1. INSTITUTO PARA LA CALIDAD DE LA EDUCACIÓN
SECCIÓN DE POSTGRADO
DIPLOMADO DE ESPECIALIZACIÓN DE POSTGRADO EN
ASESORÍA DE TESIS
MÓDULO: DISEÑO DE INVESTIGACIÓN Y OPERACIONALIZACIÓN
DE VARIABLES
EXPOSITOR: RONALD JOSÉ TORRES MARTÍNEZ
AGOSTO/17 – 2014
2. CONTENIDOS 01
CLASE-03:
PROCESO ESTADISTICO Y FORMULACION DEL PROBLEMA DE
INVESTIGACIÓN:
1. PROCESO ESTADISTICO.
2. FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN, OBJETIVOS E
HIPÓTESIS DE INVESTIGACIÓN
3. DISEÑO DE INVESTIGACIÓN, CONCEPTO Y CARACTERÍSTICAS
3. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
DISTRIBUCION SIMETRICA
DISTRIBUCION ASIMETRICA
COLA DERECHA O POSITIVA
DISTRIBUCIONES
FRECUENCIA FRECUENCIA
DISTRIBUCION ASIMETRICA
COLA IZQUIERDA O NEGATIVA
DISTRIBUCION GENERAL
FRECUENCIA FRECUENCIA
4. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
DISTRIBUCIONES ESTADÍSTICAS
DISTRIBUCIÓN NORMAL DISTRIBUCIÓN t DE STUDENT
DISTRIBUCIÓN CHI CUADRADO
DISTRIBUCIÓN F
5. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
DISTRIBUCIÓN NORMAL
퐗퐢 퐟퐢 퐗퐢퐟퐢 퐟퐢 퐗퐢 − 퐗 ퟐ
6 1
7 2
8 3
9 5
10 9
11 14
12 18
13 15
14 8
15 4
16 3
17 2
18 1
Total =
6
14
24
45
90
154
216
195
112
60
48
34
18
85 1016
35,40
49,01
46,81
43,51
34,22
12,64
0,05
16,54
33,62
37,21
49,21
51,01
36,60
445,81
MEDIA
X =
푛 푖=1
푓푖푋푖
n
X =
1016
85
= 11,95
Var(X) =
n fi Xi − X 2
i=1
n − 1
Var(X) =
n fi Xi − X 2
i=1
85 − 1
= 5,31
VARIANZA
DESVIACIÓN ESTÁNDAR
DE = VAR(X) DE = 5,31
DE = 2,30
푋 ± 퐷퐸 = 11,95 ± 2,30
ퟗ, ퟔퟓ ; ퟏퟒ, ퟐퟔ
6. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
DISTRIBUCIÓN NORMAL
퐗퐢 퐟퐢 퐗퐢퐟퐢 퐟퐢 퐗퐢 − 퐗 ퟐ
6 1
7 2
8 3
9 5
10 9
11 14
12 18
13 15
14 8
15 4
16 3
17 2
18 1
Total =
6
14
24
45
90
154
216
195
112
60
48
34
18
85 1016
35,40
49,01
46,81
43,51
34,22
12,64
0,05
16,54
33,62
37,21
49,21
51,01
36,60
445,81
X = 11,95
DE = 2,30
11,95
49,01 u2
35,40 u2
51,01 u2
36,50 u2
6 7 8 9 10 11 12 13 14 15 16 17 18
9,65 ; 14,26
11. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
AREA BAJO LA CURVA NORMAL ESTANDARIZADA ~ N(0,1)
LA DISTRIBUCION NORMAL ESTANDARIZADA ES SIMÉTRICA
100% ≈ 1,0
-3 -2 -1 0 1 2 3
P(-oo ≤ z ≤ +oo)=1,0
50% ≈ 0,5
-3 -2 -1 0 1 2 3
P(-oo ≤ z ≤ 0)=0,5
50% ≈ 0,5
-3 -2 -1 0 1 2 3
P(0 ≤ z ≤ oo)=0,5
-3 -2 -1 0 1 2 3
P(-oo ≤ z ≤ -2)=0,02272
Para Z=-2 la prob. es: 0,02272
-3 -2 -1 0 1 2 3
P(-oo ≤ z ≤ -1)=0,15862
Para Z=-1 la prob. es: 0,15862
-3 -2 -1 0 1 2 3
P(-oo ≤ z ≤ 1)=0,84131
Para Z=1 la prob. es: 0,84131
12. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
AREA BAJO LA CURVA NORMAL ESTANDARIZADA ~ N(0,1)
훼
2
훼
2
1 − 훼
Z
훼
2
=
5%
2
=2,5%
1 − 훼 = 95% 훼
2
=
5%
2
=2,5%
푍훼
2
= 푍2,5%=푍0,025=-1,96
Z
DOS COLAS = 푍1−2,5%=푍97,5%=푍0,975 = ퟏ, ퟗퟔ
푍1−
훼
2
DOS COLAS
13. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
AREA BAJO LA CURVA NORMAL ESTANDARIZADA ~ N(0,1)
1 − 훼 = 95%
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
-3 -2 -1 0 1 2 3
훼=5%
1 − 훼 = 95%
푍훼 = 푍5%=푍0,05=-1,645
Z
푍1−훼 = 푍1−5%=푍95%=푍0,95 = ퟏ, ퟔퟒퟓ
UNA COLA IZQUIERDA
훼=5%
Z
UNA COLA DERECHA
훼
2
=
10%
2
=5%
1 − 훼 = 90%
훼
2
=
10%
2
=5%
푍훼
2
= 푍5%=푍0,05=-1,645
Z
DOS COLAS = 푍1−5%=푍95%=푍0,95 = ퟏ, ퟔퟒퟓ
푍1−
훼
2
14. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
PRUEBAS DE DISTRIBUCIÒN NORMAL
VARIABLES:
GRUPO: ESTUDIANTES DE CIENCIAS
ESTUDIANTES DE SOCIALES
ptje_Antes: Promedio de 4 pruebas
Antes de la intervención
ptje_Después: Promedio de 4 pruebas
Después de la intervención
N_Ex_Aprob: Número de exámenes
Aprobados, realizados antes
y después de la intervención
25. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
PRUEBAS DE DISTRIBUCIÒN NORMAL
El Las Pruebas de Normalidad es un contraste de ajuste que se utiliza para comprobar si
unos datos determinados (X1, X2,…, Xn) han sido extraídos de una población normal.
Los parámetros de la distribución no tienen porqué ser conocidos.
Ho:Datos presentan distribución normal
Ha:Datos No presentan distribución normal
Si Sig.=p<0,05 se rechaza Ho y se
acepta Ha.
El test de Kolgomorov Smirnov.
CIENCIAS: Sig=p=0,200>0,05 → Distribución Normal.
SOCIALES: Sig=p=0,200>0,05 → Distribución Normal.
CIENCIAS: Sig=p=0,000<0,05 → Distribución No Normal.
SOCIALES: Sig=p=0,000<0,05 → Distribución No Normal.
Ptje_Antes
N_Ex_Aprob
26. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
PRUEBAS DE DISTRIBUCIÒN NORMAL
El Las Pruebas de Normalidad es un contraste de ajuste que se utiliza para comprobar si
unos datos determinados (X1, X2,…, Xn) han sido extraídos de una población normal.
Los parámetros de la distribución no tienen porqué ser conocidos.
Ho:Datos presentan distribución normal
Ha:Datos No presentan distribución normal
Si Sig.=p<0,05 se rechaza Ho y se
acepta Ha.
El test de Shapiro-Wilk.
CIENCIAS: Sig=p=0,258>0,05 → Distribución Normal.
SOCIALES: Sig=p=0,529>0,05 → Distribución Normal.
CIENCIAS: Sig=p=0,000<0,05 → Distribución No Normal.
SOCIALES: Sig=p=0,000<0,05 → Distribución No Normal.
Ptje_Antes
N_Ex_Aprob
27. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
PRUEBAS DE DISTRIBUCIÒN NORMAL
gráfico Q-Q Normal:
Este gráfico permiten comprobar si las
poblaciones de las que se han extraído las
muestras presentan distribución normal.
Si los datos proceden de una distribución
normal los puntos aparecen agrupados en
torno a la línea recta esperada.
PRESENTA DISTRIBUCIÓN NORMAL
28. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
PRUEBAS DE DISTRIBUCIÒN NORMAL
El gráfico Q-Q Normal sin tendencia se basa en
las diferencias entre los valores observados y los
valores esperados bajo la hipótesis de
normalidad.
Si estas diferencias se distribuyen aleatoriamente
alrededor del eje de abscisas puede suponerse
que la hipótesis de normalidad es sostenible.
PRESENTA DISTRIBUCIÓN NORMAL
41. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
MEDIDA DE ASIMETRÍA.
Evalúa el grado de distorsión o inclinación que adopta la distribución de los datos
respecto a su valor promedio tomado como centro de gravedad. El coeficiente de
asimetría de Pearson es:
Grado de Asimetría Valor del Sesgo
Simetría Perfecta. Cero: Promedio es igual a la mediana
Sesgo Positivo. Positivo: Promedio mayor que la mediana)
Sesgo Negativo. Negativo: Promedio menor que la mediana
Asimetría Positiva
(Promedio>Mediana)
Simétrica
(Promedio=Mediana)
Asimetría Negativa
(Promedio<Mediana)
MEDIDAS ESTADÍSTICAS
42. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
MEDIDAS ESTADÍSTICAS
MEDIDA DE CURTOSIS.
Evalúa el grado de apuntamiento de la distribución, el coeficiente es K:
Grado de Apuntamiento Valor del Sesgo
Mesocúrtica (Distribución Normal). 0.263
Leptocúrtica (Elevada). Mayor a 0.263 ó se aproxima a 0.5
Platicúrtica (Aplanada). Menor a 0.263 ó se aproxima a 0
Platicúrtica Mesocúrtica Leptocúrtica
44. TÉCNICAS ESTADÍSTICAS PARA EL PROCESAMIENTO DE LA INFORMACIÓN
MEDIDAS ESTADÍSTICAS
COEFICIENTE DE VARIACION
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se
compara la desviación estándar con el respectivo valor promedio de los datos:
Grado de Variabilidad de los datos. Coeficiente de Variabilidad
Variabilidad baja. Menos de 10%
Variabilidad moderada. De 10% a 30%
Variabilidad alta. Más de 30%
Puntaje Antes de la Intervención: Puntaje Después de la intervención.
푋 ± 푆 = 12,163 ±2,754 푋 ± 푆 = 14,982 ± 1,277
퐶푉 =
2,754
12,163
푋100 =22,64% 퐶푉 =
1,277
14,982
푋100 =8,52%
Variabilidad MODERADA. Variabilidad BAJA.
Los puntajes obtenidos Antes de la Intervención son más variables, que los puntajes
obtenidos Después de la Intervención.
45. TAMAÑO DE MUESTRA
POBLACIÓN HOMOGENEA
POBLACIÓN HETEROGENEA
ESTRATIFICAR LA POBLACIÓN
ESTRATO 1 ESTRATO 2
MUESTRA
REPRESENTATIVA
MUESTRA
REPRESENTATIVA
ESTRATO 1
MUESTRA
REPRESENTATIVA
ESTRATO 2
46. TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
Seleccionar una muestra apropiada para la investigación requiere:
1. DEFINIR LOS SUJETOS U OBJETOS QUE VAN A SER MEDIDOS.
PREGUNTA DE INVESTIGACIÓN UNIDAD DE ANÁLISIS ERRONEA UNIDAD DE ANÁLISIS CORRECTA
Error: No hay grupo de comparación
Error: La pregunta propone indagar
sobre actitudes individuales y esta
unidad de análisis denota datos
agregados en una estadística laboral
y macrosocial
Error: Se procederá a describir
únicamente como perciben los
adolescentes la relación con sus
padres
¿Discriminan a las mujeres en los
anuncios de televisión?
¿Hay problemas de
comunicación entre padres e
hijos?
Mujeres que aparecen en los
anuncios de la televisión
Contar el número de conflictos
sindicales registrados en
Conciliación y Arbitraje durante los
últimos cinco años.
Grupo de adolescentes se aplicara
cuestionario
Mujeres y hombres que aparecen
en los anuncios de televisión para
comparar y determinar si hay
diferencias entre los dos grupos
Muestra de obreros que trabajan
en el área metropolitana cada
uno de los cuales contestara a las
preguntas de un cuestionario
Grupo de padres e hijos. A ambas
partes se les aplicará el
cuestionario
¿Están los obreros del área
metropolitana satisfechos con
su trabajo?
47. TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
Seleccionar una muestra apropiada para la investigación requiere:
2. DELIMITAR LA POBLACIÓN.
PREGUNTA DE INVESTIGACIÓN UNIDAD DE ANÁLISIS POBLACION DELIMITADA
¿Discriminan a las mujeres en los
anuncios de televisión?
¿Hay problemas de
comunicación entre padres e
hijos?
Mujeres y hombres que aparecen
en los anuncios de televisión para
comparar y determinar si hay
diferencias entre los dos grupos
Muestra de obreros que trabajan
en el área metropolitana cada
uno de los cuales contestara a las
preguntas de un cuestionario
Grupo de padres e hijos. A ambas
partes se les aplicará el
cuestionario
¿Están los obreros del área
metropolitana satisfechos con
su trabajo?
Selección de spots publicitarios
transmitidos durante los meses
de septiembre y octubre del 2013.
Obreros de construcción civil en
planillas en compañías
constructoras formalizadas.
Padres e hijos católicos de
colegios parroquiales de Lima
metropolitana.
48. TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
Seleccionar una muestra apropiada para la investigación requiere:
3. TIPO DE MUESTRA.
TIPO DE
MUESTRA
NO PROBABILISTICA
Los elementos de la
población son
elegidos por
conveniencia
Depende de la
persona que toma la
muestra
PROBABILISTICA
Los elementos de la
población tienen la
misma posibilidad de
ser elegidos
Muestreo aleatoria simple
Muestreo aleatoria estratificada
Muestreo aleatoria sistemática
Muestreo aleatoria por conglomerados
Muestreo por cuotas
Muestreo intencional o de conveniencia
Bola de nieve
Muestreo discrecional
49. TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
N n
POBLACIÓN
PARÁMETROS
푿 흈ퟐ 퐏
Medida de
probabilidad
Representativa
MUESTRA
ESTADÍSTICOS
풙 푺ퟐ p
VARIABLE
CUANTITATIVA CUALITATIVA
푿 흈ퟐ 퐏
POBLACIÓN FINITA
“n” CONOCIDA
POBLACIÓN INFINITA
“n” NO CONOCIDA
Seleccionar una muestra apropiada para la investigación requiere:
4. DETERMINAR EL TAMAÑO DE MUESTRATIPO DE MUESTRA.
50. Supongamos que la proporción de deserción escolar es de 10%.
Extraemos muestras de tamaño n:
n
풆 = ퟎ, ퟎퟓ 풆 = ퟎ, ퟎퟓ
0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17
m1 푝1 = 0.14
n
m2 푝2 = 0.08
n m3
푝3 = 0.12
n
m4
푝4 = 0.09
El error muestral es la distancia en valor
absoluto entre el valor del estadistico de la
muestra y la proporción de la población
tomada como verdadera.
풆ퟏ = ퟎ. ퟎퟒ
P=10%
N=300
풆ퟐ = ퟎ. ퟎ2
풆ퟑ = ퟎ. ퟎ2
풆ퟒ = ퟎ. ퟎퟏ
푒푖 = 푃 − 푝푖
(푃 − 푝푖 ) = ±푒
푝푖 = 푃 ± 푒
푷 − 풆 ≤ 풑풊 ≤ 푷 + 풆
Error muestral= ±풆 = ퟎ, ퟎퟓ
TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
ퟎ, ퟏퟎ − ퟎ, ퟎퟓ ≤ 풑풊 ≤ ퟎ, ퟏퟎ + ퟎ, ퟎퟓ
ퟎ, ퟎퟓ ≤ 풑풊 ≤ ퟎ, ퟏퟓ
51. Si eligiéramos 100 muestras bajo las mismas condiciones y aleatoriedad, tendríamos:
n
m1 푝1 = 0.14
n
m2 푝2 = 0.08
n m3
푝3 = 0.12
n
m4
푝4 = 0.09
P=10%
N=300
n
m100
푝77 = 0.03
푝100 = 0.012
De las cien muestra extraídas
aleatoriamente, si 95 de ellas caen
en el Intervalo:
Se tendría un 95% de confianza de
obtener la proporción muestral
dentro del error especificado por
el investigador, y un 5% de las
muestras tendrían una proporción
fuera de este intervalo.
1 − 훼 =95% 훼
훼
=2.5%
=2.5% 2
2
0,05 ≤ 푝 ≤ 0,15
Esta condición, asegura que probabilísticamente,
este procedimiento sea fiable, asignándose una
distribución de probabilidad normal.
푍1−
푍훼 =1.96
훼
2
2
=-1.96
1 − 훼 = 95% : Nivel de confianza
훼 = 5% : Significación
TAMAÑO DE MUESTRA
¿CÓMO SELECCIONAR UNA MUESTRA?
ퟎ, ퟎퟓ ≤ 풑풊 ≤ ퟎ, ퟏퟓ
54. TAMAÑO DE MUESTRA ALEATORIA SIMPLE
¿CÓMO SELECCIONAR UNA MUESTRA?
1. PROBLEMAS DE APLICACIÓN:
¿Cuál es el número óptimo para un estudio de 60000 personas inscritas en cursos de
formación, en el cual se establece un nivel de confianza de 95%, un margen de error de
3%. Suponemos que la opción por inscribirse en cursos de formación, o no, es del 50%?
Datos:
N=60000
1 − 훼 = 0,95
e =0,03
p =0,50
q = 1 − p =0,50
푛 =
푁 푍
2 푝(1 − 푝)
1−
훼
2
푒2 푁 − 1 + 푍
2 푝(1 − 푝)
1−
훼
2
푛 =
2 = (1,96)2= 3,8416
푍0,95
60000 3,8416 (0,50)(1 − 0,50)
(0,03)2 60000 − 1 + 3,8416 (0,50)(1 − 0,50)
푛 = 382
푆 푁 < 푛(푛 − 1) se ajusta el tamaño muestral
60000 < 382(382 − 1) 60 000 < 145 542
푛∗ =
382
1 +
382
60000
푛∗ = 380
55. TAMAÑO DE MUESTRA ALEATORIA SIMPLE
¿CÓMO SELECCIONAR UNA MUESTRA?
2. PROBLEMAS DE APLICACIÓN:
El Ministerio de Trabajo planea un estudio con el interés de conocer el promedio de horas
semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de
una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las
cuales se conoce a través de un estudio piloto que su varianza (S2) es de 9.648. Trabajando
con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1,
¿Cuál debe ser el tamaño muestral que empleemos?.
Datos:
N=10000
1 − 훼 = 0,95
e =0,1
S2=9,648
푛 =
푁 푍
2 푆2
1−
훼
2
푒2 푁 − 1 + 푍
2 푆2
1−
훼
2
푛 =
10000 3,8416 (9,648)2
2 = (1,96)2= 3,8416
푍0,95
(0,1)2 10000 − 1 + 3,8416 푆2
푛 = 850 푆 푁 < 푛(푛 − 1) se ajusta el tamaño muestral
10000 < 852(852 − 1) 10000 < 725052
푛∗ =
852
1 +
852
10000
푛∗ = 785
56. INSTITUTO PARA LA CALIDAD DE LA EDUCACIÓN
SECCIÓN DE POSTGRADO
DIPLOMADO DE ESPECIALIZACIÓN DE POSTGRADO EN
ASESORÍA DE TESIS
MÓDULO: DISEÑO DE INVESTIGACIÓN Y OPERACIONALIZACIÓN
DE VARIABLES
EXPOSITOR: RONALD JOSÉ TORRES MARTÍNEZ
AGOSTO/17 – 2014