Este documento presenta el marco operativo de una investigación educativa. En el Capítulo 1, se describe el muestreo, tamaño de la muestra y procesamiento de información. Se explican conceptos como población, muestra, tipos de muestreo y cómo calcular el tamaño de la muestra. También se detallan etapas de procesar datos como codificar, tabular, analizar estadísticamente y presentar resultados en tablas y diagramas.
2. CAPÍTULO N° I
Marco operativo de la investigación
CAPÍTULO N° I
Marco operativo de la investigación
1.1. Introducción al muestreo
1.2. Tamaño de la muestra
1.3. Procesamiento y análisis de la
información
1.1. Introducción al muestreo
1.2. Tamaño de la muestra
1.3. Procesamiento y análisis de la
información
3.
• Parte central de la tesis
• Aspectos metodológicos
• Población y muestra
• Tablas y diagramas
• Interpretación de datos
¿Qué es el marco operativo?
4. • Población (N): conjunto de todos los casos que tiene una
característica común.
• Muestra(n): Subgrupo de la población
1.1. Introducción al muestreo
N
n
Parámetro:
medida
estadística
5. MUESTREO
Procedimiento por el cual se extrae, de un
conjunto de unidades que constituyen el
objeto de estudio ( población), un número
de casos reducido (muestra) elegidos con
criterios tales que permitan la
generalización a toda la población de los
resultados obtenidos al estudiar la
muestra.
7. CONDICIONES QUE DEBE CUMPLIR
UNA “BUENA” MUESTRA
Que comprendan parte de la población y no
la totalidad de ésta.
Aunque el sentido común pareciera indicar
que poblaciones más grandes deben producir
muestras mayores, esto no es siempre cierto
ya que:
El tamaño de la población NO es el único elemento
que influye en el tamaño de la muestra.
8. La ausencia de distorsión en la elección de los
elementos de la muestra.
Si esta elección presenta alguna anomalía,
la muestra resultará por este mismo hecho
viciada.
Que sea representativa o reflejo fiel de la
población, de tal modo que reproduzca sus
características básicas en orden a la
investigación.
CONDICIONES QUE DEBE CUMPLIR UNA
“BUENA” MUESTRA
9. 1.2. Tamaño de la muestra
Es el número de unidades a incluir en la
muestra.
Existen varios factores que influyen en el:
Tiempo y recursos disponibles
Modalidad de Muestreo
Tipo de Análisis Previsto
Varianza o heterogeneidad de la población
Margen de error máximo admisible
Nivel de confianza de la estimación muestral
10. Gabriel Vela Quico 10
TIPOS DE MUESTRATIPOS DE MUESTRA
NO PROBABILÍSTICONO PROBABILÍSTICO PROBABILÍSTICOPROBABILÍSTICO
•El investigador decide
•No emplea estadística
•Puede estar sesgada
•Útil para diseñar un
cuestionario
a. Muestreo basado en el
acaso: requiere poco
esfuerzo y dinero. Ej.
encuesta de opinión.
b. Muestreo de criterio:
intencional o de juicio.
•Todos los elementos de una población
pueden ser escogidos
•Usa estadística
•Busca reducir el error
El tipo de investigación decide
el tipo de muestra
a. Muestreo aleatorio simple (azar
b. Muestreo aleatorio sistemático:
c. Muestreo aleatorio estratificado
d. Muestreo aleatorio por
conglomerados
11. USOS DE CADA TIPO DE MUESTREO
Muestreo Probabilísticos
Estimación de
Parámetros
Comprobación de
Hipótesis
Muestreos No
Probabilísticos
Estudios Pilotos
Estudios Cualitativos
Investigaciones en
poblaciones de difícil
registro o localización ( Ej.
prostitutas, enfermos de
VIH)
12. EJEMPLO: ¿QUÉ TIPO DE MUESTREO ES?
Se realiza un muestreo entre los alumnos
que van a clases de la Química,
eligiéndolos al azar a la entrada del salón.
Este diseño es NO probabilístico porque aquellos que
no van a clases NO PUEDEN ser elegidos
Este diseño es NO probabilístico porque aquellos que
no van a clases NO PUEDEN ser elegidos
13. Se utiliza la lista de propietarios de líneas
telefónicas para elegir a aquellos que serán
encuestados.
Este diseño es NO probabilístico porque aquellos que
no tienen teléfono NO PUEDEN ser elegidos
Este diseño es NO probabilístico porque aquellos que
no tienen teléfono NO PUEDEN ser elegidos
EJEMPLO: ¿QUÉ TIPO DE MUESTREO ES?
14. Un investigador toma muestras del carbón
extraído de una mina, tomando al azar
trozos de carbón de la parte superior de
cada carro.
Este diseño es NO probabilístico
porque solo se toma carbón
de la parte superior
Este diseño es NO probabilístico
porque solo se toma carbón
de la parte superior
EJEMPLO: ¿QUÉ TIPO DE MUESTREO ES?
15. ADVERTENCIAS FRENTE A ERRORES
Cuanto mas heterogénea sea la población
mayor será su varianza poblacional lo que
implicará mayores tamaños muestrales.
Cuando se desconoce el valor de la varianza
poblacional se recurre al supuesto mas
desfavorable, asumiendo una varianza
poblacional igual a 0,5.
0,5 significa que una unidad seleccionada
tiene 50 % de posibilidades de pertenecer o
no a un grupo específico dentro de la
población
16. ERROR ALEATORIO
El error aleatorio no se suele ajustar a
ninguna regla y por ello tiende a anularse
cuando se trata de un número elevado de
casos.
Los errores aleatorios se comenten, por ejemplo, cuando un
encuestado elige erróneamente una casilla queriendo
hacerlo en otra, cuando un encuestador marca
erróneamente un dato.
17. ERRORES SISTEMÁTICOS
Un error sistemático es aquel que se produce de
igual modo ( sentido y proporción) en todas las
mediciones que se realizan sobre un parámetro
de la muestra
Ejemplo: Sustituciones, según criterio propio
del investigador, de unidades de la muestra
que habían sido elegidas al azar.
Insuficiente observación del conjunto de la
población que influye en una deficiente
definición de sus características.
18. ERROR MUESTRAL
La diferencia entre el valor del parámetro de
una población y el obtenido de una muestra
Por muy perfecta que sea la muestra siempre
habrá grado de divergencia entre los
parámetros estimados usándola y los de la
verdadera población.
20. EJEMPLO DEL CÁLCULO DEL TAMAÑO DE LA
MUESTRA (POBLACIÓN INFINITA)
Estimando qué proporción de sujetos poseen
una característica al nivel de confianza del
99.7% (Z=3) y un error de admitido del 2%,
será:
EL TAMAÑO DE LA POBLACIÓN NO FUE
TOMADO EN CUENTA!!!
5625
2
50503
2
2
==
xx
n
21.
Edición y codificación de l a información: revisar los
datos para detectar errores u omisiones; dejarlo listo
para la tabulación.
Categorización y tabulación de la información:
definir grupos en las que puede ser clasificadas las
respuestas.
Análisis estadístico: DESCRIPTIVA e INFERENCIAL
2.3. Procesamiento y análisis de
información
22. Escala de medición Medidas de tendencia
central
Medidas de dispersión
Nominal Porcentajes
Razones
Proporciones
Ordinal Mediana
Moda
Rango recorrido
Cuartiles
Percentiles
Intervalo Media Varianza
Desviación estándar
Desviación media
Proporción Media geométrica
Media aritmética
Coeficiente de variación
Escala de medición
23. SPSS es un programa estadístico informático muy
usado en las ciencias sociales y las empresas de
investigación de mercado
24. Medidas de Tendencia Central
Usadas principalmente en datos de
intervalos y de razones
Media
Mediana
Moda
25. Media
Es la medida más común de las medidas de tendencia
central
También conocida como “promedio”
Es una medida que se encuentra a la “mitad” de los
datos
Cómo calcularla:
nesobservaciodeNumero
valoreslostodosdeSuma
Media =
26. Media: ventajas y desventajas
Ventajas:
Es fácil de calcular
Es más estable con un número grande de observaciones
Desventajas:
Sensibilidad a valores extremos
Valores extremos = muy altos o muy bajos
27. Ejemplo:
Calculando la Media
Estud. Punteo
Estud. 1 92
Estud. 2 84
Estud. 3 100
Estud. 4 78
Estud. 5 86
Estud. 6 100
Estud. 7 71
Estud. 8 44
Estud. 9 91
Estud. 10 75
Estud. 11 81
Suma
Suma de todos los punteos
en un examen = 902
Total de observaciones =
11
Media = 902/11 = 82
La media de los punteos es
82
902
28. Mediana
Es el valor a la mitad de una lista de valores ordenados
El 50avo
percentil
¿Cómo calcularlo?:
1. Ordene todos los valores
2. Encuentre el valor a la mitad
Si hay un número par de valores, utilice la media entre los
dos valores que se encuentren en la mitad
29. Mediana: ventajas y desventajas
Ventajas:
No es sensible a los valores extremos
Es fácil de interpretar
Desventajas:
Se deben ordenar los datos para el calculo
Los valores extremos pueden ser importantes
30. Ejemplo: Encontrando la Mediana
Punteo
92
84
100
78
86
100
71
44
91
75
81
1. Ponga los valores en
orden
2. Encuentre el valor a la
mitad
La mediana en el punteo de
exámenes es 84
Punteo
Ordena-
do
44
71
75
78
81
84
86
91
92
100
100
31. Moda
Es el valor más común en una distribución
¿Cómo encontrarla?:
1. Ponga todos los valores en orden
2. Cuente cuántas veces cada valor ocurre
El valor que ocurre con más frecuencia es la moda
32. Moda: ventajas y desventajas
Ventajas:
Es útil cuando hay agrupaciones con diferentes valores
Solo mide lo que puede ser usado para datos que no son
cuantitativos
Desventajas:
Puede no existir en algunos datos
Puede estar demasiado lejos de la mitad de los datos
33. Ejemplo: Encontrando la Moda
Punteos
92
84
100
78
86
100
71
44
91
75
81
1. Ordene sus valores
2. Cuente cuantas veces
cada uno de los valores
ocurre
La moda es 100.
Punteos
Ordena-
dos
44
71
75
78
81
84
86
91
92
100
100
34. Medidas de dispersión -- Rango
Encontrando el Rango
1. Poner los valores en orden
2. Encontrar el valor más bajo
3. Encontrar el valor más alto
El rango de los punteos es de (44-100)
La media de punteo fue 82 (44-100).
La mediana de punteo fue 84 (44-100).
Punteos
92
84
100
78
86
100
71
44
91
75
81
Punteos
Ordena-
dos
44
71
75
78
81
84
86
91
92
100
100
Para datos cuantitativos, generalmente se usan mediciones de la escala de intervalos (cuando los datos están clasificados dentro de categorías que espaciadas proporcionalmente en intervalos iguales) o en la escala de razones (cuando los datos están clasificados dentro de categorías espaciadas a intervalos iguales pero que requieren un “0” claramente definido) donde podemos examinar las medidas de tendencia central para describir los datos. Las tres medidas de tendencia central son la media, la mediana y la moda. Vamos a explicar estas tres medidas en las siguientes diapositivas.
La media es la medida mejor conocida y más comúnmente usada en la tendencia central. También se le conoce como el “promedio”. Para calcular la media, usted toma la suma de todos los valores y los divide por el número de observaciones.
Una de las razones porqué la media se usa comúnmente, es porque es fácil de calcular y fácil de comprender. También se convierte más confiable o estable a medida que el número de observaciones aumenta. Por ejemplo, si nosotros quisiéramos escoger a 50 personas de su vecindario para calcular la edad media, ésta podría ser una estimación más estable del promedio de edad que si calculamos la media solamente entre 5 personas.
La desventaja de utilizar la media es que es sensible a los valores extremos, de manera que si sus datos están agrupados alrededor de un cierto valor, pero usted tiene varios valores muy grandes o muy pequeños, la media será sacada de esos valores extremos.
Tenemos los resultados de una clase con 11 estudiantes. Cuál es la primera cosa que necesitamos calcular para obtener la media?
Respuesta: Sume todos los valores para obtener la suma total.
Nota al Instructor: De un clic para mostrar la suma total
Correcto y para estos datos la suma total es 902. También tenemos 11 observaciones
Nota al Instructor: De un clic para mostrar el total de observaciones
De manera que ahora debemos dividir 902 entre 11 para obtener la media.
Nota al Instructor: De un clic para mostrar el cálculo.
Por tanto, podemos ver que la media de punteo de los estudiantes para esta clase es de 82.
Si el estudiante no se presentó al examen y recibió un “cero”, entonces obtendríamos un valor mucho más bajo para la media, lo que es un ejemplo de porqué es más sensible a los valores extremos
La mediana es el punto medio de una lista ordenada de valores. También es igual al 50avo percentil, o sea, es el punto o valor que se encuentra entre el 50% de los valores de arriba y el 50% de los valores de abajo (vamos a hacer una ilustración en unos momentos). La manera de encontrar la mediana es poner todos los valores en orden desde el más pequeño hasta el más grande y luego encontrar el valor que está en el medio. Cuando el número de valores es un número par, usted necesitará tomar los dos valores que se encuentran en medio de la lista para obtener la mediana.
La mediana no es sensible a los valores extremos como la media, por tanto, es una mejor medida de tendencia central para la mayoría de los casos. Como la media, también es fácil de entender y de interpretar. Una desventaja de la mediana es que uno debe ordenar los datos primero para poder encontrar la mediana y si usted está haciendo el cálculo a mano requiere más trabajo. Este no es un problema cuando se usan programas de computación tales como Excel o Epi Info, que hace este ordenamiento automáticamente. Adicionalmente, debido a que la mediana es el valor que simplemente se encuentra a la mitad, no contabiliza los valores de los extremos. En algunos casos, algunos de estos valores muy altos o muy bajos pueden ser importantes; sin embargo, éstos no influencian a la mediana.
Usemos nuevamente los mismos punteos del examen pero esta vez para encontrar la mediana.
Cuál es el primer paso que tenemos que tomar para llegar a la mediana?
Respuesta: Poner los valores en orden
Nota al Instructor: De un clic para mostrar los datos ordenados
Ahora que hemos ordenado los datos, que hacemos a continuación?
Respuesta: Encontrar el valor que está a la mitad de la lista con 11 valores
Nota al Instructor: De un clic para mostrar la respuesta
Cuál es la mediana?
Respuesta: La mediana de los punteos es 84.
Nota al Instructor: De un clic para mostrar el recuadro con la respuesta.
La moda es el valor que ocurre con más frecuencia en una distribución. Para encontrar la moda, usted necesita poner todos los valores en orden y luego contar cuántas veces ocurre cada uno de los valores. El valor que ocurre con mayor frecuencia, es la moda, (o sea, es el valor que está “de moda”).
La moda puede ser una medida de tendencia central muy útil para datos que están agrupados con varios valores diferentes. También es la única medida que puede usarse para datos no-cuantitativos, debido a que se basa en frecuencias. Las desventajas de usar la moda es que ésta puede no existir para algunos datos. Esto puede suceder cuando muchos valores ocurren con la misma frecuencia por lo que no hay un valor que ocurra con más frecuencia que los otros. Otra desventaja adicional es que puede encontrarse demasiado lejos de la mitad de los datos.
Veamos a los punteos del examen de la clase nuevamente para practicar el encuentro de la moda.
¿Cuál es el primer paso que debemos tomar para obtener la moda?
Respuesta: Poner los valores en orden
Nota al Instructor: De un clic para mostrar los datos ordenados
Ahora que hemos ordenado los datos, ¿qué debemos hacer?
Respuesta: Contar cuántas veces ocurre cada uno de los valores
Nota al Instructor: De un clic para mostrar la respuesta
¿Cuál es la moda y cómo la encontró?
Respuesta: La moda es el valor más común. En este caso todos los números ocurrieron solo una vez, exceptuado el 100 que ocurrió dos veces. La moda del punteo del examen es 100.
Nota al Instructor: De un clic para mostrar el recuadro con la respuesta
Una nota final acerca de las medidas de tendencia central. Éstas se reportan frecuentemente en combinación con las medidas de dispersión. Las medidas de dispersión describen el alcance de una distribución. Estas medidas incluyen el rango, varianza y la desviación estándar. Discutiremos estas medidas en más detalle en presentaciones futuras, pero por el momento, estamos introduciendo el concepto de rango
El rango es la diferencia entre los valores más bajos y los valores más altos en una distribución. Usando los datos sobre punteos de la prueba, intentemos encontrar el rango de los punteos.
El primer paso para identificar el rango es ordenar los valores.
Nota al Instructor: De un clic para mostrar los valores ordenados.
Ahora que hemos ordenado los datos, encontremos el valor más bajo. ¿Cuál es el valor más bajo?
Respuesta: 44
Nota al Instructor: De un clic para mostrar la respuesta.
¿Cuál es el valor más alto?
Respuesta: 100
Nota al Instructor: De un clic para mostrar la respuesta
El rango de los punteos fue de (44-100).
Nota al Instructor: De un clic para mostrar la respuesta
El rango es frecuentemente usado cuando se describe la media o la mediana, sin embargo, generalmente no se utiliza para describir la moda.
Por consiguiente, podemos decir que la media del punteo de la prueba fue de 82 con un rango de (44-100).
Nota al Instructor: De un clic para mostrar la respuesta
También podemos decir que la mediana de los punteos fue de 84 con un rango de de 44 a 100.
Nota al Instructor: De un clic para mostrar la respuesta