Clase de introducción al análisis estadístico. Los errores habituales en la lectura de tablas de distribución de frecuencias y presentación de análisis descriptivo.
1. Principios Metodológicos
para la orientación
de Trabajos Académicos
Enrique Morosini
24/11/2012 Aspectos Metodológicos - Enrique Morosini 1
2. Kerlinger y Lee, 2001, pp. 171-195
Introducción
Análisis, interpretación,
estadísticas e inferencia
24/11/2012 Aspectos Metodológicos - Enrique Morosini 2
3. ¿Qué es Analizar?
• Analizar significa la categorización, ordenamiento,
manipulación y resumen de datos, para responder
a las preguntas de investigación. El propósito es
reducir los datos a una forma entendible e
interpretable para que las relaciones de los
problemas de investigación puedan ser estudiadas
y probadas.
• Un propósitos primario de la estadística, es
manipular y resumir datos numéricos y comparar
con los que se hubiesen obtenidos por el azar.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 3
4. ¿Qué es interpretar?
• En la interpretación…
– se toman los resultados del análisis,
– se hacen las inferencias pertinentes a las
relaciones de investigación estudiadas y
– se sacan conclusiones de estas relaciones.
• El investigador que interpreta los resultados de
investigaciones, los busca por sus significados y sus
implicaciones.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 4
5. Cómo se logra la interpretación
1. Interpretando las relaciones dentro del estudio de
investigación y sus datos. Éste es el uso más
estrecho y frecuente del término interpretación.
Aquí la interpretación y el análisis están
estrechamente entrelazados.
2. La búsqueda de significado más amplio de los datos
de investigación. Se comparan los resultados y las
inferencias realizadas a partir de los datos con la
teoría y con los resultados de otras investigaciones.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 5
6. La interpretación de los datos
• Adecuación de los diseños de investigación,
metodología, mediciones y análisis.
• A veces los investigadores tienen preferencias por
métodos de investigación, métodos de observación,
métodos de medición y tipos de análisis. Por ejemplo
no es adecuado utilizar análisis de frecuencias, con
digamos, medidas continuas tomadas con una escala
de actitudes.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 6
7. La interpretación de los datos
• El investigador debe examinar a fondo la adecuación
técnica de los métodos, medidas y estadísticas. La
adecuación de la interpretación de los datos
depende de tal escrutinio.
• El aceptar sin cuestionamiento la confiabilidad y
validez de las mediciones de variables es un error
grave. Se debe ser especialmente cuidadoso al
cuestionar la validez de sus mediciones.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 7
8. Medidas de frecuencia y continuas
• Los datos cuantitativos se presentan en dos formas
generales: como medidas de frecuencia y como
medidas continuas. Obviamente, las medidas
continuas están asociadas con variables continuas.
• Aunque ambas clases de variables y medidas pueden
ser integradas bajo el mismo marco de medición o
referencia, en la práctica es necesario distinguirlas.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 8
9. Medidas de frecuencia y continuas
• Frecuencias: son los números de objetos en un conjunto
o subconjunto.
• El primer paso de cualquier análisis es la categorización,
que deben ajustarse a las siguientes reglas:
– Se establecen de acuerdo con el problema de
investigación.
– Son exhaustivas.
– Son mutuamente excluyentes.
– Derivan de un principio de clasificación.
– Deberá estar en un nivel de discurso.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 9
10. Regla 1. Relacionado al problema
• Esta es probablemente la más importante de las
reglas de la categorización.
• Si las categorizaciones no se establecen de acuerdo a
las demandas del problema de investigación,
entonces no puede haber respuestas adecuadas a las
preguntas de investigación.
• Lo importante es respetar el paradigma del problema
que se plantea, si al modelo de análisis se incorporan
variables irrelevantes al problema tendrá un
paradigma analítico, al menos, irrelevante.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 10
11. Regla 2: sobre la exhaustividad
• Este requisito no siempre es fácil de satisfacer.
• Dependiendo de la variable que se está escogiendo
podría tener un conjunto bastante amplio de
respuestas, mientras que lo que se está buscando
responde a una suposición más simple de categorías.
– Pensemos en la variable: estructura familiar.
– Pensemos en la variable: situación de pareja.
– Pensemos en la variable: preferencia política.
– Pensemos en la variable: clase social.
– Pensemos en la variable identidad de género.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 11
12. Regla 3: categorías excluyentes
• Esta regla, frecuentemente, causa preocupación en
los investigadores.
• Las definiciones de categorías deben ser claras y sin
ambigüedades, es decir, cada categoría observada
debería ser registrada en una sola casilla y no en más
de una.
• Por ejemplo, supongamos que estemos investigando
sobre religión y algunas personas asisten a más de
una iglesia, la definición operacional podría ser en
cuál de ellas está bautizada.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 12
13. Regla 4: principio de clasificación
• Todas las categorías deben pertenecer al mismo
conjunto. Muchas veces las personas con poca
experiencia pueden confundir no tener claro cuál es
el principio clasificatorio que subyace a una
conjunto.
Albañil Empresa privada
Cocinera Taxista
Comerciante Empleado
Supermercado Jornalero
Empresa comercial Asalariado
Empresa propia Independiente
24/11/2012 Aspectos Metodológicos - Enrique Morosini 13
14. Regla 5: nivel de discurso
• Este principio es un poco más difícil de describir.
• Tiene relación con el universo de fracciones posibles
o admisibles en la definición de las variables que son
objeto de investigación.
• Generalmente los niveles de las variables
independientes constituyen la manera en cómo
serán organizados los resultados. El nivel de discurso
se relaciona más estrechamente con la partición
posible en la variable dependiente.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 14
22. ¿Qué es la estadística?
• La palabra estadística deriva de la palabra italiana
statista, persona que trata asuntos de Estado (de
Stato, “Estado”). Originalmente se llamó “aritmética
de Estado” e involucraba representar con tablas la
información relativa a las naciones, especialmente
aquellos datos relacionados con impuestos y la
planificación de la viabilidad de las guerras.
• La estadística deriva de una gran cantidad de
fuentes…
• La teoría de la probabilidad, la teoría de las
decisiones…
24/11/2012 Aspectos Metodológicos - Enrique Morosini 22
23. Niveles de medición y estadística
• Es habitual encontrar en libros de estadística, como
primera unidad, la distinción de los distintos tipos de
escalas (la clásica tipificación de Stevens):
– Escalas nominales
– Escalas ordinales
– Escalas de intervalo
– Escalas de razón
• Sin embargo, existe un interesante artículo que relativiza
tal tratamiento. El artículo escrito por Lord (1953), se
titula “Sobre el tratamiento estadístico de los números de fútbol”.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 23
24. Tipos de análisis estadísticos
• Análisis exploratorio
• Análisis gráficos
• Distribución de frecuencias
• Medidas de tendencia central y variabilidad
• Medidas de relaciones: [Pearson, categóricas]
• Análisis de diferencias: [medias, porcentajes]
• Análisis de varianza y métodos relacionados
• Elaboración de índices e Indicadores sociales
• Análisis multivariado
24/11/2012 Aspectos Metodológicos - Enrique Morosini 24
25. Tipos de análisis estadísticos
• Análisis epidemiológico
• Análisis de supervivencia
• Análisis psicométrico
• Análisis de series temporales
• Análisis espectral
• Correlación canónica
• Regresión múltiple no-lineal
• Análisis factorial
• Análisis de clases latentes
• Metaanálisis
24/11/2012 Aspectos Metodológicos - Enrique Morosini 25
26. Recomendaciones
• No avance en el nivel de dificultad estadística hasta que
domine suficientemente las operaciones básicas del
tema.
• No se preocupe por las operaciones aritméticas,
concéntrese más bien en el aspecto conceptual e
interpretativo.
• No se preocupe por manejar los temas más complejos de
análisis, probablemente la mayor parte del conocimiento
científico evoluciona sin hacer uso de ella.
• Cuando requiera aplicar técnicas más complejas recurra a
un especialista para que lo asesore.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 26
28. El encuentro inicial con los datos
• En el año 1977 Tukey desarrolló un conjunto de
métodos para analizar datos de una investigación.
• Esta metodología se denominó Análisis Exploratorio.
• Este método está incluido como rutina básica en
muchos paquetes estadísticos, su uso apunta a una
revisión exhaustiva de la forma, la distribución, las
medidas de tendencia central, la presencia de datos
extremos y problemas posibles con la construcción
de la base de datos.
• Incorpora un set de análisis gráficos muy útiles.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 28
29. Análisis descriptivo
• La técnica exploratoria incluye el cálculo de los
siguientes datos descriptivos:
– Media
– Desviación típica
– Varianza
– Mediana
– Moda
– Curtosis
– Asimetría
– Media recortada
– Intervalo de la media
24/11/2012 Aspectos Metodológicos - Enrique Morosini 29
30. Análisis gráfico-exploratorio
• El Diagrama de “tallos y hojas” (Stem-and-Leaf
Diagram) permite obtener simultáneamente una
distribución de frecuencias de la variable y su
representación gráfica. Para construirlo basta separar
en cada dato el último dígito de la derecha (que
constituye la hoja) del bloque de cifras restantes
(que formará el tallo). Esta representación de los
datos es semejante a la de un histograma pero
además de ser fáciles de elaborar, presentan más
información que estos.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 30
31. Tallos y hojas
• En el tallo se consigan un valor nuclear, por ejemplo,
los decimales, en las hojas el valor complementario
que representa un número específico de unidades.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 31
32. Análisis gráfico-exploratorio
• El gráfico de “cajas y bitotes” (box plot) son una
presentación visual que describe varias
características importantes al mismo tiempo, tales
como la dispersión y simetría. Para su realización se
representan los tres cuartiles y los valores mínimo y
máximo de los datos, sobre un rectángulo, alineado
horizontal o verticalmente.
24/11/2012 Aspectos Metodológicos - Enrique Morosini 32
39. Distribución de frecuencias
• Se utilizan tablas de frecuencia simple y porcentajes
para describir características de la población:
Estado civil Frecuencia Porcentaje
Casado 6 2%
Soltero 267 91%
Unido 15 7%
24/11/2012 Aspectos Metodológicos - Enrique Morosini 39
40. Análisis de frecuencias
• Las tablas de frecuencia, con intención analítica, se
presentan en tabulación cruzada, algunas veces
llamada fracción cruzada o análisis de contingencia:
Menor al 60% Sup. o igual al 60%
CARRERA Total
Recuento % Recuento %
Psicología 150 43,2% 197 56,8% 347
C. de la Comunicación 98 45,2% 119 54,8% 217
C. de la Educación 21 58,3% 15 41,7% 36
Historia 7 26,9% 19 73,1% 26
Letras 15 48,4% 16 51,6% 31
Filosofía 6 42,9% 8 57,1% 14
Trabajo Social 44 58,7% 31 41,3% 75
Total 341 45,7% 405 54,3% 746
24/11/2012 Aspectos Metodológicos - Enrique Morosini 40
41. Análisis de frecuencias
• Analicemos la siguiente distribución porcentual.
¿En quién confía para hablar de sexo?
Total %
Padre 26 19,12%
Madre 86 63,24%
Ambos 24 17,65%
Total 136 100%
24/11/2012 Aspectos Metodológicos - Enrique Morosini 41
42. Análisis de frecuencias
Tabla ##. Distribución de elección parental de mayor confianza
para hablar de sexo según sexo del adolescente
Sexo del
Padre Madre Ambos Total
adolescente
Femenino 3% 88% 9% 100%
Masculino 33% 42% 25% 100%
Total 19% 63% 18% 100%
24/11/2012 Aspectos Metodológicos - Enrique Morosini 42
43. Análisis de frecuencias
Tabla ##. Distribución de elección parental de mayor confianza
para hablar de sexo según sexo del adolescente
Sexo del Sexo del padre
adolescente Padre Madre Ambos Total
Femenino 8% 65% 25% 47%
Masculino 92% 35% 75% 53%
Total 100% 100% 100% 100%
24/11/2012 Aspectos Metodológicos - Enrique Morosini 43
44. Análisis de frecuencias
• La interpretación de los datos: % de fila y % de columnas.
¿En quién confía para hablar de sexo?
Total %
Padre 26 19%
Madre 86 63%
Ambos 24 18%
Total 136 100%
Sexo del Sexo del padre Sexo del Sexo del padre
adolescente Padre Madre Ambos Total adolescente Padre Madre Ambos Total
Femenino 3% 88% 9% 100% Femenino 8% 65% 25% 47%
Masculino 33% 42% 25% 100% Masculino 92% 35% 75% 53%
Total 19% 63% 18% 100% Total 100% 100% 100% 100%
24/11/2012 Aspectos Metodológicos - Enrique Morosini 44
46. Medidas de descripción
• Medidas de tendencia central:
– Media aritmética
– Mediana
– Moda
• Medidas de dispersión o variabilidad:
– Rango
– Rango intercuartil
– Desviación media
– Desviación estándar
24/11/2012 Aspectos Metodológicos - Enrique Morosini 46
47. Medidas de descripción
• Medidas de distribución o forma:
– Curtosis
– Asimetría
• Medidas de posición:
– Cuartiles
– Quintiles
– Percentiles
24/11/2012 Aspectos Metodológicos - Enrique Morosini 47
48. Medida de tendencia central: la media
n
1
X = ∑ Xi
n i =1
X=
∑X
n
24/11/2012 Aspectos Metodológicos - Enrique Morosini 48
49. Medida de variabilidad: La varianza
n
∑(X i − X) 2
σ =
2
X
i =1
n
n
∑(X i − X) 2
σX = i =1
n
24/11/2012 Aspectos Metodológicos - Enrique Morosini 49