3. ANÁLISIS DE DATOS
Tipos de estadística
ESTADÍSTICA DESCRIPTIVA
Métodos para organizar, resumir y presentar datos de manera
informativa.
4.
5. ANÁLISIS DE DATOS
Tipos de estadística
ESTADÍSTICA INFERENCIAL
Métodos que se emplean para determinar una propiedad de una
población con base en la información de una muestra de ésta.
6.
7. Ejemplo
Como paso inicial se creará una base de datos en Microsoft Access para el ingreso de los datos
recogidos con un método de entrada de doble digitación.
Se realizará un análisis univariado el cual constará de frecuencias (relativas y absolutas), medidas de
tendencia central (mediana y media) y medidas de dispersión (varianza y desviación central) según
las características o distribución de cada variable de estudio (percepción de producto saludable,
tipo y número de advertencias nutricionales, edad, sexo, tipo de colegio y nivel socioeconómico).
Se realizará un análisis bivariado para analizar la relación entre las advertencias publicitarias y las
preferencias alimentarias, y la relación entre las advertencias y la percepción de producto
saludable. Se utilizará el test de chi-cuadrado para hallar diferencias entre los grupos. Valor de p
<0,05 se considerará como estadísticamente significativo.
Mediante un análisis de regresión logística múltiple se evaluará la asociación entre el tipo de
advertencias publicitarias y la preferencia ajustados por sexo, edad, tipo de colegio y nivel
socioeconómico.
Se utilizará el software estadístico Stata® v14.2 (Stata Corporation, College Station, Texas, USA) para
el análisis de los datos.
9. 1. Preguntarse ¿qué busca la
pregunta?
Diferencia Asociación
Ej. Efecto hipercolesterolemiante
del consumo de sábila en
diferentes dosis.
Ej. Relación entre las
horas de sueño y el IMC
10. Diferencia
2. ¿Las muestras están
relacionadas?
Las muestras relacionadas o pareadas son aquellas en
las que por cada observación realizada en un grupo,
presenta una observación concordante en el otro grupo.
Esto permite controlar fuentes ajenas de variabilidad.
• Autoapareamiento. El mismo sujeto actúa como su propio
control: Observaciones antes y después, diseños crossover.
• Observaciones naturalmente apareadas: medidas
realizadas en animales de la misma camada, gemelos.
• Observaciones artificialmente apareadas: emparejamiento
realizado por el investigador atendiendo a características
importantes como edad, sexo, raza, peso.
12. Diferencia
4. ¿La distribución de los
datos obtenidos es normal?
• Es una distribución unimodal, simétrica, su
asimetría es 0 y su curtosis 3.
• Para comprobar la normalidad se realiza
una prueba: Shapiro-Wilk, Kolmogorov-
Smirnov, Shapiro-Francia. Se pueden
acompañar de gráficos.
• Si tienen distribución normal,
corresponden estadística paramétrica.
13. Estadística inferencial
paramétrica
2 muestras no pareadas
Test de hipótesis de dos medias muestrales
Muestras independientes + distribución normal+ homegeneidad de varianzas (Prueba de
Levene): t de student
Muestras independientes + distribución normal+ no homegeneidad de varianzas (Prueba
de Levene): Test de Welch
Muestras independientes + distribución no normal+ similar forma y dispersión : Mann-
Whitney/ test de Wilcoxon
Muestras independientes + distribución no normal+ diferente forma y dispersión: Test de
la mediana
14. Estadística inferencial
paramétrica
2 muestras pareadas
Test de hipótesis de dos medias muestrales
Muestras dependientes + distribución normal: t de student para muestras pareadas
Muestras dependientes + distribución no normal+ asimetría: Test de los signos
Muestras dependientes + distribución no normal+ simetría: Test de Wilcoxon
15. Inferencia estadística de K
muestras independientes
Muestras independientes + distribución normal*+ homocedasticidad**: ANOVA
Muestras independientes + distribución normal + no homocedasticidad: Welch
Muestras independientes + distribución no normal + similar forma: Kruskall-
Wallis
Muestras independientes + distribución no normal + diferente forma: test de la
mediana
*Normalidad: sobre los residuales (dato-media)
**Prueba de Levene
Pruebas post-hoc:
Anova Tukey, SNK, Tamhane
Kruskall-Wallis Mann-Whitney
16. Inferencia estadística de K
muestras independientes
o Muestras dependientes + distribución normal*: ANOVA
o Muestras dependientes + distribución no normal: Friedman
*Normalidad: sobre los residuales (dato-media)
**Prueba de Levene
o Pruebas post-hoc:
Anova Tukey, SNK, Tamhane
Friedman Signos, Wilcoxon
17. Asociación
1. ¿Hay variable
independiente/predictor?
Regresión: se estudia cómo varía el calor medio
de una de las variables (dependiente, y) a medida
que cambia otra variable (independiente, x).
Correlación: no existe esta distinción y las dos
variables se consideran dependientes, la
correlación de x respecto a y equivale a la
correlación de y respecto a x.
X ------> Y
X <-----> Y
19. Normalidad (de cada variable: bivariada): Pearson
No normal: Spearman
Valor del coeficiente Adjetivos asociados
0 - 0.1 Trivial, muy pequeña, insustancial
0.1 – 0.3 Pequeña, baja, menor
0.3 - 0.5 Moderada, mediana
0.5 – 0.7 Grande, elevada
0.7 – 0.9 Muy grande, muy elevada
>0.9 Prácticamente perfecta
Correlación
20. Regresión lineal simple
Condiciones : linealidad, normalidad, homocedasticidad,
ausencia de autocorrelación.
Cuando solo interviene una variable independiente se habla de
regresión lineal simple, de lo contrario es múltiple.
y= a +b . x
a : parte independiente de y