SlideShare una empresa de Scribd logo
1 de 13
Seminario 8
Análisis bivariado con variables
cuantitativas. Normalidad y linealidad.
Diagrama de dispersión. Coeficientes de
correlación de Pearson y Rho de Spearman.
EJERCICIO
Determina si existe relación entre las variables
altura y peso del fichero de datos “activos en
salud” y si existe determina cómo de fuerte
es.
Abrimos R Commander y cargamos el conjunto
de datos “Activos en salud” , vamos a
representar como se relacionan dos variables
cuantitativas, peso y altura.
Para ello, en primer lugar tenemos que
comprobar si siguen o no una distribución
normal, ya que dependiendo de ello
utilizaremos distintos coeficientes de
correlación, el de Pearson, si la distribución
sigue la normalidad o Rho de Spearman que se
emplea cuando la distribución no sigue la
normalidad.
En primer lugar, representamos la relación que se da entre estas dos
variables a través de un diagrama de dispersión de R Commander
Mirando el gráfico a simple vista , aunque la muestra es lo suficientemente
grande, no podemos apreciar si existe o no relación entre las dos variables.
Para ello, lo comprobamos gráficamente y a través del test de Shapiro.
Comprobamos la normalidad de los datos a través de representaciones
gráficas, con un gráfico Q-Q, histograma, y además con el test de Shapiro
• Gráfico Q-Q (Gráfica de comparación de cuantiles)
Altura Peso
En ambas gráficas existen muchos puntos que se salen de
la línea, por lo tanto, ninguna de las dos variables
siguen una distribución normal
A continuación lo comprobamos con la representación en
histogramas:
Altura
Peso
Para que las variables siguiesen una distribución normal, la gráfica tendría que
ser simétrica a un lado y otro de la mediana, que en ambos casos se encuentra
desplazada a la izquierda, y que confirman, por tanto, que ninguna de las
variables siguen una distribución normal.
Con el gráfico box-plot:
Si las variables siguiesen una distribución normal, media, mediana y moda deberían
coincidir y colocarse en el lugar central de la caja, a la misma distancia del rango
superior e inferior, en la gráfica del peso, esto claramente no ocurre así,
sin embargo, con la gráfica de la altura podríamos tener algunas dudas, puesto que la
mediana parece situarse más o menos a la misma distancia de los rangos, para
confirmarlo, hacemos un test de contraste de hipótesis, utilizando el test de Shapiro.
Test de Shapiro
En primer lugar nos planteamos las hipótesis:
H0: La variable altura sigue una distribución normal
H1: La variable altura no sigue una distribución
normal
Como podemos ver, p-valor es 4,686e-0,6 , y nos indica el error que cometeríamos si
escogiésemos la hipótesis nula, como este valor es menor que el margen de error que
nosotros habíamos aceptado (0,05) aceptamos la hipótesis nula, de manera que la
variable altura no sigue una distribución normal.
Hacemos lo mismo con la variable peso:
Ocurre lo mismo que con
La variable altura, el error que
cometeríamos si aceptamos la hipótesis nula(p-
valor) es menor
que el que habíamos asumido y, por lo tanto,
La aceptamos. La variable peso tampoco
Sigue una distribución normal.
Como las variables no siguen una distribución normal,
utilizaremos el test de Spearman.
Establecemos las hipótesis:
H0: No existe correlación entre peso y altura (rho ≠0)
H1: Existe correlación entre peso y altura. (rho=0)
Como rho es distinto de 0, podemos afirmar que existe
correlación entre las variables peso y altura, es decir,
aceptamos la hipótesis alternativa. Además esta correlación
es fuerte puesto que se aproxima más al valor 1, que al 0.

Más contenido relacionado

La actualidad más candente (20)

Tarea seminario 8 cecilia
Tarea seminario 8 ceciliaTarea seminario 8 cecilia
Tarea seminario 8 cecilia
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Tarea 8
Tarea 8Tarea 8
Tarea 8
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Tarea 8
Tarea 8Tarea 8
Tarea 8
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Semi8
Semi8Semi8
Semi8
 
Correlación
CorrelaciónCorrelación
Correlación
 
Seminario 9 estadistica
Seminario 9 estadisticaSeminario 9 estadistica
Seminario 9 estadistica
 
Tarea seminario VIII
Tarea seminario VIIITarea seminario VIII
Tarea seminario VIII
 
Seminario 10 ejercicio 1 (falta 1.1)
Seminario 10 ejercicio 1 (falta 1.1)Seminario 10 ejercicio 1 (falta 1.1)
Seminario 10 ejercicio 1 (falta 1.1)
 
Sem9 tic
Sem9 ticSem9 tic
Sem9 tic
 
T de student
T de studentT de student
T de student
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Tarea seminario 8
Tarea seminario 8Tarea seminario 8
Tarea seminario 8
 
Seminario 8: Análisis bivariado con variables cuantitativas
Seminario 8: Análisis bivariado con variables cuantitativasSeminario 8: Análisis bivariado con variables cuantitativas
Seminario 8: Análisis bivariado con variables cuantitativas
 
Informe estadístico de estadística bivariada
Informe estadístico de estadística bivariadaInforme estadístico de estadística bivariada
Informe estadístico de estadística bivariada
 
Tarea seminario 9
Tarea seminario 9Tarea seminario 9
Tarea seminario 9
 
Análisis bivariado con variables cuantitativas
Análisis bivariado con variables cuantitativas Análisis bivariado con variables cuantitativas
Análisis bivariado con variables cuantitativas
 
Correlación
CorrelaciónCorrelación
Correlación
 

Similar a Análisis de correlación entre altura y peso con datos no normales

Similar a Análisis de correlación entre altura y peso con datos no normales (20)

Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Presentación seminario 8
Presentación seminario 8Presentación seminario 8
Presentación seminario 8
 
Tarea seminiario 8
Tarea seminiario 8Tarea seminiario 8
Tarea seminiario 8
 
Seminario 9
Seminario 9Seminario 9
Seminario 9
 
Estadística bivariada.2
Estadística bivariada.2Estadística bivariada.2
Estadística bivariada.2
 
Seminario 10 primera parte
Seminario 10 primera parteSeminario 10 primera parte
Seminario 10 primera parte
 
Seminario 8 machu
Seminario 8 machuSeminario 8 machu
Seminario 8 machu
 
ESTADÍSTICA Y TICs - SEMINARIO 10 (I) - Isabel Gómez Megías
ESTADÍSTICA Y TICs - SEMINARIO 10 (I) - Isabel Gómez Megías ESTADÍSTICA Y TICs - SEMINARIO 10 (I) - Isabel Gómez Megías
ESTADÍSTICA Y TICs - SEMINARIO 10 (I) - Isabel Gómez Megías
 
Tarea 8
Tarea 8Tarea 8
Tarea 8
 
Actividades del seminario 10
Actividades del seminario 10Actividades del seminario 10
Actividades del seminario 10
 
Seminario 9.
Seminario 9.Seminario 9.
Seminario 9.
 
Tarea 9
Tarea 9Tarea 9
Tarea 9
 
Estadística bivariada ejercicio 4
Estadística bivariada ejercicio 4Estadística bivariada ejercicio 4
Estadística bivariada ejercicio 4
 
Seminario viii
Seminario viiiSeminario viii
Seminario viii
 
Seminario 8 estadistica
Seminario 8 estadistica Seminario 8 estadistica
Seminario 8 estadistica
 
Tarea 8
Tarea 8Tarea 8
Tarea 8
 
Seminario viii
Seminario viiiSeminario viii
Seminario viii
 
Tarea 8
Tarea 8Tarea 8
Tarea 8
 
Tarea seminario 9
Tarea seminario 9Tarea seminario 9
Tarea seminario 9
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 

Más de estherl8

Ejercicio tema 11
Ejercicio tema 11Ejercicio tema 11
Ejercicio tema 11estherl8
 
Ejercicio tema 9
Ejercicio tema 9Ejercicio tema 9
Ejercicio tema 9estherl8
 
Seminario 7
Seminario 7Seminario 7
Seminario 7estherl8
 
Seminario6
Seminario6Seminario6
Seminario6estherl8
 
Seminario 5
Seminario 5Seminario 5
Seminario 5estherl8
 
Seminario3
Seminario3Seminario3
Seminario3estherl8
 
Estadistica seminario 2
Estadistica seminario 2Estadistica seminario 2
Estadistica seminario 2estherl8
 

Más de estherl8 (7)

Ejercicio tema 11
Ejercicio tema 11Ejercicio tema 11
Ejercicio tema 11
 
Ejercicio tema 9
Ejercicio tema 9Ejercicio tema 9
Ejercicio tema 9
 
Seminario 7
Seminario 7Seminario 7
Seminario 7
 
Seminario6
Seminario6Seminario6
Seminario6
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Seminario3
Seminario3Seminario3
Seminario3
 
Estadistica seminario 2
Estadistica seminario 2Estadistica seminario 2
Estadistica seminario 2
 

Último

Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 

Último (20)

Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 

Análisis de correlación entre altura y peso con datos no normales

  • 1. Seminario 8 Análisis bivariado con variables cuantitativas. Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman.
  • 2. EJERCICIO Determina si existe relación entre las variables altura y peso del fichero de datos “activos en salud” y si existe determina cómo de fuerte es.
  • 3. Abrimos R Commander y cargamos el conjunto de datos “Activos en salud” , vamos a representar como se relacionan dos variables cuantitativas, peso y altura. Para ello, en primer lugar tenemos que comprobar si siguen o no una distribución normal, ya que dependiendo de ello utilizaremos distintos coeficientes de correlación, el de Pearson, si la distribución sigue la normalidad o Rho de Spearman que se emplea cuando la distribución no sigue la normalidad.
  • 4. En primer lugar, representamos la relación que se da entre estas dos variables a través de un diagrama de dispersión de R Commander Mirando el gráfico a simple vista , aunque la muestra es lo suficientemente grande, no podemos apreciar si existe o no relación entre las dos variables. Para ello, lo comprobamos gráficamente y a través del test de Shapiro.
  • 5. Comprobamos la normalidad de los datos a través de representaciones gráficas, con un gráfico Q-Q, histograma, y además con el test de Shapiro • Gráfico Q-Q (Gráfica de comparación de cuantiles)
  • 6. Altura Peso En ambas gráficas existen muchos puntos que se salen de la línea, por lo tanto, ninguna de las dos variables siguen una distribución normal
  • 7. A continuación lo comprobamos con la representación en histogramas: Altura Peso Para que las variables siguiesen una distribución normal, la gráfica tendría que ser simétrica a un lado y otro de la mediana, que en ambos casos se encuentra desplazada a la izquierda, y que confirman, por tanto, que ninguna de las variables siguen una distribución normal.
  • 8. Con el gráfico box-plot: Si las variables siguiesen una distribución normal, media, mediana y moda deberían coincidir y colocarse en el lugar central de la caja, a la misma distancia del rango superior e inferior, en la gráfica del peso, esto claramente no ocurre así, sin embargo, con la gráfica de la altura podríamos tener algunas dudas, puesto que la mediana parece situarse más o menos a la misma distancia de los rangos, para confirmarlo, hacemos un test de contraste de hipótesis, utilizando el test de Shapiro.
  • 9. Test de Shapiro En primer lugar nos planteamos las hipótesis: H0: La variable altura sigue una distribución normal H1: La variable altura no sigue una distribución normal
  • 10. Como podemos ver, p-valor es 4,686e-0,6 , y nos indica el error que cometeríamos si escogiésemos la hipótesis nula, como este valor es menor que el margen de error que nosotros habíamos aceptado (0,05) aceptamos la hipótesis nula, de manera que la variable altura no sigue una distribución normal. Hacemos lo mismo con la variable peso: Ocurre lo mismo que con La variable altura, el error que cometeríamos si aceptamos la hipótesis nula(p- valor) es menor que el que habíamos asumido y, por lo tanto, La aceptamos. La variable peso tampoco Sigue una distribución normal.
  • 11. Como las variables no siguen una distribución normal, utilizaremos el test de Spearman. Establecemos las hipótesis: H0: No existe correlación entre peso y altura (rho ≠0) H1: Existe correlación entre peso y altura. (rho=0)
  • 12.
  • 13. Como rho es distinto de 0, podemos afirmar que existe correlación entre las variables peso y altura, es decir, aceptamos la hipótesis alternativa. Además esta correlación es fuerte puesto que se aproxima más al valor 1, que al 0.