Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

04. correlación lineal.pdf

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Próximo SlideShare
5 regresion y correlacion
5 regresion y correlacion
Cargando en…3
×

Eche un vistazo a continuación

1 de 21 Anuncio

Más Contenido Relacionado

Más reciente (20)

Anuncio

04. correlación lineal.pdf

  1. 1. ▪Graficar nubes de puntos de arreglos bidimensionales en un plano cartesiano. ▪Identificar el patrón de correlación lineal en un arreglo bidimensional de variables estadísticas. ▪Calcular e interpretar el coeficiente de correlación de Pearson, para un conjunto de puntos.
  2. 2. En los temas desarrollados anteriormente, nos hemos enfocado en describir y analizar una sola variable, por ejemplo: edad, peso, estatura, el nivel de ingresos, tiempo de espera, coeficiente intelectual, calificaciones,etc. Se trabajó en la representación gráfica de estas variables, se calculó sus medidas de tendencia central, medidas de dispersión, también se calculó intervalos de confianza para los parámetros de la población; sin embargo, cuando se hace un estudio generalmente interesa analizar más de una variable y hacer un análisis conjunto de ellas, de manera que se pueda ver cómo éstas variables se relacionan entre sí, de modo que pueda establecerse dependencia entre ellas, ya que muchos problemas están influidos por otros, y frecuentemente resulta interesante determinar qué tanta relación tienen dos variables. Por ejemplo, qué tan relacionado está el peso y la estatura de una persona, o si está relacionado el peso con la incidencia de enfermedades cardiovasculares, los años de estudio con el nivel de ingresos, entre otros.
  3. 3. Resulta interesante poder establecer si dos variables están relacionadas porque permite analizar las causas y efectos en situaciones reales, con el fin de predecir eventos futuros y particularmente el caso de los estudios de fenómenos sociales; esto puede traducirse en una contribución al bienestar de la sociedad. Para ilustrar estas ideas pensemos en un ejemplo hipotético: Supongamos que se toma una muestra de 10 niños recién nacidos a los que les tomó talla y peso al momento de su nacimiento obteniendo los resultados que se muestran a continuación:
  4. 4. Usando un poco el sentido común, se esperaría que a mayor talla el peso del niño también sería mayor,aunque no necesariamente esto siempre va a ser cierto, porque habrá niños bajos de talla que muestren mayor peso; sin embargo, para ver si el supuesto se cumple Hacemos un arreglo de los datos anteriores, ordenado por talla en forma ascendente (de menor a mayor) para ver si existe esa relación entre la talla y el peso, de manera que a mayor talla esperaríamos mayor peso de los niños al nacer.
  5. 5. Si representamos los pares ordenados (talla, peso) para cada niño en el plano cartesiano, podemos observar la misma tendencia que ya habíamos identificado: a mayor talla se esperaría mayor peso en los niños al nacer.
  6. 6. Después de identificar esa relación entre las variables talla y peso, el siguiente paso sería poder predecir el peso de un niño si conocemos su talla. En este caso estamos indicando dependencia entre las variables esto es: el peso depende de la talla. Hasta ahora hemos visto que, al estudiar simultáneamente el comportamiento de dos variables, se hace con el propósito de conocer la influencia que tiene una variable sobre la otra, o en qué medida se relacionan entre ellas, esto es lo que se conoce como correlación. Pasemos ahora a formalizar estas ideas definiendo algunos términos importantes
  7. 7. Distribuciones bidimensionales: cuando se estudian simultáneamente los valores de dos variables estadísticas, el conjunto de los pares ordenados de valores correspondientes a cada individuo o punto muestral se denomina distribución bidimensional. En el ejemplo de la talla y peso de los recién nacidos podemos apreciar el arreglo bidimensional resultante de los datos de ambas variables.
  8. 8. Correlación: es la relación que existe entre dos variables. Al estudiar simultáneamente los valores de dos variables estadísticas distintas, se hace con el fin de determinar si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra variable. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. Por ejemplo podríamos mencionar algunas variables entre las cuales existe correlación: 1. La puntuación obtenida en una prueba de inteligencia y el índice académico de un grupo de alumnos. Se esperaría que los estudiantes con puntuaciones más altas en la prueba de inteligencia también tendrían un mayor índice académico. 2. La velocidad de un vehículo y el tiempo que tarda en llegar a su destino. A mayor velocidad se necesitaría menos tiempo para llegar al destino previsto.
  9. 9. 3. La cantidad de calorías ingeridas en la dieta diaria y el peso de un grupo de personas. A una mayor ingesta de calorías en la dieta diaria mayor peso de las personas. En algunos casos es posible que se observe una aparente relación entre dos variables, aunque en realidad no exista, esto puede darse debido a que hay una tercera variable que está influyendo; por ejemplo, si se analiza la relación que existe entre la estatura y la fluidez verbal de las personas. Es obvio que estas dos variables no están relacionadas entre sí, pero si se aplica el mismo test, a niños entre los tres y los doce años, es natural que los niños más altos tengan más fluidez verbal, ya que son los de mayor edad; en este caso, la variable edad es realmente la que influye en el incremento de la fluidez verbal en esa etapa de la vida.
  10. 10. Concepto de nube de puntos Para identificar si hay correlación entre dos variables es de gran utilidad construir un diagrama de dispersión representando los puntos del arreglo bidimensional en el plano. Nube de puntos o diagrama de dispersión: La representación de los pares ordenados de una distribución bidimensional en el plano cartesiano se denomina nube de puntos o diagrama de dispersión. En el ejemplo de la talla y peso de los recién nacidos podemos apreciar el arreglo bidimensional y el diagrama de dispersión correspondiente:
  11. 11. Cuando dos variables están relacionadas, la correlación puede ser positiva o negativa. ▪ CORRELACIÓN POSITIVA: se dice que existe correlación positiva entre dos variables “X” e “Y” si al incrementar el valor de la variable “X” también se observa que la variable “Y” tiende a incrementarse. ▪ CORRELACIÓN NEGATIVA: se dice que existe correlación negativa entre dos variables “X” e “Y” si al incrementar el valor de la variable “X”, se observa que la variable “Y” tiende a disminuir.
  12. 12. De acuerdo con la forma que toman los puntos de un arreglo bidimensional en el diagrama de dispersión, se puede decir si la relación entre las dos variables es lineal, curvilínea u otra.
  13. 13. Cuando el diagrama de dispersión de un arreglo bidimensional de dos variables tiene un patrón de comportamiento lineal, esto es la nube de puntos se agrupa alrededor de una recta, diremos que la correlación es lineal, como se muestra en los siguientes gráficos:
  14. 14. Se dice que la correlación lineal es fuerte cuando la nube de puntos se distribuye alrededor de una recta y será cada vez más débil (o menos fuerte) cuando la nube se dispersa con respecto a la recta. En los gráficos anteriores se observa que la correlación es bastante fuerte, ya que las rectas que hemos dibujado están próximas a los puntos de la nube. ▪ Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable,la otra variable también tiende a aumentar. ▪ Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable,la otra variable tiende a disminuir. La apreciación visual de la existencia de correlación no es suficiente, por lo que utilizaremos un indicador llamado coeficiente de correlación,el cual permitirá valorar si la correlación es fuerte o débil, positiva o negativa.
  15. 15. ▪ Coeficiente de correlación: es un indicador que cuantifica el grado de relación que existe entre dos variables. El valor del coeficiente de correlación oscila de -1 y 1; cuando las variables no guardan relación entre sí, el coeficiente de correlación será cercano a cero, mientras que si las variables están muy relacionadas el coeficiente de correlación será cercano a -1 o a 1, dependiendo del sentido de la relación. ▪ Si el coeficiente de correlación es uno (1) se dice que hay correlación perfecta positiva entre las variables. ▪ Si el coeficiente de correlación es menos uno (-1) se dice que hay correlación perfecta negativa entre las variables. ▪ Si el coeficiente de correlación es cero se dice que no hay correlación entre las variables.
  16. 16. Coeficiente de correlación de Pearson (r) El coeficiente “r” de Pearson es el coeficiente de correlación que comúnmente se utiliza para medir qué tan estrecho es el ajuste de las coordenadas (x,y) con respecto a la recta que mejor se ajusta a la nube de puntos. La fórmula para calcular la “r” de Pearson es la siguiente:
  17. 17. ▪ https://youtu.be/LaDGREQL9o4 ▪ https://youtu.be/Gj6-OJb4uxk ▪ https://youtu.be/VizbC6dsRNQ

×