Profesor: Alumna:
Ramón Aray 26.564.471 Laura Fuentes
Barcelona, Julio 2015.
República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
Ingeniería en Mantenimiento Mecánico
Sección “ZV”
Coeficiente de Correlación de Pearson
 Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia
de la covarianza, la correlación de Pearson es independiente de la escala de medida de las
variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson
como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y
cuando ambas sean cuantitativas. En el caso de que se esté estudiando dos variables aleatorias x
e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra , siendo
la expresión que nos permite calcularlo:
Coeficiente de Correlación de Pearson
Donde;
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este
coeficiente sobre un estadístico muestral,
denotado como a
Ventajas y Desventajas del Coeficiente de
Pearson
VENTAJAS:
 El valor del coeficiente de correlación es independiente de cualquier
unidad usada para medir variables.
 Mientras mas grande sea la muestra mas exacta será la estimación.
DESVENTAJAS:
 Requiere supuestos acerca de la naturaleza o formas de las poblaciones
afectadas.
 Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la de
la curva normal.
Usos del coeficiente de correlación de Pearson
 Permite predecir el valor de una variable dado un valor determinado de la otra variable.
 Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como
correlación.
 Dicho cálculo es el primer paso para determinar la relación entre las variables.
 Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de
estimación.
 Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2
variables.
 Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva
entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva
entre la información. Usos del Coeficiente de Correlación de Pearson.
Usos de enfoques Pearson a problemas
estadísticos
 En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que
atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se
decidiría cuál de ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al
error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una
prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido
por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto”
que algunos han propuesto como sustituto de los valores p en los informes de investigación
científica. Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la
prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado
por “r”.
El Coeficiente de Correlación de Spearman
 Es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias
continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo
orden. El estadístico ρ viene dado por la expresión:
Coeficiente de Correlación de Spearman
El Coeficiente de Correlación de Spearman
 Donde D es la diferencia entre los
correspondientes estadísticos de orden de x - y. N
es el número de parejas. Se tiene que considerar la
existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede
ignorar tal circunstancia. Para muestras mayores
de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
El Coeficiente de Correlación de Spearman
 La interpretación de coeficiente de Spearman es igual que la del
coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia. La correlación estimada entre X e Y se
halla calculando el coeficiente de correlación de Pearson para el conjunto
de rangos apareados. La correlación de Spearman puede ser calculada con
la fórmula de Pearson, si antes hemos transformado las puntuaciones en
rangos.
Usos del Coeficiente de Correlación de
Spearman
 A partir de un conjunto de n puntuaciones, la formula
que permite el calculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal,
es la siguiente:
 P=0 No hay correlación
 p≠ 0 Hay correlación
 Donde d es la distancia existente entre los puestos que
ocupan las puntuaciones correspondientes a un sujeto
i cuando estas puntuaciones han sido ordenadas para
X y para Y.
Ventajas y desventajas
VENTAJAS
 No esta afectada por los cambios en las unidades de medida.
 Al ser una técnica no parámetra, es libre de distribución
probabilística.
DESVENTAJAS
 Es recomendable usarlo cuando los datos presentan valores
extremos, ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no normales.
 r no debe ser utilizado para decir algo sobre la relación entre causa y
efecto.
Usos del Coeficiente de correlación de
Spearman
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir; de forma que las puntuaciones que la representan
puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs
(rho), aunque cuando nos situamos en el contexto de la Estadística
Descriptiva se emplea la notación rs
Bibliografía
 Internet
 Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre
variables cuantitativas.
 http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_
cuantitativas2.pdf Correlation en Wikipedia (inglés).
 http://personal.us.es/vararey/adatos2/correlacion.pdf.
 https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3
n_de_Pearson.

Coeficiente de correlación de pearson y spearman

  • 1.
    Profesor: Alumna: Ramón Aray26.564.471 Laura Fuentes Barcelona, Julio 2015. República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Instituto Universitario Politécnico “Santiago Mariño” Ingeniería en Mantenimiento Mecánico Sección “ZV”
  • 2.
    Coeficiente de Correlaciónde Pearson  Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que nos permite calcularlo:
  • 3.
    Coeficiente de Correlaciónde Pearson Donde; es la covarianza de (X,Y) es la desviación típica de la variable X es la desviación típica de la variable Y De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como a
  • 4.
    Ventajas y Desventajasdel Coeficiente de Pearson VENTAJAS:  El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.  Mientras mas grande sea la muestra mas exacta será la estimación. DESVENTAJAS:  Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.  Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.
  • 5.
    Usos del coeficientede correlación de Pearson  Permite predecir el valor de una variable dado un valor determinado de la otra variable.  Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación.  Dicho cálculo es el primer paso para determinar la relación entre las variables.  Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación.  Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2 variables.  Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Usos del Coeficiente de Correlación de Pearson.
  • 6.
    Usos de enfoquesPearson a problemas estadísticos  En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica. Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por “r”.
  • 7.
    El Coeficiente deCorrelación de Spearman  Es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión: Coeficiente de Correlación de Spearman
  • 8.
    El Coeficiente deCorrelación de Spearman  Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia. Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
  • 9.
    El Coeficiente deCorrelación de Spearman  La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de rangos apareados. La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las puntuaciones en rangos.
  • 10.
    Usos del Coeficientede Correlación de Spearman  A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:  P=0 No hay correlación  p≠ 0 Hay correlación  Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.
  • 11.
    Ventajas y desventajas VENTAJAS No esta afectada por los cambios en las unidades de medida.  Al ser una técnica no parámetra, es libre de distribución probabilística. DESVENTAJAS  Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales.  r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
  • 12.
    Usos del Coeficientede correlación de Spearman Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir; de forma que las puntuaciones que la representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs
  • 13.
    Bibliografía  Internet  Correlaciónen Wikipedia (español): http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre variables cuantitativas.  http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_ cuantitativas2.pdf Correlation en Wikipedia (inglés).  http://personal.us.es/vararey/adatos2/correlacion.pdf.  https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3 n_de_Pearson.