Caja de herramientas de inteligencia artificial para la academia y la investi...
el uso de los coeficientes de correlación de Pearson y de Sperman
1. República Bolivariana De Venezuela
Ministerio Del Poder Popular Para La Educación Superior
Instituto Universitario Santiago Mariño
Ingeniería Industrial
Sección: Yv
COEFICIENTES DE CORRELACION DE PEARSON
Y SPERMAN
Barcelona, Febrero de 2016
Bachiller:
Renzon Cumana C.I.: 24.492.308
Profesor:
Ramón Aray
2. Coeficiente de Correlación de
Pearson
El Coeficiente de Correlación de Pearson es una medida
de la relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente
de correlación de Pearson como un índice que puede utilizarse para
medir el grado de relación de dos variables siempre y cuando ambas
sean cuantitativas.
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población; el coeficiente de correlación
de Pearson se simboliza con la letra , siendo la expresión que nos
permite calcularlo:
3. Coeficiente de Correlación de
Pearson
Donde;
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente
sobre un estadístico muestral, denotado como a:
4. El valor del coeficiente de
correlación es independiente
de cualquier unidad usada
para medir variables.
Mientras mas grande sea la
muestra mas exacta será la
estimación. Requiere supuestos acerca de la
naturaleza o formas de las poblaciones
afectadas.
Requiere que las dos variables hayan
ido medidas hasta un nivel cuantitativo
continuo y que la distribución de
ambas sea semejante a la de la curva
normal.
Ventajas y desventajas del
coeficiente de Pesaron
5. Usos del Coeficiente de Correlación
de Pearson
Permite predecir el valor de una variable dado un valor determinado de la otra
variable.
Se trata de valorar la asociación entre dos variables cuantitativas estudiando el
método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las variables.
Consiste en la posibilidad de calcular su distribución muestral y así poder
determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación lineal entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de que existe una
relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque
a 1 da como resultado una mayor correlación positiva entre la información.
6. Características de la R de Pearson
La r de Pearson es una medida que indica hasta que punto los
mismos individuos o sucesos ocupan la misma posición relativa a 2
variables.
La r de Pearson refleja únicamente la relación lineal entre 2
variables.
Cuando la relación es perfecta positiva, cada individuo obtiene
exactamente las mismas calificaciones en ambas variables.
Un valor alto positivo alto de r de Pearson indica que cada individuo
obtiene, aproximadamente; las mismas calificaciones en ambas
variables.
9. Usos de Enfoques de Pearson
a Problemas Estadísticos
En la perspectiva de Pearson, para establecer el nivel de
significación estadística habría que atender al impacto de cada tipo de error
en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es
preferible minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir
de este último tipo de error, introdujeron el concepto de “poder de una
prueba estadística”, el cual se refiere a su capacidad para evitar el error
tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha
desarrollado el concepto de “tamaño del efecto” que algunos han propuesto
como sustituto de los valores p en los informes de investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T
de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de
correlación de Pearson, simbolizado por r.
10. Coeficiente de Correlación de
Spearman
El Coeficiente de Correlación de Spearman, ρ (rho) es
una medida de la correlación (la asociación o interdependencia)
entre dos variables aleatorias continuas. Para calcular ρ, los
datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
11. Coeficiente de Correlación de
Spearman
Donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a
la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar
tal circunstancia.
Para muestras mayores de 20 observaciones, podemos
utilizar la siguiente aproximación a la distribución t de Student
12. Coeficiente de Correlación de
Spearman
La interpretación de coeficiente de Spearman es igual que
la del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0
cero, significa no correlación pero no independencia.
La correlación estimada entre X e Y se halla calculando el
coeficiente de correlación de Pearson para el conjunto de rangos
apareados.
La correlación de Spearman puede ser calculada con la
fórmula de Pearson, si antes hemos transformado las puntuaciones
en rangos.
13. Usos del Coeficiente de correlación
de Spearman
A partir de un conjunto de n puntuaciones, la formula que
permite el calculo de la correlación entre dos variables X e Y,
medidas al menos en escala ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan
las puntuaciones correspondientes a un sujeto i cuando estas
puntuaciones han sido ordenadas para X y para Y.
14. Ventajas y Desventajas del
Coeficiente de Spearman
No esta afectada por los
cambios en las unidades de
medida.
Al ser una técnica no
parámetra, es libre de
distribución probabilística.
Es recomendable usarlo
cuando los datos presentan
valores extremos, ya que
dichos valores afectan mucho
el coeficiente de correlación
de Pearson, o ante
distribuciones no normales.
r no debe ser utilizado para
decir algo sobre la relación
entre causa y efecto.
15. Usos del Coeficiente de correlación
de Spearman
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir; de forma que las puntuaciones que la
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs
(rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs.
16. Propiedades Coeficiente de
Correlación de Spearman
El Coeficiente de Correlación de Spearman se encuentra
siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs <
1.
Cuando todos los sujetos se sitúan en el mismo puesto para la
variable X y para la variable Y, el valor de rs es 1. Si ocupan
valores opuestos, es decir; al primer sujeto en X le corresponde
el ultimo lugar en Y, al segundo en X le corresponde el penúltimo
en Y, etc. Entonces el valor de rs es -1.
18. Usos de Enfoques de Spearman a
Problemas Estadísticos
Una generalización del coeficiente de Spearman es útil en la
situación en la cual hay tres o más condiciones, varios individuos son
observados en cada una de ellas, y predecimos que las observaciones
tendrán un orden en particular. Por ejemplo, un conjunto de individuos
pueden tener tres oportunidades para intentar cierta tarea, y predecimos
que su habilidad mejorará de intento en intento.
El coeficiente de correlación de rangos de Spearman debe
utilizarse para series de datos en los que existan valores extremos, pues si
calculamos la correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de
Spearman se encuentra entre los valores de -1 y 1.
La significación estadística de un coeficiente debe tenerse en cuenta
conjuntamente con la relevancia clínica del fenómeno que se estudia.
19. Bibliografía
Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre
variables cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cua
ntitativas2.pdf Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_
de_Pearson.