1. INSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”
INGENIERÍA INDUSTRIAL
PROFESOR: RAMÓN ARAY BACHILLER: MARÍA CORNIVEL
ESTADÍSTICA I C.I: 23734548
SECCIÓN: YV
BARCELONA, 10 DE FEBRERO DE 2016
2. COEFICIENTE DE CORRELACIÓN DE SPEARMAN
Este coeficiente es una medida de asociación lineal que utiliza los rangos, números
de orden, de cada grupo de sujetos y compara dichos rangos.
La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas
o positivas respectivamente, 0 cero, significa no correlación pero no independencia
Fórmula:
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más
elevados le asignamos el rango 1 al siguiente el rango 2 y así sucesivamente. Si
se repiten dos puntajes o más se calculan las medias aritméticas.
3. COEFICIENTE DE CORRELACIÓN DE SPEARMAN
Ejemplo N°1: La siguiente tabla muestra el rango u orden obtenido en
la primera evaluación (X) y el rango o puesto obtenido en la segunda
evaluación (Y) de 8 estudiantes universitarios en la asignatura de
Estadística. Calcular el coeficiente de correlación por rangos de
Spearman:
Estudiante X Y
Diana 1 3
Elisabet
h
2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucia 8 7
El coeficiente de
correlación de
Spearman es menos
sensible que el de
Pearson para los
valores muy lejos de
lo esperado.
4. COEFICIENTE DE CORRELACIÓN DE SPEARMAN
Solución: Para calcular el coeficiente de correlación por rangos de Spearman
de se llena la siguiente tabla:
Se aplica la fórmula:
Por lo tanto existe una correlación positiva moderada entre la primera y
segunda evaluación de los 8 estudiantes.
5. USOS DEL COEFICIENTE DE CORRELACIÓN DE
SPEARMAN
A partir de un conjunto de n puntuaciones, la formula que permite el
calculo de la correlación entre dos variables X y Y, medidas al menos en
escala ordinal, es la siguiente:
P=0 no hay correlación
p≠0 hay correlación
6. VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE SPEARMAN
Ventajas:
No esta afectada por los cambios en la unidades de medida.
Al ser una técnica no parámetra, es libre de distribución probabilística.
7. VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE SPEARMAN
Desventajas:
Es recomendable usarlo cuando los datos presentan valores extremos,
ya que dichos valores afectan mucho el coeficiente de correlación.
R no debe ser utilizado para decir algos obre la relación causa y efecto.
8. USOS DE ENFOQUES DE SPEARMAN A PROBLEMAS
ESTADÍSTICOS.
Una generalización del coeficiente de spearman es útil en la situación en la cual
hay tres o mas condiciones, varios individuos son observados en cada una de
ellas, y predecimos que las observaciones tendrán un orden en particular. Por
ejemplo, un conjunto de individuos pueden tener tres oportunidades para
intentar cierta tarea y predecimos que su habilidad mejorara de intento en
intento.
El coeficiente de correlación de rangos de spearman debe utilizarse para serie
de datos en los que existan valores extremos, pues si calculamos la correlación
de pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación se encuentra entre
los valores de -1 y 1.
La significación estadística de un coeficiente debe tener en cuenta
conjuntamente con la relevancia clínica del fenómeno que se estudia.
9. COEFICIENTE DE CORRELACIÓN DE PEARSON
Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es independiente de la
escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson
como un índice que puede utilizarse para medir el grado de relación de dos
variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una
población; el coeficiente de correlación de Pearson se simboliza con la letra
rho_{x,y}, siendo la expresión que nos permite calcularlo:
10. COEFICIENTE DE CORRELACIÓN DE PEARSON
Donde:
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un estadístico
muestral, denotado como a :
11. VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE PEARSON
Ventajas:
El valor de coeficiente de correlación es independiente de cualquier
unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será la estimación.
12. VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE PEARSON
Desventajas:
Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la
de la curva normal.
13. USOS DEL COEFICIENTE DE CORRELACIÓN DE
PEARSON
Permite predecir el valor de una variable dado un valor determinado de
la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
Dicho calculo es el primer paso para determinar la relación entre las
variables.
Consiste en la posibilidad de calcular su distribución muestral y asi
poder determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que
no hay relación lineal entre 2 variable.
14. USOS DE ENFOQUES DE PEARSON A PROBLEMAS
ESTADÍSTICOS.
En la perspectiva de pearson, para establecer el nivel de significación
estadístico habría que atender al impacto de cada tipo de error en el objetivo del
investigador y a partir de ahí se decidirá cual de ellos es preferible minimizar.
Pearson llamo alfa al error tipo I y beta al error tipo II; a partir de este ultimo tipo
de error, introdujeron el concepto de “poder de una prueba estadística”, el cual
se refiere a su capacidad para evitar el error tipo II y esta definido por 1-beta y
en estrecha relación con este se ha desarrollado el concepto de “tamaño del
efecto” que algunos han propuesto como sustituto de los valores p en los
informes de investigación científica.
Las pruebas paramétricas mas conocidas y usadas son las pruebas T de
Student, la prueba F, llamada así en honor a Fisher y el coeficiente de
correlación de pearson, simbolizado por r.