1. República Bolivariana de Venezuela
Instituto Universitario Politécnico “Santiago Mariño”
Asignatura: Estadística I
ingeniería Industrial
Sección: YV
Profesor: Bachiller:
Pedro Beltrán Yoslandys Rodríguez
CI: 26756199
Barcelona, Julio de 2015
2. Uso de los coeficientes de correlación de
Pearson
Dado dos variables, la correlación permite hacer estimaciones
del valor de una de ellas conociendo el valor de la otra
variable.
Los coeficientes de correlación son medidas que indican la
situación relativa de los mismos sucesos respecto a las dos
variables, es decir, son la expresión numérica que nos indica
el grado de relación existente entre las 2 variables y en qué
medida se relacionan. Son números que varían entre
los límites +1 y -1. Su magnitud indica el grado de asociación
entre las variables; el valor r = 0 indica que no existe relación
entre las variables; los valores ( 1 son indicadores de una
correlación perfecta positiva (al crecer o decrecer X, crece o
decrece Y) o negativa (Al crecer o decrecer X, decrece o crece
Y).
4. Para interpretar el coeficiente de
correlación utilizamos la siguiente escala:
Valorar Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
5. Para datos no agrupados se calcula
aplicando la siguiente ecuación:
6. Aplicar usos de enfoques Pearson a problemas
estadísticos
• Identifica el dependiente variable que se probará entre
dos observaciones derivadas independientemente.
•Uno de los requisitos es que las dos variables que se
comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado.
•Para cantidades grandes de información, el calculo puede
ser tedioso.
•Reporta un valor de correlación cercano a 0 como un
indicador de que no hay relación linear entre las dos
variables.
•Reporta un valor de correlación cercano al 1 como
indicador de que existe una relación linear positiva entre
las dos variables.
7. •Un valor mayor a cero que se acerque a 1 da como resultado
una mayor correlación positiva entre la información.
• Reporta un valor de correlación cercano a -1 como indicador
de que hay una relación linear negativa entre las dos
variables.
•Interpreta el coeficiente de correlación de acuerdo con el
contexto de los datos particulares.
•El valor de correlación es esencialmente un valor arbitrario
que debe aplicarse de acuerdo con las variables que se
comparan.
• Determina la importancia de los resultados.
• Esto se logra con el uso del coeficiente de correlación,
grados de libertad y una tabla de valores críticos del
coeficiente de correlación.
• Los grados de libertad se calculan como el número de las
dos observaciones menos 2.
8. Uso de los coeficientes de correlación de
Spearman
En estadística, el coeficiente de correlación de
Spearman, ρ (rho) es una medida de la correlación (la
asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la
hora de ordenarlos, aunque si éstos son pocos, se puede
ignorar tal circunstancia
9. Para muestras mayores de 20 observaciones, podemos
utilizar la siguiente aproximación a la distribución t de
Student
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y
+1, indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos ordenaciones
de una distribución normal bivariante.
10. Ventajas del coeficiente de Spearman
1. Al ser Spearman una técnica no paramétrica es libre
de distribución probabilística (2, 5, 9).
2. Los supuestos son menos estrictos. Es robusto a la
presencia de outliers (es decir permite ciertos desvíos
del patrón normal). La manifestación de una relación
causa-efecto es posible sólo a través de la comprensión
de la relación natural que existe entre las variable y no
debe manifestarse sólo por la existencia de una fuerte
correlación (1, 5).
11. Desventajas del coeficiente de Spearman
Los coeficientes de correlación más utilizados sólo miden una relación
lineal. Por lo tanto, es perfectamente posible que, si bien existe una
fuerte relación no lineal entre las variables, r está cerca de 0 o igual a
0. En tal caso, un diagrama de dispersión puede indicar
aproximadamente la existencia o no de una relación no lineal.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se
podría calcular 'r' entre el número de calzado y la inteligencia de las
personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no
tiene sentido y por lo tanto es llamado correlación de oportunidad o
sin sentido.
'R' no debe ser utilizado para decir algo sobre la relación entre causa y
efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos
concluir que las variables X e Y están relacionadas. Sin embargo, el
mismo valor de 'r no nos dice si X influencia a Y o al revés. La
correlación estadística no debe ser la herramienta principal para
estudiar la causalidad por el problema con las terceras variables.
12. Aplicar usos de enfoques
Spearman a problemas estadísticos
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega
ρs (rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs La fórmula
de cálculo para rs puede derivarse de la utilizada en el caso
de rxy; bastaría aplicar el coeficiente de correlación de
Pearson a dos series de puntuaciones ordinales,
compuestas cada una de ellas por la n primeros números
naturales.
13. A partir de un conjunto de n puntuaciones, la fórmula que
permite el cálculo de la correlación entre dos variables X
e Y, medidas al menos en escala ordinal, es la
siguiente: Donde d es la distancia existente entre los
puestos que ocupan las puntuaciones correspondientes a
un sujeto i cuando estas puntuaciones han sido
ordenadas para X y para Y. El coeficiente de correlación de
Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los
sujetos se sitúan en el mismo puesto para la variable X y
para la variable Y, el valor de rs es 1. Si ocupan valores
opuestos, es decir, al primer sujeto en X le corresponde el
último lugar en Y, al segundo en X le corresponde el
penúltimo en Y, etc., entonces el valor de rs es -1.w