República Bolivariana de Venezuela
Instituto Universitario Politécnico “Santiago Mariño”
Asignatura: Estadística I
ingeniería Industrial
Sección: YV
Profesor: Bachiller:
Pedro Beltrán Yoslandys Rodríguez
CI: 26756199
Barcelona, Julio de 2015
Uso de los coeficientes de correlación de
Pearson
Dado dos variables, la correlación permite hacer estimaciones
del valor de una de ellas conociendo el valor de la otra
variable.
Los coeficientes de correlación son medidas que indican la
situación relativa de los mismos sucesos respecto a las dos
variables, es decir, son la expresión numérica que nos indica
el grado de relación existente entre las 2 variables y en qué
medida se relacionan. Son números que varían entre
los límites +1 y -1. Su magnitud indica el grado de asociación
entre las variables; el valor r = 0 indica que no existe relación
entre las variables; los valores ( 1 son indicadores de una
correlación perfecta positiva (al crecer o decrecer X, crece o
decrece Y) o negativa (Al crecer o decrecer X, decrece o crece
Y).
Ejemplo:
Para interpretar el coeficiente de
correlación utilizamos la siguiente escala:
Valorar Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Para datos no agrupados se calcula
aplicando la siguiente ecuación:
Aplicar usos de enfoques Pearson a problemas
estadísticos
• Identifica el dependiente variable que se probará entre
dos observaciones derivadas independientemente.
•Uno de los requisitos es que las dos variables que se
comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado.
•Para cantidades grandes de información, el calculo puede
ser tedioso.
•Reporta un valor de correlación cercano a 0 como un
indicador de que no hay relación linear entre las dos
variables.
•Reporta un valor de correlación cercano al 1 como
indicador de que existe una relación linear positiva entre
las dos variables.
•Un valor mayor a cero que se acerque a 1 da como resultado
una mayor correlación positiva entre la información.
• Reporta un valor de correlación cercano a -1 como indicador
de que hay una relación linear negativa entre las dos
variables.
•Interpreta el coeficiente de correlación de acuerdo con el
contexto de los datos particulares.
•El valor de correlación es esencialmente un valor arbitrario
que debe aplicarse de acuerdo con las variables que se
comparan.
• Determina la importancia de los resultados.
• Esto se logra con el uso del coeficiente de correlación,
grados de libertad y una tabla de valores críticos del
coeficiente de correlación.
• Los grados de libertad se calculan como el número de las
dos observaciones menos 2.
Uso de los coeficientes de correlación de
Spearman
En estadística, el coeficiente de correlación de
Spearman, ρ (rho) es una medida de la correlación (la
asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la
hora de ordenarlos, aunque si éstos son pocos, se puede
ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos
utilizar la siguiente aproximación a la distribución t de
Student
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y
+1, indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos ordenaciones
de una distribución normal bivariante.
Ventajas del coeficiente de Spearman
1. Al ser Spearman una técnica no paramétrica es libre
de distribución probabilística (2, 5, 9).
2. Los supuestos son menos estrictos. Es robusto a la
presencia de outliers (es decir permite ciertos desvíos
del patrón normal). La manifestación de una relación
causa-efecto es posible sólo a través de la comprensión
de la relación natural que existe entre las variable y no
debe manifestarse sólo por la existencia de una fuerte
correlación (1, 5).
Desventajas del coeficiente de Spearman
Los coeficientes de correlación más utilizados sólo miden una relación
lineal. Por lo tanto, es perfectamente posible que, si bien existe una
fuerte relación no lineal entre las variables, r está cerca de 0 o igual a
0. En tal caso, un diagrama de dispersión puede indicar
aproximadamente la existencia o no de una relación no lineal.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se
podría calcular 'r' entre el número de calzado y la inteligencia de las
personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no
tiene sentido y por lo tanto es llamado correlación de oportunidad o
sin sentido.
'R' no debe ser utilizado para decir algo sobre la relación entre causa y
efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos
concluir que las variables X e Y están relacionadas. Sin embargo, el
mismo valor de 'r no nos dice si X influencia a Y o al revés. La
correlación estadística no debe ser la herramienta principal para
estudiar la causalidad por el problema con las terceras variables.
Aplicar usos de enfoques
Spearman a problemas estadísticos
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega
ρs (rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs La fórmula
de cálculo para rs puede derivarse de la utilizada en el caso
de rxy; bastaría aplicar el coeficiente de correlación de
Pearson a dos series de puntuaciones ordinales,
compuestas cada una de ellas por la n primeros números
naturales.
A partir de un conjunto de n puntuaciones, la fórmula que
permite el cálculo de la correlación entre dos variables X
e Y, medidas al menos en escala ordinal, es la
siguiente: Donde d es la distancia existente entre los
puestos que ocupan las puntuaciones correspondientes a
un sujeto i cuando estas puntuaciones han sido
ordenadas para X y para Y. El coeficiente de correlación de
Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los
sujetos se sitúan en el mismo puesto para la variable X y
para la variable Y, el valor de rs es 1. Si ocupan valores
opuestos, es decir, al primer sujeto en X le corresponde el
último lugar en Y, al segundo en X le corresponde el
penúltimo en Y, etc., entonces el valor de rs es -1.w
Bibliografía
•http://www.monografias.com/trabajos93/muestreo-correlaciones-
contingencias-y-pearson/muestreo-correlaciones-contingencias-y-
pearson2.shtml
•http://www.buenastareas.com/ensayos/Correlacion/6991496.html
•http://personal.us.es/vararey/adatos2/correlacion.pdf
•http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1729-
519X2009000200017

Presentacion de estadistica correlacion - y

  • 1.
    República Bolivariana deVenezuela Instituto Universitario Politécnico “Santiago Mariño” Asignatura: Estadística I ingeniería Industrial Sección: YV Profesor: Bachiller: Pedro Beltrán Yoslandys Rodríguez CI: 26756199 Barcelona, Julio de 2015
  • 2.
    Uso de loscoeficientes de correlación de Pearson Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable. Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
  • 3.
  • 4.
    Para interpretar elcoeficiente de correlación utilizamos la siguiente escala: Valorar Significado -1 Correlación negativa grande y perfecta -0,9 a -0,99 Correlación negativa muy alta -0,7 a -0,89 Correlación negativa alta -0,4 a -0,69 Correlación negativa moderada -0,2 a -0,39 Correlación negativa baja -0,01 a -0,19 Correlación negativa muy baja 0 Correlación nula 0,01 a 0,19 Correlación positiva muy baja 0,2 a 0,39 Correlación positiva baja 0,4 a 0,69 Correlación positiva moderada 0,7 a 0,89 Correlación positiva alta 0,9 a 0,99 Correlación positiva muy alta 1 Correlación positiva grande y perfecta
  • 5.
    Para datos noagrupados se calcula aplicando la siguiente ecuación:
  • 6.
    Aplicar usos deenfoques Pearson a problemas estadísticos • Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. •Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado. •Para cantidades grandes de información, el calculo puede ser tedioso. •Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. •Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables.
  • 7.
    •Un valor mayora cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. • Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. •Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. •El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. • Determina la importancia de los resultados. • Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. • Los grados de libertad se calculan como el número de las dos observaciones menos 2.
  • 8.
    Uso de loscoeficientes de correlación de Spearman En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión: donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
  • 9.
    Para muestras mayoresde 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
  • 10.
    Ventajas del coeficientede Spearman 1. Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9). 2. Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal). La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5).
  • 11.
    Desventajas del coeficientede Spearman Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la existencia o no de una relación no lineal. Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido. 'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir que las variables X e Y están relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X influencia a Y o al revés. La correlación estadística no debe ser la herramienta principal para estudiar la causalidad por el problema con las terceras variables.
  • 12.
    Aplicar usos deenfoques Spearman a problemas estadísticos Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales.
  • 13.
    A partir deun conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente: Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.w
  • 14.