2. Determinar El uso De Los Coeficientes De Correlación De
Pearson
El coeficiente de correlación de Pearson, normalmente denotado como "r", es un
valor estadístico que mide la relación linear entre dos variables. Los rangos de
valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa
respectivamente entre ambas variables. El cálculo del coeficiente de correlación
normalmente se realiza con programas de estadística, como SPSS y SAS, para
dar los valores posibles más precisos en estudios científicos. Su interpretación y
uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde
se calcula.
USO:
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear
entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que
existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se
acerque a 1 da como resultado una mayor correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear
negativa entre las dos variables.
3. El cálculo del coeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra .
La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga dimensión y
sea un
coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de Y (peso) con lo que
obtenemos el
coeficiente de correlación de Pearson que en este caso es de 0.885 e indica una importante correlación entre
las dos variables.
Es evidente que el hecho de que la correlación sea fuerte no implica causalidad. Si elevamos al cuadrado el
coeficiente de
correlación obtendremos el coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la
variabilidad en el peso
se explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad del
peso de estos
niños. La introducción de más variable con técnicas de análisis multivariado nos permitirá identificar la
importancia
de que otras variables pueden tener sobre el peso.
6. Ventajas
La ventaja que tiene este coeficiente sobre otras herramientas para medir la correlación, como
puede ser la covarianza, es que los resultados del coeficiente de correlación están acotados entre
-1 y +1. Esta característica nos permite comparar diferentes correlaciones de una manera más
estandarizada.
7. Desventajas
Si bien 'r' (coeficiente de correlación) es una herramienta poderosa, debe ser utilizada con
cuidado.
Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo tanto, es
perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está
cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la
existencia o no de una relación no lineal.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el
número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el
valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido.
'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto. Dicho de otra
manera, al examinar el valor de 'r' podríamos concluir que las variables X e Y están relacionadas.
Sin embargo, el mismo valor de 'r no nos dice si X influencia a Y o al revés. La correlación
estadística no debe ser la herramienta principal para estudiar la causalidad, por el problema con
las terceras variables.
8. El coeficiente de correlación de Sperman, ρ (rho) es una medida de la correlación (la
asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ,
los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
Determinar El uso De Los Coeficientes De Correlación De
Sperman
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y.N es el
número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia.
USOS:
Para aplicar el coeficiente de correlación de Sperman se requiere que las variables estén medidas al menos
en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos
series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el
contexto de la Estadística Descriptiva se emplea la notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente
de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n
primeros números naturales.
9. - Al ser Sperman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9).
- Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos
del patrón normal).
- La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación
natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación
(1, 5).
Ejemplo: Con base en la información de las 44 truchas y ante el no cumplimiento de los supuestos del
coeficiente de correlación de Pearson se aplicó la técnica no paramétrica de Sperman dando como resultado
la siguiente salida ( figura 4 ).
Ventajas
10. Desventajas
Indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia.
La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos
ordenaciones de una distribución normal bivariante
11. Usos de enfoques Pearson:
Métodos Estadísticos para Investigadores”. Desde entonces, el contraste de Hipótesis es considerado
uno de los métodos de inferencia estadística de utilización obligada en casi todas las disciplinas.
Si bien hoy en día los estudiantes de Estadística aprenden a testear hipótesis aplicando una
secuencia de pasos más o menos estandarizada, es importante recordar que no estamos ante una teoría
unificada, sino ante la amalgama de los estudios sistemáticos realizados separadamente por Fisher
por un lado y Neyman y Pearson por el otro. Fisher desarrolló su teoría que denominó Pruebas de
Significación y Neyman y Pearson las llamadas Pruebas de Hipótesis. Desde 1930, fecha en que
aparecieron los trabajos de NP., la teoría de los tests de hipótesis fue dominada por el paradigma de la
decisión. Esto ha llevado al estado actual de cosas en el cual predomina la teoría de Neyman-Pearson
como modelo ó esquema de razonamiento para la toma decisiones, pero la práctica estadística en la
investigación, aplicando los mismos procedimientos, interpreta los datos como evidencia para validar
teorías.
Aplicar usos de enfoques Pearson y enfoque Sperman a problemas estadísticos.
12. Enfoque psicométrico de los factores de la inteligencia (Sperman, Catell, Thurstone)
• El enfoque psicométrico utiliza técnicas de análisis factorial con la idea de descubrir las diferencias
individuales de la inteligencia entre las personas. Para ello se recurre al uso de los test de inteligencia.
• Spearman distingue dos factores: el factor “G” y el factor “S”. El “G” es la inteligencia general (común a la
mayoría de las personas). El “S” son las habilidades específicas de la inteligencia (verbal, numérica, espacial, etc.)
Usos de enfoque Sperman: