Como determinar el uso de coeficientes de correlación de Pearson y Sperman, ventajas de cada uno de ellos y usos de enfoques sperman y pearson a problemas estadísticos.
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Presentacion Gabriela Ramos
1. Republica Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
I.U.P Santiago Mariño
Ing. De Mantenimiento Mecánico
Bachiller: Gabriela Ramos
C.I: V-25061688
Barcelona, Julio de 2016
2. Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias
cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las
variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que
puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación
de Pearson se simboliza con la letra , siendo la expresión que nos permite calcularlo:
4. Ventajas y Desventajas del Coeficiente
de Pearson
Ventajas
1. El valor del coeficiente de
correlación es independiente de
cualquier unidad usada para
medir variables.
2. Mientras mas grande sea la
muestra mas exacta será la
estimación.
Desventajas
1. Requiere supuestos acerca
de la naturaleza o formas de
las poblaciones afectadas.
2. Requiere que las dos
variables hayan ido medidas
hasta un nivel cuantitativo
continuo y que la
distribución de ambas sea
semejante a la de la curva
normal.
5. Usos del Coeficiente de Correlación
de Pearson
Permite predecir el valor de una variable dado un valor determinado de la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las variables.
Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2
variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la
información.
6. Usos de Enfoques de Pearson a
Problemas Estadísticos
En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de
cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto
de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-
beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto
como sustituto de los valores p en los informes de investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a
Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.
7. El Coeficiente de Correlación de Sperman, ρ (rho) es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y
reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión
8. Coeficiente de Correlación de
Spearman
Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene
que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar
tal circunstancia. Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la
distribución t de Student.
9. Coeficiente de Correlación de
Spearman
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1
y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no
independencia.
La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de
rangos apareados.
La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las
puntuaciones en rangos
10. Usos del Coeficiente de Correlación
de Spearman
A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y,
medidas al menos en escala ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i
cuando estas puntuaciones han sido ordenadas para X y para Y.
11. Ventajas y Desventajas del Coeficiente
de Spearman
Ventajas:
1. No esta afectada por los
cambios en las unidades
de medida.
2. Al ser una técnica no
parámetro, es libre de
distribución
probabilística.
Desventajas:
1. Es recomendable usarlo cuando
los datos presentan valores
extremos, ya que dichos valores
afectan mucho el coeficiente de
correlación de Pearson, o ante
distribuciones no normales.
2. r no debe ser utilizado para decir
algo sobre la relación entre causa
y efecto.
12. Usos del Coeficiente de correlación de
Spearman
Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en
escala ordinal, es decir; de forma que las puntuaciones que la representan puedan ser colocadas en dos series
ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs.
13. Usos de Enfoques de Spearman a
Problemas Estadísticos
Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios
individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular.
Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su
habilidad mejorará de intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores
extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La
significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del
fenómeno que se estudia.
14. Bibliografía
Internet
Correlación en Wikipedia (español): http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre variables
cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf Correlation en Wikipedia.
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson. Bibliografía