metodos de fitomejoramiento en la aolicacion de plantas
Coeficiente de correlacion de pearson - Liliana Egañe
1. Republica Bolivariana de Venezuela
Ministerio del poder popular para la educación superior
I.U.P. Santiago Mariño.
Sede-Barcelona.
Coeficientes de correlación de PearsonCoeficientes de correlación de Pearson
y de Spearman.y de Spearman.
Profesor:
Ramón Aray. Bachiller:
Liliana Egañe,
C.I:26.704.947
2. Coeficientes de correlación de Pearson.
El coeficiente de correlación de Pearson es una medida de la relación lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas.
El coeficiente de correlación es una medida de asociación entre dos variables y.
se simboliza con la literal r.
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual
corresponde a ausencia de correlación. Los primeros dan a entender que existe
una correlación directamente proporcional e inversamente proporcional,
respectivamente
3. De lo anterior referimos que:
Ø +1 ó -1 = Correlación perfecta.
Ø 0.95 = Correlación fuerte.
Ø 80% = Correlación significativa.
Ø 70% = Correlación moderada.
Ø 50% = Existe una relación parcial.
Permite predecir el valor de una variable dado un valor determinado de la otra
variable. Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación. Dicho cálculo es el primer paso
para determinar la relación entre las variables.
Nota : Si dos variables son independiente estarán incorrelacionadas aunque el
resultado recíproco no es necesariamente cierto.
Si r = 0 se dice que las variables
están incorrelacionadas: no puede
establecerse ningún sentido de
covariación.
4. Ø El valor del coeficiente de correlación es independiente de cualquier unidad
usada para medir variables
Ø Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos es que las dos
variables que se comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado.
Ø
Ø Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación linear entre las dos variables.
Ø
Ø Reporta un valor de correlación cercano al 1 como indicador de que existe
una relación linear positiva entre las dos variables.
Ø
Ø Un valor mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
Ø
Ø Reporta un valor de correlación cercano a -1 como indicador de que hay una
relación linear negativa entre las dos variables.
Ø Mientras mas grande sea la muestra mas exacta será la estimación.
Ventajas:
5. Ø Requiere supuestos acerca de la naturaleza o formas de las poblaciones
afectadas
Ø Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo
continuo y que la distribución de ambas sea semejante a la de la curva
normal
Ø El coeficiente de correlación debe ser seleccionado en base a las escalas de
medidas usadas en cada una de las variables.
Ø
Ø La determinación del tamaño de muestra en las de tablas de contingencias
varia según sea el objetivo:
a) Determinar probabilidades de incidencias.
b) Decimar independencias entres dos variables.
c) Analizar la asociación entre las variables.
Ø El tamaño de muestra para construir intervalo de confianza para el coeficiente
de correlación poblacional de Pearson es función de la longitud del
intervalo, de la probabilidad de confianza y del coeficiente de correlación
muestral. Por esta razón se sugiere un procedimiento secuencial para este
propósito.
Desventajas:
6. Es una medida de la correlación entre dos variables aleatorias continuas. Este
coeficiente es una medida de asociación lineal que utiliza los rangos, números de
orden, de cada grupo de sujetos y compara dichos rangos
La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas
o positivas respectivamente, 0 cero, significa no correlación pero no
independencia
Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel
de una escala ordinal. Si alguna de las variables está medida a nivel de escala de
intervalo/razón deberá procederse antes de operar el estadístico a su conversión
en forma ordinal.
El coeficiente de correlación de Spearman es
menos sensible que el de Pearson para los
valores muy lejos de lo esperado. En este
ejemplo: Pearson = 0.30706 Spearman = 0.76270
Coeficiente de correlación de Spearman.
7. Ventajas:
Ø El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de
éste, por aplicación del coeficiente de Pearson a valores ordinales
considerados como puntuaciones.
Ø
Ø El coeficiente de correlación de Spearman es exactamente el mismo que el
coeficiente de correlación de Pearson, calculado sobre el rango de
observaciones.
Ø La correlación estimada entre X e Y se halla calculando el coeficiente de
correlación de Pearson para el conjunto de rangos apareados. La correlación
de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos
transformado las puntuaciones en rangos.
Ø El coeficiente de correlación de Spearman se encuentra
siempre comprendido entre los valores -1 y 1. Es decir, -1
< rs < 1. Cuando todos los sujetos se sitúan en el mismo
puesto para la variable X y para la variable Y, el valor de rs
es 1. Si ocupan valores opuestos, es decir, al primer sujeto
en X le corresponde el último lugar en Y, al segundo en X le
corresponde el penúltimo en Y, etc., entonces el valor de
rs es -1.
8. Desventajas:
Ø Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir, de forma
que las puntuaciones que las representan puedan ser colocadas en dos
series ordenadas.
Ø Al ser Spearman una técnica no paramétrica es libre de distribución
probabilística (2, 5, 9). –
Ø
Ø Los supuestos son menos estrictos.
Ø
Ø Es robusto a la presencia de outliers (es decir permite ciertos desvíos del
patrón normal).
Ø
Ø La manifestación de una relación causa-efecto es posible sólo a través de
la comprensión de la relación natural que existe entre las variable y no
debe manifestarse sólo por la existencia de una fuerte correlación (1, 5)
Ø
Ø Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir, de forma
que las puntuaciones que las representan puedan ser colocadas en dos
series ordenadas.
9. Aplicar usos de enfoques Pearson y enfoque Spearman
a problemas estadísticos.
Usos de enfoques Pearson:
Métodos Estadísticos para Investigadores”. Desde entonces, el contraste de
Hipótesis es considerado uno de los métodos de inferencia estadística de utilización
obligada en casi todas las disciplinas.
Si bien hoy en día los estudiantes de Estadística aprenden a testear hipótesis
aplicando una secuencia de pasos más o menos estandarizada, es importante recordar
que no estamos ante una teoría unificada, sino ante la amalgama de los estudios
sistemáticos realizados separadamente por Fisher por un lado y Neyman y Pearson por
el otro. Fisher desarrolló su teoría que denominó Pruebas de Significación y Neyman y
Pearson las llamadas Pruebas de Hipótesis. Desde 1930, fecha en que aparecieron los
trabajos de NP., la teoría de los tests de hipótesis fue dominada por el paradigma de la
decisión. Esto ha llevado al estado actual de cosas en el cual predomina la teoría de
Neyman-Pearson como modelo ó esquema de razonamiento para la toma decisiones,
pero la práctica estadística en la investigación, aplicando los mismos procedimientos,
interpreta los datos como evidencia para validar teorías.
10. Aplicación de la prueba estadística
Las observaciones de cada variable se deben ordenar en rangos, así como obtener
las diferencias entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.
Educación de algunas madres y calificación de desarrollo mental de los hijos.
Calculo de los grados de libertad (gl). gl = numero de parejas - 1 = 8 - 1 = 7
El valor rs calculado se compara con los valores críticos de rs del coeficiente de
correlación por rangos de Spearman. El valor crítico de rs con 7 grados de libertad,
para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea, mayor que
el calculado.
Por lo tanto, éste tiene una probabilidad mayor que 0.05. Decisión Como el valor
de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha.
Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los
valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener
esa magnitud, al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto
significa que para aceptar Ha, se requiere tener un valor igual o más lato que
0.714. Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en
la siguiente figura, existe una asociación relativa entre la educación formal de la
madre y el desarrollo mental de sus hijos; sin embargo, ésta no es significativa.
11. Usos de enfoque Sperman:
Los datos brutos usados en este
ejemplo se ven debajo.
El primer paso es ordenar los datos de la primera columna. Se agregan
dos columnas 'orden(i)' y 'orden(t)‘
Para el orden i, se corresponderán con el numero de fila del cuadro,
para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a
mayor
para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de
TV a la semana', para no hacer otro cuadro, la secuencia ordenada
quedaría
T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }
para este caso, el orden sería para cada elemento, respectivamente:
orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }
sin embargo, el valor de orden esta dado por el valor promedio de sus
posiciones, así para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
12. Después, se crean dos columnas más, una columna "d" que muestra las
diferencias entre las dos columnas de orden y, otra columna "d2". Esta
última es sólo la columna "d" al cuadrado.
Después de realizar todo esto con los datos del ejemplo, se debería acabar
con algo como lo siguiente:
13.
Nótese como el número de orden de los valores que son idénticos es la media de
los números de orden que les corresponderían si no lo fueran.
Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. Así que esos valores pueden ser sustituidos en la fórmula.
De lo que resulta:
• El enfoque psicométrico utiliza técnicas de análisis factorial con la idea de
descubrir las diferencias individuales de la inteligencia entre las personas. Para
ello se recurre al uso de los tests de inteligencia.
• Spearman distingue dos factores: el factor “G” y el factor “S”. El “G” es la
inteligencia general (común a la mayoría de las personas). El “S” son las
habilidades específicas de la inteligencia (verbal, numérica, espacial, etc.)
14. Conclusión.
El coeficiente de correlación de Spearman es exactamente el mismo que
el coeficiente de correlación de Pearson, calculado sobre el rango de
observaciones.
La correlación estimada entre X e Y se halla calculando el coeficiente de
correlación de Pearson para el conjunto de rangos apareados.
La correlación de Spearman puede ser calculada con la fórmula de
Pearson, si antes hemos transformado las puntuaciones en rangos.