SlideShare una empresa de Scribd logo
CORRELACIONES
Introducción
Hasta ahora nos hemos centrado en medidas de tendencia
central, variabilidad, asimetría y curtosis de una única variable.
No obstante, en la práctica es común examinar dos o más
variables conjuntamente (v.g., relación entre inteligencia y
rendimiento, etc.)
En este tema nos centraremos en la relación entre 2 variables (a
partir de n observaciones apareadas) y calcularemos (en
particular) un índice que nos dará el grado de
relación/asociación entre ambas variables: el coeficiente de
correlación lineal (de Pearson)
5.2 Representación gráfica de una relación
inteligencia
rendimiento
rendimiento
rendimiento
inteligencia
inteligencia
Relación lineal positiva
Relación lineal negativa
Sin relación
Nota: El coeficiente de correlación de Pearson mide relación LINEAL.
Representación gráfica de una relación (2)
rendimiento
rendimiento inteligencia
inteligencia
Relación lineal Relación no lineal
Nota: El coeficiente de correlación de Pearson mide relación LINEAL.
Representación gráfica de una relación (3)
inteligencia
rendimiento
rendimiento
rendimiento
inteligencia
inteligencia
Relación lineal perfecta
(casi perfecta)
Relación lineal débil
Relación lineal
fuerte/moderada
Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están
relacionadas, y si la relación es positiva o negativa
5.3 Covarianza e índice de correlación de Pearson
rendimiento
inteligencia
Observad que cuando la relación lineal es positiva,
cuando las puntuaciones diferenciales de X son
positivas, las puntuaciones diferenciales de Y suelen
ser positivas.
inteligencia
rendimiento
Observad que cuando la relación lineal es negativa,
cuando las puntuaciones diferenciales de X son
positivas, las puntuaciones diferenciales de Y suelen
ser negativas.
Caso 1
Caso 2
Covarianza
La covarianza aprovecha esta característica señalada en la transparencia
anterior (al emplear el producto de las puntuaciones diferencias de X e Y).
He aquí la fórmula:
( )( )
1
n
i i
i
xy
X X Y Y
s
n
=
− −
=

En el caso 1, la covarianza será un valor positivo, y en el caso 2, la covarianza
será un valor negativo. Por tanto la covarianza nos da una idea de si la
relación entre X e Y es positiva o negativa.
Problema: la covarianza no en un índice acotado (v.g., cómo interpretar una
covarianza de 6 en términos del grado de asociación), y no tiene en cuenta la
variabilidad de las variables. Por eso se emplea el siguiente índice....
Coeficiente de correlación (lineal) de Pearson
El coeficiente de correlación de Pearson parte de la covarianza:
( )( )
1
n
i i
i
xy
x y
X X Y Y
r
n s s
=
− −
=
 
 xy
xy
x y
s
r
s s
=

Ahora veremos varias propiedades del índice...
Coeficiente de correlación (lineal) de Pearson
Propiedad 1. El índice de correlación de Pearson no puede valer menos
de -1 ni más de +1.
Un índice de correlación de Pearson de -1 indica una relación lineal
negativa perfecta
Un índice de correlación de Pearson de +1 indica una relación lineal
positiva perfecta.
Un índice de correlación de Pearson de 0 indica ausencia de relación
lineal. (Observad que un valor cercano a 0 del índice no implica que no
haya algún tipo de relación no lineal: el índice de Pearson mide relación
lineal.)
Coeficiente de correlación (lineal) de Pearson
Propiedad 2. El índice de correlación de Pearson (en valor absoluto) no varía
cuando se transforman linealmente las variables.
Por ejemplo, la correlación de Pearson entre la temperatura (en grados
celsius) y el nivel de depresión es la misma que la correlación entre la
temperatura (medida en grados Fahrenheit) y el nivel de depresión.
Evidentemente, el índice de correlación de Pearson es el mismo entre las
puntaciones directas de X e Y, o entre las puntuaciones diferenciales de X e Y,
o entre las puntuaciones típicas de X e Y. (Recordad que las puntuaciones
diferenciales y las puntuaciones típicas son transformaciones lineales de las
puntuaciones directas.)
Coeficiente de correlación (lineal) de Pearson
Interpretación
Hemos de tener en cuenta qué es lo que estamos midiendo para poder
interpretar cuán grande es la relación entre las variables bajo estudio. En
muchos casos, depende del área bajo estudio.
rendimiento
inteligencia
En todo caso, es muy importante efectuar el
diagrama de dispersión. Por ejemplo, en el
caso de la izquierda, es claro que no hay
relación entre inteligencia y rendimiento. Sin
embargo, si calculamos el índice de
correlación de Pearson nos dará un valor muy
elevado, causado por la puntuación atípica en
la esquina superior derecha.
Coeficiente de correlación (lineal) de Pearson
Interpretación (2)
Es importante indicar que “CORRELACIÓN NO IMPLICA CAUSACIÓN”. El que dos
variables estén altamente correlaciones no implica que X causa Y ni que Y causa X.
(Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación
entre cáncer de pulmón y el hecho de fumar.)
Coeficiente de correlación (lineal) de Pearson
Interpretación (3)
Es importante indicar que el coeficiente de correlación de Pearson puede verse
afectado por la influencia de terceras variables.
Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba
de habilidad verbal, saldrá que los más altos también tienen más habilidad
verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños
más altos serán mayores en edad que los más bajos.
Habilidad
numérica
Estatura
6 años
8 a
10 a
12 a
14 a
Si se parcializa esta “tercera” variable
(mediante “correlación parcial”, que ya
veremos más adelante), difícilmente habrá
una relación de importancia entre estatura
y habilidad numérica.
Hay muchos casos en que es la tercera
variable la causante de una alta relación
entre X e Y (y ello muchas veces es difícil de
identificar)
Coeficiente de correlación (lineal) de Pearson
Interpretación (3)
Por otra parte, el valor del coeficiente de Pearson depende en parte de la
variabilidad del grupo.
Rendimiento
inteligencia
CI bajo CI alto
Si efectuamos el coeficiente de Pearson entre
inteligencia y rendimiento con todos los sujetos,
el valor del coeficiente de Pearson será bastante
elevado.
Sin embargo, si empleamos únicamente los
individuos con CI bajo (o CI alto) y calculamos la
correlación con Rendimiendo, el valor del
coeficiente de Pearson será claramente menor.
Un grupo heterogéneo daría pues un mayor
grado de relación entre variables que un grupo
homogéneo.
5.4 Otros coeficientes: variables semi-cuantitativas
Claro está, es posible obtener medidas del grado de relación de variables
cuando éstas no sean cuantitativas.
El caso en que las variables X e Y sean ordinales
Recordad, cuando tenemos variables con escala ordinal, podemos establecer el
orden entre los valores, pero no sabemos las distancias entre los valores. (Si
supiéramos la distancia entre los valores ya estaríamos al menos en una escala de
intervalo)
Podemos calcular el coeficiente de correlación de Spearman o el coeficiente de
correlación de Kendall. (Veremos el primero.)
Coeficiente de correlación de Spearman
Lo que tenemos ahora son 2 sucesiones de valores ordinales.
El coeficiente de Spearman es un caso especial del coeficiente de correlación
de Pearson aplicada a dos series de los n primeros números naturales (cuando
no hay empates; si hay –muchos- empates hay otra fórmula
( )
2
1
2
6
1
1
n
i
i
s
d
r
n n
=

= −
−

i
d es la diferencia entre el valor ordinal en X y el valor
ordinal en Y del sujeto i
Coeficiente de correlación de Spearman (propiedades)
Primera. Se encuentra acotado, como el coeficiente de Pearson entre -1 y +1.
Un coeficiente de Spearman de +1 quiere decir que el que es primero en X es
primero en Y, el que es segundo en X es segundo en I, etc
Un coeficiente de Sperman de -1 quiere decir que el que es primero en X es
último en Y, el segundo en X es el penúltimo en Y, etc.
Segunda. Su cálculo es muy sencillo (más que el del coeficiente de correlación
de Pearson). No obstante, con los ordenadores y un programa estadístico, esto
es irrelevante estos días...
5.5 Variables cualitativas Prueba c2 como medida de asociación y como prueba de
contraste
La prueba chi-cuadrado es una prueba no paramétrica que se emplea para medir la
asociación entre dos variables cuando tenemos tablas de contingencia. También es
empleada, de manera general, para evaluar la divergencia entre una puntuaciones
observadas (empíricas) y unas puntuaciones predichas (teóricas).
De manera general, el estadístico chi-cuadrado se obtiene así:
c2 =
fe− ft
( )2
ft

Donde fe representa las frecuencias empíricas y ft
representa las frecuencias teóricas
Prueba c2 como medida de asociación: El caso de independencia de 2 variables
cualitativas
Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora
bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple:
Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el
resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de
las columnas, y ese resultado se divide por N
c2 =
fe− ft
( )2
ft

Prueba c2 como medida de asociación. Coeficientes derivados e
interpretación
A partir de la prueba chi-cuadrado, se han propuesto cierto número de
medidas de asociación entre variables cuando tenemos frecuencias en
tablas de contingencia. Se trata de cuantificar la fuerza de la relación entre
dos variables.
Caso de tener tablas 2x2: Coeficiente phi
n
2
c
 =
Este índice se interpreta
de manera análoga al
coeficiente de Pearson
(pero observa que phi no
puede ser negativo...sólo
de 0 a 1)
Prueba c2 como medida de asociación: Coeficientes derivados e
interpretación
Este índice se interpreta análogamente al índice de Pearson (excepto por el tema
del signo).
m
n
V
2
ˆ c
=
Caso de tener más de 2 filas ó columnas: Prueba de Cramer
m es el número menor entre el número
de filas-1 y columnas-1
Observa que si la tabla es 2x2 este índice coincide con el índice phi

Más contenido relacionado

Similar a CORRELACION.pdf

Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y Spearman
JCMENESESV
 
Correlacion de Pearson
Correlacion de PearsonCorrelacion de Pearson
Correlacion de Pearson
Valentina
 
Coeficiente de correlación de pearson y sperman
Coeficiente de correlación de pearson y spermanCoeficiente de correlación de pearson y sperman
Coeficiente de correlación de pearson y sperman
Tayko Urbana
 
Coeficiente de correlación de pearson y spearman
Coeficiente de correlación de pearson y spearmanCoeficiente de correlación de pearson y spearman
Coeficiente de correlación de pearson y spearman
Andrea Beltrán
 
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMANCOEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
Karla GM
 

Similar a CORRELACION.pdf (20)

Correlación PEARSON
Correlación PEARSONCorrelación PEARSON
Correlación PEARSON
 
Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y Spearman
 
Correlacion de Pearson
Correlacion de PearsonCorrelacion de Pearson
Correlacion de Pearson
 
Coeficiente de correlacion
Coeficiente de correlacionCoeficiente de correlacion
Coeficiente de correlacion
 
Coeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearmanCoeficientes de correlación de pearson y de spearman
Coeficientes de correlación de pearson y de spearman
 
PPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptxPPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptx
 
Correlacion pearson y sperman
Correlacion pearson y spermanCorrelacion pearson y sperman
Correlacion pearson y sperman
 
coeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearsoncoeficientes de correlacion spearman y pearson
coeficientes de correlacion spearman y pearson
 
Milacom
MilacomMilacom
Milacom
 
Presentación4
Presentación4Presentación4
Presentación4
 
Coeficiente de correlación de pearson y sperman
Coeficiente de correlación de pearson y spermanCoeficiente de correlación de pearson y sperman
Coeficiente de correlación de pearson y sperman
 
Seminario 10
Seminario 10Seminario 10
Seminario 10
 
Coeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearmanCoeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearman
 
Hector hernandez
Hector hernandezHector hernandez
Hector hernandez
 
coeficiente de correlacion de pearson y spearman
coeficiente de correlacion de pearson y spearmancoeficiente de correlacion de pearson y spearman
coeficiente de correlacion de pearson y spearman
 
COEFICIENTE DE CORRELACION DE PEARSON Y SPEARMAN
COEFICIENTE DE CORRELACION DE PEARSON Y SPEARMANCOEFICIENTE DE CORRELACION DE PEARSON Y SPEARMAN
COEFICIENTE DE CORRELACION DE PEARSON Y SPEARMAN
 
Coeficiente de correlación de pearson y spearman
Coeficiente de correlación de pearson y spearmanCoeficiente de correlación de pearson y spearman
Coeficiente de correlación de pearson y spearman
 
Coeficiente de correlacion de pearsony spearman
Coeficiente de correlacion de pearsony spearman Coeficiente de correlacion de pearsony spearman
Coeficiente de correlacion de pearsony spearman
 
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMANCOEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
 
Pearson y sperman
Pearson y spermanPearson y sperman
Pearson y sperman
 

Último

PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernándezPRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
Ruben53283
 

Último (20)

5.Deicticos Uno_Enfermería_EspanolAcademico
5.Deicticos Uno_Enfermería_EspanolAcademico5.Deicticos Uno_Enfermería_EspanolAcademico
5.Deicticos Uno_Enfermería_EspanolAcademico
 
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATRBIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
 
Creación WEB. Ideas clave para crear un sitio web
Creación WEB. Ideas clave para crear un sitio webCreación WEB. Ideas clave para crear un sitio web
Creación WEB. Ideas clave para crear un sitio web
 
Proceso de gestión de obras - Aquí tu Remodelación
Proceso de gestión de obras - Aquí tu RemodelaciónProceso de gestión de obras - Aquí tu Remodelación
Proceso de gestión de obras - Aquí tu Remodelación
 
Proyecto integrador Vereda Cujacal Centro.pptx
Proyecto integrador Vereda Cujacal Centro.pptxProyecto integrador Vereda Cujacal Centro.pptx
Proyecto integrador Vereda Cujacal Centro.pptx
 
ESTEREOTIPOS DE GÉNERO A LAS PERSONAS? (Grupo)
ESTEREOTIPOS DE GÉNERO A LAS PERSONAS? (Grupo)ESTEREOTIPOS DE GÉNERO A LAS PERSONAS? (Grupo)
ESTEREOTIPOS DE GÉNERO A LAS PERSONAS? (Grupo)
 
Poemas de Beatriz Giménez de Ory_trabajos de 6º
Poemas de Beatriz Giménez de Ory_trabajos de 6ºPoemas de Beatriz Giménez de Ory_trabajos de 6º
Poemas de Beatriz Giménez de Ory_trabajos de 6º
 
Cerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencialCerebelo Anatomía y fisiología Clase presencial
Cerebelo Anatomía y fisiología Clase presencial
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
 
Sesión de clase: Luz desde el santuario.pdf
Sesión de clase: Luz desde el santuario.pdfSesión de clase: Luz desde el santuario.pdf
Sesión de clase: Luz desde el santuario.pdf
 
ACERTIJO LA RUTA DE LAS ADIVINANZAS OLÍMPICAS. Por JAVIER SOLIS NOYOLA
ACERTIJO LA RUTA DE LAS ADIVINANZAS OLÍMPICAS. Por JAVIER SOLIS NOYOLAACERTIJO LA RUTA DE LAS ADIVINANZAS OLÍMPICAS. Por JAVIER SOLIS NOYOLA
ACERTIJO LA RUTA DE LAS ADIVINANZAS OLÍMPICAS. Por JAVIER SOLIS NOYOLA
 
ACERTIJO DE CARRERA OLÍMPICA DE SUMA DE LABERINTOS. Por JAVIER SOLIS NOYOLA
ACERTIJO DE CARRERA OLÍMPICA DE SUMA DE LABERINTOS. Por JAVIER SOLIS NOYOLAACERTIJO DE CARRERA OLÍMPICA DE SUMA DE LABERINTOS. Por JAVIER SOLIS NOYOLA
ACERTIJO DE CARRERA OLÍMPICA DE SUMA DE LABERINTOS. Por JAVIER SOLIS NOYOLA
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
 
Presentación Revistas y Periódicos Digitales
Presentación Revistas y Periódicos DigitalesPresentación Revistas y Periódicos Digitales
Presentación Revistas y Periódicos Digitales
 
ENUNCIADOS CUESTIONARIO S9 GEOLOGIA Y MINERALOGIA - GENERAL.docx
ENUNCIADOS CUESTIONARIO S9 GEOLOGIA Y MINERALOGIA - GENERAL.docxENUNCIADOS CUESTIONARIO S9 GEOLOGIA Y MINERALOGIA - GENERAL.docx
ENUNCIADOS CUESTIONARIO S9 GEOLOGIA Y MINERALOGIA - GENERAL.docx
 
PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernándezPRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
PRÁCTICAS PEDAGOGÍA.pdf_Educación Y Sociedad_AnaFernández
 
PROYECTO INTEGRADOR ARCHIDUQUE. presentacion
PROYECTO INTEGRADOR ARCHIDUQUE. presentacionPROYECTO INTEGRADOR ARCHIDUQUE. presentacion
PROYECTO INTEGRADOR ARCHIDUQUE. presentacion
 
Evaluación de los Factores Internos de la Organización
Evaluación de los Factores Internos de la OrganizaciónEvaluación de los Factores Internos de la Organización
Evaluación de los Factores Internos de la Organización
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
 
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSALLA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
 

CORRELACION.pdf

  • 2. Introducción Hasta ahora nos hemos centrado en medidas de tendencia central, variabilidad, asimetría y curtosis de una única variable. No obstante, en la práctica es común examinar dos o más variables conjuntamente (v.g., relación entre inteligencia y rendimiento, etc.) En este tema nos centraremos en la relación entre 2 variables (a partir de n observaciones apareadas) y calcularemos (en particular) un índice que nos dará el grado de relación/asociación entre ambas variables: el coeficiente de correlación lineal (de Pearson)
  • 3. 5.2 Representación gráfica de una relación inteligencia rendimiento rendimiento rendimiento inteligencia inteligencia Relación lineal positiva Relación lineal negativa Sin relación Nota: El coeficiente de correlación de Pearson mide relación LINEAL.
  • 4. Representación gráfica de una relación (2) rendimiento rendimiento inteligencia inteligencia Relación lineal Relación no lineal Nota: El coeficiente de correlación de Pearson mide relación LINEAL.
  • 5. Representación gráfica de una relación (3) inteligencia rendimiento rendimiento rendimiento inteligencia inteligencia Relación lineal perfecta (casi perfecta) Relación lineal débil Relación lineal fuerte/moderada Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están relacionadas, y si la relación es positiva o negativa
  • 6. 5.3 Covarianza e índice de correlación de Pearson rendimiento inteligencia Observad que cuando la relación lineal es positiva, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser positivas. inteligencia rendimiento Observad que cuando la relación lineal es negativa, cuando las puntuaciones diferenciales de X son positivas, las puntuaciones diferenciales de Y suelen ser negativas. Caso 1 Caso 2
  • 7. Covarianza La covarianza aprovecha esta característica señalada en la transparencia anterior (al emplear el producto de las puntuaciones diferencias de X e Y). He aquí la fórmula: ( )( ) 1 n i i i xy X X Y Y s n = − − =  En el caso 1, la covarianza será un valor positivo, y en el caso 2, la covarianza será un valor negativo. Por tanto la covarianza nos da una idea de si la relación entre X e Y es positiva o negativa. Problema: la covarianza no en un índice acotado (v.g., cómo interpretar una covarianza de 6 en términos del grado de asociación), y no tiene en cuenta la variabilidad de las variables. Por eso se emplea el siguiente índice....
  • 8. Coeficiente de correlación (lineal) de Pearson El coeficiente de correlación de Pearson parte de la covarianza: ( )( ) 1 n i i i xy x y X X Y Y r n s s = − − =    xy xy x y s r s s =  Ahora veremos varias propiedades del índice...
  • 9. Coeficiente de correlación (lineal) de Pearson Propiedad 1. El índice de correlación de Pearson no puede valer menos de -1 ni más de +1. Un índice de correlación de Pearson de -1 indica una relación lineal negativa perfecta Un índice de correlación de Pearson de +1 indica una relación lineal positiva perfecta. Un índice de correlación de Pearson de 0 indica ausencia de relación lineal. (Observad que un valor cercano a 0 del índice no implica que no haya algún tipo de relación no lineal: el índice de Pearson mide relación lineal.)
  • 10. Coeficiente de correlación (lineal) de Pearson Propiedad 2. El índice de correlación de Pearson (en valor absoluto) no varía cuando se transforman linealmente las variables. Por ejemplo, la correlación de Pearson entre la temperatura (en grados celsius) y el nivel de depresión es la misma que la correlación entre la temperatura (medida en grados Fahrenheit) y el nivel de depresión. Evidentemente, el índice de correlación de Pearson es el mismo entre las puntaciones directas de X e Y, o entre las puntuaciones diferenciales de X e Y, o entre las puntuaciones típicas de X e Y. (Recordad que las puntuaciones diferenciales y las puntuaciones típicas son transformaciones lineales de las puntuaciones directas.)
  • 11. Coeficiente de correlación (lineal) de Pearson Interpretación Hemos de tener en cuenta qué es lo que estamos midiendo para poder interpretar cuán grande es la relación entre las variables bajo estudio. En muchos casos, depende del área bajo estudio. rendimiento inteligencia En todo caso, es muy importante efectuar el diagrama de dispersión. Por ejemplo, en el caso de la izquierda, es claro que no hay relación entre inteligencia y rendimiento. Sin embargo, si calculamos el índice de correlación de Pearson nos dará un valor muy elevado, causado por la puntuación atípica en la esquina superior derecha.
  • 12. Coeficiente de correlación (lineal) de Pearson Interpretación (2) Es importante indicar que “CORRELACIÓN NO IMPLICA CAUSACIÓN”. El que dos variables estén altamente correlaciones no implica que X causa Y ni que Y causa X. (Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación entre cáncer de pulmón y el hecho de fumar.)
  • 13. Coeficiente de correlación (lineal) de Pearson Interpretación (3) Es importante indicar que el coeficiente de correlación de Pearson puede verse afectado por la influencia de terceras variables. Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba de habilidad verbal, saldrá que los más altos también tienen más habilidad verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños más altos serán mayores en edad que los más bajos. Habilidad numérica Estatura 6 años 8 a 10 a 12 a 14 a Si se parcializa esta “tercera” variable (mediante “correlación parcial”, que ya veremos más adelante), difícilmente habrá una relación de importancia entre estatura y habilidad numérica. Hay muchos casos en que es la tercera variable la causante de una alta relación entre X e Y (y ello muchas veces es difícil de identificar)
  • 14. Coeficiente de correlación (lineal) de Pearson Interpretación (3) Por otra parte, el valor del coeficiente de Pearson depende en parte de la variabilidad del grupo. Rendimiento inteligencia CI bajo CI alto Si efectuamos el coeficiente de Pearson entre inteligencia y rendimiento con todos los sujetos, el valor del coeficiente de Pearson será bastante elevado. Sin embargo, si empleamos únicamente los individuos con CI bajo (o CI alto) y calculamos la correlación con Rendimiendo, el valor del coeficiente de Pearson será claramente menor. Un grupo heterogéneo daría pues un mayor grado de relación entre variables que un grupo homogéneo.
  • 15. 5.4 Otros coeficientes: variables semi-cuantitativas Claro está, es posible obtener medidas del grado de relación de variables cuando éstas no sean cuantitativas. El caso en que las variables X e Y sean ordinales Recordad, cuando tenemos variables con escala ordinal, podemos establecer el orden entre los valores, pero no sabemos las distancias entre los valores. (Si supiéramos la distancia entre los valores ya estaríamos al menos en una escala de intervalo) Podemos calcular el coeficiente de correlación de Spearman o el coeficiente de correlación de Kendall. (Veremos el primero.)
  • 16. Coeficiente de correlación de Spearman Lo que tenemos ahora son 2 sucesiones de valores ordinales. El coeficiente de Spearman es un caso especial del coeficiente de correlación de Pearson aplicada a dos series de los n primeros números naturales (cuando no hay empates; si hay –muchos- empates hay otra fórmula ( ) 2 1 2 6 1 1 n i i s d r n n =  = − −  i d es la diferencia entre el valor ordinal en X y el valor ordinal en Y del sujeto i
  • 17. Coeficiente de correlación de Spearman (propiedades) Primera. Se encuentra acotado, como el coeficiente de Pearson entre -1 y +1. Un coeficiente de Spearman de +1 quiere decir que el que es primero en X es primero en Y, el que es segundo en X es segundo en I, etc Un coeficiente de Sperman de -1 quiere decir que el que es primero en X es último en Y, el segundo en X es el penúltimo en Y, etc. Segunda. Su cálculo es muy sencillo (más que el del coeficiente de correlación de Pearson). No obstante, con los ordenadores y un programa estadístico, esto es irrelevante estos días...
  • 18. 5.5 Variables cualitativas Prueba c2 como medida de asociación y como prueba de contraste La prueba chi-cuadrado es una prueba no paramétrica que se emplea para medir la asociación entre dos variables cuando tenemos tablas de contingencia. También es empleada, de manera general, para evaluar la divergencia entre una puntuaciones observadas (empíricas) y unas puntuaciones predichas (teóricas). De manera general, el estadístico chi-cuadrado se obtiene así: c2 = fe− ft ( )2 ft  Donde fe representa las frecuencias empíricas y ft representa las frecuencias teóricas
  • 19. Prueba c2 como medida de asociación: El caso de independencia de 2 variables cualitativas Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple: Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de las columnas, y ese resultado se divide por N c2 = fe− ft ( )2 ft 
  • 20. Prueba c2 como medida de asociación. Coeficientes derivados e interpretación A partir de la prueba chi-cuadrado, se han propuesto cierto número de medidas de asociación entre variables cuando tenemos frecuencias en tablas de contingencia. Se trata de cuantificar la fuerza de la relación entre dos variables. Caso de tener tablas 2x2: Coeficiente phi n 2 c  = Este índice se interpreta de manera análoga al coeficiente de Pearson (pero observa que phi no puede ser negativo...sólo de 0 a 1)
  • 21. Prueba c2 como medida de asociación: Coeficientes derivados e interpretación Este índice se interpreta análogamente al índice de Pearson (excepto por el tema del signo). m n V 2 ˆ c = Caso de tener más de 2 filas ó columnas: Prueba de Cramer m es el número menor entre el número de filas-1 y columnas-1 Observa que si la tabla es 2x2 este índice coincide con el índice phi