REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA
EDUCACIÓN
I.U.P. “SANTIAGO MARIÑO”
SEDE – BARCELONA
COEFICIENTES DE
CORRELACIÓN DE PEARSON Y
SPEARMAN
BACHILLER:
BRANCO FATIMA C.I.:
24.829.148
PROFESOR: RAMON ARAY
SECCION: YV
INTRODUCCIÒN
El concepto de relación o correlación entre dos variables se refiere al grado
de parecido o variación conjunta existente entre las mismas. En este apartado
vamos a estudiar un tipo particular de relación llamada lineal y se limita a considerar
únicamente el caso de dos variables cuantitativas (correlación simple). Una relación
lineal positiva entre dos variables X e Y significa que los valores de las dos variables
varían de forma parecida: los sujetos que puntúan alto en X tienden a puntuar alto
en Y y los que puntúan bajo en X tienden a puntuar bajo en Y. Este tipo de
diagramas puede obtenerse mediante: Gráficos, en las diferentes opciones que
tiene: Generador de Gráficos, Cuadros de diálogo antiguos o en Gráficos
interactivos.
COEFICIENTE DE CORRELACIÓN
Un coeficiente de correlación, mide el grado de relación o asociación existente
generalmente entre dos variables aleatorias. No es conveniente identificar correlación con
dependencia causal, ya que, si hay una semejanza formal entre ambos conceptos, no puede
deducirse de esto que sean análogos (9, 15); en efecto es posible que haya una alta correlación
entre dos acontecimientos y que sin embargo, no exista entre ellos relación de causa o efecto; por
ejemplo cuando dos acontecimientos tienen alguna causa común, pueden resultar altamente
asociados y no son el uno causa del otro. Cabe recordar que el coeficiente fluctúa entre -1 ≤ ρ ≤
1.
COEFICIENTE DE CORRELACIÓN DE
PEARSON
• Tiene como objetivo medir la fuerza o grado de asociación entre dos
variables aleatorias cuantitativas que poseen una distribución normal
bivariada conjunta. El coeficiente se define por la siguiente fórmula:
COEFICIENTE DE CORRELACIÓN DE
PEARSON
• Cuando ρ=+ la relación es directa entre las variables. Si ρ=- la
relación es inversa y si ρ= 0 son independientes. Dicho coeficiente se
puede expresar en términos de su estadístico como:
USOS DEL COEFICIENTE DE RELACION DE
PEARSON
• Permite predecir el valor de una variable dado un valor determinado de la otra
variable
• Se trata de valorar la asociación entre dos variables cuantitativas estudiando
el método conocido como correlación.
• Dicho cálculo es el primer paso para determinar la relación entre las
variables.
• Consiste en la posibilidad de calcular su distribución muestral y así poder
determinar su error típico de estimación.
• Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación lineal entre 2 variables.
• Reporta un valor de correlación cercano a 1 como un indicador de que existe
una relación lineal positiva entre las 2 variables. Un valor mayor a cero que
se acerque a 1 da como resultado una mayor correlación positiva entre la
información. Usos del Coeficiente de Correlación de Pearson
USOS DE ENFOQUES DE PEARSON A
PROBLEMAS ESTADISTICOS
• En la perspectiva de Pearson, para establecer el nivel de significación estadística habría
que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de
ahí se decidiría cuál de ellos es preferible minimizar.
• Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de
error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a
su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación
con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han
propuesto como sustituto de los valores p en los informes de investigación científica.
• Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la
prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson,
simbolizado por r. Usos de Enfoques de Pearson a Problemas Estadísticos.
COEFICIENTE DE CORRELACIÓN DE
SPEARMAN
El coeficiente de correlación de
Spearman es un coeficiente no paramétrico
alternativo al coeficiente de correlación de
Pearson. Charles Spearman contribuyó al
análisis del factor, a la teoría de la
inteligencia, elaboró una prueba de la teoría
mental . Se define el coeficiente de
correlación de rangos de Spearman como el
coeficiente de correlación lineal entre los
rangos Ri(x) y Ri(y), en la fórmula de Pearson
se reemplaza Xi por Ri(x) y Yi por Ri (y)
quedando
COEFICIENTE DE CORRELACIÓN DE
SPEARMAN
• La interpretación de coeficiente de Spearman es
igual que la del coeficiente de correlación de
Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas respectivamente,
0 cero, significa no correlación pero no
independencia. La correlación estimada entre X e Y
se halla calculando el coeficiente de correlación de
Pearson para el conjunto de rangos apareados. La
correlación de Spearman puede ser calculada con la
fórmula de Pearson, si antes hemos transformado
las puntuaciones en rangos. Coeficiente de
Correlación de Spearman.
• A partir de un conjunto de n puntuaciones, la formula que permite el calculo
de la correlación entre dos variables X e Y, medidas al menos en escala
ordinal, es la siguiente:
• P=0 No hay correlación
• p≠ 0 Hay correlación
• Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas puntuaciones
han sido ordenadas para X y para Y. Usos del Coeficiente de correlación
de Spearman.
USOS DEL COEFICIENTE DE
CORRELACIÓN DE SPEARMAN
VENTAJAS Y DESVENTAJAS DEL
COEFICIENTE DE SPEARMAN
• VENTAJAS
• No esta afectada por los cambios en las unidades de medida.
• Al ser una técnica no parámetro, es libre de distribución probabilística.
• DESVENTAJAS:
• Es recomendable usarlo cuando los datos presentan valores extremos, ya
que dichos valores afectan mucho el coeficiente de correlación de Pearson, o
ante distribuciones no normales.
• R no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
USOS DE COEFICIENTE DE CORRELACION
SPEARMAN
• Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir; de forma
que las puntuaciones que la representan puedan ser colocadas en dos
series ordenadas.
• A veces, este coeficiente es denominado por la letra griega ρs (rho),
aunque cuando nos situamos en el contexto de la Estadística Descriptiva
se emplea la notación rs. Usos del Coeficiente de correlación de
Spearman
USOS DE ENFOQUES PEARSON Y ENFOQUE
SPEARMAN A PROBLEMAS ESTADÍSTICOS.
• Una generalización del coeficiente de Spearman es útil en la situación en la cual
hay tres o más condiciones, varios individuos son observados en cada una de
ellas, y predecimos que las observaciones tendrán un orden en particular. Por
ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar
cierta tarea, y predecimos que su habilidad mejorará de intento en intento. El
coeficiente de correlación de rangos de Spearman debe utilizarse para series de
datos en los que existan valores extremos, pues si calculamos la correlación de
Pearson, los resultados se verán afectados. La interpretación del resultado del
coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1.
La significación estadística de un coeficiente debe tenerse en cuenta
conjuntamente con la relevancia clínica del fenómeno que se estudia. Usos de
Enfoques de Spearman a Problemas Estadísticos
CONCLUSIÒN
La serie de tiempo en estadística es un procesamiento de señales, y econometría, una
serie temporal es una secuencia de puntos de datos, medidos típicamente a intervalos de tiempo
sucesivos, y espaciados (con frecuencia) de forma uniforme.
El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de
datos, extrayendo información representativa, tanto referente a los orígenes o relaciones
subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro.
De hecho uno de los usos más habituales de las series de datos temporales es su análisis
para predicción y pronóstico. Por ejemplo de los datos climáticos, o de las acciones de bolsa, o las
series pluviométricas.
BIBLIOGRAFÌA
• http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre variables
cuantitativas.
• http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas
2.pdf Correlation en Wikipedia (inglés).
• http://personal.us.es/vararey/adatos2/correlacion.pdf.
• https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pea
rson.
• http://rccp.udea.edu.co/index.php/ojs/article/viewFile/274/271

Correlacion

  • 1.
    REPÚBLICA BOLIVARIANA DEVENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN I.U.P. “SANTIAGO MARIÑO” SEDE – BARCELONA COEFICIENTES DE CORRELACIÓN DE PEARSON Y SPEARMAN BACHILLER: BRANCO FATIMA C.I.: 24.829.148 PROFESOR: RAMON ARAY SECCION: YV
  • 2.
    INTRODUCCIÒN El concepto derelación o correlación entre dos variables se refiere al grado de parecido o variación conjunta existente entre las mismas. En este apartado vamos a estudiar un tipo particular de relación llamada lineal y se limita a considerar únicamente el caso de dos variables cuantitativas (correlación simple). Una relación lineal positiva entre dos variables X e Y significa que los valores de las dos variables varían de forma parecida: los sujetos que puntúan alto en X tienden a puntuar alto en Y y los que puntúan bajo en X tienden a puntuar bajo en Y. Este tipo de diagramas puede obtenerse mediante: Gráficos, en las diferentes opciones que tiene: Generador de Gráficos, Cuadros de diálogo antiguos o en Gráficos interactivos.
  • 3.
    COEFICIENTE DE CORRELACIÓN Uncoeficiente de correlación, mide el grado de relación o asociación existente generalmente entre dos variables aleatorias. No es conveniente identificar correlación con dependencia causal, ya que, si hay una semejanza formal entre ambos conceptos, no puede deducirse de esto que sean análogos (9, 15); en efecto es posible que haya una alta correlación entre dos acontecimientos y que sin embargo, no exista entre ellos relación de causa o efecto; por ejemplo cuando dos acontecimientos tienen alguna causa común, pueden resultar altamente asociados y no son el uno causa del otro. Cabe recordar que el coeficiente fluctúa entre -1 ≤ ρ ≤ 1.
  • 4.
    COEFICIENTE DE CORRELACIÓNDE PEARSON • Tiene como objetivo medir la fuerza o grado de asociación entre dos variables aleatorias cuantitativas que poseen una distribución normal bivariada conjunta. El coeficiente se define por la siguiente fórmula:
  • 5.
    COEFICIENTE DE CORRELACIÓNDE PEARSON • Cuando ρ=+ la relación es directa entre las variables. Si ρ=- la relación es inversa y si ρ= 0 son independientes. Dicho coeficiente se puede expresar en términos de su estadístico como:
  • 6.
    USOS DEL COEFICIENTEDE RELACION DE PEARSON • Permite predecir el valor de una variable dado un valor determinado de la otra variable • Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. • Dicho cálculo es el primer paso para determinar la relación entre las variables. • Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación. • Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal entre 2 variables. • Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Usos del Coeficiente de Correlación de Pearson
  • 7.
    USOS DE ENFOQUESDE PEARSON A PROBLEMAS ESTADISTICOS • En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. • Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica. • Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r. Usos de Enfoques de Pearson a Problemas Estadísticos.
  • 9.
    COEFICIENTE DE CORRELACIÓNDE SPEARMAN El coeficiente de correlación de Spearman es un coeficiente no paramétrico alternativo al coeficiente de correlación de Pearson. Charles Spearman contribuyó al análisis del factor, a la teoría de la inteligencia, elaboró una prueba de la teoría mental . Se define el coeficiente de correlación de rangos de Spearman como el coeficiente de correlación lineal entre los rangos Ri(x) y Ri(y), en la fórmula de Pearson se reemplaza Xi por Ri(x) y Yi por Ri (y) quedando
  • 10.
    COEFICIENTE DE CORRELACIÓNDE SPEARMAN • La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de rangos apareados. La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las puntuaciones en rangos. Coeficiente de Correlación de Spearman.
  • 11.
    • A partirde un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente: • P=0 No hay correlación • p≠ 0 Hay correlación • Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y. Usos del Coeficiente de correlación de Spearman. USOS DEL COEFICIENTE DE CORRELACIÓN DE SPEARMAN
  • 12.
    VENTAJAS Y DESVENTAJASDEL COEFICIENTE DE SPEARMAN • VENTAJAS • No esta afectada por los cambios en las unidades de medida. • Al ser una técnica no parámetro, es libre de distribución probabilística. • DESVENTAJAS: • Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. • R no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
  • 13.
    USOS DE COEFICIENTEDE CORRELACION SPEARMAN • Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir; de forma que las puntuaciones que la representan puedan ser colocadas en dos series ordenadas. • A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs. Usos del Coeficiente de correlación de Spearman
  • 14.
    USOS DE ENFOQUESPEARSON Y ENFOQUE SPEARMAN A PROBLEMAS ESTADÍSTICOS. • Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento. El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados. La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno que se estudia. Usos de Enfoques de Spearman a Problemas Estadísticos
  • 15.
    CONCLUSIÒN La serie detiempo en estadística es un procesamiento de señales, y econometría, una serie temporal es una secuencia de puntos de datos, medidos típicamente a intervalos de tiempo sucesivos, y espaciados (con frecuencia) de forma uniforme. El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de datos, extrayendo información representativa, tanto referente a los orígenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro. De hecho uno de los usos más habituales de las series de datos temporales es su análisis para predicción y pronóstico. Por ejemplo de los datos climáticos, o de las acciones de bolsa, o las series pluviométricas.
  • 16.
    BIBLIOGRAFÌA • http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relaciónentre variables cuantitativas. • http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas 2.pdf Correlation en Wikipedia (inglés). • http://personal.us.es/vararey/adatos2/correlacion.pdf. • https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pea rson. • http://rccp.udea.edu.co/index.php/ojs/article/viewFile/274/271