Trabajos Preliminares en Obras de Construcción..pdf
Estadistica 1 presentacion 2
1. REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER PUPULAR PARA LA
EDUCACION SUPERIOR
INSTITUTO UNIVERSITARIO POLITÉCNICO
´´SANTIAGO MARIÑO´´
INGENIERIA INDUSTRIAL 45
Daniela Betancourt
CI: 21344468
2. En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el
grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
Coeficiente de correlación de Pearson
El coeficiente de correlación lineal de Pearson se define matemáticamente con la ecuación siguiente:
3. Donde:
r = coeficiente de correlación de Pearson.
Sxy = sumatoria de los productos de ambas variables.
Sx = sumatoria de los valores de la variable independiente.
Sy = sumatoria de los valores de la variable dependiente.
Sx2 = sumatoria de los valores al cuadrado de la variable independiente.
Sy2 = sumatoria de los valores al cuadrado de la variable dependiente.
N = tamaño de la muestra en función de parejas.
Este procedimiento estadístico es aplicable cuando las observaciones se miden según una escala de intervalo, por otra
parte, el fenómeno debe ser lineal.
Al igual que las otras pruebas paramétricas, la varianza de las variables X y Y deben guardar homogeneidad.
Pasos:
1.Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente
(X).
2.Elevar al cuadrado cada valor X y de Y.
3.Obtener los productos de X y Y, para lo cual se deben multiplicar independientemente ambos valores.
4.Efectuar las sumatorias Sx, Sy, Sx2, Sy2, y Sxy.
5.Calcular el tamaño de la muestra en función de parejas de X y Y.
6.Aplicar la ecuación.
7.Calcular los grados de libertad (gl): gl = N parejas -1.
8.Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en función de la probabilidad.
9.Decidir si se acepta o rechaza la hipótesis.
4. Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A valores altos de una de ellas le
suelen corresponder valor bajos de la otra y viceversa. Cuánto más próximo a -1 esté el coeficiente de correlación más
patente será esta covariación extrema. Si r= -1 hablaremos de correlación negativa perfecta lo que supone una
determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una
relación lineal de pendiente negativa).
Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo. A valores altos de una le
corresponden valores altos de la otra e igualmente con los valores bajos. Cuánto más próximo a +1 esté el coeficiente de
correlación más patente será esta covariación Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo):Existe una relación lineal perfecta ( con pendiente
positiva).
Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse ningún sentido de covariación.
Propiedad importante: Si dos variables son independientes estarán incorrelacionadas aunque el resultado recíproco no es
necesariamente cierto. Matriz de correlaciones
ir a análsis multidimensional
Propiedades de coeficiente de correlación de Pearson
5. Diagrama de dispersión
Ejemplo: Una empresa comercial tiene establecimientos en varias ciudades de Chile. El gerente comercial planea lanzar al aire un
anuncio comercial por radio en las estaciones locales, al menos dos veces antes de una promoción (liquidación) que empezará el
Sábado y terminará el Domingo. Planea tener las cifras de las ventas de grabadoras de vídeos (Blu-Ray) del Sábado y Domingo en
sus diferentes locales y compararlas con el número de veces que apareció el comercial en la radio. El objetivo fundamental de la
investigación es determinar si existe relación entre el número de veces que se transmitió el anuncio y las ventas de sus productos. Los
datos son:
6. Con la información de la tabla anterior se desea responder las
siguientes interrogantes:
1. ¿Cuál es la variable dependiente?. La variable dependiente son las
Ventas.
2. Trace el diagrama o gráfico de dispersión.
3. ¿Parece haber alguna relación entre X e Y?. Si existe una fuerte
correlación positiva
4. Realizar los cálculos el coeficiente de correlación de Pearson o r es de 0,93
(aproximado) y en consecuencia el coeficiente de determinación r² es
de r²=(0,929516)²=0,864.
7. En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos,
inversiones entre dos ordenaciones de una distribución normal bivariante.
Coeficiente de correlación de Spearman
Donde:
rs = coeficiente de correlación de Spearman.
d2 = diferencias existentes entre los rangos de las dos variables, elevadas al
cuadrado.
N = tamaño de la muestra expresada en parejas de rangos de las variables.
S = sumatoria.
8. Pasos.
1.Clasificar en rangos cada medición de las observaciones.
2.Obtener las diferencias de las parejas de rangos de las variables estudiadas y elevadas al cuadrado.
3.Efectuar la sumatoria de todas las diferencias al cuadrado.
4.Aplicar la ecuación.
5.Calcular los grados de libertad (gl). gl = número de parejas - 1. Solo se utilizará cuando la muestra sea mayor a 10.
6.Comparar el valor r calculado con respecto a los valores críticos de la tabla de valores críticos de t de Kendall en función de
probabilidad.
7.Decidir si se acepta o rechaza la hipótesis.
Ejemplo: Un investigador está interesado en conocer si el desarrollo mental de un niño esta asociado a la educación formal de su madre. De esta manera,
obtiene la calificación de desarrollo mental en la escala de Gesell de ocho niños elegidos aleatoriamente y se informa del grado de escolaridad de las
madres.
Elección de la prueba estadística.
Se desea medir asociación o correlación. Las calificaciones de la educación formal de las madres están dadas en una medición cualitativa, pero tienen una
escala ordinal, por lo cual es posible ordenarlas en rangos.
Planteamiento de la hipótesis.
•Hipótesis alterna (Ha). El desarrollo mental de los hijos es una variable dependiente de la educación formal de la madre; por lo tanto, existe una
correlación significativa.
•Hipótesis nula (Ho). La asociación entre las variables de educación formal de la madre y el desarrollo mental de los hijos no es significativa, ni hay
correlación.
9. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Desarrollo mental de algunos niños y escolaridad de las madres.
Aplicación de la prueba estadística.
Las observaciones de cada variable se deben ordenar en rangos, así como
obtener las diferencias entre los rangos, efectuar la sumatoria y elevar
ésta al cuadrado.
Educación de algunas madres y calificación de desarrollo mental de los
hijos.
Calculo de los grados de libertad (gl).
gl = numero de parejas - 1 = 8 - 1 = 7
El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de Spearman.
El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea,
mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05.
Decisión.
Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha.9
Calculo de rs de Spearman.
10. Ventajas y desventajas del coeficiente de correlación de Pearson
• Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el coeficiente de
correlaciones de Pearson.
• Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas por X e Y.
• El valor 0 representa falta de correlación.
• Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de
correlación poblacional tiene el valor cero.
• En cambio una correlación nula no implica la independencia de variables.
Ventajas
Desventajas
11. Ventajas y desventajas del coeficiente de correlación de Spearman
• Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9).
• Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).
• La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe
entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5).
Ventajas
Desventajas
• Indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.
• La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal
bivariante.