2. La aproximación moderna al problema de averiguar si un
valor observado de ρ es significativamente diferente de
cero (siempre tendremos -1 ≤ ρ ≤ 1) es calcular la
probabilidad de que sea mayor o igual que el ρ
esperado, dada la hipótesis nula, utilizando un test de
permutación.
La aproximación más básica es comparar el ρ observado
con tablas publicadas para varios niveles de
significación. Es una solución simple si la significación
sólo necesita saberse dentro de cierto rango, o ser
menor de un determinado valor, mientras haya tablas
disponibles que especifiquen los rangos adecuados.
3. Donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de
parejas. Se tiene que considerar la existencia de datos
idénticos a la hora de ordenarlos, aunque si éstos son
pocos, se puede ignorar tal circunstancia.
4. Una aproximación alternativa para tamaños de muestra
suficientemente grandes es una aproximación a la distribución
t de Student. Para tamaños de muestra más grandes que
unos 20 individuos, la variable:
Tiene una distribución t de Student en el caso nulo
(correlación cero). En el caso no nulo (ej: para averiguar si un
ρ observado es significativamente diferente a un valor teórico
o si dos ρs observados difieren significativamente), los tests
son mucho menos potentes, pero puede utilizarse de nuevo la
distribución t.
5. No esta afectada por los cambios en las unidades
de medida.
Al ser una técnica no parámetra, es libre de
distribución probabilística.
La manifestación de una relación causa-efecto es
posible sólo a través de la comprensión de la
relación natural que existe entre las variable y no
debe manifestarse sólo por la existencia de una
fuerte correlación (1, 5).
6. Es recomendable usarlo cuando los datos
presentan valores extremos, ya que dichos
valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no
normales.
r no debe ser utilizado para decir algo sobre la
relación entre causa y efecto.
7. Los datos brutos usados en este ejemplo se ven debajo:
El primer paso es ordenar los datos de la primera columna. Se agregan dos
columnas 'orden(i)' y 'orden(t). Para el orden i, se corresponderán con el
numero de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3er lugar,
ordenado de menor a mayor para el orden t, se debe hacer lo mismo pero
ordenando por 'Horas de TV a la semana', para no hacer otro cuadro, la
secuencia ordenada quedaría: T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 } para
este caso, el orden sería para cada elemento, respectivamente: orden(t) = {
1, 2, 3, 4, 5, 6, 7, 8, 9, 10 } sin embargo, el valor de orden esta dado por el
valor promedio de sus posiciones, así para: 7 aparece 2 veces, sumando sus
posiciones = ( 2 + 3 ) / 2 = 2.5, 28 aparece 3 veces, sumando sus posiciones
= ( 7 + 8 + 9 ) / 3 = 8, 50 aparece 1 vez, sumando sus posiciones = 10 / 1 =
10. Después, se crean dos columnas más, una columna "d" que muestra las
diferencias entre las dos columnas de orden y, otra columna "d2". Esta última
es sólo la columna "d" al cuadrado.
8. Después, se crean dos columnas más, una
columna "d" que muestra las diferencias entre las
dos columnas de orden y, otra columna "d2". Esta
última es sólo la columna "d" al cuadrado.
9. Nótese como el número de orden de los valores que son idénticos es la
media de los números de orden que les corresponderían si no lo fueran.
Los valores de la columna d2 pueden ser sumados para averiguar: El valor
de n es 10. Así que esos valores pueden ser sustituidos en la fórmula:
De lo que resulta:
10. A diferencia de la covarianza, la correlación de Pearson
es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente
de correlación de Pearson como un índice que puede
utilizarse para medir el grado de relación de dos
variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra , siendo
la expresión que nos permite calcularlo: Coeficiente de
Correlación de Pearson.
11. En el caso de que se esté estudiando dos variables
aleatorias X y Y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra , siendo la
expresión que nos permite calcularlo:
Donde; es la covarianza de (X,Y) es la desviación típica de la
variable X es la desviación típica de la variable Y De manera
análoga podemos calcular este coeficiente sobre un estadístico
muestral:
12. El valor del coeficiente de correlación es
independiente de cualquier unidad usada
para medir variables.
Mientras mas grande sea la muestra mas
exacta será la estimación.
13. Requiere supuestos acerca de la
naturaleza o formas de las poblaciones
afectadas.
Requiere que las dos variables hayan ido
medidas hasta un nivel cuantitativo
continuo y que la distribución de ambas
sea semejante a la de la curva normal.
14. Una empresa comercial tiene establecimientos en varias ciudades de Chile. El gerente
comercial planea lanzar al aire un anuncio comercial por radio en las estaciones locales,
al menos dos veces antes de una promoción (liquidación) que empezará el Sábado y
terminará el Domingo. Planea tener las cifras de las ventas de grabadoras de vídeos
(Blu-Ray) del Sábado y Domingo en sus diferentes locales y compararlas con el número
de veces que apareció el comercial en la rad
El objetivo fundamental de la investigación es determinar si existe relación entre
el número de veces que se transmitió el anuncio y las ventas de sus productos.
Se desea responder las siguientes interrogantes:
1. ¿Cuál es la variable dependiente?.
La variable dependiente son las Ventas.
2. Trace el diagrama o gráfico de dispersión.
3. ¿Parece haber alguna relación entre X e Y?.
Si existe una fuerte correlación positiva.
4. Determine el coeficiente de correlación.
15. Notar que un procedimiento alternativo para obtener el
coeficiente de determinación r² es mediante la incorporación de
una línea de tendencia lineal en el diagrama de dispersión tal cual
abordamos en el artículo.
0,93 indica una correlación positiva fuerte entre el número de veces
que sale publicado el anuncio, y las ventas.