2. CORRELACIONES:
En este seminario vamos a trabajar con distintos tipos de variables para
ver si estas están relacionadas entre ellas y la intensidad con la que se
relacionan, usando para ello las correlaciones.
La correlación determina la relación o dependencia que existe entre
las dos variables que intervienen en una distribución. Es decir,
determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las variables
están correlacionadas o que hay correlación entre ellas.
3. Según el tipo de coeficiente encontramos:
◦Pearson: escala-escala
◦Biserial puntual: escala- nominal dicotómica
◦Spearman: ordinal-ordinal
◦Contingencia: nominal-nominal (una no sea dicotómica)
◦Phi: nominal dicotómica-nominal
4. La primera actividad que hicimos fue intentar
asociar dos variables en escala como son el
peso medido en consulta y la edad.
5.
6. Tras relacionar estas dos variables, para saber si podemos usar el coeficiente de correlación
de Pearson, usaremos Kolmogorov-Smirnov, al ser la muestra mayor de 50, para
comprobar si siguen una distribución normal es decir, paramétrica. Si fuera menor de 50,
usaríamos Shapiro-wilk.
7. Tras realizar el contraste de hipótesis:
◦ Hipótesis nula: No hay diferencias entre el peso y la edad, son normales con respecto a que
cumple criterios de normalidad, si representamos la media de los dos, sumamos dos desviaciones
típicas y sale el 95%.
◦ Hipótesis alternativa: si hay diferencia entre el peso y la edad, no son normales. En este caso se
rechaza la hipótesis nula ya que si hay diferencias y no son normales.
Al ser la significación menor de 0,05, rechazamos la hipótesis nula, es decir, los datos no siguen una
distribución normal y, por ello, en vez de usar Pearson, usaremos Spearman.
9. Dejamos Pearson pero sabemos que no se puede usar porque no sigue el cirterio de
normalidad.
10.
11. Hay asociación entre las dos variables ya que vuelvo a rechazar la hipótesis nula (p
es 0.000), es decir, edad y peso están relacionados con una intensidad muy baja y
una asocacion significativa.
La intensidad es 0,2, según los valores de bisquerra es una correlación muy baja.
12. Contingencia: correlacionaremos sexo y
hábito tabáquico.
◦Como los valores de la etiqueta es 0 para masculino y 1 para
femenino, si sale negativo la correlación se acerca mas a
masculino y si sale positivo se acerca mas a femenino.
13.
14.
15.
16.
17. La hipótesis nula sería que no hay relación entre ellas mientras que la hipótesis
alternativa sería que si hay relación.
Como p es menor de 0,05, rechazo la hipótesis nula y acepto la alternativa, la
correlación es de 0,223, la intensidad es baja, como es positivo se acerca a las
mujeres, el sexo y habito tabáquico está relacionado y va en dirección a las mujeres,
es decir, donde más se cumple esta relación es con las mujeres.
27. Hipótesis nula: no hay diferencias.
Hipótesis alternativa: si hay diferencias.
Aceptamos la hipótesis nula, es una relación sin sentido, no están
relacionados.
30. Rechazo la hipótesis nula ya que la significación es de 0,000. Debido a que el valor
obtenido en Phi es positivo, 0,754, y al igual que dijimos antes, que si el resultado es
negativo se acerca a los hombres, en este caso al ser positivo se acerca a las mujeres.
Con el tipo de tratamiento ocurre exactamente lo mismo, si es negativo se acerca al
tratamiento A y si es positivo al B. Por lo que en este caso tienen una intensidad alta
basándonos en los valores de correlación de Bisquerra y tienen tendencia a ser
mujeres con el tratamiento B .
Hipótesis nula: no
hay diferencias.
Hipótesis alternativa:
si hay diferencias.