1. ANÁLISIS EXPLORATORIO DE DATOS
TABLAS DE FRECUENCIAS, RESÚMENES
NUMÉRICOS Y GRÁFICOS.
Marta Tabares Gallego
2. Selecciona dos variables cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de frecuencias
e interpreta al menos 3 aspectos en relación a la
distribución de las mismas.
4. Interpretación de datos:
- ¿Cuántos participantes realizan esta
acción a diario?: 185
- ¿Cuál es el porcentaje de las personas
que hacen la cama a diario?: 63,57%
- ¿Cuántos participantes nunca han
hecho la cama y que porcentaje
presenta sobre la totalidad?: 3 y
1,03%
- ¿Cuántas personas han hecho la cama
alguna vez al año y cual es su
porcentaje sobre la totalidad?: 4 y
1,37%
- ¿Cuántas personas hacen la cama 2 o
3 veces al mes y que porcentaje
representan?: 10 y 3,44%
- ¿Cuántas personas hacen la cama 2 o
3 veces a la semana y cuál es su
porcentaje sobre la totalidad?: 49
personas y representan un 16,84%
- ¿Cuántas personas realizan esta
acción SOLO los fines de semana y
qué porcentaje representan??: 40 y
13,75%
Primera variable:
“hacercama”
Tabla de frecuencias para la
variable “hacercama”
5. Segunda variable:
“marchaatras”
Tabla de frecuencias para la
variable “marchaatras”
Interpretación de datos:
- ¿Cuántos participantes nunca han
tenido relaciones?: 6 ¿qué porcentaje
representan en la muestra?: 2,88%
- ¿Cuántas personas, de las que han
tenido relaciones, nunca han
realizado la marcha atrás?: 106
personas
- ¿Qué tipo de personas representan
más de un 50% sobre la muestra?: las
personas que nunca han realizado la
marcha atrás con un 50,96%
- ¿Cuántas personas han realizado
alguna vez esta acción en una
relación y qué porcentaje
representan?: 87 personas y son un
41,83%
- ¿Cuántas personas tienen por
costumbre realizar la marcha atrás y
la tienen en cuenta en todas las
relaciones?: 9 personas representando
un 4,33% en la muestra
6. Tabla de frecuencias para la
variable “estudiosmadre”
Tercera variable:
“estudiosmadre”
Interpretación de datos:
- ¿Cuál es el factor que tiene más
participantes y, por tanto, un mayor
porcentaje con respecto a los demás?:
las mujeres sin estudios o estudios
primarios, las cuales son 135 y
representan casi un 50%: 47,20%
- ¿Cuántas mujeres han llegado al
bachiller?: 87 personas, son un
28,67%
- Por último, ¿Cuántas mujeres tienen
estudios universitarios?: 69 madres
de los que están en la muestra, con un
24,13%
7. Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas.
8. MEAN: media
SD: desviación típica
IQR: rango intercuartílico
CUARTILES Q:
Q1: la variable de 25% (deja a la izquierda el primer 25% de las
observaciones)
Q2: la variable de 50% (coincide con la mediana y por tanto con el
percentil 50%)
Q3: la variable de 75%
NA: datos desconocidos (not available)
9. Cuarta variable:
“altura”
Resúmenes numéricos para
la variable “altura”
Interpretación de datos:
- La media (resume el conjunto de todos los
valores y están representados todos los
valores): tiende al valor central y es =
1,667
- La desviación típica (sd): representa un
0,0807 (si es 0 indicaría que todas las
medidas serían iguales, homogeneidad
total) por lo tanto está cerca de la
homogeneidad.
- Con los cuartiles, podemos observar cierta
asimetría (si la diferencia entre los
cuartiles es similar podemos hablar de
simetría para la gráfica) puesto que la
diferencia es relativamente grande:
- Q1: 1,6
- Q2: 1,655 (diferencia entre Q1 y Q2
0,055) percentil 50 y mediana
- Q3: 1,72 (diferencia entre Q2 y Q3
0,065)
- Por ultimo, el rango intercuartílico (IQR)
0,12 (diferencia entre Q1 y Q3)
Podemos ver que tenemos 291 personas en
nuestra muestra, pero que solo tenemos
información de 290 para esta variable
10. Quinta variable:
“peso”
Interpretación de datos:
- La media (resume el conjunto de todos los
valores y están representados todos los
valores): tiende al valor central y es =
62,75
- La desviación típica (sd): representa un
12,65 (si es 0 indicaría que todas las
medidas serían iguales, homogeneidad
total) por lo tanto está lejos de la
homogeneidad.
- Con los cuartiles, podemos observar cierta
asimetría (si la diferencia entre los
cuartiles es similar podemos hablar de
simetría para la gráfica) puesto que la
diferencia es relativamente grande:
- Q1: 54
- Q2: 60(diferencia entre Q1 y Q2 6)
percentil 50 y mediana
- Q3: 68 (diferencia entre Q2 y Q3 8)
- Por ultimo, el rango intercuartílico (IQR)
14 (diferencia entre Q1 y Q3)
Podemos ver que tenemos 291 personas en
nuestra muestra, pero que solo tenemos
información de 290 para esta variable
11. Debes realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución
los mismos.
12. GRÁFICAS PARA VARIABLES CUALITATIVAS
Gráfica de sectores lo realizaremos con la variable
“estudiosmadre”
Gráfica de barras lo realizaremos con la variable “hacercama”
GRÁFICAS PARA VARIABLES CUANTITATIVAS
Histograma de frecuencias lo realizaremos con la variable
“altura”
Diagrama de cajas lo realizaremos con la variable “peso”
13. Seleccionamos gráficas y nos dirigimos al
tipo de gráfica que queremos (en este caso
gráfica de sectores). Posteriormente nos
aparecerá un recuadro donde
seleccionaremos la variable que queremos
(“estudiosmadre”) y cliqueamos en
“aceptar”. Finalmente obtendremos
nuestra gráfica.
14. Seleccionamos gráficas y nos dirigimos al
tipo de gráfica que queremos (en este caso
gráfica de barras). Posteriormente nos
aparecerá un recuadro donde
seleccionaremos la variable que queremos
(“hacercama”) y cliqueamos en “aceptar”.
Finalmente obtendremos nuestra gráfica.
15. Seleccionamos gráficas y nos dirigimos al
tipo de gráfica que queremos (en este caso
histograma de frecuencias).
Posteriormente nos aparecerá un
recuadro donde seleccionaremos la
variable que queremos (“altura”) y
cliqueamos en “aceptar”. Finalmente
obtendremos nuestra gráfica.
16. Seleccionamos gráficas y nos dirigimos al
tipo de gráfica que queremos (en este caso
diagrama de cajas). Posteriormente nos
aparecerá un recuadro donde
seleccionaremos la variable que queremos
(“peso”) y cliqueamos en “aceptar”.
Finalmente obtendremos nuestra gráfica.