Este documento presenta un seminario sobre análisis exploratorio de datos que incluye ejercicios de tablas de frecuencias, resúmenes numéricos y gráficos. Los ejercicios analizan datos demográficos y de estilo de vida de estudiantes de enfermería utilizando tablas de frecuencias, estadísticos descriptivos, histogramas, gráficos de barras y de caja. Los resultados proporcionan información sobre el uso de anticonceptivos, altura, peso, hábitos alimenticios y
3. 1. En primer lugar, cargaremos la base
de datos “activosensalud”
4. 2. Para poder seleccionar las dos variables cualitativas tal y como se nos
pide en el ejercicio, tenemos que seguir los siguientes pasos
5. 3. Realizamos el proceso dos veces, una para la variable
“pildoradeldiadespues” y otra vez para la variable
“protecciónpreservativo”
6. 4. Con las tablas de cada frecuencia, podemos realizar una comparación ya que disponemos
tanto de las frecuencias absolutas como de los porcentajes
7. 5. COMPARACIÓN DE FRECUENCIAS
· En cuanto a la frecuencia “proteccionpreservativo”, han
contestado 255 de 291 personas, y en “pildoradiadespues” 193 de
291.
· El 61,57% utiliza preservativo siempre, y el 31,37% afirma
haberlo utilizado alguna vez.
· En cuanto al uso de la píldora del día después el 69,43% dice no
haberla utilizado nunca, y tal sólo el 27,98% alguna vez.
· Podemos concluir que es más utilizado el preservativo como
método anticonceptivo que la píldora del día después debido al
alto porcentaje de personas que dicen no haberla utilizado nunca.
9. 1. En primer lugar, tenemos que abrir dos variables cuantitativas, para abrir la
primera que será “altura” seguimos los siguientes pasos
10. 2. Nos tenemos que asegurar de seleccionar “Media”, “Desviación típica” y
“Rango intercuartílico” ya que será lo que utilizaremos, para ello,
pincharemos en Estadísticos.
11. 3. En R Comander, obtendremos los siguientes datos:
A partir de los siguientes datos podemos deducir que la altura
media (mean) de los alumnos de primer año de enfermería es de
1.667 metros. La desviación típica (sd) es de 0.08078101, lo
cuál nos indica que los valores no están muy dispersos, es decir no
hay una gran variabilidad entre unos y otros. Con respecto a los
cuartiles, podemos deducir que la altura mínima es de 1,46m. El
25% o menos de los estudiantes, miden 1,6 m y el 50% de los
mismos, o menos miden 1.655 metros. El 75% o menos de los
estudiantes miden 1.72m. El valor máximo es de 2m lo que nos
indica que menos del 100% de los estudiantes mide menos de dos
metros. Finalmente podemos observar que, hay un alumno que no
ha contestado a la pregunta sobre su altura(NA).
12. 4. Ahora haremos el mismo análisis con la variable “peso”
Deducimos que el peso medio (mean) de los alumnos de primer
año de enfermería es de 62,76 kg. La desviación típica(sd) es
de 12,65981 indicador de una gran dispersión entre los datos
obtenidos por lo que hay una gran variabilidad. En cuanto a los
cuartiles vemos que el peso mínimo es de 38kg. El 25% de los
estudiantes, o menos pesan 54kg y el 50% o menos pesan 60kg.
El 75% o menos pesa 68kg. Por último observamos que menos del
100% de los estudiantes pesan 130kg. Se puede ver que 16
estudiantes no han contestado a la pregunta sobre su
peso(NA=16)
14. 1. Gráfico de sectores de la variable trabajo
Este tipo de gráficos es muy útil para
variables cualitativas, es preferible
que no se representen un gran número
de las mismas ya que puede resultar
confuso
En cuanto a la frecuencia trabajo, observamos que un gran
número de los encuestados no trabajan si miramos la
porción rosa, los cuáles son la mayoría, por el contrario la
porción azul representa los alumnos que si desempeñan
algún trabajo
15. 2. Gráfico de barras de la variable dulces
Los gráficos de barras también se
utilizan para variables cualitativas,
tienen una mayor importancia visual
por lo que se pueden utilizar
múltiples categorías. En este caso he
escogido la frecuencia con la que los
alumnos comen dulces. Se observa
que el dato más relevante es que más
del 80% de los estudiantes comen
dulces 1 o 2 veces a la semana.
16. 3. Histograma de frecuencias
Se utiliza en variables
cuantitativas.
He utilizado la frecuencia “peso”,
observando así que el peso medio
de los alumnos se encuentra entre
50 y 60 kg con una frecuencia
superior al 100%
17. 4. Gráfica de caja
Se utiliza para variables
cuantitativas.
Se puede analizar que el 25% de
los estudiantes tienen una
puntuación en torno a 7, siento
este el valor medio de
comunicación familiar. El 75%
de los valores se encuentran
entre 7 y 9. El 100% de los
valores se encuentran entre 13
o menos. Observamos 3 valores
atípicos: 103,72 y 281.