Este documento presenta un análisis exploratorio de datos dividido en tres secciones: 1) creación de tablas de frecuencias sobre variables como dulces y fruta, 2) resúmenes estadísticos de variables como altura y horas de práctica deportiva, y 3) gráficas como sectores sobre padres sanitarios, barras sobre tabaco, e histograma sobre altura.
2. ÍNDICE
La siguiente presentación está dividida en tres
apartados distintos:
1. Creación de tablas de frecuencias.
2. Creación de resúmenes estadísticos.
3. Creación de gráfica de sectores, gráfica de
barras e histograma.
3. 1. Creación de tablas de frecuencias
El primer paso es
abrir Rcommander y a
continuación “cargar
conjunto de datos”
pinchando en “datos”.
4.
5. Para crear la primera tabla
de frecuencias pinchamos en
“estadísticos” -> “resúmenes”
-> “distribución de
frecuencias”.
6. Lo siguiente que tenemos que hacer es seleccionar las
variables. La primera que he escogido ha sido
“dulces”.
Tabla de frecuencias “dulces”:
7. Llevando a cabo el procedimiento
anterior, selecciono la segunda
variable,en este caso será “fruta”.
Tabla de frecuencia “frutas”:
8. ANÁLISIS DE LOS DATOS
A partir de los datos obtenidos en la tabla podemos ver que el consumo
de fruta es más abundante que el de dulces. A diario un 37,07% de los
encuestados consume fruta, sin embargo, solo un 6,90% come diariamente
dulces.
Centrándonos en la fruta podemos ver que predomina el consumo diario
(32, 07%) y a este le sigue el consumo de 3 o más veces por semana pero
no diario (22,76%).
En cuanto a los dulces observamos que lo que predomina es el consumo de
los mismos menos de una vez por semana (31,75%).
El 50% de la muestra estudiada consume una o dos veces dulces en semana
y fruta, tres o más veces en semana pero no de forma diaria.
9. 2. Creación de resúmenes estadísticos
Para seleccionar las
variables seleccionamos
“Resúmenes” y a
continuación “Resúmenes
numéricos”.
10. La primera variable que voy a seleccionar para
realizar el resumen numérico es “altura”.
11. Los resultados obtenidos son los siguientes:
Media (mean) 1.667
Sd (desviación típica) 0.08078101
IQR (recorrido intercuartílico) 0.12
0%, 25%, 50%, 75%, 100% (cuartiles) 1.46, 1.6, 1.655, 1.72, 2 respectivamente
Mediana
n (Número total de respuestas) 290
NA (personas sin responder) 1
12. Ahora voy a seleccionar “horasdeprácticadeportiva” y voy a realizar el
mismo procedimiento que con la variable “altura”.
13. Estos son los resultados para la variable “horasdeprácticadeportiva”:
Media (mean) 2.482759
Sd (desviación típica) 3.138616
IQR (recorrido intercuartílico) 4
0%, 25%, 50%, 75%, 100%
(cuartiles)
0, 0, 2, 4, 16, respectivamente
Mediana
n (Número total de respuestas) 290
NA (personas sin responder) 1
14. 3. Creación de gráfica de sectores, gráfica de barras e histograma.
Para crear una
gráfica de sectores
pincho en “gráficas”
y a continuación
“Gráfica de
sectores”
3.1. Gráfica de sectores
15. A continuación seleccionamos la variable a
partir de la cual quiero realizar la
gráfica. En este caso he seleccionado
“padresanitario”.
El análisis que podemos sacar de
la gráfica es que la mayor parte
de las personas entrevistadas no
tienen un padre sanitario.
16. 3.2. Gráfica de barras
El procedimiento es
el mismo que para la
gráfica de
sectores,en este
caso seleccionamos
“Gráfica de barras”.
17. En este caso he seleccionado la variable
“tabaco”.
La interpretación que podemos
sacar de esta gráfica de
barras es que la mayoría de
las personas no han fumado
nunca.
19. Esta vez he seleccionado la
variable “altura y esto son los
resultados obtenidos.
Podemos decir que la altura que más
predomina es entre 1,65 y 1,70 m.