En esta presentación vamos a trabajar el análisis exploratorio de datos, que resulta fundamental para hacernos una idea de los resultados obtenidos y de la existencia de datos perdidos o extraños.
El análisis es el primer paso para evaluar nuestras distribuciones de datos.
Vamos a trabajar también tablas de frecuencias, resúmenes numéricos y gráficas, con el fin de entender y visualizar mejor nuestro conjunto de datos obtenido de una muestra.
2. seminario 6
Vamos a trabajar el análisis exploratorio de datos, que resulta fundamental
para hacernos una idea de los resultados obtenidos y de la existencia de datos
perdidos o extraños (construcción, manipulación o importación).
Por tanto, es el primer paso para evaluar nuestras distribuciones de datos.
Posteriormente realizaremos:
★ Tablas de frecuencias
★ Resúmenes numéricos
★ Gráficas
3. tablas de frecuencias
El primer paso para analizar los datos derivados de variables cuantitativas es
la realización de tablas de frecuencias.
Estas proporcionan una rápida visión del comportamiento de los datos y exponen
ordenadamente la información recogida en una muestra.
Sexo Frecuencia
Hombre 7
Mujer 8
EJERCICIO:
Seleccionar dos variables cualitativas del
fichero “activossalud.RData”, descríbelas
en tablas de frecuencias e interpreta al
menos 3 aspectos en relación a la
distribución de las mismas.
4. En primer lugar debemos importar nuestro conjunto de datos al programa
RCommander.
A nuestro conjunto de datos lo llamaremos “Seminario6”. Tras nombrarlo, nos
aparecerá una ventana emergente y buscaremos en la carpeta en la que lo
tengamos guardado e importaremos nuestro archivo en formato Excel
5. Para crear nuestras tablas de frecuencias debo cliquear en “Estadísticos”,
“Resúmenes” y por último “Distribución de frecuencias” (como aparece a
continuación.
Para la primera tabla he seleccionado la variable “cerveza” y le damos a
Aceptar. Repetiremos el mismo proceso eligiendo otra variable para realizar la
segunda tabla.
6. Yo he elegido las variables “cerveza” y “combinados”. El resultado tiene que
salir así.
Estas tablas nos proporcionan una visión rápida del comportamiento de estas
dos variables.
7. Interpretación
En relación al consumo de cerveza, es mayor el porcentaje de personas, según
la muestra, que nunca consume cerveza, seguido de aquellas personas que solo
la consumen los fines de semana, siendo la diferencia entre ambas de 47
personas.
En cuanto al consumo de combinados, la tabla de frecuencias nos desvela que
diariamente nadie realiza el consumo de estos, siendo mayor el porcentaje
(40%) de personas que lo consumen los fines de semana.
8. resúmenes numéricos
ejercicio
Selecciona dos variables numéricas del fichero “activossalud.RData”, y
mediante resúmenes numéricos describe e interpreta la distribución de las
mismas.
Para realizar nuestros resúmenes numéricos debemos pinchar en “Estadísticos”,
“Resúmenes” y por último “Resúmenes numéricos”.
9. Tras esto se abrirá una ventana emergente en la que tendremos que elegir la
variable que queramos, en mi caso “horapracticadeportiva”, y
“malestaresactivos”. Cliqueamos antes de darle a aceptar en “Estadísticos”, y
seleccionamos Media, Desviación típica, Rango intercuartílico y los cuantiles.
resultado horapracticadeportiva
malestaresactivos
10. GRÁFICAS
Las tablas de frecuencias y las representaciones gráficas son dos maneras
equivalentes de presentar la información.
EJERCICIO
Debes realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero “activossalud.RData”, describe e interpreta la
distribución los mismos. Gráfica de sectores, gráfica de barras e histograma.
11. Para realizar las gráficas debemos pulsar en “Gráficas”, y dentro de esta,
seleccionamos el tipo de gráficas que queramos representar.
★ Gráfica de sectores
★ Gráfica de barras
★ Histograma
12. Gráfica de sectores
Seleccionamos la variable “estudiosmadre”,
y le damos a Aceptar.
Nuestra gráfica será de esta manera.
Podemos observar como predominan las
personas cuyas madres no tienen estudios o
solo han realizado educación primaria.
13. Gráficas de barras
Seleccionamos la variable “dulces” y le
damos a Aceptar.
Podemos observar que es frecuente el
consumo de dulces durante la semana
aunque no diariamente.