Este documento presenta un resumen de tres ejercicios realizados como parte de un seminario sobre el análisis de datos. El primer ejercicio involucra la descripción de dos variables cualitativas mediante tablas de frecuencia e interpretación de los resultados. El segundo ejercicio describe la distribución de dos variables numéricas utilizando resúmenes estadísticos. El tercer ejercicio crea diferentes tipos de gráficos para variables cualitativas y numéricas con el fin de visualizar e interpretar la distribución de los datos.
2. VAMOS A IMPORTAR LA BASE DE DATOS PARA TENER LOS DATOS NECESARIOS
PARA TRABAJAR, COMO ESTA EN FORMATO R SE HARÍA ASÍ:
3.
4. PRIMER EJERCICIO
• SELECCIONAR DOS VARIABLES CUALITATIVAS-FACTOR DEL FICHERO,
DESCRIBIRLAS EN TABLAS DE FRECUENCIA E INTERPRETAR AL MENOS 3
ASPECTOS EN RELACIÓN A LA DISTRIBUCIÓN DE LAS MISMAS.
• LAS VARIABLES ELEGIDAS SON FRUTA Y HACHIS. LA DESCRIPCIÓN DE CADA
VARIABLE EN UNA TABLA DE FRECUENCIA SE HACE DE LA SIGUIENTE MANERA:
5.
6.
7.
8. A PARTIR DE LA TABLA DE FRECUENCIA PODEMOS SACAR ALGUNOS ASPECTOS
IMPORTANTES:
- EL TAMAÑO DE LA MUESTRA ES DE 290
- EL 89% COME AUNQUE SEA ALGO DE FRUTA A LO LARGO DE LA SEMANA, DEL
CUAL EL 32% COME FRUTA A DIARIO
- TODOS LOS DATOS ESTAN DISPONIBLES
- EL 22% NO COME FRUTA O COME MENOS DE UNA VEZ POR SEMANA
- DE LOS 290, 159 COMEN FRUTA 3 O MÁS VECES A LA SEMANA LO QUE
REPRESENA UN 55% DEL TOTAL
9.
10.
11. • LOS ASPECTOS MÁS SIGNIFICATIVOS SON:
- 233 PERSONAS NO LO HAN PROBADO NUNCA (81%)
- EL 19% HA PROBADO EL HACHIS
- EL 13% LO HA PROBADO ALGUNA VEZ REPRESENTADO POR 36 PERSONAS
- SOLO EL 1,39 % TOMA HACHIS A DIARIO AUNQUE EL PORCENTAJE AUMENTA
3,14% SI SE TRATA DE TOMAR HACHIS 2 O 3 VECES AL MES
12. SEGUNDO EJERCICIO
• SELECCIONAR DOS VARIABLES DEL FICHERO Y MEDIANTE RESÚMENES
NUMÉRICOS DESCRIBIR E INTERPRETAR LA DISTRIBUCIÓN DE LAS MISMAS.
• LAS VARIABLES ELEGIDAS SON ALTURA Y HORAPRACTICADEPORTIVA
13.
14.
15. • LA VARIABLE HORAPRACTICADEPORTIVA TIENE UNA MEDIA DE 2.482759 CUYA
DESVIACIÓN TÍPICA ES 3.138616
• SOLO HAY UN CASO NO DISPONIBLE POR LA RAZÓN QUE SEA
• LA MEDIANA COINCIDE CON EL SEGUNDO CUARTIL, EN ESTE CASO LA MEDIANA
SERÍA 2
• ESTA VARIABLE ES SIMÉTRICA PUESTO QUE LA MEDIA Y LA MEDIANA TIENEN
VALORES SEMEJANTES
16.
17. • LA MEDIA ES 1.667 Y LA DESVIACIÓN TÍPICA ES DE 0.08. ESTO QUIERE DECIR
QUE LOS VALORES DE ALTURA ESTAN ENTRE 1.58 Y 1.75
• SÓLO HAY UN CASO NO DISPONIBLE POR LA RAZÓN QUE SEA
• LA MEDIANA COINCIDE CON EL SEGUNDO CUARTIL QUE EN ESTE CASO ES 1.665
• ESTA VARIABLE ES SIMÉTRICA PUESTO QUE LA MEDIA Y LA MEDIANA TIENE
VALORES MUY SEMEJANTES
18. TERCER EJERCICIO
• REALIZAR UN GRÁFICO DE CADA TIPO CON VARIABLES ADECUADAMENTE
SELECCIONADAS
• PARA LAS VARIABLES CUALITATIVAS-FACTOR TENEMOS EL GRAFICO DE BARRAS
Y EL GRÁFICO DE SECTORES
19.
20.
21. • PODEMOS INTERPRETAR QUE LA MAYORIA NO TOMA REFRESCOS Y QUE UNA
MINORIA LO TOMA A DIARIO
22.
23.
24. • CON ESTE GRÁFICO PODEMOS DECIR QUE EL NÚMERO DE PERSONAS QUE
CONSUMEN EMBUTIDOS A DIARIO ES CASI EL MISMO QUE NO LOS CONSUME
NUNCA
25. • PARA VARIABLES NUMÉRICAS UTILIZAMOS EL HISTOGRAMA Y EL DIAGRAMA DE
CAJAS
26.
27.
28.
29.
30. • PODEMOS DECIR QUE ESTA VARIABLE ES SIMÉTRICA PUESTO QUE LA MEDIA Y LA
MEDIANA COINCIDEN Y LOS DATOS SE DISTIBUYEN DE IGUAL FORMA EN AMBOS
LADOS