Este documento describe un seminario sobre estadística descriptiva. Explica los objetivos de resumir y analizar un conjunto de datos para describir sus características. Detalla el método de analizar variables cualitativas y cuantitativas de un conjunto de datos de 290 estudiantes mediante tablas de frecuencias, resúmenes numéricos y gráficos como diagramas de sectores, barras e histograma. Los resultados muestran las características de las variables analizadas como el peso, horas de deporte y hábitos de consumo de alcohol y tab
1. SEMINARIO 6 ESTADISTICA DESCRIPTIVA
1. INTRODUCCIÓN
La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar,
ordenar, analizar y representar un conjunto de datos, con el fin de describir
apropiadamente las características de este.
2. OBJETIVOS
La finalidad última de la estadística descriptiva es resumir la información de conjuntos
más o menos numerosos de datos. Para ello se asienta en un concepto inmediato a la
tarea de recuento: la frecuencia, medida empírica de la ocurrencia de los distintos
estados que puede presentar una variable.
- General: Utilizar la estadística descriptiva para exponer ordenadamente e interpretar la
información recogida sobre un conjunto de datos.
- Específicos:
1. Describir en tablas de frecuencias los datos de dos variables cualitativas-factor
del fichero “activossalud.RData” e interpretar al menos 3 aspectos en relación a
la distribución de las mismas.
2. Describir mediante resúmenes numéricos dos variables numéricas del fichero
“activossalud.RData” e interpretar la distribución de las mismas.
3. Realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero “activossalud.RData”, describir e interpretar la
distribución los mismos.
3. METODOLOGÍA
3.1- Población de estudio.
Hemos realizado una encuesta a 290 estudiantes de primero de enfermería de la
Universidad de Sevilla, centros propios y adscritos para conocer sus estilos de vida y
activos en salud.
2. 3.2- Variables a analizar:
-Variables incluidas en los análisis y de qué tipo son.
Madresanitaria: dos categorías: 0- No, 1- Sí. Es una variable cualitativa
Tabaco: 0-“a diario”, 1- “solo los fines de semana”, 3- “2 o 3 veces a la
semana”, 4- “2 o 3 veces al mes”, 4- “Alguna vez anual”, 5- “Nunca”. Es una
variable cualitativa.
Peso: vector numérico, unidades kg. Es una variable cuantitativa
horapracticadeportiva: Horas de dedicación a practicar deporte a la semana. Es
una variable cuantitativita
Para las graficas he usado las siguientes variables
Altura: vector numérico, unidades metros
Peso: vector numérico, unidades kg. Es una variable cuantitativa
Botellon: 0-“a diario”, 1- “solo los fines de semana”, 3- “2 o 3 veces a la
semana”, 4- “2 o 3 veces al mes”, 4- “Alguna vez anual”, 5- “Nunca”
Cerveza: 0-“a diario”, 1- “solo los fines de semana”, 3- “2 o 3 veces a la
semana”, 4- “2 o 3 veces al mes”, 4- “Alguna vez anual”, 5- “Nunca”
3.3- Análisis de datos:
-Software estadístico utilizado: He usado el software estaditico RStudio y Rcommander
-Análisis estadísticos que se van a realizar:
-Se ha realizado una tabla de frecuencias que la usamos para comparar datos
-Se ha realizado un resumen numérico de dos variables cuantitativas
-Y por ultimo 4 tipos de graficas: sectores, barras, histograma y cajas
4. RESULTADOS
Primero abrimos Rstudio y tecleamos library(“Rcmdr”). Así abriremos el paquete de
Rcommander. A continuación hacemos click sobre “Datos”, “Cargar conjunto de datos”
3. y subimos el archivo “Activossalud” que previamente hemos descargado de enseñanza
virtual”.
TAREA 1: Describir en tablas de frecuencias los datos de dos variables cualitativas-
factor del fichero “activossalud.RData” e interpretar al menos 3 aspectos en relación a
la distribución de las mismas.
Antes de empezar debemos elegir dos variables cualitativas del fichero. Yo he elegido
“madresanitaria” y “tabaco”. A continuación hacemos click en “Estadisticos”,
“Resumenes” y “Distribucion de frecuencia” y asi conseguimos la tabla de frecuencia
de las variables seleccionadas.
De esta tabla sacamos que el 27 de los alumnos tiene madre sanitaria y que el resto no.
Es decir, el 90.72% de los entrevistados no tiene madre sanitaria. El 9,28 porciento si.
De la tabla de la variable “tabaco” sacamos que han contestado 289 de los 290 alumnos
a los que se le realizaron las encuestas. Vemos que 126 alumnos nunca han fumado y
que 50 de ellos lo hace a diario. 21 de ellos solo fuman los fines de semana, 20 un par
de veces entre semana y 17 un par de veces al mes. Un 43% de los alumnos nunca ha
fumado y vemos que mas de la mitad de ellos lo ha probado o fuma ya sea diariamente
o en ocasiones.
4. TAREA 2: Seleccione dos variables numéricas del fichero “activossalud.RData”, y
mediante resúmenes numéricos describa e interprete la distribución de las mismas.
Volvemos a elegir dos variables del fichero pero esta vez cuantitativas. Esta vez he
elegido las variables “peso” y “horasdeportivas”. Primero hacemos click sobre
“Estadisticos”, “Resumenes” y por ultimo “Resumenes numéricos” y aquí
seleccionamos nuestras variables elegidas.
Ahora interpretamos los resultados. En la tabla vemos la media, la desviación típica, los
cuartiles, la muestra (n) y las personas que no han contestado (NA).
En la practica deportiva vemos que la madia de horas dedicadas al deporte es de
aproximadamente 2,5 horas. El segundo cuartil nos indica que solo el 75% de la gente
realiza 2 h y el 25% 4.
En el peso vemos que la media de las 274 personas que contestaron es de 62,75 kg. El
50% pesa menos de 60kg y un 25% pesa entre 38 y 54 kg.
TAREA 3: Realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero “activossalud.RData”, describir e interpretar la distribución
los mismos.
Para realizar los gráficos seleccionamos “Gráficos” y seleccionamos el que queramos.
La primera grafica que he seleccionado es un diagrama de sectores para la variable
“Botellon”
5. Como vemos un poco mas del 25% de los alumnos va a los botellones los fines de
semana. Una cantidad considerable nunca va y pocas personas suelen ir a diario o varias
veces a la semana. Como podemos ver la mayoría de los jóvenes van al menos una vez
al mes a botellones.
A continuación la segunda grafica que he realizado es un diagrama de cajas con la
variable altura.
La mediana está entre 1,6 y 1,7. Vemos también que el 50% mide entre 1,6 y 1,75
aproximandamente. La altura mas alta alcanzada por un alumno es 1.9 y la mas baja
1,45 aproximadamente. Los valores que aparecen por encima de la línea acompañados
6. de un punto singifican que son valores que han alcanzado esos alumnos y que están
alejados del conjunto de datos que se abarcan en el diagrama de cajas.
La tercera grafica es un histograma de frecuencia sobre la variable peso.
Como podemos observar la mayoría de las personas pesan entre 60 y 70 kg. Muy pocas
personas pesan mas de 80/90 kg y menos de 40 por lo que es una buena señal ya que no
abunda la obesidad ni la desnutrición.
La ultima grafica que voy a representar es una grafica de barras de la variable cerveza.
En la primera grafica vemos las veces que toman cerveza con el numero de alumnos. En
la segunda grafica observamos el porcentaje de las veces que se ingiere cerveza.
7. a diario”, 1- “solo los fines de semana”, 3- “2 o 3 veces a la semana”, 4- “2 o 3
veces al mes”, 4- “Alguna vez anual”, 5- “Nunca”
Como vemos 60 de los alumnos consumen cerveza solo los fines de semana y muy
pocos diario. Hay una cantidad considerable que nunca toma cerveza y 50 de ellos la
toman alguna vez al año.
Los 60 alumnos que solo consumen durante los fines de semana representan el 20% de
los alumnos entrevistados mientra que los aproxiamnamente 100 que nunca la toman
son el 45%
5. CONCLUSIONES
Gracias a los análisis realizados hemos podido comprar los datos obtenidos de las
estrevistas y hacer un análisis valorativo de la población a cerca de las variables usadas.
Por ejemplo hemos podido comprobar que la mitad de alumnos entrevistados dedicaba
2,5 h al deporte a la semana y que deberían de dedicarle un poco mas ya que la practica
deportiva y el ejercicio físico son claves para llevar una vida saludable.