Esto es un informe de estadística como ejemplo a utilizar la estadística descriptiva para exponer ordenadamente e interpretar la información recogida sobre un conjunto de datos
1. Introducción:
La estadística descriptiva, es una rama propia de las matemáticas, tiene poca
transcendencia, ya que es usado con carácter observativo y explorativo. Nos va a
permitir ver como evolucionan las cosas en el tiempo, pero no establecer una relación
causa efecto. A partir de ella nos va a permitir describir apropiadamente las
características de un conjunto de datos, los cuales previamente han sido presentados y
recolectados, tales como pueden ser la altura o la edad de la población.
Este conjunto de datos formados por valores numéricos va a ser clasificados en
cuantitativos o continuos y cualitativos o categóricos. Las cualitativas no se van a poder
medir numéricamente, a diferencia de las cuantitativas.
Objetivos:
- General: Utilizar la estadística descriptiva para exponer ordenadamente e interpretar la
información recogida sobre un conjunto de datos.
- Específicos:
1. Describir en tablas de frecuencias los datos de dos variables cualitativas-factor
del fichero “activossalud.RData” e interpretar al menos 3 aspectos en relación a
la distribución de las mismas.
2. Describir mediante resúmenes numéricos dos variables numéricas del fichero
“activossalud.RData” e interpretar la distribución de las mismas.
3. Realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero “activossalud.RData”, describir e interpretar la
distribución de los mismos.
Metodología:
En este informe nos hemos enfocado en el estudio de los estilos de vida y activos en
salud de los estudiantes de Enfermería de la Universidad de Sevilla, centros propios y
adscritos. Entre todos ellos alumnos, a partir de un muestreo hemos seleccionado a 290
2. alumnos para realizarle las encuestas.
Nos centraremos en 4 variables, las cuales dos de ellas son categóricas y las otras dos
continuas. Las dos variables categóricas en las que nos vamos a centrar van a ser: el
consumo de tabaco cuyas opciones a elegir será “a diario”, “solo los fines de semana”,
“2 o 3 veces a la semana”, “2 o 3 veces al mes”, “Alguna vez anual”, “Nunca”; y hacer
botellón medidas como “a diario”, “solo los fines de semana”, “2 o 3 veces a la
semana”, “2 o 3 veces al mes”, “Alguna vez anual”, “Nunca”,. Por otro lado, las
variables continuas que vamos a usar van a ser el peso y la altura.
Para realizar este informe has sido utilizado el software estadístico R, con la versión
2.4-1, los análisis estadísticos que vamos a usar van a ser dos variables categóricas
nominales, y dos cuantitativa continuas.
Resultados:
Tabla de frecuencia para la variable Botellón:
F.Absolutas F. A.
Acumulada
F.Relativa F. Relativa
acumulada
Porcentaje Porcentaje
acumulado
A
diario
3 3 0.0105 0.0105 1.05% 1.05%
Solo
fines
90 93 0.3158 0.3263 31.58% 32.63%
2 ó 3
veces
semana
6 99 0.0211 0.3474 2.11% 34.74%
2ó 3
veces
mes
73 172 0.2561 0.6035 25.61% 60.35%
Algunas
veces
anua
62 234 0.2175 0.821 21.75% 82.1%
Nunca 51 285 0.1789 1 17.89% 100%
3. A partir de la visualización en esta tabla de frecuencias observamos que la mayoría de
nuestra muestra hace botellón solo los fines de semana (31,58%), mientras que la
minoría lo hacen de manera diaria (1,06%). Por otro lado, nos puede dar información
por lo menos el 60,35% de la muestra hace botellón como mínimo 2 ó 3 veces al mes.
Tabla de frecuencia para la variable Tabaco:
F.Absolutas F. A.
Acumulada
F.Relativa F. Relativa
acumulada
Porcentaje Porcentaje
acumulado
A
diario
50 50 0.173 0.173 17.30% 17.30%
Solo
fines
21 71 0.0727 0.2457 7.27% 24.57%
2 ó 3
veces
semana
20 91 0.0692 0.3149 6.92% 31.49%
2ó 3
veces
mes
17 108 0.0588 0.3737 5.88% 37.37%
Algunas
veces
anual
55 163 0.1903 0.564 19.03% 56.4%
Nunca 126 289 0.4360 1 43.60% 100%
A partir de la visualización de esta tabla de frecuencias observamos que la mayoría de
nuestra muestra no fuma tabaco (43,60%), mientras que por otro lado la minoría fuma 2
ó 3 veces al mes. Además de ello, vemos que al menos el 56,4% de la población fuma
alguna vez como mínimo.
Resumen numérico de la variable Altura:
4. Tras realizar el resumen numérico acerca de la altura de nuestra muestra observamos
que nuestra media seria 1,67m, lo que nos indica que la altura supuestamente
representativa de nuestra muestra seria esa, por otro lado, vemos que el segundo cuartil,
que es la mediana nos deja ver como el 50% de nuestra población se encuentra por
debajo de 1,655m mientras que el otro 50% de la población se encuentra por encima de
dicha marca. Además nos permite ver que al ser muy próximas media y mediana nos da
una información sobre que en cierto modo nuestra distribución atiende a la normalidad
y además que los valores extremos no influyen excesivamente en nuestra media.
Nuestra desviación típica o estándar es de 0,08, esto nos dice que entre 1,59 y 1,75,
encontramos al 68,26% de nuestra muestra.
Resumen numérico de la variable Peso:
Una vez realizado el resumen numérico en función de la variable peso, observamos que
nuestra media es de 62,74, esta no se encuentra muy alejada de nuestra mediana que es
de 60 por tanto, es muy posible que presente una distribución normal. A partir de esta
mediana vemos que el 50% de nuestra muestra pesará menos de 60 y el otro 50% de
nuestra muestra pesará más de 60.
Nuestra desviación típica (sd) es de 12,66, esto nos indica que el 68,26% de nuestra
muestra pesará entre 50,08kg y 75,4kg. El recorrido intercuartílico del peso seria de 14,
por lo que el 50% de nuestra muestra pesará entre 54kg y el 68kg.
Gráfico de Sectores para la variable categórica Botellón.
En este gráfico vemos como se dividen las distintas
categorías establecidas en función a la frecuencia con
la que se hace botellón. Cada categoría esta
representada de manera proporcional al área del sector
circular.
Como este gráfico nos deja ver, vemos que la mayoría
hacen botellón solo los fines de semana. Y una minoría
de ellos lo hacen a diario.
5. Gráfico de barras para la variable categórica Tabaco:
Este gráfico de barras nos muestra como la mayoría de nuestra muestra nunca
consume tabaco, esta sería nuestra moda ya que es la frecuencia que más se repite.
Como pudimos apreciar en las tablas de frecuencias anteriores, la mayoría se da en el
caso de nunca, mientras que la cantidad de individuos que fuman los fines de semana, 2
ó 3 veces en semana y 2 ó 3 veces al mes es muy similar.
Histograma para variable continua Altura:
Con respecto al histograma realizado para la altura observamos una ligera asimetría
hacia la derecha, pero mantiene una distribución dentro de la normalidad, como vemos,
el intervalo 1,6-1,65, es el que presenta la frecuencia más alta aproximándose a la media
1,67. Nuestra moda en cuanto a intervalos sería 1,6-1,65.
6. Conociendo la mediana de 1,655, vemos que moda, mediana y media son muy
similares, la distribución tiende a la normalidad, además podemos ver como se
distribuye en forma de campana de Gauss.
Diagrama de caja para la variable continua Peso:
Conclusiones:
Con respecto a nuestra variable categórica sobre hacer botellón podemos asegurar que la
mayoría de los estudiantes de Enfermería de la Universidad de Sevilla, centros propios
y adscritos, realizan botellón solo los fines de semana (31,58%), frente a la minoría que
lo hace únicamente a diario. Son datos muy positivos, ya que las categorías que reflejan
una menor frecuencia de hacer botellón son las que más frecuencias absolutas
presentan. Aunque aún así estos datos podrían mejorarse, estableciendo programas
interactivos de los efectos negativos de alcohol orientado para jóvenes, e impartidos de
forma entretenida.
Por otro lado, podemos analizar la variable tabaco, donde los datos nos refleja que la
mayoría de los estudiantes no fuman, un dato de carácter muy positivo, sin embargo,
hay un importante porcentaje de estudiantes que sí fuman, y que además lo hacen a
diario. Además es un dato interesante teniendo en cuenta que nuestra muestra realizan
estudios del control de distintos aspectos de la salud de la población, por tanto,
En este diagrama de caja que representa a
nuestra muestra, observamos que la mediana se
establece en 60, similar a su media, anteriormente
calculada, que es 62,75, lo que nos da una cierta idea
sobre la normalidad.
Por otro lado, los bigotes van a representar cada uno de
ellos un 25% de nuestra muestra, y que la caja
representa al 50% restante.
Como observamos hay también numerosos valores
atípicos que van a influir en el valor de nuestra media,
estos son numerosos, por lo que podría provocar que el
estudio de nuestra variable dejará de atender a la
normalidad.
Sin contar con estos valores atípicos vemos que los
máximos se encontrarían entorno a 90kg de peso, y el
mínimo 38, esto queda representado por los extremos
de los bigotes.
7. podríamos establecer campañas antitabaco, donde en lugar de mostrar los efectos
negativos que tiene el consumo de tabaco, algo que ya conocen al ser estudiantes de
Enfermería, podríamos enseñarle estrategias distintas que suplan esa necesidad de fumar
que puedan llegar a ser interesantes y que además le permita predicar con el ejemplo
para sus futuros pacientes.
Con respecto a la variable altura, vemos como la mayoría de los estudiantes miden entre
1,60-1,65, distribuyéndose la altura de manera normal dentro de nuestra muestra, no se
ve de manera tan clara esta distribución si atendemos a la variable peso, debido a la gran
cantidad de valores atípicos que se dan en nuestra población. Teniendo en cuenta que el
peso no tiene una distribución tan normalizada como la altura, nos puede dar una cierta
información sobre posibles casos sobrepeso o delgadez en nuestros estudiantes, por
tanto, sería interesante estudiar el I.M.C de nuestra muestra, y si se confirma nuestra
teoría podríamos buscar estrategias que faciliten una correcta alimentación de nuestros
estudiantes, como por ejemplo, cambiar de las máquinas expendedoras tanta comida
grasa y sustituirla por frutas u otros alimentos bajos en grasas saturadas.