2. PÁGINA 1
ÍNDICE
1. INTRODUCCIÓN ……………………………………………2
2. OBJETIVOS……………………………………………………3
3. METODOLOGÍA…………………………………………....3
3.1 POBLACIÓN DE ESTUDIO………………….….3
3.2 VARIABLES A ANALIZAR……………………….3
3.3 ANÁLISIS DE DATOS……………………….……4
4. RESULTADOS………………………………………………..5
5. CONCLUSIONES………………………….…………………6
3. PÁGINA 2
1. INTRODUCCIÓN
La estadística es la ciencia que utiliza conjunto de datos numéricos para obtener, a partir de
ellos, inferencias basadas en el cálculo de probabilidades. Es un estudio que reúne, clasifica y
recuenta todos los hechos que tienen una determinada característica en común, para poder llegar
a conclusiones a partir de los datos numéricos extraídos. (RAE)
La estadística se divide en dos:
Estadística descriptiva: Describe y analiza los datos de un colectivo / muestra o una
población, con el fin de descubrir las regularidades o características existentes en sus
elementos. Se clasifica en:
o Descriptiva univariable: Analiza la distribución de una característica o
dimensión en una población, y elabora una serie de medidas resumen de esa
distribución.
o Descriptiva bivariable: Se ocupa de analizar la distribución conjunta de dos
variables en la población y la asociación entre esas variables.
Estadística Inferencial: Su función es extrapolar las características al conjunto del
colectivo de dónde se extrae el subconjunto.
En conclusión, la estadística descriptiva nos proporciona un conjunto de métodos y
procedimientos que nos permiten recopilar información, clasificar, encontrar las características
de los datos y hacer una buena interpretación de los mismos, para poder emitir una buena
conclusión respecto a un tema de interés.
4. PÁGINA 3
2. OBJETIVOS
1. General: El objetivo de este informe es trabajar más a fondo el tema de la estadística
descriptiva usándola para exponer ordenadamente e interpretar la información recogida
sobre un conjunto de datos llamado activos en salud.
2. Específico:
2.1 Describir en tablas de frecuencias los datos de dos variables cualitativas-factor del
fichero “activossalud.RData” e interpretar al menos 3 aspectos en relación a la
distribución de las mismas.
2.2 Describir mediante resúmenes numéricos dos variables numéricas del fichero
“activossalud.RData” e interpretar la distribución de las mismas.
2.3 Realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas
del fichero “activossalud.RData”, describir e interpretar la distribución los mismos.
3. METODOLOGÍA
3.1 POBLACIÓN DE ESTUDIO
Para el estudio he usado la base Activos en Salud, donde tengo una muestra N= 291, donde
todos son estudiantes de 1o Enfermería de la Universidad de Sevilla, centros propios y adscritos.
Estos datos han sido obtenidos mediante la realización de una encuesta a todos los alumnos
para conocer sus estilos de vida y activos en salud.
3.2 VARIABLES A ANALIZAR
En este conjunto de datos tenemos tanto variables cualitativas-factor como variables
cuantitativas. En concreto, voy a usar dos de cada tipo.
Variable cualitativas-factor: Para este tipo usaré las tablas de frecuencias que da una
rápida visión del comportamiento de los datos, diagrama de sector y barras. Las que
usaré son:
o Parejas Sexuales: 0 “3 o más”, 1 “2 parejas”, 2 “1 pareja”, 3 “no
he mantenido relaciones sexuales”.
5. PÁGINA 4
o Hachis: 0 “a diario”, 1 - “solo los fines de semana”, 3 “2 o 3 veces a la
semana”, 4 “2 o 3 veces al mes”, 5 “Alguna vez anual”, 6 “Nunca”.
Variable cuantitativa: Para este tipo usaré resúmenes numéricos que da una visión de
diferentes datos (medidas de dispersión, medidas de tendencia central y medidas de
posición), histograma y diagrama de cajas. Las que usaré son:
o Mantenimiento del hogar: Escala cuantitativa, formada tras sumar la
frecuencia con que realizas las siguientes tareas domésticas: Hacer la cama,
poner la lavadora, tender la ropa, limpiar el baño, lavar los platos, vasos, etc.,
barrer y fregar el suelo, cambiar las sábanas, limpiar el polvo, hacer de comer y
planchar, cada una de ellas con las siguientes categorías de respuesta: 1
“Nunca”, 2 “Algunas veces al año”, 3 “2 o tres veces al mes”, 4 “Solo
los fines de semana”, 5 “Diario”. A más puntuación, con más frecuencia
realiza tareas domésticas.
o Peso: vector numérico, unidades kg.
3.3 ANÁLISIS DE DATOS
Para ello usaré el programa Rcommander y Rgraphics, ambos son parte del paquete R, el cual
es un software estadístico que se encuentra en Internet de manera gratuita.
Variable cualitativas-factor: Tablas de frecuencias:
o Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad.
o Frecuencias relativas (proporción): Número de individuos de cada modalidad,
pero dividido por el total (n).
o Porcentaje: Número de individuos de cada modalidad por 100, dividido por el total.
o Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas.
Variable cuantitativa:
o Medidas de tendencia central: moda, media y mediana.
o Medidas de dispersión: rango, varianza y desviación típica que informan de la
dispersión y variabilidad de los datos con respecto a la media.
o Medidas de posición: cuartiles que son las puntuaciones que dividen a la
distribución en cuatro partes iguales, cada una de ellas con el 25% de los casos en
orden respectivamente (Q1, Q2, Q3, Q4).
6. PÁGINA 5
4. RESULTADOS
1. Descripción en tabla de frecuencias de dos variables cualitativas-factor.
PAREJAS SEXUALES
xi ni fi % Ni Fi Pi
3 o más 83 0.29 28.82 83 0.29 28.82
2 parejas 55 0.19 19.1 138 0.48 47.92
1 pareja 115 0.4 39.93 253 0.88 87.85
No relaciones 35 0.12 12.15 288 1 100
Total 288 1 100
No han respondido 3 personas, por lo que N=288
HACHÍS
xi ni fi % Ni Fi Pi
A diario 4 0.02 1.39 4 0.02 1.39
Fines de semana 2 0.01 0.7 6 0.03 2.09
2 o 3 veces semana 3 0.01 1.05 9 0.04 3.14
2 o 3 veces mes 9 0.03 3.14 18 0.07 6.28
Alguna vez anual 36 0.12 12.54 54 0.19 18.82
Nunca 233 0.81 81.18 287 1 100
Total 287 1 100
No han respondido 4 personas, por lo que N=287
2. Resúmenes numéricos de dos variables cuantitativas:
A) Mantenimiento del hogar: No han respondido 4 personas, por lo que n=287.
Media: 15.79
Mediana: 16.00
Rango intercuartílico: 9.5
Desviación Típica: 7.696161
Q1 (25%): 10,5
Q2 (50%): 16
Q3 (75%): 20
7. PÁGINA 6
Q4 (100%): 35
B) Peso: No han respondido 16 personas, por lo que n=275
Media: 62.76
Mediana: 60.00
Rango intercuartílico: 14
Desviación Típica: 12.65981
Q1 (25%): 54
Q2 (50%): 60
Q3 (75%): 68
Q4 (100%): 130
3. Gráficos:
A) Parejas Sexuales: 1º Gráfico de sectores, 2º Gráfico de barras.
B) Hachís: 1º Gráfico de barras, 2º Gráfico de sectores.
10. PÁGINA 9
5. CONCLUSIONES
Parejas sexuales: Tras realizar el estudio y analizar las frecuencias de los datos obtenidos
podemos ver como el 40% de personas han tenido solo una pareja sexual, si comparamos
esto con la realidad vemos que no es un dato muy fiable ya que con edades entre los 18-22
los jóvenes han tenido más de 3 parejas sexuales, esto explica la posible vergüenza a la hora
de responder la pregunta. El segundo dato con mayor % es tener 3 parejas, esto si se asemeja
más a la realidad. Otro dato a destacar es el bajo número de personas (solo 35) que no han
tenido parejas sexuales, con esto vemos como la sexualidad en los jóvenes ya ha cambiado,
no es como hace 30 años, cada vez van más rápido y empiezan antes, esto nos puede llevar
a el aumento de las E.T.S. debido al desconocimiento que tienen personas de baja edad por
estas enfermedades, su gravedad y los medios para evitarlas, sin olvidar que muchos jóvenes
con tal de hacerse los interesantes “ no ven el peligro y no están preparados
psicológicamente por su escasa madurez mental”. En ambos gráficos se ve de manera muy
significativa lo mencionado anteriormente y se ve como hay muy poca diferencia entre
todas las frecuencias.
Hachís: Tras analizar los datos obtenidos en el consumo de Hachís, me he llevado una gran
alegría al ver como el 81.18% de las personas nunca han probado esta droga, eso explica la
mayor concienciación de los jóvenes por el peligro que conlleva consumir drogas y es una
alegría ver como estudiantes de una profesión sanitaria muy importante no han consumido
drogas. Por eso vemos como el porcentaje de personas que han respondido “consumir a
diario”, “fines de semana”, “2 o 3 veces semana”, “2 o 3 veces mes” oscila entre el 0.01-
0.03%. Finalmente destacar el 0.12% de personas que la han probado alguna vez, esto sería
muy útil para formar campañas y fomentar el no consumir drogas, pero por desgracia estos
datos solo nos valen en este grado, puesto que una gran mayoría de jóvenes consumen y
venden todo tipo de drogas por diversión o creerse interesantes y es hacia ellos a los que se
debería de realizar un estudio más centrado en el consumo de drogas para crear planes y
campañas de actuación y ayuda hacia estos jóvenes que oscilan entre los 16-25 años. En
ambos gráficos se ve de manera muy significativa lo mencionado anteriormente a demás e
ver la clara diferencia que hay entre unos datos y otros, donde más reflejado se ve esto es
en el diagrama de barras.
11. PÁGINA 10
Mantenimiento del hogar: Tras analizar los datos obtenidos en la suma de puntuación de
la realización de todas las tareas del hogar vemos como la media está en 15.79 y la mediana
en 16. Que la media y la mediana se parezcan tantos es señal de que la distribución de datos
es simétrica, ya que la media simboliza el centro de gravedad de los datos y la mediana el
valor central en el 50%. Esto nos indica que la participación en el mantenimiento del hogar
de todos los estudiantes es muy similar. Para explicar la distribución de datos me he basado
en lo siguiente:
Media = Mediana distribución simétrica
Media < Mediana distribución asimétrica con cola a la izquierda
Media > Mediana distribución asimétrica con cola a la derecha
En ambos gráficos se ve claramente como el valor mínimo es 0 y el máximo 35, se ve
claramente como la mayoría de datos andan entre 10 y 20, sabiendo que mientras más
puntuación más ayudas en casa. Es bueno ver como los datos están prácticamente en la
mitad lo cual indica que los estudiantes ayudan bastante en sus hogares, aunque estos datos
podrían mejorar mucho más, haciendo a todos participes del mantenimiento del hogar sin
importar el ser hombre o mujer. En el diagrama de cajas se ve como solo hay un dato muy
por encima que se salga de la media normal.
Peso: Tras analizar los datos obtenidos en el peso de todos los estudiantes de 1º de
enfermería vemos como la media está en 62.76 y la mediana en 60. Que la media y la
mediana se parezcan tantos es señal de que la distribución de datos es simétrica, ya que la
media simboliza el centro de gravedad de los datos y la mediana el valor central en el 50%.
Esto nos indica que el peso de los estudiantes es muy equitativo entre todos ellos, siendo el
peso mínimo 38 y el peso máximo obtenido 130. Estos datos tan extremistas probablemente
indiquen una posible anorexia y obesidad respectivamente.
En ambos gráficos se ve claramente como la mayoría de datos oscilan entre 40 y 70 esto es
muy buena señal que indica el normopeso, lo cual nos da señal de que hay unos buenos
hábitos alimenticios y deportivos cuidando mucho de la salud. Se podrían usar los datos
escasos y aislados que se ven para formar campañas sobre la buena alimentación, dieta,
nutrición y los trastornos alimentarios, para ayudar a la gente que los padece, aunque sean
pocos y hacer que los que están en la media y con buen peso lo mantengan y entiendan
porque han de mantenerlo. A esto se le podría sumar los datos de altura y hacer el IMC para
ver si los datos se corresponden con lo analizado con los datos del peso.