El documento analiza variables cualitativas y cuantitativas del archivo "activossalud.RData" mediante tablas de frecuencias, resúmenes numéricos y gráficos. Se describen dos variables cualitativas, "uso de preservativo" y "empleo de marcha atrás", encontrando que la mayoría de la muestra usa preservativo pero la mitad no emplea la marcha atrás. También se analizan las variables cuantitativas "altura" y "peso", hallando alturas promedio de 1.667m y
2. • Selecciona dos variables cualitativas-factor del
fichero “activossalud.RData”, descríbelas en
tablas de frecuencias e interpreta al menos 3
aspectos en relación a la distribución de las
mismas.
3. • Las dos variables cualitativas o factores que utilizaremos
para resolver el ejercicio son :
a) Uso de preservativo b) empleo de la “marcha
atrás”
4. Procedemos a realizar una interpretación de ambas
distribuciones:
a) Uso de preservativo:
• Un 61’57% de la muestra SIEMPRE utiliza preservativo
en sus relaciones sexuales.
• Tan solo un 4’71% de la muestra afirma no haber
utilizado nunca este método anticonceptivo.
• Más de la mitad de la muestra ha usado el preservativo
como método anticonceptivo en sus relaciones sexuales
(92.94%)
5. b) empleo de la “marcha atrás”:
• Más de la mitad de la muestra (50’96%) nunca ha
realizado esta conducta de riesgo.
• Un 41’83% de la muestra ha practicado el coito
interrumpido alguna vez
• Tan solo un 4’43% de la muestra utiliza en el 100% de
sus relaciones sexuales esta práctica como “método
anticonceptivo”.
6. • Selecciona dos variables numéricas del
fichero “activossalud.RData”, y mediante
resúmenes numéricos describe e
interpreta la distribución de las mismas.
7. • Realizamos los resúmenes numéricos de dos de las
variables cuantitativas de nuestra base de datos, en este
caso hemos escogido las variables : a) Altura y B) peso.
• Peso: vector numérico, unidades kg
• Altura: vector numérico, unidades metros
8. Estudiaremos medidas de resumen o medidas descriptivas
numéricas que son de tres tipos:
• Las que ayudan a encontrar el centro de la distribución,
llamadas medidas de tendencia central.
• Las que miden la dispersión, llamadas medidas de
dispersión.
• Las que describen la posición relativa de una
observación dentro del conjunto de datos, llamadas
medidas de posición relativa.
9. • 1. Medidas de Tendencia Central :
Son valores numéricos que quieren mostrar el centro de un
conjunto de datos, nos interesan especialmente: la media (o
promedio) y la mediana.
En cuanto a la variable “altura” : Encontramos que la media de
la altura de nuestras muestra es de 1’667 metros, que difiere
un poco de la mediana , cuyo valor central se encuentra en
1’655 metros. Solo una persona no ha contestado.
Por otro lado, en cuanto a la variable “peso”, observamos que
el peso medio de los alumnos de la muestra se encuentra en
62’755 kg y el valor central o mediana se halla en 60’00 kg.
16 personas no contestaron sobre su peso.
10. • 2) Medidas de Dispersión:
. Rango: Es la medida de variabilidad o dispersión más
simple. Se calcula tomando la diferencia entre el valor
máximo y el mínimo observado. Rango = Máximo – Mínimo
3) Medidas de posición:
.Cuartiles: Cuando se dividen un conjunto ordenado de
datos en cuatro partes iguales, los puntos de división se
conocen como cuartiles y los representamos por Q1, Q2 y
Q3.
En relación a esto, podemos comentar que:
11. En cuanto a la desviación, en la altura es de 0’08, mientras que en el peso
es de 12’66. Esto nos dice que los valores en el peso están mucho más
dispersos que con respecto a al altura.
El máximo del peso se sitúa en 130 kg, la altura máxima se corresponde
con 2m.
El peso mínimo es 38kg, mientras que la mínima altura es de 1’46m.
La muestra por tanto es más homogénea con respecto a la altura que con
respecto al peso.
Observamos también los datos de los cuartiles Q1,Q2 y Q3 en nuestra
tabla, que coinciden con los valores el 25, 50 y 75% respectivamente y de
los cuales el Q2 es la mediana o valor medio, que en cuanto al peso es
60kg y en cuanto a la altura es 1’65m.
12. • Debes realizar al menos un gráfico de cada tipo
con variables adecuadamente seleccionadas del
fichero “activossalud.RData”, describe e
interpreta la distribución los mismos
13. • Variables cualitativas-factor: Gráficos de sectores
- Variable utilizada: botellón
En nuestro gráfico observamos
Que aproximadamente un 35% de los
encuestados solo realizan botellón los
Fines de semana, mientras que un 20%
nunca han realizado esta práctica. Por
otro lado, observamos que el porcentaje
de usuarios que lo realizan durante la
semana o a diario no supera un 5%
14. • Variables cualitativas-factor: Gráficos de barras
-Variable utilizada: cerveza
En nuestro gráfico de barras se observa
Que la mayoría de nuestros encuestados
Nunca beben cerveza, y que solo una
minoría la consume a diário.
Solo unos 18 encuestados la toman alguna
vez y aquellos que la beben de 2 a 3
Veces en semana varían desde 9 a 20
Personas aproximadamente.
15. • Variables numéricas : Histograma de frecuencias
- Variable utilizada: horas de prácticas deportivas
En nuestro histograma apreciamos que
la mayoría de los encuestados no superan
las 5 horas de prácticas deportivas
semanales, siendo más frecuente una
práctica de 2h semanales (más de 150
personas), y lo menos frecuente,
superar las 10-15 horas de ejercicio físico
a la semana, lo cual solo lo realiza una
minoría casi inapreciable.
16. • Variables numéricas :Diagrama de cajas o bigote
- Variable utilizada: altura
Sacamos tres sujetos fuera de
nuestra gráfica ya que se
salen de nuestros valores y alterarían
la grafica.
- El valor maximo es 1’46 aprox. Mientras
Que el mínimo es 2m aprox.
-El 25% de los individuos presentan una
altura de 1’6m y la mediana se corresponde
Con 1’65m
-El 71% de los alumnos tienen una altura
De 1’75m.
Los valores están distribuidos proporcionalmente y
No muy dispersos entre 1’6 y 1’7m.