2. Primer ejercicio
1º) Cambiamos directorio de trabajo, y a continuacion cargar datos
“activossalud”. (291 fila y 38 columnas)
2º) Seleccionamos dos variables cualitativas-factor del fichero.
Seleccionamos distribución de frecuencias.
3. 3º) Describo en tablas de frecuencias e interpreto al menos
3 aspectos en relación a la distribución de las mismas.
Botellón:
• El 31.58% ( es decir 90 individuos)
realizan botellon solo los fines de
semana
• 2 o 3 veces al mes seria el 25,61%
(N=73)
• Y destaca que 51 individuos el
(17,89%) nunca
En cuanto al consumo de cerveza:
• Los fines de semana 60
(20,76%)
• A diario solo el 1,38% (4)
• Nunca 107 individuos (37.02%)
5. 2º) Mediante resúmenes numéricos describimos e
interpretamos la distribución de las mismas.
Variable “comunicacionfamiliar”
Media: 7.829932
Desviación típica: 2.824487
La mediana coincide con el 2º cuartil (dejando a su
izqda el 50%), es por tanto: 7
Concluimos por tanto que la variable es simétrica, ya
que la mediana y la media presentan valores muy
cercanos
Variable “comunicacionpares”
Media: 5.393728
Desviación típica: 1.585014
La mediana (2ºcuartil): 5
Concluimos también que esta variable es
simétrica
6. Tercer ejercicio
• Debemos realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describimos e interpretamos la
distribución los mismos.
7. Comenzamos con variables cualitativas – factor:
1. Gráficos Gráficos de sectores
a diario
solo los fines de semana2 o 3 veces a la semana
2 o 3 veces al mes
Algunas veces anual
Nunca
botellon
(Tenemos en cuenta que los
gráficos de sectores no son útiles
cuando la variable tiene
múltiples categorías)
- Llama la atención las personas
que hacen botellón (mayoría)
Y el mínimo que sería a diario
- El porcentaje de los que beben
algunas veces , 2 o 3 veces al mes
y los que nunca son similares.
> with(Datos, pie(table(botellon), labels=levels(botellon),
xlab="", ylab="", main="botellon",
col=rainbow_hcl(length(levels(botellon)))))
8. 2. Gráficos Gráficos de barras
El eje de las
ordenadas (Y,
vertical) informa de
las frecuencias
absolutas.
- Destaca el
porcentaje de
personas que nunca
beben cerveza
(siendo el mayor).
- A diario sería el
menor porcentaje
diario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Frequency
020406080100
En eje de las abscisas (X/ horizontal) obtenemos los valores de las 6 variables:
diario, fines de semana, 2 o 3 veces semana, 2 o 3 veces mes, alguna vez,
nunca.
> with(Datos, Barplot(cerveza, xlab="cerveza", ylab="Frequency"))
9. (También podemos cambiar la gama de colores)
diario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Frequency
020406080100
> barplot(table(Datos$cerveza),
xlab="cerveza",ylab="Frequency",col=c("red","blue","green","chocolate","y
ellow","grey"))
10. 3. En cuanto a las variables numéricas:
Gráficas Histograma de frecuencias
Rectángulos unidos cuya área
es proporcional a la frecuencia
absoluta del intervalo
correspondiente
- La mayor frecuencia es en
los individuos con un peso
de entre 50 y 60
- Hay un mínimo porcentaje
entre los individuos de
> ó =100 y de <40.
peso
frequency
40 60 80 100 120
020406080100
11. 4. Gráficas Diagrama de cajas (Boxplot)
46810
comunicacionpares
97
103
- Los casos atípicos son observaciones con valores
extremos
- Diferentes de las restantes observaciones.
- A veces, pueden convertirse en observaciones
influyentes que distorsionan los resultados (relaciones
entre variables, normalidad, etc.)