Este documento presenta los resultados de tres ejercicios realizados con el conjunto de datos "activossalud". El primer ejercicio describe las distribuciones de frecuencias de dos variables cualitativas. El segundo ejercicio resume numéricamente dos variables numéricas. El tercer ejercicio incluye gráficos de barras y sectores para variables cualitativas, así como histogramas y diagramas de cajas para variables numéricas.
Broker Excuse, Fully furnished office space with workstations , cabins , conference room ,meeting room , reception , network and voice cabling done,Intercom facility, AC,Cafeteria, Pantry,Lift, Power backup ,Parking, Security and other amenities are there.
We also have few semi-Furnished and UN-Furnished options from 2000 sq ft to 25000 sq ft where owner is ready to furnish as per client requirement in other localities.
Suitable for IT Companies , Software Companies , BPO, KPO , MNC . It can be also re-modify as per client requirement . For more options visit our website or feel free to call us.@8285122122 / 8285133133 / 9891500527 / 9999568224
2. Primer ejercicio
1º) Cambiamos directorio de trabajo, y a continuacion cargar datos
“activossalud”. (291 fila y 38 columnas)
2º) Seleccionamos dos variables cualitativas-factor del fichero.
Seleccionamos distribución de frecuencias.
3. 3º) Describo en tablas de frecuencias e interpreto al menos
3 aspectos en relación a la distribución de las mismas.
Botellón:
• El 31.58% ( es decir 90 individuos)
realizan botellon solo los fines de
semana
• 2 o 3 veces al mes seria el 25,61%
(N=73)
• Y destaca que 51 individuos el
(17,89%) nunca
En cuanto al consumo de cerveza:
• Los fines de semana 60
(20,76%)
• A diario solo el 1,38% (4)
• Nunca 107 individuos (37.02%)
5. 2º) Mediante resúmenes numéricos describimos e
interpretamos la distribución de las mismas.
Variable “comunicacionfamiliar”
Media: 7.829932
Desviación típica: 2.824487
La mediana coincide con el 2º cuartil (dejando a su
izqda el 50%), es por tanto: 7
Concluimos por tanto que la variable es simétrica, ya
que la mediana y la media presentan valores muy
cercanos
Variable “comunicacionpares”
Media: 5.393728
Desviación típica: 1.585014
La mediana (2ºcuartil): 5
Concluimos también que esta variable es
simétrica
6. Tercer ejercicio
• Debemos realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describimos e interpretamos la
distribución los mismos.
7. Comenzamos con variables cualitativas – factor:
1. Gráficos Gráficos de sectores
a diario
solo los fines de semana2 o 3 veces a la semana
2 o 3 veces al mes
Algunas veces anual
Nunca
botellon
(Tenemos en cuenta que los
gráficos de sectores no son útiles
cuando la variable tiene
múltiples categorías)
- Llama la atención las personas
que hacen botellón (mayoría)
Y el mínimo que sería a diario
- El porcentaje de los que beben
algunas veces , 2 o 3 veces al mes
y los que nunca son similares.
> with(Datos, pie(table(botellon), labels=levels(botellon),
xlab="", ylab="", main="botellon",
col=rainbow_hcl(length(levels(botellon)))))
8. 2. Gráficos Gráficos de barras
El eje de las
ordenadas (Y,
vertical) informa de
las frecuencias
absolutas.
- Destaca el
porcentaje de
personas que nunca
beben cerveza
(siendo el mayor).
- A diario sería el
menor porcentaje
diario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Frequency
020406080100
En eje de las abscisas (X/ horizontal) obtenemos los valores de las 6 variables:
diario, fines de semana, 2 o 3 veces semana, 2 o 3 veces mes, alguna vez,
nunca.
> with(Datos, Barplot(cerveza, xlab="cerveza", ylab="Frequency"))
9. (También podemos cambiar la gama de colores)
diario fines de semana 2 o 3 veces semana 2 o 3 veces mes alguna vez nunca
cerveza
Frequency
020406080100
> barplot(table(Datos$cerveza),
xlab="cerveza",ylab="Frequency",col=c("red","blue","green","chocolate","y
ellow","grey"))
10. 3. En cuanto a las variables numéricas:
Gráficas Histograma de frecuencias
Rectángulos unidos cuya área
es proporcional a la frecuencia
absoluta del intervalo
correspondiente
- La mayor frecuencia es en
los individuos con un peso
de entre 50 y 60
- Hay un mínimo porcentaje
entre los individuos de
> ó =100 y de <40.
peso
frequency
40 60 80 100 120
020406080100
11. 4. Gráficas Diagrama de cajas (Boxplot)
46810
comunicacionpares
97
103
- Los casos atípicos son observaciones con valores
extremos
- Diferentes de las restantes observaciones.
- A veces, pueden convertirse en observaciones
influyentes que distorsionan los resultados (relaciones
entre variables, normalidad, etc.)