2. Como ya vimos en el seminario anterior, R Commander es una interfaz
estadística de gran uso y con capacidades estadísticas imnumerables.
En esta ocasión, vamos a realizar ejercicios más específicos de
estadística, con el fichero “activosensalud.RData”. Entre ellos:
Seleccionar dos variables cualitativas-factor del fichero, descríbelas en
tablas de frecuencias e interpreta al menos 3 aspectos en relación a la
distribución de las mismas.
Selecciona dos variables numéricas del fichero, y mediante resúmenes
numéricos describe e interpreta la distribución de las mismas.
Realizar al menos un gráfico de cada tipo con variables
adecuadamente seleccionadas del fichero, describe e interpreta la
distribución los mismos.
INTRODUCCIÓN.
4. 1. Primeramente, vamos a abrir el programa R, que a su vez abrirá R
Commander. Tras esto, tenemos que especificar el directorio de trabajo.
En mi caso, he elegido la carpeta
“SEMINARIO 6 ESTADÍSTICA”
Pulsamos sobre “Fichero” y posteriormente
sobre “Cambiar directorio de trabajo”.
5. 2. Antes de empezar a realizar las actividades, debemos cargar los datos. En este
caso, se trata de un archivo de R, por lo que para cargarlos: pulsamos sobre “datos” y
posteriormente sobre “Cargar conjunto de datos”.
Elegimos el archivo de R llamado
“activossalud.Rdata” y se cargarán los
datos.
6. 3. Para la actividad, buscamos las
distribuciones de frecuencia de los
datos cualitativos. Para ello,
pulsamos en “Estadísticas”,
“resúmenes” y luego a “Distribución
de frecuencias”
Nos aparecerá una nueva ventana. En ella elegiremos dos variables, de las que queremos que nos
salgan sus tablas de frecuencia. En nuestro caso, hemos elegido “Botellón” y “Dulces” y
posteriormente, pulsamos en “ACEPTAR”.
7. Nos aparecerán las tablas de frecuencia de las variables elegidas y vamos a interpretar 3
aspectos de cada una.
BOTELLÓN DULCES
Los fines de semana
hacen botellón un
31% de los individuos.
31,72% de los
individuos toma
dulces menos de una
vez a la semana
(N=92)
51 Individuos del total
no hace botellón
nunca (17,89%)
20 de los individuos
toman dulces
diariamente (6,9%)
234 individuos del
total han hecho
botellón alguna vez
(82,1%)
Un 14,48% de los
individuos no toma
dulces nunca (N=42)
9. 1. Primero vamos a buscar las tablas de frecuencias de los datos cuantitativos. Para
ellos, pulsamos en “Estadísticas” , “Resúmenes” y luego “resúmenes numéricos”.
Nos aparecerá una nueva ventana
y en ella aparecerán las variables
cuantitativas de la distribución.
Elegimos dos de ellas, en mi caso,
he elegido “altura” y “comunicación
familiar”.
10. 2. Una vez elegidas las dos variables cuantitativas, nos aparecerá en R
Commander, las tablas de frecuencia de “Altura” y “Comunicaciónfamiliar”.
ALTURA COMUNICACIÓN FAMILIAR
• La mediana coincidiría con el 2º cuartil y sería
1,655m. Es una distribución casi asimétrica, la
media y la mediana tienen valores similares.
• La muestra presenta 291 individuos y sólo uno
no ha contestado. La media es 1,6670m y la
DT 0,08078. El rango intercuartílico sería 0,12;
el 1er cuartil sería 1,6 y el 3er cuartil sería
1,72.
• La mediana coincidiría con el 2º cuartil y es 7.
Es una distribución no asimétrica, pues la
mediana y la media no coinciden.
• La muestra presentan 147 individuos y 144 no
han contestado. La media es de 7,829932 y la
DT es de 2,82448722. El rango intercuartílico
sería 3; el 1er cuartil es 6 y el 3er cuartil es 9.
12. Gráfica de sectores.
Para realizar un gráfico de sectores,
pulsamos sobre “Gráficas” y luego sobre
“gráfica de sectores”.
Nos aparecerá la siguiente ventana:
En ella, elegiremos nuestra
variable, en mi caso “dulces”
y posteriormente podemos
poner título al gráfico. Tras
esto, pulsamos “aceptar”.
13. Una vez realizado lo anterior, nos aparecerá nuestro gráfico de sectores sobre la variable “Dulces”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
Es muy característico el hecho de que una
parte importante de la muestra toma dulces
menos de una vez a la semana o de 1 a 2
veces por semanas.
También llama la atención el hecho de que
una parte poco representativa nunca toma
dulces.
Además, muy pocos individuos se dedican a
tomar dulces a diario.
14. Diagrama de barras.
Para realizar un diagrama de barras, pulsamos
sobre “Gráficas” y luego sobre “gráfica de
barras”. Luego nos aparecerá una nueva
ventana y en ella elegimos la variable a
representar en nuestro caso “cerveza”.
15. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “cerveza”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
Es muy característico el hecho de que
una parte muy representativa de la
población nunca bebe cerveza.
Otro hecho importante es que sólo una
mínima parte de todos los individuos
bebe cerveza a diario.
16. Histograma.
Para realizar un histograma, primero pulsamos en
“gráficas” y luego en “histograma”.
Nos aparecerá una nieva ventana, donde
deberemos elegir una variable para el
histograma, en nuestro caso,
“medicalización”.
17. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “medicalización”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
Presenta una distribución asimétrica, un
poco sesgada a la izquierda.
El porcentaje más alto de individuos se
halla con una altura entre 1,6 y 1,7m
(modas de la distribución).
Muy pocos individuos miden menos de
1,5 m y también pocos individuos miden
más de 1,9m.
18. Diagrama de cajas y bigotes.
Para realizar un diagrama de cajas y bigotes,
pulsamos en “gráficas” y luego en “diagrama de
caja”.
Nos aparecerá una nueva ventana y en ella
deberemos elegir una variable de la
distribución, en nuestro caso, hemos
elegido el “peso”.
19. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “peso”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
La mediana de la variable es 60; los
cuartiles 1 y 3, serían respectivamente 55
y 70 aproximadamente. EL Rango
intercuartílico sería 70-55=15 (Q3-Q1).
Existen datos raros O ATÍPICOS que se
hallan fuera de la caja y de los bigotes,
existe una gran dispersión.
El puntaje más bajo es 39 o 40
aproximadamente y el más alto 90.