SlideShare una empresa de Scribd logo
1 de 19
R Commander:
Variables, tablas
de frecuencia y
gráficas de datos.
Realizado por Ismael Rodríguez
Godino
Subgrupo16 – Virgen del Rocío
Seminario 6 – Estadística y TICS
Como ya vimos en el seminario anterior, R Commander es una interfaz
estadística de gran uso y con capacidades estadísticas imnumerables.
En esta ocasión, vamos a realizar ejercicios más específicos de
estadística, con el fichero “activosensalud.RData”. Entre ellos:
Seleccionar dos variables cualitativas-factor del fichero, descríbelas en
tablas de frecuencias e interpreta al menos 3 aspectos en relación a la
distribución de las mismas.
Selecciona dos variables numéricas del fichero, y mediante resúmenes
numéricos describe e interpreta la distribución de las mismas.
Realizar al menos un gráfico de cada tipo con variables
adecuadamente seleccionadas del fichero, describe e interpreta la
distribución los mismos.
INTRODUCCIÓN.
Variables cualitativas y
tablas de frecuencia
1ª PARTE DEL SEMINARIO 6
1. Primeramente, vamos a abrir el programa R, que a su vez abrirá R
Commander. Tras esto, tenemos que especificar el directorio de trabajo.
En mi caso, he elegido la carpeta
“SEMINARIO 6 ESTADÍSTICA”
Pulsamos sobre “Fichero” y posteriormente
sobre “Cambiar directorio de trabajo”.
2. Antes de empezar a realizar las actividades, debemos cargar los datos. En este
caso, se trata de un archivo de R, por lo que para cargarlos: pulsamos sobre “datos” y
posteriormente sobre “Cargar conjunto de datos”.
Elegimos el archivo de R llamado
“activossalud.Rdata” y se cargarán los
datos.
3. Para la actividad, buscamos las
distribuciones de frecuencia de los
datos cualitativos. Para ello,
pulsamos en “Estadísticas”,
“resúmenes” y luego a “Distribución
de frecuencias”
Nos aparecerá una nueva ventana. En ella elegiremos dos variables, de las que queremos que nos
salgan sus tablas de frecuencia. En nuestro caso, hemos elegido “Botellón” y “Dulces” y
posteriormente, pulsamos en “ACEPTAR”.
Nos aparecerán las tablas de frecuencia de las variables elegidas y vamos a interpretar 3
aspectos de cada una.
BOTELLÓN DULCES
Los fines de semana
hacen botellón un
31% de los individuos.
31,72% de los
individuos toma
dulces menos de una
vez a la semana
(N=92)
51 Individuos del total
no hace botellón
nunca (17,89%)
20 de los individuos
toman dulces
diariamente (6,9%)
234 individuos del
total han hecho
botellón alguna vez
(82,1%)
Un 14,48% de los
individuos no toma
dulces nunca (N=42)
Variables cuantitativas
y tablas de frecuencias
2ª PARTE DEL SEMINARIO 6.
1. Primero vamos a buscar las tablas de frecuencias de los datos cuantitativos. Para
ellos, pulsamos en “Estadísticas” , “Resúmenes” y luego “resúmenes numéricos”.
Nos aparecerá una nueva ventana
y en ella aparecerán las variables
cuantitativas de la distribución.
Elegimos dos de ellas, en mi caso,
he elegido “altura” y “comunicación
familiar”.
2. Una vez elegidas las dos variables cuantitativas, nos aparecerá en R
Commander, las tablas de frecuencia de “Altura” y “Comunicaciónfamiliar”.
ALTURA COMUNICACIÓN FAMILIAR
• La mediana coincidiría con el 2º cuartil y sería
1,655m. Es una distribución casi asimétrica, la
media y la mediana tienen valores similares.
• La muestra presenta 291 individuos y sólo uno
no ha contestado. La media es 1,6670m y la
DT 0,08078. El rango intercuartílico sería 0,12;
el 1er cuartil sería 1,6 y el 3er cuartil sería
1,72.
• La mediana coincidiría con el 2º cuartil y es 7.
Es una distribución no asimétrica, pues la
mediana y la media no coinciden.
• La muestra presentan 147 individuos y 144 no
han contestado. La media es de 7,829932 y la
DT es de 2,82448722. El rango intercuartílico
sería 3; el 1er cuartil es 6 y el 3er cuartil es 9.
Tipos de gráficas y
variables
3ª PARTE DEL SEMINARIO 6
Gráfica de sectores.
Para realizar un gráfico de sectores,
pulsamos sobre “Gráficas” y luego sobre
“gráfica de sectores”.
Nos aparecerá la siguiente ventana:
En ella, elegiremos nuestra
variable, en mi caso “dulces”
y posteriormente podemos
poner título al gráfico. Tras
esto, pulsamos “aceptar”.
Una vez realizado lo anterior, nos aparecerá nuestro gráfico de sectores sobre la variable “Dulces”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
 Es muy característico el hecho de que una
parte importante de la muestra toma dulces
menos de una vez a la semana o de 1 a 2
veces por semanas.
 También llama la atención el hecho de que
una parte poco representativa nunca toma
dulces.
 Además, muy pocos individuos se dedican a
tomar dulces a diario.
Diagrama de barras.
Para realizar un diagrama de barras, pulsamos
sobre “Gráficas” y luego sobre “gráfica de
barras”. Luego nos aparecerá una nueva
ventana y en ella elegimos la variable a
representar en nuestro caso “cerveza”.
Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “cerveza”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
 Es muy característico el hecho de que
una parte muy representativa de la
población nunca bebe cerveza.
 Otro hecho importante es que sólo una
mínima parte de todos los individuos
bebe cerveza a diario.
Histograma.
Para realizar un histograma, primero pulsamos en
“gráficas” y luego en “histograma”.
Nos aparecerá una nieva ventana, donde
deberemos elegir una variable para el
histograma, en nuestro caso,
“medicalización”.
Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “medicalización”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
 Presenta una distribución asimétrica, un
poco sesgada a la izquierda.
 El porcentaje más alto de individuos se
halla con una altura entre 1,6 y 1,7m
(modas de la distribución).
 Muy pocos individuos miden menos de
1,5 m y también pocos individuos miden
más de 1,9m.
Diagrama de cajas y bigotes.
Para realizar un diagrama de cajas y bigotes,
pulsamos en “gráficas” y luego en “diagrama de
caja”.
Nos aparecerá una nueva ventana y en ella
deberemos elegir una variable de la
distribución, en nuestro caso, hemos
elegido el “peso”.
Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “peso”.
De nuestra distribución podemos sacar una
serie de conclusiones o interpretaciones:
 La mediana de la variable es 60; los
cuartiles 1 y 3, serían respectivamente 55
y 70 aproximadamente. EL Rango
intercuartílico sería 70-55=15 (Q3-Q1).
 Existen datos raros O ATÍPICOS que se
hallan fuera de la caja y de los bigotes,
existe una gran dispersión.
 El puntaje más bajo es 39 o 40
aproximadamente y el más alto 90.

Más contenido relacionado

Destacado

Destacado (6)

R commander práctica seminario 5
R commander práctica seminario 5R commander práctica seminario 5
R commander práctica seminario 5
 
Seminario 8 estadistica
Seminario 8 estadisticaSeminario 8 estadistica
Seminario 8 estadistica
 
Lectura crítica de texto científico
Lectura crítica de texto científicoLectura crítica de texto científico
Lectura crítica de texto científico
 
Estadística seminario II - búsqueda bibliográfica
Estadística seminario II - búsqueda bibliográficaEstadística seminario II - búsqueda bibliográfica
Estadística seminario II - búsqueda bibliográfica
 
Ejercicio estadística seminario 7
Ejercicio estadística seminario 7Ejercicio estadística seminario 7
Ejercicio estadística seminario 7
 
Búsqueda en base de datos -PubMed y Cinahl
Búsqueda en base de datos -PubMed y CinahlBúsqueda en base de datos -PubMed y Cinahl
Búsqueda en base de datos -PubMed y Cinahl
 

Similar a Seminario estadística 6 IRG.

Similar a Seminario estadística 6 IRG. (20)

Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Seminario 6 trabajo blog
Seminario 6 trabajo blogSeminario 6 trabajo blog
Seminario 6 trabajo blog
 
Variables, tablas de frecuencia y gráficas
Variables, tablas de frecuencia y gráficasVariables, tablas de frecuencia y gráficas
Variables, tablas de frecuencia y gráficas
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Seminario vi
Seminario viSeminario vi
Seminario vi
 
Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Presentacion seminario 6
Presentacion seminario 6Presentacion seminario 6
Presentacion seminario 6
 
Presentación tarea seminario 6
Presentación tarea seminario 6Presentación tarea seminario 6
Presentación tarea seminario 6
 
Seminario 6 (r commander)
Seminario 6 (r commander)Seminario 6 (r commander)
Seminario 6 (r commander)
 
Tarea 6
Tarea 6Tarea 6
Tarea 6
 
Tarea 6
Tarea 6Tarea 6
Tarea 6
 
Informe correspondiente a la estadística descriptiva
Informe correspondiente a la estadística descriptivaInforme correspondiente a la estadística descriptiva
Informe correspondiente a la estadística descriptiva
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Tareas seminario 6 María Blanco
Tareas seminario 6 María BlancoTareas seminario 6 María Blanco
Tareas seminario 6 María Blanco
 
Seminario VI
Seminario VISeminario VI
Seminario VI
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Aleyambon 170421073214
Aleyambon 170421073214Aleyambon 170421073214
Aleyambon 170421073214
 
Informe de estadística descriptiva.
Informe de estadística descriptiva.Informe de estadística descriptiva.
Informe de estadística descriptiva.
 

Seminario estadística 6 IRG.

  • 1. R Commander: Variables, tablas de frecuencia y gráficas de datos. Realizado por Ismael Rodríguez Godino Subgrupo16 – Virgen del Rocío Seminario 6 – Estadística y TICS
  • 2. Como ya vimos en el seminario anterior, R Commander es una interfaz estadística de gran uso y con capacidades estadísticas imnumerables. En esta ocasión, vamos a realizar ejercicios más específicos de estadística, con el fichero “activosensalud.RData”. Entre ellos: Seleccionar dos variables cualitativas-factor del fichero, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas. Selecciona dos variables numéricas del fichero, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas. Realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución los mismos. INTRODUCCIÓN.
  • 3. Variables cualitativas y tablas de frecuencia 1ª PARTE DEL SEMINARIO 6
  • 4. 1. Primeramente, vamos a abrir el programa R, que a su vez abrirá R Commander. Tras esto, tenemos que especificar el directorio de trabajo. En mi caso, he elegido la carpeta “SEMINARIO 6 ESTADÍSTICA” Pulsamos sobre “Fichero” y posteriormente sobre “Cambiar directorio de trabajo”.
  • 5. 2. Antes de empezar a realizar las actividades, debemos cargar los datos. En este caso, se trata de un archivo de R, por lo que para cargarlos: pulsamos sobre “datos” y posteriormente sobre “Cargar conjunto de datos”. Elegimos el archivo de R llamado “activossalud.Rdata” y se cargarán los datos.
  • 6. 3. Para la actividad, buscamos las distribuciones de frecuencia de los datos cualitativos. Para ello, pulsamos en “Estadísticas”, “resúmenes” y luego a “Distribución de frecuencias” Nos aparecerá una nueva ventana. En ella elegiremos dos variables, de las que queremos que nos salgan sus tablas de frecuencia. En nuestro caso, hemos elegido “Botellón” y “Dulces” y posteriormente, pulsamos en “ACEPTAR”.
  • 7. Nos aparecerán las tablas de frecuencia de las variables elegidas y vamos a interpretar 3 aspectos de cada una. BOTELLÓN DULCES Los fines de semana hacen botellón un 31% de los individuos. 31,72% de los individuos toma dulces menos de una vez a la semana (N=92) 51 Individuos del total no hace botellón nunca (17,89%) 20 de los individuos toman dulces diariamente (6,9%) 234 individuos del total han hecho botellón alguna vez (82,1%) Un 14,48% de los individuos no toma dulces nunca (N=42)
  • 8. Variables cuantitativas y tablas de frecuencias 2ª PARTE DEL SEMINARIO 6.
  • 9. 1. Primero vamos a buscar las tablas de frecuencias de los datos cuantitativos. Para ellos, pulsamos en “Estadísticas” , “Resúmenes” y luego “resúmenes numéricos”. Nos aparecerá una nueva ventana y en ella aparecerán las variables cuantitativas de la distribución. Elegimos dos de ellas, en mi caso, he elegido “altura” y “comunicación familiar”.
  • 10. 2. Una vez elegidas las dos variables cuantitativas, nos aparecerá en R Commander, las tablas de frecuencia de “Altura” y “Comunicaciónfamiliar”. ALTURA COMUNICACIÓN FAMILIAR • La mediana coincidiría con el 2º cuartil y sería 1,655m. Es una distribución casi asimétrica, la media y la mediana tienen valores similares. • La muestra presenta 291 individuos y sólo uno no ha contestado. La media es 1,6670m y la DT 0,08078. El rango intercuartílico sería 0,12; el 1er cuartil sería 1,6 y el 3er cuartil sería 1,72. • La mediana coincidiría con el 2º cuartil y es 7. Es una distribución no asimétrica, pues la mediana y la media no coinciden. • La muestra presentan 147 individuos y 144 no han contestado. La media es de 7,829932 y la DT es de 2,82448722. El rango intercuartílico sería 3; el 1er cuartil es 6 y el 3er cuartil es 9.
  • 11. Tipos de gráficas y variables 3ª PARTE DEL SEMINARIO 6
  • 12. Gráfica de sectores. Para realizar un gráfico de sectores, pulsamos sobre “Gráficas” y luego sobre “gráfica de sectores”. Nos aparecerá la siguiente ventana: En ella, elegiremos nuestra variable, en mi caso “dulces” y posteriormente podemos poner título al gráfico. Tras esto, pulsamos “aceptar”.
  • 13. Una vez realizado lo anterior, nos aparecerá nuestro gráfico de sectores sobre la variable “Dulces”. De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:  Es muy característico el hecho de que una parte importante de la muestra toma dulces menos de una vez a la semana o de 1 a 2 veces por semanas.  También llama la atención el hecho de que una parte poco representativa nunca toma dulces.  Además, muy pocos individuos se dedican a tomar dulces a diario.
  • 14. Diagrama de barras. Para realizar un diagrama de barras, pulsamos sobre “Gráficas” y luego sobre “gráfica de barras”. Luego nos aparecerá una nueva ventana y en ella elegimos la variable a representar en nuestro caso “cerveza”.
  • 15. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “cerveza”. De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:  Es muy característico el hecho de que una parte muy representativa de la población nunca bebe cerveza.  Otro hecho importante es que sólo una mínima parte de todos los individuos bebe cerveza a diario.
  • 16. Histograma. Para realizar un histograma, primero pulsamos en “gráficas” y luego en “histograma”. Nos aparecerá una nieva ventana, donde deberemos elegir una variable para el histograma, en nuestro caso, “medicalización”.
  • 17. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “medicalización”. De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:  Presenta una distribución asimétrica, un poco sesgada a la izquierda.  El porcentaje más alto de individuos se halla con una altura entre 1,6 y 1,7m (modas de la distribución).  Muy pocos individuos miden menos de 1,5 m y también pocos individuos miden más de 1,9m.
  • 18. Diagrama de cajas y bigotes. Para realizar un diagrama de cajas y bigotes, pulsamos en “gráficas” y luego en “diagrama de caja”. Nos aparecerá una nueva ventana y en ella deberemos elegir una variable de la distribución, en nuestro caso, hemos elegido el “peso”.
  • 19. Una vez realizado lo anterior, nos aparecerá nuestro gráfico sobre la variable “peso”. De nuestra distribución podemos sacar una serie de conclusiones o interpretaciones:  La mediana de la variable es 60; los cuartiles 1 y 3, serían respectivamente 55 y 70 aproximadamente. EL Rango intercuartílico sería 70-55=15 (Q3-Q1).  Existen datos raros O ATÍPICOS que se hallan fuera de la caja y de los bigotes, existe una gran dispersión.  El puntaje más bajo es 39 o 40 aproximadamente y el más alto 90.