Marina Flores Salazar.
Grupo 13.
Virgen del Rocío.

En el seminario 6 vamos a volver a trabajar con el
programa Rcommander.
Vamos a realizar una análisis exploratorio de datos y
también a realizar tablas de frecuencias, resúmenes
numéricos y gráficos en el programa estadístico.
Introducción.

Paso 1: importar la base de datos y como está en el
formato de R hay que hacerlo de la siguiente manera:
datos cargar conjunto de datos activossalud2.

En el primer ejercicio vamos a seleccionar dos variables cualitativas-
factor del fichero “activossalud.RData”, descríbelas en tablas de
frecuencias e interpreta al menos 3 aspectos en relación a la
distribución de las mismas. Hay que seguir los siguientes pasos:
estadísticos resúmenes distribución de frecuencia.
Las variables que hemos
elegido son “fruta” y
“cerveza”
A partir de esta tabla podemos sacar los siguientes datos:
• El tamaño de la muestra es de 290.
• El 89% come algo de fruta a lo largo de la semana y de este
porcentaje come fruta a diario el 32%.
• Todos los datos están disponibles.
• El 22% o no come fruta o come menos que una vez por
semana.
• De los 290 individuos, el 55% que serían 159 comen fruta 3 o
más veces por semana.
FRUTA
CERVEZA
A partir de esta tabla podemos sacar los siguientes datos:
• 107 personas nunca han tomado cerveza que sería el 37%.
• El 18% lo han probado alguna vez y abarca a 51 personas.
• El número de personas que consume cerveza 2 o 3 veces al mes es de 40 cuyo porcentaje
sería del 14%.
• El porcentaje de 9% toman cervezas 2 o 3 veces a la semanas y correspondería con 27
personas.
• 60 personas consumen cerveza los fines de semana. Correspondería el 21%.
• El número de personas que consumen a diario es de 4, siendo el porcentaje de 1,38%.

En el segundo ejercicio vamos a seleccionar dos variables numéricas del
fichero “activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas. Hay que seguir los
siguientes pasos: estadísticos resúmenesresúmenes numéricos
elección de variable.
PESO.
A partir de estos datos podemos saber:
• La variable peso tiene una media de 62.75571 y su desviación
típica es de 12.65981.
• Existen 16 casos no disponibles.
• La mediana seria 60 y coincide con el segundo cuartil.
• Esta variable es simétrica ya que la media y la mediana tienen
valores similares.
ALTURA.
A partir de estos datos podemos saber:
• La variable altura tiene una media de 1.667 y su desviación típica
es de 0.08078101.
• Solo existe un caso no disponible.
• La mediana es 1.655 y coincide con el segundo cuartil.
• Esta variable es simétrica ya que la media y la mediana son
semejantes.

En el tercer ejercicio vamos a realizar un gráfico de cada tipo
con variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución los
mismos. Para las variables cualitativas tenemos el g´rafico de
barras y el gráfico de sectores. Hay que seguir los siguientes
pasos: grafica gráfica de barras/sectores.
Podemos observar que solo una
minoría toma combinados todos los
días.
Como se puede observar
en el diagrama la gran
mayoría no ha
consumido nunca hachís
y que el número de
personas que consumen
2 o 3 veces al mes es
practicamente el mismo
que el conjunto de los
que consumen 2 o 3
veces a la semana, los
fines de semana y a
diario.
Seminario 6

Seminario 6

  • 1.
    Marina Flores Salazar. Grupo13. Virgen del Rocío.
  • 2.
     En el seminario6 vamos a volver a trabajar con el programa Rcommander. Vamos a realizar una análisis exploratorio de datos y también a realizar tablas de frecuencias, resúmenes numéricos y gráficos en el programa estadístico. Introducción.
  • 3.
     Paso 1: importarla base de datos y como está en el formato de R hay que hacerlo de la siguiente manera: datos cargar conjunto de datos activossalud2.
  • 4.
     En el primerejercicio vamos a seleccionar dos variables cualitativas- factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas. Hay que seguir los siguientes pasos: estadísticos resúmenes distribución de frecuencia. Las variables que hemos elegido son “fruta” y “cerveza”
  • 5.
    A partir deesta tabla podemos sacar los siguientes datos: • El tamaño de la muestra es de 290. • El 89% come algo de fruta a lo largo de la semana y de este porcentaje come fruta a diario el 32%. • Todos los datos están disponibles. • El 22% o no come fruta o come menos que una vez por semana. • De los 290 individuos, el 55% que serían 159 comen fruta 3 o más veces por semana. FRUTA
  • 6.
    CERVEZA A partir deesta tabla podemos sacar los siguientes datos: • 107 personas nunca han tomado cerveza que sería el 37%. • El 18% lo han probado alguna vez y abarca a 51 personas. • El número de personas que consume cerveza 2 o 3 veces al mes es de 40 cuyo porcentaje sería del 14%. • El porcentaje de 9% toman cervezas 2 o 3 veces a la semanas y correspondería con 27 personas. • 60 personas consumen cerveza los fines de semana. Correspondería el 21%. • El número de personas que consumen a diario es de 4, siendo el porcentaje de 1,38%.
  • 7.
     En el segundoejercicio vamos a seleccionar dos variables numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas. Hay que seguir los siguientes pasos: estadísticos resúmenesresúmenes numéricos elección de variable.
  • 8.
    PESO. A partir deestos datos podemos saber: • La variable peso tiene una media de 62.75571 y su desviación típica es de 12.65981. • Existen 16 casos no disponibles. • La mediana seria 60 y coincide con el segundo cuartil. • Esta variable es simétrica ya que la media y la mediana tienen valores similares.
  • 9.
    ALTURA. A partir deestos datos podemos saber: • La variable altura tiene una media de 1.667 y su desviación típica es de 0.08078101. • Solo existe un caso no disponible. • La mediana es 1.655 y coincide con el segundo cuartil. • Esta variable es simétrica ya que la media y la mediana son semejantes.
  • 10.
     En el tercerejercicio vamos a realizar un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos. Para las variables cualitativas tenemos el g´rafico de barras y el gráfico de sectores. Hay que seguir los siguientes pasos: grafica gráfica de barras/sectores.
  • 11.
    Podemos observar quesolo una minoría toma combinados todos los días.
  • 12.
    Como se puedeobservar en el diagrama la gran mayoría no ha consumido nunca hachís y que el número de personas que consumen 2 o 3 veces al mes es practicamente el mismo que el conjunto de los que consumen 2 o 3 veces a la semana, los fines de semana y a diario.