TAREA SEMINARIO
Selecciona dos variables cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de
frecuencias e interpreta al menos 3 aspectos en
relación a la distribución de las mismas.
A
Primero cargamos el
conjunto de datos en
formato de R en R
Commander:
Para ver las tablas
de frecuencia de las
distintas variables:
Seleccionamos las
variables cualitativas
de las cuales
queremos saber su
frecuencia. En este
caso, yo he elegido las
variables
“estudiosmadre” y
“estudiospadre”.
En la ventana de debajo de R Commander podemos visualizar las
respectivas tablas:
Estudios de la madre
Estudios del padre
En estas tablas se aprecia que
aparecen dos tipos de
frecuencias: absolutas (primera
línea) y porcentajes (segunda
línea).
Comparando las dos tablas se
observa que:
- La mayoría de progenitores o
bien tienen únicamente estudios
primarios o no los tienen.
- Hay un menor porcentaje de
mujeres en cada ámbito, lo que
demuestra el menor grado de
educación en las mujeres.
- En torno al 50% de los
progenitores poseen el titulo de
Bachiller o universitario.
Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas.
B
Para ver los resúmenes
numéricos de las
distintas variables:
A continuación elegimos las
variables numéricas que de las
cuales queramos sus
resúmenes numéricos. En este
caso yo he elegido “peso” y
“horapracticadeportiva”.
Debemos asegurarnos de que en el
resumen numérico aparece lo que
nos interesa:
El resumen de las dos
variables elegidas es el
siguiente:
La desviación típica de la primera tabla es 3.1 y la de la segunda es 12.66.
De los 291 participantes de la muestra, hay 1 dato no disponible en cuanto a la hora de
practica deportiva y 16 datos no disponibles en cuanto al peso.
La media de horas de practica deportiva de
las personas de la muestra es de 2.4 horas.
En cuanto al peso, la media de la muestra
es de 62.75 kg.
El 50% corresponde a la mediana por lo que en la primera tabla la mediana es 2
mientras que en la del peso, la mediana es 60.
C Debes realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la
distribución los mismos.
En R podemos crear
diferentes gráficos.
Cada variable está
mejor representada
por un tipo de gráfico
en concreto.
Gráfico de sectores
Grafico de barras
Histograma de
frecuencias
Histograma de
frecuencias con curva
normal
Diagrama de cajas
Variables
cualitativas
Variables
cualitativas
Variables
numéricas
Variables
numéricas
Variables
numéricas
GRÁFICA DE SECTORES
Elegimos una variable
cualitativa como por ejemplo
“verduras”.
Se observa que la mayor parte de los
participantes de la investigación
consumen verdura varias veces a las
semana. Muy pocos son lo que nunca o
casi nunca la toman, lo que es algo
alentador en cuanto a la calidad de la
alimentación de la muestra. A pesar de
esto, teniendo en cuenta la
importancia del consumo diario de
verduras, el numero de personas que lo
cumples es muy bajo.
GRÁFICA DE BARRAS
Elegimos una variable cualitativa como
por ejemplo “fruta”.
En cuanto al consumo de fruta destaca que la mayoría de las
personas encuestadas consumen fruta varias veces a la
semana destacando sobre todo un mayor numero de
personas que lo hace a diario.
En contraste con el consumo de verduras, podríamos afirmar
que fruta es consumida con mayor frecuencia.
HISTOGRAMA DE FRECUENCIAS
Elegimos una variable numérica como por
ejemplo “horapracticadeportiva”.
En este gráfico se muestra
claramente que la mayor parte de
las personas o bien no realiza
deporte a lo largo de la semana o
bien pocas horas.
A medida que aumenta el numero de
horas, la cantidad de personas que
realiza deporte disminuye
considerablemente.
DIAGRAMA DE CAJAS
Elegimos una variable numérica
como por ejemplo “altura”.
Observando el diagrama
podemos conocer que el
50% de la muestra tiene
una altura entre 1.6 y 1.72
metros. Esto lo sabemos
porque el interior de la
caja representa el 50% de
la muestra.
La mediana es ≈ 1.65.
Hay tres valores atípicos u
outliers, es decir, valores
que se salen del máximo en
este caso. El mayor de
estos valores es la altura
de 2 metros.

Tarea 6

  • 1.
  • 2.
    Selecciona dos variablescualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas. A Primero cargamos el conjunto de datos en formato de R en R Commander:
  • 3.
    Para ver lastablas de frecuencia de las distintas variables: Seleccionamos las variables cualitativas de las cuales queremos saber su frecuencia. En este caso, yo he elegido las variables “estudiosmadre” y “estudiospadre”.
  • 4.
    En la ventanade debajo de R Commander podemos visualizar las respectivas tablas: Estudios de la madre Estudios del padre En estas tablas se aprecia que aparecen dos tipos de frecuencias: absolutas (primera línea) y porcentajes (segunda línea). Comparando las dos tablas se observa que: - La mayoría de progenitores o bien tienen únicamente estudios primarios o no los tienen. - Hay un menor porcentaje de mujeres en cada ámbito, lo que demuestra el menor grado de educación en las mujeres. - En torno al 50% de los progenitores poseen el titulo de Bachiller o universitario.
  • 5.
    Selecciona dos variablesnuméricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas. B Para ver los resúmenes numéricos de las distintas variables: A continuación elegimos las variables numéricas que de las cuales queramos sus resúmenes numéricos. En este caso yo he elegido “peso” y “horapracticadeportiva”.
  • 6.
    Debemos asegurarnos deque en el resumen numérico aparece lo que nos interesa: El resumen de las dos variables elegidas es el siguiente: La desviación típica de la primera tabla es 3.1 y la de la segunda es 12.66. De los 291 participantes de la muestra, hay 1 dato no disponible en cuanto a la hora de practica deportiva y 16 datos no disponibles en cuanto al peso. La media de horas de practica deportiva de las personas de la muestra es de 2.4 horas. En cuanto al peso, la media de la muestra es de 62.75 kg. El 50% corresponde a la mediana por lo que en la primera tabla la mediana es 2 mientras que en la del peso, la mediana es 60.
  • 7.
    C Debes realizaral menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos. En R podemos crear diferentes gráficos. Cada variable está mejor representada por un tipo de gráfico en concreto. Gráfico de sectores Grafico de barras Histograma de frecuencias Histograma de frecuencias con curva normal Diagrama de cajas Variables cualitativas Variables cualitativas Variables numéricas Variables numéricas Variables numéricas
  • 8.
    GRÁFICA DE SECTORES Elegimosuna variable cualitativa como por ejemplo “verduras”. Se observa que la mayor parte de los participantes de la investigación consumen verdura varias veces a las semana. Muy pocos son lo que nunca o casi nunca la toman, lo que es algo alentador en cuanto a la calidad de la alimentación de la muestra. A pesar de esto, teniendo en cuenta la importancia del consumo diario de verduras, el numero de personas que lo cumples es muy bajo.
  • 9.
    GRÁFICA DE BARRAS Elegimosuna variable cualitativa como por ejemplo “fruta”.
  • 10.
    En cuanto alconsumo de fruta destaca que la mayoría de las personas encuestadas consumen fruta varias veces a la semana destacando sobre todo un mayor numero de personas que lo hace a diario. En contraste con el consumo de verduras, podríamos afirmar que fruta es consumida con mayor frecuencia.
  • 11.
    HISTOGRAMA DE FRECUENCIAS Elegimosuna variable numérica como por ejemplo “horapracticadeportiva”. En este gráfico se muestra claramente que la mayor parte de las personas o bien no realiza deporte a lo largo de la semana o bien pocas horas. A medida que aumenta el numero de horas, la cantidad de personas que realiza deporte disminuye considerablemente.
  • 12.
    DIAGRAMA DE CAJAS Elegimosuna variable numérica como por ejemplo “altura”.
  • 13.
    Observando el diagrama podemosconocer que el 50% de la muestra tiene una altura entre 1.6 y 1.72 metros. Esto lo sabemos porque el interior de la caja representa el 50% de la muestra. La mediana es ≈ 1.65. Hay tres valores atípicos u outliers, es decir, valores que se salen del máximo en este caso. El mayor de estos valores es la altura de 2 metros.