2. El ejercicio que vamos a realizar es el siguiente:
• Selecciona dos variables cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de frecuencias e
interpreta al menos 3 aspectos en relación a la distribución
de las mismas.
Para ello abrimos esta base de datos previamente descargada
en el “Rcommander”.
3. Para crear una tabla de frecuencias con cada una de las variables
cualitativas que vamos a escoger debemos seguir estos pasos:
1. Seleccionar la opción “estadísticos”.
2. Clicar en “Resúmenes” -> “distribución de frecuencia”
3. Seleccionar las dos variables que queremos analizar, en este caso
estudiaremos “dulces” y “combinados”.
4. Análisis de resultados obtenidos
4. Variable “Dulces”:
• Podemos observar que de las personas que han respondido estas
preguntas, el 31,72% ha contestado que consumen dulces “menos de
una vez en semana”. Esto significa que la mayoría de encuestados se
encuentra en este apartado.
• El siguiente porcentaje mayoritario es el de aquellas personas que han
respondido que comen dulces “1 o 2 veces en semana”, que son un
30% del total.
• Siendo unicamente el 6,90% de personas las han declarado que toman
dulces “a diario”.
• El porcentaje de personas que “nunca” toman dulces es bajo, siendo un
14,48% tan sólo.
5. Variable “combinados”:
• Podemos observar que el mayor porcentaje de respuesta de la ingesta
de combinados es de 40%, correspondiendo este a aquellas personas
que solo lo toman en “fines de semana”.
• Seguidamente tenemos el porcentaje de “2 o 3 veces al mes” con un
valor del 22,46%, muy cerca de la opción “alguna vez” (22,11%).
• El porcentaje mas bajo corresponde a la opción “a diario”, con un 0 %
seguida de la opción “2 o 3 veces en semana”, 0,35%.
• La opción “nunca” tiene un porcentaje de personas intermedio con
respecto al de las otras respuestas, 15,09%.
6. De la variable dulces podríamos decir que en general la muestra escogida
tiene una buena actuación con respecto a la ingesta de dulces, ya que el
porcentaje de personas que nunca los comen supera al de aquellos que lo
toman a diario (lo que no es una actitud saludable).
En cuanto a la ingesta de combinados el resultado de nuestra muestra ha
sido que nadie ingiere este tipo de alimentos de forma diaria, lo que es un
acto saludable por parte de los encuestados y que la mayoría de ellos lo
hacen en fines de semana, podríamos decir que una frecuencia inferior
sería mas saludable pero no es una actitud del todo insana.
7. Para la segunda parte de esta guía, realizaremos el siguiente ejercicio:
• Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas.
Para ello, volveremos a utilizar el programa Rcommander
donde ya hemos abierto la base de datos con la que vamos a
trabajar.
La diferencia con el ejercicio anterior es que esta vez
trabajaremos con dos variables cuantitativas.
8. 1. Seleccionar opción “estadísticos”
2. Clicar en resúmenes-> resúmenes numéricos
3. Seleccionar las variables a estudiar, en este caso “peso” y
“medicalización”
4. Comprobar que hemos seleccionado todos los datos del resumen
numérico que nos interesan clicando en “estadísticos” una vez
tengamos abierto el cuadro de resumen numérico.
5. Análisis de los resultados obtenidos
9. Después de comprobar que tenemos todos los datos necesarios
seleccionados.
El resultado obtenido tras crear nuestro resumen numérico de las variables
“peso” y “medicalización” es:
10. Podemos analizar de este resumen numérico los siguientes aspectos:
• El número de personas que no han contestado en la encuesta de
“medicalización” es mucho mayor que el de no contestados de la
encuesta “peso”, siendo los valores 40 y 16 respectivamente.
• Sin embargo, un echo curioso con respecto al análisis anterior es que la
muestra de la variable “medicalización” es de 251 personas, siendo la
de la variable “peso” de 275 lo que implica que esta última engloba a un
mayor número de personas a pesar de tener menor número de
preguntas no contestadas.
11. • La media de la medicalización con respecto a su desviación típica es
mucho mayor, de lo cual podemos deducir que no existen un numero
significativo de valores extremos o muy distales de la media. Con respecto
al peso, podemos decir que ocurre de forma distinta, ya que existe un
mayor numero de datos que se alejan de la media, siendo esta menos
representativa o significativa que en el caso anterior.
• La medicalización sigue una distribución simétrica puesto que no hay
apenas diferencia entre la media y la mediana (9,91 y 10). Y si nos fijamos
en los datos de la variable peso podríamos decir que los valores de media
y mediana coinciden casi en su totalidad (62,7 y 60).
• La distribución que sigue la variable peso es homogénea ya que los datos
obtenidos en los cuartiles 25-50% son muy parecidos entre sí, y a los de
50-75% de igual forma.
• Siendo un caso parecido el de la variable medicalización.
12. En esta tercera parte, mostraremos como realizar el siguiente ejercicio:
• Debes realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución
los mismos.
Para ello volveremos a hacer uso del programa Rcommander.
13. Los pasos a realizar serán los siguientes:
1. Seleccionar la variable que queramos
representar en las distintas gráficas.
2. Clicar en “gráficas” y seguidamente seleccionar
el tipo de grafica que deseamos
3. Análisis de los datos representados en las
gráficas.
14. Podemos observar que la variable “peso” no sigue una distribución normal
ya que los valores mas frecuentados no se encuentran en el centro,
quedando a ambos lados aquellos casos menos comunes.
Podemos decir que los valores más
repetidos se encuentran entre 50-60.
15. Hemos usado la variable cuantitativa “altura” para representar este tipo de
gráfica.
Podemos observar tres valores que nos
indican tres valores poco usuales.
• Son: 259/103/116
• Valor máximo: 1,9
• Valor medio: 1,65
• El 50% de la muestra mide:
Entre 1-1,65
• El otro 50%: Entre 1,65-1,9
• Podemos observar la distribución
normal que se da en la variable altura.
16. Para este diagrama de barras hemos elegido la variable “edad” la cual es
de tipo cuantitativa pero hemos recodificado esta variable agrupando sus
opciones en intervalos de edad de forma que ya es una variable cualitativa
que podemos representar en este tipo de gráficas:
• Podemos ver que nuestra muestra engloba
en mayor medida adolescentes de 18 años.
• Siendo el grupo mas minoritario el de más de
25 años
• Y posteriormente se encuentran mas
igualados los de entre 19-25 años.
17. Para esta grafica hemos usado la variable “sexo” de tipo cualitativa en la
cual tenemos dos posibles respuestas:
• Podemos observar que la mayoría de nuestra muestra corresponde a
personas del sexo femenino, mientras que un porcentaje muy inferior a
la mitad son personas de sexo masculino.
• De estos datos podemos deducir que
los estudios realizados con esta muestra
estarán mucho mas centrados en las
mujeres que en los hombres.