Seminario 6
Análisis exploratorio de datos
1º debemos de cargar el conjunto de datos “activos en salud” para por
consiguiente trabajar con ellos.
En la imagen de la izquierda podemos ver que menos de la mitad (37’02%),
nunca han bebido pero si lo comparamos con la imagen de la derecha que
son los que nunca han bebido vino, este último es mucho más bajo (32’18%).
En relación con los que si beben cerveza, los más frecuentes son los que
beben los fines de semana con un 20’76%; en el caso de los que consumen
vino, los más frecuentes son los que beben alguna vez al mes con un
28’37%. Sin embargo, el porcentaje de persona que beben cerveza en total
(62’97%) es menor que los que beben vino (67’82%).Así como los que beben
a diario cerveza (1‘38%) son algo mayor que los que beben vino (1’04%).
En la imagen de la derecha, la media de peso es 62 +/- 12 de desviación típica, por lo que los datos
no estarían muy dispersos, es decir, la población en estudio es más o menos homogénea. Si en el
25% tenemos un valor de 54 y en el 75% es de 68, por lo que la diferencia entre el 25-50 y 50-75 nos
da un valor parecido por lo que es más o menos homogénea. Según la media y la mediana podemos
decir que nos encontramos en una población con un poco de sobrepeso. Y según la NA podemos
observar que hay 16 valores ausentes y no sabemos porque causa no aparecen.
En la imagen de la izquierda, la media de peso es 1’7 +/- 0’08 de desviación típica, por lo que los
datos no estarían muy dispersos, es decir, la población en estudio es más o menos homogénea. Si en
el 25% tenemos un valor de 1’6 y en el 75% es de 1’72, por lo que la diferencia entre el 25-50 y 50-75
nos da un valor parecido por lo que es más o menos homogénea. Según la media y la mediana
podemos decir que nos encontramos en una población con estatura media. Y según la NA podemos
observar que hay 1 valores ausentes y no sabemos porque causa no aparecen.
Aquí vamos a analizar la variable cualitativa “Sexo”
donde podemos ver que hay una mayor proporción
de muestra de mujer que de hombres.
Aquí también vamos a analizar
variables cualitativas pero en este caso
se trata de las veces que hacen la cama.
En la muestra elegida vemos que hay
una mayor proporción de individuos
que hacen la cama diariamente. Incluso
entre los individuos que hacen la cama
los fines de semanas y los que la hacen
2-3 veces entre semana, el 2º es algo
más mayor que el 1º.
Aquí vamos a analizar la variable cuantitativa
“Altura” donde vemos que el punto máximo
coincide con la media y mediana (1’65) y que
es el valor que más se repite entre la muestra
elegida. Luego de ese punto máximo los
valores decaen por ambos lados de manera
equitativa.
Aquí podemos ver que los bigotes son los valores máximos cuyas personas le
dedican 32’ a mantener la casa y mínimos cuyas personas no le dedican nada
al mantenimiento de la casa. El interior de la caja corresponde al rango
intercuartílico donde 50% de los individuos dedica entre 10-20’ al
mantenimiento de la casa, y la línea media de dicha caja corresponde con la
mediana que es la que divide en 2 partes iguales los datos en este caso es 16’.
Existen valores atípicos que son valores extremos y pueden distorsionar los
resultados, en este caso encontramos un individuo que le dedica 35’ al
mantenimiento de la casa.
La parte de abajo es ligeramente más pequeña que el de arriba, es decir,
aquellas personas que le dedican menos tiempo comprendidas entre el 25-50%
de la población están menos dispersas que las comprendidas entre el 50-75%.
El bigote de abajo es más corto que el de arriba por lo que el 25% de los que
dedican menos tiempo están más concentrado que el 25% de los que le
dedican más tiempo.

Seminario 6

  • 1.
  • 2.
    1º debemos decargar el conjunto de datos “activos en salud” para por consiguiente trabajar con ellos.
  • 4.
    En la imagende la izquierda podemos ver que menos de la mitad (37’02%), nunca han bebido pero si lo comparamos con la imagen de la derecha que son los que nunca han bebido vino, este último es mucho más bajo (32’18%). En relación con los que si beben cerveza, los más frecuentes son los que beben los fines de semana con un 20’76%; en el caso de los que consumen vino, los más frecuentes son los que beben alguna vez al mes con un 28’37%. Sin embargo, el porcentaje de persona que beben cerveza en total (62’97%) es menor que los que beben vino (67’82%).Así como los que beben a diario cerveza (1‘38%) son algo mayor que los que beben vino (1’04%).
  • 6.
    En la imagende la derecha, la media de peso es 62 +/- 12 de desviación típica, por lo que los datos no estarían muy dispersos, es decir, la población en estudio es más o menos homogénea. Si en el 25% tenemos un valor de 54 y en el 75% es de 68, por lo que la diferencia entre el 25-50 y 50-75 nos da un valor parecido por lo que es más o menos homogénea. Según la media y la mediana podemos decir que nos encontramos en una población con un poco de sobrepeso. Y según la NA podemos observar que hay 16 valores ausentes y no sabemos porque causa no aparecen. En la imagen de la izquierda, la media de peso es 1’7 +/- 0’08 de desviación típica, por lo que los datos no estarían muy dispersos, es decir, la población en estudio es más o menos homogénea. Si en el 25% tenemos un valor de 1’6 y en el 75% es de 1’72, por lo que la diferencia entre el 25-50 y 50-75 nos da un valor parecido por lo que es más o menos homogénea. Según la media y la mediana podemos decir que nos encontramos en una población con estatura media. Y según la NA podemos observar que hay 1 valores ausentes y no sabemos porque causa no aparecen.
  • 7.
    Aquí vamos aanalizar la variable cualitativa “Sexo” donde podemos ver que hay una mayor proporción de muestra de mujer que de hombres.
  • 8.
    Aquí también vamosa analizar variables cualitativas pero en este caso se trata de las veces que hacen la cama. En la muestra elegida vemos que hay una mayor proporción de individuos que hacen la cama diariamente. Incluso entre los individuos que hacen la cama los fines de semanas y los que la hacen 2-3 veces entre semana, el 2º es algo más mayor que el 1º.
  • 9.
    Aquí vamos aanalizar la variable cuantitativa “Altura” donde vemos que el punto máximo coincide con la media y mediana (1’65) y que es el valor que más se repite entre la muestra elegida. Luego de ese punto máximo los valores decaen por ambos lados de manera equitativa.
  • 10.
    Aquí podemos verque los bigotes son los valores máximos cuyas personas le dedican 32’ a mantener la casa y mínimos cuyas personas no le dedican nada al mantenimiento de la casa. El interior de la caja corresponde al rango intercuartílico donde 50% de los individuos dedica entre 10-20’ al mantenimiento de la casa, y la línea media de dicha caja corresponde con la mediana que es la que divide en 2 partes iguales los datos en este caso es 16’. Existen valores atípicos que son valores extremos y pueden distorsionar los resultados, en este caso encontramos un individuo que le dedica 35’ al mantenimiento de la casa. La parte de abajo es ligeramente más pequeña que el de arriba, es decir, aquellas personas que le dedican menos tiempo comprendidas entre el 25-50% de la población están menos dispersas que las comprendidas entre el 50-75%. El bigote de abajo es más corto que el de arriba por lo que el 25% de los que dedican menos tiempo están más concentrado que el 25% de los que le dedican más tiempo.