SlideShare una empresa de Scribd logo
1 de 17
SEMINARIO 6
·Análisis exploratorio de datos
·Tablas de frecuencias, resúmenes
numéricos y gráficos.
Ana Guerrero Pizarro
EJERCICIO 1
1. En primer lugar, cargaremos la base
de datos “activosensalud”
2. Para poder seleccionar las dos variables cualitativas tal y como se nos
pide en el ejercicio, tenemos que seguir los siguientes pasos
3. Realizamos el proceso dos veces, una para la variable
“pildoradeldiadespues” y otra vez para la variable
“protecciónpreservativo”
4. Con las tablas de cada frecuencia, podemos realizar una comparación ya que disponemos
tanto de las frecuencias absolutas como de los porcentajes
5. COMPARACIÓN DE FRECUENCIAS
· En cuanto a la frecuencia “proteccionpreservativo”, han
contestado 255 de 291 personas, y en “pildoradiadespues” 193 de
291.
· El 61,57% utiliza preservativo siempre, y el 31,37% afirma
haberlo utilizado alguna vez.
· En cuanto al uso de la píldora del día después el 69,43% dice no
haberla utilizado nunca, y tal sólo el 27,98% alguna vez.
· Podemos concluir que es más utilizado el preservativo como
método anticonceptivo que la píldora del día después debido al
alto porcentaje de personas que dicen no haberla utilizado nunca.
EJERCICIO 2
1. En primer lugar, tenemos que abrir dos variables cuantitativas, para abrir la
primera que será “altura” seguimos los siguientes pasos
2. Nos tenemos que asegurar de seleccionar “Media”, “Desviación típica” y
“Rango intercuartílico” ya que será lo que utilizaremos, para ello,
pincharemos en Estadísticos.
3. En R Comander, obtendremos los siguientes datos:
A partir de los siguientes datos podemos deducir que la altura
media (mean) de los alumnos de primer año de enfermería es de
1.667 metros. La desviación típica (sd) es de 0.08078101, lo
cuál nos indica que los valores no están muy dispersos, es decir no
hay una gran variabilidad entre unos y otros. Con respecto a los
cuartiles, podemos deducir que la altura mínima es de 1,46m. El
25% o menos de los estudiantes, miden 1,6 m y el 50% de los
mismos, o menos miden 1.655 metros. El 75% o menos de los
estudiantes miden 1.72m. El valor máximo es de 2m lo que nos
indica que menos del 100% de los estudiantes mide menos de dos
metros. Finalmente podemos observar que, hay un alumno que no
ha contestado a la pregunta sobre su altura(NA).
4. Ahora haremos el mismo análisis con la variable “peso”
Deducimos que el peso medio (mean) de los alumnos de primer
año de enfermería es de 62,76 kg. La desviación típica(sd) es
de 12,65981 indicador de una gran dispersión entre los datos
obtenidos por lo que hay una gran variabilidad. En cuanto a los
cuartiles vemos que el peso mínimo es de 38kg. El 25% de los
estudiantes, o menos pesan 54kg y el 50% o menos pesan 60kg.
El 75% o menos pesa 68kg. Por último observamos que menos del
100% de los estudiantes pesan 130kg. Se puede ver que 16
estudiantes no han contestado a la pregunta sobre su
peso(NA=16)
EJERCICIO 3
1. Gráfico de sectores de la variable trabajo
Este tipo de gráficos es muy útil para
variables cualitativas, es preferible
que no se representen un gran número
de las mismas ya que puede resultar
confuso
En cuanto a la frecuencia trabajo, observamos que un gran
número de los encuestados no trabajan si miramos la
porción rosa, los cuáles son la mayoría, por el contrario la
porción azul representa los alumnos que si desempeñan
algún trabajo
2. Gráfico de barras de la variable dulces
Los gráficos de barras también se
utilizan para variables cualitativas,
tienen una mayor importancia visual
por lo que se pueden utilizar
múltiples categorías. En este caso he
escogido la frecuencia con la que los
alumnos comen dulces. Se observa
que el dato más relevante es que más
del 80% de los estudiantes comen
dulces 1 o 2 veces a la semana.
3. Histograma de frecuencias
Se utiliza en variables
cuantitativas.
He utilizado la frecuencia “peso”,
observando así que el peso medio
de los alumnos se encuentra entre
50 y 60 kg con una frecuencia
superior al 100%
4. Gráfica de caja
Se utiliza para variables
cuantitativas.
Se puede analizar que el 25% de
los estudiantes tienen una
puntuación en torno a 7, siento
este el valor medio de
comunicación familiar. El 75%
de los valores se encuentran
entre 7 y 9. El 100% de los
valores se encuentran entre 13
o menos. Observamos 3 valores
atípicos: 103,72 y 281.

Más contenido relacionado

La actualidad más candente

Tarea seminario 7
Tarea seminario 7Tarea seminario 7
Tarea seminario 7carmenreal
 
Calculo de-la-muestra-con-epidat
Calculo de-la-muestra-con-epidatCalculo de-la-muestra-con-epidat
Calculo de-la-muestra-con-epidatLuisHuamnVilchez
 
Ejercicios selectividad muestras
Ejercicios selectividad muestrasEjercicios selectividad muestras
Ejercicios selectividad muestrasMatemolivares1
 
Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado aliciaaguilares
 
Seminario 6 estadística
Seminario 6 estadísticaSeminario 6 estadística
Seminario 6 estadísticairismmdp
 
Ejercicio de clase estadística sobre el intervalo de confianza
Ejercicio de clase estadística sobre el intervalo de confianza Ejercicio de clase estadística sobre el intervalo de confianza
Ejercicio de clase estadística sobre el intervalo de confianza marnunbai
 
Informe estadístico seminarios de estadística descriptiva realizado por alici...
Informe estadístico seminarios de estadística descriptiva realizado por alici...Informe estadístico seminarios de estadística descriptiva realizado por alici...
Informe estadístico seminarios de estadística descriptiva realizado por alici...aliciaaguilares
 
Tarea seminario 7
Tarea seminario 7Tarea seminario 7
Tarea seminario 7javibarbi
 
Estadistica bivariada
Estadistica bivariadaEstadistica bivariada
Estadistica bivariadaMariiiaaRC
 
Tarea 6 del seminario de tics (word)
Tarea 6 del seminario de tics (word)Tarea 6 del seminario de tics (word)
Tarea 6 del seminario de tics (word)Ana Amador Álvarez
 

La actualidad más candente (20)

Ppoint seminario 7
Ppoint seminario 7Ppoint seminario 7
Ppoint seminario 7
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Tarea seminario 7
Tarea seminario 7Tarea seminario 7
Tarea seminario 7
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Calculo de-la-muestra-con-epidat
Calculo de-la-muestra-con-epidatCalculo de-la-muestra-con-epidat
Calculo de-la-muestra-con-epidat
 
Ejercicios selectividad muestras
Ejercicios selectividad muestrasEjercicios selectividad muestras
Ejercicios selectividad muestras
 
Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado
 
Seminario 6 estadística
Seminario 6 estadísticaSeminario 6 estadística
Seminario 6 estadística
 
Ejercicio de clase estadística sobre el intervalo de confianza
Ejercicio de clase estadística sobre el intervalo de confianza Ejercicio de clase estadística sobre el intervalo de confianza
Ejercicio de clase estadística sobre el intervalo de confianza
 
Trabajo intraclase 1
Trabajo intraclase 1Trabajo intraclase 1
Trabajo intraclase 1
 
Intra y extra clase
Intra y extra claseIntra y extra clase
Intra y extra clase
 
Seminario 6
Seminario 6 Seminario 6
Seminario 6
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Informe estadístico seminarios de estadística descriptiva realizado por alici...
Informe estadístico seminarios de estadística descriptiva realizado por alici...Informe estadístico seminarios de estadística descriptiva realizado por alici...
Informe estadístico seminarios de estadística descriptiva realizado por alici...
 
Tarea seminario 7
Tarea seminario 7Tarea seminario 7
Tarea seminario 7
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
R-Commander
R-CommanderR-Commander
R-Commander
 
Estadistica bivariada
Estadistica bivariadaEstadistica bivariada
Estadistica bivariada
 
Tarea 6 del seminario de tics (word)
Tarea 6 del seminario de tics (word)Tarea 6 del seminario de tics (word)
Tarea 6 del seminario de tics (word)
 

Similar a Seminario 6

Similar a Seminario 6 (20)

Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Seminario 6
Seminario 6Seminario 6
Seminario 6
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Seminario 6: Análisis exploratorio de datos.
Seminario 6: Análisis exploratorio de datos.Seminario 6: Análisis exploratorio de datos.
Seminario 6: Análisis exploratorio de datos.
 
R1
R1R1
R1
 
Fiabilidad de las escalas braden y emina
Fiabilidad de las escalas braden y eminaFiabilidad de las escalas braden y emina
Fiabilidad de las escalas braden y emina
 
Variabilidad iv m
Variabilidad iv mVariabilidad iv m
Variabilidad iv m
 
Tabla 1
Tabla 1Tabla 1
Tabla 1
 
Informe
InformeInforme
Informe
 
Seminario6
Seminario6Seminario6
Seminario6
 
ultima parte sem 5
ultima parte sem 5ultima parte sem 5
ultima parte sem 5
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Seminario 6 estadistica
Seminario 6 estadisticaSeminario 6 estadistica
Seminario 6 estadistica
 
Informe estadístico correspondiente a los seminarios de estadística descriptiva
Informe estadístico correspondiente a los seminarios de estadística descriptivaInforme estadístico correspondiente a los seminarios de estadística descriptiva
Informe estadístico correspondiente a los seminarios de estadística descriptiva
 
Sem6ej2
Sem6ej2Sem6ej2
Sem6ej2
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
Informe estadistica
Informe estadisticaInforme estadistica
Informe estadistica
 
Seminario 6 tics
Seminario 6 ticsSeminario 6 tics
Seminario 6 tics
 
Seminario 6 tics
Seminario 6 ticsSeminario 6 tics
Seminario 6 tics
 
Informe
InformeInforme
Informe
 

Seminario 6

  • 1. SEMINARIO 6 ·Análisis exploratorio de datos ·Tablas de frecuencias, resúmenes numéricos y gráficos. Ana Guerrero Pizarro
  • 3. 1. En primer lugar, cargaremos la base de datos “activosensalud”
  • 4. 2. Para poder seleccionar las dos variables cualitativas tal y como se nos pide en el ejercicio, tenemos que seguir los siguientes pasos
  • 5. 3. Realizamos el proceso dos veces, una para la variable “pildoradeldiadespues” y otra vez para la variable “protecciónpreservativo”
  • 6. 4. Con las tablas de cada frecuencia, podemos realizar una comparación ya que disponemos tanto de las frecuencias absolutas como de los porcentajes
  • 7. 5. COMPARACIÓN DE FRECUENCIAS · En cuanto a la frecuencia “proteccionpreservativo”, han contestado 255 de 291 personas, y en “pildoradiadespues” 193 de 291. · El 61,57% utiliza preservativo siempre, y el 31,37% afirma haberlo utilizado alguna vez. · En cuanto al uso de la píldora del día después el 69,43% dice no haberla utilizado nunca, y tal sólo el 27,98% alguna vez. · Podemos concluir que es más utilizado el preservativo como método anticonceptivo que la píldora del día después debido al alto porcentaje de personas que dicen no haberla utilizado nunca.
  • 9. 1. En primer lugar, tenemos que abrir dos variables cuantitativas, para abrir la primera que será “altura” seguimos los siguientes pasos
  • 10. 2. Nos tenemos que asegurar de seleccionar “Media”, “Desviación típica” y “Rango intercuartílico” ya que será lo que utilizaremos, para ello, pincharemos en Estadísticos.
  • 11. 3. En R Comander, obtendremos los siguientes datos: A partir de los siguientes datos podemos deducir que la altura media (mean) de los alumnos de primer año de enfermería es de 1.667 metros. La desviación típica (sd) es de 0.08078101, lo cuál nos indica que los valores no están muy dispersos, es decir no hay una gran variabilidad entre unos y otros. Con respecto a los cuartiles, podemos deducir que la altura mínima es de 1,46m. El 25% o menos de los estudiantes, miden 1,6 m y el 50% de los mismos, o menos miden 1.655 metros. El 75% o menos de los estudiantes miden 1.72m. El valor máximo es de 2m lo que nos indica que menos del 100% de los estudiantes mide menos de dos metros. Finalmente podemos observar que, hay un alumno que no ha contestado a la pregunta sobre su altura(NA).
  • 12. 4. Ahora haremos el mismo análisis con la variable “peso” Deducimos que el peso medio (mean) de los alumnos de primer año de enfermería es de 62,76 kg. La desviación típica(sd) es de 12,65981 indicador de una gran dispersión entre los datos obtenidos por lo que hay una gran variabilidad. En cuanto a los cuartiles vemos que el peso mínimo es de 38kg. El 25% de los estudiantes, o menos pesan 54kg y el 50% o menos pesan 60kg. El 75% o menos pesa 68kg. Por último observamos que menos del 100% de los estudiantes pesan 130kg. Se puede ver que 16 estudiantes no han contestado a la pregunta sobre su peso(NA=16)
  • 14. 1. Gráfico de sectores de la variable trabajo Este tipo de gráficos es muy útil para variables cualitativas, es preferible que no se representen un gran número de las mismas ya que puede resultar confuso En cuanto a la frecuencia trabajo, observamos que un gran número de los encuestados no trabajan si miramos la porción rosa, los cuáles son la mayoría, por el contrario la porción azul representa los alumnos que si desempeñan algún trabajo
  • 15. 2. Gráfico de barras de la variable dulces Los gráficos de barras también se utilizan para variables cualitativas, tienen una mayor importancia visual por lo que se pueden utilizar múltiples categorías. En este caso he escogido la frecuencia con la que los alumnos comen dulces. Se observa que el dato más relevante es que más del 80% de los estudiantes comen dulces 1 o 2 veces a la semana.
  • 16. 3. Histograma de frecuencias Se utiliza en variables cuantitativas. He utilizado la frecuencia “peso”, observando así que el peso medio de los alumnos se encuentra entre 50 y 60 kg con una frecuencia superior al 100%
  • 17. 4. Gráfica de caja Se utiliza para variables cuantitativas. Se puede analizar que el 25% de los estudiantes tienen una puntuación en torno a 7, siento este el valor medio de comunicación familiar. El 75% de los valores se encuentran entre 7 y 9. El 100% de los valores se encuentran entre 13 o menos. Observamos 3 valores atípicos: 103,72 y 281.