1. ESTADÍSTICA DESCRIPTIVA
EJERCICIO R-COMMANDER
Clara Pérez de la Carrera
1.- REALIZA EL ANÁLISIS DESCRPTIVO NÚMERICO DE DOS VARIABLES
CUANTITAVIVAS Y OTRAS DOS VARIABLES CUALITATIVAS.
2.- REALIZA EL ANÁLISIS DESCRPTIVO MEDIANTE GRÁFICOS DE LAS
CUATRO VARIABLES, EMPLEANDO EN CADA CASO UN TIPO DE
GRÁFICO DIFERENTE.
3.- OBSERVA E INTERPRETA LOS RESULTADOS OBTENIDOS EN LOS
APARTADOS ANTERIORES. ¿Como se distribuyen los valores de las
variables seleccionadas? ¿Cómo es la muestra estudiada?
2. En primer lugar realizamos un
resumen del conjunto de datos
activo, y seleccionamos dos
variables cuantitativas. Una de
ellas es “malestaresactivos” y el
resumen nos muestra:
- Media= 43,46
- Desviación Típica= 9,57
- Recorrido intercuartílico (Q3-
Q1)= 12
- Total de individuos = 279
- Valores perdidos (NA)= 12
- Mediana o Q2 = 44
- Q1= 16
- Q3= 50
- Q4= 65
3. A continuación pasamos a analizar
los datos pero gráficamente, para
ello usamos por ejemplo un
histograma, que nos muestra que
nuestro conjunto de datos no sigue
una distribución normal puesto que
la mayoría de los valores no se
encuentran en el centro de la
distribución. Podemos identificar
una asimetría hacia la izquierda ya
que la mayoría de los datos se sitúan
a la derecha por la existencia de
valores extremos.
4. La siguiente variable cuantitativa que
vamos a analizar es la
“comunicaciónfamiliar” para ello
seguimos los mismos pasos que en el
anterior ejemplo. En este caso R-cmder
nos muestra:
- Media= 7,83
- Desviación Típica= 2,82
- Recorrido intercuartílico= 3
- Total de individuos= 147
- Valores perdidos= 144
- Mediana o Q2= 7
- Q1=6
- Q3=9
- Q4= 16
5. A continuación pasamos a analizar un diagrama
de cajas y bigotes donde se representa
gráficamente nuestra variable cuantitativa.
Podemos observar que nuestro conjunto de datos
no sigue una distribución normal ya que más de la
mitad de los datos se sitúan por encima de Q2 o
Mediana, y además podemos notar una cierta
alteración debido a la presencia de valores
extremos.
6. Pasamos a analizar variables cualitativas, es este caso “proteccionpreservativo”, para ello R
construye tablas de frecuencias en las que podemos observar las frecuencias absolutas o nº de
individuos que se engloban dentro de cada categoría de la variable y también frecuencias
porcentuales. Los datos muestran claramente un mayor uso de preservativo entre los individuos
(61,57% de los encuestados lo usan siempre).
7. A continuación estudiamos dicha
variable cualitativa mediante
gráficas, en este caso mediante
una gráfica de barras. Claramente
observamos como predomina el
uso de preservativo entre los
individuos ya que hay más
unidades de análisis dentro de la
categoría “siempre”.
8. Repetimos el proceso pero esta vez estudiamos la variable cualitativa “pildoradiadespues” y
obtenemos nuevamente la tabla de frecuencia (donde se muestran frecuencias absolutas y
porcentuales). Una vez obtenidos los datos, concluimos que la mayoría de individuos (69,43%)
nunca han usado la píldora del día después.
9. Estudiando la variable gráficamente,
esta vez mediante gráfica de
sectores, llegaríamos a la misma
conclusión ya que la mayor parte del
área se corresponde a individuos
que nunca han tomado la píldora del
día después.