El documento presenta el análisis estadístico de los datos de horas de sueño nocturno de un grupo de niños. Calcula las medidas de tendencia central (mediana de 9 horas, moda de 9 horas, media de 8.48 horas) y de dispersión (rango de 9 horas, desviación típica de 1.914 horas). También genera un diagrama de caja que muestra la distribución de los datos con los cuartiles.
2. Enunciado
En una población de niños y niñas, se ha anotado el número de horas de sueño nocturno:
Para poder calcular y resolver los enunciados posteriores, primero debemos de ordenar los
datos de menos a mayor:
3. Calcular Medidas de tendencia central:
moda, mediana, media aritmética
• Media aritmética:
Es el parámetro de centralización más usado. Se define como el valor
promedio de todos los demás, es decir, el centro aritmético de los datos. En
nuestro caso al ser una Media poblacional: se representa con la letra griega
µ.
Para calcular la Media aritmética en nuestro caso:
Media=µ= [2+6+2.7+4.8+7.9+5.10+11]/21=178/21=8,48 horas
4. • La Mediana:
Es el valor central de una distribución de n datos ordenados de menor a mayor, es decir, es
aquel valor de la variable que divide a un conjunto de datos ordenados en dos partes iguales
en número de datos, dejando igual número de valores de la variable por encima como por
debajo de él.
Informa sobre el valor alrededor del cual se encuentran los valores observados.
En nuestro caso como hay un nº impar de observaciones (N=21), la mediana es el valor
central de la distribución. Por ello nuestra mediana es:
horas
5. • La Moda:
Es el valor que más veces se repite, es decir, es la
característica o valor de la variable que tiene mayor
frecuencia
Hay distribuciones que pueden tener más de una moda.
En nuestro caso, el valor que más se repite es el 9, por tanto:
Moda= 9 horas
Valor 2= 1 vez
Valor 6= 1 vez
Valor 7= 2 veces
Valor 8= 4 veces
Valor 9= 7 veces
Valor 10= 5 veces
Valor 11=1 vez
6. Calcular Medidas de dispersión: rango
y desviación típica
• Rango:
Es la diferencia entre el valor máximo y el valor
mínimo de los valores o datos observados.
Informa sobre el recorrido de la variable.
En nuestro caso el rango es:
Rango= 11-2=9 horas
Rango = valor máximo – valor mínimo
7. • Desviación típica o estándar:
Es la medida de dispersión más usada. Se expresa en
iguales unidades que los datos originales.
1º)Primero se calcula la varianza poblacional para datos
sin agrupar de una población total:
Donde
Xi: es cada uno de los valores de la variable
µ: la media aritmética poblacional
N: tamaño de la población
Como nuestra poblaciones es pequeña, es
decir, cuando N ≤ 30, se divide por N-1.
9. Calcular las medidas anteriores con
IBM SPSS
• Entramos en el programa con el fin de conocer
como calculamos dichas medidas y para
comprobar nuestros resultados.
10. Entramos en el programa SPSS y cliqueamos sobre vista de variables.
Una vez allí, diseñamos nuestra variable “Horas de sueño”.
11. Tras diseñar nuestra variable, entramos en vista de datos.
Colocamos los datos que nos ha dado el enunciado de forma ordenada.
12. Una vez colocados los datos de forma ordenada. Cliqueamos
sobre “Analizar”; dentro de esta en “Estadísticos descriptivos” y
por último en “Frecuencias”.
13. A continuación, nos aparece un cuadro donde colocamos nuestra variable en
“Variables” y entramos en “Estadísticos”
14. Tras entrar en “Estadísticos”, cliqueamos sobre “Media”, “Mediana”,
“Moda”, “Desviación estándar” y el “Rango”. Con el fin de calcularlos.
Terminamos dando a “Continuar.
15. Una vez realizado la acción anterior, nos aparecerá de nuevo el primer
cuadro al cual le daremos a “Aceptar”.
16. Tras realizar todo el procedimiento,
nos aparece una ventana nueva en la
cual nos muestra el resultado de:
• Moda: 9
• Mediana: 9
• Media aritmética: 8.48
• Rango: 9
• Desviación estándar o típica:
1,914
23. Comentar el resultado acerca de la distribución de los datos
Primer cuartil
o
P25
Corresponde a
8 horas de
sueño.
La Mediana
o
segundo cuartil
o
P50
divide a los
datos
ordenados en
dos partes
iguales.
Corresponde a
9 horas de
sueño.
Tercer cuartil o P75
Corresponde a 10 horas
de sueño
24. (RIC) = amplitud intercuartil.
Diferencia entre el 3º y 1º cuartil
Q3-Q1 (50% datos)
Bigotes
Extremo del “bigote”
Cuando no hay valores atípicos por
defecto coincide con el valor mínimo de la
distribución. Si no hubiera un valor atípico el valor
mínimo sería 6 horas de sueño
Valor atípico por defecto.
Es mucho menor que los demás valores
y esta por debajo (fuera de los
“bigotes”)
En este caso nos indica que es la
posición 1 lo cual corresponde a 2
horas de sueño de nuestra tabla
+
Media aritmética.
Corresponde a 8,48
horas de sueño
Extremo o barrera del “bigote”. Cuando no hay
valores atípicos por exceso
coincide con el valor máximo de la
distribución. Corresponde a 11 horas de sueño
25. Calculo de los datos
• Para obtener los cuartiles, vamos a calcular los
percentiles:
Posición de Pi= i(n+1)/100, siendo i el número del percentil
o P25 = Q1= 25(21+1)/100 =5.5⇒Q1=5+0,5⇒Q1 es un punto
situado entre el 5º y el 6º dato (entre 8 y 8). Con lo cual Q1
es 8 horas.
o P50=Q2=50(21+1)/100= 11 (posición), corresponde a 9
horas.
o P75=Q3= 75(21+1)/100= 16.5⇒Q1=16+0,5⇒Q1 es un punto
situado entre el 16º y el 17º dato (entre 10 y 10). Con lo cual
Q3 es 10 horas.
• Valor atípico por defecto: Q1-3(RI)= 8-3(2)= 2 horas
• RIC: Q3-Q1=10-8=2 horas