1. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
1
CAPITULO I
NOCIONES GENERALES DE ESTADISTICA
1.1INTRODUCCIÓN
En nuestras labores cotidianas y de manera intuitiva se fueron utilizando
permanentemente procedimientos y datos estadísticos, como se cita en los
siguientes ejemplos: Para aprobar una determinada asignatura se necesita un
promedio mínimo para lo cual se suma las calificaciones parciales entre el total; El
tiempo promedio que utiliza un estudiante en venir de su casa a la carrera Cs de
la Educación.
Como se puede observar en los ejemplos mencionados se encuentran
actividades de observación, registro, análisis y de predicción, estructurando de
manera sistemática llega a constituir el pilar de la estadística como ciencia de
investigación.
No se trata de una disciplina reciente, se conoce que en civilizaciones como en
China, Egipto, Persia y otras se tenían registros estadísticos de control de
producción agrícola, ganaderas y otras actividades de cuantificación.
En la actualidad puede considerarse como ciencia que ha alcanzado un desarrollo
considerable que juega un papel muy importante dentro el campo de la
investigación.
1.2 DEFINICIÓN DE ESTADÍSTICA
Se cita a continuación a varios autores para la conceptualización de la estadística.
“Se la considera como la ciencia o conjunto de conocimientos que se ocupa de la
colección, tabulación, análisis e interpretación de datos para tomar decisiones y
predecir situaciones futuras” (Estadística, Filomeno Carvajal).
“La estadística es una ciencia que brinda los métodos para recolectar, organizar e
interpretar datos en forma adecuada para la toma de decisiones en condiciones de
incertidumbre” (Estadística descriptiva, inferencial y muestreo, Jorge Ordoñez O.).
“La estadística es parte del método científico y se le define como un conjunto de
técnicas usadas para recopilar, organizar, presentar, analizar e interpretar datos,
con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos
o fenómenos de estudio” (Estadística Aplicada, Juan y José Fernández Chavesta).
2. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
2
1.3 CLASIFICACIÓN DE LA ESTADÍSTICA
La estadística se clasifica en :
A. ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA
Parte de la estadística que describe y analiza a todos los elementos de la
población, cuyas conclusiones obtenidas son válidas para dicha población.
B. ESTADÍSTICA INFERENCIAL O INDUCTIVA
Parte de la estadística, que brinda la teoría para inferir o estimar las leyes de una
población, a partir de los resultados de una muestra. Estas inferencias están
ligadas a un grado de incertidumbre o probabilidad.
1.4 CONCEPTOS VARIOS EN ESTADÍSTICA
a. Población o Universo
Es un conjunto grande y completo de individuos, elementos o unidades que
presentan características comunes y observables
Ejemplo 1:
Todos los estudiantes inscritos en la Carrera Ciencias de la educación Gestión
2.012
Ejemplo 2:
Habitantes del municipio de Llallagua
b. Muestra
Es un subconjunto de la población que es representativa y aleatoria.
Se utilizan muestras cuando es dificultoso o demasiado costoso realizar el estudio
en la población, al número que compone la muestra se llama tamaño de la
muestra.
Ejemplo 3:
Si se trata de realizar una investigación sobre la práctica de valores en
estudiantes del nivel secundaria del área concentrada del municipio de Llallagua,
Gestión 2.011.
3. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
3
La población, estará constituida por todos los estudiantes que cursan el nivel de
secundaria, gestión 2.011.
Muestra, número determinado de estudiantes por ejemplo 184 que serán
seleccionados al azar por cada establecimiento educativo.(éste número se
determina con criterios estadísticos con ayuda de la estadística inferencial).
Ejemplo 4:
En la investigación realizada sobre: El ábaco una alternativa metodológica para la
resolución del problema de la lecto - escritura de los números hasta las centenas,
para niños y niñas de 2do. a 5to. grado de primaria de los centros de acogida
Margarita Auger y Miraflores del Municipio de Uncia.
La población lo conformara todos los niñas y niños de los centros de acogida
Margarita auger y Miraflores que cursan los grados de 2do. a 5to. de primaria.
Muestra, número de niños y niñas de los centros de acogida con dificultades de
aprendizaje en la lecto – escritura de los números hasta las centenas.
1.5 OBSERVACIONES
Estadísticamente son los datos que se recolectan para un estudio
1.6 VARIABLES ESTADÍSTICAS
a. Definición
En forma general se define como característica, una cualidad, un aspecto
determinado, que cuantificadas pueden tomar diferentes valores dentro de dos
limites pre- establecidos.
Se simboliza por X, Y, Z, etc. cuando una variable toma un mismo valor se llama
constante.
Ejemplo 5:
La Carrera de Ciencias de la Educación de la UNSXX. Lleva a cabo un estudio
para determinar la situación ocupacional de sus egresados.
Las variables que se presentan son: Sexo, Ingresos anuales, Profesión, número
de años de experiencia, Nivel jerárquico ocupacional.
b. Clasificación de las variables
4. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
4
b.1 Variable Cualitativa
Son variables que se refieren a alguna característica cualitativa de la población
(que no se pueden medir directamente son sujetas a una clasificación previa) así
por ejemplo nacionalidad color de la piel, sexo y otras.
La variable cualitativa a su vez puede clasificarse en:
Variable cualitativa nominal: Son variables que describen características
propias de un conjunto de elementos
Ejemplos:
6)
Masculino
Sexo Femenino
7)
Blanca
Raza Negra
Amarilla
8) Soltero
Estado Civil Casado
Viudo
Divorciado
9) Rojo
Azul
Colores que utilizan los niños Amarillo
para describir figuras geométricas Verde
Morado
Variable cualitativa ordinal: Se caracteriza porque se puede clasificar y
ordenar de mayor a menor o viceversa.
Ejemplos:
10)
Bajo
Estaturas Mediano
Alto
11) Analfabeto
Primaria
Secundaria
Bachillerato
Grado de Instrucción Licenciatura
5. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
5
Diplomado
Especialidad
Maestría
Doctorado
b.2 Variable Cuantitativa
Son variables que resultan de adiciones y conteos (tienen valor numérico), así por
ejemplo: peso, número de estudiantes, calificaciones, estatura, edad, etc.
La variable cuantitativa a su vez puede clasificarse en:
Variable Discreta: Son los que asumen valores numéricos enteros.
Ejemplos:
Edades de un grupo de personas, número de integrantes de una familia,
número de estudiantes con dificultades de aprendizaje en establecimientos
educativos del área dispersa, etc.
Variable Continua: Son aquellas que pueden tomar infinitos valores entre dos
números.
Ejemplos:
Estatura, peso, temperatura, índice de rendimiento en una prueba de
aptitud en niños de un centro infantil, etc.
Cabe mencionar que en estadística, algunas variables cuantitativas discretas se
pueden convertir en variables cuantitativas continuas. Asi por ejemplo:
Variable cuantitativa discreta Variable cuantitativa continua
Edad (expresada en años) Edad (expresada en meses
semanas, días).
PARÁMETRO
Es usado para describir alguna característica de una población, para determinar
su valor, es necesario utilizar la información de la población completa y por tanto
las decisiones se tomaran con certidumbre total.
ESTADÍGRAFO
Medida usada para describir alguna característica de la muestra y la toma de
decisiones contiene un grado de incertidumbre.
6. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
6
1.7 IMPORTANCIA
Los problemas de la sociedad son cada vez más complejos e inciertos, en el futuro
requieren de un tratamiento sistemático y con criterio científico; es decir que no
pueden ser encarados solamente con especulaciones o en forma intuitiva,
requieren mas bien de observaciones o experimentaciones repetidas para lograr
conocimientos válidos.
La estadística aplicada al campo educativo es de gran importancia porque permite
la valoración cuantitativa y cualitativa de ciertos hechos juzgados a priori que
conducen a interpretaciones erróneas. Permite encarar de un modo sistemático
con clara orientación científica.
7. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
7
CAPITULO II
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
2.1 TOMA DE DATOS
En el proceso de investigación se contempla la etapa de recolección de datos que
se requieren para alcanzar los objetivos y demostrar la hipótesis de la
investigación, por lo que es muy importante aplicar los métodos más adecuados
para una buena recolección ya que de ello dependerá la obtención de la
información que refleje la realidad de los datos muestrales o poblacionales.
2.2 ORDENACIÓN DE DATOS
Es una colocación de los datos numéricos tomados en orden creciente o
decreciente de magnitud.
2.3 REDONDEO DE DATOS.- CRITERIOS.
A) REDONDEO A NÚMEROS ENTEROS
Cuando se tiene números enteros más una parte decimal se presentan los
siguientes casos:
Cuando el número entero termina en un número par ó impar y la parte
decimal es 5 ó mayor (mayor ó igual a 5) ,el redondeo es directo al
inmediato superior del número entero.
Ejemplos:
a) 35,5 redondeando a número entero resulta: 36
b) 68,5 redondeando a número entero resulta: 69
c) 157, 7 redondeando a número entero resulta: 158
d) 639, 9 redondeando a número entero resulta: 640
Cuando el número entero es par ó impar y, la parte decimal son números
menores ó iguales a cuatro, entonces el numero entero no se redondea, es
el mismo.
8. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
8
Ejemplos:
a) 65,3 aproximando a número entero resulta: 65
b) 145,3 aproximando a número entero resulta: 145
B) REDONDEO A NUMEROS DECIMALES
Cuando se tiene un conjunto de datos con la presencia de números
decimales, se debe asumir con que cantidades se trabajara tomado en
cuenta en la parte decimal el redondeo con décimas, centésimas,
milésimas, etc. utilizando los siguientes criterios:
CRITERIO DEL “PAR MÁS PROXIMO”
Se redondea al número par más próximo que antecede al 5
Así por ejemplo:
a) 38,365 aproximando a centésimas resulta 38,36
b) 74,475 aproximando a centésimas resulta 74,48
c) 1,0635 aproximando a milésimas resulta 1, 064
d) 8,365 aproximando a centésimas resulta 8,36
CRITERIO “POR EXCESO”
Se redondea al número par ó impar que antecede al 5
Así por ejemplo:
a) 3, 65 aproximando a décimas resulta 3,7
b) 5,775 aproximando a centésimas resulta 5, 78
c) 1,3565 aproximando a milésimas resulta 1,357
2.4 TABLA DE DISTRIBUCIÓN DE DISTRIBUCIÓN DE FRECUENCIAS
Es la presentación ordenada de los datos considerando determinados aspectos o
características comunes de los elementos en su conjunto.
La organización se realiza tomando en cuenta el tipo de variable a la que
pertenecen los datos.
Para lo cual definimos los siguientes conceptos de instrumentos estadísticos:
9. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
9
Rango o recorrido de los datos
Se define como la distancia entre el dato máximo y mínimo, se halla restando el
dato mayor con el dato menor.
R = Yi Max. - Y i Min
Frecuencia absoluta ni
La frecuencia del valor absoluta del valor Yi es el número de veces que aparece
ese valor en el conjunto de observaciones.
Frecuencia absoluta acumulada Nj
Es la suma acumulada una tras otra, el 1er. dato resulta ser el mismo que el de la
casilla anterior.
Frecuencias relativas hi
Es el resultado de dividir cada valor de la frecuencia absoluta entre el total de los
datos
hi = Frecuencia absoluta de Yi
Número total de los datos
Frecuencia relativa acumulada Hj
Es la suma acumulada una tras otra de las frecuencias relativas.
Frecuencia relativa Porcentual Pi
Es la frecuencia relativa multiplicada por 100 que representa el porcentaje de
observaciones que corresponden al valor de Yi .
Pi = h i x 100
Marca de clase o punto medio ( Y`i)
Es el punto medio de la clase que se obtiene sumando los límites inferiores y
Superior de la clase dividiendo por 2.
En forma general la tabla de distribución de frecuencias se presenta de la
siguiente forma:
10. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
10
Yi ni Nj hi Hj Pi
Y1
Y2
Y3
.
.
.
.
Ym
n1
n2
n3
.
.
.
.
nm
N1 = n1
N2 = n1 + n2
N3 = n1 + n2 + n3
.
.
.
.
Nm = n1 + n2 + n3
+ ……+. Nm=N
hi = n1 / N
h2= n2 / N
h3= n3 / N
.
.
.
.
hm= nm / N
H1= h1
H2 = h1+h2
H3= h1+h2+h3
.
.
.
.
Hm= h1+h2+h3
+ …..+ hm=1
P1= h1 x 100
P2= h2 x 100
P3= h3 x 100
.
.
.
.
.
.
Pm= hm x 100
Total N 1 . 100
2.5 ORGANIZACIÓN DE LAS TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
PARA VARIABLES CUANTITATIVAS
En los ejemplos siguientes se mostraran el llenado de las tablas de distribución de
frecuencias en base a las definiciones dadas anteriormente clasificando en datos
agrupados y no agrupados.
A. CUANDO LOS DATOS NO ESTÁN AGRUPADOS EN CLASES O
CATEGORÍAS
Ejemplo 1:
Los siguientes datos corresponden a calificaciones en una asignatura
correspondiente a 25 estudiantes de un paralelo de una determinada carrera de la
UNSXX. (Escala 1 a 100 puntos).
72 72 44 72 84
35 44 66 72 84
72 84 44 66 66
84 66 44 84 44
66 72 66 72 72
Se pide: a) Presentar los datos en una tabla de distribución de frecuencias.
b) Interpretar los resultados de la tabla.
11. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
11
Solución: a) Tabla de distribución de frecuencias
Calificaciones
Y i
ni Nj hi Hj Pi
%
35
44
66
72
84
1
5
6
8
5
1
6
12
20
25
1 / 25 = 0.04
5 / 25 = 0.20
6 / 25 = 0.24
8 / 25 = 0.32
5 / 25 = 0.20
0.04
0.24
0.48
0.80
1.00
4
20
24
32
20
Totales N = 25 1.00 100
b. Interpretación de los resultados de la tabla
1 estudiante tiene la calificación de 35 puntos representando el 4 % del
total.
5 estudiantes tienen la calificación de 44 , que equivale el 20% del total.
6 estudiantes obtuvieron la calificación de 66 puntos, equivalente al 24%
del total.
8 estudiantes tienen la calificación de 72 puntos, representando el 32 %
del total .
5 estudiantes tienen la calificación de 84 puntos, equivalente al 20% del
total.
Interpretando las frecuencias relativas acumuladas porcentuales:
6 estudiantes obtuvieron la calificación hasta 44 , equivalente al 24%
del total , es decir el 24% de los estudiantes reprobó la
asignatura.
19 estudiantes tienen la calificación mayor o igual a 66, es decir el
porcentaje de estudiantes que aprobó la asignatura es del 76%
del total.
12. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
12
Ejemplo 2. Los siguientes datos corresponden a calificaciones obtenidas de 40
estudiantes en un curso pre – Universitario (escala 1 al 7).
5 2 2 5 6 4
5 7 4 3 6 4
1 4 3 3 3 2
4 4 2 6 7 5
4 3 6 3 4 5
6 4 2 3 2
5 1 5 6 1
Se pide:
a) Presentar los datos en una tabla de distribución de frecuencias.
b) Interpretaciones de las frecuencias: absolutas, porcentuales y acumuladas.
c) ¿Cuántos estudiantes obtuvieron la calificación de 4?
d) ¿Qué porcentaje de estudiantes tienen una calificación de 3?
e) ¿Cuántos estudiantes obtuvieron la calificación a lo más de 6?
Solución:
a) Tabla de distribución de frecuencias.
Calificaciones
Y i
ni Nj hi Hj Pi
%
1
2
3
4
5
6
7
3
6
7
9
7
6
2
3
9
16
25
32
38
40
3 / 40 = 0.075
6 / 40 = 0.150
7 / 40 = 0.175
9 / 40 = 0.225
7 / 40 = 0.175
6 / 40 = 0.150
2 / 40 = 0.050
0.075
0.225
0.400
0.625
0.800
0.950
1.000
7.5
15.0
17.5
22.5
17.5
15.0
5.0
Totales N = 40 1.000 100.0
13. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
13
b) Interpretación de los resultados de la tabla:
Frecuencias absolutas:
3 estudiantes del curso pre-universitario tienen la calificación de 1, representando
el 7.5% del total.
6 estudiantes del curso pre – universitario tienen la calificación de 2,
representando el 15.0 % del total.
7 estudiantes del curso pre – universitario tienen la calificación de 3,
representando el 17.5 % del total.
9 estudiantes del curso pre – universitario tienen la calificación de 4,
representando el 22.5 % del total.
7 estudiantes del curso pre – universitario tienen la calificación de 5,
representando el 17.5 % del total.
6 estudiantes del curso pre – universitario tienen la calificación de 6,
representando el 15.0 % del total.
2 estudiantes del curso pre – universitario tienen la calificación de 7,
representando el 5.0 % del total.
Frecuencias Acumuladas:
16 estudiantes del curso pre-universitario tienen la calificación de 1 a 3 puntos,
equivalente al 40 % del total.
24 estudiantes del curso pre-universitario tienen la calificación de 4 a 7 puntos,
equivalente al 60 % del total.
c) 9 estudiantes obtuvieron la calificación de 4.
d) El 17.5 % de los estudiantes tienen la calificación de 3.
e) 8 estudiantes obtuvieron la calificación a lo más de 6.
B. CUANDO LOS DATOS ESTÁN AGRUPADOS EN CLASES O CATEGORÍAS
Cuando se dispone cantidad de valores diferentes de la variable es útil distribuirlos
en clases o categorías y determinar el número de individuos pertenecientes a cada
clase.
14. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
14
Ejemplo 3:
Un investigador desea determinar en una comunidad, el número de horas
semanales que dedican los niños menores de 6 años de edad, a ver la televisión.
La investigación se realizo en 25 niños, cuyos datos se registran en el siguiente
cuadro:
10 19 25 19 26
16 19 27 27 25
23 22 17 12 20
15 21 23 26 14
18 25 23 24 21
Se pide :
a. Elaborar la tabla de distribución de frecuencias
b. Interpretar los resultados de la tabla.
Solución :
Los datos registrados serán distribuidos en clases o categorías, para lo cual se
debe determinar: el rango, números de clases y la amplitud de los intervalos.
RANGO
R = Yi Max. - Y i Min
R = 27 – 10
R = 17
DETERMINACIÓN DEL NÚMERO DE CLASES
Es el número de clases o categorías o intervalos en el que se va a dividir la
información.
El número de clases se puede fijar arbitrariamente, dependiendo del número de
datos que se tenga, por lo general el número de clases a elegir, varia entre 5 a 20.
Sin embargo existe también otra forma de determinar el número de clases con
buena aproximación, la cual se conoce con el nombre de REGLA DE STURGES y
cuyo cálculo responde a la siguiente fórmula:
K = 1 + 3.3 Log N
15. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
15
Donde:
K = número de clases
N =Número de datos
Para el ejemplo: K = 1 + 3.3 log 25
K = 5.6 6 (necesariamente redondear a entero)
K = 6 (número de clases)
DETERMINACIÓN DE LA AMPLITUD DE LA CLASE
Se determina de la siguiente forma:
Amplitud del intervalo = Rango / Número de clases
Llamado también ancho de clase, amplitud es la cantidad de datos que están
comprendidos en un intervalo de clase.
Un intervalo se forma por dos límites que son los valores extremos de un intervalo
que son límite superior ( Y i ) y limite inferior ( Y i – 1).
Cuando un intervalo no tiene límite superior o inferior se llama intervalo de clase
abierto.
Para el ejemplo: Amplitud = 17 / 6 = 2.8 3
Formando los intervalos resulta:
Y i -1 - Y i
10 - 12
13 - 15
16 - 18
19 - 21
22 - 24
25 - 27
NOTA: los intervalos no siempre van a tener la misma amplitud, de acuerdo a la
investigación y a la necesidad de presentar la información para su análisis
correspondiente, es posible tener tres tipos de clases o categorías.
16. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
16
Intervalos de igual amplitud Intervalos de diferente amplitud
(Lo anotado en el ejemplo dado grupos de edad
anteriormente)
0 - 15
16 - 21
22 - 45
46 - 60
61 - 84
Intervalos abiertos
Peso en kgs.
Menos de 40
40 - 45
46 - 51
52 - 57
58 - 63
64 - 69
70 o más
Con todo lo mencionado se construye la tabla de distribución de frecuencias:
a. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Horas
Semanales
Y i -1 - Y i
ni Nj Hi Hj Pi
%
10 - 12
13 - 15
16 - 18
19 - 21
22 - 24
25 - 27
2
2
3
6
5
7
2
4
7
13
18
25
2 / 25 = 0.08
2 / 25 = 0.08
3 / 25 = 0.12
6 / 25 = 0.24
5 / 25 = 0.20
7 / 25 = 0.28
0.08
0.16
0.28
0.52
0.72
1.00
8
8
12
24
20
28
Totales N = 25 1.00 100
17. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
17
b. Interpretando los resultados:
2 niños ven la televisión entre 10 y 12 horas semanales, que equivale al 8 % del
total.
3 niños ven la televisión entre 16 y 18 horas semanales, representando el 12 %
del total.
6 niños ven la televisión entre 19 y 21 horas semanales, que equivale al 24 % del
Total
5 niños ven la televisión entre 22 y 24 horas semanales, representando el 20 %
del total.
7 niños ven la televisión entre 25 y 27 horas semanales que equivale al 28 % del
total, es decir el porcentaje más alto de niños ven la mayor cantidad de horas
semanales la televisión.
Ejemplo 4:
Los siguientes datos corresponden al Índice de Rendimiento en una prueba de
aptitud de 40 estudiantes:
1.51 1.53 1.47 1.58 1.46 1.69 1.66 1.61
1.23 1.56 1.09 1.63 1.60 1.89 1.37 2.29
1.65 1.69 2.01 1.73 1.22 1.46 1.51 1.47
1.61 1.65 1.60 2.18 1.54 1.33 1.65 1.50
2.29 1.56 1.67 1.81 1.67 1.38 1.68 1.83
Se pide hallar:
a) Rango (R)
b) Número de clases (K)
c) Amplitud de la Clase (C)
d) Tabla de distribución de frecuencias
e) Interpretación de las frecuencias absolutas, porcentuales y acumuladas
f) Interpretación de los datos más sobresalientes.
Desarrollo:
a) R = Yi Máx - Yi min
R = 2.29 – 1.09
R = 1.20
18. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
18
b) K = 1 + 3.3 Log N
K = 1 + 3.3 Log 40
K = 1 + 3.3 (1.602059991)
K = 1 + 5.286797971
K = 6.2868 6
K = 6
c) C = R / K
C = 1.20/ 6
C = 0.20
Formando las clases ó categorías
Como se puede observar la última clase no
Incluye al dato de 2.29, para resolver esta
dificultad se presentan tres alternativas de
de solución.
i) Dejando el límite superior de la última clase abierta de la siguiente forma:
ii Aumentando una clase al final:
Y i -1 - Y i
1.09 - 1.28
1.29 - 1.48
1.49 - 1.68
1.69 - 1.88
1.89 - 2.08
2.09 - 2.28
Y i -1 - Y i
1.09 - 1.28
1.29 - 1.48
1.49 - 1.68
1.69 - 1.88
1.89 - 2.08
2.09 y más
Y i -1 - Y i
1.09 - 1.28
1.29 - 1.48
1.49 - 1.68
1.69 - 1.88
1.89 - 2.08
2.09 - 2.28
2.29 - 2.48
19. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
19
iii) aumentando 1 centésimo a la amplitud de las clases, en la relación resulta:
C = R / K
C = 0.20 + 0.01
C = 0.21
Luego las nuevas clases resultan:
c) Tabla de Distribución de Frecuencias
Índice de
rendimiento
Yi-1 - Yi
ni Nj hi Hj Pi
%
1.09 - 1.29
1.30 - 1.50
1.51 - 1.71
1.72 - 1.92
1.93 - 2.13
2.14 - 2.34
3
8
21
4
1
3
3
11
32
36
37
40
3 / 40 = 0.075
8 / 40 = 0.200
21 / 40 = 0.525
4 / 40 = 0.100
1 / 40 = 0.025
3 / 40 = 0.075
0.075
0.275
0.800
0.900
0.925
1.000
7.5
20.0
52.5
10.0
2.5
7.5
Totales N = 40 1.00 100
d) Interpretación de frecuencias absolutas y porcentuales:
3 estudiantes obtuvieron un índice de rendimiento de aptitud entre 1.09 y 1.29 ,
que representa el 7.5 % del total.
8 estudiantes obtuvieron un índice de rendimiento de aptitud entre 1.30 y 1.50,que
representa el 20 % del total.
Y i -1 - Y i
1.09 - 1.29
1.30 - 1.50
1.51 - 1.71
1.72 - 1.92
1.93 - 2.13
2.14 - 2.34
20. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
20
21 estudiantes tienen un índice de rendimiento de aptitud entre 1.51 a 1.71, que
representa el 52.5 % del total.
4 estudiantes tienen un índice de rendimiento de aptitud entre 1.72 y 1.92 ,
equivalente al 10 % del total.
1 estudiante obtuvo un índice de rendimiento de aptitud entre 1.93 y 2.13, que
representa el 2.5 % del total.
3 estudiantes obtuvieron un índice de rendimiento de aptitud entre 2.14 y 2.34, que
representa el 7.5 % del total.
e) Interpretación de los datos más sobresalientes
De un total de 40 estudiantes que se sometieron a una prueba de índice de
rendimiento de aptitud: 21 de ellos obtuvieron entre 1.51 y 1.71, que representa el
52.5%, 1 solo estudiante que equivale al 2.5% obtuvo entre 1.93 y 2.13.
Lo que significa que más de la mitad de los estudiantes alcanzo un puntaje
relativamente regular, frente a un porcentaje mínimo que obtuvo un puntaje mayor.
2.6 ORGANIZACIÓN DE LAS TABLAS DE FRECUENCIAS PARA VARIABLES
CUALITATIVAS
Las siguientes tablas de distribuciones de frecuencias se presentan para variables
cualitativas nominales y ordinales, para elaborar es necesario conocer como se
clasifica la variable, para luego proceder a la tabulación.
Ejemplo 5:
La siguiente información corresponde a un grupo de 70 personas entrevistadas;
de los cuales 45 son hombres y 25 son mujeres.
Se pide:
a. Elaborar la tabla de distribución de frecuencias
b. Interpretar los resultados de la tabla.
DESARROLLO
a. La información corresponde a una variable nominal por lo que la presentación
de la tabla de distribución de frecuencias es la siguiente:
21. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
21
Sexo ni hi Pi
(%)
Varones
Mujeres
45
25
0.64
0.36
64
36
Totales N = 70 1.00 100
b. Interpretación:
El mayor porcentaje que equivale al 64 % de los entrevistados son varones.
El menor porcentaje que equivale al 36 % de las entrevistadas son mujeres.
Por lo que la mayoría de las personas entrevistadas corresponde a los varones.
Ejemplo 6:
En un trabajo de investigación, una de las variables de estudio es el grado de
instrucción en una población de 140 personas. Obteniéndose los siguientes
resultados: 48 son analfabetos; 67 cursaron la primaria; 22 cursaron la secundaria
y 3 el nivel superior.
Se pide:
a. Presentar la Tabla de distribución de frecuencias.
b. Interpretación.
c. Interpretar el comportamiento de los datos más sobresalientes.
Desarrollo:
a. La información corresponde a una variable ordinal por lo que la presentación
de la tabla de distribución de frecuencias es la siguiente:
Grado de
Instrucción
ni hi Pi
(%)
Analfabetos
Primaria
Secundaria
Superior
48
67
22
3
0.34
0.48
0.16
0.02
34
48
16
2
Totales N = 140 1.00 100
22. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
22
b. Interpretación:
48 personas equivalente al 34 % del total son Analfabetos..
67 personas equivalente al 48% del total son de Primaria.
22 personas equivalente al 16 % tienen instrucción en el nivel Secundario.
3 personas equivalente al 2% tienen instrucción Superior
c. Interpretando el comportamiento de los datos más sobresalientes:
De un total de 140 personas de la población entrevistada, el mayor porcentaje
equivalente al 48 % alcanzo el grado de instrucción en la Primaria y en un
porcentaje menor del 2% el nivel Superior.
Es decir que la mayoría de las personas entrevistadas tienen el grado de
instrucción Primaria y una minoría el de formación superior.
23. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
23
CAPÍTULO III
REPRESENTACIONES GRÁFICAS
3.1 INTRODUCCIÓN
Las tablas de frecuencias constituyen de un modo muy sencillo de representación
de datos, y pueden extraerse de ellas, conclusiones muy valiosas. Estas se
complementan adecuadamente con las graficas facilitando de este modo, la
interpretación y análisis de los datos. Por lo tanto diremos que: Un grafico es la
representación de un fenómeno estadístico por medio de figuras geométricas que
permiten visualizar en forma clara la forma en que se distribuye un conjunto de
observaciones.
Un grafico se compone por:
El Titulo: que expresa el contenido del grafico y por lo general es igual o parecido
al título del cuadro estadístico que sirve de frecuencia.
Escalas: se utiliza el sistema cartesiano, las escalas vienen a ser la graduación de
ambos ejes, según la naturaleza de las variables y frecuencias correspondientes.
Cuerpo: es el grafico en sí, y constituye la representación en dibujo de los datos.
Fuente: indica el origen de los datos estadísticos que se está representado en el
grafico.
3.2. CUANDO LOS DATOS NO ESTÁN AGRUPADOS EN CLASES O
CATEGORÍAS:
3.2.1 Grafico de barras
Es usado generalmente para representar hechos o fenómenos sin
continuidad sin movimiento de tal forma que permita visualizar la magnitud
y comparar los elementos en que se clasifican las variables.
a) Grafico de barras para frecuencias absolutas:
Ejemplo 1:
Datos que corresponden a calificaciones en la asignatura Introducción a la
Matemática correspondiente a 25 estudiantes del paralelo P1.1 de la carrera Cs.
De la Educación de la UNS XX.
Escala: (1 a 100 puntos)
24. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
24
CUADRO Nº 1
UNIVERSIDAD NACIONAL SIGLO XX
CARRERA CS. DE LA EDUCACIÓN
CALIFICACIONES
ASIGNATURA INTRODUCCIÓN A LA MATEMÁTICA
PARALELO “1.1” - GESTIÓN 2.006
Yi ni Nj hi Hj Pi
( % )
35 1 1 0, 04 0, 04 4
44 5 6 0, 20 0, 24 20
66 6 12 0, 24 0, 48 24
72 8 20 0, 32 0, 80 32
84 5 25 0, 20 1 20
25 1 100 100
FUENTE: Elaboración Propia
GRÁFICO Nº 1
UNIVERSIDAD NACIONAL SIGLO XX
CARRERA CS. DE LA EDUCACIÓN
CALIFICACIONES
ASIGNATURA INTRODUCCIÓN A LA MATEMÁTICA
PARALELO 1.1
1er. SEMESTRE - GESTIÓN 2.006
0
1
2
3
4
5
6
7
8
9
35 44 66 72 84
Valores de Variable Calificaciones
Frecuencia
FUENTE: Del Cuadro Nº 1
25. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
25
b) Grafico de barras para frecuencias relativas o frecuencias porcentuales
Representación grafica de las frecuencias relativas porcentuales
GRAFICO Nº 2
FUENTE: Del Cuadro Nº1
3.3. REPRESENTACIONES GRÁFICAS CUANDO LOS DATOS ESTÁN
AGRUPADOS EN CLASES O CATEGORÍAS.
3.3.1 Histogramas o histogramas de frecuencias, consiste en una serie
de rectángulos que tienen
Sus bases sobre un eje horizontal (eje x) con centros en las marcas de
clase y longitud igual al tamaño de los intervalos de clase.
Superficies proporcionales a las frecuencias de clase.
Ejemplo 2:
En base a la siguiente información se realizaran las representaciones gráficas
correspondientes que se mencionan.
26. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
26
CUADRO Nº 2
COMUNIDAD “X”
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6 AÑOS DE
EDAD, A VER LA TELEVISIÓN
LA PAZ – 2.011
Horas
Semanales
Yi-1 - Yi
ni Nj hi Hj Pi
% Y´i
10 - 12
13 - 15
16 - 18
19 - 21
22 - 24
25 - 27
2
2
3
6
5
7
2
4
7
13
18
25
2 / 25 = 0.08
2 / 25 = 0.08
3 / 25 = 0.12
6 / 25 = 0.24
5 / 25 = 0.20
7 / 25 = 0.28
0.08
0.16
0.28
0.52
0.72
1.00
8
8
12
24
20
28
11
14
17
20
23
26
Totales N = 25 1.00 100
FUENTE: Elaboración Propia, En Base a Encuestas
a) Histogramas de frecuencias absolutas
GRAFICO Nº 3
COMUNIDAD “X”
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6 AÑOS DE
EDAD, A VER LA TELEVISIÓN
LA PAZ – 2.011
0
1
2
3
4
5
6
7
8
10
-
12
13
-
15
16
-
18
19
-
21
22
-
24
25
-
27
Horas Sem anales
Frecuencia
FUENTE: Del Cuadro Nº 2
27. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
27
b) Histogramas de frecuencias relativas o histogramas porcentuales
En el eje de las ordenadas se anotan las frecuencias porcentuales
GRAFICO N º 4
COMUNIDAD “X”
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6 AÑOS DE
EDAD, A VER LA TELEVISIÓN
LA PAZ – 2.011
FUENTE: Del Cuadro Nº 2
3.3.2 Polígonos
El polígono de frecuencias es un grafico de línea trazada sobre las marcas
de clase puede obtenerse uniendo los puntos medios de los techos de los
rectángulos del histograma ( a través de una línea recta) incrementando
una anterior de la primera clase y otra posterior a la última clase, ambos
con frecuencia cero.
28. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
28
a) Polígono de frecuencias absolutas
GRAFICO Nº 5
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6
AÑOS DE EDAD, A VER LA TELEVISIÓN.
FUENTE: DEL CUADRO Nº 2
b) Polígono de frecuencias relativas o porcentuales
GRAFICO Nº 6
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6 AÑOS DE
EDAD, A VER LA TELEVISIÓN.
29. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
29
FUENTE: DEL CUADRO Nº 2
3.3.3 Ojivas
Son gráficos que se utilizan para representar las frecuencias acumuladas
absolutas o relativas, y consiste en un grafico lineal que nos permite
observar la cantidad de elementos que quedan por encima o por debajo de
determinados valores.
Las ojivas son de dos tipos:
“Ojivas menor que”
“Ojivas o mas”
Para su elaboración se trabaja con los límites inferiores de cada intervalo de clase
y las frecuencias acumuladas correspondientes.
30. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
30
a) Representación grafica de frecuencias absolutas acumuladas Ojivas
“menor que”
NÚMERO DE HORAS
SEMANALES
ni Nj
10 – 12
13 – 15
16 – 18
19 – 21
22 – 24
25 – 27
2
2
3
6
5
7
2
4
7
13
18
25
Totales N = 25
CUADRO Nº 3
NÚMERO DE HORAS
SEMANALES
FRECUENCIAS
ACUMULADAS
MENOR QUE
Menor que 10
Menor que 13
Menor que 16
Menor que 19
Menor que 22
Menor que 25
Menor que 28
0
2
4
7
13
18
25
Ubicando los puntos: (10,0); (13,2); (16,4), (19,7), (22,13), (25,18), (28,25)
31. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
31
GRAFICO Nº 7
NÚMERO DE HORAS SEMANALES QUE DEDICAN LOS NIÑOS MENORES DE 6 AÑOS DE
EDAD, A VER LA TELEVISIÓN.
FUENTE: DEL CUADRO Nº 3
b) Ojivas “>”
NÚMERO DE HORAS
SEMANALES
ni Nj “>”
10 – 12
13 – 15
16 – 18
19 – 21
22 – 24
25 – 27
28 – 30
2
2
3
6
5
7
25
23
21
18
12
7
0
Totales N = 25
32. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
32
CUADRO Nº 4
NÚMERO DE HORAS
SEMANALES
FRECUENCIAS
ACUMULADAS
MAYORES QUE
10 o más
13 o más
16 o más
19 o más
22 o más
25 o más
28 o más
25
23
21
18
12
7
0
En base a la información presentada en los cuadros realizar la representación
gráfica de la ojiva “mayor que”.
3.3.4 Curva de frecuencias: Es también importante la representación
grafica conocida con el nombre de curva de frecuencias, que se realiza
suavizando el polígono correspondiente.
Ejemplo:
CUADRO Nº 5
CLASE ni
FRECUENCIA
SUAVIZADA fs
0 0.67
10 – 12 2 1.33
13 – 15 2 2.33
16 – 18 3 3.67
19 – 21 6 4.67
22 – 24 5 6
25 – 27 7 4
0 2.33
TOTALES
33. Cs. de la Educación Estadística Educativa Lic. Elizabeth C. Gamón C.
33
Para las frecuencias suavizadas se utiliza la formula:
Hallando:
34. Cs. de la Educación Estadística Descriptiva
34
Tipos de curvas de frecuencias: se presentan en diferentes formas.
Simétrica o bien formada Sesgada a la derecha (sesgo positivo)
Sesgada a la izquierda (sesgo negativo) En forma de J
35. Cs. de la Educación Estadística Descriptiva
35
En forma de J invertido En forma de U
3.4. OTRAS GRAFICAS:
a) Diagrama circular o (ciclograma)
Es una representación grafica de mucha aplicación, particularmente cuando
toma pocos valores o cuando la investigación abarca pocos aspectos.
Para su elaboración se utiliza la circunferencia siendo necesario que los
valores absolutos y/o porcentuales, sean traducidos en grados a cada
elemento de la variable le corresponde un sector de la circunferencia.
También se conoce con el nombre de gráfico de sectores o pastel.
Pasos a seguir en su graficación:
1) Se traza una circunferencia.
2) Se distribuye la superficie entre el número o distintos valores que
toma la variable
Para calcular cada área se determina esto en grados, para el cual se aplica la
regla de tres simple así:
100% 360º
Pi (%) x
Donde:
Pi (%) porcentaje que representa la circunferencia de cada valor particular de la
variable con relación a la población total.
36. Cs. de la Educación Estadística Descriptiva
36
360º grados que corresponde a una circunferencia:
Ejemplo 3:
En una prueba de desarrollo psicosocial aplicada a un grupo de niños en una
ciudad, se detecto las siguientes areas de desarrollo promedio:
Motricidad gruesa media: 50 niños
Motricidad fina media: 63 niños
Audicion y lenguaje medio: 70 niños
Personal y social: 48 niños
CUADRO Nº 6
ZONA MIRAFLORES
DESARROLLO PSICOSOCIAL ,
SEGÚN AREAS DE DESARROLLO PROMEDIO
LA PAZ - 2.012
AÉREAS DE DESARROLLO ni %
ANGULO EN
GRADOS
Motricidad gruesa media 50 21.6 78
Motricidad fina media 63 27.3 98
Audición y lenguaje media 70 30.3 109
Personal y social 48 20.8 75
TOTAL
231 100 360º
37. Cs. de la Educación Estadística Descriptiva
37
GRAFICO Nº 8
ZONA MIRAFLORES
DESARROLLO PSICOSOCIAL ,
SEGÚN AREAS DE DESARROLLO PROMEDIO
LA PAZ - 2.012
Fuente: Del Cuadro No. 6
b) Grafico de barras simples, compuestas y mixtas.
Estas formas de representación son de mucha utilidad en un trabajo de
investigación.
Ejemplo 4:
La siguiente información corresponde al nivel de instrucción que alcanzaron 150
personas.
Motricidad gruesa
media
21,6%
Motricidad fina media
27,3%
Audición y lenguaje
media
30,3%
Personal y social
20,8%
38. Cs. de la Educación Estadística Descriptiva
38
CUADRO Nº 7
ZONA Nº 5
NUMERO DE PERSONAS ENCUESTADAS POR NIVEL DE INSTRUCCIÓN, SEGÚN SEXO
LLALLAGUA - 2012
NIVEL DE
INSTRUCCIÓN
Sexo
Total
Masculino femenino
Analfabeto
Primario
Secundario
Superior
28
35
12
5
22
31
13
4
50
66
25
9
Total 80 70 150
FUENTE: Elaboración propia en base a encuestas
BARRAS SIMPLES
GRAFICO Nº 9
ZONA Nº 5
NUMERO DE PERSONAS ENCUESTADAS POR NIVEL DE INSTRUCCIÓN, SEGÚN SEXO
LLALLAGUA - 2012
50
66
25
9
0
10
20
30
40
50
60
70
Analfabeto Primario Secundario Superior
Nivel de Instrucción
No.
de
Personas
FUENTE: Del Cuadro No. 7
39. Cs. de la Educación Estadística Descriptiva
39
BARRAS COMPUESTAS
GRAFICO Nº 10
ZONA Nº 5
NUMERO DE PERSONAS ENCUESTADAS POR NIVEL DE INSTRUCCIÓN, SEGÚN SEXO
LLALLAGUA - 2012
FUENTE: Del Cuadro Nº 7
BARRAS MIXTAS
GRAFICO Nº 11
ZONA Nº 5
NUMERO DE PERSONAS ENCUESTADAS POR NIVEL DE INSTRUCCIÓN, SEGÚN SEXO
LLALLAGUA – 2012
28
35
12
5
22
31
13
4
0
10
20
30
40
50
60
70
Analfabeto Primario Secundario Superior
Nivel de Instrucción
No.
de
Personas
Femenino
Masculino
FUENTE: Del Cuadro Nº 7
40. Cs. de la Educación Estadística Descriptiva
40
c) Pictogramas o pictógrafas
Representación en base a dibujos de una población de personas, conjunto de
animales o de un fenómeno determinado. Son utilizados en una forma que llama la
atención, muchos de estos pictogramas muestran gran originalidad e ingeniosidad
en el arte de la presentación de datos.
Ejemplo 5:
En el siguiente cuadro se muestra el número de estudiantes encuestados del 6to.
grado de secundaria de las diferentes Unidades Educativas del Municipio de
Llallagua área concentrada.
CUADRO Nº 8
MUNICIPIO DE LLALLAGUA
NUMERO DE ESTUDIANTES ENCUESTADOS
DEL 6TO. GRADO DE SECUNDARIA, SEGÚN SEXO
GESTIÓN 2.011
(Cada figura representa el 10% de individuos).
FUENTE: Elaboración propia, en base a encuestas.
d) Pirámide poblacional o demográfica
Se aplica cuando se tiene un censo de población para su elaboración se
colocan en las rectas horizontales las cantidades (Nº de habitantes) y en la
parte vertical las familias o clases en las que están organizadas la
población en su conjunto.
SEXO TOTAL %
Varones
Mujeres
117
157
42.7
53.7
Totales 274 100%
41. Cs. de la Educación Estadística Descriptiva
41
Ejemplo 6:
CUADRO Nº 9
POBLACION
ORGANIZADA
EN EDADES
V M T
0 – 10 8 12 20
10 – 20 20 15 35
20 – 30 25 15 40
30 – 40 32 28 60
40 – 50 20 30 50
50 – 60 24 16 40
60 – 70 15 15 30
70 o más 5 3 8
Grafico nº 12
42. Cs. de la Educación Estadística Descriptiva
42
e) Grafico lineal o tendencia:
Llamado también serie cronológica, se usa para representar una
distribución de frecuencias dada en el tiempo (días, semanas, meses,
años, etc.)
Se pueden incluir hasta tres hechos o situaciones razón por lo cual pueden ser
simples o compuestas.
Gráfico Lineal Simple
Ejemplo 7:
CUADRO Nº 10
UNIVERSIDAD “X”
EGRESADOS POR AÑOS 2003 - 2010
AÑOS CANTIDAD
2003 300
2004 710
2005 950
2006 820
2007 790
2008 980
2009 1085
2010 1220
FUENTE: Universidad “X”. Secretaria General.
43. Cs. de la Educación Estadística Descriptiva
43
GRAFICO Nº 13
UNIVERSIDAD “X”
EGRESADOS POR AÑOS 2003 - 2010
FUENTE: Del Cuadro Nº 10
Grafico lineal compuesto:
Ejemplo 8:
CUADRO Nº 11
COLEGIO “X”
ESTUDIANTES MATRICULADOS POR AÑOS, SEGÚN SEXO
2005 - 2010
AÑOS
SEXO
TOTAL
MASCULINO FEMENINO
2005 115 130 245
2006 120 110 230
2007 150 250 400
2008 425 375 800
2009 580 430 1010
2010 700 650 1350
FUENTE: Dirección Colegio
44. Cs. de la Educación Estadística Descriptiva
44
GRAFICO Nº 14
COLEGIO “X”
ESTUDIANTES MATRICULADOS POR AÑOS, SEGÚN SEXO
2005 - 2010
FUENTE: Del Cuadro 11
EJEMPLOS DE APLICACIÓN:
La siguiente presentación estadística de resultados de algunas variables de
estudio, hace referencia a un trabajo de investigación en la asignatura de
Estadística Educativa, realizada en la gestión 2.012 por estudiantes de la Carrera
Ciencias de la Educación 1er. año, presentado a la Feria de Investigación
organizada por la Dirección General de Investigación de la Universidad Nacional
Siglo XX. de la misma gestión, ocupando un sitial muy importante para la carrera
en uno de los tres primeros lugares cuyo tema fue “Orientación Motivaciónal y
Preferencia de Carreras para Profesionalización en estudiantes del 6to. Grado de
secundaria del Área concentrada del Municipio de LLallagua, gestión 2.012”
45. Cs. de la Educación Estadística Descriptiva
45
CUADRO Nº 1
ESTUDIANTES DEL 6to. GRADO DE SECUNDARIA DEL AREA CONCENTRADA DEL
MUNICIPIO DE LLALLAGUA
OBJETIVO QUE PERSIGUE EN LA VIDA
GESTIÓN 2.012
INDICADORES FRECUENCIA %
Ser profesional 214 87
Trabajar 7 3
Formar una familia 1 1
NS/NR 22 9
Total 244 100
Fuente de información: Elaboración propia, en base a encuesta.
GRAFICO Nº 1
Fuente de información: Del cuadro Nº 1
De un total de 244 estudiantes: el 87% menciona ser profesional, en porcentajes mínimos del 3% y
1% elije trabajar y formar una familia respectivamente, lo que llama la atención que un 9% no sabe
ó no responde
Lo que significa que una gran mayoría tiene como objetivo en la vida ser profesional.
Estudiantes de 6to. Grado de Secundaria del Area Concentrada del Municipio de Llallagua
Objetivo que Persigue en la Vida
Gestión 2012
46. Cs. de la Educación Estadística Descriptiva
46
CUADRO Nº 2
ESTUDIANTES DEL 6to. GRADO DE SECUNDARIA DEL AREA CONCENTRADA DEL
MUNICIPIO DE LLALLAGUA
CONOCIMIENTO DEL NÚMERO DE CARRERAS CON LAS QUE CUENTA LA UNIVERSIDAD
NACIONAL SIGLO XX
GESTIÓN 2.012
INDICADORES FRECUENCIA %
SABE 80 33
NS / NR 164 67
TOTAL 244 100
Fuente de información: Elaboración propia, en base a encuesta.
GRAFICO Nº 2
Fuente de información: Del cuadro Nº 2
De un total de 224 alumnos encuestados sobre el 100%, el 33% sabe cuántas carreras existen y el
67% no sabe cuántas carreras existen en la universidad esto por falta de información.
Es decir que la mayoría de los estudiantes no sabe con cuantas carreras cuenta nuestra casa
superior de estudios.
Estudiantes de 6to. Grado de Secundaria del Area Concentrada del Municipio de Llallagua
Conocimiento del Número de Carreras con las que Cuenta la Universidad
Nacional “Siglo XX”
Gestión 2012
47. Cs. de la Educación Estadística Descriptiva
47
CUADRO Nº 3
ESTUDIANTES DEL 6to. GRADO DE SECUNDARIA DEL AREA CONCENTRADA DEL
MUNICIPIO DE LLALLAGUA
PREFERENCIA DE CARRERA SI DECIDE ESTUDIAR EN LA UNSXX.
GESTIÓN 2.012
CARRERAS FRECUENCIA %
Enfermería 24 10
Laboratorio clínico 0 0
Bioquímica 11 5
Odontología 7 3
Medicina 47 19
Cs. De la comunicación 6 2
Derecho 23 9
Cs. De la Educación 7 3
Contaduría publica 20 8
Ing. De minas 0 0
Ing. Agronómica 9 4
Ing. Mecánica Auto motriz 7 3
Ing. Informática 3 1
Ing. Electromecánica 10 4
Ing. Civil 21 9
NS/NR 49 20
TOTAL 244 100
Fuente de información: Elaboración propia, en base a encuesta.
48. Cs. de la Educación Estadística Descriptiva
48
GRAFICO Nº 3
Fuente de información: DeL cuadro Nº 3
De un total de 244 estudiantes encuestados la preferencia de carreras mencionadas son: el 19 %
por Medicina, el 10% Enfermería, 9% derecho, 9% Ing. Civil, 8% Contaduría pública , 5%
Bioquímica, 4% Ing. Agronómica, 4% Ing. Electromecánica, el 3% odontología, el 3% Cs. de la
Educación, 3% Ing. Mecánica Automotriz, 2% Cs. de la Comunicación, ,1% Ing. Informática, Las
carreras de Laboratorio Clínico e Ingeniería Minas - Topografía no tienen preferencia y el 20% no
tienen la carrera de preferencia ó no respondieron.
La carrera de mayor preferencia es Medicina, seguida por Enfermería, las demás carreras en
porcentajes menores, lo que llama la atención que existen dos carreras sin preferencia alguna, y en
porcentaje relativamente alto los futuros bachilleres no responden ó no tienen carrera de
preferencia.
Estudiantes de 6to. Grado de Secundaria del Area Concentrada del Municipio de Llallagua
Preferencia de Carrera Si Decide Estudiar en la UNSXX
Gestión 2012
49. Cs. de la Educación Estadística Descriptiva
49
CAPITULO IV
MEDIDAS DE TENDENCIA CENTRAL
4.1 INTRODUCCIÓN
Una tabla de frecuencias nos representa un resumen de los datos observados
describiendo la forma en que se distribuyen los elementos de la población. Pero
frecuentemente se necesita una sola medida que describe la naturaleza de los
datos en su conjunto, vale decir un solo número que sea representativo.
Lo que significa que dicho valor debe reflejar la tendencia de valores individuales
los que, generalmente están distribuidos alrededor de cierto valor central, por esta
razón reciben el nombre de medidas de tendencia central.
4.2 SIMBOLOGÍA NECESARIA PREVIA
a. NOTACIÓN CON INDICE Ó SUB – INDICE
El símbolo Xi , Se lee “ X sub i”
Denota cualesquiera de los N valores X1 , X2 , X3, …………, XN
que una variable X puede asumir.
La letra i se llama índice ó subíndice.
b. Notación sumatoria: El símbolo Xi
Xi = X1 + X2 + X3 + X4 + X5 + X6 + …………+ X N
Ejemplos : Desarrollar las siguientes sumatorias
1. Σ Xj Yj = X1 Y1 + X2 Y2 + X3 Y3 + ………..+ XN YN
2 Σ a Xp = a X1 + a X2 + a X3 + ………..+ a Xn
3. Σ ( Yi – 3 )2
= ( Yi – 3 )2
+ ( y2 – 3 )2
+ (Y3 – 3 )2
+ ( Y4 – 3 )2
4. Σ Xj = X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9 + X10
50. Cs. de la Educación Estadística Descriptiva
50
5. Σ Xi = X1 + X2 + X3 + X4 + X5 +X6
N N
6. Dadas las variables X e Y
X1 = 2 , X2 = -5 , X3 = 4 , X4 = -8
Y1 = -3 , Y2 = - 8 , Y3 = 10 , Y4 = 6
Hallar el valor de las siguientes sumatorias:
a) Σ Xi = X1 + X2 + X3 + X4
= 2 + ( - 5 ) + 4 + ( - 8 )
= - 7
b) Σ Yi = Y1 + Y2 + Y3 + Y4
= (- 3) + (- 8) + 10 + 6
= 5
c) Σ Xi Yi = X1Y1 + X2Y2 + X3Y3 + X4Y4
= (2) (- 3) + (- 5) (- 8) + (4)(10) + (- 8)(6)
= 26
d) Σ Xj2
= ( X 1 ) 2
+ ( X 2 )2
+ ( X3 )2
+ ( X 4 )2
= 22
+ (- 5)2
+ 42
+ (- 8)2
= 109
e) ( Σ Xj ) ( Σ Yj ) = ( X1 + X2 + X3 + X 4 ) ( Y1 + Y2 + Y3 + Y4 )
= (-7) (5)
= - 35
4.3 MEDIDAS DE TENDENCIA CENTRAL.- DEFINICIÓN Y DESCRIPCIÓN
Son estadígrafos que permiten hallar un solo valor numérico e indican el centro de
un conjunto de datos.
DESCRIPCION DE LAS MEDIDAS DE TENDENCIA CENTRAL
4.3.1 Media Aritmética o Promedio Aritmético
Es la medida mas estable y se representa por: X se lee “ X barra”.
51. Cs. de la Educación Estadística Descriptiva
51
La más conocida y utilizada, se obtiene de acuerdo a lo siguiente:
a) LA MEDIA ARITMÉTICA EN DATOS NO AGRUPADOS EN CLASES Ó
CATEGORÍAS
Se halla sumando todos los datos de la distribución y dividiendo dicha suma entre
el total de los datos.
Se expresa mediante la fórmula:
Σ Xi
X Que es lo mismo : X X1 + X2 + X 3 + ………. + Xn
N N
Donde Xi: Suma de todos los datos observados
N: Numero total de datos
Ejemplo 7:
El coeficiente intelectual (CI.) de 5 personas es el siguiente:
100, 95, 102, 115, y 98
Hallando la media aritmética:
X = Σ Xi = X1 + X2 + X3 + X4 + X5
N 5
X = 100 + 95 +102 + 115 + 98
5
X = 510
5
X = 102
Interpretación: El coeficiente de Inteligencia promedio de las 5 personas es de
102.
52. Cs. de la Educación Estadística Descriptiva
52
b. EN DATOS AGRUPADOS EN CLASES Ó CATEGORÍAS
Se utiliza la fórmula:
Σ Y ni
Y
N
Y Y n1 + Y n2 + Y n3 + ………….+ Y nN
N
Donde: Y´ i : Es la marca de clase
N número total de las observaciones
Ejemplo 8:
La siguiente información hace referencia al número de estudiantes con dificultades
de aprendizaje en 40 establecimientos educativos del área dispersa.
Número de estudiantes
Y i – 1 - Yi
Numero de estab..
Educativos
Ni Y´i Y ´i ni
0 - 2 10 1 ( 1 ) (10)
3 - 5 17 4 ( 4 ) (17)
6 - 8 5 7 ( 7 ) ( 5)
9 - 11 6 10 ( 10 ) ( 6 )
12 - 14 1 13 ( 13 ) ( 1)
15 - 17 1 16 ( 16 ) ( 1)
Totales 40 Yi ni = 202
53. Cs. de la Educación Estadística Descriptiva
53
Reemplazando los valores calculados:
Y = Σ Yi ni = 202 = 5.05
N 40
Y = 5
Interpretación: Los establecimientos Educativos del área dispersa tienen como
promedio a 5 estudiantes con dificultades de aprendizaje
Nota: Este método también se puede utilizar cuando los intervalos de clase no
tienen igual tamaño.
c. PROMEDIO ARITMÉTICO PONDERADO
Es aquel promedio que se utiliza cuando prevalece cierto peso de importancia o
repetición de los datos en el estudio.
Se halla mediante la siguiente fórmula:
X = Σ Xi ni S uma del producto de cada dato por peso, importancia ó repetición
Σ ni Suma de todos los pesos, importancia o repetición
Ejemplo 9:
En una Universidad, 20 Docentes tienen 5 años de servicio, 13 docentes tienen
10 y 12 tienen 15. Hallar el tiempo promedio de servicio de los docentes.
TIEMPO DE SERVICIOS
Xi
NÚMERO DE DOCENTES
ni Xi ni
5
10
15
20
13
12
X1 n1 = (5) (20)
X2 n2 = (10) (13)
X3 n3 = (15) (12)
TOTALES N = 45 Xi ni = 410
X = Σ Xi ni = x1 n1+ x2 n2 + x3 n3
ni n1 + n2 + n3
54. Cs. de la Educación Estadística Descriptiva
54
X = 410
45
X = 9.11
Interpretación: El tiempo de servicios promedio de los docentes en la Universidad
es de 9 años.
c. VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA
VENTAJAS:
Es útil cuando los datos siguen aproximadamente una progresión aritmética
o están distribuidos en forma normal o simétrica.
Es un estadígrafo de gran estabilidad, porque toma en cuenta a todos los
datos.
Nos permite estimar y probar parámetros en estadística inferencial.
DESVENTAJAS:
Como incluye a todos los datos, puede ser afectado por valores
extremos.
Cuando los datos tiene clases abiertas en los extremos, no es
recomendable calcular la media aritmética.
4.3.2 MEDIANA (Me)
En un conjunto de datos ordenados según en magnitud, es el valor medio o la
media aritmética de los dos valores medios, que significa que por encima del
mismo se encuentran el 50 % de los casos, y por debajo el 50 % restante.
a. PARA DATOS NO AGRUPADOS EN CLASES Ó CATEGORÍAS
El cálculo de la mediana es directo, en el conjunto de datos puestos en serie en
forma creciente o decreciente, tomando en cuenta lo siguiente:
Si la serie es impar, la mediana será el valor central.
Si la serie es par la mediana, será el promedio de los dos valores medios
55. Cs. de la Educación Estadística Descriptiva
55
Ejemplos:
10. En las series de números siguientes hallar la mediana
a. 1, 2, 3, 4, 5 Me = 3
b. 8, 6, 9, 7, 5 , ordenando: 5, 6, 7, 8, 9 Me = 7
c. 1, 2, 3, 4 Me = 2 + 3 = 5 = 2.5
2 2
d. 3, 4, 4, 4, 5, 6, 6, 7, 7, 7, 7 Me = 6
11. Hallar la mediana de las edades de 7 personas: 11, 12, 15, 13, 48, 10, 7
Ordenando los datos en forma creciente:
7, 10, 11, 12, 13, 15, 48
Me
Me = 12
Interpretación: El 50% de las personas tienen como máximo 12 años , el resto
tiene más de 12 años.
b. PARA DATOS AGRUPADOS EN CLASES Ó CATEGORÍAS
Se define como:
N / 2 - (∑ n )1
Me = Y i -1 + C
n mediana
Donde:
Y i -1 : Limite real inferior del intervalo de la clase mediana
N : Número total de datos ( frecuencia total )
(∑ n )1 : Suma de todas las frecuencias absolutas de todas las clases por
debajo de la clase mediana.
nmediana : Frecuencia absoluta de la clase mediana
C : Tamaño del intervalo de la clase mediana.
56. Cs. de la Educación Estadística Descriptiva
56
Ejemplo 12:
En el ejemplo anotado anteriormente con relación al número de horas semanales
que dedican los niños menores de 6 años de edad, a ver la televisión. Cuya
investigación realizada en 25 niños:
Número de horas
Semanales
Y i -1 - Yi
ni
Ni
10 - 12 2 2
13 - 15 2 4
16 - 18 3 7
19 - 21 6 13
22 - 24 5 18
25 - 27 7 25
Totales 25
Pasos a seguir para el cálculo de la mediana:
Paso 1: Se halla N / 2 = 25 / 2 = 12.5
Paso 2: Para determinar la clase que contiene a la mediana
Se ubica el valor de 12.5 en la columna de la frecuencia acumulada, que
corresponde entre los valores N3 y N4 , es decir:
entre: 7 < 12.5 < 13
Entonces la clase de la mediana será la fila que corresponde al inmediato
superior de la frecuencia acumulada del valor N / 2.
Y i-1 - Y i
19 - 21
ni
6
Ni
13
57. Cs. de la Educación Estadística Descriptiva
57
Paso 3: Se determina los elementos que se requieren para el cálculo de la
mediana en la relación dada:
Y i – 1 = 19 ; ( ∑ n)1 = 7 ; n mediana = 6 ; c = 3
Reemplazando en la relación:
Me = 19 + 12.5 - 7 . 3
6
Me = 21.75
Interpretación: El 50 % de los niños ve la televisión como máximo 21.25 horas
semanales, el resto 50 % de los niños ve más de 21.25 horas semanales.
c. VENTAJAS Y DESVENTAJAS DE LA MEDIANA
VENTAJAS
La mediana es un estadígrafo que no esta afectada por los valores
extremos, y por lo tanto es más representativa que la media aritmética.
Es útil cuando los datos agrupados tienen clases abiertas en los extremos.
DESVENTAJAS
Se deben organizar los datos antes de realizar cualquier tipo de cálculo
para hallar la mediana esto lleva tiempo para cualquier conjunto de datos
con muchos elementos.
No se puede utilizar para cálculos estadísticos avanzados , asi por ejemplo
en la estadística inferencial y el muestreo.
4.3.3 LA MODA (Mo)
Es un estadígrafo que nos indica el valor o cualidad que se representa con más
frecuencia dentro de una variable.
a. PARA DATOS NO AGRUPADOS EN CLASES O CATEGORÍAS
Ejemplos:
En los siguientes series de números determinar la moda:
58. Cs. de la Educación Estadística Descriptiva
58
13. 3, 3, 5, 6, 8, 8, 8, 9, 9, 9, 9, 10 11, 12, 15, 18 Mo = 9
14. 2, 3, 5, 6, 8, 10, 11, 12, 15 Mo = no tiene
15. 5, 6, 7,14 , 14, 14, 17, 18, 19, 20, 20, 20, 22 Mo = 14, 20 bimodal
16. La información corresponde al coeficiente intelectual de un grupo de
estudiantes:
100, 95, 102, 115, 98, 95, 95
La Mo = 95
Interpretación: la mayoría de los estudiantes tiene un coeficiente intelectual de 95
Ejemplo 17:
Dada la información como se muestra en el siguiente cuadro:
SEXO FRECUENCIA
MASCULINO
FEMENINO
30
15
La moda también es útil, cuando la variable como en este caso pertenece a la
escala nominal.
Mo = 30
Interpretación: La mayoría de los estudiantes son varones.
b. PARA DATOS AGRUPADOS EN CLASES O CATEGORÍAS
Se define como:
Δ1
M0 = Y i -1 + . C
Δ1 + Δ2
59. Cs. de la Educación Estadística Descriptiva
59
Donde:
Y i-1 : Limite real inferior de la clase modal
Δ1 : Exceso de la frecuencia modal sobre la frecuencia de clase contigua
Inferior.
Δ2 : Exceso de la frecuencia modal sobre la frecuencia de clase contigua
Superior.
C : Tamaño del intervalo de la clase modal
La clase modal se ubica en aquella clase que tiene la mayor frecuencia.
Ejemplo 18:
En el ejemplo anotado anteriormente con relación al número de horas semanales
que dedican los niños menores de 6 años de edad, a ver la televisión. Cuya
investigación realizada en 25 niños:
Número de horas
Semanales
Y i -1 - Yi
ni
10 - 12 2
13 - 15 2
16 - 18 3
19 - 21 6
22 - 24 5
25 - 27 7
Totales 25
Pasos a seguir para el cálculo de la moda:
Paso 1: Se ubica la mayor frecuencia absoluta:
En este caso n6 = 7
Paso 2: Determinando la clase modal
60. Cs. de la Educación Estadística Descriptiva
60
La clase modal será:
Y i-1 – Yi ni
25 - 27 7
Paso 3: Se determina los elementos que se requieren para el cálculo de la
moda.
Y i – 1 = 25 ; Δ1 = 7 – 5 = 2 ; Δ2 = 7 – 0 = 7 ; C = 3
Reemplazando en la relación para el cálculo de la moda:
Mo = 25 + 2 . 3
2 + 7
Mo = 25.67
Interpretación: La mayoría de los niños ven la televisión 25.67 horas semanales.
c. VENTAJAS Y DESVENTAJAS DE LA MODA
VENTAJAS
Al igual que la mediana, no esta afectada por valores extremos.
Puede usarse cuando los datos agrupados tienen clases abiertas en los
extremos.
Se usa también para variables que pertenecen a la escala nominal.
DESVENTAJAS
No es representativa a menos que la distribución contenga un gran número
de datos y exista repetición significativa de ellos.
Cuando la serie tiene dos, tres o más modas se hace difícil su
interpretación y comparación.
61. Cs. de la Educación Estadística Descriptiva
61
4.3.4 LA MEDIA GEOMÉTRICA (Yg)
Es un estadígrafo que nos indica el porcentaje promedio de los datos .Se define
como: La raíz de indice “ n “ del producto continuado de los n datos
X g = X1. X2 . X3 …………..Xn
Donde:
X n: valores de los datos
N : número de datos
a. PARA DATOS NO AGRUPADOS EN CLASES Ó CATEGORÍAS
Ejemplo 19: EL índice de crecimiento de niños vacunados a través de años fue el
siguiente:
2. 009: 185% 2.010 : 230% 2.011: 150%
EL crecimiento promedio será:
3
X g = X1 . X2 . X3
3
X g = (185). (230). (150) = 6.382.500 = 185.5 %
Interpretación: EL índice de crecimiento anual promedio de niños vacunados es
de 185.5 %.
b. PARA DATOS AGRUPADOS EN CLASES Ó CATEGORÍAS
Se define como:
Yg = Antilog Σ ni log yi
N
Donde:
ni: Frecuencia absoluta
Yi: Valores de la variable
N . Número total de datos
Función logarítmica y antilogarítmica
62. Cs. de la Educación Estadística Descriptiva
62
Ejemplo: En un trabajo de investigación, una de las variables de estudio hace
referencia a los casos de delito de robo en (%), según el reporte de puestos
policiales.
C. VENTAJAS Y DESVENTAJAS DE LA MEDIA GEOMÉTRICA
VENTAJAS
Es más importante e indicado calcular la media geométrica para series
temporales, es decir para cualquier variable que cambia a medida que pasa el
tiempo así como demografía, para crecimientos poblacionales, natalidad,
mortalidad y otros.
DESVENTAJAS
La media geométrica no se puede calcular cuando alguno de los valores de
la variable es cero.
Esta restringida solo a cantidades positivas por la presencia de la
operación aritmética de raíz cuadrada.
4.4 MEDIDAS DE POSICIÓN O CUANTILES.- DEFINICIÓN
Estadígrafos que dividen a una distribución de frecuencias en 10, 25 y cien partes
iguales.
DESCRIPCIÓN DE LOS CUANTILES ( Qi )
4.4.1 CUARTILES
Son estadígrafos que dividen a la información en cuatro partes iguales, donde
cada uno de ellos incluye el 25 % de las observaciones.
25% 25% 25% 25%
---------------------------------
Primer cuartil
Q1
-----------------------------------------------------------------------
Segundo cuartil
Q2
-----------------------------------------------------------------------------------------------------------
Tercer cuartil
Q3
Si se estudia el 25 % de las observaciones se dice que se está analizando el
cuartil 1 ( Q1 ).
Interpretación
63. Cs. de la Educación Estadística Descriptiva
63
Por ejemplo el cuartel Q1: Como el límite máximo del 25 % de las observaciones
inferiores ó como el límite mínimo del 75 % de las observaciones superiores.
Los cuartiles se obtienen utilizando la siguiente relación:
Qj = Y i - 1 + ( j N) / 4 - ( Σ n )1 . c
nq
Donde:
j = 1, 2, 3 según se trate de hallar el primer, segundo o tercer cuartel
Y i – 1: Límite real inferior
N : Total de observaciones
(Σ n )1 : Suma de las frecuencias absolutas simples de todos las clases
anteriores a la clase cuartílica.
nq : Frecuencia absoluta de la clase cuartílica
Ejemplo 20:
En el ejemplo anotado anteriormente con relación al número de horas semanales
que dedican los niños menores de 6 años de edad, a ver la televisión. Cuya
investigación fue realizada en 25 niños
Número de horas
Semanales
Y i -1 - Yi
ni Ni
10 - 12 2 2
13 - 15 2 4
16 - 18 3 7
19 - 21 6 13
22 - 24 5 18
25 - 27 7 25
Totales 25
Calcular el cuartil primero: Q1
64. Cs. de la Educación Estadística Descriptiva
64
Pasos a seguir para el cálculo de Q1:
Paso 1: Se halla N / 4 = 25 / 4 = 6.25
Paso 2: Para determinar la clase que contiene a Q1
Se ubica el valor de 6.25 en la columna de la frecuencia acumulada, que
corresponde entre los valores N2 y N3 , es decir:
entre: 4 < 6.25 < 7
Entonces la clase del primer cuartil será la fila que corresponde al inmediato
superior de la frecuencia acumulada del valor N / 4.
Y i-1 - Y i
16 - 18
ni
3
Ni
7
Paso 3: Se determina los elementos que se requieren para el cálculo de la
mediana:
Y i – 1 = 16 ; ( Σ n )1 = 4 ; nQ = 3 ; c = 3
Reemplazando en la relación: Q1 = 16 + 6.25 - 4 . 3
3
Q1 = 18.25
Interpretación: El 25 % de los niños ve la televisión como máximo 17.75 % horas
semanales.
4.4.2 DECILES
Son estadígrafos que dividen a la información en diez partes iguales, donde cada
uno de ellos incluye el 10 % de las observaciones.
10% 10% 10% …………… 10% 10% = 100%
-----------------
Primer
decil (D1)
-------------------------------
Segundo
Decil (D2)
-------------------------------------------------
Tercer
Decil (D3)
………………………………………………………………………...
Noveno
Decil (D9)
65. Cs. de la Educación Estadística Descriptiva
65
Interpretación
El primer Decil D1: Como el límite máximo del 10 % de las observaciones inferiores
ó como el límite mínimo del 90 % de las observaciones superiores.
El segundo Decil D2: Como el límite máximo del 20 % de las observaciones
inferiores ó como el límite mínimo del 80 % de las observaciones superiores.
Los Deciles se obtienen utilizando la siguiente relación:
Di = Y i - 1 + ( j N) / 10 - ( Σ n )1 . C
nD
Donde:
i = 1 , 2, 3, ……….., 9 según se trate de hallar el primer, segundo , tercero
………………………..noveno decil.
Y i – 1 : Limite real inferior
N : Total de observaciones
( Σ n )1 = Suma de las frecuencias absolutas simples de todos las clases
anteriores a la clase decílica.
nD = frecuencia absoluta de la clase decílica
Ejemplo:
En el ejemplo anotado anteriormente con relación al número de horas semanales
que dedican los niños menores de 6 años de edad, a ver la televisión. Cuya
investigación fue realizada en 25 niños
66. Cs. de la Educación Estadística Descriptiva
66
Número de horas
Semanales
Y i -1 - Yi
ni Ni
10 - 12 2 2
13 - 15 2 4
16 - 18 3 7
19 - 21 6 13
22 - 24 5 18
25 - 27 7 25
Totales 25
Se calculara el séptimo decil D7
Pasos a seguir
Paso 1: Se halla i N / 10 con i = 7
7 N / 10 = 7. 25 / 10 = 17.5
Paso 2: Para determinar la clase que contiene a D7
Se ubica el valor de 17.5 en la columna de la frecuencia acumulada, que
corresponde entre los valores N4 y N5 , es decir:
entre: 13 < 17.5 < 18
Entonces la clase del séptimo decil será el que corresponde al inmediato superior
del valor 7N / 10.
Y i -1 - Y i
22 - 24
Ni
5
Ni
18
Paso 3: Se determina los elementos que se requieren para el cálculo del D7:
Y i – 1 = 22 ; ( Σ n )1 = 13 ; nQ = 5 ; c = 3
67. Cs. de la Educación Estadística Descriptiva
67
Reemplazando en la relación: D7 = 22 + 17.5 - 13 . 3
5
D7 = 24.7
Interpretación: El 70 % de los niños ve la televisión como máximo 24.7 horas
semanales.
4.4.3 PERCENTILES
Son estadígrafos que dividen a la información en cien partes iguales, donde cada
uno de ellos incluye el 1 % de las observaciones.
1% 1% 1% …………… 1% 1% = 100%
-----------------
Primer
Percentil (P1)
-------------------------------
Segundo
Percentil (P2)
-------------------------------------------------
Tercer
Percentil (P3)
………………………………………………………………………...
Nonagésimo
noveno
Percentil (P99)
Interpretación
El Percentil P15: Como el límite máximo del 15 % de las observaciones inferiores ó
como el límite mínimo del 85 % de las observaciones superiores.
El Percentil P85: Como el límite máximo del 85 % de las observaciones inferiores
ó como el límite mínimo del 15 % de las observaciones superiores.
Los Percentiles se obtienen utilizando la siguiente relación:
Pi = Y i - 1 + ( j N) / 100 - ( Σ n )1 . C
np
Donde:
i = 1 , 2, 3, ……….., 99 según se trate de hallar el primer, segundo , tercero
68. Cs. de la Educación Estadística Descriptiva
68
………………………..nonagésimo percentil.
Y i – 1 : Limite real inferior de la clase percentílica
N : Total de observaciones
( Σ n )1 : Suma de las frecuencias absolutas simples de todos las clases
anteriores a la clase percentílica.
nD = frecuencia absoluta de la clase percentílica
Ejemplo 21:
En el ejemplo anotado anteriormente con relación al número de horas semanales
que dedican los niños menores de 6 años de edad, a ver la televisión. Cuya
investigación fue realizada en 25 niños
Número de horas
Semanales
Y i -1 - Yi
ni Ni
10 - 12 2 2
13 - 15 2 4
16 - 18 3 7
19 - 21 6 13
22 - 24 5 18
25 - 27 7 25
Totales 25
Se calculara el P35
El procedimiento de cálculo de la clase percentílica es similar al de los otros
cuantiles, tomando en cuenta el término:
69. Cs. de la Educación Estadística Descriptiva
69
i N / 100 = 35 ( 25) / 100 = 8.75
Entonces la clase del P35 será la fila que corresponde al inmediato superior de
la frecuencia acumulada del valor de 8.75
Y i -1 - Y i
19 - 21
ni
6
Ni
13
Los elementos que se requieren para el cálculo de P35:
Y i – 1 = 19 ; ( Σ n )1 = 7 ; nQ = 6 ; c = 3
Reemplazando en la relación: P35 = 19 + 8.75 - 7 . 3
6
P35 = 19.87
Interpretación: El 35 % de los niños ve la televisión como máximo 19.87 horas
semanales.
70. Cs. de la Educación Estadística Descriptiva
70
CAPITULO V
MEDIDAS DE DISPERSIÓN
5.1. INTRODUCCIÓN
En temas anteriores se estudio a las medidas de tendencia central, estas
medidas al igual que los cuantiles son solo parte de las técnicas necesarias para
describir las características del conjunto de observaciones. Si solo se considera a
las medidas de tendencia central, podríamos llegar a conclusiones erróneas o
equivocadas. Así por ejemplo estamos evaluando o comparando el tiempo en
minutos que tardan 6 niñas y 6 niños de igual edad para desarrollar la misma tarea
el tiempo promedio obtenido de los dos grupos fue el siguiente:
Niñas: 15.2 minutos
Niños: 14.7 minutos
Concluimos diciendo que las niñas fueron las que utilizaron mayor tiempo para
realizar su tarea.
Sin embargo si analizamos el tiempo utilizado por cada niño tenemos:
Concentrados Niñas: 14, 16, 13, 15, 17, 16 X = 15.17
Están más dispersos Niños: 16, 12, 15, 18, 13, 14 X = 14.67
Por esta razón para el análisis e interpretación de datos, se hace necesario el uso
de otros estadígrafos que nos permitan ver el grado de variabilidad o dispersión de
las observaciones.
5.2. DEFINICIÓN DE MEDIDAS DE DISPERSIÓN
Se llama dispersión al grado en que los datos numéricos tienden a extenderse
alrededor de algún valor medio.
Son estadígrafos que miden la dispersión o desviación de los datos con respecto
al valor central.
DESCRIPCIÓN DE LAS MEDIDAS DE DISPERSIÓN:
71. Cs. de la Educación Estadística Descriptiva
71
5.3. RANGO
a. PARA DATOS NO AGRUPADOS
El rango es la diferencia entre el dato mayor y el dato menor es decir:
R = XMAX - xMIN
Ejemplo 1: El tiempo que utilizan 6 niños de igual edad para desarrollar una
misma tarea fue la siguiente: 16, 12, 15, 18, 13, 14 min.
R = 18 – 12 = 6 min.
b. Para datos agrupados:
El Rango:
R = yi – yi – 1
Límite superior Límite inferior
De la última clase de la 1ª clase
Los datos agrupados con intervalos abiertos en los extremos, no tienen rango.
Ejemplo 2:
En el de horas semanales
27 - 10 = 10
Solo debe usarse cuando se desea saber en forma inmediata la dispersión de
datos sin ninguna precisión estadística.
72. Cs. de la Educación Estadística Descriptiva
72
5.4. DESVIACIÓN MEDIA (DM)
a. PARA DATOS NO AGRUPADOS:
Es el promedio de la suma de las desviaciones en valor absoluto de cada
observación o datos con respecto a su media aritmética:
Valor absoluto
Observación Media
o dato aritmética
Número de datos
Valor absoluto:
- 3 = 3 ; - 8 = 8
Ejemplo 3: El tiempo que utilizan 6 niños de igual edad para desarrollar una
misma tarea fue el siguiente:
16, 12, 15, 18, 13, 14 min.
Calculamos la media aritmética:
73. Cs. de la Educación Estadística Descriptiva
73
Interpretación: el tiempo utilizado por los niños para desarrollar la tarea, se
dispersa en promedio 1.7 minutos con respecto al valor central.
b. PARA DATOS AGRUPADOS
Es el promedio de la suma de las desviaciones en valor absoluto de cada marca
de clase con respecto a su media aritmética multiplicado por su frecuencia
respectiva.
Marca de clase Media aritmética frecuencia absoluta
simple
Numero de datos
Ejemplo 4: Con relación al número de horas semanales que dedican los niños
menores de 6 años de edad, a ver la televisión.
Nº DE HORAS
SEMANALES
ni Yi Y’i ni
10 – 12 2 11 22 9.72 19.44
13 – 15 2 14 28 6.72 13.44
16 – 18 3 17 51 3.72 11.16
19 – 21 6 20 120 0.72 4.32
22 – 24 5 23 115 2.28 11.4
25 – 27 7 26 182 5.28 36.96
TOTALES 25 518 96.72
74. Cs. de la Educación Estadística Descriptiva
74
Interpretación: El número de horas semanales que dedican los niños menores a
6 años de edad se dispersa en promedio 3.9 h/s con respecto al valor central.
5.5. LA VARIANZA:
a. PARA DATOS NO AGRUPADOS EN CLASES O CATEGORIAS
Es el promedio de la suma de los cuadrados de las desviaciones de variable
respecto a su media.
Ejemplo 5:
El tiempo que utilizan 6 niños de igual edad para desarrollar la misma tarea es:
16, 12, 15, 18, 13, 14
Hallar la varianza:
Datos (Xi)
16
12
15
18
13
14
(16 – 14.67)2
= 1.69
(12 – 14.67)2
= 7.29
(15 – 14.67)2
= 0.09
(18 – 14.67)2
= 10.89
(13 – 14.67)2
= 2.89
(14 – 14.67)2
= 0.49
TOTAL Σ (xI - X )2
= 23.34
75. Cs. de la Educación Estadística Descriptiva
75
Hallando
x = 16 + 12 +15 +18 +13 +14 = 14.7
6
V2= 23.34 = 3.89 ≈ 4 (min)2
6
Interpretación: El tiempo utilizado por los niños para desarrollar la tarea se
dispersa en promedio en 4 minutos al cuadrado con respecto al valor central.
Ejemplo 6: El tiempo que utilizan 6 niñas de igual edad para desarrollar la misma
tarea:
14, 16, 13, 15, 17, 16
Datos 14 16 13 15 17 16
1.44 0.64 4.84 0.04 3.24 0.64
V2
= 10.84
X = 15.2
V2= 10. 84 = 1.8 ≈ 2 (min)2
6
b. PARA DATOS AGRUPADOS
Es el cuadrado del promedio de la suma de las desviaciones de cada manca de
clase con respecto a su media aritmética, multiplicado por la frecuencia respectiva.
76. Cs. de la Educación Estadística Descriptiva
76
Ejemplo 7:
Número de horas semanales:
Nº DE HORAS
SEMANALES
ni Y’i Σ ( YI - Y)2
ni
10 – 12 2 11 94.5 189.0
13 – 15 2 14 45.2 90.4
16 – 18 3 17 13.8 41.4
19 – 21 6 20 0.5 3.0
22 – 24 5 23 5.2 26.0
25 – 27 7 26 27.9 195.3
25 545.1
V2= 545.1 = 21.8 (h)2
25
Interpretación: El número de horas semanales se dispersa en promedio 21.8
horas al cuadrado con respecto al valor central.
5.6. LA DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR: ( V )
Es una de las medidas de dispersión de mayor utilidad dentro de un análisis
estadístico, es una medida que considera que tan lejos de la media están
localizadas cada uno de los valores observados y se la define como la raíz
cuadrada positiva de la varianza.
a. Para datos no agrupados:
Entonces:
77. Cs. de la Educación Estadística Descriptiva
77
Ejemplo 8:
El tiempo que utilizan 6 niños de igual edad para desarrollar la misma tarea es:
16, 12, 15, 18, 13, 14
La varianza es:
Interpretación: El tiempo utilizado por los niños para desarrollar la tarea, se
dispersa en promedio, 2 minutos con respecto al valor central.
Ejemplo 9:
Niñas:
Interpretación: El tiempo utilizado por las niñas para desarrollar la tarea, se
dispersa en promedio 1.4 minutos con respecto al valor central.
b. Para datos agrupados:
78. Cs. de la Educación Estadística Descriptiva
78
CAPITULO VI
DISTRIBUCIONES BIDIMENSIONALES
6.1 INTRODUCCIÓN
Todo el estudio hasta el momento se hizo en variables por separado, pero en la
práctica se analiza el comportamiento de dos ó más variables al mismo tiempo.
Se puede observar que el comportamiento de una variable puede estar
influenciado por el cambio de las variables, lo que significa que existe una relación
causa y efecto entre algunas variables.
6.2 DISTRIBUCIÓN DE VARIABLES ESTADÍSTICAS BIDIMESIONALES
Las variables bidimensionales se distribuyen como se muestra en la siguiente
tabla:
Y1 Y2 Y3 ……… Yn Totales
X1 n11 n12 n13 ……… n1n n1
X2 n21 n22 n23 ……… n2n n2
X3 N31 n32 n33 ………. n3n n3
. . . . . . .
. . . . . . .
Xi ni1 Ni2 Ni3 . nin ni
. . . . . . .
Xm Nm1 nm2 nm3 ……… nmn nm
Totales N1 n2 n3 ………. nn N
Donde:
nmn: número de veces que se repite el par (xi,yj)se llama frecuencia absoluta
conjunta del par i )filas) y j (columnas).
ni : frecuencia marginal de x. representa el número total de pares con la primera
componente x. (i= 1,2,3,…..m)
nj: Frecuencia marginal de y. representa el número total de pares con el segundo
componente y. (j=12,2,3…..n)
N: Número total de datos observados
79. Cs. de la Educación Estadística Descriptiva
79
Distribuciones marginales
Los valores de la variable estadística bidimensional ( x,y) tiene su distribución de
frecuencias por:
(X1,Y1) ------ n11
(X1,Y2) ------ n12
(X2,Y2 ) …… n22
(X2, Y1) …. n21
6.3 COEFICIENTE DE CORRELACIÓN ( r )
Indica el grado de relación entre dos o más variables en forma cuantitativa.
Así se tienen los siguientes ejemplos: se quiere determinar la relación de las
puntuaciones obtenidas en las pruebas de diagnostico y la prueba final en un
determinado curso; la relación entre el nivel económico de las familias y la
drogadicción.
En el desarrollo del presente capítulo, se calculara el coeficiente de correlación de
Pearson (también llamado coeficiente de correlación de producto momento de
Pearsón ) y el coeficiente de correlación por rangos de Spearman que se emplea
cuando se tiene datos ordinales.
Análisis del coeficiente de Correlación:
1. Se obtienen dos series de medidas en los mismos individuos que tengan
alguna forma de relación.
2. Los valores de los coeficientes de correlación varían entre -1.00 y 1.00
ambos extremos representan relaciones perfectas entre las relaciones.
3. Si r = - 1, entonces hay correlación lineal perfecta pero inversa. Es decir,
que cuando x sube, y baja en la misma proporción.
4. Si r = 1, entonces hay correlación lineal perfecta y directa; es decir, que
cuando x sube, y también lo hace, en la misma proporción.
3. Si r se acerca a -1, entonces hay correlación lineal casi perfecta, pero
inversa, es decir, que cuando x sube, y baja casi en la misma proporción.
80. Cs. de la Educación Estadística Descriptiva
80
4. Si r se acerca a 1, entonces hay correlación lineal casi perfecta y directa, es
decir, que cuando x sube, y también lo hace, casi en la misma proporción.
5. Si r se acerca a cero (por la izquierda o la derecha) no existe una relación
lineal entre x e y.
6. Si r = 0 se dice que no existe en absoluto una relación lineal o asociación
entre las variables estudiadas.
A. COEFICIENTE DE CORRELACIÓN DE PEARSON
Su cálculo se realiza desarrollando las siguientes fórmulas:
a. N Σ XY - ( Σ X ) (Σ Y )
r = 2 2 2 2
[ N Σ X - (Σ X ) ] [ N Σ Y - (Σ Y ) ]
b. Σ xy
r = 2 2 , donde: x = X – X y = Y - Y
(Σ x ) (Σ y )
Ejemplo 1: Calcular el coeficiente de correlación en base a la siguiente
información: puntuaciones de 5 estudiantes que están inscritos en el curso de
estadística escala 1 a 10.
ESTUDIANTE PRUEBA DE
DIAGNOSTICO
PRUEBA FINAL
A
B
C
D
E
5
3
4
6
2
5
4
6
7
3
Utilizando la fórmula a)
Asignamos a las variables: Prueba de diagnostico X
Prueba final Y
81. Cs. de la Educación Estadística Descriptiva
81
Realizando los cálculos en la tabla:
ESTUDIANTE
X Y XY X2
Y2
A
B
C
D
E
5
3
4
6
2
5
4
6
7
3
25
12
24
42
6
25
9
16
36
4
25
16
36
49
9
Totales
Σ X = 20 Σ Y = 25 Σ X Y = 109 Σ X2
= 90 Σ Y2
= 135
Reemplazando en la fórmula a):
(5) (109) - (20) (25)
r =
[ (5) (90) - (20)2
] [ (5) (135) - (25)2
]
r = 545 - 500
(450 – 400) (675 – 625)
r = 45
(50) (50)
r = 0.9
Interpretación: Entre la prueba de diagnóstico y la prueba final, hay una relación
lineal casi perfecta y directa.
B. COEFICIENTE DE CORRELACIÓN POR RANGOS O DE SPEARMAN
Tiene aplicación cuando los datos son de carácter ordinal.
82. Cs. de la Educación Estadística Descriptiva
82
La fórmula a utilizar:
2
1 - 6 Σ D
r r = 2
N ( N - 1 )
Donde:
N : número total de elementos
2
D : Significa la suma de las diferencias de las variables elevados al cuadrado
Ejemplo 2 . Se han observado comparativamente en 5 estudiantes sus aptitudes
para las asignaturas de Matemáticas e Historia ,cuyo resultado fue el siguiente:
ESTUDIANTE APTITUD
EN MATEMÁTICAS
X
APTITUD
EN HISTORIA
Y
E1 Segundo Primero
E2 Cuarto Tercero
E3 Tercero Cuarto
E4 Quinto Quinto
E5 Primero Segundo
Esta información debe cuantificarse:
ESTUDIANT
E
APTITU
D
EN MAT.
X
APTITUD
EN
HISTORIA.
Y
D
2
D
E1 2 1 1 1
E2 4 3 1 1
E3 3 4 -1 1
E4 5 5 0 0
E5 1 2 -1 1
Totales 2
Σ D = 4
83. Cs. de la Educación Estadística Descriptiva
83
Reemplazando:
r r = 1 - 6 (4)
5 (25 – 1 )
r r = 0.8
Interpretación: Existe correlación lineal casi perfecta y directa entre las variables
de aptitud en la signatura de Matemáticas e historia.
6.4 REGRESIÓN LINEAL
Si tomamos las variables de medidas de peso y estatura de cuatro estudiantes los
mismos que muestran en el siguiente cuadro:
ESTUDIANTE PESO ( Kg)
X
ESTATURA (Cm)
Y
A 40 80
B 45 82
C 50 84
D 55 86
Se tiene una perfecta correlación positiva. Si observamos el cuadro el peso varia
de 5 en 5 cm. y la estatura de 2 en 2 cm. y se puede hace la siguiente
interrogante: ¿En cuanto se puede “estimar” la estatura de un estudiante del
mismo grupo con un peso de 60 kg.?
Como respuesta se puede afirmar 88 cm., lo que se hizo fue una estimación (un
posible resultado) es decir dado un valor X se estima el valor de una variable Y.
Dado otro ejemplo en el siguiente cuadro:
ESTUDIANTE PRUEBA DE
DIAGNOSTICO
X
PRUEBA FINAL
Y
A 5 5
B 3 4
C 4 6
D 6 7
E 2 3
84. Cs. de la Educación Estadística Descriptiva
84
La pregunta es ¿Cuál será el valor estimado de prueba final para un estudiante
que obtuvo la calificación de 7 en la prueba de diagnostico de un estudiante? *
Este ejemplo ya no es tan sencillo de responder. Pero se puede conseguir
estimando el valor de Y a través de un modelo de Regresión Lineal.
MODELO DE REGRESIÓN LINEAL SIMPLE BIVARIANTE
En el análisis de Regresión como en otros tipos de estudio estadísticos, se
procede normalmente a observar datos muestrales cuyos resultados servirán para
estimar la relación que existe entre las variables correspondientes a la población.
Los modelos de regresión describen la variación conjunta de dos variables, se
estudiará el modelo de regresión lineal simple que, por su aplicación dentro el
campo educativo, reviste singular importancia.
En general se utilizará:
X variable Independiente
Y variable dependiente
LA LINEA RECTA (O de Mínimos cuadrados)
La forma más sencilla de aproximación es la línea recta cuya ecuación es:
Y = a0 + a1 X
Es la línea recta de Y sobre X
Donde las constantes a0 y a1 se determinan mediante las siguientes fórmulas:
a) ( Σ Y ) (Σ X ² ) - ( Σ X ) ( Σ X Y)
a0 =
N Σ X ² - ( Σ X )²
N ( Σ X Y) - ( Σ X ) ( Σ Y )
a1 =
N Σ X ² - ( Σ X )²
85. Cs. de la Educación Estadística Descriptiva
85
b) Sistema de ecuaciones, llamado también ecuaciones normales para la recta de
mínimos cuadrados.
( Σ Y ) = a0 N + a1 ( Σ X )
( Σ X Y) = a0 ( Σ X ) + a1 Σ X ²
Se resuelve el sistema hallando los valores de las constantes a0 y a1
Ejemplo 3: En base a la información sobre los resultados de la prueba de
diagnostico y prueba final, calcular los coeficientes de la recta de regresión lineal.
ESTUDIANTE PRUEBA DE
DIAGNOS.
X
PRUEBA
FINAL
Y
XY X²
A 5 5 25 25
B 3 4 12 9
C 4 6 24 16
D 6 7 42 36
E 2 3 6 4
TOTALES Σ X = 20 Σ Y = 25 Σ X Y= 109 Σ X ² = 90
Se determinara las constantes, formando y resolviendo el sistema de ecuaciones:
25 = a0 (5) + a1 (20) 5 a0 + 20 a1 = 25
109 = a0 (20) + a1 (90) 20 a0 + 90 a1 = 109
De donde: a1= 0.9 ; a0 = 1.4
La línea recta de regresión lineal es: Y = 1.4 + 0.9 X
Respondiendo a la pregunta inicial * que decía:
¿Cuál será el valor estimado de prueba final para un estudiante que obtuvo 7 en la
prueba final de diagnostico?
Bastara con reemplazar en la recta de regresión lineal, para X el valor de 7,
es decir X = 7 en Y = 1.4 + 0.9 ( 7 )
86. Cs. de la Educación Estadística Descriptiva
86
Y = 1.4 + 6.3
Y = 7.7 ≈ 8 puntos
Por lo que el valor estimado de prueba final es de 8 puntos para un estudiante
que obtuvo 7 en la prueba de diagnostico.
87. Cs. de la Educación Estadística Descriptiva
87
BIBLIOGRAFIA
CANSADO, Enrique : “Curso de Estadística General “.
CARVAJAL, Ticona Filomeno: “Curso Administración Educativa “ : ISERT.
FERNANDEZ, Chavesta Jose
FERNANDEZ, Chavesta Juan: “Estadística Aplicada Técnicas para la
Investigación”; Editorial San Marcos.
ORDOÑEZ, Oporto Jorge Willy: “Estadística Descriptiva, Inferencial y Muestreo”;
Editorial Impresores San Judas Tadeo; La Paz – Bolivia.
PAGANO ROBERT R, Estadística para las ciencias del comportamiento. Quinta
edición.
MURRAY, R. Spiegel : “Estadística Serie Shaum”
SAN ROMAN, Pulido A.: “ Estadística y Técnicas de Investigación Social”;
Ediciones Pirámide S.A . ; Madrid
WAYNE W. DANIEL : “Estadística con Aplicaciones a las Ciencias Sociales y a la
Educación”, México: Mac Graw-Hill.
MATERIALES ADICIONALES
Uso del INTERNET, que brinda una fuente inagotable de textos y temas afines con
la estadística Descriptiva.
88. Cs. de la Educación Estadística Descriptiva
88
89. Cs. de la Educación Estadística Descriptiva
89