SlideShare una empresa de Scribd logo
1
CAPÍTULO 1
Conceptos básicos de Estadística Descriptiva
Prof. Mg. Wilfredo Domínguez C.
Prob. y estadística (Ing electrónica)
1) CONCEPTO DE ESTADISTICA
La estadística es una ciencia especializada en el
tratamiento de los datos y utiliza métodos
matemáticos para la recopilación, organización,
presentación, el análisis y toma de decisiones
inferenciales, dichos datos por lo general son
tomados utilizando procedimientos específicos
denominados técnicas de muestreo los que conducen
a tomar una parte pequeña (muestra) de un conjunto
más grande llamado (población).
Las definiciones de estadística son muy numerosas,
muchas de ellas depende del uso que se le dé, por
ejemplo la estadística puede servir para describir los
acontecimientos más importantes de un evento
deportivo.
La estadística también se puede usar para organizar
mejor la información de un colectivo grande, como
por ejemplo la organización de las historias clínicas
de un gran hospital, sin lugar a dudas la estadística
sirve para eso y muchas otras cosas más, pero la
estadística va mucho más allá pues desde el punto de
vista científico es una ciencia que nos permite tomar
decisiones en cuestiones que requieren un sustento
mucho más riguroso, por ejemplo puede ayudar a
2
decidir cuál de dos métodos de enseñanza aplicados a
dos grupos de niños es el más adecuado o puede
decidir que tratamiento es mejor para combatir
determinada enfermedad.
Los cursos de estadística se dictan todas las
especialidades; forma parte de todos los planes de
estudio de todas las carreras profesionales.
2) PALABRAS CLAVES EN ESTADISTICA
Definición 1. (Población) Es un conjunto de seres u
objetos sobre los cuáles necesitamos hacer algún tipo
de estudio, este conjunto grande se representa por .
P
Observe que el término población en estadística es
mucho más general del que usualmente conocemos,
pues no necesariamente la población debe estar
compuesta por personas, sino que también pueden ser
animales de una región de la costa peruana, plantas
de un gran parque, tornillos producidos por una
empresa.
Si el tamaño de la población es finita usualmente esta
se representa por N , el cual es un número entero
positivo y el tamaño de la muestra se representa
universalmente por n, de forma tal que se cumple la
desigualdad N
n  .
Una población es un conjunto y luego está formado
por elementos, dichos elementos se denominan
unidades estadísticas, podríamos representar a la
población P como un conjunto es decir: ww
3
 
N
i u
u
u
u
P ,...,
2
1 ,...,
,

Ejemplo 1. Sea la población compuesta por todos
los peruanos a la fecha, esta población tiene un
aproximado de 33 millones de personas.
Ejemplo 2. Consideremos la población compuesta
por todos lo guacamayos de la Amazonía peruana.
Ejemplo 3. Sea la población compuesta por todos
los tornillos producidos por una gran fábrica durante
un mes específico.
Ejemplo 4. Consideremos la población compuesta
por todos los alumnos de nuestra universidad.
Definición 2. (Muestra) Es una parte representativa
de la población, usualmente su tamaño por n y esta
siempre es finita, en esta parte representativa de la
población recaerá nuestro estudio, la muestra debe
ser representativa de la población, es decir deberá
tener todas las características de la población,
La forma de obtener una muestra representativa de la
población corresponde a una parte de la estadística
denomina da Técnicas de Muestreo. ww
4
Ejemplo 5.
 En un gran club deportivo hay numerosos socios;
hay una discusión sobre si seguir como
auspiciador en las camisetas de los jugadores
lleven la marca “PUMA”, o la marca “NIKE”;
para esto se toma al azar del listado de socios
100 de ellos; de estos 100 socios; 70 de ellos
están a favor de la marca “PUMA”; el resto la
otra marca. ww
5
En este caso la población está compuesta por la
totalidad de socios, en este caso su tamaño N es
desconocido; la muestra está compuesta por los
100

n socios encuestados.
 Un filántropo ayuda a 1000 niños en su
formación escolar; a fin de año se quiere
organizar una fiesta; como el local donde se va a
realizar este evento tiene una capacidad limitada
para 300 participantes; se toma la decisión de
invitar a los 300 primeros niños con mayor
rendimiento.
En esta situación la población está compuesta
por los 1000

N niños y la muestra está compuesta
por los 300

n niños seleccionados.
 Una encuestadora de estudio de mercados quiere
saber que marca de cerveza es la más preferida
en el cercado de Lima, entre dos nuevas marcas
A y B; para esto invita al azar 1000 latas de
cerveza; 500 de la marca A y 500 de marca B; de
los 500 que probaron la marca A; 235 de ellos
dijeron que si les gustaba la marca invitada.
De los 500 que probaron la marca B; 190 se
mostraron a favor.
En este caso la población está compuesta por
todos los habitantes mayores de edad de esa zona
de Lima; su tamaño N es desconocido; la
muestra está compuesta por las 1000

n personas
escogidas.
ww
6
Si el tamaño de muestra es estrictamente menor que
el tamaño de la población estamos haciendo muestreo,
ahora si N
n  estamos realizando un censo, la
mayoría de las veces se hace muestreo.
Si siempre se podría hacer un censo obtendríamos
resultados exactos y el papel de la estadística sería
muy limitado; la mayoría de la veces se trabajan con
muestras, por ejemplo la intención de voto hacia
determinada candidatura se hacen con muestras de
tamaño 1500 aproximadamente.
VENTAJAS DEL MUESTREO
 Bajo costo.
 Información más exacta (mejor calidad) que la
del censo, debido a que el menor número de
encuestadores permite capacitarlos mejor y más
selectivamente.
 Es posible introducir métodos científicos
objetivos de medición para corregir errores.
 Mayor rapidez en la obtención de resultados.
 Técnica más utilizada y que permite obtener
información de casi cualquier tipo de población.
 Gran capacidad para estandarizar datos, lo que
permite su tratamiento informático y el análisis
estadístico sobre todo obtener la información de
los encuestados
DESVENTAJAS DE LOS CENSOS
 Alto costo (humano y material) dado que exige el
empleo de una gran cantidad de recursos de
personal, financieros y materiales. ww
7
 Es necesaria una vasta organización que abarque
todo el universo a investigar, procurando evitar
omisiones y duplicaciones.
 Demora en la obtención de resultados.
 En algunos casos, la información que se obtiene
puede ser de inferior calidad (mayores errores) a
la que se obtendría si la investigación se realizara
por muestreo.
Obviamente se desea tener métodos científicos para
obtener buenas muestras; uno de los campos de la
estadística llamada TÉNICAS DE MUESTREO o
simplemente MUESTREO enseña como seleccionar
una buena muestra.
Existen varias técnicas de muestreo; la elección de la
técnica depende de la situación y en realidad el
MUESTREO es motivo de un curso separado de la
estadística básica.
Las principales técnicas de muestreo se presentan en
el siguiente diagrama:
Muestreo no probabilístico:
a)A juicio.
El muestreo deliberado, crítico o por juicio, es
una técnica de muestreo no probabilístico en la
que los miembros de la muestra se eligen sólo
sobre la base del conocimiento y el juicio del
investigador.
ww
8
b)Por conveniencia.
El muestreo por conveniencia es una técnica de
muestreo no probabilístico y no aleatorio
utilizada para crear muestras de acuerdo a la
facilidad de acceso.
Consiste en tomar un segmento o fracción de la
población por su cómoda accesibilidad. Por
ejemplo, una muestra obtenida de listas
fácilmente disponibles, como las guías de
teléfonos, constituyen una muestra deliberada.
Por la comodidad o facilidad en tomar la muestra
se sacrifica cierto grado de representatividad de
las características disponibles; sin embargo, este
tipo de muestreo puede ser de alguna utilidad
para estudios pilotos o de sondeo.
ww
9
c)Voluntariado.
Muestreo probabilístico:
a)Muestreo Aleatorio Simple (M.A.S.) ww
10
El muestreo aleatorio simple es una técnica de
muestreo en la que todos los elementos que
forman el universo - y que por lo tanto están
incluídos en el marco muestral - tienen idéntica
probabilidad de ser seleccionados para la
muestra. ... Un individuo solo puede aparecer una
única vez en una muestra.
b)Estratificado.
En un muestreo aleatorio estratificado se divide la
población en clases o estratos y se escoge,
aleatoriamente, un número de individuos de cada
estrato proporcional al número de componentes de
cada estrato.
Ejemplo ww
11
En una fábrica que consta de 600 trabajadores
queremos tomar una muestra de 20. Sabemos que
hay 200 trabajadores en la sección A, 150 en la B,
150 en la C y 100 en la D.
c)Sistemático.
El muestreo sistemático es un tipo de muestreo
probabilístico donde se hace una selección aleatoria
del primer elemento para la muestra, y luego se
seleccionan los elementos posteriores utilizando
intervalos fijos o sistemáticos hasta alcanzar el
tamaño de la muestra deseado.
w
12
d)Por conglomerados.
En estadística, el muestreo por conglomerados es una
técnica de muestreo utilizada cuando hay
agrupamientos «naturales» relativamente
homogéneos en una población estadística.1
A menudo se utiliza en la investigación de mercados.
En esta técnica, la población total se divide en estos
grupos (o clusters) y una muestra aleatoria simple se
selecciona de los grupos.
A continuación, la información requerida se obtiene
de una muestra aleatoria simple de los elementos
dentro de cada grupo seleccionado y una submuestra
de elementos se puede seleccionar dentro de cada uno
de estos grupos. Una motivación común para el
muestreo por conglomerados es reducir el número
total de entrevistas, y sus costes, dada la precisión
deseada. Suponiendo un tamaño de muestra fijo, la
técnica ofrece resultados más precisos cuando la
mayoría de la variación en la población es dentro de
los grupos y no entre ellos.
ww
13
e)Muestreo por cuotas
Es la técnica más difundida sobre todo en estudios de
mercado y sondeos de opinión.
En primer lugar es necesario dividir la población de
referencia en varios estratos definidos por algunas
variables de distribución conocida (como el género o
la edad). Posteriormente se calcula el peso
proporcional de cada estrato, es decir, la parte
proporcional de población que representan.
Finalmente se multiplica cada peso por el tamaño de
n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado
en que una vez determinada la cuota, el investigador
es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
En estadística, las muestras pueden clasificarse
según su tamaño en dos tipos:
ww
14
a)Si 30

n se denominan “muestras grandes”.
b)Si 30

n de denominan “muestras pequeñas”.
w
Definición 3. (Variable) Es la característica de
interés que se observa en cada unidad estadística o
unidad elemental , y como esta cambia de unidad a
unidad suele llamarse variable y por lo general se
representa por letras mayúsculas como X , es decir
en cada P
ui  se observa un valor i
X .
Donde a cada P
ui  se le asigna un i
X ; es decir
N
i
X
u i
i ;....
2
;
1
; 

Con referencia al Ejemplo 1, muchas cosas se pueden
observar en cada peruano, es decir cada peruano
constituye una unidad estadística, por ejemplo se
podría estar interesado en observar la edad, el peso, la
condición socioeconómica, su nivel educacional y
otras cosas más.
Si sólo estudiamos una sola variable estamos
haciendo estadística unidimensional o de una
variable.
La observación en cada unidad estadística puede
arrojar un número (variable numérica o cuantitativa)
o puede proporcionar una cualidad (variable
cualitativa).
Siempre que se observa una característica en cada
unidad estadística esta puede resultar un número o
una cualidad, la estadística puede trabajar con ambos
tipos de variables desde su aspecto elemental
descriptivo o hacer análisis estadístico avanzado.
ww
15
3) CLASIFICACIÓN DE LAS VARIABLES
Las variables se pueden clasificar en dos grandes
grupos: cuantitativas o numéricas (grupo A) o
cualitativas (grupo B), es decir:
A: Variables cuantitativas- Son aquellas que resultan
ser un número y provienen del conteo o de
mediciones, estas a su vez se pueden clasificar en dos
sub grupos: w
A1: Variables cuantitativas discretas.- Son aquellas
que solamente pueden tomar valores enteros positivos
o cero, es decir pueden ser 0, 1, 2, 3, …….
Este tipo de variables por lo general provienen de
contar y cuando se cuenta algo o es un entero positivo
o es cero.
Ejemplo 6. Son ejemplos de este tipo de variables
las siguientes:
1) Número de hijos por familia
2) Número de televisores por familia
3) Número de computadoras defectuosas por
laboratorio.
4) Número de cursos matriculados por alumno.
5) Número de dormitorios por familia.
6) Número alumnos por aula.
7) Número visitas al médico por año de pacientes de
la tercera edad al seguro social.
8) Número de latidos del corazón por minuto.
Ejercicio 1.- Dar ocho ejemplos adicionales de
variables cuantitativas discretas ww
16
A2: Variables cuantitativas continuas.- Son aquellas
que pueden tomar todos los valores posibles en un
intervalo dado, incluso valores fraccionarios e incluso
negativos.
Este tipo de variables provienen de medir, y cuando se
mide algo no necesariamente resulta un entero
positivo o cero; e incluso puede ser negativo como lo
es la temperatura medioambiente.
Ejemplo 7. Presentamos algunos ejemplos de este
tipo de variables:
1) Estatura de personas en metros.
2) Peso de la personas en kilos.
3) Perímetro craneal de recién nacidos.
4) Temperatura ambiental en grados
centígrados. w
5) Edad de las personas.
6) Nivel de glucosa en la sangre.
7) Calificación de estudiantes en escala
vigesimal.
8) Altura en metros sobre el nivel del mar las
ciudades de la costa peruana.
Ejercicio 2.- Dar ocho ejemplos adicionales sobre
variables cuantitativas continuas.
B: Variables cualitativas.- Como su nombre lo indica
son variables en los cuales se observan una cualidad.
Ejemplo 8. Son ejemplos de este tipo de variables:
ww
17
1) El nivel educacional de los peruanos
2) La jerarquía institucional.
3) La clase social a la que se pertenece.
4) El color de los ojos.
5) La creencia religiosa.
6) La preferencia electoral.
7) El tipo de sangre de las personas.
Las variables cualitativas se pueden clasificar en
dos tipos: cualitativas ordinales y cualitativas
nominales.
B1: VARIABLES CUALITATIVAS ORDINALES.-
Son aquellas variables cualitativas en los que se puede
establecer algún tipo de ordenamiento entre ellas, por
ejemplo de mayor a menor o de menor a mayor.
Ejemplo 9. En las universidades existe la jerarquía
institucional; primero el rector de la universidad;
luego están los vicerrectores a continuación los
decanos y luego los directores de escuela y así
sucesivamente. Observe que existe una ordenación de
mayor a menor.
Ejemplo 10. Otro ejemplo clásico es el nivel
educacional de las personas; este nivel puede ser
ordenado en analfabetos (no saben leer ni escribir;
luego las personas que tienen educación primaria
(saben leer y escribir); a continuación las personas
que tienen educación secundaria; posteriormente las
personas con estudios universitaria y así
18
sucesivamente. Observe que implícitamente un
ordenamiento de menor a mayor.
B1: VARIABLES CUALITATIVAS NOMINALES.-
Son aquellas variables en los que no se puede
establecer ningún tipo de ordenamiento entre ellas; se
darán algunos ejemplos de este tipo de variables
cualitativas nominales.
Ejemplo 11. El color de cabello de las personas; el
sexo de las personas; el tipo de sangre; el lugar de
nacimiento
4) PARÁMETROS POBLACIONALES
Definición 4. (Parámetro) Los parámetros son
cantidades fijas, que existen y que teóricamente se
pueden conocer si se trabajasen con todos los
elementos (unidades poblacionales) que constituyen
la población. Los parámetros más usados en
estadística son:
 La media poblacional, la cuál se representa por
la letra griega  (mu); asociada a variables
cuantitativas.
 La varianza poblacional, usualmente
representada por 2
 (sigma cuadrado); asociado
a variables cuantitativas
ww
19
 La desviación estándar poblacional:  ; asociado
a variables cuantitativas.
 La proporción poblacional p. Asociada a
variables cualitativas. (ojo cualitativas)
La media poblacional  , la varianza poblacional 2
 y
la desviación estándar poblacional están asociadas a
variables cuantitativas (numéricas).
La proporción poblacional pestá asociada más bien a
variables de tipo cualitativo (cualidades).
Ejemplo 12. Consideremos una población hipotética
compuesta por 10

N estudiantes universitarios; la
variable de interés es la edad en años cumplidos; esta
población es dada por la siguiente data:
18 19 21 17 20 18 19 22 21 18
Existe la media poblacional  y se puede calcular
sumando las 10 edades y dividiendo en 10

N ; es decir:
años
X
N
i
i
3
,
19
10
193
10
18
...
19
18
10
10
1











Supongamos que etiquetamos las 10 edades con los
números 1; 2; 3;….10; en 10 papelitos enumeramos 1;
2;…;10.
Los 10 papelitos se ponen en una caja; una niña con
los ojos vendados selecciona 3 boletos juntos;
resultando como integrantes de la muestra a 17; 19; y
20; el tamaño de la muestra es 3

n
Lo que se ha hecho es muestreo aleatorio simple; el
cual es un muestreo probabilístico.
Con estos tres datos se puede calcular la media
muestral; es decir 6666
,
18
3
56
3
20
19
17
1 




X . ww
20
Supongamos que la niñita devuelve a la caja los tres
boletos; teniendo nuevamente 10

N números. Vuelve a
sacar 3 papelitos; esta vez resulta en la muestra 19;
18; 21 la media muestral es años
X 3333
,
19
3
58
3
21
18
19
2 




En total se tienen 120
!
7
!
3
!
10
3
10










muestras posibles.
Naturalmente en un estudio sólo se trabaja con una
muestra.
Siempre que se trabaja con muestras inevitablemente
esta sujetos a cometer error al querer estimar 
(parámetro).
Supongamos que trabajamos con la primera muestra
que arrojó una media muestra años
X 6666
,
18
1  ; la
verdadera media o verdadero valor es años
3
,
19

 .
El Error de muestreo se define X
E 


 

 ˆ ; donde ̂
se lee mu estimado )
:
( mu
griega
letra
 ; en este caso:
6334
,
0
666
,
18
3
,
19
ˆ 





 X
E 


Ejemplo 13. Imaginemos la población de todos los
peruanos a la fecha y que la variable de interés sea la
edad medida en años, de hecho existe la media
poblacional , o sea la edad promedio de todos los
peruanos a la fecha, para esto tendríamos que sumar
la edades de todos peruanos a la fecha y dividir toda
esto entre aproximadamente entre 33 millones.
Esta tarea en la práctica es realmente imposible, pues
la base de datos actualizada conteniendo la edad de
todos lo peruanos a la fecha no existe, pero si tengo la
certeza de que esa edad promedio en verdad existe,
pero que es imposible conocerla con exactitud,
teóricamente se tendría que calcular: ww
21
millones
X
millones
peruanos
los
todos
de
edades
de
Suma
i
33
33





Si bien es cierto que esta cantidad no la puedo
conocer con exactitud, si es posible estimarla
(aproximarla) usando muestras.
w
Esta estimación puede ser puntualmente (darle un
valor explícito) o también se puede estimarla por
intervalos, es decir poner ese valor  entre dos
valores determinados, en otras palabras se puede
construir un intervalo de confianza para  de la
forma:
.
.
.
. S
L
I
L 
  , donde .
.I
L es el límite inferior del
intervalo y .
.S
L es el límite superior del intervalo de
confianza.
Ejemplo 14. Supongamos que se va a realizar un
referéndum para aprobar o desaprobar o aprobar una
reforma constitucional y que la población de votantes
es de 20 millones de personas, aprobar o desaprobar
el referéndum es una cualidad.
Por comodidad supongamos sólo dos posibilidades:
aprobar (si) o desaprobar (no). Antes de efectuar el
referéndum nadie puede saber con exactitud la
proporción de votantes a favor del (si), o sea existe la
proporción de votantes a favor de la modificación
constitucional, el cual teóricamente se puede obtener
así:
)
20
( millones
electores
de
Total
si
del
favor
a
electores
de
número
p  ww
22
Esta cantidad se que existe, pero es desconocida, pero
se puede estimar puntualmente y también por
intervalos, la estimación puede hacerse en base a una
muestra de tamaño n, por ejemplo 1500 o 3000
votantes elegidos al azar, esto mediante alguna
técnica de muestreo y a nivel nacional, obviamente
1
0 
 p , el cual multiplicada por 100 queda expresada
en porcentaje, es decir %
100
100
%
0 
 si
p .
Las encuestadoras de opinión pública presentan
frecuentemente intervalos de confianza basados en
muestras, hablan de margen de error y un nivel de
confianza.
Si bien es cierto p no se conoce si se puede estimar
puntualmente mediante p̂ , el cual se lee como si
p
estimado, esto es posible si por ejemplo la muestra de
tamaño 1500

n , si de estos votantes 800 se inclinan a
favor del si se tendría:
5333
,
0
1500
800


p

Equivalentemente en % se puede decir que un
53,33% se inclina a favor del si.
En general la proporción muestral es:
n
tica
caracterís
cierta
con
objetos
u
personas
de
nro
estimado
p
p
.
)
( 


5) CONSTRUCCION DE CUADROS DE
DISTRIBUCIÓN DE FRECUENCIAS: CASO
DISCRETO
ww
23
Si se tiene una data n
X
X
X ;...;
; 2
1 proveniente de una
variable discreta lo más probable es que existan datos
repetidos, es mejor contar cuantas veces se repite un
valor particular, y luego presentarlos en un cuadro de
distribución de frecuencias; en el siguiente ejemplo se
presenta la metodología.
Ejemplo 15. En nuestra universidad existen
numerosos laboratorios de cómputo; inevitablemente
en cada laboratorio existen computadoras
defectuosas. Se tomó una muestra de laboratorios y se
contó el número de computadoras defectuosas por
laboratorio en n=25 laboratorios (variable discreta) ,
resultando:
0
.
1
.
2
.
1
.
3
.
2
.
2
.
3
.
3
.
4
.
1
.
2
.
2
.
3
.
4
.
2
.
3
.
0
.
2
.
1
.
2
.
3
.
4
.
5
.
1
.
w
Los datos se organizaran de menor a mayor, contando
las veces que se repiten cada uno.
i
X
0: 0 0 2
1 
f
1: 1 1 1 1 1 5
2 
f
2: 2 2 2 2 2 2 2 2 8
3 
f
3: 3 3 3 3 3 3 6
4 
f
4: 4 4 4 3
5 
f
5: 5 1
6 
f
El esquema anterior puede ser puesto verticalmente y
esto nos dará una idea de la forma de la distribución
de los datos: ww
24
f1=2 f2=5 f3=8 f4=6 f5=3 .f6=1
x
x
x x
x x x
x x x
x x x x
x x x x x
x x x x x x
Xi 0 1 2 3 4 5
Luego se procede a la construcción de un cuadro de
distribución de frecuencias, teniendo en cuenta lo
siguiente:
6

k ; seis valores distintos de la variable en la
muestra de tamaño 25

n
i
f : frecuencia absoluta; i
h : frecuencia relativa
:
i
F Frecuencia Absoluta Acumulada i
H : Frecuencia Relativa
Acumulada
i
X
i
f i
h i
F i
H
0 2
1 
f 08
,
0
25
2
1 

h
2
1 
F 08
,
0
1 
H
1 5
2 
f 20
,
0
25
5
2 

h 7
5
2
2 


F 28
,
0
20
,
0
08
,
0
2 


H
2 8
3 
f 32
,
0
25
8
3 

h
15
8
7
3 


F 60
,
0
32
,
0
28
,
0
3 


H
3 6
4 
f 24
,
0
25
6
4 

h
21
6
15
4 


F 84
,
0
24
,
0
60
,
0
4 


H
4 3
5 
f 12
,
0
25
3
5 

h 24
3
21
5 


F 96
,
0
12
,
0
84
,
0
5 


H
5 1
6 
f 04
,
0
25
1
6 

h
25
1
24
6 


 n
F 1
04
,
0
96
,
0
6 


H 1
Tot
al
25

n 1
25
Interpretación:
6
4 
f ; seis laboratorios tienen 3 computadoras
defectuosas.
:
%
024
)
25
6
(
100
100 4 

h El 24% de los laboratorios tienen
3 computadoras defectuosas.
21
6
15
4 


F : 21 laboratorios tienen 3 o menos
computadoras defectuosas.
%
84
)
84
,
0
(
100
4 

H : el 84% de los laboratorios tienen 3 o
menos computadoras defectuosas.
w
Ejercicio 1.- Usando los datos del Ejemplo anterior;
pero añadiendo a la data original los siguientes 11
datos:
2 4 6 1 6 2 3 2 2 3 2
Se pide rehacer lo realizado en el mencionado
Ejemplo; pero ahora 36
11
25 


n
6) CUADRO GENERAL DE DISTRIBUCIÓN
DE FRECUENCIAS Y PROPIEDADES.
En general para construir un cuadro de distribución
de frecuencias para caso discreto se debe tener la data
con un tamaño de muestra n y sin tabular (o datos en
bruto) de la forma: n
X
X
X ;...;
; 2
Se hace el conteo para obtener las frecuencias
absolutas k
i
fi ;...,
2
;
1
:  ; donde k es el número distintos
26
de la variable; obviamente n
k  . El cuadro toma la
forma:
i
X i
f i
h i
F i
H
1
X 1
f
n
f
h 1
1  1
1 f
F  1
1 h
H 
2
X 2
f
n
f
h 2
2  2
1
2 f
f
F 
 2
1
2 h
H
H 

 … … … ….
i
X i
f
n
f
h i

4
i
i
i f
F
F 
 1 i
i
i h
H
H 
 1
 … … … …
k
X k
f
n
f
h k
k 
n
f
F
F k
k
k 

 1 1
1 

  k
k
k h
H
H
Total n 1
En general se cumplen las siguientes propiedades:
1) n
f
k
i
i 

1
2) 1
1



k
i
i
h
3) n
Fk 
4) 1

k
H
5) n
F
F
F
F
F
f k
i
i 





  ...
... 1
2
1
1
6) 1
...
... 1
2
1
1 





  k
i
i H
H
H
H
H
h
7) i
i
i
i
i f
f
f
f
f
F
F 





 
 )
...
( 1
2
1
1
8) i
i
i
i
i
i h
H
h
h
h
h
h
h
h
H 








 
 1
1
2
1
2
1 )
...
(
...
9)
n
F
H i
i  ; i
i H
n
F 
10) i
i
i f
F
F 
 1
11) i
i
i h
H
H 
 1
7) |CONSTRUCCION DE CUADROS DE
DISTRIBUCIÓN DE FRECUENCIAS: CASO
CONTINUO ww
27
Este procedimiento es recomendable solamente
cuando se tienen por lo menos un tamaño de muestra
mayor o igual 25 o mejor aún tener una muestra de
tamaño grande; es decir un 30

n (muestras grandes)
La metodología se presentará con un ejemplo práctico
dado a continuación.
Ejemplo 16. Los siguientes datos corresponden a las
notas finales (n=26 alumnos) en un curso de
especialidad, las notas son dados con decimales y en
una escala vigesimal:
14,6 13,8 11,8 12,0 14,1
09,7 15,9 15,8 17,0 12,7
16,5 14,8 09,3 13,0 12,6
13,8 10,0 11,6 08,0 11,6
18,0 12,7 12,8 10,5 13,6
10,5
Paso 1.- Se halla el valor máximo (Xmax) y el valor
mínimo de la muestra (Xmin),
Se calcula el Recorrido muestral ,dado por:
min
max X
X
R 

En nuestro caso:
10
8
18
;
8
;
18
min
max
min
max







X
X
R
X
X
w
Paso 2.- Se determina el número de intervalos de
clases k; obviamente k es un entero positivo; a
trabajar; como ejemplo tomemos 5

k .
Observación.-
La elección del número de intervalos es controversial,
ninguna elección se puede decir que es mejor que la
otra u otras.
28
Existen tres criterios para la elección del número de
intervalos de clase; los cuales son:
1) Tomar un k moderado entre 5 y 15; es decir
15
5 
 k ; nosotros hemos elegido k=5 como
ejemplo.
2) Otro criterio es tomar próximo a la raíz
cuadrada de n; es decir 0990
,
5
26 

 n
k
3) Otro criterio es el de Sturges; el cual dice
tomar k como el valor más próximo a
1+3,3log(n); donde log es el logaritmo en base
10; es decir:
)
log(
3
,
3
1 n
n 

En nuestro caso
6691
,
5
)
4149
,
1
(
3
,
3
1
)
26
log(
3
,
3
1
)
26
log(
3
,
3
1 






n
Paso 3.- Se calcula la amplitud de los intervalos de
clase (c) definida como
k
R
c  .
En nuestro caso
2
5
10



k
R
c
Paso 3.- Cada intervalo de clase tendrá amplitud
constante igual a c=2 y se crean los k=5 intervalos de
clase; desde el Xmin se va sumando la amplitud c; de la
siguiente forma:
[8; 10>; [10; 12>; [12; 14>; [14; 16>; [16; 18]
Observe la forma de los intervalos de clase; los cuatro
primeros son cerrados en límite inferior (incluye) y
abierto en el límite superior (excluye); excepto el
último el cual es cerrado en ambos extremos.
29
ww
Paso 4.- Cada una de las observaciones es colocada en
cada uno de los intervalos
[ 8; 10> : 09,7 09,3 08,0 f1=3
[10; 12> :11,6 10,0 11,6 11,6 10,5 10,5 f2=6
[12; 14> :13,8 12,0 12,7 13,0 12,6 13,8 12,7 12,8 13,6 f3=9
[14; 16>: 14,6 14,1 15,9 15,8 14,8 f4=5
[16; 18] : 17,0 16,5 18,0 f5=3
Paso 5.- Se hallan las marcas de clase )
( i
X que
simplemente es el punto medio de los intervalos de
clase; decir si el intervalo de clase es 


*
*
1
[ i
i X
X ;
entonces k
i
X
X
X i
i
i ;...;
2
;
1
;
2
*
*
1


 
Luego se crea el cuadro de distribución de
frecuencias el cual es similar al caso discreto:
Intervalos i
X i
f i
h i
F i
H i
i X
f 2
i
i X
f
[8; 10> 9 3 0,1153 3 0,1153 27 243
[10; 12> 11 6 0,2307 9 0,3460 66 726
[12; 14> 13 9 0,3461 18 0,6921 117 1521
[14; 16> 15 5 0,1923 23 0,8844 75 1125
[16; 18] 17 3 0,1153 26 0,9997 51 867
Totales n=26 1
9997
,
0  336 4482
Interpretación:
f3: 9 estudiantes tienen notas entre 12 y 14 puntos
X3=13; la nota trece es la nota “representativa” de los
estudiantes que han obtenido notas entre 12 y 14.
ww
100h3=34,64%: el 34,64% de los estudiantes tienen
notas entre 12 y 14.
30
F3=18: Dieciocho estudiantes tienen notas entre 8 y
14 puntos
100H3=69,21%: el 69,21% de los estudiantes tienen
notas entre 8 y 14
Un gráfico de la distribución de frecuencias absolutas
usando el SPSS; muestra lo siguiente:
Un gráfico de barra es proporcionado a continuación:
31
Ejercicio 2.- Con la data del Ejemplo anterior; pero
agregando cuatro datos adicionales: 10,9 13,4 17,1
12,3
Se pide rehacer el Ejemplo anterior con todos sus
pasos; recuerde que ahora Ud. tiene n=30 datos.
Ejercicio 3.- Con los datos de Ejercicio anterior,
donde n=30 tomar k=6 intervalos de clase y
reconstruir el cuadro como se hizo en el Ejemplo 13,
considerando los 5 pasos; tenga presente que tendrá
que hacer nuevamente el conteo.
Sugerencia: En este caso la amplitud de los intervalos
de clase es: 6666
,
1
6
10
6
8
18





k
R
c ; observe que la
división no es exacta como en el ejemplo anterior.
En estos casos se recomienda tomar la amplitud c con
un decimal más de los que tiene la data original, el
cual tiene un decimal; tomo la amplitud c con un
decimal más; es decir elijo c=1,66 (amplitud
constante de cada intervalo). Con estos los seis
intervalos de clase son:
[8 9,66> [9,66 11,32> [11,32 12,98>
[12,98 14,64> [14,64 16,3> [16,3 17,96]
Observe que el último intervalo no incluye a la nota
18, la medida conveniente es ampliar un poco más,
para considerar el último intervalo como [16,3 18];
cuya amplitud es de 1,7; el cual es ligeramente mayor
que los cinco primeros intervalos. Con esto los k=6
intervalos a trabajar son:
[8 9,66> [9,66 11,32> [11,32 12,98> ww
32
[12,98 14,64> [14,64 16,3> [16,3 18,0]
Ejemplo 17. Ejemplo.- Del archivo que contiene las
historias clínicas de los pacientes con problemas de
visión de un hospital de la capital; se tomó una
muestra de tamaño n=50, y se consideró la estatura de
ellos (en metros), resultando:
1,65 1,43 1,88 1,59 1,35 1,76 1,22 1,45 1,62 1,41
1,36 1,78 1,50 1,48 1,62 1,60 1,35 1,53 1,65 1,74
1,49 1,37 1,60 1,76 1,52 1,48 1,61 1,34 1,55 1,82
1,84 1,40 1,56 1,74 1,63 1,55 1,45 1,67 1,61 1,58
1,79 1,68 1,57 1,70 1,32 1,51 1,33 1,42 1,73 1,26
Los pasos a seguir para construir una distribución de
frecuencias en el caso continuo son:
1) Se calcula el rango R, el cual es definido como la
diferencia entre el mayor valor de la variable X )
( max
x
y el menor valor de X )
( min
x ; es decir:
min
max x
x
R 

En nuestro caso tenemos:
88
,
1
max 
x
22
,
1
min 
x
es decir, R=1,88-1,22=0,66
2) El investigador fija el número de intervalos de clase
con que se trabajará, se recomienda un número de
intervalos de clase comprendido entre 5 y 15 como
máximo. El número de intervalos de clase se
representa por k.
Por ejemplo en nuestro caso fijemos ejemplo k=6
intervalos de clase
3) Se halla la longitud c de los intervalos de clase, para
esto hallamos el cociente:
k
R
c 
33
Como en nuestro caso como hemos establecido que el
número de intervalos de clase es k=6 y R=0,66,
entonces la amplitud de cada intervalo de clase es:
11
,
0
6
66
,
0


c
4) Luego se determina los límites de cada intervalo de
clase, para esto se busca el menor valor de la
variable X , es decir el )
( min
x , se le suma c=0,11 y se
obtiene el límite superior del primer intervalo de
clase y así sucesivamente.
Para nuestro caso min
x =1,22, el cual es el límite inferior
del primer intervalo de clase, se le suma 0,11
resultando 1,22+0,11=1,33, el cual es el límite superior
del primer intervalo de clase, a continuación el límite
inferior del segundo intervalo de clase es 1,33, le
sumamos otra vez 0,11 resultando el límite superior del
segundo intervalo de clase, resumiendo:
1,22-1,33 primer intervalo de clase
1,33-1,44 segundo intervalo de clase
1,44-1,55 tercer intervalo de clase
1,55-1,66 cuarto intervalo de clase
1,66-1,77 quinto intervalo de clase
1,77-1,88 sexto intervalo de clase.
5) Determinamos la marca de clase de cada intervalo de
clase, el cual es el punto medio de cada intervalo,
para esto sumamos el límite inferior y superior de
cada intervalo de clase y lo dividimos entre dos,
resultando el punto medio de cada intervalo de
clase.
Para el ejemplo dado tenemos:
Intervalos
de clase
Marca de
clase
34
,
1
1
,

  i
i x
x
)
2
(
,
,
1 i
i
i
x
x
x

 
[1.22-1,33> 1,275
[1,33-1,44> 1,385
[1,44-1,55> 1,495
[1,55-166> 1,605
[1,66-1,77> 1,715
[1,77-1.88] 1,825
6) Se realiza el proceso de conteo, es decir se obtiene
el número de valores de la variable X que pertenece
a cada intervalo.
En nuestro caso, se tiene:
Intervalos
de clase
Marca de
clase
Frecuencia
absoluta
i
f
1,22-1,33 1,275 ///=3
1,33-1,44 1,385 //////////=10
1,44-1,55 1,495 /////////=9
1,55-1,66 1,605 ///////////////=15
1,66-1,77 1,715 ////////=8
1,77-1,88 1,825 /////=5
A partir de este momento se trabaja igual que el caso
discreto, es decir se agregan las tres columnas
correspondientes a las frecuencias relativas,
frecuencias absolutas acumuladas y finalmente las
frecuencias relativas acumuladas.
A continuación presentamos el cuadro de distribución
de frecuencias respectivo, es importante recordar que
las interpretaciones son vitales para cualquier estudio
de tipo descriptivo.
35
Intervalos
de clase
,
,
1 i
i x
x 

Marca de
clase
i
x
Frecuencia
absoluta
i
f
Frecuencia
relativa
i
h
Frecuencia
absoluta
acumulada
i
F
Frecuencia
relativa
acumulada
i
H
[ 1.22-1,33> 1,275 3 3/50 = 0,06 3 0.06
[1,33-1,44> 1,385 10 10/50 = 0,2 13 0,26
[1,44-1,55> 1,495 9 9/50 = 0,18 22 0,44
[1,55-1,66> 1,605 15 15/50 = 0,30 37 0,74
[1,66-1,77> 1,715 8 8/50 = 0,16 45 0,9
[1,77-1,88] 1,825 5 5/50 = 0,1 50 1
n = 50 1
Interpretación.-
10
2 
f ; significa que existen 10 pacientes cuyas tallas
están comprendidas entre 1,33 y 1,44 mts.
18
,
0
3 
h ; significa que el 18% de los pacientes tienen una
talla comprendida entre 1,44 y .1,55 mts.
37
4 
F ; significa que existen 37 pacientes cuyas tallas
están comprendidas entre 1,22 y 1,66 mts.
5
H ;significa que el 90% de los pacientes tienen una
estatura comprendida entre 1,22 y 1,77 mts.
Ejercicio 1.- Con los mismos datos del ejemplo
anterior, pero con k=5, hacer el cuadro de distribución
de frecuencias; interpretar algunos valores; hacer sus
respectivos gráficos.
Observaciones:
a) El tomar como criterio la elección del número de
intervalos k entre 5 y 15 es solamente una
alternativa; otras formas que también se usan son
las siguientes:
 Elegir K de forma tal que K= n ; donde k es el
entero más próximo a la raíz cuadrada del
36
tamaño de la muestra, en nuestro caso
K= 50 7,07, en cuyo caso se puede tomar k=7
por ser el entero más próximo a 7,07
 Existe también una fórmula para determinar el
número de intervalos, denominada Fórmula de
Sturges; dada por:
)
log(
22
,
3
1 n
K 

Donde log(10) es el logaritmo de n en base 10.
En nuestro caso se tiene
K=1+3,22 log(50)=1+3,22(1,6989)=6,476
b) Las dos últimas propuestas para la elección del
número de intervalos K son alternativas viables a la
que hemos usado para la construcción de la tabla de
frecuencias con las n=50 estaturas. En todo caso no
hay que olvidar que siempre que se haga intervalos
de clase implicará cierta pérdida de información;
pues todos los valores en un intervalo de clase
pasan a ser representados por la marca de clase
respectiva.
c) Para construir intervalos de clase se recomienda
tener un tamaño de muestra grande, es decir 30

n ;
en caso contrario sería mejor trabajar los datos
continuos como si fueran datos discretos.
d) Si bien es cierto que existe pérdida de información
en la construcción de los intervalos de clase;
también es cierto que se gana otras cosas; como por
ejemplo cuando se dibuja el histograma esta revela
algunas cosas importantes como simetría o
asimetría de la curva; en que intervalo está el mayor
número de observaciones (moda).
37
8) DISTRIBUCIÓN DE FRECUENCIAS CASO
CUALITATIVO.
En este caso no se hace distinción entre las variables
cualitativas ordinales y las cualitativas nominales; en
ambos casos se trabaja igual.
Se mostrará un ejemplo concreto para ver la
metodología.
Ejemplo 18. En una universidad existen alumnos de
diversas regiones: Costa (1); Sierra (2) y Selva (3).
Una muestra aleatoria proporcionó el siguiente
resultado:
2 1 1 2 1 1 3 1 2 3 2 1 1 1 1 3 3 2 1 2 2 1 1 1
Luego el tamaño de la muestra es 24

n ; se puede
construir un de distribución de frecuencias absolutas
y de frecuencias relativas de la siguiente manera:
i
X i
f i
h
1

C 13 5416
,
0
24
/
13 
2

SI 7 2916
,
0
24
/
7 
3

Se 4 1666
,
0
24
/
4 
24

n 1
9998
,
0 
Se interpreta así:
7
2 
f : siete estudiantes son de la sierra.
16
,
29
100 2 
h : el 29,16% de los estudiantes son de la
sierra.
Existen varias formas de representar gráficamente
esta distribución de frecuencias; destacan los
gráficos: ww
38
 Gráficos circulares
 Gráficos de barras
 Diagrama de pastel
ww
39
 Gráficos de cilindros
w
 Gráficos combinados
 Pictogramas
ww
40
Ejemplo 19. Hacer un diagrama circular y diagrama
de barras para la data de ejemplo anterior
Solución.-
El cuadro de distribución de frecuencias es: ww
i
X i
f i
h
1

C 13 5416
,
0
24
/
13 
2

SI 7 2916
,
0
24
/
7 
3

Se 4 1666
,
0
24
/
4 
24

n 1
9998
,
0 
41
X Frecuencia Porcentaje
Válidos
1,00 13 54,2
2,00 7 29,2
3,00 4 16,7
Total 24 100,0
w
ww
9) MEDIDAS DE TENDENCIA CENTRAL O
POSICIÓN O TAMBIÉN LLAMADOS
PROMEDIOS.(VARIABLES CUANTITATIVA)
Si bien es cierto existen varias medidas de tendencia
central, nos dedicaremos en primer lugar a la más
importante de todas; conocida como media muestral o
42
simplemente media o promedio, esta medida
usualmente se representa por X o  
X
M .
w
La media muestral es sin lugar a duda la más usada y
conocida de todas las medidas de tendencia central,
aparte están también otras medidas de tendencia
central por mencionar alguna de ellas e incluida la
media muestral (o simplemente media o promedio
son:
a) Media muestral o media aritmética: ]
[X
M
X 
b) Moda: d
M
c) Mediana: e
M
d) Cuartiles : 3
2
1 ;
; Q
Me
Q
Q 
e) Deciles: 9
2
1 ;...;
; D
D
D
f) Centiles : 99
2
1 ;...;
; C
C
C
g) Media geométrica: g
M
h) Media armónica: h
M
ww
a)La ]
[X
M
X  es una medida resumen de la muestra más
importante y la más usada para los datos muestrales
provenientes de variables cuantitativas y es dado por:
n
muestrales
datos
Suma
X 
43
Usualmente para su cálculo se presentan tres casos:
Caso 1.- (datos sin tabular) Si los datos están sin
tabular, es decir los datos están en bruto, sin ningún
tipo de ordenamiento o tratamiento y se presentan de
la siguiente manera: n
X
X
X ,...,
, 2
1 donde n es el tamaño
de la muestra, en este caso se tiene:
 
n
X
X
M
X
n
i
i



 1
Ejemplo 20. Los siguientes datos corresponden a las
edades (años) de un grupo de alumnos tomados al
azar del registro de matrícula, los cuales resultaron
ser:
22, 24, 25, 20, 23, 23, 24, 26
En este caso 8

n (tamaño de la muestra), luego:
años
X
X
375
,
23
8
187
8
26
24
23
23
20
25
24
22










ww
Es decir la edad promedio de los ocho estudiantes es
de 23,375 años, observe que la media siempre va
expresada en las unidades originales proporcionados
por los datos muestrales.
Un gráfico ilustrativo sobre la estatura en mts
promedio es:
44
Ejercicio 4.- (Alumno) Los siguientes datos
corresponden a las notas finales de un grupo de
alumnos (H) y de un grupo de alumnas (M) en el
curso de Historia I w
(H) 12 13 11 16 10 11 18
(M) 11 13 12 16 15 12 14 15 17
a)Hallar la nota promedio de los estudiantes
hombres.
b)Hallar la nota promedio de las estudiantes
mujeres.
c)Junte ambos grupos y obtenga la nota promedio,
d)¿Cómo podría obtener la nota promedio de c)
usando solamente los resultados en a) y en b)?
Caso 2.- (datos tabulados, como en el caso
cuantitativo discreto)
ww
Supongamos que los datos originales proporcionada
por la muestra n
X
X
X ,...,
, 2
1 y que han recibido un
tratamiento, por ejemplo ya se ha construido un
cuadro de distribución de frecuencias, siendo
k
X
X
X ,...,
, 2
1 los valores distintos de la variable, con
frecuencias absolutas k
f
f
f ,...,
, 2
1 respectivamente y se
tiene el cuadro:
45
i
X i
f
1
X 1
f
2
X 2
f
.. ..
k
X k
f
n
Donde, 1
f es el número de veces que se repite 1
X , 2
f es
el número de veces que se repite 2
X y así
sucesivamente, en este caso la media muestral se
calcula por la fórmula:
n
X
f
X
k
i
i
i


 1
Ejemplo 21. La siguiente información corresponde
al número de hijos por familia en una muestra de
hogares tomados al azar del distrito de Lince:
2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16
ww
Tenemos 16

n datos muestrales, estos pueden ser
ordenados fácilmente en un cuadro de distribución de
frecuencias de la siguiente manera:
i
X i
f i
i X
f
1 3 3
2 6 12
3 5 15
4 1 4
5 1 5
16

n 39
46
Observe que si bien es cierto son 16

n datos, no todos
son distintos. En este caso 5

k valores distintos de la
variable, de la fórmula dada se obtiene:
4375
,
2
16
39
16
)
5
(
1
)
4
(
1
)
3
(
5
)
2
(
6
)
1
(
3







X hijos por
familia.
Ejercicio 5.- (Alumno)En base al siguiente cuadro
correspondiente al número de televisores por familia
en una muestra tomada en el distrito de San Miguel;
se pide calcular el promedio de televisores por familia.
i
X i
f i
i X
f 2
i
i X
f
0 1
1 7
2 10
4 2
5 ¿
a)Teniendo en cuenta que F5=20; hallar el
promedio de televisores por familia.
b)Calcular
2
i
i X
f
 ww
Caso 3.- (datos tabulados como en el caso cuantitativo
continuo en intervalos de clase)
En este caso la fórmula es igual al caso anterior, es
decir también
n
X
f
X
k
i
i
i


 1
47
Ahora los i
X son las marcas de clase de los intervalos
(puntos medios de los intervalos) y k es el número de
intervalos de clase.
Ejemplo 22. El siguiente cuadro muestra la
distribución de sueldos mensuales en soles de un
grupo de trabajadores de construcción civil en k=6
intervalos de clase; cada intervalo clase tiene
amplitud c=100
Intervalos i
X i
f i
i X
f
700-800 750 5 3750
800-900 850 10 8500
900-1000 950 20 19000
1000-1100 1050 30 31500
1100-1200 1150 25 28750
1200-1300 1250 10 12500
100

n 104000
Luego:
1040
100
104000
1





n
X
f
X
k
i
i
i
soles mensuales. ww
Ejercicio 6.- (Alumno) El siguiente cuadro muestra
los pesos en kilos de un grupo de personas con
problemas de diabetes ingresados en el Hospital
María Auxiliadora del distrito de SJM:
Intervalos i
X i
f 2
i
i X
f
60,0-62,5 6
62,5-65,0 11
65,0-67,5 20
35
48
25
10
8
Total
a)Calcular el peso promedio de los pacientes con
diabetes.
b)Hallar la suma de los cuadrados de las
observaciones.
c)Calcular 2
i
i X
f

10) PROPIEDADES DE LA MEDIA
MUESTRAL O MEDIA ARITMÉTICA O
SIMPLEMENTE MEDIA O PROMEDIO
La media muestral tiene propiedades interesantes y
que nos permiten resolver algunos problemas de
aplicación.
Propiedad 1 La media muestral (o también llamada
media aritmética) de una constante k es la misma
constante k. Simbólicamente:
k
k
M 
]
[ ww
Esto quiere decir que si todos los datos muestrales son
iguales a una constante k; entonces la media
aritmética de ellos también es la constante k.
ww
Ejemplo 23. En una reunión de amigos
contemporáneos se juntan 5 personas; todos ellos de
edad igual a k=28 años; es decir n=5 y los datos
muestrales son.
49
X1=28; X2=28; X3=28; X4=28; X5=28
Por lo tanto 28
5
)
28
(
5
5
28
28
28
28
28
]
[ 






 k
M
X
Ejercicio 7.- (Alumno)En un salón del kínder hay 49
niños que asisten a clases, todos ellos tienen 4 años
cumplidos.
a)Hallar la edad promedio de los estudiantes de
kínder.
b)Supongamos que se incorpora al salón un alumno
de 5 años ¿Cuál es la nueva edad promedio?
Propiedad 2 La media aritmética de una variable X
más o menos una constante k, es la media aritmética
de la variable X más o menos la constante k.
Simbólicamente:
k
X
M
k
X
M 

 ]
[
]
[
Ejemplo 24. Los siguientes datos se refieren a
estaturas en metros de un grupo de pacientes de la
tercera edad:
X1=1,67; X2=1,70; X3=1,75; X4=1,68 ww
La media muestral o media aritmética de los n=4
datos es dado por:
7
,
1
4
8
,
6
4
68
,
1
75
,
1
70
,
1
67
,
1
]
[ 





 X
M
X mts.
Si a cada datos se les suma la constante k= 5
centímetros y calculemos la nueva media aritmética.
50
k=5 centímetros equivales a 0,05 metros, es decir
k=0,05 mts.
X1+0;05=1,67+0,05=1,72;
X2+0,05=1,70+0,05=1,75;
X3+0,05=1,75+0,05=1,80;
X4+0,05=1,68+0,05=1,73
La nueva media aritmética es:
05
,
0
70
,
1
05
,
0
]
[
75
,
1
4
7
4
73
,
1
80
,
1
75
,
1
72
,
1
]
05
,
0
[ 









 X
M
X
M
Ejercicio 8.- (Alumno)Se pesó a un grupo de sacos de
arroz, resultando un peso promedio de 52 kilos por
saco. Posteriormente se hizo un chequeo la balanza
electrónica y se verificó que estaba defectuosa, en el
sentido que pesaba 1,5 kilos por encima de lo que
realmente es.
Hallar el peso promedio verdadero.
Propiedad 3 La media aritmética de una constante c
por una variable X es la constante c multiplicada por
la media de X.
Simbólicamente: ww
]
[
]
[ X
cM
cX
M 
Ejemplo 25. Un profesor ha calificado a sus 6
alumnos y les ha puesto las notas de 12; 14; 16; 10; 15;
13.
Con estos resultados la nota promedio es
51
3333
,
13
6
80
6
13
15
10
16
14
12
]
[ 







X
M puntos
El profesor en vista del buen comportamiento,
asistencia, puntualidad ha decidido bonificar a cada
alumno con un 20% adicional sobre la nota original.
El nuevo promedio se obtiene cambiando la nota X
por X+(0,2)X=(1+0,2)X=1,2X; esto se hace a cada
nota:
1,2(12)=14,4; 1,2(14)=16,8; 1,2(16)=19,2; 1,2(10)=12; 1,2(15)=18;
1,2(13)=15,6 ww
16
99996
,
15
)
3333
,
13
(
2
,
1
]
[
2
,
1
16
6
96
6
6
,
15
18
12
2
,
19
8
,
16
4
,
14
]
2
,
1
[












X
M
X
M
Ejercicio 9.- (Alumno) Los trabajadores de construcción
civil de la ciudad de Huancayo gana en promedio por día 68,5
soles. Después de una negociación con los dueños de la
empresa constructora se acordó otorgarle un aumento del
15% por día sobre el jornal que percibían, además de una
bonificación de 5 soles diarios por movilidad.
a) Hallar el nuevo jornal promedio por día de los
trabajadores.
b) Si en lugar de considerar por día los jornales y bajo las
mismas condiciones ¿Cuál es el nuevo ingreso promedio
mensual de los trabajadores? Considere el mes de 30
días.
ww
Propiedad 4 Esta propiedad combina las propiedades 2 y
3. Simbólicamente:
k
X
cM
k
cX
M 

 ]
[
]
[
52
Ejercicio 10.- (Alumno)Demuestre
matemáticamente la Propiedad 4). Use propiedades
de sumatorias.
Propiedad 5 Si X e Y son dos variables que expresan
una característica común en cada unidad poblacional;
entonces:
]
[
]
[
]
[ Y
M
X
M
Y
X
M 


Ejemplo 26. Se tomado una muestra de n=5 familias
de un distrito de la capital, se consideran las
siguientes variables:
X: ingreso mensual en soles del esposo.
Y: ingreso mensual en soles de la esposa.
Los datos se muestran en el siguiente cuadro:
X 1350 1800 1200 1100 1500
Y 1400 1700 900 1000 1430
La variable Z=X+Y es el ingreso mensual familiar de
las n=5 familias.
X 1350 1800 1200 1100 1500
Y 1400 1700 900 1000 1450
Z=X+Y 2750 3500 2100 2100 2950
Se puede calcular el ingreso promedio mensual
familiar de las n=5 familias.
2680
5
13400
5
2950
2100
2100
3500
2750







Z soles.
53
También se pueden calcular el ingreso promedio de
los esposos por separado:
1390
5
6950
5
1500
1100
1200
1800
1350







X soles.
En forma similar el sueldo promedio de las esposas
1290
5
6450
5
1450
1000
900
1700
1400







Y soles.
Se observa que
1290
1390
]
[
]
[
2680
]
[
]
[ 





 Y
M
X
M
Y
X
M
Z
M soles.
Ejemplo 27. Las temperaturas registradas en una
ciudad; a las 12 del día en grados Fahrenheit (F0
) son
las siguientes 51; 60; 58; 62; 57; 49; 52; 62; 61; 63.
Hallar la media aritmética de las temperaturas en
grados Centígrados (C0
) si se cumple
8
,
1
32
0
0 

F
C
Solución.-
La temperatura en F0
es:
10
5
,
57
10
575
10
63
....
60
51
]
[ 0






 n
F
M
8
,
1
32
]
[
8
,
1
1
8
,
1
32
]
8
,
1
1
[
]
8
,
1
32
[
]
[ 0
0
0
0





 F
M
F
M
F
M
C
M
0
0
1666
,
14
8
,
1
32
]
5
,
57
[
8
,
1
1
]
[ C
C
M 

 ww
Ejercicio 11.- (Alumno) Con respecto un Ejemplo
24), supongamos que al ingreso familiar se incorpora
el hijo mayor por familia que también trabaja y
percibe un ingreso mensual; pero como recién
54
comienza y no tiene experiencia, sólo percibe el 65%
del sueldo del padre.
Hallar en nuevo ingreso promedio familiar.
Propiedad 6 (Media global) Si se tienen dos grupos 1
y 2; en los cuales se ha medido una característica
cuantitativa común X; supongamos que el primer
grupo es de tamaño n1 con media 1
X ; el segundo grupo
es de tamaño n2 con media 2
X ; entonces la media
global o conjunta de ambos grupos es:
2
1
2
2
1
1
n
n
X
n
X
n
X



Propiedad 7 La media muestral como todo promedio
está entre el valor mínimo y el valor máximo de las
observaciones; es decir.
max
min X
X
X 

Propiedad 8 Las desviaciones respecto a la media se
define como n
i
X
Xi ;...,
2
;
1
);
( 
 ww
Esta propiedad dice “La suma de las desviaciones
respecto a la media es idénticamente cero”.
Simbólicamente:
0
)
(
1




X
X
n
i
i
Ejemplo 28. Consideremos los siguientes datos:
3 5 4 6 2
Comprobar que la suma de las desviaciones con
respecto a la media es idénticamente nulo.
55
Con los datos obtenemos la media muestral
4
5
2
6
4
5
3






X
Las desviaciones con respecto a la media son:
(3-4)=-1; (5-4)=1; (4-4)=0; (6-4)=2; (2-4)=-2
0
)
2
(
)
2
(
0
)
1
(
)
1
(
)
(
1











X
X
n
i
i
Ejemplo 29. En dos salones de clase 1 y 2 se han
tomado un examen común de matemáticas; en el
primer salón tiene 16 alumnos y una nota promedio
de 12,5. En el segundo salón hay 20 alumnos y con
una nota promedio de 13,8.
Hallar la notal global (juntando las dos aulas)
Solución.-
5
,
12
;
16 1
1 
 X
n puntos
8
,
13
;
20 2
2 
 X
n puntos
Entonces la media global es dado por
ww
2222
,
13
36
476
20
16
)
8
,
13
(
20
)
5
,
12
(
16
2
1
2
2
1
1








n
n
X
n
X
n
X puntos.
Ejercicio 12.-(Alumno) Con respecto al ejemplo
anterior, supongamos un tercer salón de clases, del
cual se conocen los siguientes datos: ww
15

X puntos; 525
1



n
i
i
X
Hallar la media global considerando los tres salones
de clases.
56
11) MEDIA PONDERADA
Es un caso especial de la media muestral y se usa en
condiciones especiales donde existen pesos o
ponderaciones k
i
i ;...;
2
:
1
; 
 . En este caso se calcula con
la fórmula:
k
k
k X
X
X
X














...
...
2
1
2
2
1
1
Ejemplo 30. Las notas de un estudiante en cuatro
asignaturas(A; B; C; D), así como sus respectivos
créditos se muestran en el siguiente cuadro:
Curso Nota: i
X Crédito: i

A 11 3
B 13 7
C 12 5
D 15 2
Total 
 i
X 51 
 i
 17
Luego la media global es dada por:
5882
,
12
17
214
2
5
7
3
)
15
(
2
)
12
(
5
)
13
(
7
)
11
(
3










X puntos.
La media aritmética es:
ww
75
,
12
4
51
4
15
12
13
11






X puntos.
Ejercicio 13.-(Alumno) Con respecto al Ejemplo
anterior:
57
a) Si se agrega un quinto curso más (E) con
creditaje igual al promedio simple de los cuatro
primeros cursos y que la nota de ese quinto curso
es 14. Hallar el nuevo promedio ponderado.
b)¿Qué tendría que suceder con el creditaje para
que la media ponderada coincida con la media
aritmética?
12) MEDIDAS DE DISPERSIÓN (ABSOLUTA)
O MEDIDAS DE VARIABILIDAD.
Existen varias medidas de dispersión; las más
utilizadas son:
a)Desviación estándar (d.e.) muestral o típica: S
b)Varianza muestral:
2
S
c)Desviación Media: DM
d)Rango Intercuartílico: RI
Ejemplo 31. Si bien es cierto la media muestral es
importante, esta no es suficiente, pues hace falta
definir una medida de variabilidad de los datos
alrededor de X , para esto imaginemos tres grupos de
alumnos, donde cada grupo es de tres alumnos y que
la variable de interés sea la nota en la escala vigesimal
en cada grupo y tenemos los siguientes resultados:
Grupo A: 09 10 11; 10

A
X puntos.
Grupo B: 07 10 13; 10

B
X puntos.
58
Grupo C: 01 10 19; 10

C
X puntos.
Observemos que los tres grupos tienen la misma
media muestral y son iguales a 10; sin embargo la
variabilidad no es la misma en los tres grupos, es
necesario definir una medida que capte esta
variabilidad, una medida de muy usada es la
desviación estándar o desviación típica muestral, la
cual es definida por:
1
)
(
1
2





n
X
X
S
n
i
i
Vamos a calcular esta medida de variabilidad para los
tres grupos; resultando:
.
1
1
3
)
10
11
(
)
10
10
(
)
10
9
(
2
2
2
puntos
SA 







.
3
9
1
3
)
10
13
(
)
10
10
(
)
10
7
( 2
2
2
puntos
SB 








.
9
81
1
3
)
10
19
(
)
10
10
(
)
10
1
( 2
2
2
puntos
SC 








Si analizamos los tres grupos de datos, se nota que en
el primer grupo los datos está más concentrados
alrededor de A
X , en el segundo grupo los datos se
abren un poco más alrededor de su media y
finalmente el tercer grupo los datos están mucho más
dispersos alrededor de la media muestral.
Esto se ve reflejado en la desviación estándar
muestral, pues si los datos están muy dispersos la
59
desviación estándar es “grande”, si los datos están
muy pegados alrededor de su media la varianza es
“pequeña”; por esa razón la desviación estándar es
una medida de variabilidad excelente alrededor de la
media muestral en el siguiente sentido:
“Si la desviación es estándar (d.e.) es “grande”
significa más dipersión de los datos alrededor de la
media, si la d,e, es pequeña significa más
concentración de los datos alrededor de la media”.
13) DESVIACIÓN ESTÁNDAR O DESVIACIÓN
TÍPICA s
Es la medida de dispersión absoluta más usada y es
dada por:
1
)
(
1
2





n
X
X
S
n
i
i
Propiedad: (demostrable)
1
)
(
1
)
(
1
)
(
1
2
2
1
1
2
2
1
2












 



n
X
n
X
n
n
X
X
n
X
X
S
n
i
i
n
i
n
i
i
i
n
i
i
ww
También como en la media aritmética se presentan
tres casos en el cálculo de la desviación estándar:
Caso 1.- (datos sin tabular)
Si los datos están sin ningún tipo de tratamiento o
datos sin tabular y se tiene la muestra n
X
X
X ,...,
, 2
1 , en
60
este caso la desviación estándar (d.e.) o desviación
típica se calcula mediante la fórmula:
1
)
(
1
)
(
1
1
2
2
1
2












n
n
X
X
n
X
X
S
n
i
n
i
i
i
n
i
i
Ejemplo 32. Con los siguientes datos , referente a las
a las edades de ocho alumnos; es decir:
22, 24, 25, 20, 23, 23, 24, 26
en este caso 8

n y para el cálculo de la d.e. se
necesitan dos cantidades, la suma de datos y la suma
de los cuadrados de los datos, en este caso se tiene:



8
1
187
i
i
X , 4395
)
26
(
...
)
24
(
)
22
( 2
2
2
8
1
2







i
i
X
Luego reemplazando se obtiene:
años
S 8468
,
1
1
8
8
)
187
(
4395
2




ww
Ejercicio 14.-(Alumno) Los siguientes datos son los
pesos de un grupo de adolecentes : 54; 60; 48; 52;
45
a)Hallar la desviación estándar.
b)Sume 2 kilos a cada peso y luego calcular la
desviación estándar asociada. ¿ Es igual a la
obtenida en la parte a)?
61
Caso 2.- (datos tabulados, como en el caso
cuantitativo discreto)
En este caso se tiene:
1
)
(
1
1
2
2







n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
donde k es el número de valores distintos de la v,a, X
ww
Ejemplo 33. Con los datos de un ejemplo anterior
correspondientes al número de hijos por familia:
2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2
Se necesita una columna que tenga la suma de
cuadrados, es decir:
i
X i
f i
i X
f 2
i
i X
f
1 3 3 3
2 6 12 24
3 5 15 45
4 1 4 16
5 1 5 25
16

n 39 113
ww
Reemplazando, se tiene:
familia
por
hijos
S 0935
,
1
1
16
16
39
113
2




62
Ejercicio 15.-(Alumno) Con los n=16 datos del
ejemplo anterior se aumenta 3 datos más
correspondientes a tres familias los que tienen 3; 4; 3
hijos. Hallar la d.e. correspondiente.
Caso 3.- (datos tabulados como en el caso cuantitativo
continuo en intervalos de clase)
En este caso la fórmula es similar que en el caso
anterior, es decir:
1
)
(
1
1
2
2







n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
En este caso los i
X son las marcas de clase y k es el
número de intervalos de clase.
Ejemplo 34. Usando los datos de un Ejemplo
anterior, referente a los sueldos mensuales en soles
de un grupo de trabajadores, es necesario agregar una
columna más que contenga la suma de cuadrados, es
decir:
ww
Intervalos i
X i
f i
i X
f 2
i
i X
f
700-800 750 5 3750 2812500
800-900 850 10 8500 7225000
900-1000 950 20 19000 18050000
1000-1100 1050 30 31500 33075000
63
1100-1200 1150 25 28750 33062500
1200-1300 1250 10 12500 15625000
100

n 104000 109850000
Reemplazando se obtiene:
mensuales
soles
S 6549
,
130
1
100
100
104000
109850000
2



 .
Ejercicio 16.-(Alumno) Si a los datos del ejemplo
anterior se le agrega un intervalo más cuya marca de
clase es 1350 y Frecuencia Absoluta Acumulada F7
es 105. Hallar la d.e. correspondiente.
Ejercicio 17.-Probar que se tienen n datos numéricos
y tos iguales a una constante k; entonces 0
;
]
[ 
 S
K
K
M
14) VARIANZA MUESTRAL ]
[
2
X
Var
S 
Definición 5. ( varianza muestral) La varianza
muestral representa por 2
S = ]
[X
Var y es el cuadrado
de la desviación estándar; es decir:
2
2
.)
.
(
]
[ e
d
X
Var
S 
 ; donde
S
estándar
desviación
e
d 

.
. ww
Ambas; el 2
S (varianza muestral) y el S (desviación
estándar muestral) son medidas de variabilidad de los
datos alrededor de la media muestral, la diferencia
estriba en la S está expresada en la unidades
64
originales, mientras que 2
S está expresada en
unidades originales al cuadrado.
Obviamente si se conoce la d.e. muestral S elevando al
cuadrado se obtiene la varianza muestral
2
S y
viceversa si se conoce la varianza muestral
2
S sacando
la raíz cuadrada positiva se obtiene la d.e. muestral S ;
es decir:
]
[
.
.
2
X
Var
S
e
d
S 



Considerando lo anterior en la que se estudió la
desviación estándar muestral S y su fórmula de
cálculo en Caso 1; Caso 2 y Caso 3 se repiten sin la
raíz cuadrada; es decir para el cálculo de la varianza
muestral surgen tres casos:
Caso 1.- (Datos sin tabular)
1
)
(
1
1
2
2
2







n
n
X
X
S
n
i
n
i
i
i
Caso 2.- (Datos tabulados como en el caso
cuantitativo discreto)
ww
1
)
(
1
1
2
2
2







n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
Caso 3.- (Datos tabulados como en el caso
cuantitativo continuo)
65
1
)
(
1
1
2
2
2







n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
; donde
:
i
X marca de clase del iésimo intervalo.
:
k número de intervalos de clase.
Ejemplo 35. Los siguientes datos corresponden al
peso de un grupo de recién nacidos en kilos escogidos
al azar en verano del presente año: 2,8 3,2 3,4 3,0
2,3.
a)Calcular la media muestral, la varianza muestral
y luego obtenga la d.e. muestral para esta
muestra de tamaño n=5.
b)En invierno del mismo año se registró otro grupo
de recién nacidos, resultando: 3,1 3,1 3,1 3,1
3,1
Calcular
2
S y S
c) Si los datos: 2,8 3,2 3,4 3,0 2,3 les sumamos
100 gramos ¿Cambia la varianza obtenida en a)?
d)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3
los reducimos en un 5% ¿Cambia la varianza
obtenida en a)?
e)La varianza muestral ]
[
2
X
Var
S  ¿Puede ser
negativa?
66
Solución:
a)Se necesitan dos resultados: Suma de datos y
Suma de cuadrados de datos; es decir:
7
,
14
5
1



i
i
X ; 5
;
93
,
43
5
1
2




n
X
i
i
Por lo tanto:
94
,
2
5
7
,
14
]
[ 

 X
M
X kilos;
178
,
0
4
712
,
0
1
5
5
)
7
,
14
(
93
,
43
2
2





S (kilos)2
Tomando raíz cuadrada
4219
,
0
178
,
0
2



 S
S (kilos)
b) 5
,
15
)
1
,
3
(
5
1
,
3
1
,
3
1
,
3
1
,
3
1
,
3
;
4
5
1







 

i
i
X
n
05
,
48
)
1
,
3
(
5
2
4
1
2




i
i
X ; luego
1
,
3
5
5
.
15
]
[ 

 X
M
X (kilos)
0
4
0
1
5
5
)
5
,
15
(
05
,
48
2
2





S
Entonces la d.e. es 0

S
ww
Este resultado de varianza cero se debe la
siguiente propiedad de la varianza muestral que
dice lo siguiente:
“Si a todos los datos son iguales a una constante
k; entonces la varianza muestral es igual a cero”
Simbólicamente:
0
]
[ 
k
Var
67
Observe el siguiente detalle:
Si todos los datos son iguales la media muestral
coincide con el dato común; en este caso no hay
variabilidad alrededor de la media; eso se ve
reflejado con una d.e. igual a cero o
equivalentemente una varianza muestral igual a
cero.
c)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3
se les suma 100 gramos que es equivalente a 0,1
kilos. La nueva data es ahora: 2,9 3,3 3,5 3,1
2,4
Entonces:
92
,
46
2
,
15
5
1
5
1
2


 
 
i i
i
i X
X
178
,
0
4
712
,
0
1
5
5
)
2
,
15
(
92
,
46
2
2





S
Este resultado coincide con el obtenido en la
parte a); esto no es una coincidencia, en realidad
es una propiedad de la varianza muestral que
dice lo siguiente:
|
“La varianza de la variable X más o menos una
constante k es igual a la varianza de X”
Simbólicamente:
]
[
]
[ X
Var
k
X
Var 

68
d)Si a cada dato los reducimos un 5% entonces a
cada dato hay que multiplicarlo por la constante
k=0,95; es decir:
0,95(2,8)=2,66 0,95(3,2)=3,04 0,95(3,4)=3,23
0,95(3,0)=2,85 0,95(2,3)=2,185
646825
,
39
965
,
13
2




i
i
X
X
(Verificar)
160645
,
0
)
178
,
0
(
)
95
,
0
(
]
[
)
95
,
0
(
160645
,
0
4
5
)
965
,
13
(
646825
,
39
]
[
2
2
2
2






 X
Var
X
Var
S
Lo anterior es una propiedad de la varianza
muestral, que dice lo siguiente:
“La varianza de una constante c multiplicada por
la variable X es el la constante al cuadrado
multiplicada por la varianza de la variable X”
Simbólicamente
ww
]
[
]
[
2
X
Var
c
kX
Var 
e)La varianza nunca puede ser negativa, pues suma
de cuadrados; es decir 0
2

S
15) PROPIEDADES DE LA VARIANZA
MUESTRAL
2
S
Propiedad 1 .- 0
)
( 2

 S
X
Var
69
Propiedad 2 .- 0
]
[ 
k
Var
Propiedad 3 .- ]
[
]
[ X
Var
k
X
Var 

Propiedad 4 .- ]
[
]
[
2
X
Var
c
cX
Var 
Propiedad 5 .- ]
[
]
[
2
X
Var
c
k
cX
Var 

Ejercicio 18.- (Alumno)
Los siguientes datos corresponden a la estatura en
metros de un grupo de estudiantes varones:
ww
1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75
f) Calcular la media muestral, la varianza muestral
y luego obtenga la d.e. muestral.
g)Un grupo de estudiantes mujeres registro que 8
de ellas registraron un estatura común de 1,68
metros,
Calcular la media muestral considerando a
varones y mujeres.
h) Si a los datos: 1,67 1,70 1,68 1,71 1,69 1,71
1,72 1,75 se les resta 2 centímetros, calcular la
varianza muestral y la desviación estándar
muestral. ¿Cambian los resultados con los
obtenidos en la parte f)
i) Si a cada uno de los datos:
1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75
70
Se les aumenta un 3%. Obtener la varianza
muestral. ¿Cambian los resultados con respecto
a la parte f)?
j) La desviación estándar ¿Puede ser negativa?
16) MEDIDAS DE DISPERSIÓN RELATIVA:
El COEFICIENTE DE VARIACIÓN (C.V.)
Cuando dos o más grupos tienen la misma media
muestral la desviación estándar sirve directamente
para decidir el grupo que tiene menos dispersión
alrededor de la media.
Sin embargo tener dos o más grupos con la misma
media muestral por lo general no es posible; para
poder comparar la variabilidad en estos casos se
define el Coeficiente de Variación (CV) y es una
medida de dispersión relativa pues es adimensional y
es dada por:
ww
X
S
CV 
En la definición anterior se supone que la media
muestral es positiva; es decir 0

X ; si la media
muestral fuese negativa se le puede tomar el valor
absoluto y con esto el Coeficiente de Variación queda
definida así:
X
S
CV 
71
Ejemplo 36. Las notas promedios finales de tres
salones (A; B y C) son 5
,
11

A
X ; 0
,
13

B
X ; 0
,
10

C
X
puntos con desviaciones estándar de 6
,
0

A
S ; 55
,
0

B
S ;
53
,
0

C
S
¿Qué salón tiene notas menos variable alrededor de la
media? ¿Qué salón tiene notas más variables
alrededor la media?
Los datos presentados y los CV asociados se resumen
en el siguiente cuadro:
5
,
11

A
X 6
,
0

A
S
0521
,
0
5
,
11
6
,
0


A
CV
%
21
,
5
100 
A
CV
0
,
13

B
X 55
,
0

B
S
0423
,
0
0
,
13
55
,
0


B
CV
%
23
,
4
100 
B
CV
0
,
10

C
X 53
,
0

C
S
053
,
0
0
,
10
53
,
0


C
CV
%
3
,
5
100 
C
CV
El salón con notas menos alrededor de la media (más
concentrados alrededor de la media) es aquel que
tiene menos CV en este caso es el salón B; pues su CV
en % tiene un valor de %
23
,
4
100 
B
CV
El salón con notas más variables alrededor de la
media (más dispersos alrededor de la media) es aquel
que tiene alto CV, en este caso es el salón C; pues tien
un valor de %
3
,
5
100 
C
CV
Ejemplo 37. Se tomaron al azar dos distritos de la
capital (A y B) y la variable de interés es el número de
dormitorios por familia; se tienen los dos siguientes
cuadros:
Distrito A
72
i
X i
f
0 1
1 4
2 5
3 4
4 2
Distrito B
i
X i
f
1 0
2 1
3 3
4 7
5 4
6 1
¿Cuál de los dos grupos tiene mayor variabilidad
respecto a la media?
Solución.-
Para cada grupo hay que calcular la suma de datos y
la suma de sus cuadrados
Distrito A.-
34

 i
i X
f ; 92
2

 i
i X
f ; 16

n
125
,
2
16
34


X dormitorios;
1474
,
1
15
75
,
19
15
16
)
34
(
92
2




S dormitorios ww
8194
,
0
125
,
2
1474
,
1


CV ; %
94
,
81
100 
CV
Distrito B.-
73
65

 i
i X
f ; 279
2

 i
i X
f ; 16

n
0625
,
4
16
65


X dormitorios,
9979
,
0
15
9375
,
14
15
16
)
65
(
279
2




S
2456
,
0
0625
,
4
9979
,
0


CV ; %
26
,
24
100 
CV
El grupo más variable alrededor de la media es aquel
que tiene mayor CV; en este caso es el número de
dormitorios del distrito A.
17) APLICACIONES DEL COEFICIENTE DE
VARIACIÓN
El Coeficiente de Variación CV tiene dos importantes
aplicaciones:
a)Si se tienen dos o más grupos, el CV permite
decidir el grupo que tiene menos variabilidad
relativa alrededor de la media; para esto se busca
el CV más pequeño o el 100CV más pequeño
b)Permite tener un criterio para decidir cuando
una varianza puede ser llamada “grande” o pueda
ser denominada “pequeña”; en el siguiente
sentido:
1)Si CV<0,05 (100CV<5%) se considera una
varianza “pequeña”.
74
2) Si CV>0,05 (100CV>5%) se considera una
varianza “grande”.
ww
Ejemplo 38. Con respecto al Ejemplo anterior donde
la variable de interés es número de dormitorios por
familia, decidir para cada caso si se trata de varianza
pequeña o grande.
Se tiene los siguientes cálculos ya hechos:
Para el distrito A se tiene CV=0,8194>0,05
(Varianza grande)
Para el distrito B se tiene CV=0,2426>0,05
(Varianza grande)
Ejercicio 19.-(Alumno) Decir si es V o F la siguiente
afirmación: “Si a un conjunto de datos numéricos se
les suma una constante k; entonces el CV no cambia.”
ww
75
Ejercicios
Parte 1
1)Clasificar las siguientes variables:
1.1 Número de errores por página de un libro.
1.2 Nivel de humedad en una ciudad.
1.3 Número de latidos del corazón por minuto.
1.4 Color del cabello.
1.5 Duración de los focos de luz.
1.6 Marca de autos.
1.7 Número de cabellos por persona.
1.8 Color de tinta de lapiceros.
1.9 Número de teléfono de los usuarios.
1.10 Nivel de glucosa en la sangre en pacientes.
1.11 Altitud de las ciudades de la Sierra del Perú.
1.12 Estado civil de las personas adultas.
1.13 Temperatura medioambiente.
1.14 Diámetro interior de tuercas de precisión.
1.15 Tipo de diabetes en personas adultas.
1.16 Número de mascotas por familia.
1.17 Número de ríos que llegan a la costa en los
diferentes países del mundo.
1.18 La clase social de los peruanos.
76
2) Consideremos la población de alpacas de
una región de la sierra peruana, dicha población
quiere ser estudiada de acuerdo a su composición
por sexo (macho=m, hembra=h)
a)Defina un parámetro de interés.
b)Se cazan 150 animales de esta especie, de ellas
resultan 78 machos, estime la proporción
poblacional de machos de las alpacas de esa zona.
3) Los datos siguientes son referentes a la
duración de un grupo de focos (marca A) de luz
medido en horas: 1200, 1050, 1100, 1000,
1111, 1150, 1000
a)Hallar la media muestral X ,
b)Hallar la desviación estándar muestral S y la
varianza muestral 2
S .
c)Calcular el coeficiente de variación.¿Varianza
pequeña o grande?
4) Los siguientes datos son referentes al
número de visitas al seguro social en un año
determinado de una muestra de jubilados:
2, 4, 3, 4, 5, 4, 3, 3, 4, 5, 2, 4, 2, 4, 3, 3, 4, 3, 3, 5
a)Construir un cuadro de distribución de
frecuencias.
Obtener S
S
X ,
, 2
b)Si a cada dato se le suma 1. ¿Cambia la media
muestral?. ¿cambia la desviación estándar
muestral?. Justifique.
77
5) El siguiente cuadro muestra la distribución
de las edades de un grupo de alumnos
universitarios:
Intervalos i
X i
f
16-18 17 5
18-20 19 10
20-22 21 15
22-24 23 13
24-26 25 7
26-28 27 3
a)Calcular 2
,
, S
S
X . ¿Varianza pequeña o grande?
b) Obtener i
i
i H
F
h ,
, , e interpretar algunos valores
Solución:
Primero creamos el siguiente cuadro
Intervalos i
X i
f i
h i
F i
H i
i X
f 2
i
i X
f
[16-18> 17 5 0,094
3
5 0,094
3
85 1445
[18-20> 19 10 0,188
6
15 0,282
9
190 3610
[20-
22>
21 15 0,283
0
3
0
0,565
9
315 6615
[22-24> 2
3
13 0,245
2
4
3
0,8111 299 6877
[24-26> 2
5
7 0,132
0
5
0
0,943
1
175 4375
[26-28> 27 3 0,056
6
5
3
0,999
7
81 2187
Totales n=5
3
114
5
2510
9
78
a) 3037
,
21
53
1145


X años
b) 3592
,
7
52
6792
,
382
52
53
)
1145
(
25109
2
2




S (años)2
7127
.
2
3592
,
7 

S años
%
73
,
12
100
1273
,
0
3037
,
21
/
7127
,
2



CV
CV
Varianza grande
6) Decir si es Posible (P) o No Posible (NP),
las siguientes afirmaciones, justifique sus
respuestas:
a)La media muestral nunca puede ser negativa.
b)La desviación estandar de un conjunto de datos
puede ser cero.
c)La proporción muestral siempre es menor que la
proporción poblacional.
d)La proporción poblacional puede ser mayor que
uno.
e)Siempre que se quita un dato de un conjunto de
n datos entonces la media muestral cambia
necesariamente.
7) En un salón de clases A se tienen 25 alumnos y
una nota promedio de 12,5 puntos; otro salón B
tiene el doble de alumnos con respecto al del
salón A; la nota promedio es de 13 puntos, Hallar
la nota promedio de juntando ambos grupos.
8) Anteriormente se dieron cuatro propiedades
de la varianza muestral
2
S ; reformularlas para el
caso de desviación estándar muestral.
79
9) Un estudiante obtiene las notas en exámenes
parciales de 7; 5 y 3.
En el examen final consigue un 6; supongamos
que esta nota final tiene doble valor que los
parciales. ¿Cuál es su nota promedio?
10) Si el ingreso anual promedio de los
trabajadores del campo es de 12000 soles y el
ingreso anual promedio de los trabajadores de la
ciudad es de 15000 soles ¿El ingreso promedio
para ambos grupos será de 13500 soles?
Justifique.
11) Decir si es V o F la siguiente afirmación “Si
la d.e. de un conjunto de datos es cero, entonces
todos los datos son iguales”
12) La media aritmética de seis números es 10.
Se sabe que cinco de ellos son 8 12 13 5 9.
Hallar el elemento que falta.
13) Se dice que un conjuntos de datos están
tipificados, si a cada uno ellos se le resta la media
aritmética y se lo divide entre la desviación
estándar; es decir si la data original es:
Si se tiene la data original n
X
X
X ;...;
; 2
1
a cada uno
de ellos se les hace la transformación
n
i
S
X
X
Z i
i ;...;
2
;
1
;
)
(



Con la siguiente data: 4 3 4 1. Se pide tipificar
los cuatro datos y luego con los cuatro datos
80
transformados calcular su media aritmética y su
varianza.
14) En estas notas de clase se ha definido la
varianza muestral
1
)
(
2
2





n
X
X
S
k
i
i
; (dividida entre n-
1) también se conoce varianza muestral
insesgada o cuasivarianza.
En algunos libros presentan una varianza
ligeramente diferente y se conoce como varianza
muestral sesgada (dividida entre n); y se define
así:
n
X
X
S
k
i
i




2
2
*
)
(
La diferencia entre ambas es el denominador; si
n>30 (muestras grandes); la diferencia entre
ambas es mínima.
Encontrar una relación matemática entre ambas
varianzas
2
S y
2
*
S .
15) Se presenta siguiente cuadro en la que se
considera el número de hijos por familia
provenientes de una encuesta hecha a 50 familas
i
X i
f
0 2
1 12
2 21
3 8
4 5
5 2
n=50
81
a)Hacer una representación gráfica de dos
formas distintas: Gráfico de barras; Gráfico de
sectores circulares.
b)Hallar la media muestral; la desviación
estándar muestral y la varianza muestral
c)Obtener el C.V. e interpretar.
16) En una distribución simétrica con 7
intervalos de clase tal que
100
;
95
,
0
;
20
,
0
;
05
,
0 5
3
1 


 n
H
h
h .
a) Reconstruya el cuadro de distribución de
frecuencias; con la información adicional de que
la marca de clase del primer intervalo de clase es
5 y la marca de clase del tercer intervalo de clase
es 15.
b) Calcular .
.
;
;
; 2
V
C
S
S
X
17) Los ingresos semanales de 40 personas se
muestran en el siguiente cuadro:
*
*
1 i
i x
x 
 i
f i
F
*
1
200 x
 2 x
300
*
1 
x x x
12 22
x 29
x 34
4 x
x x
a)Complete el cuadro de distribución de
frecuencias.
b)Calcular la media muestral; la desviación
estándar muestral y el C.V.
82
c)Estimar el número de personas con ingresos
semanales entre 253 y 359 soles.
18) (RM 159) El ingreso percápite mensual de
un departamento es de $310 (x1000). El sector
obrero que constituye el 59% de esa población
percibe 1/5 del ingreso total. Hallar el ingreso
medio por habitante de ese departamento.
Observación.- El ingreso per cápita se define
como
Renta o ingreso per cápita
La renta per cápita, PIB/PBI per cápita o ingreso
per cápita es un indicador macroeconómico de
productividad y desarrollo económico, usado para
entregar una visión respecto al rendimiento de las
condiciones económicas y sociales de un país, esto en
consideración del crecimiento real y la fuerza
laboral
El PIB per cápita, ingreso per cápita o renta per
cápita es un indicador económico que mide la
relación existente entre el nivel de renta de un país y
su población. Para ello, se divide el Producto Interior
Bruto (PIB) de dicho territorio entre el número de
habitantes.
El empleo de la renta per cápita como indicador de
riqueza o estabilidad económica de un territorio tiene
sentido. Esto, porque a través de su cálculo se
interrelacionan la renta nacional (mediante el
83
PIB en un periodo concreto) y los habitantes de ese
lugar.
El objetivo del PIB per cápita es obtener un dato que
muestre el nivel de riqueza o bienestar de un
territorio en un momento determinado. Con
frecuencia se emplea como medida de comparación
entre diferentes países, para mostrar las diferencias
en cuanto a condiciones económicas.
Significado de PIB per capita
Qué es PIB per capita:
El PIB per cápita es un indicador económico que
mide la relación entre el nivel de ingresos de un país y
cada uno de sus pobladores. También suele ser
conocido con el nombre de ingresos per cápita o renta
per cápita.
La expresión está formada por las siglas PIB que
significan 'producto interno bruto', y las palabras
latinas per cápita , que quieren decir 'por cabeza'. Así,
se resume como el producto interno bruto por cabeza
de un país.
Para medir el PIB per cápita se utiliza una fórmula
que consta de los siguiente elementos: PIB per cápita
= PIB / nro de habitantes
Por ejemplo, en una nación que percibe en un año un
producto interno bruto de 300 mil millones de
dólares y que tiene 30 millones de habitantes, el PIB
per cápita será de 10 mil dólares por habitante.
Función del PIB per cápita
84
EL PIB per cápita se mide anualmente. Se supone
que su incremento delata el crecimiento de una
economía durante un determinado período.
En teoría, este dato describe el promedio de ingresos
en función del número de habitantes, lo que
permitiría diagnosticar el nivel económico de la
sociedad.
Sin embargo, al ser apenas un promedio, este
indicador no permite comprender con claridad cómo
esta riqueza es repartida entre los diferentes
individuos de un país, de manera que las
desigualdades económicas no se visibilizan.
Por ejemplo, en un país con un PIB per cápita de 10
mil dólares, ocurre a menudo que unos ganan
muchísimo menos y otros ganan muchísimo más. Así,
el PIB per cápita no es un indicador fiable para
medir la distribución de la riqueza sino apenas la
totalidad de los ingresos y su potencial de inversión.
En efecto, el PIB per cápita no ofrece información
contundente sobre los datos relacionados con
educación y salud, fundamentales en la evaluación de
la distribución de la riqueza.
Qué es el Producto Bruto Interno (PBI)?
¿Qué es el PBI? El Producto Bruto Interno (PBI)
es el valor de los bienes y servicios finales producidos
durante un período de tiempo en un territorio. Sólo se
refiere a bienes y servicios finales porque sus precios
incorporan el valor de los bienes intermedios. Por
85
tanto, incluir los bienes intermedios conllevaría a una
doble contabilización.
Existen 3 métodos para calcular el PBI: método de
gasto, el método de la producción y el método del
ingreso. Las dos primeras son las formas más usuales.
En el primer método, se contabiliza la compra
agregada de los bienes y servicios de la economía, es
decir, se suma el gasto de: los consumidores de bienes
y servicios locales (consumo privado), el gobierno
(consumo e inversión pública), las empresas
(inversión privada), los extranjeros que compran
nuestros productos (exportaciones), y, finalmente, se
excluye del cálculo el gasto en bienes no producidos
en el país (importaciones).
Por su parte, en el método de la producción, se suma
el valor de mercado del producto en cada etapa de la
producción de cada sector productivo y restándole el
valor de los insumos utilizados. Los sectores de
producción se clasifican en: manufactura, minería,
agricultura, pesca, comercio, etc.
Por último, el método del ingreso consiste en
cuantificar los ingresos recibidos por todos los
agentes de la economía en razón de su participación
en la producción. Se considera como ingresos a: las
remuneraciones, el consumo de capital fijo, los
impuestos a la producción e importación y el
excedente de explotación.
Estadísticas relacionadas
Población 32,51 millones (2019)
86
PBI per cápita 6.977,70 USD (2019)
Tasa de crecimiento del
PIB
2,2% cambio anual
(2019)
Solución.-
Sea
87
:
X ingreso total de la región.
:
N tamaño de la población de esa región.
:
X ingreso medio por habitante de esa región.
Ingreso per cápita o ingreso medio por
habitante 310



N
X
N
región
la
de
total
ingreso
$
Luego N
X 310
 .
Para el sector obrero; el ingreso medio por
habitante<:
$
0847
,
105
59
,
0
62
59
,
0
)
310
(
5
1
59
,
0
5
1




N
N
N
X
Xobreros
19) La empresa A tiene 100 empleados; con un
sueldo mensual de 2500 soles. La empresa B
tiene 200 empleados con un sueldo mensual de
2400 soles.
a)Hallar el sueldo promedio mensual de los
empleados al juntar las dos empresas.
b)Si a las dos empresas se agrega una tercera con
50 empleados con un ingreso promedio
mensual de 3000 soles. Hallar el sueldo
promedio mensual de los empleados de las tres
empresas.
20) En un examen común que rindieron cuatro
secciones D
C
B
A ;
;
; con un total de 100 alumnos;
habiendo un promedio mensual de 72 puntos.
Los puntajes promedios de los grupos C
B
A ;
; son
de 75; 62; y 80 puntos respectivamente. La
información sobre el grupo D se perdieron; pero
88
se sabe que los grupos A y B eran el 40% y el
25% del total respectivamente; y que en
grupo C habían 15 alumnos más que en grupo
D. Hallar la nota promedio del grupo D.
Solución.-
15
;
25
;
40
72
;
80
;
62
;
75








C
D
B
A
B
B
A
n
n
n
n
X
X
X
X
Luego:
15
;
25
;
100
15
25
40 





 D
C
c
c n
n
n
n
100
)
(
10
)
80
(
25
)
62
(
25
)
75
(
40
72 D
X
X





Despejando
.
65 puntos
X D 
21) (RM169) El ingreso medio mensual de 16500
obreros es de 1160 soles y de los 12900
empleados de esta compañía es de 1480 soles.
Si los obreros reciben un aumento del 20%
sobre sus ingresos más una bonificación de 500
soles por condiciones de trabajo.
Los empleados reciben un aumento del 30%
más 600 soles por condiciones de trabajo.
Hallar el nuevo ingreso promedio de todos los
trabajadores de esa gran compañía.
22) (RM173) Se compraron 40 kilos de carne a 20
soles por kilo; 20 kilos de carne a 25 soles por
kilo y 20 kilos de carne al 30 soles por kilo de
carne. Hallar el peso promedio por kilo de carne.
Solución.-
El siguiente cuadro muestra la información del
problema:
i
X i
n
20 40
89
25 20
30 20
80
Donde:
i
X : precio por kl. de carne. i
n :cantidad de kl. de
carne.
75
,
23
80
1900
80
)
20
(
30
)
20
(
25
)
40
(
20





X soles.
----------0----------
23) Los siguientes datos corresponden al sueldo (en
miles de pesos) de 40 trabajadores de una
empresa:
119 135 138 144 146 150 156 164
125 135 140 144 147 150 157 165
126 135 140 145 147 152 158 168
128 136 142 145 148 153 161 173
132 138 142 146 149 154 163 176
a) Construya la tabla de frecuencia con todos
sus elementos.
b) ¿En qué clase se encuentra el mayor
número de trabajadores?
90
c)¿Qué porcentaje de trabajadores gana entre
$139.000 y $168.000?
d)¿Cuántos trabajadores ganan a lo menos
$159.000?
e)¿Cuántos trabajadores ganan a lo más
$148.000?
24) En una industria es necesario realizar un estudio
respecto al peso de engranajes de gran tamaño.
Los siguientes datos corresponden al peso, en
kilógramos, de 30 de estas piezas, que poseen las
mismas dimensiones, pero distinta aleación.
58 52 50 42 40 50 38 52 50 45
36 45 55 42 42 52 50 45 42 38
42 38 40 46 45 45 55 42 45 40
a)Construir una tabla de frecuencias de
amplitud 5 comenzando desde 36.
b)¿Cuántos engranajes pesan entre 46 y 55
Kg.?
c)¿Qué porcentaje representa a aquellos
engranajes cuyo peso es inferior a 51 Kg.?
d)¿Cuál es la frecuencia relativa para aquel
intervalo cuya marca de clase es 48?
91
e)¿Qué porcentaje representa a aquellas
piezas que pesan más de 50 Kg.?
25) En una industria automotriz es necesario
realizar un estudio debido a una partida
defectuosa de discos de embrague. Para ello se ha
recopilado la siguiente información referente a la
duración en horas de 50 de ellos.
285 30
0
28
6
30
2
313 314 28
9
29
2
321 327
29
3
278 28
2
289 30
8
32
6
30
3
287 29
3
32
2
30
4
32
9
285 307 297 30
2
29
4
201 28
5
313
30
8
307 30
4
291 28
8
297 316 32
2
317 30
8
321 324 32
3
316 29
2
28
6
29
9
29
4
32
8
29
6
a) Construir una tabla de frecuencia de
amplitud cinco comenzado desde 285.
b) ¿Cuántos discos duraron entre 290 y
299 horas?
c) ¿Cuántos discos no alcanzaron a durar
300 horas?
92
d) ¿Qué porcentaje representan los discos
que duraron entre 310 y 314 horas?
e) ¿Qué porcentaje representa los discos
que duraron menos de 305 horas?
f)¿Cuántos discos duraron más de 309 horas?
g) ¿Cuántos discos duraron menos de 305
horas?
h) ¿Qué porcentaje representan los discos que
duraron entre 285 y 294 horas?
i)¿Cuál es el intervalo de mayor frecuencia
absoluta?
26) En un conjunto habitacional se pretende hacer
un estudio del número de personas que
consumen productos enlatados. Los datos que
han sido obtenidos de 50 bloques del conjunto
habitacional son:
63 69 83 85 93 73 81 94 10
4
12
5
64 13
2
115 12
0
12
7
13
0
10
5
114 12
3
12
1
12
8
90 75 13
7
13
1
73 62 10
0
10
9
117
93
12
4
10
3
13
3
13
8
13
3
11
0
60 91 87 13
6
13
7
13
4
12
9
96 99 72 10
4
97 84 98
a)Construir una tabla de frecuencia de
amplitud 10 partiendo desde 60.
b)¿Cuántas personan consumen entre 100 y
129 productos enlatados?
c)¿Qué porcentaje representa a las personas
que consumen menos de 90 productos
enlatados?
d)¿Qué cantidad de personas consumen más
de 80 productos enlatados?
27) Las ganancias por acción de 40 compañías de la
industria de la construcción son:
4,6 0,3 1,1 5,7 0,1 1,3 2,5 1,6
1,3 2,1 2,1 1,4 7,3 5,4 3,5 1,9
6,0 0,8 1,9 2,1 3,2 0,2 7,1 2,8
9,6 3,7 5,1 3,6 4,9 2,3 1,8 0,4
4,2 2,1 0,9 3,2 3,7 1,1 0,5 1,9
94
a)Construya una distribución de frecuencias
que comience en 0,1 y tenga una amplitud de
2,0.
b)¿Cuál es la frecuencia absoluta del tercer
intervalo?
c)¿Qué porcentaje de las compañías tienen a lo
más una ganancia de 6,0?
d) ¿Cuántas compañías tienen una ganancia
de a lo menos de 4,1?
e)Interprete la frecuencia acumulada del
segundo intervalo.
f) Interprete la frecuencia relativa acumulada
del cuarto intervalo.
28) Dada la información referente a la ubicación de
personas dentro de cuatro departamentos de una
empresa, se pide:
a)Tabular la información.
b)Realizar gráfico circular.
c)Indique frecuencias relativas porcentuales en
cada grupo.
M A P CC A CC M P P M
95
P CC M A M CC P P M P
A P A M M A M A P M
M A CC A A M P M M P
donde: A = abastecimiento; CC = control de
calidad; M = mantención; P = producción.
29) Se realizó un número determinado de compras
de materia prima. El volumen de la materia
prima viene dado en m3
. Parte de la información
se registra en la siguiente tabla:
Volumen
i
x i
f i
h i
F i
H Límites reales
6 – 10 1
11 – 15
16 – 20 6 9
21 – 25 18
26 – 30 27
Total 27
a)Complete la tabla dada.
b)En un solo gráfico, dibuje un histograma y un
polígono de frecuencia.
c) ¿Cuántas compras se realizaron entre 11 y 30
m3
?
96
d)¿Cuántas compras se realizaron entre 16 y 25
m3
?
e)¿Qué porcentaje de compras se realizaron entre
16 y 20 m3
?
f) ¿Cuántas compras se realizaron en total?
30) Los siguientes datos corresponden a la duración,
en horas, de 50 válvulas que fueron sometidas a
un cierto control:
Tiempo
i
x i
f i
h i
F i
H Límites reales
450 – 499 5
500 – 549 4
550 – 599 12
600 – 649 10
650 – 699 15
700 – 749 3
750 - 799 1
Total 50
a)Complete la tabla dada.
b)Grafique la ojiva.
c) ¿Qué porcentaje de las válvulas duraron, en
promedio 674,5 horas?
97
d)¿Qué porcentaje de las válvulas duraron entre
650 y 749 horas?
e)¿Cuántas válvulas duraron menos de 550
horas?
f) ¿Qué porcentaje de las válvulas duraron más de
649 horas?
31) Se realizaron dos experimentos referentes al
peso, en Kg., aplicado sobre una cierta cantidad
de tableros.
Peso
(Kg.)
A B
15 – 19 7 3
20 – 24 3 6
25 – 29 2 8
30 – 34 11 8
35 – 39 10 12
40 – 44 7 3
Total 40 40
a)Grafique el histograma del experimenta A.
b)Grafique la ojiva porcentual del experimento B.
98
c)Realice, en un mismo gráfico, los polígonos de
frecuencia.
d)Realice, en un mismo gráfico, las ojivas.
32) Dado el siguiente Polígono de Frecuencias:
a)¿Cuáles son los límites reales del cuarto
intervalo?
b)Interprete la frecuencia del cuarto intervalo.
c)Interprete el porcentaje de datos que hay en el
quinto intervalo.
d)¿Qué porcentaje de pesos es igual o menor que
60,5 Kg.?
OJO: FALTA GRÁFICO
PÁGINA 27
99
e)¿Cuántos pesos son iguales o mayores que 50,5
Kg.?

Más contenido relacionado

La actualidad más candente

Anualidades1
Anualidades1Anualidades1
Anualidades1
Luisita Reyes
 
Diapositiva de interes compuesto
Diapositiva de interes compuestoDiapositiva de interes compuesto
Diapositiva de interes compuestoEfernandez1
 
Cálculo del tamaño de la muestra
Cálculo del tamaño de la muestraCálculo del tamaño de la muestra
Cálculo del tamaño de la muestraMiriam Rocio
 
Sistemas de costos. directo y absorbente
Sistemas de costos.  directo y absorbenteSistemas de costos.  directo y absorbente
Sistemas de costos. directo y absorbente
Sergio Paez Hernandez
 
Organización y presentación de datos
Organización y presentación de datosOrganización y presentación de datos
Organización y presentación de datos
roxanaparedes27
 
IMPORTANCIA DINERO VALOR EN EL TIEMPO
IMPORTANCIA DINERO VALOR EN EL TIEMPOIMPORTANCIA DINERO VALOR EN EL TIEMPO
IMPORTANCIA DINERO VALOR EN EL TIEMPO
NathalyCuenca3
 
Analísis y proyecciones del FLujo de Caja
Analísis y proyecciones del FLujo de CajaAnalísis y proyecciones del FLujo de Caja
Analísis y proyecciones del FLujo de Caja
Jared Palma
 
Metodo analitico
Metodo analiticoMetodo analitico
Metodo analitico
Tiestoconta Cobach
 
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdfEjercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
Norayma García
 
Matema financiera 2
Matema financiera 2Matema financiera 2
Matema financiera 2
Juan Guillen
 
COSTEO DIRECTO Y COSTEO POR ABSORCIÓN
COSTEO DIRECTO Y COSTEO POR ABSORCIÓNCOSTEO DIRECTO Y COSTEO POR ABSORCIÓN
COSTEO DIRECTO Y COSTEO POR ABSORCIÓN
Haydee Rodriguez
 
Métodos de inventario
Métodos de inventario  Métodos de inventario
Métodos de inventario
Mara Téllez
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
José Tomás Diarte Añazco
 
COSTOS EJERCICIOS
COSTOS EJERCICIOSCOSTOS EJERCICIOS
COSTOS EJERCICIOS
A Mar Es
 
EJERCICIOS DE MATEMATICA FINANCIERA
EJERCICIOS DE MATEMATICA FINANCIERAEJERCICIOS DE MATEMATICA FINANCIERA
EJERCICIOS DE MATEMATICA FINANCIERA
abajanaf2
 
Escala de mediciones
Escala de medicionesEscala de mediciones
Escala de mediciones
LuisMaraima1
 
El Punto de Equilibrio
El Punto de EquilibrioEl Punto de Equilibrio
El Punto de Equilibrio
cpoemape
 
Ordenamiento de datos
Ordenamiento de datosOrdenamiento de datos
Ordenamiento de datos
IsabelRodriguez256
 

La actualidad más candente (20)

Depreciacion
DepreciacionDepreciacion
Depreciacion
 
Anualidades1
Anualidades1Anualidades1
Anualidades1
 
Diapositiva de interes compuesto
Diapositiva de interes compuestoDiapositiva de interes compuesto
Diapositiva de interes compuesto
 
Cálculo del tamaño de la muestra
Cálculo del tamaño de la muestraCálculo del tamaño de la muestra
Cálculo del tamaño de la muestra
 
Sistemas de costos. directo y absorbente
Sistemas de costos.  directo y absorbenteSistemas de costos.  directo y absorbente
Sistemas de costos. directo y absorbente
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Organización y presentación de datos
Organización y presentación de datosOrganización y presentación de datos
Organización y presentación de datos
 
IMPORTANCIA DINERO VALOR EN EL TIEMPO
IMPORTANCIA DINERO VALOR EN EL TIEMPOIMPORTANCIA DINERO VALOR EN EL TIEMPO
IMPORTANCIA DINERO VALOR EN EL TIEMPO
 
Analísis y proyecciones del FLujo de Caja
Analísis y proyecciones del FLujo de CajaAnalísis y proyecciones del FLujo de Caja
Analísis y proyecciones del FLujo de Caja
 
Metodo analitico
Metodo analiticoMetodo analitico
Metodo analitico
 
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdfEjercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
Ejercicios resueltos del Punto de Equilibrio - Ejemplos con Gráficos.pdf
 
Matema financiera 2
Matema financiera 2Matema financiera 2
Matema financiera 2
 
COSTEO DIRECTO Y COSTEO POR ABSORCIÓN
COSTEO DIRECTO Y COSTEO POR ABSORCIÓNCOSTEO DIRECTO Y COSTEO POR ABSORCIÓN
COSTEO DIRECTO Y COSTEO POR ABSORCIÓN
 
Métodos de inventario
Métodos de inventario  Métodos de inventario
Métodos de inventario
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
COSTOS EJERCICIOS
COSTOS EJERCICIOSCOSTOS EJERCICIOS
COSTOS EJERCICIOS
 
EJERCICIOS DE MATEMATICA FINANCIERA
EJERCICIOS DE MATEMATICA FINANCIERAEJERCICIOS DE MATEMATICA FINANCIERA
EJERCICIOS DE MATEMATICA FINANCIERA
 
Escala de mediciones
Escala de medicionesEscala de mediciones
Escala de mediciones
 
El Punto de Equilibrio
El Punto de EquilibrioEl Punto de Equilibrio
El Punto de Equilibrio
 
Ordenamiento de datos
Ordenamiento de datosOrdenamiento de datos
Ordenamiento de datos
 

Similar a CAPITULO 1.pdf

Exposición # 3
Exposición # 3Exposición # 3
Exposición # 3
albertoinv
 
Lecture 2.pptx
Lecture 2.pptxLecture 2.pptx
Lecture 2.pptx
CapScyteVictorMarisc
 
Seminario
SeminarioSeminario
Muestreo 2
Muestreo 2Muestreo 2
Muestreo 2
Jorge Castro
 
Estadística un breve repaso
Estadística un breve repasoEstadística un breve repaso
Estadística un breve repaso
Valdiir solano bocanegra
 
Metodologia de la investigacion
Metodologia de la investigacionMetodologia de la investigacion
Metodologia de la investigacion
armando1957
 
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
EstadisticosProcesos
 
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
Edison Coimbra G.
 
Selección de la muestra
Selección de la muestraSelección de la muestra
Selección de la muestra
Edison Coimbra G.
 
poblacion y muestra.pdf
poblacion y muestra.pdfpoblacion y muestra.pdf
poblacion y muestra.pdf
Paul Freire
 
Muestra o analisis muestral
Muestra o analisis muestralMuestra o analisis muestral
Muestra o analisis muestral
FernandoJuniorAyalaM
 
Muestra o analisis muestrall
Muestra o analisis muestrallMuestra o analisis muestrall
Muestra o analisis muestrall
NicolEstefaniValdezJ
 
MARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptxMARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptx
ssuser74cd56
 
Selección de muestra
Selección de muestraSelección de muestra
Selección de muestra
Arturo Capistran Rendon
 
Muestra o Análisis Muestral
Muestra o Análisis MuestralMuestra o Análisis Muestral
Muestra o Análisis Muestral
Alejandro Javier Rivas Gonzales
 
Muestra
Muestra Muestra
MUESTRA O ANALISIS MUESTRAL
MUESTRA O ANALISIS MUESTRALMUESTRA O ANALISIS MUESTRAL
MUESTRA O ANALISIS MUESTRAL
anasoniaapaza
 

Similar a CAPITULO 1.pdf (20)

Exposición # 3
Exposición # 3Exposición # 3
Exposición # 3
 
Estadistica ii
Estadistica iiEstadistica ii
Estadistica ii
 
Lecture 2.pptx
Lecture 2.pptxLecture 2.pptx
Lecture 2.pptx
 
Seminario
SeminarioSeminario
Seminario
 
Muestreo 2
Muestreo 2Muestreo 2
Muestreo 2
 
Estadística un breve repaso
Estadística un breve repasoEstadística un breve repaso
Estadística un breve repaso
 
Metodologia de la investigacion
Metodologia de la investigacionMetodologia de la investigacion
Metodologia de la investigacion
 
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
 
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.
 
Selección de la muestra
Selección de la muestraSelección de la muestra
Selección de la muestra
 
poblacion y muestra.pdf
poblacion y muestra.pdfpoblacion y muestra.pdf
poblacion y muestra.pdf
 
Muestra o analisis muestral
Muestra o analisis muestralMuestra o analisis muestral
Muestra o analisis muestral
 
Muestra o analisis muestrall
Muestra o analisis muestrallMuestra o analisis muestrall
Muestra o analisis muestrall
 
03 cuad mat_aplic_01_2011
03 cuad mat_aplic_01_201103 cuad mat_aplic_01_2011
03 cuad mat_aplic_01_2011
 
MARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptxMARCO METODOLOGICO.pptx
MARCO METODOLOGICO.pptx
 
Selección de muestra
Selección de muestraSelección de muestra
Selección de muestra
 
Muestreo
MuestreoMuestreo
Muestreo
 
Muestra o Análisis Muestral
Muestra o Análisis MuestralMuestra o Análisis Muestral
Muestra o Análisis Muestral
 
Muestra
Muestra Muestra
Muestra
 
MUESTRA O ANALISIS MUESTRAL
MUESTRA O ANALISIS MUESTRALMUESTRA O ANALISIS MUESTRAL
MUESTRA O ANALISIS MUESTRAL
 

Más de RosmeryCristinaValer

Modulación lineal.pdf
Modulación lineal.pdfModulación lineal.pdf
Modulación lineal.pdf
RosmeryCristinaValer
 
CAPITULO 0 - INTRODUCCION.pdf
CAPITULO 0 - INTRODUCCION.pdfCAPITULO 0 - INTRODUCCION.pdf
CAPITULO 0 - INTRODUCCION.pdf
RosmeryCristinaValer
 

Más de RosmeryCristinaValer (12)

Modulación lineal.pdf
Modulación lineal.pdfModulación lineal.pdf
Modulación lineal.pdf
 
CAPITULO 4.pdf
CAPITULO 4.pdfCAPITULO 4.pdf
CAPITULO 4.pdf
 
CAPITULO 5.pdf
CAPITULO 5.pdfCAPITULO 5.pdf
CAPITULO 5.pdf
 
CAPITULO 9.pdf
CAPITULO 9.pdfCAPITULO 9.pdf
CAPITULO 9.pdf
 
SEMANA 15 INGENERÍA.pdf
SEMANA 15 INGENERÍA.pdfSEMANA 15 INGENERÍA.pdf
SEMANA 15 INGENERÍA.pdf
 
CAPITULO 8.pdf
CAPITULO 8.pdfCAPITULO 8.pdf
CAPITULO 8.pdf
 
CAPITULO 6.pdf
CAPITULO 6.pdfCAPITULO 6.pdf
CAPITULO 6.pdf
 
CAPÍTULO 3.pdf
CAPÍTULO 3.pdfCAPÍTULO 3.pdf
CAPÍTULO 3.pdf
 
CAPITULO 1.pdf
CAPITULO 1.pdfCAPITULO 1.pdf
CAPITULO 1.pdf
 
CAPITULO 0 - INTRODUCCION.pdf
CAPITULO 0 - INTRODUCCION.pdfCAPITULO 0 - INTRODUCCION.pdf
CAPITULO 0 - INTRODUCCION.pdf
 
CAPITULO 7.pdf
CAPITULO 7.pdfCAPITULO 7.pdf
CAPITULO 7.pdf
 
CAPÍTULO 2.pdf
CAPÍTULO 2.pdfCAPÍTULO 2.pdf
CAPÍTULO 2.pdf
 

Último

PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdfPLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
MariaCortezRuiz
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
michiotes33
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
Pol Peña Quispe
 
Medicina Peruana en el siglo XX y XXI- Julio Gabriel Pereda Sanchez.pptx
Medicina Peruana en el siglo XX y XXI- Julio Gabriel  Pereda Sanchez.pptxMedicina Peruana en el siglo XX y XXI- Julio Gabriel  Pereda Sanchez.pptx
Medicina Peruana en el siglo XX y XXI- Julio Gabriel Pereda Sanchez.pptx
gabrielperedasanchez
 
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdfPLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
Daniel Jose Sierra Garcia
 
Sesiones 3 y 4 Estructuras Ingenieria.pdf
Sesiones 3 y 4 Estructuras Ingenieria.pdfSesiones 3 y 4 Estructuras Ingenieria.pdf
Sesiones 3 y 4 Estructuras Ingenieria.pdf
DeyvisPalomino2
 
A3QUIROZ,MANUEL- Operaciones Basicas- Construccion
A3QUIROZ,MANUEL- Operaciones Basicas- ConstruccionA3QUIROZ,MANUEL- Operaciones Basicas- Construccion
A3QUIROZ,MANUEL- Operaciones Basicas- Construccion
manuelalejandro238
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
AldithoPomatay2
 
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).docEjercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
LuisEnriqueCarboneDe
 
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
leonpool521
 
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
JuanChaparro49
 
Bash Script Programacion en la consola.pptx
Bash Script Programacion en la consola.pptxBash Script Programacion en la consola.pptx
Bash Script Programacion en la consola.pptx
SantosCatalinoOrozco
 
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDADPRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
mirellamilagrosvf
 
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaaEspecificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
ssuserebb7f71
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
MiriamAquino27
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
FRANCISCOJUSTOSIERRA
 
Hidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggfHidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggf
JavierAlejosM
 
164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas
jcbarriopedro69
 
Joseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadJoseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidad
KevinCabrera96
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
LuisPerezIgnacio1
 

Último (20)

PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdfPLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
 
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOLNORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
NORMATIVA AMERICANA ASME B30.5-2021 ESPAÑOL
 
Medicina Peruana en el siglo XX y XXI- Julio Gabriel Pereda Sanchez.pptx
Medicina Peruana en el siglo XX y XXI- Julio Gabriel  Pereda Sanchez.pptxMedicina Peruana en el siglo XX y XXI- Julio Gabriel  Pereda Sanchez.pptx
Medicina Peruana en el siglo XX y XXI- Julio Gabriel Pereda Sanchez.pptx
 
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdfPLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
 
Sesiones 3 y 4 Estructuras Ingenieria.pdf
Sesiones 3 y 4 Estructuras Ingenieria.pdfSesiones 3 y 4 Estructuras Ingenieria.pdf
Sesiones 3 y 4 Estructuras Ingenieria.pdf
 
A3QUIROZ,MANUEL- Operaciones Basicas- Construccion
A3QUIROZ,MANUEL- Operaciones Basicas- ConstruccionA3QUIROZ,MANUEL- Operaciones Basicas- Construccion
A3QUIROZ,MANUEL- Operaciones Basicas- Construccion
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
 
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).docEjercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
 
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
 
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
 
Bash Script Programacion en la consola.pptx
Bash Script Programacion en la consola.pptxBash Script Programacion en la consola.pptx
Bash Script Programacion en la consola.pptx
 
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDADPRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
 
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaaEspecificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
 
Hidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggfHidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggf
 
164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas
 
Joseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidadJoseph juran aportaciones al control de la calidad
Joseph juran aportaciones al control de la calidad
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
 

CAPITULO 1.pdf

  • 1. 1 CAPÍTULO 1 Conceptos básicos de Estadística Descriptiva Prof. Mg. Wilfredo Domínguez C. Prob. y estadística (Ing electrónica) 1) CONCEPTO DE ESTADISTICA La estadística es una ciencia especializada en el tratamiento de los datos y utiliza métodos matemáticos para la recopilación, organización, presentación, el análisis y toma de decisiones inferenciales, dichos datos por lo general son tomados utilizando procedimientos específicos denominados técnicas de muestreo los que conducen a tomar una parte pequeña (muestra) de un conjunto más grande llamado (población). Las definiciones de estadística son muy numerosas, muchas de ellas depende del uso que se le dé, por ejemplo la estadística puede servir para describir los acontecimientos más importantes de un evento deportivo. La estadística también se puede usar para organizar mejor la información de un colectivo grande, como por ejemplo la organización de las historias clínicas de un gran hospital, sin lugar a dudas la estadística sirve para eso y muchas otras cosas más, pero la estadística va mucho más allá pues desde el punto de vista científico es una ciencia que nos permite tomar decisiones en cuestiones que requieren un sustento mucho más riguroso, por ejemplo puede ayudar a
  • 2. 2 decidir cuál de dos métodos de enseñanza aplicados a dos grupos de niños es el más adecuado o puede decidir que tratamiento es mejor para combatir determinada enfermedad. Los cursos de estadística se dictan todas las especialidades; forma parte de todos los planes de estudio de todas las carreras profesionales. 2) PALABRAS CLAVES EN ESTADISTICA Definición 1. (Población) Es un conjunto de seres u objetos sobre los cuáles necesitamos hacer algún tipo de estudio, este conjunto grande se representa por . P Observe que el término población en estadística es mucho más general del que usualmente conocemos, pues no necesariamente la población debe estar compuesta por personas, sino que también pueden ser animales de una región de la costa peruana, plantas de un gran parque, tornillos producidos por una empresa. Si el tamaño de la población es finita usualmente esta se representa por N , el cual es un número entero positivo y el tamaño de la muestra se representa universalmente por n, de forma tal que se cumple la desigualdad N n  . Una población es un conjunto y luego está formado por elementos, dichos elementos se denominan unidades estadísticas, podríamos representar a la población P como un conjunto es decir: ww
  • 3. 3   N i u u u u P ,..., 2 1 ,..., ,  Ejemplo 1. Sea la población compuesta por todos los peruanos a la fecha, esta población tiene un aproximado de 33 millones de personas. Ejemplo 2. Consideremos la población compuesta por todos lo guacamayos de la Amazonía peruana. Ejemplo 3. Sea la población compuesta por todos los tornillos producidos por una gran fábrica durante un mes específico. Ejemplo 4. Consideremos la población compuesta por todos los alumnos de nuestra universidad. Definición 2. (Muestra) Es una parte representativa de la población, usualmente su tamaño por n y esta siempre es finita, en esta parte representativa de la población recaerá nuestro estudio, la muestra debe ser representativa de la población, es decir deberá tener todas las características de la población, La forma de obtener una muestra representativa de la población corresponde a una parte de la estadística denomina da Técnicas de Muestreo. ww
  • 4. 4 Ejemplo 5.  En un gran club deportivo hay numerosos socios; hay una discusión sobre si seguir como auspiciador en las camisetas de los jugadores lleven la marca “PUMA”, o la marca “NIKE”; para esto se toma al azar del listado de socios 100 de ellos; de estos 100 socios; 70 de ellos están a favor de la marca “PUMA”; el resto la otra marca. ww
  • 5. 5 En este caso la población está compuesta por la totalidad de socios, en este caso su tamaño N es desconocido; la muestra está compuesta por los 100  n socios encuestados.  Un filántropo ayuda a 1000 niños en su formación escolar; a fin de año se quiere organizar una fiesta; como el local donde se va a realizar este evento tiene una capacidad limitada para 300 participantes; se toma la decisión de invitar a los 300 primeros niños con mayor rendimiento. En esta situación la población está compuesta por los 1000  N niños y la muestra está compuesta por los 300  n niños seleccionados.  Una encuestadora de estudio de mercados quiere saber que marca de cerveza es la más preferida en el cercado de Lima, entre dos nuevas marcas A y B; para esto invita al azar 1000 latas de cerveza; 500 de la marca A y 500 de marca B; de los 500 que probaron la marca A; 235 de ellos dijeron que si les gustaba la marca invitada. De los 500 que probaron la marca B; 190 se mostraron a favor. En este caso la población está compuesta por todos los habitantes mayores de edad de esa zona de Lima; su tamaño N es desconocido; la muestra está compuesta por las 1000  n personas escogidas. ww
  • 6. 6 Si el tamaño de muestra es estrictamente menor que el tamaño de la población estamos haciendo muestreo, ahora si N n  estamos realizando un censo, la mayoría de las veces se hace muestreo. Si siempre se podría hacer un censo obtendríamos resultados exactos y el papel de la estadística sería muy limitado; la mayoría de la veces se trabajan con muestras, por ejemplo la intención de voto hacia determinada candidatura se hacen con muestras de tamaño 1500 aproximadamente. VENTAJAS DEL MUESTREO  Bajo costo.  Información más exacta (mejor calidad) que la del censo, debido a que el menor número de encuestadores permite capacitarlos mejor y más selectivamente.  Es posible introducir métodos científicos objetivos de medición para corregir errores.  Mayor rapidez en la obtención de resultados.  Técnica más utilizada y que permite obtener información de casi cualquier tipo de población.  Gran capacidad para estandarizar datos, lo que permite su tratamiento informático y el análisis estadístico sobre todo obtener la información de los encuestados DESVENTAJAS DE LOS CENSOS  Alto costo (humano y material) dado que exige el empleo de una gran cantidad de recursos de personal, financieros y materiales. ww
  • 7. 7  Es necesaria una vasta organización que abarque todo el universo a investigar, procurando evitar omisiones y duplicaciones.  Demora en la obtención de resultados.  En algunos casos, la información que se obtiene puede ser de inferior calidad (mayores errores) a la que se obtendría si la investigación se realizara por muestreo. Obviamente se desea tener métodos científicos para obtener buenas muestras; uno de los campos de la estadística llamada TÉNICAS DE MUESTREO o simplemente MUESTREO enseña como seleccionar una buena muestra. Existen varias técnicas de muestreo; la elección de la técnica depende de la situación y en realidad el MUESTREO es motivo de un curso separado de la estadística básica. Las principales técnicas de muestreo se presentan en el siguiente diagrama: Muestreo no probabilístico: a)A juicio. El muestreo deliberado, crítico o por juicio, es una técnica de muestreo no probabilístico en la que los miembros de la muestra se eligen sólo sobre la base del conocimiento y el juicio del investigador. ww
  • 8. 8 b)Por conveniencia. El muestreo por conveniencia es una técnica de muestreo no probabilístico y no aleatorio utilizada para crear muestras de acuerdo a la facilidad de acceso. Consiste en tomar un segmento o fracción de la población por su cómoda accesibilidad. Por ejemplo, una muestra obtenida de listas fácilmente disponibles, como las guías de teléfonos, constituyen una muestra deliberada. Por la comodidad o facilidad en tomar la muestra se sacrifica cierto grado de representatividad de las características disponibles; sin embargo, este tipo de muestreo puede ser de alguna utilidad para estudios pilotos o de sondeo. ww
  • 10. 10 El muestreo aleatorio simple es una técnica de muestreo en la que todos los elementos que forman el universo - y que por lo tanto están incluídos en el marco muestral - tienen idéntica probabilidad de ser seleccionados para la muestra. ... Un individuo solo puede aparecer una única vez en una muestra. b)Estratificado. En un muestreo aleatorio estratificado se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato. Ejemplo ww
  • 11. 11 En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D. c)Sistemático. El muestreo sistemático es un tipo de muestreo probabilístico donde se hace una selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra deseado. w
  • 12. 12 d)Por conglomerados. En estadística, el muestreo por conglomerados es una técnica de muestreo utilizada cuando hay agrupamientos «naturales» relativamente homogéneos en una población estadística.1 A menudo se utiliza en la investigación de mercados. En esta técnica, la población total se divide en estos grupos (o clusters) y una muestra aleatoria simple se selecciona de los grupos. A continuación, la información requerida se obtiene de una muestra aleatoria simple de los elementos dentro de cada grupo seleccionado y una submuestra de elementos se puede seleccionar dentro de cada uno de estos grupos. Una motivación común para el muestreo por conglomerados es reducir el número total de entrevistas, y sus costes, dada la precisión deseada. Suponiendo un tamaño de muestra fijo, la técnica ofrece resultados más precisos cuando la mayoría de la variación en la población es dentro de los grupos y no entre ellos. ww
  • 13. 13 e)Muestreo por cuotas Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer lugar es necesario dividir la población de referencia en varios estratos definidos por algunas variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población que representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato. En estadística, las muestras pueden clasificarse según su tamaño en dos tipos: ww
  • 14. 14 a)Si 30  n se denominan “muestras grandes”. b)Si 30  n de denominan “muestras pequeñas”. w Definición 3. (Variable) Es la característica de interés que se observa en cada unidad estadística o unidad elemental , y como esta cambia de unidad a unidad suele llamarse variable y por lo general se representa por letras mayúsculas como X , es decir en cada P ui  se observa un valor i X . Donde a cada P ui  se le asigna un i X ; es decir N i X u i i ;.... 2 ; 1 ;   Con referencia al Ejemplo 1, muchas cosas se pueden observar en cada peruano, es decir cada peruano constituye una unidad estadística, por ejemplo se podría estar interesado en observar la edad, el peso, la condición socioeconómica, su nivel educacional y otras cosas más. Si sólo estudiamos una sola variable estamos haciendo estadística unidimensional o de una variable. La observación en cada unidad estadística puede arrojar un número (variable numérica o cuantitativa) o puede proporcionar una cualidad (variable cualitativa). Siempre que se observa una característica en cada unidad estadística esta puede resultar un número o una cualidad, la estadística puede trabajar con ambos tipos de variables desde su aspecto elemental descriptivo o hacer análisis estadístico avanzado. ww
  • 15. 15 3) CLASIFICACIÓN DE LAS VARIABLES Las variables se pueden clasificar en dos grandes grupos: cuantitativas o numéricas (grupo A) o cualitativas (grupo B), es decir: A: Variables cuantitativas- Son aquellas que resultan ser un número y provienen del conteo o de mediciones, estas a su vez se pueden clasificar en dos sub grupos: w A1: Variables cuantitativas discretas.- Son aquellas que solamente pueden tomar valores enteros positivos o cero, es decir pueden ser 0, 1, 2, 3, ……. Este tipo de variables por lo general provienen de contar y cuando se cuenta algo o es un entero positivo o es cero. Ejemplo 6. Son ejemplos de este tipo de variables las siguientes: 1) Número de hijos por familia 2) Número de televisores por familia 3) Número de computadoras defectuosas por laboratorio. 4) Número de cursos matriculados por alumno. 5) Número de dormitorios por familia. 6) Número alumnos por aula. 7) Número visitas al médico por año de pacientes de la tercera edad al seguro social. 8) Número de latidos del corazón por minuto. Ejercicio 1.- Dar ocho ejemplos adicionales de variables cuantitativas discretas ww
  • 16. 16 A2: Variables cuantitativas continuas.- Son aquellas que pueden tomar todos los valores posibles en un intervalo dado, incluso valores fraccionarios e incluso negativos. Este tipo de variables provienen de medir, y cuando se mide algo no necesariamente resulta un entero positivo o cero; e incluso puede ser negativo como lo es la temperatura medioambiente. Ejemplo 7. Presentamos algunos ejemplos de este tipo de variables: 1) Estatura de personas en metros. 2) Peso de la personas en kilos. 3) Perímetro craneal de recién nacidos. 4) Temperatura ambiental en grados centígrados. w 5) Edad de las personas. 6) Nivel de glucosa en la sangre. 7) Calificación de estudiantes en escala vigesimal. 8) Altura en metros sobre el nivel del mar las ciudades de la costa peruana. Ejercicio 2.- Dar ocho ejemplos adicionales sobre variables cuantitativas continuas. B: Variables cualitativas.- Como su nombre lo indica son variables en los cuales se observan una cualidad. Ejemplo 8. Son ejemplos de este tipo de variables: ww
  • 17. 17 1) El nivel educacional de los peruanos 2) La jerarquía institucional. 3) La clase social a la que se pertenece. 4) El color de los ojos. 5) La creencia religiosa. 6) La preferencia electoral. 7) El tipo de sangre de las personas. Las variables cualitativas se pueden clasificar en dos tipos: cualitativas ordinales y cualitativas nominales. B1: VARIABLES CUALITATIVAS ORDINALES.- Son aquellas variables cualitativas en los que se puede establecer algún tipo de ordenamiento entre ellas, por ejemplo de mayor a menor o de menor a mayor. Ejemplo 9. En las universidades existe la jerarquía institucional; primero el rector de la universidad; luego están los vicerrectores a continuación los decanos y luego los directores de escuela y así sucesivamente. Observe que existe una ordenación de mayor a menor. Ejemplo 10. Otro ejemplo clásico es el nivel educacional de las personas; este nivel puede ser ordenado en analfabetos (no saben leer ni escribir; luego las personas que tienen educación primaria (saben leer y escribir); a continuación las personas que tienen educación secundaria; posteriormente las personas con estudios universitaria y así
  • 18. 18 sucesivamente. Observe que implícitamente un ordenamiento de menor a mayor. B1: VARIABLES CUALITATIVAS NOMINALES.- Son aquellas variables en los que no se puede establecer ningún tipo de ordenamiento entre ellas; se darán algunos ejemplos de este tipo de variables cualitativas nominales. Ejemplo 11. El color de cabello de las personas; el sexo de las personas; el tipo de sangre; el lugar de nacimiento 4) PARÁMETROS POBLACIONALES Definición 4. (Parámetro) Los parámetros son cantidades fijas, que existen y que teóricamente se pueden conocer si se trabajasen con todos los elementos (unidades poblacionales) que constituyen la población. Los parámetros más usados en estadística son:  La media poblacional, la cuál se representa por la letra griega  (mu); asociada a variables cuantitativas.  La varianza poblacional, usualmente representada por 2  (sigma cuadrado); asociado a variables cuantitativas ww
  • 19. 19  La desviación estándar poblacional:  ; asociado a variables cuantitativas.  La proporción poblacional p. Asociada a variables cualitativas. (ojo cualitativas) La media poblacional  , la varianza poblacional 2  y la desviación estándar poblacional están asociadas a variables cuantitativas (numéricas). La proporción poblacional pestá asociada más bien a variables de tipo cualitativo (cualidades). Ejemplo 12. Consideremos una población hipotética compuesta por 10  N estudiantes universitarios; la variable de interés es la edad en años cumplidos; esta población es dada por la siguiente data: 18 19 21 17 20 18 19 22 21 18 Existe la media poblacional  y se puede calcular sumando las 10 edades y dividiendo en 10  N ; es decir: años X N i i 3 , 19 10 193 10 18 ... 19 18 10 10 1            Supongamos que etiquetamos las 10 edades con los números 1; 2; 3;….10; en 10 papelitos enumeramos 1; 2;…;10. Los 10 papelitos se ponen en una caja; una niña con los ojos vendados selecciona 3 boletos juntos; resultando como integrantes de la muestra a 17; 19; y 20; el tamaño de la muestra es 3  n Lo que se ha hecho es muestreo aleatorio simple; el cual es un muestreo probabilístico. Con estos tres datos se puede calcular la media muestral; es decir 6666 , 18 3 56 3 20 19 17 1      X . ww
  • 20. 20 Supongamos que la niñita devuelve a la caja los tres boletos; teniendo nuevamente 10  N números. Vuelve a sacar 3 papelitos; esta vez resulta en la muestra 19; 18; 21 la media muestral es años X 3333 , 19 3 58 3 21 18 19 2      En total se tienen 120 ! 7 ! 3 ! 10 3 10           muestras posibles. Naturalmente en un estudio sólo se trabaja con una muestra. Siempre que se trabaja con muestras inevitablemente esta sujetos a cometer error al querer estimar  (parámetro). Supongamos que trabajamos con la primera muestra que arrojó una media muestra años X 6666 , 18 1  ; la verdadera media o verdadero valor es años 3 , 19   . El Error de muestreo se define X E        ˆ ; donde ̂ se lee mu estimado ) : ( mu griega letra  ; en este caso: 6334 , 0 666 , 18 3 , 19 ˆ        X E    Ejemplo 13. Imaginemos la población de todos los peruanos a la fecha y que la variable de interés sea la edad medida en años, de hecho existe la media poblacional , o sea la edad promedio de todos los peruanos a la fecha, para esto tendríamos que sumar la edades de todos peruanos a la fecha y dividir toda esto entre aproximadamente entre 33 millones. Esta tarea en la práctica es realmente imposible, pues la base de datos actualizada conteniendo la edad de todos lo peruanos a la fecha no existe, pero si tengo la certeza de que esa edad promedio en verdad existe, pero que es imposible conocerla con exactitud, teóricamente se tendría que calcular: ww
  • 21. 21 millones X millones peruanos los todos de edades de Suma i 33 33      Si bien es cierto que esta cantidad no la puedo conocer con exactitud, si es posible estimarla (aproximarla) usando muestras. w Esta estimación puede ser puntualmente (darle un valor explícito) o también se puede estimarla por intervalos, es decir poner ese valor  entre dos valores determinados, en otras palabras se puede construir un intervalo de confianza para  de la forma: . . . . S L I L    , donde . .I L es el límite inferior del intervalo y . .S L es el límite superior del intervalo de confianza. Ejemplo 14. Supongamos que se va a realizar un referéndum para aprobar o desaprobar o aprobar una reforma constitucional y que la población de votantes es de 20 millones de personas, aprobar o desaprobar el referéndum es una cualidad. Por comodidad supongamos sólo dos posibilidades: aprobar (si) o desaprobar (no). Antes de efectuar el referéndum nadie puede saber con exactitud la proporción de votantes a favor del (si), o sea existe la proporción de votantes a favor de la modificación constitucional, el cual teóricamente se puede obtener así: ) 20 ( millones electores de Total si del favor a electores de número p  ww
  • 22. 22 Esta cantidad se que existe, pero es desconocida, pero se puede estimar puntualmente y también por intervalos, la estimación puede hacerse en base a una muestra de tamaño n, por ejemplo 1500 o 3000 votantes elegidos al azar, esto mediante alguna técnica de muestreo y a nivel nacional, obviamente 1 0   p , el cual multiplicada por 100 queda expresada en porcentaje, es decir % 100 100 % 0   si p . Las encuestadoras de opinión pública presentan frecuentemente intervalos de confianza basados en muestras, hablan de margen de error y un nivel de confianza. Si bien es cierto p no se conoce si se puede estimar puntualmente mediante p̂ , el cual se lee como si p estimado, esto es posible si por ejemplo la muestra de tamaño 1500  n , si de estos votantes 800 se inclinan a favor del si se tendría: 5333 , 0 1500 800   p  Equivalentemente en % se puede decir que un 53,33% se inclina a favor del si. En general la proporción muestral es: n tica caracterís cierta con objetos u personas de nro estimado p p . ) (    5) CONSTRUCCION DE CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS: CASO DISCRETO ww
  • 23. 23 Si se tiene una data n X X X ;...; ; 2 1 proveniente de una variable discreta lo más probable es que existan datos repetidos, es mejor contar cuantas veces se repite un valor particular, y luego presentarlos en un cuadro de distribución de frecuencias; en el siguiente ejemplo se presenta la metodología. Ejemplo 15. En nuestra universidad existen numerosos laboratorios de cómputo; inevitablemente en cada laboratorio existen computadoras defectuosas. Se tomó una muestra de laboratorios y se contó el número de computadoras defectuosas por laboratorio en n=25 laboratorios (variable discreta) , resultando: 0 . 1 . 2 . 1 . 3 . 2 . 2 . 3 . 3 . 4 . 1 . 2 . 2 . 3 . 4 . 2 . 3 . 0 . 2 . 1 . 2 . 3 . 4 . 5 . 1 . w Los datos se organizaran de menor a mayor, contando las veces que se repiten cada uno. i X 0: 0 0 2 1  f 1: 1 1 1 1 1 5 2  f 2: 2 2 2 2 2 2 2 2 8 3  f 3: 3 3 3 3 3 3 6 4  f 4: 4 4 4 3 5  f 5: 5 1 6  f El esquema anterior puede ser puesto verticalmente y esto nos dará una idea de la forma de la distribución de los datos: ww
  • 24. 24 f1=2 f2=5 f3=8 f4=6 f5=3 .f6=1 x x x x x x x x x x x x x x x x x x x x x x x x x Xi 0 1 2 3 4 5 Luego se procede a la construcción de un cuadro de distribución de frecuencias, teniendo en cuenta lo siguiente: 6  k ; seis valores distintos de la variable en la muestra de tamaño 25  n i f : frecuencia absoluta; i h : frecuencia relativa : i F Frecuencia Absoluta Acumulada i H : Frecuencia Relativa Acumulada i X i f i h i F i H 0 2 1  f 08 , 0 25 2 1   h 2 1  F 08 , 0 1  H 1 5 2  f 20 , 0 25 5 2   h 7 5 2 2    F 28 , 0 20 , 0 08 , 0 2    H 2 8 3  f 32 , 0 25 8 3   h 15 8 7 3    F 60 , 0 32 , 0 28 , 0 3    H 3 6 4  f 24 , 0 25 6 4   h 21 6 15 4    F 84 , 0 24 , 0 60 , 0 4    H 4 3 5  f 12 , 0 25 3 5   h 24 3 21 5    F 96 , 0 12 , 0 84 , 0 5    H 5 1 6  f 04 , 0 25 1 6   h 25 1 24 6     n F 1 04 , 0 96 , 0 6    H 1 Tot al 25  n 1
  • 25. 25 Interpretación: 6 4  f ; seis laboratorios tienen 3 computadoras defectuosas. : % 024 ) 25 6 ( 100 100 4   h El 24% de los laboratorios tienen 3 computadoras defectuosas. 21 6 15 4    F : 21 laboratorios tienen 3 o menos computadoras defectuosas. % 84 ) 84 , 0 ( 100 4   H : el 84% de los laboratorios tienen 3 o menos computadoras defectuosas. w Ejercicio 1.- Usando los datos del Ejemplo anterior; pero añadiendo a la data original los siguientes 11 datos: 2 4 6 1 6 2 3 2 2 3 2 Se pide rehacer lo realizado en el mencionado Ejemplo; pero ahora 36 11 25    n 6) CUADRO GENERAL DE DISTRIBUCIÓN DE FRECUENCIAS Y PROPIEDADES. En general para construir un cuadro de distribución de frecuencias para caso discreto se debe tener la data con un tamaño de muestra n y sin tabular (o datos en bruto) de la forma: n X X X ;...; ; 2 Se hace el conteo para obtener las frecuencias absolutas k i fi ;..., 2 ; 1 :  ; donde k es el número distintos
  • 26. 26 de la variable; obviamente n k  . El cuadro toma la forma: i X i f i h i F i H 1 X 1 f n f h 1 1  1 1 f F  1 1 h H  2 X 2 f n f h 2 2  2 1 2 f f F   2 1 2 h H H    … … … …. i X i f n f h i  4 i i i f F F   1 i i i h H H   1  … … … … k X k f n f h k k  n f F F k k k    1 1 1     k k k h H H Total n 1 En general se cumplen las siguientes propiedades: 1) n f k i i   1 2) 1 1    k i i h 3) n Fk  4) 1  k H 5) n F F F F F f k i i         ... ... 1 2 1 1 6) 1 ... ... 1 2 1 1         k i i H H H H H h 7) i i i i i f f f f f F F          ) ... ( 1 2 1 1 8) i i i i i i h H h h h h h h h H             1 1 2 1 2 1 ) ... ( ... 9) n F H i i  ; i i H n F  10) i i i f F F   1 11) i i i h H H   1 7) |CONSTRUCCION DE CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS: CASO CONTINUO ww
  • 27. 27 Este procedimiento es recomendable solamente cuando se tienen por lo menos un tamaño de muestra mayor o igual 25 o mejor aún tener una muestra de tamaño grande; es decir un 30  n (muestras grandes) La metodología se presentará con un ejemplo práctico dado a continuación. Ejemplo 16. Los siguientes datos corresponden a las notas finales (n=26 alumnos) en un curso de especialidad, las notas son dados con decimales y en una escala vigesimal: 14,6 13,8 11,8 12,0 14,1 09,7 15,9 15,8 17,0 12,7 16,5 14,8 09,3 13,0 12,6 13,8 10,0 11,6 08,0 11,6 18,0 12,7 12,8 10,5 13,6 10,5 Paso 1.- Se halla el valor máximo (Xmax) y el valor mínimo de la muestra (Xmin), Se calcula el Recorrido muestral ,dado por: min max X X R   En nuestro caso: 10 8 18 ; 8 ; 18 min max min max        X X R X X w Paso 2.- Se determina el número de intervalos de clases k; obviamente k es un entero positivo; a trabajar; como ejemplo tomemos 5  k . Observación.- La elección del número de intervalos es controversial, ninguna elección se puede decir que es mejor que la otra u otras.
  • 28. 28 Existen tres criterios para la elección del número de intervalos de clase; los cuales son: 1) Tomar un k moderado entre 5 y 15; es decir 15 5   k ; nosotros hemos elegido k=5 como ejemplo. 2) Otro criterio es tomar próximo a la raíz cuadrada de n; es decir 0990 , 5 26    n k 3) Otro criterio es el de Sturges; el cual dice tomar k como el valor más próximo a 1+3,3log(n); donde log es el logaritmo en base 10; es decir: ) log( 3 , 3 1 n n   En nuestro caso 6691 , 5 ) 4149 , 1 ( 3 , 3 1 ) 26 log( 3 , 3 1 ) 26 log( 3 , 3 1        n Paso 3.- Se calcula la amplitud de los intervalos de clase (c) definida como k R c  . En nuestro caso 2 5 10    k R c Paso 3.- Cada intervalo de clase tendrá amplitud constante igual a c=2 y se crean los k=5 intervalos de clase; desde el Xmin se va sumando la amplitud c; de la siguiente forma: [8; 10>; [10; 12>; [12; 14>; [14; 16>; [16; 18] Observe la forma de los intervalos de clase; los cuatro primeros son cerrados en límite inferior (incluye) y abierto en el límite superior (excluye); excepto el último el cual es cerrado en ambos extremos.
  • 29. 29 ww Paso 4.- Cada una de las observaciones es colocada en cada uno de los intervalos [ 8; 10> : 09,7 09,3 08,0 f1=3 [10; 12> :11,6 10,0 11,6 11,6 10,5 10,5 f2=6 [12; 14> :13,8 12,0 12,7 13,0 12,6 13,8 12,7 12,8 13,6 f3=9 [14; 16>: 14,6 14,1 15,9 15,8 14,8 f4=5 [16; 18] : 17,0 16,5 18,0 f5=3 Paso 5.- Se hallan las marcas de clase ) ( i X que simplemente es el punto medio de los intervalos de clase; decir si el intervalo de clase es    * * 1 [ i i X X ; entonces k i X X X i i i ;...; 2 ; 1 ; 2 * * 1     Luego se crea el cuadro de distribución de frecuencias el cual es similar al caso discreto: Intervalos i X i f i h i F i H i i X f 2 i i X f [8; 10> 9 3 0,1153 3 0,1153 27 243 [10; 12> 11 6 0,2307 9 0,3460 66 726 [12; 14> 13 9 0,3461 18 0,6921 117 1521 [14; 16> 15 5 0,1923 23 0,8844 75 1125 [16; 18] 17 3 0,1153 26 0,9997 51 867 Totales n=26 1 9997 , 0  336 4482 Interpretación: f3: 9 estudiantes tienen notas entre 12 y 14 puntos X3=13; la nota trece es la nota “representativa” de los estudiantes que han obtenido notas entre 12 y 14. ww 100h3=34,64%: el 34,64% de los estudiantes tienen notas entre 12 y 14.
  • 30. 30 F3=18: Dieciocho estudiantes tienen notas entre 8 y 14 puntos 100H3=69,21%: el 69,21% de los estudiantes tienen notas entre 8 y 14 Un gráfico de la distribución de frecuencias absolutas usando el SPSS; muestra lo siguiente: Un gráfico de barra es proporcionado a continuación:
  • 31. 31 Ejercicio 2.- Con la data del Ejemplo anterior; pero agregando cuatro datos adicionales: 10,9 13,4 17,1 12,3 Se pide rehacer el Ejemplo anterior con todos sus pasos; recuerde que ahora Ud. tiene n=30 datos. Ejercicio 3.- Con los datos de Ejercicio anterior, donde n=30 tomar k=6 intervalos de clase y reconstruir el cuadro como se hizo en el Ejemplo 13, considerando los 5 pasos; tenga presente que tendrá que hacer nuevamente el conteo. Sugerencia: En este caso la amplitud de los intervalos de clase es: 6666 , 1 6 10 6 8 18      k R c ; observe que la división no es exacta como en el ejemplo anterior. En estos casos se recomienda tomar la amplitud c con un decimal más de los que tiene la data original, el cual tiene un decimal; tomo la amplitud c con un decimal más; es decir elijo c=1,66 (amplitud constante de cada intervalo). Con estos los seis intervalos de clase son: [8 9,66> [9,66 11,32> [11,32 12,98> [12,98 14,64> [14,64 16,3> [16,3 17,96] Observe que el último intervalo no incluye a la nota 18, la medida conveniente es ampliar un poco más, para considerar el último intervalo como [16,3 18]; cuya amplitud es de 1,7; el cual es ligeramente mayor que los cinco primeros intervalos. Con esto los k=6 intervalos a trabajar son: [8 9,66> [9,66 11,32> [11,32 12,98> ww
  • 32. 32 [12,98 14,64> [14,64 16,3> [16,3 18,0] Ejemplo 17. Ejemplo.- Del archivo que contiene las historias clínicas de los pacientes con problemas de visión de un hospital de la capital; se tomó una muestra de tamaño n=50, y se consideró la estatura de ellos (en metros), resultando: 1,65 1,43 1,88 1,59 1,35 1,76 1,22 1,45 1,62 1,41 1,36 1,78 1,50 1,48 1,62 1,60 1,35 1,53 1,65 1,74 1,49 1,37 1,60 1,76 1,52 1,48 1,61 1,34 1,55 1,82 1,84 1,40 1,56 1,74 1,63 1,55 1,45 1,67 1,61 1,58 1,79 1,68 1,57 1,70 1,32 1,51 1,33 1,42 1,73 1,26 Los pasos a seguir para construir una distribución de frecuencias en el caso continuo son: 1) Se calcula el rango R, el cual es definido como la diferencia entre el mayor valor de la variable X ) ( max x y el menor valor de X ) ( min x ; es decir: min max x x R   En nuestro caso tenemos: 88 , 1 max  x 22 , 1 min  x es decir, R=1,88-1,22=0,66 2) El investigador fija el número de intervalos de clase con que se trabajará, se recomienda un número de intervalos de clase comprendido entre 5 y 15 como máximo. El número de intervalos de clase se representa por k. Por ejemplo en nuestro caso fijemos ejemplo k=6 intervalos de clase 3) Se halla la longitud c de los intervalos de clase, para esto hallamos el cociente: k R c 
  • 33. 33 Como en nuestro caso como hemos establecido que el número de intervalos de clase es k=6 y R=0,66, entonces la amplitud de cada intervalo de clase es: 11 , 0 6 66 , 0   c 4) Luego se determina los límites de cada intervalo de clase, para esto se busca el menor valor de la variable X , es decir el ) ( min x , se le suma c=0,11 y se obtiene el límite superior del primer intervalo de clase y así sucesivamente. Para nuestro caso min x =1,22, el cual es el límite inferior del primer intervalo de clase, se le suma 0,11 resultando 1,22+0,11=1,33, el cual es el límite superior del primer intervalo de clase, a continuación el límite inferior del segundo intervalo de clase es 1,33, le sumamos otra vez 0,11 resultando el límite superior del segundo intervalo de clase, resumiendo: 1,22-1,33 primer intervalo de clase 1,33-1,44 segundo intervalo de clase 1,44-1,55 tercer intervalo de clase 1,55-1,66 cuarto intervalo de clase 1,66-1,77 quinto intervalo de clase 1,77-1,88 sexto intervalo de clase. 5) Determinamos la marca de clase de cada intervalo de clase, el cual es el punto medio de cada intervalo, para esto sumamos el límite inferior y superior de cada intervalo de clase y lo dividimos entre dos, resultando el punto medio de cada intervalo de clase. Para el ejemplo dado tenemos: Intervalos de clase Marca de clase
  • 34. 34 , 1 1 ,    i i x x ) 2 ( , , 1 i i i x x x    [1.22-1,33> 1,275 [1,33-1,44> 1,385 [1,44-1,55> 1,495 [1,55-166> 1,605 [1,66-1,77> 1,715 [1,77-1.88] 1,825 6) Se realiza el proceso de conteo, es decir se obtiene el número de valores de la variable X que pertenece a cada intervalo. En nuestro caso, se tiene: Intervalos de clase Marca de clase Frecuencia absoluta i f 1,22-1,33 1,275 ///=3 1,33-1,44 1,385 //////////=10 1,44-1,55 1,495 /////////=9 1,55-1,66 1,605 ///////////////=15 1,66-1,77 1,715 ////////=8 1,77-1,88 1,825 /////=5 A partir de este momento se trabaja igual que el caso discreto, es decir se agregan las tres columnas correspondientes a las frecuencias relativas, frecuencias absolutas acumuladas y finalmente las frecuencias relativas acumuladas. A continuación presentamos el cuadro de distribución de frecuencias respectivo, es importante recordar que las interpretaciones son vitales para cualquier estudio de tipo descriptivo.
  • 35. 35 Intervalos de clase , , 1 i i x x   Marca de clase i x Frecuencia absoluta i f Frecuencia relativa i h Frecuencia absoluta acumulada i F Frecuencia relativa acumulada i H [ 1.22-1,33> 1,275 3 3/50 = 0,06 3 0.06 [1,33-1,44> 1,385 10 10/50 = 0,2 13 0,26 [1,44-1,55> 1,495 9 9/50 = 0,18 22 0,44 [1,55-1,66> 1,605 15 15/50 = 0,30 37 0,74 [1,66-1,77> 1,715 8 8/50 = 0,16 45 0,9 [1,77-1,88] 1,825 5 5/50 = 0,1 50 1 n = 50 1 Interpretación.- 10 2  f ; significa que existen 10 pacientes cuyas tallas están comprendidas entre 1,33 y 1,44 mts. 18 , 0 3  h ; significa que el 18% de los pacientes tienen una talla comprendida entre 1,44 y .1,55 mts. 37 4  F ; significa que existen 37 pacientes cuyas tallas están comprendidas entre 1,22 y 1,66 mts. 5 H ;significa que el 90% de los pacientes tienen una estatura comprendida entre 1,22 y 1,77 mts. Ejercicio 1.- Con los mismos datos del ejemplo anterior, pero con k=5, hacer el cuadro de distribución de frecuencias; interpretar algunos valores; hacer sus respectivos gráficos. Observaciones: a) El tomar como criterio la elección del número de intervalos k entre 5 y 15 es solamente una alternativa; otras formas que también se usan son las siguientes:  Elegir K de forma tal que K= n ; donde k es el entero más próximo a la raíz cuadrada del
  • 36. 36 tamaño de la muestra, en nuestro caso K= 50 7,07, en cuyo caso se puede tomar k=7 por ser el entero más próximo a 7,07  Existe también una fórmula para determinar el número de intervalos, denominada Fórmula de Sturges; dada por: ) log( 22 , 3 1 n K   Donde log(10) es el logaritmo de n en base 10. En nuestro caso se tiene K=1+3,22 log(50)=1+3,22(1,6989)=6,476 b) Las dos últimas propuestas para la elección del número de intervalos K son alternativas viables a la que hemos usado para la construcción de la tabla de frecuencias con las n=50 estaturas. En todo caso no hay que olvidar que siempre que se haga intervalos de clase implicará cierta pérdida de información; pues todos los valores en un intervalo de clase pasan a ser representados por la marca de clase respectiva. c) Para construir intervalos de clase se recomienda tener un tamaño de muestra grande, es decir 30  n ; en caso contrario sería mejor trabajar los datos continuos como si fueran datos discretos. d) Si bien es cierto que existe pérdida de información en la construcción de los intervalos de clase; también es cierto que se gana otras cosas; como por ejemplo cuando se dibuja el histograma esta revela algunas cosas importantes como simetría o asimetría de la curva; en que intervalo está el mayor número de observaciones (moda).
  • 37. 37 8) DISTRIBUCIÓN DE FRECUENCIAS CASO CUALITATIVO. En este caso no se hace distinción entre las variables cualitativas ordinales y las cualitativas nominales; en ambos casos se trabaja igual. Se mostrará un ejemplo concreto para ver la metodología. Ejemplo 18. En una universidad existen alumnos de diversas regiones: Costa (1); Sierra (2) y Selva (3). Una muestra aleatoria proporcionó el siguiente resultado: 2 1 1 2 1 1 3 1 2 3 2 1 1 1 1 3 3 2 1 2 2 1 1 1 Luego el tamaño de la muestra es 24  n ; se puede construir un de distribución de frecuencias absolutas y de frecuencias relativas de la siguiente manera: i X i f i h 1  C 13 5416 , 0 24 / 13  2  SI 7 2916 , 0 24 / 7  3  Se 4 1666 , 0 24 / 4  24  n 1 9998 , 0  Se interpreta así: 7 2  f : siete estudiantes son de la sierra. 16 , 29 100 2  h : el 29,16% de los estudiantes son de la sierra. Existen varias formas de representar gráficamente esta distribución de frecuencias; destacan los gráficos: ww
  • 38. 38  Gráficos circulares  Gráficos de barras  Diagrama de pastel ww
  • 39. 39  Gráficos de cilindros w  Gráficos combinados  Pictogramas ww
  • 40. 40 Ejemplo 19. Hacer un diagrama circular y diagrama de barras para la data de ejemplo anterior Solución.- El cuadro de distribución de frecuencias es: ww i X i f i h 1  C 13 5416 , 0 24 / 13  2  SI 7 2916 , 0 24 / 7  3  Se 4 1666 , 0 24 / 4  24  n 1 9998 , 0 
  • 41. 41 X Frecuencia Porcentaje Válidos 1,00 13 54,2 2,00 7 29,2 3,00 4 16,7 Total 24 100,0 w ww 9) MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN O TAMBIÉN LLAMADOS PROMEDIOS.(VARIABLES CUANTITATIVA) Si bien es cierto existen varias medidas de tendencia central, nos dedicaremos en primer lugar a la más importante de todas; conocida como media muestral o
  • 42. 42 simplemente media o promedio, esta medida usualmente se representa por X o   X M . w La media muestral es sin lugar a duda la más usada y conocida de todas las medidas de tendencia central, aparte están también otras medidas de tendencia central por mencionar alguna de ellas e incluida la media muestral (o simplemente media o promedio son: a) Media muestral o media aritmética: ] [X M X  b) Moda: d M c) Mediana: e M d) Cuartiles : 3 2 1 ; ; Q Me Q Q  e) Deciles: 9 2 1 ;...; ; D D D f) Centiles : 99 2 1 ;...; ; C C C g) Media geométrica: g M h) Media armónica: h M ww a)La ] [X M X  es una medida resumen de la muestra más importante y la más usada para los datos muestrales provenientes de variables cuantitativas y es dado por: n muestrales datos Suma X 
  • 43. 43 Usualmente para su cálculo se presentan tres casos: Caso 1.- (datos sin tabular) Si los datos están sin tabular, es decir los datos están en bruto, sin ningún tipo de ordenamiento o tratamiento y se presentan de la siguiente manera: n X X X ,..., , 2 1 donde n es el tamaño de la muestra, en este caso se tiene:   n X X M X n i i     1 Ejemplo 20. Los siguientes datos corresponden a las edades (años) de un grupo de alumnos tomados al azar del registro de matrícula, los cuales resultaron ser: 22, 24, 25, 20, 23, 23, 24, 26 En este caso 8  n (tamaño de la muestra), luego: años X X 375 , 23 8 187 8 26 24 23 23 20 25 24 22           ww Es decir la edad promedio de los ocho estudiantes es de 23,375 años, observe que la media siempre va expresada en las unidades originales proporcionados por los datos muestrales. Un gráfico ilustrativo sobre la estatura en mts promedio es:
  • 44. 44 Ejercicio 4.- (Alumno) Los siguientes datos corresponden a las notas finales de un grupo de alumnos (H) y de un grupo de alumnas (M) en el curso de Historia I w (H) 12 13 11 16 10 11 18 (M) 11 13 12 16 15 12 14 15 17 a)Hallar la nota promedio de los estudiantes hombres. b)Hallar la nota promedio de las estudiantes mujeres. c)Junte ambos grupos y obtenga la nota promedio, d)¿Cómo podría obtener la nota promedio de c) usando solamente los resultados en a) y en b)? Caso 2.- (datos tabulados, como en el caso cuantitativo discreto) ww Supongamos que los datos originales proporcionada por la muestra n X X X ,..., , 2 1 y que han recibido un tratamiento, por ejemplo ya se ha construido un cuadro de distribución de frecuencias, siendo k X X X ,..., , 2 1 los valores distintos de la variable, con frecuencias absolutas k f f f ,..., , 2 1 respectivamente y se tiene el cuadro:
  • 45. 45 i X i f 1 X 1 f 2 X 2 f .. .. k X k f n Donde, 1 f es el número de veces que se repite 1 X , 2 f es el número de veces que se repite 2 X y así sucesivamente, en este caso la media muestral se calcula por la fórmula: n X f X k i i i    1 Ejemplo 21. La siguiente información corresponde al número de hijos por familia en una muestra de hogares tomados al azar del distrito de Lince: 2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 ww Tenemos 16  n datos muestrales, estos pueden ser ordenados fácilmente en un cuadro de distribución de frecuencias de la siguiente manera: i X i f i i X f 1 3 3 2 6 12 3 5 15 4 1 4 5 1 5 16  n 39
  • 46. 46 Observe que si bien es cierto son 16  n datos, no todos son distintos. En este caso 5  k valores distintos de la variable, de la fórmula dada se obtiene: 4375 , 2 16 39 16 ) 5 ( 1 ) 4 ( 1 ) 3 ( 5 ) 2 ( 6 ) 1 ( 3        X hijos por familia. Ejercicio 5.- (Alumno)En base al siguiente cuadro correspondiente al número de televisores por familia en una muestra tomada en el distrito de San Miguel; se pide calcular el promedio de televisores por familia. i X i f i i X f 2 i i X f 0 1 1 7 2 10 4 2 5 ¿ a)Teniendo en cuenta que F5=20; hallar el promedio de televisores por familia. b)Calcular 2 i i X f  ww Caso 3.- (datos tabulados como en el caso cuantitativo continuo en intervalos de clase) En este caso la fórmula es igual al caso anterior, es decir también n X f X k i i i    1
  • 47. 47 Ahora los i X son las marcas de clase de los intervalos (puntos medios de los intervalos) y k es el número de intervalos de clase. Ejemplo 22. El siguiente cuadro muestra la distribución de sueldos mensuales en soles de un grupo de trabajadores de construcción civil en k=6 intervalos de clase; cada intervalo clase tiene amplitud c=100 Intervalos i X i f i i X f 700-800 750 5 3750 800-900 850 10 8500 900-1000 950 20 19000 1000-1100 1050 30 31500 1100-1200 1150 25 28750 1200-1300 1250 10 12500 100  n 104000 Luego: 1040 100 104000 1      n X f X k i i i soles mensuales. ww Ejercicio 6.- (Alumno) El siguiente cuadro muestra los pesos en kilos de un grupo de personas con problemas de diabetes ingresados en el Hospital María Auxiliadora del distrito de SJM: Intervalos i X i f 2 i i X f 60,0-62,5 6 62,5-65,0 11 65,0-67,5 20 35
  • 48. 48 25 10 8 Total a)Calcular el peso promedio de los pacientes con diabetes. b)Hallar la suma de los cuadrados de las observaciones. c)Calcular 2 i i X f  10) PROPIEDADES DE LA MEDIA MUESTRAL O MEDIA ARITMÉTICA O SIMPLEMENTE MEDIA O PROMEDIO La media muestral tiene propiedades interesantes y que nos permiten resolver algunos problemas de aplicación. Propiedad 1 La media muestral (o también llamada media aritmética) de una constante k es la misma constante k. Simbólicamente: k k M  ] [ ww Esto quiere decir que si todos los datos muestrales son iguales a una constante k; entonces la media aritmética de ellos también es la constante k. ww Ejemplo 23. En una reunión de amigos contemporáneos se juntan 5 personas; todos ellos de edad igual a k=28 años; es decir n=5 y los datos muestrales son.
  • 49. 49 X1=28; X2=28; X3=28; X4=28; X5=28 Por lo tanto 28 5 ) 28 ( 5 5 28 28 28 28 28 ] [         k M X Ejercicio 7.- (Alumno)En un salón del kínder hay 49 niños que asisten a clases, todos ellos tienen 4 años cumplidos. a)Hallar la edad promedio de los estudiantes de kínder. b)Supongamos que se incorpora al salón un alumno de 5 años ¿Cuál es la nueva edad promedio? Propiedad 2 La media aritmética de una variable X más o menos una constante k, es la media aritmética de la variable X más o menos la constante k. Simbólicamente: k X M k X M    ] [ ] [ Ejemplo 24. Los siguientes datos se refieren a estaturas en metros de un grupo de pacientes de la tercera edad: X1=1,67; X2=1,70; X3=1,75; X4=1,68 ww La media muestral o media aritmética de los n=4 datos es dado por: 7 , 1 4 8 , 6 4 68 , 1 75 , 1 70 , 1 67 , 1 ] [        X M X mts. Si a cada datos se les suma la constante k= 5 centímetros y calculemos la nueva media aritmética.
  • 50. 50 k=5 centímetros equivales a 0,05 metros, es decir k=0,05 mts. X1+0;05=1,67+0,05=1,72; X2+0,05=1,70+0,05=1,75; X3+0,05=1,75+0,05=1,80; X4+0,05=1,68+0,05=1,73 La nueva media aritmética es: 05 , 0 70 , 1 05 , 0 ] [ 75 , 1 4 7 4 73 , 1 80 , 1 75 , 1 72 , 1 ] 05 , 0 [            X M X M Ejercicio 8.- (Alumno)Se pesó a un grupo de sacos de arroz, resultando un peso promedio de 52 kilos por saco. Posteriormente se hizo un chequeo la balanza electrónica y se verificó que estaba defectuosa, en el sentido que pesaba 1,5 kilos por encima de lo que realmente es. Hallar el peso promedio verdadero. Propiedad 3 La media aritmética de una constante c por una variable X es la constante c multiplicada por la media de X. Simbólicamente: ww ] [ ] [ X cM cX M  Ejemplo 25. Un profesor ha calificado a sus 6 alumnos y les ha puesto las notas de 12; 14; 16; 10; 15; 13. Con estos resultados la nota promedio es
  • 51. 51 3333 , 13 6 80 6 13 15 10 16 14 12 ] [         X M puntos El profesor en vista del buen comportamiento, asistencia, puntualidad ha decidido bonificar a cada alumno con un 20% adicional sobre la nota original. El nuevo promedio se obtiene cambiando la nota X por X+(0,2)X=(1+0,2)X=1,2X; esto se hace a cada nota: 1,2(12)=14,4; 1,2(14)=16,8; 1,2(16)=19,2; 1,2(10)=12; 1,2(15)=18; 1,2(13)=15,6 ww 16 99996 , 15 ) 3333 , 13 ( 2 , 1 ] [ 2 , 1 16 6 96 6 6 , 15 18 12 2 , 19 8 , 16 4 , 14 ] 2 , 1 [             X M X M Ejercicio 9.- (Alumno) Los trabajadores de construcción civil de la ciudad de Huancayo gana en promedio por día 68,5 soles. Después de una negociación con los dueños de la empresa constructora se acordó otorgarle un aumento del 15% por día sobre el jornal que percibían, además de una bonificación de 5 soles diarios por movilidad. a) Hallar el nuevo jornal promedio por día de los trabajadores. b) Si en lugar de considerar por día los jornales y bajo las mismas condiciones ¿Cuál es el nuevo ingreso promedio mensual de los trabajadores? Considere el mes de 30 días. ww Propiedad 4 Esta propiedad combina las propiedades 2 y 3. Simbólicamente: k X cM k cX M    ] [ ] [
  • 52. 52 Ejercicio 10.- (Alumno)Demuestre matemáticamente la Propiedad 4). Use propiedades de sumatorias. Propiedad 5 Si X e Y son dos variables que expresan una característica común en cada unidad poblacional; entonces: ] [ ] [ ] [ Y M X M Y X M    Ejemplo 26. Se tomado una muestra de n=5 familias de un distrito de la capital, se consideran las siguientes variables: X: ingreso mensual en soles del esposo. Y: ingreso mensual en soles de la esposa. Los datos se muestran en el siguiente cuadro: X 1350 1800 1200 1100 1500 Y 1400 1700 900 1000 1430 La variable Z=X+Y es el ingreso mensual familiar de las n=5 familias. X 1350 1800 1200 1100 1500 Y 1400 1700 900 1000 1450 Z=X+Y 2750 3500 2100 2100 2950 Se puede calcular el ingreso promedio mensual familiar de las n=5 familias. 2680 5 13400 5 2950 2100 2100 3500 2750        Z soles.
  • 53. 53 También se pueden calcular el ingreso promedio de los esposos por separado: 1390 5 6950 5 1500 1100 1200 1800 1350        X soles. En forma similar el sueldo promedio de las esposas 1290 5 6450 5 1450 1000 900 1700 1400        Y soles. Se observa que 1290 1390 ] [ ] [ 2680 ] [ ] [        Y M X M Y X M Z M soles. Ejemplo 27. Las temperaturas registradas en una ciudad; a las 12 del día en grados Fahrenheit (F0 ) son las siguientes 51; 60; 58; 62; 57; 49; 52; 62; 61; 63. Hallar la media aritmética de las temperaturas en grados Centígrados (C0 ) si se cumple 8 , 1 32 0 0   F C Solución.- La temperatura en F0 es: 10 5 , 57 10 575 10 63 .... 60 51 ] [ 0        n F M 8 , 1 32 ] [ 8 , 1 1 8 , 1 32 ] 8 , 1 1 [ ] 8 , 1 32 [ ] [ 0 0 0 0       F M F M F M C M 0 0 1666 , 14 8 , 1 32 ] 5 , 57 [ 8 , 1 1 ] [ C C M    ww Ejercicio 11.- (Alumno) Con respecto un Ejemplo 24), supongamos que al ingreso familiar se incorpora el hijo mayor por familia que también trabaja y percibe un ingreso mensual; pero como recién
  • 54. 54 comienza y no tiene experiencia, sólo percibe el 65% del sueldo del padre. Hallar en nuevo ingreso promedio familiar. Propiedad 6 (Media global) Si se tienen dos grupos 1 y 2; en los cuales se ha medido una característica cuantitativa común X; supongamos que el primer grupo es de tamaño n1 con media 1 X ; el segundo grupo es de tamaño n2 con media 2 X ; entonces la media global o conjunta de ambos grupos es: 2 1 2 2 1 1 n n X n X n X    Propiedad 7 La media muestral como todo promedio está entre el valor mínimo y el valor máximo de las observaciones; es decir. max min X X X   Propiedad 8 Las desviaciones respecto a la media se define como n i X Xi ;..., 2 ; 1 ); (   ww Esta propiedad dice “La suma de las desviaciones respecto a la media es idénticamente cero”. Simbólicamente: 0 ) ( 1     X X n i i Ejemplo 28. Consideremos los siguientes datos: 3 5 4 6 2 Comprobar que la suma de las desviaciones con respecto a la media es idénticamente nulo.
  • 55. 55 Con los datos obtenemos la media muestral 4 5 2 6 4 5 3       X Las desviaciones con respecto a la media son: (3-4)=-1; (5-4)=1; (4-4)=0; (6-4)=2; (2-4)=-2 0 ) 2 ( ) 2 ( 0 ) 1 ( ) 1 ( ) ( 1            X X n i i Ejemplo 29. En dos salones de clase 1 y 2 se han tomado un examen común de matemáticas; en el primer salón tiene 16 alumnos y una nota promedio de 12,5. En el segundo salón hay 20 alumnos y con una nota promedio de 13,8. Hallar la notal global (juntando las dos aulas) Solución.- 5 , 12 ; 16 1 1   X n puntos 8 , 13 ; 20 2 2   X n puntos Entonces la media global es dado por ww 2222 , 13 36 476 20 16 ) 8 , 13 ( 20 ) 5 , 12 ( 16 2 1 2 2 1 1         n n X n X n X puntos. Ejercicio 12.-(Alumno) Con respecto al ejemplo anterior, supongamos un tercer salón de clases, del cual se conocen los siguientes datos: ww 15  X puntos; 525 1    n i i X Hallar la media global considerando los tres salones de clases.
  • 56. 56 11) MEDIA PONDERADA Es un caso especial de la media muestral y se usa en condiciones especiales donde existen pesos o ponderaciones k i i ;...; 2 : 1 ;   . En este caso se calcula con la fórmula: k k k X X X X               ... ... 2 1 2 2 1 1 Ejemplo 30. Las notas de un estudiante en cuatro asignaturas(A; B; C; D), así como sus respectivos créditos se muestran en el siguiente cuadro: Curso Nota: i X Crédito: i  A 11 3 B 13 7 C 12 5 D 15 2 Total   i X 51   i  17 Luego la media global es dada por: 5882 , 12 17 214 2 5 7 3 ) 15 ( 2 ) 12 ( 5 ) 13 ( 7 ) 11 ( 3           X puntos. La media aritmética es: ww 75 , 12 4 51 4 15 12 13 11       X puntos. Ejercicio 13.-(Alumno) Con respecto al Ejemplo anterior:
  • 57. 57 a) Si se agrega un quinto curso más (E) con creditaje igual al promedio simple de los cuatro primeros cursos y que la nota de ese quinto curso es 14. Hallar el nuevo promedio ponderado. b)¿Qué tendría que suceder con el creditaje para que la media ponderada coincida con la media aritmética? 12) MEDIDAS DE DISPERSIÓN (ABSOLUTA) O MEDIDAS DE VARIABILIDAD. Existen varias medidas de dispersión; las más utilizadas son: a)Desviación estándar (d.e.) muestral o típica: S b)Varianza muestral: 2 S c)Desviación Media: DM d)Rango Intercuartílico: RI Ejemplo 31. Si bien es cierto la media muestral es importante, esta no es suficiente, pues hace falta definir una medida de variabilidad de los datos alrededor de X , para esto imaginemos tres grupos de alumnos, donde cada grupo es de tres alumnos y que la variable de interés sea la nota en la escala vigesimal en cada grupo y tenemos los siguientes resultados: Grupo A: 09 10 11; 10  A X puntos. Grupo B: 07 10 13; 10  B X puntos.
  • 58. 58 Grupo C: 01 10 19; 10  C X puntos. Observemos que los tres grupos tienen la misma media muestral y son iguales a 10; sin embargo la variabilidad no es la misma en los tres grupos, es necesario definir una medida que capte esta variabilidad, una medida de muy usada es la desviación estándar o desviación típica muestral, la cual es definida por: 1 ) ( 1 2      n X X S n i i Vamos a calcular esta medida de variabilidad para los tres grupos; resultando: . 1 1 3 ) 10 11 ( ) 10 10 ( ) 10 9 ( 2 2 2 puntos SA         . 3 9 1 3 ) 10 13 ( ) 10 10 ( ) 10 7 ( 2 2 2 puntos SB          . 9 81 1 3 ) 10 19 ( ) 10 10 ( ) 10 1 ( 2 2 2 puntos SC          Si analizamos los tres grupos de datos, se nota que en el primer grupo los datos está más concentrados alrededor de A X , en el segundo grupo los datos se abren un poco más alrededor de su media y finalmente el tercer grupo los datos están mucho más dispersos alrededor de la media muestral. Esto se ve reflejado en la desviación estándar muestral, pues si los datos están muy dispersos la
  • 59. 59 desviación estándar es “grande”, si los datos están muy pegados alrededor de su media la varianza es “pequeña”; por esa razón la desviación estándar es una medida de variabilidad excelente alrededor de la media muestral en el siguiente sentido: “Si la desviación es estándar (d.e.) es “grande” significa más dipersión de los datos alrededor de la media, si la d,e, es pequeña significa más concentración de los datos alrededor de la media”. 13) DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA s Es la medida de dispersión absoluta más usada y es dada por: 1 ) ( 1 2      n X X S n i i Propiedad: (demostrable) 1 ) ( 1 ) ( 1 ) ( 1 2 2 1 1 2 2 1 2                  n X n X n n X X n X X S n i i n i n i i i n i i ww También como en la media aritmética se presentan tres casos en el cálculo de la desviación estándar: Caso 1.- (datos sin tabular) Si los datos están sin ningún tipo de tratamiento o datos sin tabular y se tiene la muestra n X X X ,..., , 2 1 , en
  • 60. 60 este caso la desviación estándar (d.e.) o desviación típica se calcula mediante la fórmula: 1 ) ( 1 ) ( 1 1 2 2 1 2             n n X X n X X S n i n i i i n i i Ejemplo 32. Con los siguientes datos , referente a las a las edades de ocho alumnos; es decir: 22, 24, 25, 20, 23, 23, 24, 26 en este caso 8  n y para el cálculo de la d.e. se necesitan dos cantidades, la suma de datos y la suma de los cuadrados de los datos, en este caso se tiene:    8 1 187 i i X , 4395 ) 26 ( ... ) 24 ( ) 22 ( 2 2 2 8 1 2        i i X Luego reemplazando se obtiene: años S 8468 , 1 1 8 8 ) 187 ( 4395 2     ww Ejercicio 14.-(Alumno) Los siguientes datos son los pesos de un grupo de adolecentes : 54; 60; 48; 52; 45 a)Hallar la desviación estándar. b)Sume 2 kilos a cada peso y luego calcular la desviación estándar asociada. ¿ Es igual a la obtenida en la parte a)?
  • 61. 61 Caso 2.- (datos tabulados, como en el caso cuantitativo discreto) En este caso se tiene: 1 ) ( 1 1 2 2        n n X f X f S k i k i i i i i donde k es el número de valores distintos de la v,a, X ww Ejemplo 33. Con los datos de un ejemplo anterior correspondientes al número de hijos por familia: 2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2 Se necesita una columna que tenga la suma de cuadrados, es decir: i X i f i i X f 2 i i X f 1 3 3 3 2 6 12 24 3 5 15 45 4 1 4 16 5 1 5 25 16  n 39 113 ww Reemplazando, se tiene: familia por hijos S 0935 , 1 1 16 16 39 113 2    
  • 62. 62 Ejercicio 15.-(Alumno) Con los n=16 datos del ejemplo anterior se aumenta 3 datos más correspondientes a tres familias los que tienen 3; 4; 3 hijos. Hallar la d.e. correspondiente. Caso 3.- (datos tabulados como en el caso cuantitativo continuo en intervalos de clase) En este caso la fórmula es similar que en el caso anterior, es decir: 1 ) ( 1 1 2 2        n n X f X f S k i k i i i i i En este caso los i X son las marcas de clase y k es el número de intervalos de clase. Ejemplo 34. Usando los datos de un Ejemplo anterior, referente a los sueldos mensuales en soles de un grupo de trabajadores, es necesario agregar una columna más que contenga la suma de cuadrados, es decir: ww Intervalos i X i f i i X f 2 i i X f 700-800 750 5 3750 2812500 800-900 850 10 8500 7225000 900-1000 950 20 19000 18050000 1000-1100 1050 30 31500 33075000
  • 63. 63 1100-1200 1150 25 28750 33062500 1200-1300 1250 10 12500 15625000 100  n 104000 109850000 Reemplazando se obtiene: mensuales soles S 6549 , 130 1 100 100 104000 109850000 2     . Ejercicio 16.-(Alumno) Si a los datos del ejemplo anterior se le agrega un intervalo más cuya marca de clase es 1350 y Frecuencia Absoluta Acumulada F7 es 105. Hallar la d.e. correspondiente. Ejercicio 17.-Probar que se tienen n datos numéricos y tos iguales a una constante k; entonces 0 ; ] [   S K K M 14) VARIANZA MUESTRAL ] [ 2 X Var S  Definición 5. ( varianza muestral) La varianza muestral representa por 2 S = ] [X Var y es el cuadrado de la desviación estándar; es decir: 2 2 .) . ( ] [ e d X Var S   ; donde S estándar desviación e d   . . ww Ambas; el 2 S (varianza muestral) y el S (desviación estándar muestral) son medidas de variabilidad de los datos alrededor de la media muestral, la diferencia estriba en la S está expresada en la unidades
  • 64. 64 originales, mientras que 2 S está expresada en unidades originales al cuadrado. Obviamente si se conoce la d.e. muestral S elevando al cuadrado se obtiene la varianza muestral 2 S y viceversa si se conoce la varianza muestral 2 S sacando la raíz cuadrada positiva se obtiene la d.e. muestral S ; es decir: ] [ . . 2 X Var S e d S     Considerando lo anterior en la que se estudió la desviación estándar muestral S y su fórmula de cálculo en Caso 1; Caso 2 y Caso 3 se repiten sin la raíz cuadrada; es decir para el cálculo de la varianza muestral surgen tres casos: Caso 1.- (Datos sin tabular) 1 ) ( 1 1 2 2 2        n n X X S n i n i i i Caso 2.- (Datos tabulados como en el caso cuantitativo discreto) ww 1 ) ( 1 1 2 2 2        n n X f X f S k i k i i i i i Caso 3.- (Datos tabulados como en el caso cuantitativo continuo)
  • 65. 65 1 ) ( 1 1 2 2 2        n n X f X f S k i k i i i i i ; donde : i X marca de clase del iésimo intervalo. : k número de intervalos de clase. Ejemplo 35. Los siguientes datos corresponden al peso de un grupo de recién nacidos en kilos escogidos al azar en verano del presente año: 2,8 3,2 3,4 3,0 2,3. a)Calcular la media muestral, la varianza muestral y luego obtenga la d.e. muestral para esta muestra de tamaño n=5. b)En invierno del mismo año se registró otro grupo de recién nacidos, resultando: 3,1 3,1 3,1 3,1 3,1 Calcular 2 S y S c) Si los datos: 2,8 3,2 3,4 3,0 2,3 les sumamos 100 gramos ¿Cambia la varianza obtenida en a)? d)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3 los reducimos en un 5% ¿Cambia la varianza obtenida en a)? e)La varianza muestral ] [ 2 X Var S  ¿Puede ser negativa?
  • 66. 66 Solución: a)Se necesitan dos resultados: Suma de datos y Suma de cuadrados de datos; es decir: 7 , 14 5 1    i i X ; 5 ; 93 , 43 5 1 2     n X i i Por lo tanto: 94 , 2 5 7 , 14 ] [    X M X kilos; 178 , 0 4 712 , 0 1 5 5 ) 7 , 14 ( 93 , 43 2 2      S (kilos)2 Tomando raíz cuadrada 4219 , 0 178 , 0 2     S S (kilos) b) 5 , 15 ) 1 , 3 ( 5 1 , 3 1 , 3 1 , 3 1 , 3 1 , 3 ; 4 5 1           i i X n 05 , 48 ) 1 , 3 ( 5 2 4 1 2     i i X ; luego 1 , 3 5 5 . 15 ] [    X M X (kilos) 0 4 0 1 5 5 ) 5 , 15 ( 05 , 48 2 2      S Entonces la d.e. es 0  S ww Este resultado de varianza cero se debe la siguiente propiedad de la varianza muestral que dice lo siguiente: “Si a todos los datos son iguales a una constante k; entonces la varianza muestral es igual a cero” Simbólicamente: 0 ] [  k Var
  • 67. 67 Observe el siguiente detalle: Si todos los datos son iguales la media muestral coincide con el dato común; en este caso no hay variabilidad alrededor de la media; eso se ve reflejado con una d.e. igual a cero o equivalentemente una varianza muestral igual a cero. c)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3 se les suma 100 gramos que es equivalente a 0,1 kilos. La nueva data es ahora: 2,9 3,3 3,5 3,1 2,4 Entonces: 92 , 46 2 , 15 5 1 5 1 2       i i i i X X 178 , 0 4 712 , 0 1 5 5 ) 2 , 15 ( 92 , 46 2 2      S Este resultado coincide con el obtenido en la parte a); esto no es una coincidencia, en realidad es una propiedad de la varianza muestral que dice lo siguiente: | “La varianza de la variable X más o menos una constante k es igual a la varianza de X” Simbólicamente: ] [ ] [ X Var k X Var  
  • 68. 68 d)Si a cada dato los reducimos un 5% entonces a cada dato hay que multiplicarlo por la constante k=0,95; es decir: 0,95(2,8)=2,66 0,95(3,2)=3,04 0,95(3,4)=3,23 0,95(3,0)=2,85 0,95(2,3)=2,185 646825 , 39 965 , 13 2     i i X X (Verificar) 160645 , 0 ) 178 , 0 ( ) 95 , 0 ( ] [ ) 95 , 0 ( 160645 , 0 4 5 ) 965 , 13 ( 646825 , 39 ] [ 2 2 2 2        X Var X Var S Lo anterior es una propiedad de la varianza muestral, que dice lo siguiente: “La varianza de una constante c multiplicada por la variable X es el la constante al cuadrado multiplicada por la varianza de la variable X” Simbólicamente ww ] [ ] [ 2 X Var c kX Var  e)La varianza nunca puede ser negativa, pues suma de cuadrados; es decir 0 2  S 15) PROPIEDADES DE LA VARIANZA MUESTRAL 2 S Propiedad 1 .- 0 ) ( 2   S X Var
  • 69. 69 Propiedad 2 .- 0 ] [  k Var Propiedad 3 .- ] [ ] [ X Var k X Var   Propiedad 4 .- ] [ ] [ 2 X Var c cX Var  Propiedad 5 .- ] [ ] [ 2 X Var c k cX Var   Ejercicio 18.- (Alumno) Los siguientes datos corresponden a la estatura en metros de un grupo de estudiantes varones: ww 1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75 f) Calcular la media muestral, la varianza muestral y luego obtenga la d.e. muestral. g)Un grupo de estudiantes mujeres registro que 8 de ellas registraron un estatura común de 1,68 metros, Calcular la media muestral considerando a varones y mujeres. h) Si a los datos: 1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75 se les resta 2 centímetros, calcular la varianza muestral y la desviación estándar muestral. ¿Cambian los resultados con los obtenidos en la parte f) i) Si a cada uno de los datos: 1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75
  • 70. 70 Se les aumenta un 3%. Obtener la varianza muestral. ¿Cambian los resultados con respecto a la parte f)? j) La desviación estándar ¿Puede ser negativa? 16) MEDIDAS DE DISPERSIÓN RELATIVA: El COEFICIENTE DE VARIACIÓN (C.V.) Cuando dos o más grupos tienen la misma media muestral la desviación estándar sirve directamente para decidir el grupo que tiene menos dispersión alrededor de la media. Sin embargo tener dos o más grupos con la misma media muestral por lo general no es posible; para poder comparar la variabilidad en estos casos se define el Coeficiente de Variación (CV) y es una medida de dispersión relativa pues es adimensional y es dada por: ww X S CV  En la definición anterior se supone que la media muestral es positiva; es decir 0  X ; si la media muestral fuese negativa se le puede tomar el valor absoluto y con esto el Coeficiente de Variación queda definida así: X S CV 
  • 71. 71 Ejemplo 36. Las notas promedios finales de tres salones (A; B y C) son 5 , 11  A X ; 0 , 13  B X ; 0 , 10  C X puntos con desviaciones estándar de 6 , 0  A S ; 55 , 0  B S ; 53 , 0  C S ¿Qué salón tiene notas menos variable alrededor de la media? ¿Qué salón tiene notas más variables alrededor la media? Los datos presentados y los CV asociados se resumen en el siguiente cuadro: 5 , 11  A X 6 , 0  A S 0521 , 0 5 , 11 6 , 0   A CV % 21 , 5 100  A CV 0 , 13  B X 55 , 0  B S 0423 , 0 0 , 13 55 , 0   B CV % 23 , 4 100  B CV 0 , 10  C X 53 , 0  C S 053 , 0 0 , 10 53 , 0   C CV % 3 , 5 100  C CV El salón con notas menos alrededor de la media (más concentrados alrededor de la media) es aquel que tiene menos CV en este caso es el salón B; pues su CV en % tiene un valor de % 23 , 4 100  B CV El salón con notas más variables alrededor de la media (más dispersos alrededor de la media) es aquel que tiene alto CV, en este caso es el salón C; pues tien un valor de % 3 , 5 100  C CV Ejemplo 37. Se tomaron al azar dos distritos de la capital (A y B) y la variable de interés es el número de dormitorios por familia; se tienen los dos siguientes cuadros: Distrito A
  • 72. 72 i X i f 0 1 1 4 2 5 3 4 4 2 Distrito B i X i f 1 0 2 1 3 3 4 7 5 4 6 1 ¿Cuál de los dos grupos tiene mayor variabilidad respecto a la media? Solución.- Para cada grupo hay que calcular la suma de datos y la suma de sus cuadrados Distrito A.- 34   i i X f ; 92 2   i i X f ; 16  n 125 , 2 16 34   X dormitorios; 1474 , 1 15 75 , 19 15 16 ) 34 ( 92 2     S dormitorios ww 8194 , 0 125 , 2 1474 , 1   CV ; % 94 , 81 100  CV Distrito B.-
  • 73. 73 65   i i X f ; 279 2   i i X f ; 16  n 0625 , 4 16 65   X dormitorios, 9979 , 0 15 9375 , 14 15 16 ) 65 ( 279 2     S 2456 , 0 0625 , 4 9979 , 0   CV ; % 26 , 24 100  CV El grupo más variable alrededor de la media es aquel que tiene mayor CV; en este caso es el número de dormitorios del distrito A. 17) APLICACIONES DEL COEFICIENTE DE VARIACIÓN El Coeficiente de Variación CV tiene dos importantes aplicaciones: a)Si se tienen dos o más grupos, el CV permite decidir el grupo que tiene menos variabilidad relativa alrededor de la media; para esto se busca el CV más pequeño o el 100CV más pequeño b)Permite tener un criterio para decidir cuando una varianza puede ser llamada “grande” o pueda ser denominada “pequeña”; en el siguiente sentido: 1)Si CV<0,05 (100CV<5%) se considera una varianza “pequeña”.
  • 74. 74 2) Si CV>0,05 (100CV>5%) se considera una varianza “grande”. ww Ejemplo 38. Con respecto al Ejemplo anterior donde la variable de interés es número de dormitorios por familia, decidir para cada caso si se trata de varianza pequeña o grande. Se tiene los siguientes cálculos ya hechos: Para el distrito A se tiene CV=0,8194>0,05 (Varianza grande) Para el distrito B se tiene CV=0,2426>0,05 (Varianza grande) Ejercicio 19.-(Alumno) Decir si es V o F la siguiente afirmación: “Si a un conjunto de datos numéricos se les suma una constante k; entonces el CV no cambia.” ww
  • 75. 75 Ejercicios Parte 1 1)Clasificar las siguientes variables: 1.1 Número de errores por página de un libro. 1.2 Nivel de humedad en una ciudad. 1.3 Número de latidos del corazón por minuto. 1.4 Color del cabello. 1.5 Duración de los focos de luz. 1.6 Marca de autos. 1.7 Número de cabellos por persona. 1.8 Color de tinta de lapiceros. 1.9 Número de teléfono de los usuarios. 1.10 Nivel de glucosa en la sangre en pacientes. 1.11 Altitud de las ciudades de la Sierra del Perú. 1.12 Estado civil de las personas adultas. 1.13 Temperatura medioambiente. 1.14 Diámetro interior de tuercas de precisión. 1.15 Tipo de diabetes en personas adultas. 1.16 Número de mascotas por familia. 1.17 Número de ríos que llegan a la costa en los diferentes países del mundo. 1.18 La clase social de los peruanos.
  • 76. 76 2) Consideremos la población de alpacas de una región de la sierra peruana, dicha población quiere ser estudiada de acuerdo a su composición por sexo (macho=m, hembra=h) a)Defina un parámetro de interés. b)Se cazan 150 animales de esta especie, de ellas resultan 78 machos, estime la proporción poblacional de machos de las alpacas de esa zona. 3) Los datos siguientes son referentes a la duración de un grupo de focos (marca A) de luz medido en horas: 1200, 1050, 1100, 1000, 1111, 1150, 1000 a)Hallar la media muestral X , b)Hallar la desviación estándar muestral S y la varianza muestral 2 S . c)Calcular el coeficiente de variación.¿Varianza pequeña o grande? 4) Los siguientes datos son referentes al número de visitas al seguro social en un año determinado de una muestra de jubilados: 2, 4, 3, 4, 5, 4, 3, 3, 4, 5, 2, 4, 2, 4, 3, 3, 4, 3, 3, 5 a)Construir un cuadro de distribución de frecuencias. Obtener S S X , , 2 b)Si a cada dato se le suma 1. ¿Cambia la media muestral?. ¿cambia la desviación estándar muestral?. Justifique.
  • 77. 77 5) El siguiente cuadro muestra la distribución de las edades de un grupo de alumnos universitarios: Intervalos i X i f 16-18 17 5 18-20 19 10 20-22 21 15 22-24 23 13 24-26 25 7 26-28 27 3 a)Calcular 2 , , S S X . ¿Varianza pequeña o grande? b) Obtener i i i H F h , , , e interpretar algunos valores Solución: Primero creamos el siguiente cuadro Intervalos i X i f i h i F i H i i X f 2 i i X f [16-18> 17 5 0,094 3 5 0,094 3 85 1445 [18-20> 19 10 0,188 6 15 0,282 9 190 3610 [20- 22> 21 15 0,283 0 3 0 0,565 9 315 6615 [22-24> 2 3 13 0,245 2 4 3 0,8111 299 6877 [24-26> 2 5 7 0,132 0 5 0 0,943 1 175 4375 [26-28> 27 3 0,056 6 5 3 0,999 7 81 2187 Totales n=5 3 114 5 2510 9
  • 78. 78 a) 3037 , 21 53 1145   X años b) 3592 , 7 52 6792 , 382 52 53 ) 1145 ( 25109 2 2     S (años)2 7127 . 2 3592 , 7   S años % 73 , 12 100 1273 , 0 3037 , 21 / 7127 , 2    CV CV Varianza grande 6) Decir si es Posible (P) o No Posible (NP), las siguientes afirmaciones, justifique sus respuestas: a)La media muestral nunca puede ser negativa. b)La desviación estandar de un conjunto de datos puede ser cero. c)La proporción muestral siempre es menor que la proporción poblacional. d)La proporción poblacional puede ser mayor que uno. e)Siempre que se quita un dato de un conjunto de n datos entonces la media muestral cambia necesariamente. 7) En un salón de clases A se tienen 25 alumnos y una nota promedio de 12,5 puntos; otro salón B tiene el doble de alumnos con respecto al del salón A; la nota promedio es de 13 puntos, Hallar la nota promedio de juntando ambos grupos. 8) Anteriormente se dieron cuatro propiedades de la varianza muestral 2 S ; reformularlas para el caso de desviación estándar muestral.
  • 79. 79 9) Un estudiante obtiene las notas en exámenes parciales de 7; 5 y 3. En el examen final consigue un 6; supongamos que esta nota final tiene doble valor que los parciales. ¿Cuál es su nota promedio? 10) Si el ingreso anual promedio de los trabajadores del campo es de 12000 soles y el ingreso anual promedio de los trabajadores de la ciudad es de 15000 soles ¿El ingreso promedio para ambos grupos será de 13500 soles? Justifique. 11) Decir si es V o F la siguiente afirmación “Si la d.e. de un conjunto de datos es cero, entonces todos los datos son iguales” 12) La media aritmética de seis números es 10. Se sabe que cinco de ellos son 8 12 13 5 9. Hallar el elemento que falta. 13) Se dice que un conjuntos de datos están tipificados, si a cada uno ellos se le resta la media aritmética y se lo divide entre la desviación estándar; es decir si la data original es: Si se tiene la data original n X X X ;...; ; 2 1 a cada uno de ellos se les hace la transformación n i S X X Z i i ;...; 2 ; 1 ; ) (    Con la siguiente data: 4 3 4 1. Se pide tipificar los cuatro datos y luego con los cuatro datos
  • 80. 80 transformados calcular su media aritmética y su varianza. 14) En estas notas de clase se ha definido la varianza muestral 1 ) ( 2 2      n X X S k i i ; (dividida entre n- 1) también se conoce varianza muestral insesgada o cuasivarianza. En algunos libros presentan una varianza ligeramente diferente y se conoce como varianza muestral sesgada (dividida entre n); y se define así: n X X S k i i     2 2 * ) ( La diferencia entre ambas es el denominador; si n>30 (muestras grandes); la diferencia entre ambas es mínima. Encontrar una relación matemática entre ambas varianzas 2 S y 2 * S . 15) Se presenta siguiente cuadro en la que se considera el número de hijos por familia provenientes de una encuesta hecha a 50 familas i X i f 0 2 1 12 2 21 3 8 4 5 5 2 n=50
  • 81. 81 a)Hacer una representación gráfica de dos formas distintas: Gráfico de barras; Gráfico de sectores circulares. b)Hallar la media muestral; la desviación estándar muestral y la varianza muestral c)Obtener el C.V. e interpretar. 16) En una distribución simétrica con 7 intervalos de clase tal que 100 ; 95 , 0 ; 20 , 0 ; 05 , 0 5 3 1     n H h h . a) Reconstruya el cuadro de distribución de frecuencias; con la información adicional de que la marca de clase del primer intervalo de clase es 5 y la marca de clase del tercer intervalo de clase es 15. b) Calcular . . ; ; ; 2 V C S S X 17) Los ingresos semanales de 40 personas se muestran en el siguiente cuadro: * * 1 i i x x   i f i F * 1 200 x  2 x 300 * 1  x x x 12 22 x 29 x 34 4 x x x a)Complete el cuadro de distribución de frecuencias. b)Calcular la media muestral; la desviación estándar muestral y el C.V.
  • 82. 82 c)Estimar el número de personas con ingresos semanales entre 253 y 359 soles. 18) (RM 159) El ingreso percápite mensual de un departamento es de $310 (x1000). El sector obrero que constituye el 59% de esa población percibe 1/5 del ingreso total. Hallar el ingreso medio por habitante de ese departamento. Observación.- El ingreso per cápita se define como Renta o ingreso per cápita La renta per cápita, PIB/PBI per cápita o ingreso per cápita es un indicador macroeconómico de productividad y desarrollo económico, usado para entregar una visión respecto al rendimiento de las condiciones económicas y sociales de un país, esto en consideración del crecimiento real y la fuerza laboral El PIB per cápita, ingreso per cápita o renta per cápita es un indicador económico que mide la relación existente entre el nivel de renta de un país y su población. Para ello, se divide el Producto Interior Bruto (PIB) de dicho territorio entre el número de habitantes. El empleo de la renta per cápita como indicador de riqueza o estabilidad económica de un territorio tiene sentido. Esto, porque a través de su cálculo se interrelacionan la renta nacional (mediante el
  • 83. 83 PIB en un periodo concreto) y los habitantes de ese lugar. El objetivo del PIB per cápita es obtener un dato que muestre el nivel de riqueza o bienestar de un territorio en un momento determinado. Con frecuencia se emplea como medida de comparación entre diferentes países, para mostrar las diferencias en cuanto a condiciones económicas. Significado de PIB per capita Qué es PIB per capita: El PIB per cápita es un indicador económico que mide la relación entre el nivel de ingresos de un país y cada uno de sus pobladores. También suele ser conocido con el nombre de ingresos per cápita o renta per cápita. La expresión está formada por las siglas PIB que significan 'producto interno bruto', y las palabras latinas per cápita , que quieren decir 'por cabeza'. Así, se resume como el producto interno bruto por cabeza de un país. Para medir el PIB per cápita se utiliza una fórmula que consta de los siguiente elementos: PIB per cápita = PIB / nro de habitantes Por ejemplo, en una nación que percibe en un año un producto interno bruto de 300 mil millones de dólares y que tiene 30 millones de habitantes, el PIB per cápita será de 10 mil dólares por habitante. Función del PIB per cápita
  • 84. 84 EL PIB per cápita se mide anualmente. Se supone que su incremento delata el crecimiento de una economía durante un determinado período. En teoría, este dato describe el promedio de ingresos en función del número de habitantes, lo que permitiría diagnosticar el nivel económico de la sociedad. Sin embargo, al ser apenas un promedio, este indicador no permite comprender con claridad cómo esta riqueza es repartida entre los diferentes individuos de un país, de manera que las desigualdades económicas no se visibilizan. Por ejemplo, en un país con un PIB per cápita de 10 mil dólares, ocurre a menudo que unos ganan muchísimo menos y otros ganan muchísimo más. Así, el PIB per cápita no es un indicador fiable para medir la distribución de la riqueza sino apenas la totalidad de los ingresos y su potencial de inversión. En efecto, el PIB per cápita no ofrece información contundente sobre los datos relacionados con educación y salud, fundamentales en la evaluación de la distribución de la riqueza. Qué es el Producto Bruto Interno (PBI)? ¿Qué es el PBI? El Producto Bruto Interno (PBI) es el valor de los bienes y servicios finales producidos durante un período de tiempo en un territorio. Sólo se refiere a bienes y servicios finales porque sus precios incorporan el valor de los bienes intermedios. Por
  • 85. 85 tanto, incluir los bienes intermedios conllevaría a una doble contabilización. Existen 3 métodos para calcular el PBI: método de gasto, el método de la producción y el método del ingreso. Las dos primeras son las formas más usuales. En el primer método, se contabiliza la compra agregada de los bienes y servicios de la economía, es decir, se suma el gasto de: los consumidores de bienes y servicios locales (consumo privado), el gobierno (consumo e inversión pública), las empresas (inversión privada), los extranjeros que compran nuestros productos (exportaciones), y, finalmente, se excluye del cálculo el gasto en bienes no producidos en el país (importaciones). Por su parte, en el método de la producción, se suma el valor de mercado del producto en cada etapa de la producción de cada sector productivo y restándole el valor de los insumos utilizados. Los sectores de producción se clasifican en: manufactura, minería, agricultura, pesca, comercio, etc. Por último, el método del ingreso consiste en cuantificar los ingresos recibidos por todos los agentes de la economía en razón de su participación en la producción. Se considera como ingresos a: las remuneraciones, el consumo de capital fijo, los impuestos a la producción e importación y el excedente de explotación. Estadísticas relacionadas Población 32,51 millones (2019)
  • 86. 86 PBI per cápita 6.977,70 USD (2019) Tasa de crecimiento del PIB 2,2% cambio anual (2019) Solución.- Sea
  • 87. 87 : X ingreso total de la región. : N tamaño de la población de esa región. : X ingreso medio por habitante de esa región. Ingreso per cápita o ingreso medio por habitante 310    N X N región la de total ingreso $ Luego N X 310  . Para el sector obrero; el ingreso medio por habitante<: $ 0847 , 105 59 , 0 62 59 , 0 ) 310 ( 5 1 59 , 0 5 1     N N N X Xobreros 19) La empresa A tiene 100 empleados; con un sueldo mensual de 2500 soles. La empresa B tiene 200 empleados con un sueldo mensual de 2400 soles. a)Hallar el sueldo promedio mensual de los empleados al juntar las dos empresas. b)Si a las dos empresas se agrega una tercera con 50 empleados con un ingreso promedio mensual de 3000 soles. Hallar el sueldo promedio mensual de los empleados de las tres empresas. 20) En un examen común que rindieron cuatro secciones D C B A ; ; ; con un total de 100 alumnos; habiendo un promedio mensual de 72 puntos. Los puntajes promedios de los grupos C B A ; ; son de 75; 62; y 80 puntos respectivamente. La información sobre el grupo D se perdieron; pero
  • 88. 88 se sabe que los grupos A y B eran el 40% y el 25% del total respectivamente; y que en grupo C habían 15 alumnos más que en grupo D. Hallar la nota promedio del grupo D. Solución.- 15 ; 25 ; 40 72 ; 80 ; 62 ; 75         C D B A B B A n n n n X X X X Luego: 15 ; 25 ; 100 15 25 40        D C c c n n n n 100 ) ( 10 ) 80 ( 25 ) 62 ( 25 ) 75 ( 40 72 D X X      Despejando . 65 puntos X D  21) (RM169) El ingreso medio mensual de 16500 obreros es de 1160 soles y de los 12900 empleados de esta compañía es de 1480 soles. Si los obreros reciben un aumento del 20% sobre sus ingresos más una bonificación de 500 soles por condiciones de trabajo. Los empleados reciben un aumento del 30% más 600 soles por condiciones de trabajo. Hallar el nuevo ingreso promedio de todos los trabajadores de esa gran compañía. 22) (RM173) Se compraron 40 kilos de carne a 20 soles por kilo; 20 kilos de carne a 25 soles por kilo y 20 kilos de carne al 30 soles por kilo de carne. Hallar el peso promedio por kilo de carne. Solución.- El siguiente cuadro muestra la información del problema: i X i n 20 40
  • 89. 89 25 20 30 20 80 Donde: i X : precio por kl. de carne. i n :cantidad de kl. de carne. 75 , 23 80 1900 80 ) 20 ( 30 ) 20 ( 25 ) 40 ( 20      X soles. ----------0---------- 23) Los siguientes datos corresponden al sueldo (en miles de pesos) de 40 trabajadores de una empresa: 119 135 138 144 146 150 156 164 125 135 140 144 147 150 157 165 126 135 140 145 147 152 158 168 128 136 142 145 148 153 161 173 132 138 142 146 149 154 163 176 a) Construya la tabla de frecuencia con todos sus elementos. b) ¿En qué clase se encuentra el mayor número de trabajadores?
  • 90. 90 c)¿Qué porcentaje de trabajadores gana entre $139.000 y $168.000? d)¿Cuántos trabajadores ganan a lo menos $159.000? e)¿Cuántos trabajadores ganan a lo más $148.000? 24) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño. Los siguientes datos corresponden al peso, en kilógramos, de 30 de estas piezas, que poseen las mismas dimensiones, pero distinta aleación. 58 52 50 42 40 50 38 52 50 45 36 45 55 42 42 52 50 45 42 38 42 38 40 46 45 45 55 42 45 40 a)Construir una tabla de frecuencias de amplitud 5 comenzando desde 36. b)¿Cuántos engranajes pesan entre 46 y 55 Kg.? c)¿Qué porcentaje representa a aquellos engranajes cuyo peso es inferior a 51 Kg.? d)¿Cuál es la frecuencia relativa para aquel intervalo cuya marca de clase es 48?
  • 91. 91 e)¿Qué porcentaje representa a aquellas piezas que pesan más de 50 Kg.? 25) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de discos de embrague. Para ello se ha recopilado la siguiente información referente a la duración en horas de 50 de ellos. 285 30 0 28 6 30 2 313 314 28 9 29 2 321 327 29 3 278 28 2 289 30 8 32 6 30 3 287 29 3 32 2 30 4 32 9 285 307 297 30 2 29 4 201 28 5 313 30 8 307 30 4 291 28 8 297 316 32 2 317 30 8 321 324 32 3 316 29 2 28 6 29 9 29 4 32 8 29 6 a) Construir una tabla de frecuencia de amplitud cinco comenzado desde 285. b) ¿Cuántos discos duraron entre 290 y 299 horas? c) ¿Cuántos discos no alcanzaron a durar 300 horas?
  • 92. 92 d) ¿Qué porcentaje representan los discos que duraron entre 310 y 314 horas? e) ¿Qué porcentaje representa los discos que duraron menos de 305 horas? f)¿Cuántos discos duraron más de 309 horas? g) ¿Cuántos discos duraron menos de 305 horas? h) ¿Qué porcentaje representan los discos que duraron entre 285 y 294 horas? i)¿Cuál es el intervalo de mayor frecuencia absoluta? 26) En un conjunto habitacional se pretende hacer un estudio del número de personas que consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional son: 63 69 83 85 93 73 81 94 10 4 12 5 64 13 2 115 12 0 12 7 13 0 10 5 114 12 3 12 1 12 8 90 75 13 7 13 1 73 62 10 0 10 9 117
  • 93. 93 12 4 10 3 13 3 13 8 13 3 11 0 60 91 87 13 6 13 7 13 4 12 9 96 99 72 10 4 97 84 98 a)Construir una tabla de frecuencia de amplitud 10 partiendo desde 60. b)¿Cuántas personan consumen entre 100 y 129 productos enlatados? c)¿Qué porcentaje representa a las personas que consumen menos de 90 productos enlatados? d)¿Qué cantidad de personas consumen más de 80 productos enlatados? 27) Las ganancias por acción de 40 compañías de la industria de la construcción son: 4,6 0,3 1,1 5,7 0,1 1,3 2,5 1,6 1,3 2,1 2,1 1,4 7,3 5,4 3,5 1,9 6,0 0,8 1,9 2,1 3,2 0,2 7,1 2,8 9,6 3,7 5,1 3,6 4,9 2,3 1,8 0,4 4,2 2,1 0,9 3,2 3,7 1,1 0,5 1,9
  • 94. 94 a)Construya una distribución de frecuencias que comience en 0,1 y tenga una amplitud de 2,0. b)¿Cuál es la frecuencia absoluta del tercer intervalo? c)¿Qué porcentaje de las compañías tienen a lo más una ganancia de 6,0? d) ¿Cuántas compañías tienen una ganancia de a lo menos de 4,1? e)Interprete la frecuencia acumulada del segundo intervalo. f) Interprete la frecuencia relativa acumulada del cuarto intervalo. 28) Dada la información referente a la ubicación de personas dentro de cuatro departamentos de una empresa, se pide: a)Tabular la información. b)Realizar gráfico circular. c)Indique frecuencias relativas porcentuales en cada grupo. M A P CC A CC M P P M
  • 95. 95 P CC M A M CC P P M P A P A M M A M A P M M A CC A A M P M M P donde: A = abastecimiento; CC = control de calidad; M = mantención; P = producción. 29) Se realizó un número determinado de compras de materia prima. El volumen de la materia prima viene dado en m3 . Parte de la información se registra en la siguiente tabla: Volumen i x i f i h i F i H Límites reales 6 – 10 1 11 – 15 16 – 20 6 9 21 – 25 18 26 – 30 27 Total 27 a)Complete la tabla dada. b)En un solo gráfico, dibuje un histograma y un polígono de frecuencia. c) ¿Cuántas compras se realizaron entre 11 y 30 m3 ?
  • 96. 96 d)¿Cuántas compras se realizaron entre 16 y 25 m3 ? e)¿Qué porcentaje de compras se realizaron entre 16 y 20 m3 ? f) ¿Cuántas compras se realizaron en total? 30) Los siguientes datos corresponden a la duración, en horas, de 50 válvulas que fueron sometidas a un cierto control: Tiempo i x i f i h i F i H Límites reales 450 – 499 5 500 – 549 4 550 – 599 12 600 – 649 10 650 – 699 15 700 – 749 3 750 - 799 1 Total 50 a)Complete la tabla dada. b)Grafique la ojiva. c) ¿Qué porcentaje de las válvulas duraron, en promedio 674,5 horas?
  • 97. 97 d)¿Qué porcentaje de las válvulas duraron entre 650 y 749 horas? e)¿Cuántas válvulas duraron menos de 550 horas? f) ¿Qué porcentaje de las válvulas duraron más de 649 horas? 31) Se realizaron dos experimentos referentes al peso, en Kg., aplicado sobre una cierta cantidad de tableros. Peso (Kg.) A B 15 – 19 7 3 20 – 24 3 6 25 – 29 2 8 30 – 34 11 8 35 – 39 10 12 40 – 44 7 3 Total 40 40 a)Grafique el histograma del experimenta A. b)Grafique la ojiva porcentual del experimento B.
  • 98. 98 c)Realice, en un mismo gráfico, los polígonos de frecuencia. d)Realice, en un mismo gráfico, las ojivas. 32) Dado el siguiente Polígono de Frecuencias: a)¿Cuáles son los límites reales del cuarto intervalo? b)Interprete la frecuencia del cuarto intervalo. c)Interprete el porcentaje de datos que hay en el quinto intervalo. d)¿Qué porcentaje de pesos es igual o menor que 60,5 Kg.? OJO: FALTA GRÁFICO PÁGINA 27
  • 99. 99 e)¿Cuántos pesos son iguales o mayores que 50,5 Kg.?