,estadística ,muestreo no probabilístico ,muestreo por conveniencia ,muestreo consecutivo ,muestreo por cuotas ,muestreo discrecional ,muestreo de bola de nieve ,cuándo utilizar el muestreo no probabilístico
,estadística ,muestreo no probabilístico ,muestreo por conveniencia ,muestreo consecutivo ,muestreo por cuotas ,muestreo discrecional ,muestreo de bola de nieve ,cuándo utilizar el muestreo no probabilístico
Organización y presentación de datos
-Cuadros y gráficos para variable cualitativa
-Cuadros y graficos para variable cuantitativa discreta
-Cuadros y graficos para variable cuantitativa continua
Analísis y proyecciones del FLujo de CajaJared Palma
Este documento contiene interesantes anotaciones acerca de la elaboración de un flujo de caja, además contiene algunas ejemplos proyectados de acuerdo al método directo e indirecto
Organización y presentación de datos
-Cuadros y gráficos para variable cualitativa
-Cuadros y graficos para variable cuantitativa discreta
-Cuadros y graficos para variable cuantitativa continua
Analísis y proyecciones del FLujo de CajaJared Palma
Este documento contiene interesantes anotaciones acerca de la elaboración de un flujo de caja, además contiene algunas ejemplos proyectados de acuerdo al método directo e indirecto
7.Seleccion de la muestra. Paso 7 de la Investigacion Científica.Edison Coimbra G.
Enunciar los conceptos de muestra y población y describir los procedimientos para calcular y seleccionar los diferentes tipos de muestra en la investigación científica
Una muestra es un subconjunto de casos o individuos de una población. En diversas aplicaciones, interesa que una muestra sea representativa, y para ello debe escogerse una técnica de muestra adecuada que produzca una muestra aleatoria adecuada. También es un subconjunto de la población, y para ser representativa, debe tener las mismas características de la población.
Investigación de Mercados II
Tema: Muestra o Análisis Muestral
Alumno: Rivas Gonzales Alejandro Javier
Docente: Mgr. José Ramiro Zapata Barrientos
Pensamiento: TODO ES EDITABLE. R.Zapata
Procedimiento para la obtención de una muestra, el muestreo como se dijo es el proceso de obtención de la muestra, puede ser probabilístico y no probabilístico.
teoria del curso de señales y sistemas del profesor zavala esquivel de la universidad mayor de san marcos,teoria del curso de señales y sistemas del profesor zavala esquivel de la universidad mayor de san marcos,teoria del curso de señales y sistemas del profesor zavala esquivel de la universidad mayor de san marcos
libro conabilidad financiera, 5ta edicion.pdfMiriamAquino27
LIBRO DE CONTABILIDAD FINANCIERA, ESTE TE AYUDARA PARA EL AVANCE DE TU CARRERA EN LA CONTABILIDAD FINANCIERA.
SI ERES INGENIERO EN GESTION ESTE LIBRO TE AYUDARA A COMPRENDER MEJOR EL FUNCIONAMIENTO DE LA CONTABLIDAD FINANCIERA, EN AREAS ADMINISTRATIVAS ENLA CARREARA DE INGENERIA EN GESTION EMPRESARIAL, ESTE LIBRO FUE UTILIZADO PARA ALUMNOS DE SEGUNDO SEMESTRE
1. 1
CAPÍTULO 1
Conceptos básicos de Estadística Descriptiva
Prof. Mg. Wilfredo Domínguez C.
Prob. y estadística (Ing electrónica)
1) CONCEPTO DE ESTADISTICA
La estadística es una ciencia especializada en el
tratamiento de los datos y utiliza métodos
matemáticos para la recopilación, organización,
presentación, el análisis y toma de decisiones
inferenciales, dichos datos por lo general son
tomados utilizando procedimientos específicos
denominados técnicas de muestreo los que conducen
a tomar una parte pequeña (muestra) de un conjunto
más grande llamado (población).
Las definiciones de estadística son muy numerosas,
muchas de ellas depende del uso que se le dé, por
ejemplo la estadística puede servir para describir los
acontecimientos más importantes de un evento
deportivo.
La estadística también se puede usar para organizar
mejor la información de un colectivo grande, como
por ejemplo la organización de las historias clínicas
de un gran hospital, sin lugar a dudas la estadística
sirve para eso y muchas otras cosas más, pero la
estadística va mucho más allá pues desde el punto de
vista científico es una ciencia que nos permite tomar
decisiones en cuestiones que requieren un sustento
mucho más riguroso, por ejemplo puede ayudar a
2. 2
decidir cuál de dos métodos de enseñanza aplicados a
dos grupos de niños es el más adecuado o puede
decidir que tratamiento es mejor para combatir
determinada enfermedad.
Los cursos de estadística se dictan todas las
especialidades; forma parte de todos los planes de
estudio de todas las carreras profesionales.
2) PALABRAS CLAVES EN ESTADISTICA
Definición 1. (Población) Es un conjunto de seres u
objetos sobre los cuáles necesitamos hacer algún tipo
de estudio, este conjunto grande se representa por .
P
Observe que el término población en estadística es
mucho más general del que usualmente conocemos,
pues no necesariamente la población debe estar
compuesta por personas, sino que también pueden ser
animales de una región de la costa peruana, plantas
de un gran parque, tornillos producidos por una
empresa.
Si el tamaño de la población es finita usualmente esta
se representa por N , el cual es un número entero
positivo y el tamaño de la muestra se representa
universalmente por n, de forma tal que se cumple la
desigualdad N
n .
Una población es un conjunto y luego está formado
por elementos, dichos elementos se denominan
unidades estadísticas, podríamos representar a la
población P como un conjunto es decir: ww
3. 3
N
i u
u
u
u
P ,...,
2
1 ,...,
,
Ejemplo 1. Sea la población compuesta por todos
los peruanos a la fecha, esta población tiene un
aproximado de 33 millones de personas.
Ejemplo 2. Consideremos la población compuesta
por todos lo guacamayos de la Amazonía peruana.
Ejemplo 3. Sea la población compuesta por todos
los tornillos producidos por una gran fábrica durante
un mes específico.
Ejemplo 4. Consideremos la población compuesta
por todos los alumnos de nuestra universidad.
Definición 2. (Muestra) Es una parte representativa
de la población, usualmente su tamaño por n y esta
siempre es finita, en esta parte representativa de la
población recaerá nuestro estudio, la muestra debe
ser representativa de la población, es decir deberá
tener todas las características de la población,
La forma de obtener una muestra representativa de la
población corresponde a una parte de la estadística
denomina da Técnicas de Muestreo. ww
4. 4
Ejemplo 5.
En un gran club deportivo hay numerosos socios;
hay una discusión sobre si seguir como
auspiciador en las camisetas de los jugadores
lleven la marca “PUMA”, o la marca “NIKE”;
para esto se toma al azar del listado de socios
100 de ellos; de estos 100 socios; 70 de ellos
están a favor de la marca “PUMA”; el resto la
otra marca. ww
5. 5
En este caso la población está compuesta por la
totalidad de socios, en este caso su tamaño N es
desconocido; la muestra está compuesta por los
100
n socios encuestados.
Un filántropo ayuda a 1000 niños en su
formación escolar; a fin de año se quiere
organizar una fiesta; como el local donde se va a
realizar este evento tiene una capacidad limitada
para 300 participantes; se toma la decisión de
invitar a los 300 primeros niños con mayor
rendimiento.
En esta situación la población está compuesta
por los 1000
N niños y la muestra está compuesta
por los 300
n niños seleccionados.
Una encuestadora de estudio de mercados quiere
saber que marca de cerveza es la más preferida
en el cercado de Lima, entre dos nuevas marcas
A y B; para esto invita al azar 1000 latas de
cerveza; 500 de la marca A y 500 de marca B; de
los 500 que probaron la marca A; 235 de ellos
dijeron que si les gustaba la marca invitada.
De los 500 que probaron la marca B; 190 se
mostraron a favor.
En este caso la población está compuesta por
todos los habitantes mayores de edad de esa zona
de Lima; su tamaño N es desconocido; la
muestra está compuesta por las 1000
n personas
escogidas.
ww
6. 6
Si el tamaño de muestra es estrictamente menor que
el tamaño de la población estamos haciendo muestreo,
ahora si N
n estamos realizando un censo, la
mayoría de las veces se hace muestreo.
Si siempre se podría hacer un censo obtendríamos
resultados exactos y el papel de la estadística sería
muy limitado; la mayoría de la veces se trabajan con
muestras, por ejemplo la intención de voto hacia
determinada candidatura se hacen con muestras de
tamaño 1500 aproximadamente.
VENTAJAS DEL MUESTREO
Bajo costo.
Información más exacta (mejor calidad) que la
del censo, debido a que el menor número de
encuestadores permite capacitarlos mejor y más
selectivamente.
Es posible introducir métodos científicos
objetivos de medición para corregir errores.
Mayor rapidez en la obtención de resultados.
Técnica más utilizada y que permite obtener
información de casi cualquier tipo de población.
Gran capacidad para estandarizar datos, lo que
permite su tratamiento informático y el análisis
estadístico sobre todo obtener la información de
los encuestados
DESVENTAJAS DE LOS CENSOS
Alto costo (humano y material) dado que exige el
empleo de una gran cantidad de recursos de
personal, financieros y materiales. ww
7. 7
Es necesaria una vasta organización que abarque
todo el universo a investigar, procurando evitar
omisiones y duplicaciones.
Demora en la obtención de resultados.
En algunos casos, la información que se obtiene
puede ser de inferior calidad (mayores errores) a
la que se obtendría si la investigación se realizara
por muestreo.
Obviamente se desea tener métodos científicos para
obtener buenas muestras; uno de los campos de la
estadística llamada TÉNICAS DE MUESTREO o
simplemente MUESTREO enseña como seleccionar
una buena muestra.
Existen varias técnicas de muestreo; la elección de la
técnica depende de la situación y en realidad el
MUESTREO es motivo de un curso separado de la
estadística básica.
Las principales técnicas de muestreo se presentan en
el siguiente diagrama:
Muestreo no probabilístico:
a)A juicio.
El muestreo deliberado, crítico o por juicio, es
una técnica de muestreo no probabilístico en la
que los miembros de la muestra se eligen sólo
sobre la base del conocimiento y el juicio del
investigador.
ww
8. 8
b)Por conveniencia.
El muestreo por conveniencia es una técnica de
muestreo no probabilístico y no aleatorio
utilizada para crear muestras de acuerdo a la
facilidad de acceso.
Consiste en tomar un segmento o fracción de la
población por su cómoda accesibilidad. Por
ejemplo, una muestra obtenida de listas
fácilmente disponibles, como las guías de
teléfonos, constituyen una muestra deliberada.
Por la comodidad o facilidad en tomar la muestra
se sacrifica cierto grado de representatividad de
las características disponibles; sin embargo, este
tipo de muestreo puede ser de alguna utilidad
para estudios pilotos o de sondeo.
ww
10. 10
El muestreo aleatorio simple es una técnica de
muestreo en la que todos los elementos que
forman el universo - y que por lo tanto están
incluídos en el marco muestral - tienen idéntica
probabilidad de ser seleccionados para la
muestra. ... Un individuo solo puede aparecer una
única vez en una muestra.
b)Estratificado.
En un muestreo aleatorio estratificado se divide la
población en clases o estratos y se escoge,
aleatoriamente, un número de individuos de cada
estrato proporcional al número de componentes de
cada estrato.
Ejemplo ww
11. 11
En una fábrica que consta de 600 trabajadores
queremos tomar una muestra de 20. Sabemos que
hay 200 trabajadores en la sección A, 150 en la B,
150 en la C y 100 en la D.
c)Sistemático.
El muestreo sistemático es un tipo de muestreo
probabilístico donde se hace una selección aleatoria
del primer elemento para la muestra, y luego se
seleccionan los elementos posteriores utilizando
intervalos fijos o sistemáticos hasta alcanzar el
tamaño de la muestra deseado.
w
12. 12
d)Por conglomerados.
En estadística, el muestreo por conglomerados es una
técnica de muestreo utilizada cuando hay
agrupamientos «naturales» relativamente
homogéneos en una población estadística.1
A menudo se utiliza en la investigación de mercados.
En esta técnica, la población total se divide en estos
grupos (o clusters) y una muestra aleatoria simple se
selecciona de los grupos.
A continuación, la información requerida se obtiene
de una muestra aleatoria simple de los elementos
dentro de cada grupo seleccionado y una submuestra
de elementos se puede seleccionar dentro de cada uno
de estos grupos. Una motivación común para el
muestreo por conglomerados es reducir el número
total de entrevistas, y sus costes, dada la precisión
deseada. Suponiendo un tamaño de muestra fijo, la
técnica ofrece resultados más precisos cuando la
mayoría de la variación en la población es dentro de
los grupos y no entre ellos.
ww
13. 13
e)Muestreo por cuotas
Es la técnica más difundida sobre todo en estudios de
mercado y sondeos de opinión.
En primer lugar es necesario dividir la población de
referencia en varios estratos definidos por algunas
variables de distribución conocida (como el género o
la edad). Posteriormente se calcula el peso
proporcional de cada estrato, es decir, la parte
proporcional de población que representan.
Finalmente se multiplica cada peso por el tamaño de
n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado
en que una vez determinada la cuota, el investigador
es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
En estadística, las muestras pueden clasificarse
según su tamaño en dos tipos:
ww
14. 14
a)Si 30
n se denominan “muestras grandes”.
b)Si 30
n de denominan “muestras pequeñas”.
w
Definición 3. (Variable) Es la característica de
interés que se observa en cada unidad estadística o
unidad elemental , y como esta cambia de unidad a
unidad suele llamarse variable y por lo general se
representa por letras mayúsculas como X , es decir
en cada P
ui se observa un valor i
X .
Donde a cada P
ui se le asigna un i
X ; es decir
N
i
X
u i
i ;....
2
;
1
;
Con referencia al Ejemplo 1, muchas cosas se pueden
observar en cada peruano, es decir cada peruano
constituye una unidad estadística, por ejemplo se
podría estar interesado en observar la edad, el peso, la
condición socioeconómica, su nivel educacional y
otras cosas más.
Si sólo estudiamos una sola variable estamos
haciendo estadística unidimensional o de una
variable.
La observación en cada unidad estadística puede
arrojar un número (variable numérica o cuantitativa)
o puede proporcionar una cualidad (variable
cualitativa).
Siempre que se observa una característica en cada
unidad estadística esta puede resultar un número o
una cualidad, la estadística puede trabajar con ambos
tipos de variables desde su aspecto elemental
descriptivo o hacer análisis estadístico avanzado.
ww
15. 15
3) CLASIFICACIÓN DE LAS VARIABLES
Las variables se pueden clasificar en dos grandes
grupos: cuantitativas o numéricas (grupo A) o
cualitativas (grupo B), es decir:
A: Variables cuantitativas- Son aquellas que resultan
ser un número y provienen del conteo o de
mediciones, estas a su vez se pueden clasificar en dos
sub grupos: w
A1: Variables cuantitativas discretas.- Son aquellas
que solamente pueden tomar valores enteros positivos
o cero, es decir pueden ser 0, 1, 2, 3, …….
Este tipo de variables por lo general provienen de
contar y cuando se cuenta algo o es un entero positivo
o es cero.
Ejemplo 6. Son ejemplos de este tipo de variables
las siguientes:
1) Número de hijos por familia
2) Número de televisores por familia
3) Número de computadoras defectuosas por
laboratorio.
4) Número de cursos matriculados por alumno.
5) Número de dormitorios por familia.
6) Número alumnos por aula.
7) Número visitas al médico por año de pacientes de
la tercera edad al seguro social.
8) Número de latidos del corazón por minuto.
Ejercicio 1.- Dar ocho ejemplos adicionales de
variables cuantitativas discretas ww
16. 16
A2: Variables cuantitativas continuas.- Son aquellas
que pueden tomar todos los valores posibles en un
intervalo dado, incluso valores fraccionarios e incluso
negativos.
Este tipo de variables provienen de medir, y cuando se
mide algo no necesariamente resulta un entero
positivo o cero; e incluso puede ser negativo como lo
es la temperatura medioambiente.
Ejemplo 7. Presentamos algunos ejemplos de este
tipo de variables:
1) Estatura de personas en metros.
2) Peso de la personas en kilos.
3) Perímetro craneal de recién nacidos.
4) Temperatura ambiental en grados
centígrados. w
5) Edad de las personas.
6) Nivel de glucosa en la sangre.
7) Calificación de estudiantes en escala
vigesimal.
8) Altura en metros sobre el nivel del mar las
ciudades de la costa peruana.
Ejercicio 2.- Dar ocho ejemplos adicionales sobre
variables cuantitativas continuas.
B: Variables cualitativas.- Como su nombre lo indica
son variables en los cuales se observan una cualidad.
Ejemplo 8. Son ejemplos de este tipo de variables:
ww
17. 17
1) El nivel educacional de los peruanos
2) La jerarquía institucional.
3) La clase social a la que se pertenece.
4) El color de los ojos.
5) La creencia religiosa.
6) La preferencia electoral.
7) El tipo de sangre de las personas.
Las variables cualitativas se pueden clasificar en
dos tipos: cualitativas ordinales y cualitativas
nominales.
B1: VARIABLES CUALITATIVAS ORDINALES.-
Son aquellas variables cualitativas en los que se puede
establecer algún tipo de ordenamiento entre ellas, por
ejemplo de mayor a menor o de menor a mayor.
Ejemplo 9. En las universidades existe la jerarquía
institucional; primero el rector de la universidad;
luego están los vicerrectores a continuación los
decanos y luego los directores de escuela y así
sucesivamente. Observe que existe una ordenación de
mayor a menor.
Ejemplo 10. Otro ejemplo clásico es el nivel
educacional de las personas; este nivel puede ser
ordenado en analfabetos (no saben leer ni escribir;
luego las personas que tienen educación primaria
(saben leer y escribir); a continuación las personas
que tienen educación secundaria; posteriormente las
personas con estudios universitaria y así
18. 18
sucesivamente. Observe que implícitamente un
ordenamiento de menor a mayor.
B1: VARIABLES CUALITATIVAS NOMINALES.-
Son aquellas variables en los que no se puede
establecer ningún tipo de ordenamiento entre ellas; se
darán algunos ejemplos de este tipo de variables
cualitativas nominales.
Ejemplo 11. El color de cabello de las personas; el
sexo de las personas; el tipo de sangre; el lugar de
nacimiento
4) PARÁMETROS POBLACIONALES
Definición 4. (Parámetro) Los parámetros son
cantidades fijas, que existen y que teóricamente se
pueden conocer si se trabajasen con todos los
elementos (unidades poblacionales) que constituyen
la población. Los parámetros más usados en
estadística son:
La media poblacional, la cuál se representa por
la letra griega (mu); asociada a variables
cuantitativas.
La varianza poblacional, usualmente
representada por 2
(sigma cuadrado); asociado
a variables cuantitativas
ww
19. 19
La desviación estándar poblacional: ; asociado
a variables cuantitativas.
La proporción poblacional p. Asociada a
variables cualitativas. (ojo cualitativas)
La media poblacional , la varianza poblacional 2
y
la desviación estándar poblacional están asociadas a
variables cuantitativas (numéricas).
La proporción poblacional pestá asociada más bien a
variables de tipo cualitativo (cualidades).
Ejemplo 12. Consideremos una población hipotética
compuesta por 10
N estudiantes universitarios; la
variable de interés es la edad en años cumplidos; esta
población es dada por la siguiente data:
18 19 21 17 20 18 19 22 21 18
Existe la media poblacional y se puede calcular
sumando las 10 edades y dividiendo en 10
N ; es decir:
años
X
N
i
i
3
,
19
10
193
10
18
...
19
18
10
10
1
Supongamos que etiquetamos las 10 edades con los
números 1; 2; 3;….10; en 10 papelitos enumeramos 1;
2;…;10.
Los 10 papelitos se ponen en una caja; una niña con
los ojos vendados selecciona 3 boletos juntos;
resultando como integrantes de la muestra a 17; 19; y
20; el tamaño de la muestra es 3
n
Lo que se ha hecho es muestreo aleatorio simple; el
cual es un muestreo probabilístico.
Con estos tres datos se puede calcular la media
muestral; es decir 6666
,
18
3
56
3
20
19
17
1
X . ww
20. 20
Supongamos que la niñita devuelve a la caja los tres
boletos; teniendo nuevamente 10
N números. Vuelve a
sacar 3 papelitos; esta vez resulta en la muestra 19;
18; 21 la media muestral es años
X 3333
,
19
3
58
3
21
18
19
2
En total se tienen 120
!
7
!
3
!
10
3
10
muestras posibles.
Naturalmente en un estudio sólo se trabaja con una
muestra.
Siempre que se trabaja con muestras inevitablemente
esta sujetos a cometer error al querer estimar
(parámetro).
Supongamos que trabajamos con la primera muestra
que arrojó una media muestra años
X 6666
,
18
1 ; la
verdadera media o verdadero valor es años
3
,
19
.
El Error de muestreo se define X
E
ˆ ; donde ̂
se lee mu estimado )
:
( mu
griega
letra
; en este caso:
6334
,
0
666
,
18
3
,
19
ˆ
X
E
Ejemplo 13. Imaginemos la población de todos los
peruanos a la fecha y que la variable de interés sea la
edad medida en años, de hecho existe la media
poblacional , o sea la edad promedio de todos los
peruanos a la fecha, para esto tendríamos que sumar
la edades de todos peruanos a la fecha y dividir toda
esto entre aproximadamente entre 33 millones.
Esta tarea en la práctica es realmente imposible, pues
la base de datos actualizada conteniendo la edad de
todos lo peruanos a la fecha no existe, pero si tengo la
certeza de que esa edad promedio en verdad existe,
pero que es imposible conocerla con exactitud,
teóricamente se tendría que calcular: ww
21. 21
millones
X
millones
peruanos
los
todos
de
edades
de
Suma
i
33
33
Si bien es cierto que esta cantidad no la puedo
conocer con exactitud, si es posible estimarla
(aproximarla) usando muestras.
w
Esta estimación puede ser puntualmente (darle un
valor explícito) o también se puede estimarla por
intervalos, es decir poner ese valor entre dos
valores determinados, en otras palabras se puede
construir un intervalo de confianza para de la
forma:
.
.
.
. S
L
I
L
, donde .
.I
L es el límite inferior del
intervalo y .
.S
L es el límite superior del intervalo de
confianza.
Ejemplo 14. Supongamos que se va a realizar un
referéndum para aprobar o desaprobar o aprobar una
reforma constitucional y que la población de votantes
es de 20 millones de personas, aprobar o desaprobar
el referéndum es una cualidad.
Por comodidad supongamos sólo dos posibilidades:
aprobar (si) o desaprobar (no). Antes de efectuar el
referéndum nadie puede saber con exactitud la
proporción de votantes a favor del (si), o sea existe la
proporción de votantes a favor de la modificación
constitucional, el cual teóricamente se puede obtener
así:
)
20
( millones
electores
de
Total
si
del
favor
a
electores
de
número
p ww
22. 22
Esta cantidad se que existe, pero es desconocida, pero
se puede estimar puntualmente y también por
intervalos, la estimación puede hacerse en base a una
muestra de tamaño n, por ejemplo 1500 o 3000
votantes elegidos al azar, esto mediante alguna
técnica de muestreo y a nivel nacional, obviamente
1
0
p , el cual multiplicada por 100 queda expresada
en porcentaje, es decir %
100
100
%
0
si
p .
Las encuestadoras de opinión pública presentan
frecuentemente intervalos de confianza basados en
muestras, hablan de margen de error y un nivel de
confianza.
Si bien es cierto p no se conoce si se puede estimar
puntualmente mediante p̂ , el cual se lee como si
p
estimado, esto es posible si por ejemplo la muestra de
tamaño 1500
n , si de estos votantes 800 se inclinan a
favor del si se tendría:
5333
,
0
1500
800
p
Equivalentemente en % se puede decir que un
53,33% se inclina a favor del si.
En general la proporción muestral es:
n
tica
caracterís
cierta
con
objetos
u
personas
de
nro
estimado
p
p
.
)
(
5) CONSTRUCCION DE CUADROS DE
DISTRIBUCIÓN DE FRECUENCIAS: CASO
DISCRETO
ww
23. 23
Si se tiene una data n
X
X
X ;...;
; 2
1 proveniente de una
variable discreta lo más probable es que existan datos
repetidos, es mejor contar cuantas veces se repite un
valor particular, y luego presentarlos en un cuadro de
distribución de frecuencias; en el siguiente ejemplo se
presenta la metodología.
Ejemplo 15. En nuestra universidad existen
numerosos laboratorios de cómputo; inevitablemente
en cada laboratorio existen computadoras
defectuosas. Se tomó una muestra de laboratorios y se
contó el número de computadoras defectuosas por
laboratorio en n=25 laboratorios (variable discreta) ,
resultando:
0
.
1
.
2
.
1
.
3
.
2
.
2
.
3
.
3
.
4
.
1
.
2
.
2
.
3
.
4
.
2
.
3
.
0
.
2
.
1
.
2
.
3
.
4
.
5
.
1
.
w
Los datos se organizaran de menor a mayor, contando
las veces que se repiten cada uno.
i
X
0: 0 0 2
1
f
1: 1 1 1 1 1 5
2
f
2: 2 2 2 2 2 2 2 2 8
3
f
3: 3 3 3 3 3 3 6
4
f
4: 4 4 4 3
5
f
5: 5 1
6
f
El esquema anterior puede ser puesto verticalmente y
esto nos dará una idea de la forma de la distribución
de los datos: ww
24. 24
f1=2 f2=5 f3=8 f4=6 f5=3 .f6=1
x
x
x x
x x x
x x x
x x x x
x x x x x
x x x x x x
Xi 0 1 2 3 4 5
Luego se procede a la construcción de un cuadro de
distribución de frecuencias, teniendo en cuenta lo
siguiente:
6
k ; seis valores distintos de la variable en la
muestra de tamaño 25
n
i
f : frecuencia absoluta; i
h : frecuencia relativa
:
i
F Frecuencia Absoluta Acumulada i
H : Frecuencia Relativa
Acumulada
i
X
i
f i
h i
F i
H
0 2
1
f 08
,
0
25
2
1
h
2
1
F 08
,
0
1
H
1 5
2
f 20
,
0
25
5
2
h 7
5
2
2
F 28
,
0
20
,
0
08
,
0
2
H
2 8
3
f 32
,
0
25
8
3
h
15
8
7
3
F 60
,
0
32
,
0
28
,
0
3
H
3 6
4
f 24
,
0
25
6
4
h
21
6
15
4
F 84
,
0
24
,
0
60
,
0
4
H
4 3
5
f 12
,
0
25
3
5
h 24
3
21
5
F 96
,
0
12
,
0
84
,
0
5
H
5 1
6
f 04
,
0
25
1
6
h
25
1
24
6
n
F 1
04
,
0
96
,
0
6
H 1
Tot
al
25
n 1
25. 25
Interpretación:
6
4
f ; seis laboratorios tienen 3 computadoras
defectuosas.
:
%
024
)
25
6
(
100
100 4
h El 24% de los laboratorios tienen
3 computadoras defectuosas.
21
6
15
4
F : 21 laboratorios tienen 3 o menos
computadoras defectuosas.
%
84
)
84
,
0
(
100
4
H : el 84% de los laboratorios tienen 3 o
menos computadoras defectuosas.
w
Ejercicio 1.- Usando los datos del Ejemplo anterior;
pero añadiendo a la data original los siguientes 11
datos:
2 4 6 1 6 2 3 2 2 3 2
Se pide rehacer lo realizado en el mencionado
Ejemplo; pero ahora 36
11
25
n
6) CUADRO GENERAL DE DISTRIBUCIÓN
DE FRECUENCIAS Y PROPIEDADES.
En general para construir un cuadro de distribución
de frecuencias para caso discreto se debe tener la data
con un tamaño de muestra n y sin tabular (o datos en
bruto) de la forma: n
X
X
X ;...;
; 2
Se hace el conteo para obtener las frecuencias
absolutas k
i
fi ;...,
2
;
1
: ; donde k es el número distintos
26. 26
de la variable; obviamente n
k . El cuadro toma la
forma:
i
X i
f i
h i
F i
H
1
X 1
f
n
f
h 1
1 1
1 f
F 1
1 h
H
2
X 2
f
n
f
h 2
2 2
1
2 f
f
F
2
1
2 h
H
H
… … … ….
i
X i
f
n
f
h i
4
i
i
i f
F
F
1 i
i
i h
H
H
1
… … … …
k
X k
f
n
f
h k
k
n
f
F
F k
k
k
1 1
1
k
k
k h
H
H
Total n 1
En general se cumplen las siguientes propiedades:
1) n
f
k
i
i
1
2) 1
1
k
i
i
h
3) n
Fk
4) 1
k
H
5) n
F
F
F
F
F
f k
i
i
...
... 1
2
1
1
6) 1
...
... 1
2
1
1
k
i
i H
H
H
H
H
h
7) i
i
i
i
i f
f
f
f
f
F
F
)
...
( 1
2
1
1
8) i
i
i
i
i
i h
H
h
h
h
h
h
h
h
H
1
1
2
1
2
1 )
...
(
...
9)
n
F
H i
i ; i
i H
n
F
10) i
i
i f
F
F
1
11) i
i
i h
H
H
1
7) |CONSTRUCCION DE CUADROS DE
DISTRIBUCIÓN DE FRECUENCIAS: CASO
CONTINUO ww
27. 27
Este procedimiento es recomendable solamente
cuando se tienen por lo menos un tamaño de muestra
mayor o igual 25 o mejor aún tener una muestra de
tamaño grande; es decir un 30
n (muestras grandes)
La metodología se presentará con un ejemplo práctico
dado a continuación.
Ejemplo 16. Los siguientes datos corresponden a las
notas finales (n=26 alumnos) en un curso de
especialidad, las notas son dados con decimales y en
una escala vigesimal:
14,6 13,8 11,8 12,0 14,1
09,7 15,9 15,8 17,0 12,7
16,5 14,8 09,3 13,0 12,6
13,8 10,0 11,6 08,0 11,6
18,0 12,7 12,8 10,5 13,6
10,5
Paso 1.- Se halla el valor máximo (Xmax) y el valor
mínimo de la muestra (Xmin),
Se calcula el Recorrido muestral ,dado por:
min
max X
X
R
En nuestro caso:
10
8
18
;
8
;
18
min
max
min
max
X
X
R
X
X
w
Paso 2.- Se determina el número de intervalos de
clases k; obviamente k es un entero positivo; a
trabajar; como ejemplo tomemos 5
k .
Observación.-
La elección del número de intervalos es controversial,
ninguna elección se puede decir que es mejor que la
otra u otras.
28. 28
Existen tres criterios para la elección del número de
intervalos de clase; los cuales son:
1) Tomar un k moderado entre 5 y 15; es decir
15
5
k ; nosotros hemos elegido k=5 como
ejemplo.
2) Otro criterio es tomar próximo a la raíz
cuadrada de n; es decir 0990
,
5
26
n
k
3) Otro criterio es el de Sturges; el cual dice
tomar k como el valor más próximo a
1+3,3log(n); donde log es el logaritmo en base
10; es decir:
)
log(
3
,
3
1 n
n
En nuestro caso
6691
,
5
)
4149
,
1
(
3
,
3
1
)
26
log(
3
,
3
1
)
26
log(
3
,
3
1
n
Paso 3.- Se calcula la amplitud de los intervalos de
clase (c) definida como
k
R
c .
En nuestro caso
2
5
10
k
R
c
Paso 3.- Cada intervalo de clase tendrá amplitud
constante igual a c=2 y se crean los k=5 intervalos de
clase; desde el Xmin se va sumando la amplitud c; de la
siguiente forma:
[8; 10>; [10; 12>; [12; 14>; [14; 16>; [16; 18]
Observe la forma de los intervalos de clase; los cuatro
primeros son cerrados en límite inferior (incluye) y
abierto en el límite superior (excluye); excepto el
último el cual es cerrado en ambos extremos.
29. 29
ww
Paso 4.- Cada una de las observaciones es colocada en
cada uno de los intervalos
[ 8; 10> : 09,7 09,3 08,0 f1=3
[10; 12> :11,6 10,0 11,6 11,6 10,5 10,5 f2=6
[12; 14> :13,8 12,0 12,7 13,0 12,6 13,8 12,7 12,8 13,6 f3=9
[14; 16>: 14,6 14,1 15,9 15,8 14,8 f4=5
[16; 18] : 17,0 16,5 18,0 f5=3
Paso 5.- Se hallan las marcas de clase )
( i
X que
simplemente es el punto medio de los intervalos de
clase; decir si el intervalo de clase es
*
*
1
[ i
i X
X ;
entonces k
i
X
X
X i
i
i ;...;
2
;
1
;
2
*
*
1
Luego se crea el cuadro de distribución de
frecuencias el cual es similar al caso discreto:
Intervalos i
X i
f i
h i
F i
H i
i X
f 2
i
i X
f
[8; 10> 9 3 0,1153 3 0,1153 27 243
[10; 12> 11 6 0,2307 9 0,3460 66 726
[12; 14> 13 9 0,3461 18 0,6921 117 1521
[14; 16> 15 5 0,1923 23 0,8844 75 1125
[16; 18] 17 3 0,1153 26 0,9997 51 867
Totales n=26 1
9997
,
0 336 4482
Interpretación:
f3: 9 estudiantes tienen notas entre 12 y 14 puntos
X3=13; la nota trece es la nota “representativa” de los
estudiantes que han obtenido notas entre 12 y 14.
ww
100h3=34,64%: el 34,64% de los estudiantes tienen
notas entre 12 y 14.
30. 30
F3=18: Dieciocho estudiantes tienen notas entre 8 y
14 puntos
100H3=69,21%: el 69,21% de los estudiantes tienen
notas entre 8 y 14
Un gráfico de la distribución de frecuencias absolutas
usando el SPSS; muestra lo siguiente:
Un gráfico de barra es proporcionado a continuación:
31. 31
Ejercicio 2.- Con la data del Ejemplo anterior; pero
agregando cuatro datos adicionales: 10,9 13,4 17,1
12,3
Se pide rehacer el Ejemplo anterior con todos sus
pasos; recuerde que ahora Ud. tiene n=30 datos.
Ejercicio 3.- Con los datos de Ejercicio anterior,
donde n=30 tomar k=6 intervalos de clase y
reconstruir el cuadro como se hizo en el Ejemplo 13,
considerando los 5 pasos; tenga presente que tendrá
que hacer nuevamente el conteo.
Sugerencia: En este caso la amplitud de los intervalos
de clase es: 6666
,
1
6
10
6
8
18
k
R
c ; observe que la
división no es exacta como en el ejemplo anterior.
En estos casos se recomienda tomar la amplitud c con
un decimal más de los que tiene la data original, el
cual tiene un decimal; tomo la amplitud c con un
decimal más; es decir elijo c=1,66 (amplitud
constante de cada intervalo). Con estos los seis
intervalos de clase son:
[8 9,66> [9,66 11,32> [11,32 12,98>
[12,98 14,64> [14,64 16,3> [16,3 17,96]
Observe que el último intervalo no incluye a la nota
18, la medida conveniente es ampliar un poco más,
para considerar el último intervalo como [16,3 18];
cuya amplitud es de 1,7; el cual es ligeramente mayor
que los cinco primeros intervalos. Con esto los k=6
intervalos a trabajar son:
[8 9,66> [9,66 11,32> [11,32 12,98> ww
32. 32
[12,98 14,64> [14,64 16,3> [16,3 18,0]
Ejemplo 17. Ejemplo.- Del archivo que contiene las
historias clínicas de los pacientes con problemas de
visión de un hospital de la capital; se tomó una
muestra de tamaño n=50, y se consideró la estatura de
ellos (en metros), resultando:
1,65 1,43 1,88 1,59 1,35 1,76 1,22 1,45 1,62 1,41
1,36 1,78 1,50 1,48 1,62 1,60 1,35 1,53 1,65 1,74
1,49 1,37 1,60 1,76 1,52 1,48 1,61 1,34 1,55 1,82
1,84 1,40 1,56 1,74 1,63 1,55 1,45 1,67 1,61 1,58
1,79 1,68 1,57 1,70 1,32 1,51 1,33 1,42 1,73 1,26
Los pasos a seguir para construir una distribución de
frecuencias en el caso continuo son:
1) Se calcula el rango R, el cual es definido como la
diferencia entre el mayor valor de la variable X )
( max
x
y el menor valor de X )
( min
x ; es decir:
min
max x
x
R
En nuestro caso tenemos:
88
,
1
max
x
22
,
1
min
x
es decir, R=1,88-1,22=0,66
2) El investigador fija el número de intervalos de clase
con que se trabajará, se recomienda un número de
intervalos de clase comprendido entre 5 y 15 como
máximo. El número de intervalos de clase se
representa por k.
Por ejemplo en nuestro caso fijemos ejemplo k=6
intervalos de clase
3) Se halla la longitud c de los intervalos de clase, para
esto hallamos el cociente:
k
R
c
33. 33
Como en nuestro caso como hemos establecido que el
número de intervalos de clase es k=6 y R=0,66,
entonces la amplitud de cada intervalo de clase es:
11
,
0
6
66
,
0
c
4) Luego se determina los límites de cada intervalo de
clase, para esto se busca el menor valor de la
variable X , es decir el )
( min
x , se le suma c=0,11 y se
obtiene el límite superior del primer intervalo de
clase y así sucesivamente.
Para nuestro caso min
x =1,22, el cual es el límite inferior
del primer intervalo de clase, se le suma 0,11
resultando 1,22+0,11=1,33, el cual es el límite superior
del primer intervalo de clase, a continuación el límite
inferior del segundo intervalo de clase es 1,33, le
sumamos otra vez 0,11 resultando el límite superior del
segundo intervalo de clase, resumiendo:
1,22-1,33 primer intervalo de clase
1,33-1,44 segundo intervalo de clase
1,44-1,55 tercer intervalo de clase
1,55-1,66 cuarto intervalo de clase
1,66-1,77 quinto intervalo de clase
1,77-1,88 sexto intervalo de clase.
5) Determinamos la marca de clase de cada intervalo de
clase, el cual es el punto medio de cada intervalo,
para esto sumamos el límite inferior y superior de
cada intervalo de clase y lo dividimos entre dos,
resultando el punto medio de cada intervalo de
clase.
Para el ejemplo dado tenemos:
Intervalos
de clase
Marca de
clase
34. 34
,
1
1
,
i
i x
x
)
2
(
,
,
1 i
i
i
x
x
x
[1.22-1,33> 1,275
[1,33-1,44> 1,385
[1,44-1,55> 1,495
[1,55-166> 1,605
[1,66-1,77> 1,715
[1,77-1.88] 1,825
6) Se realiza el proceso de conteo, es decir se obtiene
el número de valores de la variable X que pertenece
a cada intervalo.
En nuestro caso, se tiene:
Intervalos
de clase
Marca de
clase
Frecuencia
absoluta
i
f
1,22-1,33 1,275 ///=3
1,33-1,44 1,385 //////////=10
1,44-1,55 1,495 /////////=9
1,55-1,66 1,605 ///////////////=15
1,66-1,77 1,715 ////////=8
1,77-1,88 1,825 /////=5
A partir de este momento se trabaja igual que el caso
discreto, es decir se agregan las tres columnas
correspondientes a las frecuencias relativas,
frecuencias absolutas acumuladas y finalmente las
frecuencias relativas acumuladas.
A continuación presentamos el cuadro de distribución
de frecuencias respectivo, es importante recordar que
las interpretaciones son vitales para cualquier estudio
de tipo descriptivo.
35. 35
Intervalos
de clase
,
,
1 i
i x
x
Marca de
clase
i
x
Frecuencia
absoluta
i
f
Frecuencia
relativa
i
h
Frecuencia
absoluta
acumulada
i
F
Frecuencia
relativa
acumulada
i
H
[ 1.22-1,33> 1,275 3 3/50 = 0,06 3 0.06
[1,33-1,44> 1,385 10 10/50 = 0,2 13 0,26
[1,44-1,55> 1,495 9 9/50 = 0,18 22 0,44
[1,55-1,66> 1,605 15 15/50 = 0,30 37 0,74
[1,66-1,77> 1,715 8 8/50 = 0,16 45 0,9
[1,77-1,88] 1,825 5 5/50 = 0,1 50 1
n = 50 1
Interpretación.-
10
2
f ; significa que existen 10 pacientes cuyas tallas
están comprendidas entre 1,33 y 1,44 mts.
18
,
0
3
h ; significa que el 18% de los pacientes tienen una
talla comprendida entre 1,44 y .1,55 mts.
37
4
F ; significa que existen 37 pacientes cuyas tallas
están comprendidas entre 1,22 y 1,66 mts.
5
H ;significa que el 90% de los pacientes tienen una
estatura comprendida entre 1,22 y 1,77 mts.
Ejercicio 1.- Con los mismos datos del ejemplo
anterior, pero con k=5, hacer el cuadro de distribución
de frecuencias; interpretar algunos valores; hacer sus
respectivos gráficos.
Observaciones:
a) El tomar como criterio la elección del número de
intervalos k entre 5 y 15 es solamente una
alternativa; otras formas que también se usan son
las siguientes:
Elegir K de forma tal que K= n ; donde k es el
entero más próximo a la raíz cuadrada del
36. 36
tamaño de la muestra, en nuestro caso
K= 50 7,07, en cuyo caso se puede tomar k=7
por ser el entero más próximo a 7,07
Existe también una fórmula para determinar el
número de intervalos, denominada Fórmula de
Sturges; dada por:
)
log(
22
,
3
1 n
K
Donde log(10) es el logaritmo de n en base 10.
En nuestro caso se tiene
K=1+3,22 log(50)=1+3,22(1,6989)=6,476
b) Las dos últimas propuestas para la elección del
número de intervalos K son alternativas viables a la
que hemos usado para la construcción de la tabla de
frecuencias con las n=50 estaturas. En todo caso no
hay que olvidar que siempre que se haga intervalos
de clase implicará cierta pérdida de información;
pues todos los valores en un intervalo de clase
pasan a ser representados por la marca de clase
respectiva.
c) Para construir intervalos de clase se recomienda
tener un tamaño de muestra grande, es decir 30
n ;
en caso contrario sería mejor trabajar los datos
continuos como si fueran datos discretos.
d) Si bien es cierto que existe pérdida de información
en la construcción de los intervalos de clase;
también es cierto que se gana otras cosas; como por
ejemplo cuando se dibuja el histograma esta revela
algunas cosas importantes como simetría o
asimetría de la curva; en que intervalo está el mayor
número de observaciones (moda).
37. 37
8) DISTRIBUCIÓN DE FRECUENCIAS CASO
CUALITATIVO.
En este caso no se hace distinción entre las variables
cualitativas ordinales y las cualitativas nominales; en
ambos casos se trabaja igual.
Se mostrará un ejemplo concreto para ver la
metodología.
Ejemplo 18. En una universidad existen alumnos de
diversas regiones: Costa (1); Sierra (2) y Selva (3).
Una muestra aleatoria proporcionó el siguiente
resultado:
2 1 1 2 1 1 3 1 2 3 2 1 1 1 1 3 3 2 1 2 2 1 1 1
Luego el tamaño de la muestra es 24
n ; se puede
construir un de distribución de frecuencias absolutas
y de frecuencias relativas de la siguiente manera:
i
X i
f i
h
1
C 13 5416
,
0
24
/
13
2
SI 7 2916
,
0
24
/
7
3
Se 4 1666
,
0
24
/
4
24
n 1
9998
,
0
Se interpreta así:
7
2
f : siete estudiantes son de la sierra.
16
,
29
100 2
h : el 29,16% de los estudiantes son de la
sierra.
Existen varias formas de representar gráficamente
esta distribución de frecuencias; destacan los
gráficos: ww
39. 39
Gráficos de cilindros
w
Gráficos combinados
Pictogramas
ww
40. 40
Ejemplo 19. Hacer un diagrama circular y diagrama
de barras para la data de ejemplo anterior
Solución.-
El cuadro de distribución de frecuencias es: ww
i
X i
f i
h
1
C 13 5416
,
0
24
/
13
2
SI 7 2916
,
0
24
/
7
3
Se 4 1666
,
0
24
/
4
24
n 1
9998
,
0
41. 41
X Frecuencia Porcentaje
Válidos
1,00 13 54,2
2,00 7 29,2
3,00 4 16,7
Total 24 100,0
w
ww
9) MEDIDAS DE TENDENCIA CENTRAL O
POSICIÓN O TAMBIÉN LLAMADOS
PROMEDIOS.(VARIABLES CUANTITATIVA)
Si bien es cierto existen varias medidas de tendencia
central, nos dedicaremos en primer lugar a la más
importante de todas; conocida como media muestral o
42. 42
simplemente media o promedio, esta medida
usualmente se representa por X o
X
M .
w
La media muestral es sin lugar a duda la más usada y
conocida de todas las medidas de tendencia central,
aparte están también otras medidas de tendencia
central por mencionar alguna de ellas e incluida la
media muestral (o simplemente media o promedio
son:
a) Media muestral o media aritmética: ]
[X
M
X
b) Moda: d
M
c) Mediana: e
M
d) Cuartiles : 3
2
1 ;
; Q
Me
Q
Q
e) Deciles: 9
2
1 ;...;
; D
D
D
f) Centiles : 99
2
1 ;...;
; C
C
C
g) Media geométrica: g
M
h) Media armónica: h
M
ww
a)La ]
[X
M
X es una medida resumen de la muestra más
importante y la más usada para los datos muestrales
provenientes de variables cuantitativas y es dado por:
n
muestrales
datos
Suma
X
43. 43
Usualmente para su cálculo se presentan tres casos:
Caso 1.- (datos sin tabular) Si los datos están sin
tabular, es decir los datos están en bruto, sin ningún
tipo de ordenamiento o tratamiento y se presentan de
la siguiente manera: n
X
X
X ,...,
, 2
1 donde n es el tamaño
de la muestra, en este caso se tiene:
n
X
X
M
X
n
i
i
1
Ejemplo 20. Los siguientes datos corresponden a las
edades (años) de un grupo de alumnos tomados al
azar del registro de matrícula, los cuales resultaron
ser:
22, 24, 25, 20, 23, 23, 24, 26
En este caso 8
n (tamaño de la muestra), luego:
años
X
X
375
,
23
8
187
8
26
24
23
23
20
25
24
22
ww
Es decir la edad promedio de los ocho estudiantes es
de 23,375 años, observe que la media siempre va
expresada en las unidades originales proporcionados
por los datos muestrales.
Un gráfico ilustrativo sobre la estatura en mts
promedio es:
44. 44
Ejercicio 4.- (Alumno) Los siguientes datos
corresponden a las notas finales de un grupo de
alumnos (H) y de un grupo de alumnas (M) en el
curso de Historia I w
(H) 12 13 11 16 10 11 18
(M) 11 13 12 16 15 12 14 15 17
a)Hallar la nota promedio de los estudiantes
hombres.
b)Hallar la nota promedio de las estudiantes
mujeres.
c)Junte ambos grupos y obtenga la nota promedio,
d)¿Cómo podría obtener la nota promedio de c)
usando solamente los resultados en a) y en b)?
Caso 2.- (datos tabulados, como en el caso
cuantitativo discreto)
ww
Supongamos que los datos originales proporcionada
por la muestra n
X
X
X ,...,
, 2
1 y que han recibido un
tratamiento, por ejemplo ya se ha construido un
cuadro de distribución de frecuencias, siendo
k
X
X
X ,...,
, 2
1 los valores distintos de la variable, con
frecuencias absolutas k
f
f
f ,...,
, 2
1 respectivamente y se
tiene el cuadro:
45. 45
i
X i
f
1
X 1
f
2
X 2
f
.. ..
k
X k
f
n
Donde, 1
f es el número de veces que se repite 1
X , 2
f es
el número de veces que se repite 2
X y así
sucesivamente, en este caso la media muestral se
calcula por la fórmula:
n
X
f
X
k
i
i
i
1
Ejemplo 21. La siguiente información corresponde
al número de hijos por familia en una muestra de
hogares tomados al azar del distrito de Lince:
2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16
ww
Tenemos 16
n datos muestrales, estos pueden ser
ordenados fácilmente en un cuadro de distribución de
frecuencias de la siguiente manera:
i
X i
f i
i X
f
1 3 3
2 6 12
3 5 15
4 1 4
5 1 5
16
n 39
46. 46
Observe que si bien es cierto son 16
n datos, no todos
son distintos. En este caso 5
k valores distintos de la
variable, de la fórmula dada se obtiene:
4375
,
2
16
39
16
)
5
(
1
)
4
(
1
)
3
(
5
)
2
(
6
)
1
(
3
X hijos por
familia.
Ejercicio 5.- (Alumno)En base al siguiente cuadro
correspondiente al número de televisores por familia
en una muestra tomada en el distrito de San Miguel;
se pide calcular el promedio de televisores por familia.
i
X i
f i
i X
f 2
i
i X
f
0 1
1 7
2 10
4 2
5 ¿
a)Teniendo en cuenta que F5=20; hallar el
promedio de televisores por familia.
b)Calcular
2
i
i X
f
ww
Caso 3.- (datos tabulados como en el caso cuantitativo
continuo en intervalos de clase)
En este caso la fórmula es igual al caso anterior, es
decir también
n
X
f
X
k
i
i
i
1
47. 47
Ahora los i
X son las marcas de clase de los intervalos
(puntos medios de los intervalos) y k es el número de
intervalos de clase.
Ejemplo 22. El siguiente cuadro muestra la
distribución de sueldos mensuales en soles de un
grupo de trabajadores de construcción civil en k=6
intervalos de clase; cada intervalo clase tiene
amplitud c=100
Intervalos i
X i
f i
i X
f
700-800 750 5 3750
800-900 850 10 8500
900-1000 950 20 19000
1000-1100 1050 30 31500
1100-1200 1150 25 28750
1200-1300 1250 10 12500
100
n 104000
Luego:
1040
100
104000
1
n
X
f
X
k
i
i
i
soles mensuales. ww
Ejercicio 6.- (Alumno) El siguiente cuadro muestra
los pesos en kilos de un grupo de personas con
problemas de diabetes ingresados en el Hospital
María Auxiliadora del distrito de SJM:
Intervalos i
X i
f 2
i
i X
f
60,0-62,5 6
62,5-65,0 11
65,0-67,5 20
35
48. 48
25
10
8
Total
a)Calcular el peso promedio de los pacientes con
diabetes.
b)Hallar la suma de los cuadrados de las
observaciones.
c)Calcular 2
i
i X
f
10) PROPIEDADES DE LA MEDIA
MUESTRAL O MEDIA ARITMÉTICA O
SIMPLEMENTE MEDIA O PROMEDIO
La media muestral tiene propiedades interesantes y
que nos permiten resolver algunos problemas de
aplicación.
Propiedad 1 La media muestral (o también llamada
media aritmética) de una constante k es la misma
constante k. Simbólicamente:
k
k
M
]
[ ww
Esto quiere decir que si todos los datos muestrales son
iguales a una constante k; entonces la media
aritmética de ellos también es la constante k.
ww
Ejemplo 23. En una reunión de amigos
contemporáneos se juntan 5 personas; todos ellos de
edad igual a k=28 años; es decir n=5 y los datos
muestrales son.
49. 49
X1=28; X2=28; X3=28; X4=28; X5=28
Por lo tanto 28
5
)
28
(
5
5
28
28
28
28
28
]
[
k
M
X
Ejercicio 7.- (Alumno)En un salón del kínder hay 49
niños que asisten a clases, todos ellos tienen 4 años
cumplidos.
a)Hallar la edad promedio de los estudiantes de
kínder.
b)Supongamos que se incorpora al salón un alumno
de 5 años ¿Cuál es la nueva edad promedio?
Propiedad 2 La media aritmética de una variable X
más o menos una constante k, es la media aritmética
de la variable X más o menos la constante k.
Simbólicamente:
k
X
M
k
X
M
]
[
]
[
Ejemplo 24. Los siguientes datos se refieren a
estaturas en metros de un grupo de pacientes de la
tercera edad:
X1=1,67; X2=1,70; X3=1,75; X4=1,68 ww
La media muestral o media aritmética de los n=4
datos es dado por:
7
,
1
4
8
,
6
4
68
,
1
75
,
1
70
,
1
67
,
1
]
[
X
M
X mts.
Si a cada datos se les suma la constante k= 5
centímetros y calculemos la nueva media aritmética.
50. 50
k=5 centímetros equivales a 0,05 metros, es decir
k=0,05 mts.
X1+0;05=1,67+0,05=1,72;
X2+0,05=1,70+0,05=1,75;
X3+0,05=1,75+0,05=1,80;
X4+0,05=1,68+0,05=1,73
La nueva media aritmética es:
05
,
0
70
,
1
05
,
0
]
[
75
,
1
4
7
4
73
,
1
80
,
1
75
,
1
72
,
1
]
05
,
0
[
X
M
X
M
Ejercicio 8.- (Alumno)Se pesó a un grupo de sacos de
arroz, resultando un peso promedio de 52 kilos por
saco. Posteriormente se hizo un chequeo la balanza
electrónica y se verificó que estaba defectuosa, en el
sentido que pesaba 1,5 kilos por encima de lo que
realmente es.
Hallar el peso promedio verdadero.
Propiedad 3 La media aritmética de una constante c
por una variable X es la constante c multiplicada por
la media de X.
Simbólicamente: ww
]
[
]
[ X
cM
cX
M
Ejemplo 25. Un profesor ha calificado a sus 6
alumnos y les ha puesto las notas de 12; 14; 16; 10; 15;
13.
Con estos resultados la nota promedio es
51. 51
3333
,
13
6
80
6
13
15
10
16
14
12
]
[
X
M puntos
El profesor en vista del buen comportamiento,
asistencia, puntualidad ha decidido bonificar a cada
alumno con un 20% adicional sobre la nota original.
El nuevo promedio se obtiene cambiando la nota X
por X+(0,2)X=(1+0,2)X=1,2X; esto se hace a cada
nota:
1,2(12)=14,4; 1,2(14)=16,8; 1,2(16)=19,2; 1,2(10)=12; 1,2(15)=18;
1,2(13)=15,6 ww
16
99996
,
15
)
3333
,
13
(
2
,
1
]
[
2
,
1
16
6
96
6
6
,
15
18
12
2
,
19
8
,
16
4
,
14
]
2
,
1
[
X
M
X
M
Ejercicio 9.- (Alumno) Los trabajadores de construcción
civil de la ciudad de Huancayo gana en promedio por día 68,5
soles. Después de una negociación con los dueños de la
empresa constructora se acordó otorgarle un aumento del
15% por día sobre el jornal que percibían, además de una
bonificación de 5 soles diarios por movilidad.
a) Hallar el nuevo jornal promedio por día de los
trabajadores.
b) Si en lugar de considerar por día los jornales y bajo las
mismas condiciones ¿Cuál es el nuevo ingreso promedio
mensual de los trabajadores? Considere el mes de 30
días.
ww
Propiedad 4 Esta propiedad combina las propiedades 2 y
3. Simbólicamente:
k
X
cM
k
cX
M
]
[
]
[
52. 52
Ejercicio 10.- (Alumno)Demuestre
matemáticamente la Propiedad 4). Use propiedades
de sumatorias.
Propiedad 5 Si X e Y son dos variables que expresan
una característica común en cada unidad poblacional;
entonces:
]
[
]
[
]
[ Y
M
X
M
Y
X
M
Ejemplo 26. Se tomado una muestra de n=5 familias
de un distrito de la capital, se consideran las
siguientes variables:
X: ingreso mensual en soles del esposo.
Y: ingreso mensual en soles de la esposa.
Los datos se muestran en el siguiente cuadro:
X 1350 1800 1200 1100 1500
Y 1400 1700 900 1000 1430
La variable Z=X+Y es el ingreso mensual familiar de
las n=5 familias.
X 1350 1800 1200 1100 1500
Y 1400 1700 900 1000 1450
Z=X+Y 2750 3500 2100 2100 2950
Se puede calcular el ingreso promedio mensual
familiar de las n=5 familias.
2680
5
13400
5
2950
2100
2100
3500
2750
Z soles.
53. 53
También se pueden calcular el ingreso promedio de
los esposos por separado:
1390
5
6950
5
1500
1100
1200
1800
1350
X soles.
En forma similar el sueldo promedio de las esposas
1290
5
6450
5
1450
1000
900
1700
1400
Y soles.
Se observa que
1290
1390
]
[
]
[
2680
]
[
]
[
Y
M
X
M
Y
X
M
Z
M soles.
Ejemplo 27. Las temperaturas registradas en una
ciudad; a las 12 del día en grados Fahrenheit (F0
) son
las siguientes 51; 60; 58; 62; 57; 49; 52; 62; 61; 63.
Hallar la media aritmética de las temperaturas en
grados Centígrados (C0
) si se cumple
8
,
1
32
0
0
F
C
Solución.-
La temperatura en F0
es:
10
5
,
57
10
575
10
63
....
60
51
]
[ 0
n
F
M
8
,
1
32
]
[
8
,
1
1
8
,
1
32
]
8
,
1
1
[
]
8
,
1
32
[
]
[ 0
0
0
0
F
M
F
M
F
M
C
M
0
0
1666
,
14
8
,
1
32
]
5
,
57
[
8
,
1
1
]
[ C
C
M
ww
Ejercicio 11.- (Alumno) Con respecto un Ejemplo
24), supongamos que al ingreso familiar se incorpora
el hijo mayor por familia que también trabaja y
percibe un ingreso mensual; pero como recién
54. 54
comienza y no tiene experiencia, sólo percibe el 65%
del sueldo del padre.
Hallar en nuevo ingreso promedio familiar.
Propiedad 6 (Media global) Si se tienen dos grupos 1
y 2; en los cuales se ha medido una característica
cuantitativa común X; supongamos que el primer
grupo es de tamaño n1 con media 1
X ; el segundo grupo
es de tamaño n2 con media 2
X ; entonces la media
global o conjunta de ambos grupos es:
2
1
2
2
1
1
n
n
X
n
X
n
X
Propiedad 7 La media muestral como todo promedio
está entre el valor mínimo y el valor máximo de las
observaciones; es decir.
max
min X
X
X
Propiedad 8 Las desviaciones respecto a la media se
define como n
i
X
Xi ;...,
2
;
1
);
(
ww
Esta propiedad dice “La suma de las desviaciones
respecto a la media es idénticamente cero”.
Simbólicamente:
0
)
(
1
X
X
n
i
i
Ejemplo 28. Consideremos los siguientes datos:
3 5 4 6 2
Comprobar que la suma de las desviaciones con
respecto a la media es idénticamente nulo.
55. 55
Con los datos obtenemos la media muestral
4
5
2
6
4
5
3
X
Las desviaciones con respecto a la media son:
(3-4)=-1; (5-4)=1; (4-4)=0; (6-4)=2; (2-4)=-2
0
)
2
(
)
2
(
0
)
1
(
)
1
(
)
(
1
X
X
n
i
i
Ejemplo 29. En dos salones de clase 1 y 2 se han
tomado un examen común de matemáticas; en el
primer salón tiene 16 alumnos y una nota promedio
de 12,5. En el segundo salón hay 20 alumnos y con
una nota promedio de 13,8.
Hallar la notal global (juntando las dos aulas)
Solución.-
5
,
12
;
16 1
1
X
n puntos
8
,
13
;
20 2
2
X
n puntos
Entonces la media global es dado por
ww
2222
,
13
36
476
20
16
)
8
,
13
(
20
)
5
,
12
(
16
2
1
2
2
1
1
n
n
X
n
X
n
X puntos.
Ejercicio 12.-(Alumno) Con respecto al ejemplo
anterior, supongamos un tercer salón de clases, del
cual se conocen los siguientes datos: ww
15
X puntos; 525
1
n
i
i
X
Hallar la media global considerando los tres salones
de clases.
56. 56
11) MEDIA PONDERADA
Es un caso especial de la media muestral y se usa en
condiciones especiales donde existen pesos o
ponderaciones k
i
i ;...;
2
:
1
;
. En este caso se calcula con
la fórmula:
k
k
k X
X
X
X
...
...
2
1
2
2
1
1
Ejemplo 30. Las notas de un estudiante en cuatro
asignaturas(A; B; C; D), así como sus respectivos
créditos se muestran en el siguiente cuadro:
Curso Nota: i
X Crédito: i
A 11 3
B 13 7
C 12 5
D 15 2
Total
i
X 51
i
17
Luego la media global es dada por:
5882
,
12
17
214
2
5
7
3
)
15
(
2
)
12
(
5
)
13
(
7
)
11
(
3
X puntos.
La media aritmética es:
ww
75
,
12
4
51
4
15
12
13
11
X puntos.
Ejercicio 13.-(Alumno) Con respecto al Ejemplo
anterior:
57. 57
a) Si se agrega un quinto curso más (E) con
creditaje igual al promedio simple de los cuatro
primeros cursos y que la nota de ese quinto curso
es 14. Hallar el nuevo promedio ponderado.
b)¿Qué tendría que suceder con el creditaje para
que la media ponderada coincida con la media
aritmética?
12) MEDIDAS DE DISPERSIÓN (ABSOLUTA)
O MEDIDAS DE VARIABILIDAD.
Existen varias medidas de dispersión; las más
utilizadas son:
a)Desviación estándar (d.e.) muestral o típica: S
b)Varianza muestral:
2
S
c)Desviación Media: DM
d)Rango Intercuartílico: RI
Ejemplo 31. Si bien es cierto la media muestral es
importante, esta no es suficiente, pues hace falta
definir una medida de variabilidad de los datos
alrededor de X , para esto imaginemos tres grupos de
alumnos, donde cada grupo es de tres alumnos y que
la variable de interés sea la nota en la escala vigesimal
en cada grupo y tenemos los siguientes resultados:
Grupo A: 09 10 11; 10
A
X puntos.
Grupo B: 07 10 13; 10
B
X puntos.
58. 58
Grupo C: 01 10 19; 10
C
X puntos.
Observemos que los tres grupos tienen la misma
media muestral y son iguales a 10; sin embargo la
variabilidad no es la misma en los tres grupos, es
necesario definir una medida que capte esta
variabilidad, una medida de muy usada es la
desviación estándar o desviación típica muestral, la
cual es definida por:
1
)
(
1
2
n
X
X
S
n
i
i
Vamos a calcular esta medida de variabilidad para los
tres grupos; resultando:
.
1
1
3
)
10
11
(
)
10
10
(
)
10
9
(
2
2
2
puntos
SA
.
3
9
1
3
)
10
13
(
)
10
10
(
)
10
7
( 2
2
2
puntos
SB
.
9
81
1
3
)
10
19
(
)
10
10
(
)
10
1
( 2
2
2
puntos
SC
Si analizamos los tres grupos de datos, se nota que en
el primer grupo los datos está más concentrados
alrededor de A
X , en el segundo grupo los datos se
abren un poco más alrededor de su media y
finalmente el tercer grupo los datos están mucho más
dispersos alrededor de la media muestral.
Esto se ve reflejado en la desviación estándar
muestral, pues si los datos están muy dispersos la
59. 59
desviación estándar es “grande”, si los datos están
muy pegados alrededor de su media la varianza es
“pequeña”; por esa razón la desviación estándar es
una medida de variabilidad excelente alrededor de la
media muestral en el siguiente sentido:
“Si la desviación es estándar (d.e.) es “grande”
significa más dipersión de los datos alrededor de la
media, si la d,e, es pequeña significa más
concentración de los datos alrededor de la media”.
13) DESVIACIÓN ESTÁNDAR O DESVIACIÓN
TÍPICA s
Es la medida de dispersión absoluta más usada y es
dada por:
1
)
(
1
2
n
X
X
S
n
i
i
Propiedad: (demostrable)
1
)
(
1
)
(
1
)
(
1
2
2
1
1
2
2
1
2
n
X
n
X
n
n
X
X
n
X
X
S
n
i
i
n
i
n
i
i
i
n
i
i
ww
También como en la media aritmética se presentan
tres casos en el cálculo de la desviación estándar:
Caso 1.- (datos sin tabular)
Si los datos están sin ningún tipo de tratamiento o
datos sin tabular y se tiene la muestra n
X
X
X ,...,
, 2
1 , en
60. 60
este caso la desviación estándar (d.e.) o desviación
típica se calcula mediante la fórmula:
1
)
(
1
)
(
1
1
2
2
1
2
n
n
X
X
n
X
X
S
n
i
n
i
i
i
n
i
i
Ejemplo 32. Con los siguientes datos , referente a las
a las edades de ocho alumnos; es decir:
22, 24, 25, 20, 23, 23, 24, 26
en este caso 8
n y para el cálculo de la d.e. se
necesitan dos cantidades, la suma de datos y la suma
de los cuadrados de los datos, en este caso se tiene:
8
1
187
i
i
X , 4395
)
26
(
...
)
24
(
)
22
( 2
2
2
8
1
2
i
i
X
Luego reemplazando se obtiene:
años
S 8468
,
1
1
8
8
)
187
(
4395
2
ww
Ejercicio 14.-(Alumno) Los siguientes datos son los
pesos de un grupo de adolecentes : 54; 60; 48; 52;
45
a)Hallar la desviación estándar.
b)Sume 2 kilos a cada peso y luego calcular la
desviación estándar asociada. ¿ Es igual a la
obtenida en la parte a)?
61. 61
Caso 2.- (datos tabulados, como en el caso
cuantitativo discreto)
En este caso se tiene:
1
)
(
1
1
2
2
n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
donde k es el número de valores distintos de la v,a, X
ww
Ejemplo 33. Con los datos de un ejemplo anterior
correspondientes al número de hijos por familia:
2 1 3 2 5 4 3 2 3 1 3 2 3 2 1 2
Se necesita una columna que tenga la suma de
cuadrados, es decir:
i
X i
f i
i X
f 2
i
i X
f
1 3 3 3
2 6 12 24
3 5 15 45
4 1 4 16
5 1 5 25
16
n 39 113
ww
Reemplazando, se tiene:
familia
por
hijos
S 0935
,
1
1
16
16
39
113
2
62. 62
Ejercicio 15.-(Alumno) Con los n=16 datos del
ejemplo anterior se aumenta 3 datos más
correspondientes a tres familias los que tienen 3; 4; 3
hijos. Hallar la d.e. correspondiente.
Caso 3.- (datos tabulados como en el caso cuantitativo
continuo en intervalos de clase)
En este caso la fórmula es similar que en el caso
anterior, es decir:
1
)
(
1
1
2
2
n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
En este caso los i
X son las marcas de clase y k es el
número de intervalos de clase.
Ejemplo 34. Usando los datos de un Ejemplo
anterior, referente a los sueldos mensuales en soles
de un grupo de trabajadores, es necesario agregar una
columna más que contenga la suma de cuadrados, es
decir:
ww
Intervalos i
X i
f i
i X
f 2
i
i X
f
700-800 750 5 3750 2812500
800-900 850 10 8500 7225000
900-1000 950 20 19000 18050000
1000-1100 1050 30 31500 33075000
63. 63
1100-1200 1150 25 28750 33062500
1200-1300 1250 10 12500 15625000
100
n 104000 109850000
Reemplazando se obtiene:
mensuales
soles
S 6549
,
130
1
100
100
104000
109850000
2
.
Ejercicio 16.-(Alumno) Si a los datos del ejemplo
anterior se le agrega un intervalo más cuya marca de
clase es 1350 y Frecuencia Absoluta Acumulada F7
es 105. Hallar la d.e. correspondiente.
Ejercicio 17.-Probar que se tienen n datos numéricos
y tos iguales a una constante k; entonces 0
;
]
[
S
K
K
M
14) VARIANZA MUESTRAL ]
[
2
X
Var
S
Definición 5. ( varianza muestral) La varianza
muestral representa por 2
S = ]
[X
Var y es el cuadrado
de la desviación estándar; es decir:
2
2
.)
.
(
]
[ e
d
X
Var
S
; donde
S
estándar
desviación
e
d
.
. ww
Ambas; el 2
S (varianza muestral) y el S (desviación
estándar muestral) son medidas de variabilidad de los
datos alrededor de la media muestral, la diferencia
estriba en la S está expresada en la unidades
64. 64
originales, mientras que 2
S está expresada en
unidades originales al cuadrado.
Obviamente si se conoce la d.e. muestral S elevando al
cuadrado se obtiene la varianza muestral
2
S y
viceversa si se conoce la varianza muestral
2
S sacando
la raíz cuadrada positiva se obtiene la d.e. muestral S ;
es decir:
]
[
.
.
2
X
Var
S
e
d
S
Considerando lo anterior en la que se estudió la
desviación estándar muestral S y su fórmula de
cálculo en Caso 1; Caso 2 y Caso 3 se repiten sin la
raíz cuadrada; es decir para el cálculo de la varianza
muestral surgen tres casos:
Caso 1.- (Datos sin tabular)
1
)
(
1
1
2
2
2
n
n
X
X
S
n
i
n
i
i
i
Caso 2.- (Datos tabulados como en el caso
cuantitativo discreto)
ww
1
)
(
1
1
2
2
2
n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
Caso 3.- (Datos tabulados como en el caso
cuantitativo continuo)
65. 65
1
)
(
1
1
2
2
2
n
n
X
f
X
f
S
k
i
k
i
i
i
i
i
; donde
:
i
X marca de clase del iésimo intervalo.
:
k número de intervalos de clase.
Ejemplo 35. Los siguientes datos corresponden al
peso de un grupo de recién nacidos en kilos escogidos
al azar en verano del presente año: 2,8 3,2 3,4 3,0
2,3.
a)Calcular la media muestral, la varianza muestral
y luego obtenga la d.e. muestral para esta
muestra de tamaño n=5.
b)En invierno del mismo año se registró otro grupo
de recién nacidos, resultando: 3,1 3,1 3,1 3,1
3,1
Calcular
2
S y S
c) Si los datos: 2,8 3,2 3,4 3,0 2,3 les sumamos
100 gramos ¿Cambia la varianza obtenida en a)?
d)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3
los reducimos en un 5% ¿Cambia la varianza
obtenida en a)?
e)La varianza muestral ]
[
2
X
Var
S ¿Puede ser
negativa?
66. 66
Solución:
a)Se necesitan dos resultados: Suma de datos y
Suma de cuadrados de datos; es decir:
7
,
14
5
1
i
i
X ; 5
;
93
,
43
5
1
2
n
X
i
i
Por lo tanto:
94
,
2
5
7
,
14
]
[
X
M
X kilos;
178
,
0
4
712
,
0
1
5
5
)
7
,
14
(
93
,
43
2
2
S (kilos)2
Tomando raíz cuadrada
4219
,
0
178
,
0
2
S
S (kilos)
b) 5
,
15
)
1
,
3
(
5
1
,
3
1
,
3
1
,
3
1
,
3
1
,
3
;
4
5
1
i
i
X
n
05
,
48
)
1
,
3
(
5
2
4
1
2
i
i
X ; luego
1
,
3
5
5
.
15
]
[
X
M
X (kilos)
0
4
0
1
5
5
)
5
,
15
(
05
,
48
2
2
S
Entonces la d.e. es 0
S
ww
Este resultado de varianza cero se debe la
siguiente propiedad de la varianza muestral que
dice lo siguiente:
“Si a todos los datos son iguales a una constante
k; entonces la varianza muestral es igual a cero”
Simbólicamente:
0
]
[
k
Var
67. 67
Observe el siguiente detalle:
Si todos los datos son iguales la media muestral
coincide con el dato común; en este caso no hay
variabilidad alrededor de la media; eso se ve
reflejado con una d.e. igual a cero o
equivalentemente una varianza muestral igual a
cero.
c)Si a cada uno de los datos: 2,8 3,2 3,4 3,0 2,3
se les suma 100 gramos que es equivalente a 0,1
kilos. La nueva data es ahora: 2,9 3,3 3,5 3,1
2,4
Entonces:
92
,
46
2
,
15
5
1
5
1
2
i i
i
i X
X
178
,
0
4
712
,
0
1
5
5
)
2
,
15
(
92
,
46
2
2
S
Este resultado coincide con el obtenido en la
parte a); esto no es una coincidencia, en realidad
es una propiedad de la varianza muestral que
dice lo siguiente:
|
“La varianza de la variable X más o menos una
constante k es igual a la varianza de X”
Simbólicamente:
]
[
]
[ X
Var
k
X
Var
68. 68
d)Si a cada dato los reducimos un 5% entonces a
cada dato hay que multiplicarlo por la constante
k=0,95; es decir:
0,95(2,8)=2,66 0,95(3,2)=3,04 0,95(3,4)=3,23
0,95(3,0)=2,85 0,95(2,3)=2,185
646825
,
39
965
,
13
2
i
i
X
X
(Verificar)
160645
,
0
)
178
,
0
(
)
95
,
0
(
]
[
)
95
,
0
(
160645
,
0
4
5
)
965
,
13
(
646825
,
39
]
[
2
2
2
2
X
Var
X
Var
S
Lo anterior es una propiedad de la varianza
muestral, que dice lo siguiente:
“La varianza de una constante c multiplicada por
la variable X es el la constante al cuadrado
multiplicada por la varianza de la variable X”
Simbólicamente
ww
]
[
]
[
2
X
Var
c
kX
Var
e)La varianza nunca puede ser negativa, pues suma
de cuadrados; es decir 0
2
S
15) PROPIEDADES DE LA VARIANZA
MUESTRAL
2
S
Propiedad 1 .- 0
)
( 2
S
X
Var
69. 69
Propiedad 2 .- 0
]
[
k
Var
Propiedad 3 .- ]
[
]
[ X
Var
k
X
Var
Propiedad 4 .- ]
[
]
[
2
X
Var
c
cX
Var
Propiedad 5 .- ]
[
]
[
2
X
Var
c
k
cX
Var
Ejercicio 18.- (Alumno)
Los siguientes datos corresponden a la estatura en
metros de un grupo de estudiantes varones:
ww
1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75
f) Calcular la media muestral, la varianza muestral
y luego obtenga la d.e. muestral.
g)Un grupo de estudiantes mujeres registro que 8
de ellas registraron un estatura común de 1,68
metros,
Calcular la media muestral considerando a
varones y mujeres.
h) Si a los datos: 1,67 1,70 1,68 1,71 1,69 1,71
1,72 1,75 se les resta 2 centímetros, calcular la
varianza muestral y la desviación estándar
muestral. ¿Cambian los resultados con los
obtenidos en la parte f)
i) Si a cada uno de los datos:
1,67 1,70 1,68 1,71 1,69 1,71 1,72 1,75
70. 70
Se les aumenta un 3%. Obtener la varianza
muestral. ¿Cambian los resultados con respecto
a la parte f)?
j) La desviación estándar ¿Puede ser negativa?
16) MEDIDAS DE DISPERSIÓN RELATIVA:
El COEFICIENTE DE VARIACIÓN (C.V.)
Cuando dos o más grupos tienen la misma media
muestral la desviación estándar sirve directamente
para decidir el grupo que tiene menos dispersión
alrededor de la media.
Sin embargo tener dos o más grupos con la misma
media muestral por lo general no es posible; para
poder comparar la variabilidad en estos casos se
define el Coeficiente de Variación (CV) y es una
medida de dispersión relativa pues es adimensional y
es dada por:
ww
X
S
CV
En la definición anterior se supone que la media
muestral es positiva; es decir 0
X ; si la media
muestral fuese negativa se le puede tomar el valor
absoluto y con esto el Coeficiente de Variación queda
definida así:
X
S
CV
71. 71
Ejemplo 36. Las notas promedios finales de tres
salones (A; B y C) son 5
,
11
A
X ; 0
,
13
B
X ; 0
,
10
C
X
puntos con desviaciones estándar de 6
,
0
A
S ; 55
,
0
B
S ;
53
,
0
C
S
¿Qué salón tiene notas menos variable alrededor de la
media? ¿Qué salón tiene notas más variables
alrededor la media?
Los datos presentados y los CV asociados se resumen
en el siguiente cuadro:
5
,
11
A
X 6
,
0
A
S
0521
,
0
5
,
11
6
,
0
A
CV
%
21
,
5
100
A
CV
0
,
13
B
X 55
,
0
B
S
0423
,
0
0
,
13
55
,
0
B
CV
%
23
,
4
100
B
CV
0
,
10
C
X 53
,
0
C
S
053
,
0
0
,
10
53
,
0
C
CV
%
3
,
5
100
C
CV
El salón con notas menos alrededor de la media (más
concentrados alrededor de la media) es aquel que
tiene menos CV en este caso es el salón B; pues su CV
en % tiene un valor de %
23
,
4
100
B
CV
El salón con notas más variables alrededor de la
media (más dispersos alrededor de la media) es aquel
que tiene alto CV, en este caso es el salón C; pues tien
un valor de %
3
,
5
100
C
CV
Ejemplo 37. Se tomaron al azar dos distritos de la
capital (A y B) y la variable de interés es el número de
dormitorios por familia; se tienen los dos siguientes
cuadros:
Distrito A
72. 72
i
X i
f
0 1
1 4
2 5
3 4
4 2
Distrito B
i
X i
f
1 0
2 1
3 3
4 7
5 4
6 1
¿Cuál de los dos grupos tiene mayor variabilidad
respecto a la media?
Solución.-
Para cada grupo hay que calcular la suma de datos y
la suma de sus cuadrados
Distrito A.-
34
i
i X
f ; 92
2
i
i X
f ; 16
n
125
,
2
16
34
X dormitorios;
1474
,
1
15
75
,
19
15
16
)
34
(
92
2
S dormitorios ww
8194
,
0
125
,
2
1474
,
1
CV ; %
94
,
81
100
CV
Distrito B.-
73. 73
65
i
i X
f ; 279
2
i
i X
f ; 16
n
0625
,
4
16
65
X dormitorios,
9979
,
0
15
9375
,
14
15
16
)
65
(
279
2
S
2456
,
0
0625
,
4
9979
,
0
CV ; %
26
,
24
100
CV
El grupo más variable alrededor de la media es aquel
que tiene mayor CV; en este caso es el número de
dormitorios del distrito A.
17) APLICACIONES DEL COEFICIENTE DE
VARIACIÓN
El Coeficiente de Variación CV tiene dos importantes
aplicaciones:
a)Si se tienen dos o más grupos, el CV permite
decidir el grupo que tiene menos variabilidad
relativa alrededor de la media; para esto se busca
el CV más pequeño o el 100CV más pequeño
b)Permite tener un criterio para decidir cuando
una varianza puede ser llamada “grande” o pueda
ser denominada “pequeña”; en el siguiente
sentido:
1)Si CV<0,05 (100CV<5%) se considera una
varianza “pequeña”.
74. 74
2) Si CV>0,05 (100CV>5%) se considera una
varianza “grande”.
ww
Ejemplo 38. Con respecto al Ejemplo anterior donde
la variable de interés es número de dormitorios por
familia, decidir para cada caso si se trata de varianza
pequeña o grande.
Se tiene los siguientes cálculos ya hechos:
Para el distrito A se tiene CV=0,8194>0,05
(Varianza grande)
Para el distrito B se tiene CV=0,2426>0,05
(Varianza grande)
Ejercicio 19.-(Alumno) Decir si es V o F la siguiente
afirmación: “Si a un conjunto de datos numéricos se
les suma una constante k; entonces el CV no cambia.”
ww
75. 75
Ejercicios
Parte 1
1)Clasificar las siguientes variables:
1.1 Número de errores por página de un libro.
1.2 Nivel de humedad en una ciudad.
1.3 Número de latidos del corazón por minuto.
1.4 Color del cabello.
1.5 Duración de los focos de luz.
1.6 Marca de autos.
1.7 Número de cabellos por persona.
1.8 Color de tinta de lapiceros.
1.9 Número de teléfono de los usuarios.
1.10 Nivel de glucosa en la sangre en pacientes.
1.11 Altitud de las ciudades de la Sierra del Perú.
1.12 Estado civil de las personas adultas.
1.13 Temperatura medioambiente.
1.14 Diámetro interior de tuercas de precisión.
1.15 Tipo de diabetes en personas adultas.
1.16 Número de mascotas por familia.
1.17 Número de ríos que llegan a la costa en los
diferentes países del mundo.
1.18 La clase social de los peruanos.
76. 76
2) Consideremos la población de alpacas de
una región de la sierra peruana, dicha población
quiere ser estudiada de acuerdo a su composición
por sexo (macho=m, hembra=h)
a)Defina un parámetro de interés.
b)Se cazan 150 animales de esta especie, de ellas
resultan 78 machos, estime la proporción
poblacional de machos de las alpacas de esa zona.
3) Los datos siguientes son referentes a la
duración de un grupo de focos (marca A) de luz
medido en horas: 1200, 1050, 1100, 1000,
1111, 1150, 1000
a)Hallar la media muestral X ,
b)Hallar la desviación estándar muestral S y la
varianza muestral 2
S .
c)Calcular el coeficiente de variación.¿Varianza
pequeña o grande?
4) Los siguientes datos son referentes al
número de visitas al seguro social en un año
determinado de una muestra de jubilados:
2, 4, 3, 4, 5, 4, 3, 3, 4, 5, 2, 4, 2, 4, 3, 3, 4, 3, 3, 5
a)Construir un cuadro de distribución de
frecuencias.
Obtener S
S
X ,
, 2
b)Si a cada dato se le suma 1. ¿Cambia la media
muestral?. ¿cambia la desviación estándar
muestral?. Justifique.
77. 77
5) El siguiente cuadro muestra la distribución
de las edades de un grupo de alumnos
universitarios:
Intervalos i
X i
f
16-18 17 5
18-20 19 10
20-22 21 15
22-24 23 13
24-26 25 7
26-28 27 3
a)Calcular 2
,
, S
S
X . ¿Varianza pequeña o grande?
b) Obtener i
i
i H
F
h ,
, , e interpretar algunos valores
Solución:
Primero creamos el siguiente cuadro
Intervalos i
X i
f i
h i
F i
H i
i X
f 2
i
i X
f
[16-18> 17 5 0,094
3
5 0,094
3
85 1445
[18-20> 19 10 0,188
6
15 0,282
9
190 3610
[20-
22>
21 15 0,283
0
3
0
0,565
9
315 6615
[22-24> 2
3
13 0,245
2
4
3
0,8111 299 6877
[24-26> 2
5
7 0,132
0
5
0
0,943
1
175 4375
[26-28> 27 3 0,056
6
5
3
0,999
7
81 2187
Totales n=5
3
114
5
2510
9
78. 78
a) 3037
,
21
53
1145
X años
b) 3592
,
7
52
6792
,
382
52
53
)
1145
(
25109
2
2
S (años)2
7127
.
2
3592
,
7
S años
%
73
,
12
100
1273
,
0
3037
,
21
/
7127
,
2
CV
CV
Varianza grande
6) Decir si es Posible (P) o No Posible (NP),
las siguientes afirmaciones, justifique sus
respuestas:
a)La media muestral nunca puede ser negativa.
b)La desviación estandar de un conjunto de datos
puede ser cero.
c)La proporción muestral siempre es menor que la
proporción poblacional.
d)La proporción poblacional puede ser mayor que
uno.
e)Siempre que se quita un dato de un conjunto de
n datos entonces la media muestral cambia
necesariamente.
7) En un salón de clases A se tienen 25 alumnos y
una nota promedio de 12,5 puntos; otro salón B
tiene el doble de alumnos con respecto al del
salón A; la nota promedio es de 13 puntos, Hallar
la nota promedio de juntando ambos grupos.
8) Anteriormente se dieron cuatro propiedades
de la varianza muestral
2
S ; reformularlas para el
caso de desviación estándar muestral.
79. 79
9) Un estudiante obtiene las notas en exámenes
parciales de 7; 5 y 3.
En el examen final consigue un 6; supongamos
que esta nota final tiene doble valor que los
parciales. ¿Cuál es su nota promedio?
10) Si el ingreso anual promedio de los
trabajadores del campo es de 12000 soles y el
ingreso anual promedio de los trabajadores de la
ciudad es de 15000 soles ¿El ingreso promedio
para ambos grupos será de 13500 soles?
Justifique.
11) Decir si es V o F la siguiente afirmación “Si
la d.e. de un conjunto de datos es cero, entonces
todos los datos son iguales”
12) La media aritmética de seis números es 10.
Se sabe que cinco de ellos son 8 12 13 5 9.
Hallar el elemento que falta.
13) Se dice que un conjuntos de datos están
tipificados, si a cada uno ellos se le resta la media
aritmética y se lo divide entre la desviación
estándar; es decir si la data original es:
Si se tiene la data original n
X
X
X ;...;
; 2
1
a cada uno
de ellos se les hace la transformación
n
i
S
X
X
Z i
i ;...;
2
;
1
;
)
(
Con la siguiente data: 4 3 4 1. Se pide tipificar
los cuatro datos y luego con los cuatro datos
80. 80
transformados calcular su media aritmética y su
varianza.
14) En estas notas de clase se ha definido la
varianza muestral
1
)
(
2
2
n
X
X
S
k
i
i
; (dividida entre n-
1) también se conoce varianza muestral
insesgada o cuasivarianza.
En algunos libros presentan una varianza
ligeramente diferente y se conoce como varianza
muestral sesgada (dividida entre n); y se define
así:
n
X
X
S
k
i
i
2
2
*
)
(
La diferencia entre ambas es el denominador; si
n>30 (muestras grandes); la diferencia entre
ambas es mínima.
Encontrar una relación matemática entre ambas
varianzas
2
S y
2
*
S .
15) Se presenta siguiente cuadro en la que se
considera el número de hijos por familia
provenientes de una encuesta hecha a 50 familas
i
X i
f
0 2
1 12
2 21
3 8
4 5
5 2
n=50
81. 81
a)Hacer una representación gráfica de dos
formas distintas: Gráfico de barras; Gráfico de
sectores circulares.
b)Hallar la media muestral; la desviación
estándar muestral y la varianza muestral
c)Obtener el C.V. e interpretar.
16) En una distribución simétrica con 7
intervalos de clase tal que
100
;
95
,
0
;
20
,
0
;
05
,
0 5
3
1
n
H
h
h .
a) Reconstruya el cuadro de distribución de
frecuencias; con la información adicional de que
la marca de clase del primer intervalo de clase es
5 y la marca de clase del tercer intervalo de clase
es 15.
b) Calcular .
.
;
;
; 2
V
C
S
S
X
17) Los ingresos semanales de 40 personas se
muestran en el siguiente cuadro:
*
*
1 i
i x
x
i
f i
F
*
1
200 x
2 x
300
*
1
x x x
12 22
x 29
x 34
4 x
x x
a)Complete el cuadro de distribución de
frecuencias.
b)Calcular la media muestral; la desviación
estándar muestral y el C.V.
82. 82
c)Estimar el número de personas con ingresos
semanales entre 253 y 359 soles.
18) (RM 159) El ingreso percápite mensual de
un departamento es de $310 (x1000). El sector
obrero que constituye el 59% de esa población
percibe 1/5 del ingreso total. Hallar el ingreso
medio por habitante de ese departamento.
Observación.- El ingreso per cápita se define
como
Renta o ingreso per cápita
La renta per cápita, PIB/PBI per cápita o ingreso
per cápita es un indicador macroeconómico de
productividad y desarrollo económico, usado para
entregar una visión respecto al rendimiento de las
condiciones económicas y sociales de un país, esto en
consideración del crecimiento real y la fuerza
laboral
El PIB per cápita, ingreso per cápita o renta per
cápita es un indicador económico que mide la
relación existente entre el nivel de renta de un país y
su población. Para ello, se divide el Producto Interior
Bruto (PIB) de dicho territorio entre el número de
habitantes.
El empleo de la renta per cápita como indicador de
riqueza o estabilidad económica de un territorio tiene
sentido. Esto, porque a través de su cálculo se
interrelacionan la renta nacional (mediante el
83. 83
PIB en un periodo concreto) y los habitantes de ese
lugar.
El objetivo del PIB per cápita es obtener un dato que
muestre el nivel de riqueza o bienestar de un
territorio en un momento determinado. Con
frecuencia se emplea como medida de comparación
entre diferentes países, para mostrar las diferencias
en cuanto a condiciones económicas.
Significado de PIB per capita
Qué es PIB per capita:
El PIB per cápita es un indicador económico que
mide la relación entre el nivel de ingresos de un país y
cada uno de sus pobladores. También suele ser
conocido con el nombre de ingresos per cápita o renta
per cápita.
La expresión está formada por las siglas PIB que
significan 'producto interno bruto', y las palabras
latinas per cápita , que quieren decir 'por cabeza'. Así,
se resume como el producto interno bruto por cabeza
de un país.
Para medir el PIB per cápita se utiliza una fórmula
que consta de los siguiente elementos: PIB per cápita
= PIB / nro de habitantes
Por ejemplo, en una nación que percibe en un año un
producto interno bruto de 300 mil millones de
dólares y que tiene 30 millones de habitantes, el PIB
per cápita será de 10 mil dólares por habitante.
Función del PIB per cápita
84. 84
EL PIB per cápita se mide anualmente. Se supone
que su incremento delata el crecimiento de una
economía durante un determinado período.
En teoría, este dato describe el promedio de ingresos
en función del número de habitantes, lo que
permitiría diagnosticar el nivel económico de la
sociedad.
Sin embargo, al ser apenas un promedio, este
indicador no permite comprender con claridad cómo
esta riqueza es repartida entre los diferentes
individuos de un país, de manera que las
desigualdades económicas no se visibilizan.
Por ejemplo, en un país con un PIB per cápita de 10
mil dólares, ocurre a menudo que unos ganan
muchísimo menos y otros ganan muchísimo más. Así,
el PIB per cápita no es un indicador fiable para
medir la distribución de la riqueza sino apenas la
totalidad de los ingresos y su potencial de inversión.
En efecto, el PIB per cápita no ofrece información
contundente sobre los datos relacionados con
educación y salud, fundamentales en la evaluación de
la distribución de la riqueza.
Qué es el Producto Bruto Interno (PBI)?
¿Qué es el PBI? El Producto Bruto Interno (PBI)
es el valor de los bienes y servicios finales producidos
durante un período de tiempo en un territorio. Sólo se
refiere a bienes y servicios finales porque sus precios
incorporan el valor de los bienes intermedios. Por
85. 85
tanto, incluir los bienes intermedios conllevaría a una
doble contabilización.
Existen 3 métodos para calcular el PBI: método de
gasto, el método de la producción y el método del
ingreso. Las dos primeras son las formas más usuales.
En el primer método, se contabiliza la compra
agregada de los bienes y servicios de la economía, es
decir, se suma el gasto de: los consumidores de bienes
y servicios locales (consumo privado), el gobierno
(consumo e inversión pública), las empresas
(inversión privada), los extranjeros que compran
nuestros productos (exportaciones), y, finalmente, se
excluye del cálculo el gasto en bienes no producidos
en el país (importaciones).
Por su parte, en el método de la producción, se suma
el valor de mercado del producto en cada etapa de la
producción de cada sector productivo y restándole el
valor de los insumos utilizados. Los sectores de
producción se clasifican en: manufactura, minería,
agricultura, pesca, comercio, etc.
Por último, el método del ingreso consiste en
cuantificar los ingresos recibidos por todos los
agentes de la economía en razón de su participación
en la producción. Se considera como ingresos a: las
remuneraciones, el consumo de capital fijo, los
impuestos a la producción e importación y el
excedente de explotación.
Estadísticas relacionadas
Población 32,51 millones (2019)
86. 86
PBI per cápita 6.977,70 USD (2019)
Tasa de crecimiento del
PIB
2,2% cambio anual
(2019)
Solución.-
Sea
87. 87
:
X ingreso total de la región.
:
N tamaño de la población de esa región.
:
X ingreso medio por habitante de esa región.
Ingreso per cápita o ingreso medio por
habitante 310
N
X
N
región
la
de
total
ingreso
$
Luego N
X 310
.
Para el sector obrero; el ingreso medio por
habitante<:
$
0847
,
105
59
,
0
62
59
,
0
)
310
(
5
1
59
,
0
5
1
N
N
N
X
Xobreros
19) La empresa A tiene 100 empleados; con un
sueldo mensual de 2500 soles. La empresa B
tiene 200 empleados con un sueldo mensual de
2400 soles.
a)Hallar el sueldo promedio mensual de los
empleados al juntar las dos empresas.
b)Si a las dos empresas se agrega una tercera con
50 empleados con un ingreso promedio
mensual de 3000 soles. Hallar el sueldo
promedio mensual de los empleados de las tres
empresas.
20) En un examen común que rindieron cuatro
secciones D
C
B
A ;
;
; con un total de 100 alumnos;
habiendo un promedio mensual de 72 puntos.
Los puntajes promedios de los grupos C
B
A ;
; son
de 75; 62; y 80 puntos respectivamente. La
información sobre el grupo D se perdieron; pero
88. 88
se sabe que los grupos A y B eran el 40% y el
25% del total respectivamente; y que en
grupo C habían 15 alumnos más que en grupo
D. Hallar la nota promedio del grupo D.
Solución.-
15
;
25
;
40
72
;
80
;
62
;
75
C
D
B
A
B
B
A
n
n
n
n
X
X
X
X
Luego:
15
;
25
;
100
15
25
40
D
C
c
c n
n
n
n
100
)
(
10
)
80
(
25
)
62
(
25
)
75
(
40
72 D
X
X
Despejando
.
65 puntos
X D
21) (RM169) El ingreso medio mensual de 16500
obreros es de 1160 soles y de los 12900
empleados de esta compañía es de 1480 soles.
Si los obreros reciben un aumento del 20%
sobre sus ingresos más una bonificación de 500
soles por condiciones de trabajo.
Los empleados reciben un aumento del 30%
más 600 soles por condiciones de trabajo.
Hallar el nuevo ingreso promedio de todos los
trabajadores de esa gran compañía.
22) (RM173) Se compraron 40 kilos de carne a 20
soles por kilo; 20 kilos de carne a 25 soles por
kilo y 20 kilos de carne al 30 soles por kilo de
carne. Hallar el peso promedio por kilo de carne.
Solución.-
El siguiente cuadro muestra la información del
problema:
i
X i
n
20 40
89. 89
25 20
30 20
80
Donde:
i
X : precio por kl. de carne. i
n :cantidad de kl. de
carne.
75
,
23
80
1900
80
)
20
(
30
)
20
(
25
)
40
(
20
X soles.
----------0----------
23) Los siguientes datos corresponden al sueldo (en
miles de pesos) de 40 trabajadores de una
empresa:
119 135 138 144 146 150 156 164
125 135 140 144 147 150 157 165
126 135 140 145 147 152 158 168
128 136 142 145 148 153 161 173
132 138 142 146 149 154 163 176
a) Construya la tabla de frecuencia con todos
sus elementos.
b) ¿En qué clase se encuentra el mayor
número de trabajadores?
90. 90
c)¿Qué porcentaje de trabajadores gana entre
$139.000 y $168.000?
d)¿Cuántos trabajadores ganan a lo menos
$159.000?
e)¿Cuántos trabajadores ganan a lo más
$148.000?
24) En una industria es necesario realizar un estudio
respecto al peso de engranajes de gran tamaño.
Los siguientes datos corresponden al peso, en
kilógramos, de 30 de estas piezas, que poseen las
mismas dimensiones, pero distinta aleación.
58 52 50 42 40 50 38 52 50 45
36 45 55 42 42 52 50 45 42 38
42 38 40 46 45 45 55 42 45 40
a)Construir una tabla de frecuencias de
amplitud 5 comenzando desde 36.
b)¿Cuántos engranajes pesan entre 46 y 55
Kg.?
c)¿Qué porcentaje representa a aquellos
engranajes cuyo peso es inferior a 51 Kg.?
d)¿Cuál es la frecuencia relativa para aquel
intervalo cuya marca de clase es 48?
91. 91
e)¿Qué porcentaje representa a aquellas
piezas que pesan más de 50 Kg.?
25) En una industria automotriz es necesario
realizar un estudio debido a una partida
defectuosa de discos de embrague. Para ello se ha
recopilado la siguiente información referente a la
duración en horas de 50 de ellos.
285 30
0
28
6
30
2
313 314 28
9
29
2
321 327
29
3
278 28
2
289 30
8
32
6
30
3
287 29
3
32
2
30
4
32
9
285 307 297 30
2
29
4
201 28
5
313
30
8
307 30
4
291 28
8
297 316 32
2
317 30
8
321 324 32
3
316 29
2
28
6
29
9
29
4
32
8
29
6
a) Construir una tabla de frecuencia de
amplitud cinco comenzado desde 285.
b) ¿Cuántos discos duraron entre 290 y
299 horas?
c) ¿Cuántos discos no alcanzaron a durar
300 horas?
92. 92
d) ¿Qué porcentaje representan los discos
que duraron entre 310 y 314 horas?
e) ¿Qué porcentaje representa los discos
que duraron menos de 305 horas?
f)¿Cuántos discos duraron más de 309 horas?
g) ¿Cuántos discos duraron menos de 305
horas?
h) ¿Qué porcentaje representan los discos que
duraron entre 285 y 294 horas?
i)¿Cuál es el intervalo de mayor frecuencia
absoluta?
26) En un conjunto habitacional se pretende hacer
un estudio del número de personas que
consumen productos enlatados. Los datos que
han sido obtenidos de 50 bloques del conjunto
habitacional son:
63 69 83 85 93 73 81 94 10
4
12
5
64 13
2
115 12
0
12
7
13
0
10
5
114 12
3
12
1
12
8
90 75 13
7
13
1
73 62 10
0
10
9
117
93. 93
12
4
10
3
13
3
13
8
13
3
11
0
60 91 87 13
6
13
7
13
4
12
9
96 99 72 10
4
97 84 98
a)Construir una tabla de frecuencia de
amplitud 10 partiendo desde 60.
b)¿Cuántas personan consumen entre 100 y
129 productos enlatados?
c)¿Qué porcentaje representa a las personas
que consumen menos de 90 productos
enlatados?
d)¿Qué cantidad de personas consumen más
de 80 productos enlatados?
27) Las ganancias por acción de 40 compañías de la
industria de la construcción son:
4,6 0,3 1,1 5,7 0,1 1,3 2,5 1,6
1,3 2,1 2,1 1,4 7,3 5,4 3,5 1,9
6,0 0,8 1,9 2,1 3,2 0,2 7,1 2,8
9,6 3,7 5,1 3,6 4,9 2,3 1,8 0,4
4,2 2,1 0,9 3,2 3,7 1,1 0,5 1,9
94. 94
a)Construya una distribución de frecuencias
que comience en 0,1 y tenga una amplitud de
2,0.
b)¿Cuál es la frecuencia absoluta del tercer
intervalo?
c)¿Qué porcentaje de las compañías tienen a lo
más una ganancia de 6,0?
d) ¿Cuántas compañías tienen una ganancia
de a lo menos de 4,1?
e)Interprete la frecuencia acumulada del
segundo intervalo.
f) Interprete la frecuencia relativa acumulada
del cuarto intervalo.
28) Dada la información referente a la ubicación de
personas dentro de cuatro departamentos de una
empresa, se pide:
a)Tabular la información.
b)Realizar gráfico circular.
c)Indique frecuencias relativas porcentuales en
cada grupo.
M A P CC A CC M P P M
95. 95
P CC M A M CC P P M P
A P A M M A M A P M
M A CC A A M P M M P
donde: A = abastecimiento; CC = control de
calidad; M = mantención; P = producción.
29) Se realizó un número determinado de compras
de materia prima. El volumen de la materia
prima viene dado en m3
. Parte de la información
se registra en la siguiente tabla:
Volumen
i
x i
f i
h i
F i
H Límites reales
6 – 10 1
11 – 15
16 – 20 6 9
21 – 25 18
26 – 30 27
Total 27
a)Complete la tabla dada.
b)En un solo gráfico, dibuje un histograma y un
polígono de frecuencia.
c) ¿Cuántas compras se realizaron entre 11 y 30
m3
?
96. 96
d)¿Cuántas compras se realizaron entre 16 y 25
m3
?
e)¿Qué porcentaje de compras se realizaron entre
16 y 20 m3
?
f) ¿Cuántas compras se realizaron en total?
30) Los siguientes datos corresponden a la duración,
en horas, de 50 válvulas que fueron sometidas a
un cierto control:
Tiempo
i
x i
f i
h i
F i
H Límites reales
450 – 499 5
500 – 549 4
550 – 599 12
600 – 649 10
650 – 699 15
700 – 749 3
750 - 799 1
Total 50
a)Complete la tabla dada.
b)Grafique la ojiva.
c) ¿Qué porcentaje de las válvulas duraron, en
promedio 674,5 horas?
97. 97
d)¿Qué porcentaje de las válvulas duraron entre
650 y 749 horas?
e)¿Cuántas válvulas duraron menos de 550
horas?
f) ¿Qué porcentaje de las válvulas duraron más de
649 horas?
31) Se realizaron dos experimentos referentes al
peso, en Kg., aplicado sobre una cierta cantidad
de tableros.
Peso
(Kg.)
A B
15 – 19 7 3
20 – 24 3 6
25 – 29 2 8
30 – 34 11 8
35 – 39 10 12
40 – 44 7 3
Total 40 40
a)Grafique el histograma del experimenta A.
b)Grafique la ojiva porcentual del experimento B.
98. 98
c)Realice, en un mismo gráfico, los polígonos de
frecuencia.
d)Realice, en un mismo gráfico, las ojivas.
32) Dado el siguiente Polígono de Frecuencias:
a)¿Cuáles son los límites reales del cuarto
intervalo?
b)Interprete la frecuencia del cuarto intervalo.
c)Interprete el porcentaje de datos que hay en el
quinto intervalo.
d)¿Qué porcentaje de pesos es igual o menor que
60,5 Kg.?
OJO: FALTA GRÁFICO
PÁGINA 27