ESTADISTÍCA Y 
PROBABILIDADES 
Editado Por 
G. Aaron Estuardo Morales 
C h i l e 2 0 1 2 admin2766@gmail.com
Indice 
Contenido Página 
Unidad Nº1: Estadística Descriptiva 
Introducción 3 
Estadística: conceptos previos 4 
Variables 6 
Tabulación de datos: 
a) cualitativos 7 
b) cuantitativos 8 
Representación gráfica 17 
Medidas de tendencia central: 
a) Media aritmética 39 
b) Mediana 38 
c) Moda 40 
Medidas de dispersión: 
a) Rango 45 
b) Desviación media 46 
c) Varianza 47 
d) Desviación estándar 50 
Criterio de homogeneidad 52 
Autoevaluación 56 
Unidad Nº2: Probabilidades 
Elementos de probabilidades 58 
Concepto de probabilidad en espacio finito equiprobable 60 
Axiomas de probabilidad 60 
Probabilidad condicional 69 
Teorema de Bayes 78 
Eventos independientes 83 
Variables aleatorias 86 
Distribución discreta de probabilidades 87 
Distribución continua de probabilidades 89 
Esperanza 94 
Varianza 94 
Distribuciones discretas: 
Bernuolli 102 
Binomial 103 
Hipergeométrica 108 
Distribución Poisson 113 
Distribución continua: 
Normal 117 
Normal estándar 118 
Problemas de aplicación 122 
1
Autoevaluación 1 128 
Autoevaluación 2 131 
Unidad N°3: Intervalos de Confianza 
Inferencia estadística 134 
Estimación de parámetros 134 
Estimación por intervalo 134 
Intervalo de confianza para la media de una población normal: 
a) conocida su varianza 135 
b) desconocida su varianza 140 
Intervalo de confianza para la varianza de una población normal 144 
Autoevaluación 148 
Unidad N°4: Pruebas de Hipótesis 
Pruebas de hipótesis 150 
Pruebas de unilaterales y bilaterales 152 
Pruebas de hipótesis para: 
a) la media si se conoce su varianza 153 
b) la media si se desconoce su varianza 158 
c) la varianza 164 
Autoevaluación 169 
Unidad Nº5: Regresión Lineal 
Diagrama de dispersión 171 
Método de mínimos cuadrados 173 
Recta de los mínimos cuadrados 174 
Coeficiente de correlación lineal 179 
Análisis de residuos 186 
Autoevaluación 191 
2
Unidad N°1: Estadística Descriptiva 
Introducción 
La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa información 
relacionada con éste y que es necesaria para la toma de decisiones, hace que la estadística sea hoy, una 
importante herramienta de trabajo. 
Entre las tareas principales de la Estadística, está el de reunir la información integrada por un 
conjunto de datos, con el propósito de obtener conclusiones válidas del comportamiento de éstos, como 
también hacer una inferencia sobre comportamientos futuros. 
En cuanto al uso y la aplicación, puede decirse que abarca todo el ámbito humano encontrándose 
en las relaciones comerciales, financieras, políticas, sociales, etc. siendo fundamental en el campo de la 
investigación y en la toma de decisiones. 
Es así también como en el área de las empresas de servicio y manufactura es posible realizar un 
análisis profundo del proceso estadístico al control de la productividad y de la calidad. 
3
Estadística 
Es el conjunto de métodos y procedimientos que implican recopilación, presentación, ordenación 
y análisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones. 
Pueden distinguirse dos ramas diferentes en Estadística: 
c Estadística Descriptiva, la cual es la que se utiliza en la descripción y análisis de conjuntos de 
4 
datos o población. 
c Inferencia Estadística, la cual hace posible la estimación de una característica de una 
población, o la toma de una decisión con respecto a una población, con base únicamente en resultados 
muestrales. 
Conceptos de elementos utilizados en el análisis estadístico 
1) Población o Universo: Conjunto completo de individuos, objetos, o medidas los cuales poseen 
una característica común observable y que serán considerados en un estudio. 
2) Muestra: Es un subconjunto o una porción de la población. 
3) Variable: Característica o fenómeno de una población o muestra que será estudiada, la cual 
puede tomar diferentes valores. 
4) Datos: Números o medidas que han sido recopiladas como resultado de la observación. 
5) Estadístico: Es una medida, un valor que se calcula para describir una característica a partir de 
una sola muestra. 
6) Parámetro: Es una característica cuantificable de una población.
Recopilación de Información 
La Estadística Descriptiva tiene como función el manejo de los datos recopilados en cuanto se 
refiere a su ordenación y presentación, para poner en evidencia ciertas características en la forma que sea 
más objetiva y útil. 
Una población o universo objeto de una investigación estadística puede ser finita si sus 
elementos se pueden contar. Por ejemplo, número de alumnos de un curso. 
Una población o universo es infinita cuando no es finita. En Estadística, el sentido del término 
población infinita se refiere a una población con un número tan grande de elementos que no le es posible al 
investigador someter a medida cada uno de ellos. 
Cuando se miden cualitativamente las características de una población, resultan categorías que 
deben ser exhaustivas, es decir, que se pueda clasificar a toda la población, y también deben ser 
mutuamente excluyentes, es decir, un mismo elemento no puede pertenecer simultáneamente a dos o más 
categorías. Por ejemplo, sexo de una persona: masculino o femenino. 
Una muestra debe cumplir ciertas condiciones, de aquí surge el concepto de muestra aleatoria 
que es aquella obtenida de modo que cada elemento de la población tiene una oportunidad igual e 
independiente de ser elegido. 
La investigación estadística es toda operación orientada a la recopilación de información sobre 
5 
una población. 
La investigación puede ser tan simple como la recopilación de datos estadísticos obtenidos de 
informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos 
altamente especializados en estas materias, o tan complejas que requiera de la colaboración de especialistas 
en diferentes materias, como ocurre en los censos de población de un país. 
Se denomina variable a fenómenos o características que son medidas en algún tipo de 
investigación estadística.
Variables 
Es muy probable que un especialista en Estadística que realiza una encuesta desee desarrollar un 
instrumento que le permita hacer varias preguntas y manejar diversos fenómenos o características. A estos 
fenómenos o características se les denomina variables aleatorias. 
Según la forma en que se expresen las variables, se dividen en: 
1) Variables Cualitativas: son aquellas que pueden expresarse sólo en forma de atributo. 
Ejemplo: 
1) Estado civil : 
c soltero 
c casado 
c viudo 
c separado 
2) Satisfacción con un producto: 
c muy insatisfecho 
c regularmente insatisfecho 
c neutral 
c satisfecho 
c muy satisfecho 
3) Tamaño de un tablero : 
c grande 
c mediano 
c pequeño 
2) Variables Cuantitativas, son aquellas variables que pueden expresarse en forma numéricaÀ Se 
6 
dividen en discretas y continuas. 
2.1) Variables Cuantitativas Discretas, son respuestas numéricas que surgen de un proceso de 
conteo, siendo siempre un número entero. 
Ejemplos : 
1) Número de asignaturas inscritas en el primer semeste. 
2) Número de integrantes del grupo familiar. 
3) Número de salas de clases del IPVG. 
2.2) Variables Cuantitativas Continuas, son respuestas numéricas que surgen de un proceso de 
medición, las cuales pueden tomar valores entre dos números enteros. 
Ejemplo : 
1) Estatura 
2) Temperatura 
3) Peso
Tabulación de los datos 
En los experimentos estadísticos los datos recolectados pueden corresponder a una población o 
muestra. En ambos casos los procedimientos de resumen de datos son análogos y designaremos por: 
5 ~ Tamaño de la población estudiada 
 ~ Tamaño de la muestra (parte de la población) 
Con el objeto de realizar un mejor estudio de los datos es necesario organizar éstos, mediante el 
7 
uso de distribuciones de frecuencia. 
Una distribución de frecuencia es una tabla resumen en la que se disponen los datos divididos en 
grupos ordenados numéricamente y que se denominan clases o categorías. 
A) Tabulación de datos cualitativos 
La construcción de una distribución de frecuencia de atributos o distribución de frecuencia de 
variable cualitativa es simple, basta enumerar los diversos atributos con su respectiva frecuencia de 
ocurrencia. 
Frecuencia absoluta : ²  ³ indica el número de veces que se repite un atributo. 
Ejemplo: 
Considérese una muestra  trabajadores de una cierta empresa de la región los cuales han sido 
encuestados sobre su actual estado civil. La información es tabulada de la siguiente manera: 
Estado Civil 
Soltero 
Casado 
Viudo 
Separado 
Total 
 
 
	 
 
	 
	 
 
 ~  (tamaño de la muestra) 
 ~  (número de clases)
B) Tabulación de variable cuantitativa 
Distinguiremos dos casos: 
B.1) Tabulación de variable discreta (que toma un conjunto pequeño de 
8 
datos distintos) 
Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos que 
participan son los siguientes: 
a) Frecuencia absoluta : ²  ³ indica el número de veces que se repite una variable. 
b) Tamaño de la muestra : ²  ³ indica la cantidad de elementos que conforman la muestra, se 
obtiene sumando todas las frecuencias absolutas. 
 
 ~   ~ número de clases distintas 
 ~  
 
c) Frecuencia relativa : ²  ³ es la proporción de datos que se encuentra en una clase, se obtiene 
dividiendo la frecuencia absoluta de la clase por el tamaño de la muestra. 
 
  Obs:  
  
 ~ a)  ~  
b)      
d) Frecuencia absoluta acumulada : ² - ³ indica la cantidad de datos que se encuentran hasta 
cierta clase. 
 
   
- ~  
 ~  
e) Frecuencia relativa acumulada : ²/ ³ es la proporción de datos acumulados que se 
encuentran hasta cierta clase. 
 
   Obs:  
/ ~  a) / ~  
 ~  
b)   /   
Ejercicio 
Una empresa que tiene 	 trabajadores se propone reestructurar las remuneraciones, se estudia los 
años de servicio de los trabajadores determinándose los siguientes resultados:
9 
5 ~ 	 (tamaño de la población) 
Se pide: 
À c Tabular la información. 
À c ¿ Qué cantidad de trabajadores tiene
años de servicio ?. 
À c ¿ Qué porcentaje de trabajadores tiene 
 años de servicio ?. 
À c Si aquellos trabajadores que tengan a lo menos siete años de servicio reciben un aumento del
% .¿ Qué porcentaje de los trabajadores recibió dicho aumento?. 
	À c Si todos los trabajadores que tengan a lo más cinco años de servicio reciben una bonificación 
de $À .¿ Qué cantidad de trabajadores recibió dicha bonificación?. 

À c Si la empresa decide otorgar una bonificación especial de $À por cada año de servicio.¿ 
Cuánto será el dinero necesario para cumplir dicha bonificación?. 
Solución 
À c 
Años de servicio 
Total 
  - / 
 
 Á
Á
Á 
  Á  

 
 Á
Á 	 
  Á 
 Á
Á 
  Á
Á  	 Á  
	 Á  
À c Ocho trabajadores tienen
años de servicio 
À c El
% de los trabajadores tiene 
 años de servicio. 
À c El
% de los trabajadores recibió el aumento de sueldo. 
	À c  trabajadores recibieron la bonificación. 

À c $ À
À
 se necesitan para la bonificación por año de servicio.
B.2) Tabulación de variable continua o discreta 
Para tabular una variable continua o discreta (que tome un gran número de datos distintos) se 
10 
necesitan los siguientes elementos: 
a) Rango o recorrido : Es la diferencia entre el valor máximo y valor mínimo que toma la 
variable. 
9 ~ %máx c %mín 
b) Número de intervalos o clases () : Es el número de grupos en que es posible dividir los 
valores de la variable. 
El número de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clases 
puede ocultar la naturaleza general de los datos y un número muy grande puede ser demasiado detallado 
como para revelar alguna información útil. Como regla general se recomienda que el número de clases esté 
entre cinco y veinte. Hay una regla llamada Regla de Sturges que puede dar una aproximación razonable 
para el número de clases, ella es: 
 ~  b Á  ²³ donde  es el número de datos de la muestra. 
c) Amplitud del intervalo o amplitud de la clase () : 
Recorrido 
N° de clases  ~ ~ 
9 
 
d) Límites de un intervalo : Son los valores extremos de una clase. El menor valor es considerado 
como el límite inferior y el valor que se obtiene sumando al límite inferior la amplitud del intervalo es el 
límite inferior de la segunda clase. 
e) Límites reales de un intervalo : Se obtienen calculando el promedio entre el límite superior de 
una clase y el límite inferior de la clase siguiente. 
f) Marca de clase : ² % ³ Es el punto medio de un intervalo. 
g) Frecuencia absoluta : ²  ³ indica el número de observaciones que pertenece a un intervalo 
dado. 
 
Observación:  ~   ~ tamaño de la muestra 
 ~
h) Frecuencia relativa : ²  ³ es la proporción de datos que se encuentra en un intervalo, se 
determina dividiendo la frecuencia absoluta del intervalo por el tamaño de la muestra. 
   Obs:  
11 
 
  
 ~ 
 
i) Frecuencia absoluta acumulada : ² - ³ indica el número de datos de la muestra menores o 
iguales al límite real superior del intervalo . 
 
- ~  - ~  
 ~  
j) Frecuencia relativa acumulada : ²/ ³ indica la proporción de datos de la muestra menores o 
iguales al límite real superior del intervalo . 
 
   
/ ~  
 ~  
Observación: Existe más de un método para construir una tabla de distribución de frecuencias, a 
continuación se presentan dos formas de construirla: 
Ejemplo 
Los siguientes datos corresponden a las notas obtenidas por  alumnos en un curso de 
Estadística ¢
À c Construya la correspondiente distribución de frecuencia. 
À c ¿En qué clase se concentra el mayor número de notas? 
À c ¿Cuál es la frecuencia absoluta del cuarto intervalo?. Interprete el resultado . 
À c ¿Qué porcentaje de los alumnos tienen una nota inferior a 	?
À c ¿Cuántos alumnos tienen una nota superior a 
? 

À c Interprete la frecuencia acumulada del sexto intervalo. 
À c Interprete la frecuencia relativa acumulada del quinto intervalo. 
     
12 
Solución: 
9 ~  c  ~
~  
 ~  b Á  ²³ ~ Á 
 ˜
~ ~ Á 
 ˜  
À c Notas Límites reales %   - / 
 c 
 
Á 	 c 
Á 	 Á 	  Á   Á  
 c 
 
Á 	 c 
Á 	 Á 	  Á   Á  
 c 
 
Á 	 c 
Á 	 Á 	  Á
Á
c 	
 
Á 	 
c	
Á	 	Á	 
 Á
  Á 
	 c 

 	
Á 	 c 

Á 	 
Á 	  Á  	
 Á 	
 

 c 
 

Á 	 c 
Á 	 Á 	  Á  

 Á 

 
 c
Á 	 c
Á
Á 	 	 Á
Á
c
Á 	 c 
Á 	 
Á 	 
 Á 
 
 Á 
 

 c 
 
Á 	 c 
Á 	 Á 	  Á   Á  
Total  Á  
À c El mayor número de notas se concentra en el quinto intervalo, que coresponde al intervalo 
entre 	 c 

. 
À c La frecuencia absoluta del cuarto intervalo es 
. Esto nos indica que son 
 los alumnos que 
tienen una nota entre  c 	
. 
À c El  % de los alumnos tiene una nota inferior a 	. 
	À c El
% de los alumnos tiene una nota superior a 
. 

À c Existen 

 alumnos con nota inferior a . 
À c El 	
 % de los alumnos tiene una nota inferior a 
.
Ejercicios 
1) Los siguientes datos corresponden al sueldo (en miles de pesos) de  trabajadores de una 
13 
empresa ¢
a) Construya la tabla de frecuencia con todos sus elementos. 
b) ¿En qué clase se encuentra el mayor número de trabajadores?. 
c) ¿Qué porcentaje de trabajadores gana entre $ 139.000 y $ 168.000 ?. 
d) ¿Cuántos trabajadores ganan a lo menos $ 159.000 ?. 
e) ¿Cuántos trabajadores ganan a lo más $ 148.000 ?. 
2) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño. 
Los siguientes datos corresponden al peso, en kilógramos, de  de estas piezas, que poseen las mismas 
dimensiones, pero distinta aleación.
a) Construir una tabla de frecuencias de amplitud 	 comenzando desde 
À 
b) ¿Cuántos engranajes pesan entre 
 y 		 Kg.?. 
c) ¿Qué porcentaje representa a aquellos engranajes cuyo peso es inferior a 	1 Kg.?. 
d) ¿Cuál es la frecuencia relativa para aquel intervalo cuya marca de clase es
?. 
e) ¿Qué porcentaje representa a aquellas piezas que pesan más de 	 Kg. ? . 
3) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de 
discos de embrague. Para ello se ha recopilado la siguiente información referente a la duración en horas de 
	 de ellos.
a) Construir una tabla de frecuencia de amplitud cinco comenzando desde
À 
b) ¿Cuántos discos duraron entre 
 y 

 horas?. 
c) ¿Cuántos discos no alcanzaron a durar  horas?. 
d) ¿Qué porcentaje representan los discos que duraron entre  y  horas?. 
e) ¿Qué porcentaje representan los discos que duraron menos de 	 horas?. 
f) ¿Cuántos discos duraron más de 
 horas?. 
g) ¿Cuántos discos duraron menos de 	 horas?. 
h) ¿Qué porcentaje representan los discos que duraron entre
y 
 horas?. 
i) ¿Cuál es el intervalo de mayor frecuencia absoluta?.
4) En un conjunto habitacional se pretende hacer un estudio del número de personas que 
consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional 
son ¢
a) Construir una tabla de fecuencia de amplitud  partiendo desde 
À 
b) ¿Cuántas personas consumen entre  y 
 productos enlatados ?. 
c) ¿Qué porcentaje representa a las personas que consumen menos de 
 productos enlatados?. 
d) ¿Qué cantidad de personas consumen más de
productos enlatados?. 
5) Las ganancias por acción de 40 compañías de la industria de la construcción son: 
Á 
 Á  Á  	Á  Á  Á  Á 	 Á 
 
Á  Á  Á  Á  Á  	Á  Á 	 Á 
 

Á  Á
Á 
 Á  Á  Á  Á  Á
Á 
 Á  	Á  Á 
 Á 
 Á  Á
Á  
Á  Á  Á 
 Á  Á  Á  Á 	 Á 
 
a) Construya una distribución de frecuencias que comience en Á  y tenga una amplitud de Á  
b) ¿Cuál es la frecuencia absoluta del tercer intervalo?. Interprete el resultado . 
c) ¿Qué porcentaje de las compañías tienen a lo más una ganancia de 
Á ? 
d) ¿Cuántas compañías tienen una ganancia a lo menos de Á ? 
e) Interprete la frecuencia acumulada del segundo intervalo. 
f) Interprete la frecuencia relativa acumulada del cuarto intervalo. 
14
15 
Solución 
1)a) 9 ~ 
 c 
 ~ 	 
5 ~  
 ~  b Á  ! ~ 
Á
˜ 
 
	 

 
 ~ ~ 
Á 	 ˜  
Sueldo Límites reales %   - / 

 c
Á 	 c
Á 	 Á 	  Á  Á   

 c
Á 	 c
Á 	 Á 	  Á 	 Á 	  

 c
Á
c
Á 	 Á 	  Á  
     
	 Á 
  

 c
Á 	 c
Á 	 	Á 	 
 Á 	 Á
c
Á 	 c
Á 	 
Á 	 	 Á 	 Á
c
Á 	 c
Á 	 Á 	  Á 	   
Total  
b) En la tercera clase se encuentra el mayor número de trabajadores. 
c) 67,5 % de los trabajadores gana entre $139.000 y $ 168.000 
d) 7 trabajadores ganan a lo menos $ 159.000 
e) 24 trabajadores ganan a lo más $ 148.000 
2) a) Peso Límites reales %   - / 

 c  	Á 	 c Á
Á   Á  
c	 Á	c	Á	   Á
Á
 

 c 	 	Á 	 c 	Á
Á   Á  
	 c 		 	Á 	 c 		 
Á 	 	 
 Á  
 Á 
 
	
 c 
 		Á 	 c 
Á
Á    
Total  
b) 11 engranajes pesan entre 46 y 55 kilos. 
c) El 77 % de las piezas pesan menos de 51 kilos. 
d) La frecuencia relativa es 0,17 
e) El 23 % de las piezas pesa más de 50 kilos.
3) a) Duración Límites reales %   - /
c
Á 	 c
Á
Á
Á
c
Á 	 c 
Á
Á 
  Á  

	 c 

 
Á 	 c 

Á 	 
 	 Á  
    
     
16 
 Á  
 c  

Á 	 c Á 	   Á  
 Á
c 
 Á 	 c 
Á 	  	 Á   Á
c  
Á 	 c Á 	   Á 
  Á  
	 c 
 Á 	 c 
Á 	   Á 
  Á
c  
Á 	 c Á 	  
 Á  
 Á 
 
	 c 
 Á 	 c 
Á 	   Á
Total 	 
b) 13 discos duraron entre 290 y 299 horas. 
c) 22 discos no alcanzaron a durar 300 horas. 
d) El 6 % de los engranajes duraron entre 300 y 314 horas. 
e) El 58 % de los engranajes duraron menos de 305 horas. 
f) 16 engranajes duraron más de 309 horas. 
g) 29 engranajes duraron menos de 305 horas. 
h) El 16 % de los engranajes duraron entre 285 y 294 horas. 
i) El primer intervalo. 
4) a) Nº de personas   - / 

 c 

 	 Á  	 Á  
 c 
  Á
Á
c
Á   Á
c
Á 
  Á  
 c 
 
 Á
Á 	
 
 c 
  Á
Á 
 
 
 c
Á 
  Á
c 
  Á  	  
Total 	 
b) 18 personas consumen entre 100 y 129 productos enlatados. 
c) El 28 % de las personas consume menos de 90 productos enlatados. 
d) 41 personas consume más de 79 productos enlatados. 
5) a) Ganancias Límites Reales %   - / 
Á  c Á  Á 	 c Á 	 Á 	  Á 	  Á 	 
Á  c Á  Á 	 c Á 	 Á 	  Á 	  Á 	 
Á  c 
Á  Á 	 c 
Á 	 	Á 	  
Á 	  Á 
	 

Á  c
Á  
Á 	 c
Á 	 Á 	  Á 	 
 Á
Á  c Á
Á 	 c Á 	 
Á 	  Á 	  Á  
Total  Á  
b) La frecuencia absoluta del tercer intervalo es , es decir, existen  compañías cuyas ganancias 
están entre Á  y 
Á  por acción. 
c) El 
Á 	 % de las compañías tienen a lo más una ganancia de 
Á  por acción. 
d)  compañías tienen a lo menos una ganancia de Á  por acción. 
e)  compañías tienen una ganancia igual o menor a Á  por acción. 
f) El 
Á 	 % de las compañías tienen una ganancia por acción de a lo más
Á .
Representación Gráfica 
Su objetivo es captar la información obtenida en los datos en forma rápida por cualquier persona, 
así cada representación debe llevar un título adecuado. 
Las normas en la construcción de un gráfico estadístico son similares a los de gráficos de 
funciones, las variables independientes, se ubican en las abscisas y las dependientes en las ordenadas. 
Tipos de gráficos 
a) Gráfico circular: se usan para mostrar el comportamiento de las frecuencias relativas, 
absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de sectores 
circulares, proporcionales a las frecuencias. 
Departamento % 
A (1) 
B (2) 
C (3) 
D (4) 
E (5) 
Total
17 
 
Pe rso n al p o r De p ar tame n to 
1 
15% 
2 
28% 
3 
33% 
4 
15% 
5 
9% 
1 
2 
3 
4 
5
b) Pictograma: es un gráfico cuyo uso es similar al de sector circular, pero la frecuencia es 
representada por medio de una figura o dibujo que identifique a la variable en estudio. Este gráfico se 
utiliza para mostrar producciones en una serie cronológica. 
Por ejemplo, Alumnos del Instituto Profesional Dr. Virginio Gómez: 
18 
~  alumnos 
1996: 
1997: 
1998: 
1999: 
2000: 
2001:
c) Gráfico lineal: se utiliza para mostrar las frecuencias absolutas o relativas de una variable 
discreta, son representadas mediante líneas verticales proporcionales a dichas frecuencias. 
19 
%
Total 
 
 
%
d) Gráfico de barra: Se utiliza para representar tablas de frecuencia con atributos o con 
variables discretas y pocos valores. Sobre un eje horizontal se construyen bases de rectángulo del mismo 
ancho cada uno correspondiente a una modalidad del atributo, sobre estas bases se levantan rectángulos 
cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre ellas debe ser 
uniforme. 
20 
Departamento 
ABC 
DE 
Total 
 
 
	 
 

 
	 
 

 
Personal por Departamento 
140 
120 
100 
80 
60 
40 
20 
0 
A B C D E 
Departamento 
Frecuencia
e) Histograma: es el gráfico adecuado cuando los datos están ordenados en tablas con intervalos, 
es decir, para datos de variables continuas. También el histograma es una conformación de rectángulos, 
pero uno al lado de otro cuya área es proporcional a la frecuencia de cada intervalo. Los extremos de la 
base de cada rectángulo son los límites reales del intervalo. 
21 
Límites Reales 
Total 
 
 
Á 	 c
Á
Á 	 c Á 	  
Á 	 c 
Á 	 
 

Á 	 c Á 	  
Á 	 c Á 	  
Á 	 c
Á
HISTOGRAMA 
12 
10 
8 
6 
4 
2 
0 
8,5 12,5 16,5 20,5 24,5 28,5 
4,5 8,5 12,5 16,5 20,5 24,5 
Límites Re a les 
Frecuencia Absoluta
f) Polígono de frecuencia: este gráfico sirve para mostrar la tendencia de la variable, se puede 
determinar a partir de un histograma uniendo los puntos medios superiores de cada rectángulo del 
histograma. También, se determina el polígono uniendo los puntos formado por la marca de clase con la 
frecuencia absoluta del intervalo respectivo. 
22 
Límites reales 
Total 
%  
  
Á 	 c
Á 	 
Á
Á 	 c Á 	 Á 	  
Á 	 c 
Á 	 Á 	 
 

Á 	 c Á
Á 	  
Á 	 c Á 	 Á 	  
Á 	 c
Á 	 
Á
Polígono de F recuencias 
12 
10 
8 
6 
4 
2 
0 
2,5 6,5 10,5 14,5 18,5 22,5 26,5 30,5 
M arcas de Clase s 
Fre cue ncia Absoluta
Observación: El polígono de frecuencias se convierte en polígono de frecuencias relativas, 
cambiando la frecuencia absoluta por la frecuencia relativa, en este caso, el área bajo el polígono de 
frecuencias relativas es igual a . 
23 
Histograma y Polígono de Frecuencias 
Histograma y Polígono de Frecuencias 
12 
10 
8 
6 
4 
2 
0 
Límites Reales 
Frecuencia Absoluta
e) Ojiva: es un gráfico que se usa para mostrar como se acumulan las frecuencias absolutas, 
relativas o porcentuales. Se obtiene al unir los puntos formados por los límites superiores de cada intervalo 
con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se consideran las frecuencias 
porcentuales acumuladas se llama ojiva porcentual. 
24 
Límites reales 
Total 
%  - 
   
c
c
c 
  
  

 c
c     
 c
Ojiva 
40 
36 
32 
28 
24 
20 
16 
12 
8 
4 
0 
4 8 12 16 20 24 28 
Límites Super iore s 
Frecuencia Acum ulada
25 
Ejercicios 
1) Dada la información referente a la ubicación de personas dentro de cuatro departamentos de 
una empresa, se pide ¢ 
a) Tabular la información. 
b) Realizar gráfico circular. 
c) Indique frecuencias relativas porcentuales en cada grupo. 
M A P CC A CC M P P M 
P CC M A M CC P P M P 
A P A M M A M A P M 
M A CC A A M P M M P 
donde ¢ A ~ abastecimiento ; CC ~ control de calidad ; M ~ mantención ; P ~ producción. 
2) Se realizó un número determinado de compras de materia prima. El volumen de la materia 
prima viene dado en m3.Parte de la información se registra en la siguiente tabla ¢ 
Volumen Límites reales 
Total 
%   - / 
     

 c   
 c 	 

 c  
 
 
 c
c   
 
a) Complete la tabla dada. 
b) En un sólo gráfico, dibuje un histograma y un polígono de frecuencia. 
c) ¿Cuántas compras se realizaron entre  y  m3?. 
d) ¿Cuántas compras se realizaron entre 
 y 	 m3?. 
e) ¿Qué porcentaje de compras se realizaron entre 
 y  m3?. 
f) ¿Cuántas compras se realizaron en total?.
3) Los siguientes datos corresponden a la duración, en horas, de 	 válvulas que fueron sometidas 
26 
a un cierto control. 
Tiempo Límites reales 
Total 
%   - / 
     
	 c 

  
	 c 	
 	 
		 c 	

  

 c 

  

	 c 


 	 
 c 
  
	 c 

  
	 
a) Complete la tabla dada. 
b) Grafique la ojiva 
c) ¿Qué porcentaje de las válvulas duraron, en promedio 
Á 	 horas?. 
d) ¿Qué porcentaje de las válvulas duraron entre 
	 y 
 horas?. 
e) ¿Cuántas válvulas duraron menos de 		 horas?. 
f) ¿Qué porcentaje de las válvulas duraron más de 

 horas? 
4) Se realizaron dos experimentos referente al peso, en Kg., aplicado sobre una cierta cantidad de 
tableros. 
Peso(Kg.) A B 
	 c 
   
 c   
 
	 c
c
c 
   
 c    
Total 
  
a) Grafique el histograma del experimento A. 
b) Grafique la ojiva porcentual del experimento B. 
c) Realice, en un mismo gráfico, los polígonos de frecuencia. 
d) Realice, en un mismo gráfico, las ojivas.
5) Dado el siguiente Polígono de Frecuencias: 
Pesos de los Alumnos de C . C ivil 
27 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
35,5 45,5 55,5 65,5 75,5 85,5 95,5 
Pe so (Kg.) 
N° Alumnos 
a)¿Cuáles son los límites reales del cuarto intervalo?. 
b) Interprete la frecuencia del cuarto intervalo. 
c) Interprete el porcentaje de datos que hay en el quinto intervalo. 
d) ¿Qué porcentaje de pesos es igual o menor que 
Á 	 Kg.?. 
e) ¿Cuántos pesos son iguales o mayores que 	Á 	 Kg.?.
28 
Solución 
1) a) Departamento 
A 
CC 
MP 
Total 
 
 
 
	 
 
 
 
b) Gráfico Circular 
Personal por Departamento 
A 
25% 
CC 
13% 
M 
34% 
P 
28% 
A 
CC 
M 
P 
c) Departamento % 
A 
CC 
MP 
Total 
  
  
 À	 	 
	 À	  
 À	 	 
 À
2) a) Volumen %   - / Límites reales 
     

 c
À  À 	À	 c À	 
 c 	   À  À À	 c 	À	 

 c
À 
 À 	À	 c À	 
 c 	  
  
À
À


 À	 c 	À	 

 c
À  À


 	À	 c À	 
Total  À


 
29 
b) Histograma y Polígono de Frecuencia 
Compras de Materia Prima 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
3 8 13 18 23 28 33 
Marcas de Clases 
Frecuencia Absoluta 
c) Entre 11 y 30 m3 se realizaron 26 compras 
d) Entre 16 y 25 m3 se realizaron 15 compras 
e) Entre 16 y 20 m3 se realizaron un porcentaje de 22,2 % de compras 
f) En total se realizaron 27 compras
3) a) Tiempo %   - / Límites reales 
     
	 c 

 Á 	  Á
Á
Á 	 c 

Á 	 
	 c 	
 	Á 	 	 Á  
 Á
Á 	 c 	
Á 	 
		 c 	

 	Á 	  Á   Á  
30 
	
Á 	 c 	

Á 	 

 c 

 
Á 	  Á   Á 
 	

Á 	 c 

Á 	 

	 c 


 
Á 	 	 Á  
 Á 
 

Á 	 c 


Á 	 
 c 
 Á 	  Á 
 
 Á
Á 	 c 
Á 	 
	 c 

 Á 	  Á  	 Á  
Á 	 c 

Á 	 
Total 	 Á  
b) Ojiva 
Dura ción Vá lvula s 
60 
50 
40 
30 
20 
10 
0 
449,5 499,5 549,5 599,5 649,5 699,5 749,5 799,5 
Lím ite s Supe r iore s 
Frecue ncia Acum ulada 
c) 30 % de las válvulas duraron en promedio 674,5 horas 
d) 36 % de las válvulas duraron entre 650 y 749 horas 
e) 9 válvulas duraron menos de 550 horas 
f) 38 % de las válvulas duraron más de 649 horas
31 
4) a) Histograma 
Experimento A 
12 
9 
6 
3 
0 
19,5 24,5 29,5 34,5 39,5 44,5 
14,5 19,5 24,5 29,5 34,5 39,5 
Límites Reales 
Frecuencia Absoluta 
b) Ojiva Porcentual 
Experimento B 
1 
0,9 
0,8 
0,7 
0,6 
0,5 
0,4 
0,3 
0,2 
0,1 
0 
14,5 19,5 24,5 29,5 34,5 39,5 44,5 
Límites Superiores 
Fre c. Acum. Porc.
32 
c) Polígonos de Frecuencia 
Experimento A y B 
12 
11 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
12 17 22 27 32 37 42 47 
Marcas de Clase s 
Frecuencia 
Ser ie 1 Ser ie 2 
Serie 1 ~ Experimento A Serie 2 ~ Experimento B 
d) Ojivas 
Experimento A y B 
45 
40 
35 
30 
25 
20 
15 
10 
5 
0 
14,5 19,5 24,5 29,5 34,5 39,5 44,5 
Límites Superiores 
Frecuencia Acumulada 
Serie1 Serie2 
Serie 1 ~ Experimento A Serie 2 ~ Experimento B
5) a) Los límites reales del cuarto intervalo son Á 	 c
Á 	 
b) 
 alumnos de C. Civil tienen pesos que van desde  kilos hasta
kilos 
c)
% de los alumnos pesan más de
Á 	 kilos y menos de 
Á 	 kilos 
d) El  % de los pesos de los alumnos es igual o menor que 
Á 	 kilos 
e)  alumnos pesan a lo menos 	Á 	Kg. 
33
Medidas de tendencia central y de dispersión 
En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas que 
representan las propiedades de tendencia central, dispersión y forma para extraer y resumir las principales 
características de los datos. Si se calculan a partir de una muestra de datos, se les denomina estadísticos; si 
se les calcula a partir de una población se les denomina parámetros. 
Medidas de tendencia central 
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un 
punto central y por lo general es posible elegir algún valor que describa todo un conjunto de datos. Un 
valor típico descriptivo como ese es una medida de tendencia central o posición. Las medidas de 
tendencia central a estudiar son: media aritmética, mediana y moda. 
Media aritmética 
La media aritmética ( también denominada media ) es la medida de tendencia central que se 
utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos, 
dividiendo después ese total entre el número total de elementos involucrados. 
La media aritmética de un conjunto de valores %Á %Á ÀÀÀÁ % se define como el cuociente entre la 
suma de los valores y el número de ellos. Su símbolo es % si la media aritmética es de una muestra y  si la 
media aritmética es de una población. 
a) Para datos no agrupados: 
 
% b % b ÀÀÀ b % % 
    ; tamaño de la muestra 
Media muestral: % ~ ~  ~ 
  
5 
% b % b ÀÀÀ b % % 
  5  
34 
 ~  
Media poblacional:  ~ ~ ; 5 ~ tamaño de la población 
5 5 
 ~  
Ejemplo ¢ Calcular la media aritmética de los siguientes datos relacionados con las notas de test en 
Estadística obtenidas por un cierto alumno: 
	Á
Á 	
Á 	Á 	Á 
 
	 b
b 	
 b 	 b 	 b 
 
% ~ ~ 		Á  š 		 

 
El promedio de test es 		 puntos.
%  b %  b ÀÀÀ b %  %  %  
          
35 
b) Para datos agrupados: 
Si los datos están ordenados en tablas de frecuencia la media aritmética se obtiene como sigue ¢ 
Muestra Población 
% ~ ~ ~ 
  b   
b ÀÀÀ b   5  ~   ~  
   
donde: % es la marca de clase del intervalo i-ésimo 
 es la frecuencia del intervalo i-ésimo 
 es el número de datos de la muestra y 5 es el número de datos de la población 
es el número de intervalos 
Ejemplo ¢ Calcular la media aritmética para el peso de  trabajadores, según tabla adjunta: 
Peso (Kg.) 
Total 
%  % 
    
		 c
Á 	 	 
Á 	 

 c  

Á 	 	 

Á 	 
 c
Á
c
Á 	 	 Á
c 
 
Á 	  Á
%
% ~ ~ ~ Á  š  
 ~  
  
El peso promedio de los  trabajadores es de  kilos 
Propiedades de la media aritmética 
Propiedad 1 ¢ La media aritmética de una constante es igual a la constante. 
% ¢ % % % À À À % 
valores ¢    À À À  
 b  b  b ÀÀÀ b   
% ~ ~ ~  
  
Por lo tanto, % ~
Propiedad 2 ¢ La media aritmética de una variable más una constante es igual a la media 
% b  b % b  b ÀÀÀ b % b  
    
36 
aritmética de la variable más la constante. 
% ¢ % % % À À À % 
 ¢ % b  % b  % b  À À À % b  
 ~ 
  
 ~  
 
 
 
 ~  
²% b ³ 
 ~ ~ 
  
 
  !   !   ! 
 
  
~ 
% b % b % b ÀÀÀ b % b  
 
 %  
  
~ b 
 ~  
  
~ % b  
Propiedad 3 ¢ La media aritmética de una variable por una constante es igual al producto de la 
constante por la media de la variable. 
% ¢ % % À À À % 
' ¢ % % À À À % 
' ~ 
%  b %  b ÀÀÀ b % 
 
  
~ 
²% b % b ÀÀÀ b %³ 
 
  
~ % 
Propiedad 4 ¢ Media Ponderada 
% ~ 
% h  b % h  b À À À b % h  
      
 b  b À À À b
Ventajas y desventajas del uso de la media aritmética: 
Ventajas Desventajas 
- Estable muestra a muestra - No aplicable a atributos 
- Fácil cálculo e interpretación - Influyen en su valor los valores extremos 
	Á 
 h  b 
Á  h  b Á 
 h 
 	
Á
37 
Ejemplos: 
1) De un grupo de contribuyentes se determinó que el promedio de impuestos es de $32.200. 
Determinar en cada uno de los siguientes casos, la nueva media aritmética: 
a) Los impuestos aumentan en un 2 % 
b) A los impuestos se les disminuye la cantidad de $2.300 
c) A cada contribuyente, se le disminuye un 3 % y además se le condona $2.550 
Solución: 
1) a) % ~ À h Á  ~ À
La nueva media aritmética es $ À
b) % ~ À c À ~ 
À
 La nueva media aritmética es $ 
À
 
c) % ~ À h Á 
 c À		 ~
À
La nueva media aritmética es $
À
2) En tres cursos de un mismo nivel los promedios de las calificaciones fueron 	Á 
 Â 
Á  y Á 
 Â 
si los cursos tenían respectivamente  Â  y 
 alumnos, determine la calificación promedio de los tres 
cursos. 
Solución: 
% ~ ~ ~ 	Á
š 	Á 	 
 b  b 
  
El promedio de las calificaciones de los tres cursos es 	Á
Mediana 
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos. La 
mediana no se ve afectada por observaciones extremas en un conjunto de datos. Por ello, cuando se 
presenta alguna información extrema, resulta apropiado utilizar la mediana, y no la media, para describir el 
conjunto de datos. 
Su símbolo es 4. 
a) Mediana para datos no agrupados 
Se deben ordenar los datos de forma creciente o decreciente. Para muestras con un número par de 
observaciones, la mediana es el dato que queda en el centro de dicha ordenación y para muestras con 
número impar de observaciones la mediana es el promedio de los dos datos centrales. 
Ejemplos ¢ 
1) Para muestra con número impar de datos: 4  ~ ?  b
? b ?  b  
 b  	 
38 
 
datos ¢ Á Á 	Á 
Á Á Á  
datos ordenados ¢ Á Á Á Á 
Á Á  ¬ 4 ~ ? b  ~ ? ~ 	 
 
2) Para muestra con número par de datos: 4  ~ 
? b ? 
  
 b 
 
datos ¢ Á 	Á Á 
Á Á Á Á  
datos ordenados ¢ 
Á 	Á Á Á Á Á Á  
? b ? 
4 ~ ~ ~ ~ Á 	 
   
b) Mediana para datos agrupados 
 c - 
 c 
 8 9 
4  ~ 3 b h  
  
donde:  es el primer intervalo cuya frecuencia acumulada supera a 
 
 
3 es el límite real inferior del intervalo de la mediana. 
 es el número de datos. 
-c es la frecuencia acumulada anterior al intervalo de la mediana. 
 es la frecuencia absoluta del intervalo de la mediana. 
 es la amplitud del intervalo.

Estadistica y probabilidad

  • 1.
    ESTADISTÍCA Y PROBABILIDADES Editado Por G. Aaron Estuardo Morales C h i l e 2 0 1 2 admin2766@gmail.com
  • 2.
    Indice Contenido Página Unidad Nº1: Estadística Descriptiva Introducción 3 Estadística: conceptos previos 4 Variables 6 Tabulación de datos: a) cualitativos 7 b) cuantitativos 8 Representación gráfica 17 Medidas de tendencia central: a) Media aritmética 39 b) Mediana 38 c) Moda 40 Medidas de dispersión: a) Rango 45 b) Desviación media 46 c) Varianza 47 d) Desviación estándar 50 Criterio de homogeneidad 52 Autoevaluación 56 Unidad Nº2: Probabilidades Elementos de probabilidades 58 Concepto de probabilidad en espacio finito equiprobable 60 Axiomas de probabilidad 60 Probabilidad condicional 69 Teorema de Bayes 78 Eventos independientes 83 Variables aleatorias 86 Distribución discreta de probabilidades 87 Distribución continua de probabilidades 89 Esperanza 94 Varianza 94 Distribuciones discretas: Bernuolli 102 Binomial 103 Hipergeométrica 108 Distribución Poisson 113 Distribución continua: Normal 117 Normal estándar 118 Problemas de aplicación 122 1
  • 3.
    Autoevaluación 1 128 Autoevaluación 2 131 Unidad N°3: Intervalos de Confianza Inferencia estadística 134 Estimación de parámetros 134 Estimación por intervalo 134 Intervalo de confianza para la media de una población normal: a) conocida su varianza 135 b) desconocida su varianza 140 Intervalo de confianza para la varianza de una población normal 144 Autoevaluación 148 Unidad N°4: Pruebas de Hipótesis Pruebas de hipótesis 150 Pruebas de unilaterales y bilaterales 152 Pruebas de hipótesis para: a) la media si se conoce su varianza 153 b) la media si se desconoce su varianza 158 c) la varianza 164 Autoevaluación 169 Unidad Nº5: Regresión Lineal Diagrama de dispersión 171 Método de mínimos cuadrados 173 Recta de los mínimos cuadrados 174 Coeficiente de correlación lineal 179 Análisis de residuos 186 Autoevaluación 191 2
  • 4.
    Unidad N°1: EstadísticaDescriptiva Introducción La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa información relacionada con éste y que es necesaria para la toma de decisiones, hace que la estadística sea hoy, una importante herramienta de trabajo. Entre las tareas principales de la Estadística, está el de reunir la información integrada por un conjunto de datos, con el propósito de obtener conclusiones válidas del comportamiento de éstos, como también hacer una inferencia sobre comportamientos futuros. En cuanto al uso y la aplicación, puede decirse que abarca todo el ámbito humano encontrándose en las relaciones comerciales, financieras, políticas, sociales, etc. siendo fundamental en el campo de la investigación y en la toma de decisiones. Es así también como en el área de las empresas de servicio y manufactura es posible realizar un análisis profundo del proceso estadístico al control de la productividad y de la calidad. 3
  • 5.
    Estadística Es elconjunto de métodos y procedimientos que implican recopilación, presentación, ordenación y análisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones. Pueden distinguirse dos ramas diferentes en Estadística: c Estadística Descriptiva, la cual es la que se utiliza en la descripción y análisis de conjuntos de 4 datos o población. c Inferencia Estadística, la cual hace posible la estimación de una característica de una población, o la toma de una decisión con respecto a una población, con base únicamente en resultados muestrales. Conceptos de elementos utilizados en el análisis estadístico 1) Población o Universo: Conjunto completo de individuos, objetos, o medidas los cuales poseen una característica común observable y que serán considerados en un estudio. 2) Muestra: Es un subconjunto o una porción de la población. 3) Variable: Característica o fenómeno de una población o muestra que será estudiada, la cual puede tomar diferentes valores. 4) Datos: Números o medidas que han sido recopiladas como resultado de la observación. 5) Estadístico: Es una medida, un valor que se calcula para describir una característica a partir de una sola muestra. 6) Parámetro: Es una característica cuantificable de una población.
  • 6.
    Recopilación de Información La Estadística Descriptiva tiene como función el manejo de los datos recopilados en cuanto se refiere a su ordenación y presentación, para poner en evidencia ciertas características en la forma que sea más objetiva y útil. Una población o universo objeto de una investigación estadística puede ser finita si sus elementos se pueden contar. Por ejemplo, número de alumnos de un curso. Una población o universo es infinita cuando no es finita. En Estadística, el sentido del término población infinita se refiere a una población con un número tan grande de elementos que no le es posible al investigador someter a medida cada uno de ellos. Cuando se miden cualitativamente las características de una población, resultan categorías que deben ser exhaustivas, es decir, que se pueda clasificar a toda la población, y también deben ser mutuamente excluyentes, es decir, un mismo elemento no puede pertenecer simultáneamente a dos o más categorías. Por ejemplo, sexo de una persona: masculino o femenino. Una muestra debe cumplir ciertas condiciones, de aquí surge el concepto de muestra aleatoria que es aquella obtenida de modo que cada elemento de la población tiene una oportunidad igual e independiente de ser elegido. La investigación estadística es toda operación orientada a la recopilación de información sobre 5 una población. La investigación puede ser tan simple como la recopilación de datos estadísticos obtenidos de informaciones provenientes de fuentes oficiales a nivel institucional o de publicaciones de organismos altamente especializados en estas materias, o tan complejas que requiera de la colaboración de especialistas en diferentes materias, como ocurre en los censos de población de un país. Se denomina variable a fenómenos o características que son medidas en algún tipo de investigación estadística.
  • 7.
    Variables Es muyprobable que un especialista en Estadística que realiza una encuesta desee desarrollar un instrumento que le permita hacer varias preguntas y manejar diversos fenómenos o características. A estos fenómenos o características se les denomina variables aleatorias. Según la forma en que se expresen las variables, se dividen en: 1) Variables Cualitativas: son aquellas que pueden expresarse sólo en forma de atributo. Ejemplo: 1) Estado civil : c soltero c casado c viudo c separado 2) Satisfacción con un producto: c muy insatisfecho c regularmente insatisfecho c neutral c satisfecho c muy satisfecho 3) Tamaño de un tablero : c grande c mediano c pequeño 2) Variables Cuantitativas, son aquellas variables que pueden expresarse en forma numéricaÀ Se 6 dividen en discretas y continuas. 2.1) Variables Cuantitativas Discretas, son respuestas numéricas que surgen de un proceso de conteo, siendo siempre un número entero. Ejemplos : 1) Número de asignaturas inscritas en el primer semeste. 2) Número de integrantes del grupo familiar. 3) Número de salas de clases del IPVG. 2.2) Variables Cuantitativas Continuas, son respuestas numéricas que surgen de un proceso de medición, las cuales pueden tomar valores entre dos números enteros. Ejemplo : 1) Estatura 2) Temperatura 3) Peso
  • 8.
    Tabulación de losdatos En los experimentos estadísticos los datos recolectados pueden corresponder a una población o muestra. En ambos casos los procedimientos de resumen de datos son análogos y designaremos por: 5 ~ Tamaño de la población estudiada ~ Tamaño de la muestra (parte de la población) Con el objeto de realizar un mejor estudio de los datos es necesario organizar éstos, mediante el 7 uso de distribuciones de frecuencia. Una distribución de frecuencia es una tabla resumen en la que se disponen los datos divididos en grupos ordenados numéricamente y que se denominan clases o categorías. A) Tabulación de datos cualitativos La construcción de una distribución de frecuencia de atributos o distribución de frecuencia de variable cualitativa es simple, basta enumerar los diversos atributos con su respectiva frecuencia de ocurrencia. Frecuencia absoluta : ² ³ indica el número de veces que se repite un atributo. Ejemplo: Considérese una muestra trabajadores de una cierta empresa de la región los cuales han sido encuestados sobre su actual estado civil. La información es tabulada de la siguiente manera: Estado Civil Soltero Casado Viudo Separado Total ~ (tamaño de la muestra) ~ (número de clases)
  • 9.
    B) Tabulación devariable cuantitativa Distinguiremos dos casos: B.1) Tabulación de variable discreta (que toma un conjunto pequeño de 8 datos distintos) Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos que participan son los siguientes: a) Frecuencia absoluta : ² ³ indica el número de veces que se repite una variable. b) Tamaño de la muestra : ² ³ indica la cantidad de elementos que conforman la muestra, se obtiene sumando todas las frecuencias absolutas. ~ ~ número de clases distintas ~ c) Frecuencia relativa : ² ³ es la proporción de datos que se encuentra en una clase, se obtiene dividiendo la frecuencia absoluta de la clase por el tamaño de la muestra. Obs: ~ a) ~ b)   d) Frecuencia absoluta acumulada : ² - ³ indica la cantidad de datos que se encuentran hasta cierta clase. - ~ ~ e) Frecuencia relativa acumulada : ²/ ³ es la proporción de datos acumulados que se encuentran hasta cierta clase. Obs: / ~ a) / ~ ~ b)  /  Ejercicio Una empresa que tiene trabajadores se propone reestructurar las remuneraciones, se estudia los años de servicio de los trabajadores determinándose los siguientes resultados:
  • 15.
    9 5 ~ (tamaño de la población) Se pide: À c Tabular la información. À c ¿ Qué cantidad de trabajadores tiene
  • 16.
    años de servicio?. À c ¿ Qué porcentaje de trabajadores tiene años de servicio ?. À c Si aquellos trabajadores que tengan a lo menos siete años de servicio reciben un aumento del
  • 17.
    % .¿ Quéporcentaje de los trabajadores recibió dicho aumento?. À c Si todos los trabajadores que tengan a lo más cinco años de servicio reciben una bonificación de $À .¿ Qué cantidad de trabajadores recibió dicha bonificación?. À c Si la empresa decide otorgar una bonificación especial de $À por cada año de servicio.¿ Cuánto será el dinero necesario para cumplir dicha bonificación?. Solución À c Años de servicio Total - / Á
  • 18.
  • 20.
    Á Á Á
  • 21.
    Á Á Á
  • 23.
    Á Á
  • 25.
    Á Á Á À c Ocho trabajadores tienen
  • 26.
  • 27.
    % de lostrabajadores tiene años de servicio. À c El
  • 28.
    % de lostrabajadores recibió el aumento de sueldo. À c trabajadores recibieron la bonificación. À c $ À À se necesitan para la bonificación por año de servicio.
  • 29.
    B.2) Tabulación devariable continua o discreta Para tabular una variable continua o discreta (que tome un gran número de datos distintos) se 10 necesitan los siguientes elementos: a) Rango o recorrido : Es la diferencia entre el valor máximo y valor mínimo que toma la variable. 9 ~ %máx c %mín b) Número de intervalos o clases () : Es el número de grupos en que es posible dividir los valores de la variable. El número de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clases puede ocultar la naturaleza general de los datos y un número muy grande puede ser demasiado detallado como para revelar alguna información útil. Como regla general se recomienda que el número de clases esté entre cinco y veinte. Hay una regla llamada Regla de Sturges que puede dar una aproximación razonable para el número de clases, ella es: ~ b Á ²³ donde es el número de datos de la muestra. c) Amplitud del intervalo o amplitud de la clase () : Recorrido N° de clases ~ ~ 9 d) Límites de un intervalo : Son los valores extremos de una clase. El menor valor es considerado como el límite inferior y el valor que se obtiene sumando al límite inferior la amplitud del intervalo es el límite inferior de la segunda clase. e) Límites reales de un intervalo : Se obtienen calculando el promedio entre el límite superior de una clase y el límite inferior de la clase siguiente. f) Marca de clase : ² % ³ Es el punto medio de un intervalo. g) Frecuencia absoluta : ² ³ indica el número de observaciones que pertenece a un intervalo dado. Observación: ~ ~ tamaño de la muestra ~
  • 30.
    h) Frecuencia relativa: ² ³ es la proporción de datos que se encuentra en un intervalo, se determina dividiendo la frecuencia absoluta del intervalo por el tamaño de la muestra. Obs: 11 ~ i) Frecuencia absoluta acumulada : ² - ³ indica el número de datos de la muestra menores o iguales al límite real superior del intervalo . - ~ - ~ ~ j) Frecuencia relativa acumulada : ²/ ³ indica la proporción de datos de la muestra menores o iguales al límite real superior del intervalo . / ~ ~ Observación: Existe más de un método para construir una tabla de distribución de frecuencias, a continuación se presentan dos formas de construirla: Ejemplo Los siguientes datos corresponden a las notas obtenidas por alumnos en un curso de Estadística ¢
  • 38.
    À c Construyala correspondiente distribución de frecuencia. À c ¿En qué clase se concentra el mayor número de notas? À c ¿Cuál es la frecuencia absoluta del cuarto intervalo?. Interprete el resultado . À c ¿Qué porcentaje de los alumnos tienen una nota inferior a ?
  • 39.
    À c ¿Cuántosalumnos tienen una nota superior a ? À c Interprete la frecuencia acumulada del sexto intervalo. À c Interprete la frecuencia relativa acumulada del quinto intervalo. 12 Solución: 9 ~ c ~
  • 40.
    ~ ~ b Á ²³ ~ Á ˜
  • 42.
    ~ ~ Á ˜ À c Notas Límites reales % - / c Á c Á Á Á Á c Á c Á Á Á Á c Á c Á Á Á
  • 43.
  • 44.
    c Á c Á Á Á Á c Á c Á Á Á Á c Á c Á Á Á Á c
  • 45.
  • 46.
  • 47.
    Á Á
  • 48.
  • 49.
  • 50.
    Á c Á Á Á Á c Á c Á Á Á Á Total Á À c El mayor número de notas se concentra en el quinto intervalo, que coresponde al intervalo entre c . À c La frecuencia absoluta del cuarto intervalo es . Esto nos indica que son los alumnos que tienen una nota entre c . À c El % de los alumnos tiene una nota inferior a . À c El
  • 51.
    % de losalumnos tiene una nota superior a . À c Existen alumnos con nota inferior a . À c El % de los alumnos tiene una nota inferior a .
  • 52.
    Ejercicios 1) Lossiguientes datos corresponden al sueldo (en miles de pesos) de trabajadores de una 13 empresa ¢
  • 53.
    a) Construya latabla de frecuencia con todos sus elementos. b) ¿En qué clase se encuentra el mayor número de trabajadores?. c) ¿Qué porcentaje de trabajadores gana entre $ 139.000 y $ 168.000 ?. d) ¿Cuántos trabajadores ganan a lo menos $ 159.000 ?. e) ¿Cuántos trabajadores ganan a lo más $ 148.000 ?. 2) En una industria es necesario realizar un estudio respecto al peso de engranajes de gran tamaño. Los siguientes datos corresponden al peso, en kilógramos, de de estas piezas, que poseen las mismas dimensiones, pero distinta aleación.
  • 54.
    a) Construir unatabla de frecuencias de amplitud comenzando desde À b) ¿Cuántos engranajes pesan entre y Kg.?. c) ¿Qué porcentaje representa a aquellos engranajes cuyo peso es inferior a 1 Kg.?. d) ¿Cuál es la frecuencia relativa para aquel intervalo cuya marca de clase es
  • 55.
    ?. e) ¿Quéporcentaje representa a aquellas piezas que pesan más de Kg. ? . 3) En una industria automotriz es necesario realizar un estudio debido a una partida defectuosa de discos de embrague. Para ello se ha recopilado la siguiente información referente a la duración en horas de de ellos.
  • 57.
    a) Construir unatabla de frecuencia de amplitud cinco comenzando desde
  • 58.
    À b) ¿Cuántosdiscos duraron entre y horas?. c) ¿Cuántos discos no alcanzaron a durar horas?. d) ¿Qué porcentaje representan los discos que duraron entre y horas?. e) ¿Qué porcentaje representan los discos que duraron menos de horas?. f) ¿Cuántos discos duraron más de horas?. g) ¿Cuántos discos duraron menos de horas?. h) ¿Qué porcentaje representan los discos que duraron entre
  • 59.
    y horas?. i) ¿Cuál es el intervalo de mayor frecuencia absoluta?.
  • 60.
    4) En unconjunto habitacional se pretende hacer un estudio del número de personas que consumen productos enlatados. Los datos que han sido obtenidos de 50 bloques del conjunto habitacional son ¢
  • 61.
    a) Construir unatabla de fecuencia de amplitud partiendo desde À b) ¿Cuántas personas consumen entre y productos enlatados ?. c) ¿Qué porcentaje representa a las personas que consumen menos de productos enlatados?. d) ¿Qué cantidad de personas consumen más de
  • 62.
    productos enlatados?. 5)Las ganancias por acción de 40 compañías de la industria de la construcción son: Á Á Á Á Á Á Á Á Á Á Á Á Á Á Á Á Á Á
  • 63.
    Á Á Á Á Á Á
  • 64.
    Á Á Á Á Á Á Á
  • 65.
    Á Á Á Á Á Á Á Á Á a) Construya una distribución de frecuencias que comience en Á y tenga una amplitud de Á b) ¿Cuál es la frecuencia absoluta del tercer intervalo?. Interprete el resultado . c) ¿Qué porcentaje de las compañías tienen a lo más una ganancia de Á ? d) ¿Cuántas compañías tienen una ganancia a lo menos de Á ? e) Interprete la frecuencia acumulada del segundo intervalo. f) Interprete la frecuencia relativa acumulada del cuarto intervalo. 14
  • 66.
    15 Solución 1)a)9 ~ c ~ 5 ~ ~ b Á ! ~ Á
  • 67.
    ˜ ~ ~ Á ˜ Sueldo Límites reales % - / c
  • 68.
  • 69.
    Á Á Á Á c
  • 70.
  • 71.
    Á Á Á Á c
  • 72.
  • 73.
  • 74.
    Á Á Á Á c
  • 75.
  • 76.
    Á Á Á Á
  • 77.
  • 78.
  • 79.
    Á Á Á Á
  • 80.
  • 81.
  • 82.
    Á Á Á Total b) En la tercera clase se encuentra el mayor número de trabajadores. c) 67,5 % de los trabajadores gana entre $139.000 y $ 168.000 d) 7 trabajadores ganan a lo menos $ 159.000 e) 24 trabajadores ganan a lo más $ 148.000 2) a) Peso Límites reales % - / c Á c Á
  • 83.
    Á Á c Á c Á Á
  • 84.
    Á c Á c Á
  • 85.
    Á Á c Á c Á Á Á c Á c Á
  • 86.
    Á Total b) 11 engranajes pesan entre 46 y 55 kilos. c) El 77 % de las piezas pesan menos de 51 kilos. d) La frecuencia relativa es 0,17 e) El 23 % de las piezas pesa más de 50 kilos.
  • 87.
    3) a) DuraciónLímites reales % - /
  • 88.
  • 89.
  • 90.
  • 91.
  • 92.
  • 93.
  • 94.
    Á c Á
  • 95.
    Á Á c Á c Á Á 16 Á c Á c Á Á Á
  • 96.
    c Á c Á Á Á
  • 97.
    c Á c Á Á Á c Á c Á Á Á
  • 98.
    c Á c Á Á Á c Á c Á Á
  • 99.
    Total b)13 discos duraron entre 290 y 299 horas. c) 22 discos no alcanzaron a durar 300 horas. d) El 6 % de los engranajes duraron entre 300 y 314 horas. e) El 58 % de los engranajes duraron menos de 305 horas. f) 16 engranajes duraron más de 309 horas. g) 29 engranajes duraron menos de 305 horas. h) El 16 % de los engranajes duraron entre 285 y 294 horas. i) El primer intervalo. 4) a) Nº de personas - / c Á Á c Á
  • 100.
  • 102.
  • 103.
    Á Á
  • 104.
  • 105.
    Á Á c Á
  • 106.
    Á c Á
  • 107.
    Á c
  • 108.
    Á Á
  • 109.
    c Á Total b) 18 personas consumen entre 100 y 129 productos enlatados. c) El 28 % de las personas consume menos de 90 productos enlatados. d) 41 personas consume más de 79 productos enlatados. 5) a) Ganancias Límites Reales % - / Á c Á Á c Á Á Á Á Á c Á Á c Á Á Á Á Á c Á Á c Á Á Á Á Á c
  • 110.
  • 111.
    Á Á Á Á
  • 112.
    Á cÁ
  • 113.
    Á cÁ Á Á Á Total Á b) La frecuencia absoluta del tercer intervalo es , es decir, existen compañías cuyas ganancias están entre Á y Á por acción. c) El Á % de las compañías tienen a lo más una ganancia de Á por acción. d) compañías tienen a lo menos una ganancia de Á por acción. e) compañías tienen una ganancia igual o menor a Á por acción. f) El Á % de las compañías tienen una ganancia por acción de a lo más
  • 114.
  • 115.
    Representación Gráfica Suobjetivo es captar la información obtenida en los datos en forma rápida por cualquier persona, así cada representación debe llevar un título adecuado. Las normas en la construcción de un gráfico estadístico son similares a los de gráficos de funciones, las variables independientes, se ubican en las abscisas y las dependientes en las ordenadas. Tipos de gráficos a) Gráfico circular: se usan para mostrar el comportamiento de las frecuencias relativas, absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de sectores circulares, proporcionales a las frecuencias. Departamento % A (1) B (2) C (3) D (4) E (5) Total
  • 116.
    17 Perso n al p o r De p ar tame n to 1 15% 2 28% 3 33% 4 15% 5 9% 1 2 3 4 5
  • 117.
    b) Pictograma: esun gráfico cuyo uso es similar al de sector circular, pero la frecuencia es representada por medio de una figura o dibujo que identifique a la variable en estudio. Este gráfico se utiliza para mostrar producciones en una serie cronológica. Por ejemplo, Alumnos del Instituto Profesional Dr. Virginio Gómez: 18 ~ alumnos 1996: 1997: 1998: 1999: 2000: 2001:
  • 118.
    c) Gráfico lineal:se utiliza para mostrar las frecuencias absolutas o relativas de una variable discreta, son representadas mediante líneas verticales proporcionales a dichas frecuencias. 19 %
  • 119.
  • 120.
    d) Gráfico debarra: Se utiliza para representar tablas de frecuencia con atributos o con variables discretas y pocos valores. Sobre un eje horizontal se construyen bases de rectángulo del mismo ancho cada uno correspondiente a una modalidad del atributo, sobre estas bases se levantan rectángulos cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre ellas debe ser uniforme. 20 Departamento ABC DE Total Personal por Departamento 140 120 100 80 60 40 20 0 A B C D E Departamento Frecuencia
  • 121.
    e) Histograma: esel gráfico adecuado cuando los datos están ordenados en tablas con intervalos, es decir, para datos de variables continuas. También el histograma es una conformación de rectángulos, pero uno al lado de otro cuya área es proporcional a la frecuencia de cada intervalo. Los extremos de la base de cada rectángulo son los límites reales del intervalo. 21 Límites Reales Total Á c
  • 122.
  • 124.
    Á cÁ Á c Á Á c Á Á c Á Á c
  • 125.
  • 126.
    HISTOGRAMA 12 10 8 6 4 2 0 8,5 12,5 16,5 20,5 24,5 28,5 4,5 8,5 12,5 16,5 20,5 24,5 Límites Re a les Frecuencia Absoluta
  • 127.
    f) Polígono defrecuencia: este gráfico sirve para mostrar la tendencia de la variable, se puede determinar a partir de un histograma uniendo los puntos medios superiores de cada rectángulo del histograma. También, se determina el polígono uniendo los puntos formado por la marca de clase con la frecuencia absoluta del intervalo respectivo. 22 Límites reales Total % Á c
  • 128.
  • 130.
    Á cÁ Á Á c Á Á Á c Á
  • 131.
    Á Á c Á Á Á c
  • 132.
  • 133.
    Polígono de Frecuencias 12 10 8 6 4 2 0 2,5 6,5 10,5 14,5 18,5 22,5 26,5 30,5 M arcas de Clase s Fre cue ncia Absoluta
  • 134.
    Observación: El polígonode frecuencias se convierte en polígono de frecuencias relativas, cambiando la frecuencia absoluta por la frecuencia relativa, en este caso, el área bajo el polígono de frecuencias relativas es igual a . 23 Histograma y Polígono de Frecuencias Histograma y Polígono de Frecuencias 12 10 8 6 4 2 0 Límites Reales Frecuencia Absoluta
  • 135.
    e) Ojiva: esun gráfico que se usa para mostrar como se acumulan las frecuencias absolutas, relativas o porcentuales. Se obtiene al unir los puntos formados por los límites superiores de cada intervalo con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se consideran las frecuencias porcentuales acumuladas se llama ojiva porcentual. 24 Límites reales Total % - c
  • 139.
  • 140.
    c c
  • 141.
    c c
  • 142.
    Ojiva 40 36 32 28 24 20 16 12 8 4 0 4 8 12 16 20 24 28 Límites Super iore s Frecuencia Acum ulada
  • 143.
    25 Ejercicios 1)Dada la información referente a la ubicación de personas dentro de cuatro departamentos de una empresa, se pide ¢ a) Tabular la información. b) Realizar gráfico circular. c) Indique frecuencias relativas porcentuales en cada grupo. M A P CC A CC M P P M P CC M A M CC P P M P A P A M M A M A P M M A CC A A M P M M P donde ¢ A ~ abastecimiento ; CC ~ control de calidad ; M ~ mantención ; P ~ producción. 2) Se realizó un número determinado de compras de materia prima. El volumen de la materia prima viene dado en m3.Parte de la información se registra en la siguiente tabla ¢ Volumen Límites reales Total % - / c c c c
  • 144.
    c a) Complete la tabla dada. b) En un sólo gráfico, dibuje un histograma y un polígono de frecuencia. c) ¿Cuántas compras se realizaron entre y m3?. d) ¿Cuántas compras se realizaron entre y m3?. e) ¿Qué porcentaje de compras se realizaron entre y m3?. f) ¿Cuántas compras se realizaron en total?.
  • 145.
    3) Los siguientesdatos corresponden a la duración, en horas, de válvulas que fueron sometidas 26 a un cierto control. Tiempo Límites reales Total % - / c c c c c c c a) Complete la tabla dada. b) Grafique la ojiva c) ¿Qué porcentaje de las válvulas duraron, en promedio Á horas?. d) ¿Qué porcentaje de las válvulas duraron entre y horas?. e) ¿Cuántas válvulas duraron menos de horas?. f) ¿Qué porcentaje de las válvulas duraron más de horas? 4) Se realizaron dos experimentos referente al peso, en Kg., aplicado sobre una cierta cantidad de tableros. Peso(Kg.) A B c c c
  • 146.
  • 147.
    c c Total a) Grafique el histograma del experimento A. b) Grafique la ojiva porcentual del experimento B. c) Realice, en un mismo gráfico, los polígonos de frecuencia. d) Realice, en un mismo gráfico, las ojivas.
  • 148.
    5) Dado elsiguiente Polígono de Frecuencias: Pesos de los Alumnos de C . C ivil 27 10 9 8 7 6 5 4 3 2 1 0 35,5 45,5 55,5 65,5 75,5 85,5 95,5 Pe so (Kg.) N° Alumnos a)¿Cuáles son los límites reales del cuarto intervalo?. b) Interprete la frecuencia del cuarto intervalo. c) Interprete el porcentaje de datos que hay en el quinto intervalo. d) ¿Qué porcentaje de pesos es igual o menor que Á Kg.?. e) ¿Cuántos pesos son iguales o mayores que Á Kg.?.
  • 149.
    28 Solución 1)a) Departamento A CC MP Total b) Gráfico Circular Personal por Departamento A 25% CC 13% M 34% P 28% A CC M P c) Departamento % A CC MP Total À À À À
  • 150.
    2) a) Volumen% - / Límites reales c
  • 151.
    À À À c À c À À À c À c
  • 152.
    À À À c À c À
  • 153.
    À À c À c
  • 154.
    À À À c À Total À 29 b) Histograma y Polígono de Frecuencia Compras de Materia Prima 10 9 8 7 6 5 4 3 2 1 0 3 8 13 18 23 28 33 Marcas de Clases Frecuencia Absoluta c) Entre 11 y 30 m3 se realizaron 26 compras d) Entre 16 y 25 m3 se realizaron 15 compras e) Entre 16 y 20 m3 se realizaron un porcentaje de 22,2 % de compras f) En total se realizaron 27 compras
  • 155.
    3) a) Tiempo% - / Límites reales c Á Á
  • 156.
  • 157.
    Á c Á c Á Á Á
  • 158.
    Á c Á c Á Á Á 30 Á c Á c Á Á Á Á c Á c Á Á Á Á c Á c Á Á Á
  • 159.
    Á c Á c Á Á Á Á c Á Total Á b) Ojiva Dura ción Vá lvula s 60 50 40 30 20 10 0 449,5 499,5 549,5 599,5 649,5 699,5 749,5 799,5 Lím ite s Supe r iore s Frecue ncia Acum ulada c) 30 % de las válvulas duraron en promedio 674,5 horas d) 36 % de las válvulas duraron entre 650 y 749 horas e) 9 válvulas duraron menos de 550 horas f) 38 % de las válvulas duraron más de 649 horas
  • 160.
    31 4) a)Histograma Experimento A 12 9 6 3 0 19,5 24,5 29,5 34,5 39,5 44,5 14,5 19,5 24,5 29,5 34,5 39,5 Límites Reales Frecuencia Absoluta b) Ojiva Porcentual Experimento B 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 14,5 19,5 24,5 29,5 34,5 39,5 44,5 Límites Superiores Fre c. Acum. Porc.
  • 161.
    32 c) Polígonosde Frecuencia Experimento A y B 12 11 10 9 8 7 6 5 4 3 2 1 0 12 17 22 27 32 37 42 47 Marcas de Clase s Frecuencia Ser ie 1 Ser ie 2 Serie 1 ~ Experimento A Serie 2 ~ Experimento B d) Ojivas Experimento A y B 45 40 35 30 25 20 15 10 5 0 14,5 19,5 24,5 29,5 34,5 39,5 44,5 Límites Superiores Frecuencia Acumulada Serie1 Serie2 Serie 1 ~ Experimento A Serie 2 ~ Experimento B
  • 162.
    5) a) Loslímites reales del cuarto intervalo son Á c
  • 163.
    Á b) alumnos de C. Civil tienen pesos que van desde kilos hasta
  • 164.
  • 165.
    % de losalumnos pesan más de
  • 166.
    Á kilosy menos de Á kilos d) El % de los pesos de los alumnos es igual o menor que Á kilos e) alumnos pesan a lo menos Á Kg. 33
  • 167.
    Medidas de tendenciacentral y de dispersión En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas que representan las propiedades de tendencia central, dispersión y forma para extraer y resumir las principales características de los datos. Si se calculan a partir de una muestra de datos, se les denomina estadísticos; si se les calcula a partir de una población se les denomina parámetros. Medidas de tendencia central La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un punto central y por lo general es posible elegir algún valor que describa todo un conjunto de datos. Un valor típico descriptivo como ese es una medida de tendencia central o posición. Las medidas de tendencia central a estudiar son: media aritmética, mediana y moda. Media aritmética La media aritmética ( también denominada media ) es la medida de tendencia central que se utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos, dividiendo después ese total entre el número total de elementos involucrados. La media aritmética de un conjunto de valores %Á %Á ÀÀÀÁ % se define como el cuociente entre la suma de los valores y el número de ellos. Su símbolo es % si la media aritmética es de una muestra y si la media aritmética es de una población. a) Para datos no agrupados: % b % b ÀÀÀ b % % ; tamaño de la muestra Media muestral: % ~ ~ ~ 5 % b % b ÀÀÀ b % % 5 34 ~ Media poblacional: ~ ~ ; 5 ~ tamaño de la población 5 5 ~ Ejemplo ¢ Calcular la media aritmética de los siguientes datos relacionados con las notas de test en Estadística obtenidas por un cierto alumno: Á
  • 168.
    Á Á Á Á b
  • 169.
    b b b b % ~ ~ Á š El promedio de test es puntos.
  • 170.
    % b% b ÀÀÀ b % % % 35 b) Para datos agrupados: Si los datos están ordenados en tablas de frecuencia la media aritmética se obtiene como sigue ¢ Muestra Población % ~ ~ ~ b b ÀÀÀ b 5 ~ ~ donde: % es la marca de clase del intervalo i-ésimo es la frecuencia del intervalo i-ésimo es el número de datos de la muestra y 5 es el número de datos de la población es el número de intervalos Ejemplo ¢ Calcular la media aritmética para el peso de trabajadores, según tabla adjunta: Peso (Kg.) Total % % c
  • 171.
    Á Á c Á Á c
  • 172.
  • 173.
  • 175.
    Á Á
  • 176.
    c Á Á
  • 178.
  • 180.
    % ~ ~~ Á š ~ El peso promedio de los trabajadores es de kilos Propiedades de la media aritmética Propiedad 1 ¢ La media aritmética de una constante es igual a la constante. % ¢ % % % À À À % valores ¢ À À À b b b ÀÀÀ b % ~ ~ ~ Por lo tanto, % ~
  • 181.
    Propiedad 2 ¢La media aritmética de una variable más una constante es igual a la media % b b % b b ÀÀÀ b % b 36 aritmética de la variable más la constante. % ¢ % % % À À À % ¢ % b % b % b À À À % b ~ ~ ~ ²% b ³ ~ ~ ! ! ! ~ % b % b % b ÀÀÀ b % b % ~ b ~ ~ % b Propiedad 3 ¢ La media aritmética de una variable por una constante es igual al producto de la constante por la media de la variable. % ¢ % % À À À % ' ¢ % % À À À % ' ~ % b % b ÀÀÀ b % ~ ²% b % b ÀÀÀ b %³ ~ % Propiedad 4 ¢ Media Ponderada % ~ % h b % h b À À À b % h b b À À À b
  • 182.
    Ventajas y desventajasdel uso de la media aritmética: Ventajas Desventajas - Estable muestra a muestra - No aplicable a atributos - Fácil cálculo e interpretación - Influyen en su valor los valores extremos Á h b Á h b Á h Á
  • 183.
    37 Ejemplos: 1)De un grupo de contribuyentes se determinó que el promedio de impuestos es de $32.200. Determinar en cada uno de los siguientes casos, la nueva media aritmética: a) Los impuestos aumentan en un 2 % b) A los impuestos se les disminuye la cantidad de $2.300 c) A cada contribuyente, se le disminuye un 3 % y además se le condona $2.550 Solución: 1) a) % ~ À h Á ~ À
  • 184.
    La nueva mediaaritmética es $ À
  • 185.
    b) % ~À c À ~ À La nueva media aritmética es $ À c) % ~ À h Á c À ~
  • 186.
  • 187.
    La nueva mediaaritmética es $
  • 188.
  • 189.
    2) En trescursos de un mismo nivel los promedios de las calificaciones fueron Á  Á y Á  si los cursos tenían respectivamente  y alumnos, determine la calificación promedio de los tres cursos. Solución: % ~ ~ ~ Á
  • 190.
    š Á b b El promedio de las calificaciones de los tres cursos es Á
  • 191.
    Mediana La medianaes el valor que se encuentra en el centro de una secuencia ordenada de datos. La mediana no se ve afectada por observaciones extremas en un conjunto de datos. Por ello, cuando se presenta alguna información extrema, resulta apropiado utilizar la mediana, y no la media, para describir el conjunto de datos. Su símbolo es 4. a) Mediana para datos no agrupados Se deben ordenar los datos de forma creciente o decreciente. Para muestras con un número par de observaciones, la mediana es el dato que queda en el centro de dicha ordenación y para muestras con número impar de observaciones la mediana es el promedio de los dos datos centrales. Ejemplos ¢ 1) Para muestra con número impar de datos: 4 ~ ? b
  • 193.
    ? b ? b b 38 datos ¢ Á Á Á Á Á Á datos ordenados ¢ Á Á Á Á Á Á ¬ 4 ~ ? b ~ ? ~ 2) Para muestra con número par de datos: 4 ~ ? b ? b datos ¢ Á Á Á Á Á Á Á datos ordenados ¢ Á Á Á Á Á Á Á ? b ? 4 ~ ~ ~ ~ Á b) Mediana para datos agrupados c - c 8 9 4 ~ 3 b h donde: es el primer intervalo cuya frecuencia acumulada supera a 3 es el límite real inferior del intervalo de la mediana. es el número de datos. -c es la frecuencia acumulada anterior al intervalo de la mediana. es la frecuencia absoluta del intervalo de la mediana. es la amplitud del intervalo.