SlideShare una empresa de Scribd logo
1 de 122
Descargar para leer sin conexión
ÍNDICE TEMÁTICO 
CAP. 1.- ¿ QUE ES ESTADÍSTICA ? 3 
Introducción ; Estadística ; Usos y Abusos de la 
Estadística; Introducción a los Términos Básicos; 
Relación entre Probabilidad y Estadística; Examen 
de Autoevaluación. 
CAP. 2.- ELABORACIÓN DE CUADROS ESTADÍSTICOS 11 
Introducción ; Toma de Datos ; Técnicas Estadísticas; 
Frecuencias ; Concepto de Variable ; Intervalos ; Cua-dro 
estadístico ; Ejercicios Propuestos. 
CAP. 3.- GRÁFICAS ESTADÍSTICAS 30 
Introducción ; Representaciones gráficas ; Histograma 
ó diagrama de barras ; Polígono de frecuencias ; Diagra-ma 
de Pastel ; Ojiva o curva de frecuencias ; Curva de 
Lorenz ; Curvas de frecuencias ; Curva de la Distribución 
Normal ; Examen de Autoevaluación 
CAP. 4.- MEDIDAS DE TENDENCIA CENTRAL 42 
La Media Aritmética; La Mediana; La Moda; 
Comparación de la Media, la Mediana y la Moda; 
Media Geométrica; Media Armónica; Media Ar-mónica 
para datos agrupados; Ejercicios Propuestos. 
CAP. 5.- MEDIDAS DE DISPERSIÓN 60 
Medidas de Dispersión; Desviación estándar; 
Varianza; Cálculo de la Media y Desviación 
Estándar para Datos Agrupados; Interpretación 
practica de la desviación estándar; Ejercicios 
Propuestos. 
CAP. 6.- PROBABILIDAD 76 
Conjuntos y sus operaciones; ¿ Qué es Espacio 
Muestral ?; Sucesos Simples y Compuestos; 
Probabilidad; Axiomas de la Probabilidad; 
Análisis Combinatorio; Probabilidad Condicional; 
Independencia Probabilistica; Leyes de Probabili-dad; 
Ejercicios Propuestos.
PROBABILIDAD Y ESTADÍSTICA 
1 
CAP. 7.- DISTRIBUCIONES DE PROBABILIDAD 98 
Distribución Binomial; Distribución de Poisson; 
Distribución Normal; Distribución t de Student; 
Ejercicos Propuestos. 
APÉNDICE : TABLAS DE PROBABILIDADES 
Tabla 1 Distribución Normal 115 
Tabla 2 Distribución t de Student 116 
Tabla 3 Distribución Binomial 117 
Tabla 4 Valores de e- x 119 
BIBLIOGRAFÍA 120
PROBABILIDAD Y ESTADÍSTICA 
2 
PRESENTACIÓN 
Tomando en consideración que los estudiantes deben contar con 
los elementos necesarios para un curso, ya que esto les facilitaría el proceso 
del aprendizaje, nos dimos a la tarea de elaborar los apuntes del curso de 
PROBABILIDAD Y ESTADÍSTICA en el Nivel Medio Superior, mismos 
que se elaboraron tomando en consideración la bibliografía actualizada 
existente en está área. El contenido de este libro se determino en base a los 
programas que rigen en el Nivel Medio Superior en la Universidad de Colima. 
En este cuaderno de apuntes se ha tratado de evitar al máximo las 
demostraciones áridas, que en muchas ocasiones en lugar de aclarar, 
obscurecen más el panorama del lector. 
El objetivo del cuaderno de apuntes (La superación académica), 
es ambicioso y sería presuntuoso afirmar que materiales como el presente lo 
satisfacen. Con este material se pretende que al final el alumno tenga las 
herramientas necesarias para concentrar y representar información, y al 
mismo tiempo tenga las bases necesarias para posteriores cursos en el Nivel 
Superior. 
Esperamos que este cuaderno sea de utilidad tanto para los 
alumnos como para los maestros, esperando de estos últimos sus comentarios 
al utilizarlo. 
LOS AUTORES
PROBABILIDAD Y ESTADÍSTICA 
3 
INTRODUCCIÓN 
Para tratar de predecir el resultado de una elección nacional, los 
encuestadores entrevistan a un número predeterminado de personas en todo el 
país y registran sus preferencias. Sobre la base de esta información se 
construye una predicción. Problemas similares se encuentran en 
investigaciones de mercado, en sociología, en la industria, etc. 
La producción de una planta química depende de muchos 
factores. Observando estos factores y la producción durante cierto periodo de 
tiempo, podemos construir una ecuación de predicción que relacione a la 
producción con los factores observados. Si usamos esas ecuaciones para 
predecir la producción, la predicción raramente será igual a la verdadera 
producción, esto es, la predicción casi siempre tendrá algún error. 
Encontramos problemas similares en los campos de la educación, la 
sociología, la psicología, las ciencias físicas y muchas otras ciencias. A estos 
predictores se les llama estadísticos de prueba, que son la base de toda 
investigación y desarrollo científico. Además de la predicción, el estadístico 
también sirve para tomar decisiones acerca de poblaciones a partir de 
resultados obtenidos de investigaciones desarrolladas a muestras o pequeñas 
partes de la población. 
La Estadística es una ciencia que es de gran utilidad y en la 
actualidad nos es mucho más difícil mencionar algún lugar en el que la 
Estadística no se aplique que uno en el que tenga una gran importancia. Por 
ejemplo, las Universidades podrían desear predecir el rendimiento promedio 
de los estudiantes universitarios, para lo cual sería necesario utilizar la
PROBABILIDAD Y ESTADÍSTICA 
Estadística. Podría desearse comparar dos técnicas de enseñanza físicamente 
distintas; podríamos considerar la inspección de artículos comprados en una 
fabrica en donde la inspección podría consistir en seleccionar diez artículos 
de cada lote y registrar el número de defectuosos, en donde, la decisión de 
aceptar o rechazar el lote, podría basarse en el número de defectuosos 
encontrados. 
Los ejemplos anteriores son una muestra de lo importante que 
resulta ser el estudio de la Estadística, por lo que en el presente curso se 
presenta una definición de Estadística y se da una relación que existe con la 
Probabilidad para poder hacer toma de decisiones respecto de investigaciones 
desarrolladas. 
4 
ESTADÍSTICA 
Es un lenguaje universal de la ciencia tanto en sus ramas físicas 
como sociales, la comunicación y el uso de la Estadística nos permiten 
comunicar más exactamente los descubrimientos en las investigaciones. La 
Estadística es también un instrumento que utilizado con cuidado y precisión 
nos permite describir nuestros resultados y adoptar decisiones respecto a lo 
que nos dicen. 
Aprender Estadística es algo simple y se llega a su comprensión total 
por medio de ejercicios; en la Estadística intervienen números y letras como 
parte de su lenguaje, además, la Estadística posee significados diversos para 
personas de formaciones e intereses diversos. El campo de la Estadística se 
divide ampliamente en dos ramas, que son: La Estadística descriptiva y la 
Estadística Inferencial.
PROBABILIDAD Y ESTADÍSTICA 
La Estadística Descriptiva está dedicada a la recolección, 
descripción y presentación de datos numéricos. La Estadística Inferencial se 
refiere a las técnicas de interpretar los valores que se obtienen a partir de las 
técnicas descriptivas, además de las técnicas de tomar decisiones sobre la 
base de los datos obtenidos. 
Estadística es la ciencia de recolectar, clasificar, describir e 
5 
interpretar datos numéricos. 
USOS Y ABUSOS DE LA ESTADÍSTICA 
Las aplicaciones de la Estadística son ilimitadas, pues sería más 
difícil nombrar un campo en donde no se utiliza la Estadística, que señalar 
uno en donde la Estadística desempeñe un papel importante. Ejemplos sobre 
la utilización de la Estadística: 
1.- En la Educación se usa mucho para describir resultados de pruebas. 
2.- En la ciencia los datos obtenidos en experimentos deben recogerse y 
analizarse estadísticamente para tomar una decisión. 
3.- Los gobiernos utilizan la Estadística para la recolección de información en 
sus diversos campos. 
Los abusos de la Estadística suelen ser muy pintorescos y a veces 
ocasionan muchas dificultades, a numerosas personas les preocupa la lejanía 
de las descripciones estadísticas y a otras les preocupa toda la información 
(dependiendo de sus necesidades) debido a que creen que es falsa, y sin 
embargo, la mayoría de las mentiras estadísticas se deben a: 
1.- La utilización de valores estadísticos inadecuados. 
2.- Utilización de enunciados abiertos y no explícitos.
PROBABILIDAD Y ESTADÍSTICA 
6 
3.- Utilización de datos derivados de un diseño experimental defectuoso. 
4.- Una mala presentación de resultados. 
Todos estos factores comunes acarrean una sola consecuencia, que 
es la mala concepción de la información por parte del investigador. 
INTRODUCCIÓN A LOS TÉRMINOS BÁSICOS 
Para estudiar Estadística debemos ser capaces de hablar su lenguaje, 
por lo que definiremos primeramente sus términos básicos: 
1.- POBLACIÓN : Colección completa de individuos, objetos o medidas que 
tienen una característica en común, el concepto de Población es la idea 
fundamental más importante de la Estadística. La Población debe definirse 
cuidadosamente en cada caso a fin de poder determinar la preferencia de ella. 
2.- MUESTRA : Es un subconjunto de la población, es decir, una Muestra se 
compone de algunos de los individuos, objetos o medidas que componen la 
población. 
3.- VARIABLE DE RESPUESTA : Es una característica individual de cada 
elemento de la población o de una muestra; por ejemplo: la edad de un 
alumno al ingresar a la Universidad, el color del pelo, su estatura, su peso, 
etc., son Variables de Respuesta y el valor de la variable será la medida de la 
característica que interese. 
4.- PIEZA DE DATOS : El valor de la variable de respuesta asociado con 
cada elemento, será la Pieza de Datos, por ejemplo: el coche es verde, Jorge 
ingresó a la Universidad a la edad de 23 años. Si nos damos cuenta estamos 
asignando a cada elemento su variable o característica.
PROBABILIDAD Y ESTADÍSTICA 
5.- DATOS : Comprende el conjunto de valores asignados a la variable de 
respuesta para cada elemento perteneciente a la muestra. 
6.- EXPERIMENTO : Es una actividad planificada cuyos resultados nos 
producen un conjunto de datos. 
7.- PARÁMETRO : Es una característica medida de una población completa, 
por ejemplo: la proporción de alumnos de más de 21 años que ingresan a la 
Universidad. En Estadística se asignan símbolos del alfabeto griego para 
designar un Parámetro. 
8.- ESTADÍSTICO : Es la medida de una característica relativa a la muestra, 
al valor promedio de los datos y la imagen de éstos; la mayoría de los 
Estadísticos muestrales se encuentran por medio de fórmulas y suelen 
asignárseles símbolos del alfabeto latino. 
Fundamentalmente existen dos clases de datos, los que presentan 
información cualitativa y los datos consistentes en información cuantitativa. 
Los que están dentro de los cualitativos se llaman Datos de Atributo, mientras 
que los cuantitativos se dividen en Discretos y Continuos. 
7 
DATOS 
CUALITATIVOS CUANTITATIVOS 
ATRIBUTO DISCRETOS CONTINUOS
PROBABILIDAD Y ESTADÍSTICA 
Los Datos de Atributo o Cualitativos son los que agrupan a una 
muestra en características semejantes, pero no tienen medidas numéricas. 
Los Datos Cuantitativos se dividen en: 
Discretos : Son los datos que resultan de un conteo o una simple observación. 
Continuos : Son los datos que se obtienen cuando la medida es un proceso 
infinito. 
8 
RELACIÓN ENTRE PROBABILIDAD Y 
ESTADÍSTICA 
La Probabilidad y Estadística son dos campos distintos aunque 
relacionados entre sí, en las matemáticas, se dice a veces que la Probabilidad 
es el vehículo de la Estadística es decir, de no ser por las leyes de 
Probabilidad, no existirían las teorías estadísticas, así que investigaremos la 
diferencia entre estas dos ramas del árbol matemático. Observaremos un 
ejemplo o modelo de dos cajas: 
10 FICHAS 
5 ROJAS 
PROBABILIDAD 3 VERDES ESTADÍSTICA ? ? ? ? 
2 AMARILLAS 
En la caja de Probabilidad hay 10 fichas ( 5 Rojas, 3 Verdes y 2 
Amarillas ), en el terreno de la Probabilidad se intenta responder preguntas; 
por ejemplo, ¿ Cuál es la probabilidad de que si se saca una ficha de la caja, 
sea Roja ?, ¿ Cuál es la probabilidad de la ocurrencia de un evento ?, por otra
PROBABILIDAD Y ESTADÍSTICA 
parte, dentro de la Estadística necesitaremos extraer una muestra de ella para 
hacernos conjeturas sobre lo que en ella existe. Por lo que se podría decir 
como diferencia bien marcada entre una y otra, lo siguiente: " La Probabilidad 
estudia la oportunidad de que algo ocurra, cuando se conocen las 
posibilidades; mientras que la Estadística pregunta, cuales son esas 
posibilidades a partir de los resultados de una muestra ". 
9 
EXAMEN DE AUTOEVALUACIÓN 
1.- ¿Qué es la Estadística? 
2.- Dé tres ejemplos en donde se utilice la Estadística. 
3.- Explique los factores que ocasionan un mal uso de la Estadística. 
4.- Mencione los ocho términos básicos de la Estadística. 
5.- Defina los siguientes términos en base a lo que usted comprenda: 
Población, Muestra, Pieza de Datos, Parámetro. 
6.- Mencione como se clasifican los datos y defínalos. 
7.- ¿ Qué relación existe entre la Probabilidad y la Estadística?. 
8.- Suponga que desea obtener una estimación del consumo de gasolina 
(Km por litro) del FORD COUGAR. Describa la población que sería de 
interés para usted, de la cual tendría que seleccionar la muestra.
PROBABILIDAD Y ESTADÍSTICA 
9.- Un investigador médico desea estimar el tiempo de supervivencia de un 
paciente después de la aparición de un tipo particular de cáncer y después de 
un régimen particular de radioterapia. Identifique la población de interés para 
el investigador médico. ¿ Puede percibir algún problema en el muestreo de 
esta población ? 
10.- Suponga que usted es un candidato para la legislatura y que desea 
evaluar la opinión de los votantes respecto a sus posibilidades de ganar. 
Identifique la población de interés para usted y de la cual desearía seleccionar 
su muestra. 
10
PROBABILIDAD Y ESTADÍSTICA 
11 
INTRODUCCIÓN 
Como veremos más adelante, el análisis estadístico de datos 
requiere numerosas operaciones aritméticas, y sería muy tedioso describir 
todas estas operaciones con palabras. La solución de esta dificultad es 
expresar las operaciones en términos de una o más fórmulas. Entonces, para 
analizar un conjunto dado de datos muéstrales se sustituirían las mediciones 
muéstrales en el conjunto apropiado de fórmulas. 
Una de las operaciones mas comunes en el análisis estadístico de 
datos es el proceso de sumas (adición). Por lo tanto necesitaremos un símbolo 
para indicarle que sume las mediciones muéstrales, o que sume un conjunto 
de números calculados a partir de las mediciones muéstrales. Este símbolo, 
llamado sumatoria, puede ser muy familiar para algunos y completamente 
nuevo para otros (  ). 
A continuación presentaremos algunos conceptos necesarios para 
la elaboración de cuadros estadísticos, conceptos como frecuencia, frecuencia 
relativa, frecuencia acumulada, etc. 
TOMA DE DATOS 
Si tuviéramos la población frente a nosotros, ¿ cómo podríamos 
describir este subconjunto grande de mediciones ?. Muchos textos se han 
dedicado a los métodos de la estadística descriptiva, es decir, a los métodos 
para describir conjuntos de datos numéricos.
PROBABILIDAD Y ESTADÍSTICA 
Esencialmente estos métodos se pueden clasificar como métodos 
gráficos y métodos numéricos. En este texto hablaremos de los dos métodos 
para describir información, y comenzaremos con el método numérico, el cual 
se basa esencialmente en la recolección de datos para presentarlos en un 
cuadro estadístico, cuadro en el que nosotros podremos leer la información 
que se encontraba dispersa en la muestra o población. En la actualidad es muy 
común encontrarnos con cuadros estadísticos, y lo más general es la 
presentación de información en los distintos medios de comunicación de las 
posiciones que ocupan los distintos equipos en los diferentes deportes. 
12 
TÉCNICAS ESTADÍSTICAS 
Las técnicas estadísticas, los gráficos, las distribuciones de 
frecuencias, promedios, etc., son términos de indudable valor práctico para la 
descripción de los datos. Sin embargo la mayor utilidad estadística se 
encuentra en el análisis de los datos numéricos. 
El análisis de los datos numéricos por técnicas estadísticas es 
una expresión abstracta. La característica esencial común a todas las técnicas 
es el elemento de inferencia estadística, que se define como un proceso de 
inducción lógica, que partiendo de los datos establece un juicio sobre todo el 
conjunto, obteniéndose una medida de la incertidumbre para la consecuencia 
que se infiere. Por ejemplo; consideremos el problema de estimar la 
proporción de votos a favor de una determinada propuesta o candidato, se 
toma una muestra de los votantes y se calcula la proporción de los que lo 
hacen a favor de un sólo candidato, suponiendo que el 60% de la muestra
PROBABILIDAD Y ESTADÍSTICA 
vota a favor de un candidato, entonces, se infiere que el 60% de todos los 
votantes están a favor de ese candidato. 
En otras palabras, hay un grado de incertidumbre vinculado a la 
conclusión cuya medición se obtiene aplicando las técnicas estadísticas. La 
Estadística reúne un conjunto de procedimientos para describir y analizar los 
datos de diversas disciplinas, ésta debe ser neutral y por ello puede emplearse 
la misma técnica de muestreo en economía, finanzas, educación, ingeniería, 
y otras. Sin embargo, la Estadística ha elaborado técnicas peculiares para 
cada campo de aplicación. 
Por lo que podemos concluir que las TÉCNICAS-ESTADÍSTICAS 
se basan en: la recolección de datos, los gráficos, las 
frecuencias, los promedios, etc. En los negocios la Estadística ha 
desarrollado técnicas como las de: Índices de Precios, Sucesiones, Series de 
Tiempo, y otras. En las ciencias biológicas alcanzan el más alto nivel e 
interés las técnicas para el diseño de experimentos. Mientras que en la 
Industria se desarrollan técnicas para el control de calidad. 
Así como se enunciaron anteriormente algunas ramas en las que 
tiene aplicación la Estadística y en las cuales se han desarrollado técnicas 
peculiares para cada una, podríamos mencionar algunas otras, pero con la 
práctica nos daremos cuenta de cómo es el desarrollo en ellas. 
13 
FRECUENCIAS 
Antes de comenzar con la distribución de frecuencias, será 
conveniente definir el vocablo Frecuencia, ya que se ha mencionado con
PROBABILIDAD Y ESTADÍSTICA 
anterioridad, sin embargo, no ha sido definido. Así mismo se hará una 
clasificación de los tipos de frecuencias utilizados en la Estadística. 
FRECUENCIA: Es el número total de repeticiones de un 
elemento determinado, en una muestra o población. Existen varios tipos de 
frecuencias a saber: Frecuencia de clase, Frecuencia relativa, Frecuencia 
acumulada, Frecuencia relativa acumulada, etc. Para los objetivos que se 
persiguen en este curso, definiremos las frecuencias de datos agrupados. 
FRECUENCIA RELATIVA: Es el tanto por ciento o porcentaje 
correspondiente a cada intervalo de clase. La manera de obtenerla es 
dividiendo el número de elementos de esa clase entre el número total de 
elementos de la muestra o población. La frecuencia relativa tiene gran 
utilidad, ya que puede especificarnos el porcentaje de ocurrencia de un evento 
dentro de una muestra, la elaboración de gráficas estadísticas, etc.. Por 
ejemplo: la distribución de presupuestos por áreas, el porcentaje de 
producción de ciertos productos, la distribución por edades de ciertas 
poblaciones, etc. 
FRECUENCIA ACUMULADA: Esta frecuencia se obtiene al sumar a 
la frecuencia de cada clase, las frecuencias de las clases anteriores a ella. Las 
frecuencias de las demás clases serán la suma sucesiva de las frecuencias de 
las clases anteriores, de tal forma que en la última clase se tendrá una 
frecuencia igual al tamaño de la muestra o población. 
FRECUENCIA RELATIVA ACUMULADA: Se sigue el mismo 
procedimiento que en la frecuencia acumulada, sólo que en este caso se toma 
como base la frecuencia relativa, expresándose como porcentaje. 
14
PROBABILIDAD Y ESTADÍSTICA 
15 
CONCEPTO DE VARIABLE 
Consideremos la desigualdad X + 2 > 5, los valores de X que 
satisfacen dicha desigualdad son todos los valores mayores que 3, dado que: 
X + 2 > 5 
X > 5 - 2 
X > 3 
como X > 3, entonces X puede ser: 4, 5, 6, ... 
X se llama variable porque toma distintos valores posibles 
dentro de la desigualdad ( por lo que se dice que una variable es aquella que 
puede tomar distintos posibles valores dentro de un suceso ). 
Desde los tiempos más remotos dos tendencias opuestas, a veces 
colaborando la una con la otra, han gobernado todo el desarrollo de la 
matemática. Estas dos son el dominio de lo continuo y lo discreto. Una de las 
grandes tareas de la matemática actual consiste en armonizar lo continuo y lo 
discreto para incluirlos en una matemática única y para iluminar la oscuridad 
de ambas. 
Siguiendo con el concepto de variable, veremos que una variable 
discreta es una regla bien definida para asignar valores numéricos a todos los 
resultados posibles de un experimento. Lo anterior significa que una variable 
aleatoria discreta es aquella que se asocia a todo experimento siempre y 
cuando el conteo sea finito o infinito numerable y con datos numéricos 
enteros. 
Una variable continua es aquella cuyos valores posibles no tienen 
interrupción, es decir, son aquellos valores que podemos obtener no mediante 
un conteo o simple observación, si no mediante observaciones más concretas
PROBABILIDAD Y ESTADÍSTICA 
y sus valores son no numerables (Los Reales). Veamos algunos ejemplos 
sobre lo anterior: 
16 
a) Los posibles resultados de lanzar un dado normal. 
S = { 1, 2, 3, 4, 5, 6 } 
Es discreto por poderse obtener por un conteo. 
b) Lanzar una moneda normal hasta que caiga sol. 
S = { 1, 2, 3, 4, ... , n } 
Es discreto por ser un proceso infinito numerable. 
c) La cantidad de descargue de un Río hacia el Océano. 
Es continua, ya que es imposible determinarlo por un conteo o por 
una simple observación, y se requiere de un método más concreto para 
estimarlo. 
INTERVALOS 
Es importante que repasemos un concepto ya manejado en 
matemáticas, como es el de INTERVALO, ya que con el será necesario 
trabajar en la formación de cuadros estadísticos, en donde hablaremos de 
intervalos de clases, por lo que definimos lo siguiente: 
“ Un intervalo de clase es aquel que contiene a una cierta 
cantidad de elementos de la muestra o población ”, por ejemplo, el número de 
alumnos que obtienen una calificación entre 5 y 8, en este ejemplo, el 
intervalo es [5, 8], y como frecuencia contendrá a todos los alumnos que
PROBABILIDAD Y ESTADÍSTICA 
hayan obtenido esas calificaciones, el 5 recibe el nombre de límite inferior 
del intervalo y el 8 el de límite superior del intervalo. En la construcción de 
cuadros estadísticos será necesario este concepto en la formación de clases. 
17 
CUADRO ESTADÍSTICO 
El cuadro estadístico más usual es aquél en el que se representa 
el número total de clases o de variables, con el número de elementos 
correspondientes a cada uno, llamándose a esto frecuencia, así mismo, 
veremos cuadros estadísticos en los que tendremos frecuencias acumuladas 
(Suma de los elementos anteriores a la clase), frecuencia relativa (porcentaje 
de cada clase con respecto a la muestra), frecuencia relativa acumulada, 
marcas de clases, desviaciones medias, mediana, etc. 
A continuación se presenta una forma de distribución en un 
cuadro estadístico: 
CLASE o 
VARIABLE 
FRECUENCIA FRECUENCIA 
ACUMULADA 
FRECUENCIA 
RELATIVA 
FREC. REL. 
ACUMULADA 
30 - 36 6 6 6/14 6/14 
37 - 43 5 11 5/14 11/14 
44 - 50 3 14 3/14 14/14 
TOTAL 14 14/14 
A continuación se muestra un conjunto de datos, con los que 
vamos a elaborar un cuadro estadístico: 
30 42 50 73 60 63 
38 27 67 83 70 63 
52 83 97 49 83 73 
30 35 63 59 84 75 
84 90 80 95 85 68
PROBABILIDAD Y ESTADÍSTICA 
Para formar un cuadro estadístico es necesario primeramente 
ordenar todos los elementos de la muestra en forma ascendente, para después 
agruparlos en clases. 
18 
27 42 60 67 75 84 
30 49 60 68 80 85 
30 50 63 70 83 90 
35 52 63 73 83 95 
38 59 63 73 83 97 
Para elegir el número de clases se deben observar ciertos 
criterios; se debe evitar que queden demasiados elementos en una clase, así 
como también clases sin elementos. Una clase con demasiados elementos 
oculta información que en ocasiones es indispensable para el estadístico y una 
clase vacía ocasiona problemas a la hora de calcular las medidas estadísticas. 
Se recomienda un mínimo de 5 clases y un máximo de 20 clases, 
dependiendo del número de elementos de la muestra y de lo disperso que se 
encuentren. Es recomendable tomar entre 5 y 9 clases cuando la muestra 
cuenta con menos de 50 elementos y entre 10 y 20 cuando tenga más de 50 
elementos. 
Para obtener el número de clases existen dos formas, una 
conocida como forma empírica y otra de fórmula general. A continuación 
enunciaremos la forma empírica: 
Número de Clases = 
Elementomáximo - Elementomínimo 1 
Intervalode Clase
PROBABILIDAD Y ESTADÍSTICA 
En este caso, dependiendo del número de elementos con que 
cuente la muestra, se elige un Intervalo de clase y se realiza la operación 
anterior para obtener el número de clases que se deben de colocar en el cuadro 
estadístico, pero pudiese en lugar de elegir el Intervalo de clase, escogerse el 
número de clases que se desean, entonces se aplicaría la siguiente fórmula: 
19 
Intervalo de Clase = 
Elementomáximo - Elementomínimo 1 
Número de Clases 
Ahora bien, si no se desea de esta manera se utiliza la fórmula 
general, la cual se aplicará de la siguiente manera: 
Si se tienen menos de 50 elementos en la muestra, el número de 
clases se obtiene con la siguiente fórmula: 
No. de Clases = 1 + 3.3 log N 
pero si se tienen más de 50 elementos, entonces se utiliza: 
No. de Clases = 3 + 3.3 log N 
Continuando con el ejemplo anterior, procedemos a calcular el 
número de clases en forma empírica para elaborar el cuadro estadístico. 
Como el número de elementos es 30, escogemos un número en 
forma aleatoria para el Intervalo de Clase o Amplitud de Clase de 9. Ahora 
bien, aplicando la fórmula presentada para el número de clases, tenemos: 
No. de clases = 
Elem. Má x. - Elem. Mín. + 1 
Int. de Clase 
= 
97 - 27 + 1 
9 
= 
71 
9 
= 7.88 
como podemos ver tenemos 7.88 clases, pero debido a tener una porción de 
una clase más, debemos incrementar o redondear a el inmediato superior,
PROBABILIDAD Y ESTADÍSTICA 
teniendo entonces que el número de clases a utilizar será de 8 clases ya que 
si utilizáramos 7 clases, tendríamos al final un valor que no entraría en el 
número de clases escogidas para la colección de datos. 
Para hacer una comparación entre el método empírico y la forma 
20 
general, aplicaremos la fórmula. 
No. de clases = 1 + 3.3 log N 
teniéndose al sustituir N = 30 lo siguiente: 
No. de clases = 1 + 3.3 log(30) 
= 1 + 3.3 (1.4771) 
= 1 + 4.87 = 5.87 
en este caso aproximaríamos a 6 clases y procederíamos a calcular el 
Intervalo de Clase o Amplitud de Clase. El hecho de que en un procedimiento 
se tengan 8 clases y en el otro 6 clases no afecta a los cálculos que el 
estadístico hará, con lo que podemos decir que el estadista utilizará el método 
que considere más práctico para sus fines. 
Para elaborar el cuadro estadístico es necesario formar los 
intervalos de clases, por lo que debemos escoger los límites inferior y superior 
de los intervalos de clase de la siguiente manera: En la primera clase 
tomamos el menor elemento de la colección de datos como el límite inferior 
de esta clase, que es 27, para obtener el límite superior de la primera clase 
debemos sumar 9 a el 27 debido a que el Intervalo de Clase es 9 (por que 
estamos utilizando el método empírico ), teniéndose entonces que el límite 
superior de la primera clase es 35. De esta manera tenemos que el Intervalo de 
Clase de la primera clase es de 27 a 35, en este intervalo aparentemente
PROBABILIDAD Y ESTADÍSTICA 
tenemos un intervalo de clase de 8, sin embargo debemos tomar en cuenta que 
los extremos del intervalo están incluidos en él, teniéndose que del número 27 
a el número 35 existen 9 unidades, que para mayor entendimiento lo 
desarrollamos a continuación. 
21 
27 28 29 30 31 32 33 34 35 
en donde claramente se ve que son 9. Ahora bien, para obtener el conteo de 
cada intervalo o frecuencia de clase, debemos observar en la colección 
original de datos cuantos elementos se encuentran en ese intervalo, 
teniéndose que en este intervalo se encuentran los siguientes elementos de la 
colección de datos, 27, 30, 30 y 35. 
Para formar el Intervalo de Clase de la clase 2, tomamos el 
inmediato superior a el límite superior de clase de la primera clase para 
obtener el límite inferior de clase de la segunda clase ( Si la colección de 
datos son números enteros, se suma uno a el límite superior de clase para 
obtener el límite inferior de la clase siguiente, si la colección de datos es en 
decimales se suma una unidad correspondiente a los decimales), por lo tanto 
el intervalo de clase de la clase 2 inicia en 36 que al sumarle 9 y restarle 1 
debido a que están incluidos los extremos tenemos que el límite superior de la 
clase dos es 44 y en este intervalo los elementos de la colección original que 
se encuentran son 38 y 42. 
De la misma forma que se obtuvieron los intervalos de clase de 
las clases 1 y 2 lo hacemos para las clases restantes de esta colección de datos.
PROBABILIDAD Y ESTADÍSTICA 
Anteriormente en este capítulo definimos los conceptos de 
frecuencia, frecuencia acumulada, frecuencia relativa y frecuencia relativa 
acumulada, por lo tanto procederemos a explicar como se obtiene cada una 
para poder terminar con nuestro cuadro estadístico. Para obtener la frecuencia 
acumulada se deben tomar como referencia los límites superiores de clase; de 
lo anterior tenemos que hasta el límite superior de la clase 1 (35) existen 4 
datos; hasta el límite superior de la clase 2 (44) los datos que van son 6; para 
el límite superior de la clase 3 (53) los datos acumulados de las clases es 9 y 
asi sucesivamente hasta la última clase que deberá contener a la totalidad de 
elementos. Con la explicación anterior concluimos que la frecuencia 
acumulada se obtiene sumando a la frecuencia de clase la frecuencia de las 
clases anteriores. 
En lo que se refiere a la frecuencia relativa, tenemos que en cada 
clase debemos especificar en razón a cuantos elementos tiene el intervalo de 
clase con respecto a la colección total de datos, para el intervalo de clase 1 
tenemos que la razón de elementos es 4/30 ( 4 de 30 ), para el intervalo de 
clase 2 la razón es 2/30 ( 2 de 30 ) y así sucesivamente hasta la última clase. 
Para las frecuencias relativas acumuladas se tienen que obtener las razones 
acumuladas en cada intervalo de clase especificando que la última clase 
deberá contener al total de elementos, por lo cual deberá aparecer la unidad. 
Un punto más que debe aparecer en el cuadro estadístico es la 
marca de clase, la cual nos servirá para elaborar las gráficas estadísticas en el 
capítulo 3. La marca de clase se obtiene sumando el límite inferior de clase 
con el límite superior de la misma clase y dividiendo entre dos, así para el 
22
PROBABILIDAD Y ESTADÍSTICA 
23 
intervalo de clase 1, su marca de clase es 
27 35 
2 
31 
 
 , para el intervalo de 
clase 2 su marca de clase es 40 y así sucesivamente. 
En base a todos los datos obtenidos anteriormente, procedemos a 
desarrollar nuestro cuadro estadístico, el cual queda de la siguiente manera: 
Número 
de 
Clase 
Intervalo de 
Clase 
Frecuencia Frecuencia 
Acumulada 
Frecuencia 
Relativa 
Frecuencia 
Rel. Acum. 
Marca de 
Clase 
1 27 - 35 4 4 4 / 30 4 / 30 31 
2 36 - 44 2 6 2 / 30 6 / 30 40 
3 45 - 53 3 9 3 / 30 9 / 30 49 
4 54 - 62 3 12 3 / 30 12 / 30 58 
5 63 - 71 6 18 6 / 30 18 / 30 67 
6 72 - 80 4 22 4 / 30 22 / 30 76 
7 81 - 89 5 27 5 / 30 27 / 30 85 
8 90 - 98 3 30 3 / 30 30 / 30 94 
Totales 30 30 / 30 
Cuando se obtienen más de 20 clases por el método empírico al 
escoger aleatoriamente el Intervalo de Clase o Amplitud de Clase, entonces 
se recomienda usar el método general, debido a que se pueden obtener malos 
resultados a causa de la dispersión de datos que existirá entre ellos. 
Ejemplo: Con la siguiente distribución: 
6 42 49 6 52 36 8 32 33 9 
53 33 12 31 41 8 50 50 23 41 
32 11 49 10 15 28 31 13 48 9 
17 9 27 15 41 32 7 28 17 13 
47 6 35 47 15 53 5 42 53 27 
que nos muestra las edades de una comunidad, elaborar: Un cuadro 
estadístico, especificando las Clases, Frecuencia, Frecuencia Relativa y la 
Frecuencia Acumulada.
PROBABILIDAD Y ESTADÍSTICA 
24 
Primero ordenamos los datos: 
5 8 10 15 23 31 33 41 47 50 
6 8 11 15 27 31 33 41 48 52 
6 9 12 15 27 32 35 42 49 53 
6 9 13 17 28 32 36 42 49 53 
7 9 13 17 28 32 41 47 50 53 
ahora calculamos el Intervalo de Clases eligiendo un número de 
clase igual a 9 
Intervalo de Clase = (53 - 5 + 1) / 9 = 5.44 
con estos datos elaboramos el cuadro estadístico, con 9 clases y un Intervalo 
de Clase de 6. 
# Clase Int. Clase Frecuencia Frec. Acum. Frec. Rel. Frec. R. A. Marca de 
Clase 
1 5 - 10 11 11 0.22 0.22 7.5 
2 11 - 16 7 18 0.14 0.36 13.5 
3 17 - 22 2 20 0.04 0.40 19.5 
4 23 - 28 5 25 0.10 0.50 25.5 
5 29 - 34 7 32 0.14 0.64 31.5 
6 35 - 40 2 34 0.04 0.68 37.5 
7 41 - 46 5 39 0.10 0.78 43.5 
8 47 - 52 8 47 0.16 0.94 49.5 
9 53 - 58 3 50 0.06 1.00 55.5 
Totales 50 1.00 
Para elaborar las gráficas estadísticas es necesario conocer 
además de la marca de clase, los límites reales de clases. 
L.R.C. = 
Lim.Sup. de la Clase (n)  Lim. Inf.de la Clase (n 1) 
2 
( L.R.C. = Límite Real de Clase )
PROBABILIDAD Y ESTADÍSTICA 
25 
CUADRO ESTADÍSTICO CON LIMITES REALES DE CLASE 
Número 
de Clase 
Intervalo de 
Clase 
Intervalo de Clase 
con Limites Reales 
Frecuencia Marca de Clase 
1 5 - 10 4.5 - 10.5 11 7.5 
2 11 - 16 10.5 - 16.5 7 13.5 
3 17 - 22 16.5 - 22.5 2 19.5 
4 23 - 28 22.5 - 28.5 5 25.5 
5 29 - 34 28.5 - 34.5 7 31.5 
6 35 - 40 34.5 - 40.5 2 37.5 
7 41 - 46 40.5 - 46.5 5 43.5 
8 47 - 52 46.5 - 52.5 8 49.5 
9 53 - 58 52.5 - 58.5 3 55.5 
En el capítulo tres veremos de la necesidad de utilizar cuadros 
estadísticos como el anterior para la elaboración de gráficas estadísticas. A 
continuación presentamos una serie de ejercicios resueltos referentes a este 
capítulo. 
* Evalué las siguientes sumas: 
5 
a) (y - 4) = 
y = 0 
6 
b) (y 
y = 2 
2 - 5) = 
c) 
4 
i = 1 
3 
(yi - 2) = d) (y + 2i) = 
i = 1 
5 
a) (y - 4) = 
y = 0 
(0 - 4) + (1 - 4) + (2 - 4) + (3 - 4) + (4 - 4) + (5 - 4) 
= - 4 - 3 - 2 - 1 + 0 + 1 = - 9 
como podemos observar, se fue sustituyendo en el lugar de y el valor 
consecutivo desde el cero hasta el máximo valor que era el 5. Lo hecho 
anteriormente es similar para los incisos b), c) y d).
PROBABILIDAD Y ESTADÍSTICA 
26 
6 
b) (y 
y = 2 
2 - 5) = (4 - 5) + (9 - 5) + (16 - 5) + (25 - 5) + (36 - 5) 
= - 1 + 4 + 11 + 20 + 31 = 65 
c) 
4 
i = 1 
(yi - 2) = (y1 - 2) + (y2 - 2) + (y3 - 2) + (y4 - 2) 
= y1 + y2 + y3 + y4 - 8 
3 
d) (y + 2i) = 
i = 1 
[y + 2(1)] + [y + 2(2)] + [y + 2(3)] = 3y + 12 
* Si y es la variable de posición de una sucesión y la 
fórmula para el elemento típico es y2 - 1: 
a) Escriba los primeros cuatro elementos de la sucesión. 
Los primeros cuatro elementos son: 
si y = 1 entonces : (1)2 - 1 = 0 primer elemento 
si y = 2 entonces : (2)2 - 1 = 3 segundo elemento 
si y = 3 entonces : (3)2 - 1 = 8 tercer elemento 
si y = 4 entonces : (4)2 - 1 = 15 cuarto elemento 
b) Use el signo de sumatoria para escribir una expresión para la suma de 
los primeros cuatro elementos. La fórmula de sumatoria es : 
4 
y = 1 
(y2 - 1) 
c) Encuentre la suma de los primeros cuatro números. 
4 
y = 1 
(y2 - 1) = [(1)2 - 1] + [(2)2 - 1] + [(3)2 - 1] + [(4)2 - 1] 
= 0 + 3 + 8 + 15 = 26
PROBABILIDAD Y ESTADÍSTICA 
* Para estimar la pérdida semanal debida a robos, una tienda 
de ropas registró el total en nuevos pesos de las pérdidas durante un período 
de 10 semanas. Estas pérdidas, redondeadas a la decena más cercana fueron: 
27 
y1 = 360.00 y2 = 430.00 y3 = 210.00 y4 = 320.00 y5 = 550.00 
y6 = 170.00 y7 = 240.00 y8 = 370.00 y9 = 280.00 y10 = 290.00 
a) Encuentre 
10  yi = 360 + 430 + 210 + 320 + 550 + 170 + 240 + 370 
i = 1 
+ 280 + 290 = 3,220.00 
b) Encuentre: i) 
4 
i = 2 
yi ii) 
4 
i = 2 
2 
yi 
i) 
4 
i = 2 
yi = 430.00 + 210.00 + 320.00 = 960.00 
ii) 
4 
i = 2 
2 = (430.00)2 + (210.00)2 + (320.00)2 = 331,400.00 
yi 
* Dados el siguiente conjunto de elementos: 
16 19 17 8 11 9 14 8 
11 13 19 17 7 6 5 9 
16 8 9 13 12 17 16 14 
9 16 15 18 6 8 5 7 
16 17 13 9 7 5 7 11 
elaborar un cuadro estadístico en el podamos observar la frecuencia, 
frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada, 
marca de clase, amplitud de clase y límites reales de clase. 
Primero procederemos a ordenar los datos presentados 
anteriormente: 
5 7 8 9 11 14 16 17 
5 7 8 9 12 14 16 17 
5 7 8 9 13 15 16 18 
6 7 9 11 13 16 17 19
PROBABILIDAD Y ESTADÍSTICA 
28 
6 8 9 11 13 16 17 19 
como tenemos 40 elementos en la muestra, aplicaremos la fórmula de menos 
de 50 elementos: 
Num. de Clases = 1 + 3.3 log N 
Num. de Clases = 1 + 3.3 log (40) 
Num. de Clases = 1 + 3.3(1.602) 
Num. de Clases = 1 + 5.28 = 6.28 
como tenemos 6.28 clases, redondeamos al inmediato inferior, por lo que 
utilizaremos 6 clases para la distribución anterior. Con 6 clases, el intervalo 
de clase será: 
Int. de Clase = ( 19 - 5 + 1 ) / 6 = 2.5 
como el intervalo de clase es un número no entero, utilizaremos 3 como 
intervalo de clase, y entonces el número de clases será 5, quedando nuestro 
cuadro estadístico de la siguiente manera: 
# de C Intervalo 
de Clase 
Int. Clase 
Lim. Real 
Frecuencia Frecuencia 
relativa 
Frecuencia 
Acumulada 
Frec. Rel. 
Acumulada 
Marca de 
Clase 
1 5 - 7 4.5 - 7.5 9 0.225 9 0.225 6 
2 8 - 10 7.5 - 10.5 9 0.225 18 0.450 9 
3 11 - 13 10.5 - 13.5 7 0.175 25 0.625 12 
4 14 - 16 13.5 - 16.5 8 0.200 33 0.825 15 
5 17 - 19 16.5 - 19.5 7 0.175 40 1.000 18 
Totales 40 1.000 
los límites reales se obtuvieron aplicando la relación de la página 23 vista en 
este capítulo.
PROBABILIDAD Y ESTADÍSTICA 
29 
EJERCICIOS PROPUESTOS 
1.- Defina los siguientes conceptos: 
a) Frecuencia 
b) Frecuencia Relativa 
c) Cuadro Estadístico. 
d) Amplitud de Clase. 
2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son: 
2 8 5 2 7 2 5 5 5 6 
1 6 2 3 6 7 7 6 3 3 
4 3 4 8 1 4 5 2 7 5 
5 4 4 6 6 3 8 3 7 1 
8 8 3 2 3 8 6 2 7 2 
Formar un cuadro estadístico con toda la información manejada 
en este capítulo. 
3.- Evalúe las siguientes sumas: 
a) 
3 
y = 1 
y3 
b) 
3 
x = 1 
( 1 + 2x + x2 ) 
c) 
3 
x = 0 
( x3 + 2x )
PROBABILIDAD Y ESTADÍSTICA 
30 
INTRODUCCIÓN 
Es natural introducir los métodos gráficos para describir 
conjuntos de datos a través de la consideración de un conjunto real de datos. 
Anteriormente vimos el análisis de datos por métodos numéricos, métodos 
con los que nosotros podemos leer información respecto a promedios, 
poblaciones, etc. En los cuadros estadísticos se habló de clases y variables, 
ahora podremos representar gráficamente esas clases o variables y a ello es lo 
que llamaremos métodos estadísticos gráficos. Note que en los extremos de 
los subintervalos o clases se han escogido de manera que ningún elemento 
coincida con dos subintervalos o clases a la vez, eliminando así cualquier 
ambigüedad relacionada con la ubicación de una observación particular. Justo 
con los cuadros estadísticos vistos en el capítulo anterior es con los que 
deberemos elaborar nuestras gráficas estadísticas para el desarrollo de los 
métodos gráficos. 
REPRESENTACIONES GRÁFICAS 
En muchos casos una representación gráfica de una tabla de 
frecuencias da una información concisa y clara de una distribución de 
frecuencias. Son cuatro los tipos de representaciones gráficas más usuales, 
también existen dos tipos de representación gráfica no muy común y que sin 
embargo se deben de conocer; las representaciones gráficas son : 
1.- Histograma ó Diagrama de Barras. 
2.- Polígono de frecuencias. 
3.- Diagrama de Pastel. 
4.- Ojiva o Curva de frecuencias.
PROBABILIDAD Y ESTADÍSTICA 
31 
Los dos tipos de gráficas no muy usuales son: 
1.- Curva de Lorenz. 
2.- Curva de la distribución Normal. 
HISTOGRAMA ó DIAGRAMA DE BARRAS 
Es aquel en el que se representan los datos mediante un plano 
coordenado, en el eje horizontal o de abcisas anotaremos la amplitud de clase 
o valor de la variable, mientras que en el eje vertical o de ordenadas se 
anota el número de elementos o frecuencias de clase; existen dos formas de 
presentar un histograma, por ejemplo, utilizando los datos del siguiente 
cuadro tendríamos: 
Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total 
Frecuencia 4 6 8 12 8 8 4 50 
PRIMERA FORMA
PROBABILIDAD Y ESTADÍSTICA 
32 
SEGUNDA FORMA 
POLÍGONO DE FRECUENCIAS 
Se obtiene relacionando la marca de clase (punto medio de cada 
intervalo) con su frecuencia respectiva. Ahora bien, para poder formar el 
polígono de frecuencias es necesario tomar una clase antes de la primera clase 
y una clase después de la última clase ambas con frecuencia cero, de esta 
manera al unir todos los puntos de relación marca de clase con frecuencia 
quedara formado el polígono respectivo. Veamos un polígono de frecuencias 
en base al siguiente cuadro estadístico. Las marcas de clase se obtienen como 
se menciono en el capítulo 2. 
Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total 
Frecuencia 4 6 8 12 8 8 4 50 
Marca de Clase 34.5 44.5 54.5 64.5 74.5 84.5 94.5
PROBABILIDAD Y ESTADÍSTICA 
33 
DIAGRAMA DE PASTEL 
Este diagrama se forma con la distribución de frecuencias 
relativas y se llama así debido a su configuración, la forma de obtener las 
rebanadas que le dan la forma de un pastel es multiplicando la frecuencia 
relativa por 360 grados que es el número de grados que tiene una 
circunferencia, su configuración es la siguiente: 
Extracción de el estudiante Z. Urbana Z. Suburbana Z. Rural Totales 
Frecuencia 240 1400 360 2000 
Porcentaje ( % ) 12 70 18 100
PROBABILIDAD Y ESTADÍSTICA 
34 
OJIVA O CURVA DE FRECUENCIA ACUMULADA 
Esta gráfica y distribución nos sirve para saber o poder 
responder preguntas como las siguientes: 
a) ¿Cuántos alumnos reciben calificaciones superiores a 60? 
b) ¿Cuántos alumnos tienen calificaciones inferiores a 60? 
Estas interrogantes en las que se desea conocer la frecuencia por 
encima o por debajo de cierto valor de la variable, son preguntas muy visuales 
en los distintos campos de la ciencia. 
Variable Frecuencia Frec. Acum. 
40 0 0 
50 3 3 
60 1 4 
70 2 6 
80 3 9 
90 1 10 
Totales 10 
Si hiciéramos un histograma de frecuencias obtendríamos la 
siguiente gráfica:
PROBABILIDAD Y ESTADÍSTICA 
En base al mismo cuadro estadístico elaboraremos a continuación 
35 
un histograma de frecuencias acumuladas. 
Sobre el mismo histograma de frecuencia acumulada podríamos 
formar la curva u Ojiva, que es otra gráfica característica de la Estadística 
Descriptiva, la cual se forma de la siguiente manera: 
a).- Se eligirán los ejes coordenados en los cuales se especifica-rán 
la clase (o variable) y la frecuencia acumulada. 
b).- Si se trabaja con clases, para la formación de la Ojiva 
utilizaremos los limites superiores de clase, mientras que si trabajamos con 
variables, utilizaremos el punto donde se localiza la variable. 
Tanto el histograma de frecuencia acumulada como la Ojiva son 
utilizados en los cuadros estadísticos por clases o variables, veamos la gráfica 
de una Ojiva.
PROBABILIDAD Y ESTADÍSTICA 
Existe una curva más sobre frecuencia acumulada que toma el 
nombre de Curva de Lorenz. La elaboración de esta curva se realiza de la 
misma manera que la Ojiva, sólo que la unión entre puntos son líneas rectas, 
además, de que se cierran los cuadros quedando la gráfica de la manera 
siguiente: 
36
PROBABILIDAD Y ESTADÍSTICA 
Está curva no es muy utilizada en el campo de las Ciencias 
Sociales, sin embargo, es muy importante dentro de las investigaciones en 
Física, Matemáticas, Fisiología, Ingeniería, etc. 
Las curvas de frecuencias son representaciones graficas de 
distribuciones de frecuencias teóricas. Ciertas formas de curvas de 
frecuencias reciben nombres específicos que guardan correspondencia con 
tipos específicos de distribuciones de frecuencias. Existen cuatro tipos de 
distribución correspondientes a estos tipos específicos, que son: La 
distribución Rectangular, La distribución Normal, La distribución Asimétrica 
y La distribución Bimodal. En este cuaderno hablaremos de la distribución 
Normal o curva acampanada ya que será utilizada más adelante. 
37 
DISTRIBUCION NORMAL 
Es una distribución simétrica alrededor de la media, con una 
curva de frecuencias en forma acampanada; es la principal distribución 
dentro de la Estadística Inferencial, más adelante en el capítulo siete esta 
distribución será tratada con más detalle, su representación gráfica es: 
A continuación se muestra un conjunto de datos, con los que 
vamos a elaborar las graficas estadísticas que se mencionaron: un histograma, 
un polígono de frecuencias, un diagrama de pastel y una ojiva.
PROBABILIDAD Y ESTADÍSTICA 
38 
30 42 50 73 60 63 
38 27 67 83 70 63 
52 83 97 49 83 73 
30 35 63 59 84 75 
84 90 80 95 85 68 
Basándonos en que se trata del ejercicio presentado en el capítulo 
anterior para la formación de un cuadro estadístico, procederemos a colocar 
nuevamente dicho cuadro, el cual queda de la siguiente manera: 
Número 
de 
Clase 
Intervalo de 
Clase 
Frecuencia Frecuencia 
Acumulada 
Frecuencia 
Relativa 
Frecuencia 
Rel. Acum. 
Marca de 
Clase 
1 27 - 35 4 4 4 / 30 4 / 30 31 
2 36 - 44 2 6 2 / 30 6 / 30 40 
3 45 - 53 3 9 3 / 30 9 / 30 49 
4 54 - 62 3 12 3 / 30 12 / 30 58 
5 63 - 71 6 18 6 / 30 18 / 30 67 
6 72 - 80 4 22 4 / 30 22 / 30 76 
7 81 - 89 5 27 5 / 30 27 / 30 85 
8 90 - 98 3 30 3 / 30 30 / 30 94 
Totales 30 30 / 30 
Basándose en el cuadro anterior, se procede a formar las gráficas estadísticas. 
a) HISTOGRAMA
PROBABILIDAD Y ESTADÍSTICA 
39 
b) POLÍGONO DE FRECUENCIAS 
c).- CÁLCULOS PARA OBTENER EL DIAGRAMA DE PASTEL 
Num. de Clase Frecuencia Relativa Frecuencia Relativa x 360 Grados por Clase 
1 0.133 0.133 x 360 48 
2 0.067 0.067 x 360 24 
3 0.100 0.100 x 360 36 
4 0.100 0.100 x 360 36 
5 0.200 0.200 x 360 72 
6 0.133 0.133 x 360 48 
7 0.167 0.167 x 360 60 
8 0.100 0.100 x 360 36
PROBABILIDAD Y ESTADÍSTICA 
40 
d) O J I V A 
frec. 30 
26.5 35.5 44.5 53.5 62.5 71.5 80.5 89.5 98.5 
Límites superiores de las clases 
EXAMEN DE AUTOEVALUACIÓN 
1.- Explique la elaboración de las siguientes gráficas estadísticas : 
a) Histograma. 
b) Diagrama de Pastel. 
c) Pictograma 
d) Polígono de Frecuencias 
2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son: 
2 8 5 2 7 2 5 5 5 6 
1 6 2 3 6 7 7 6 3 3 
4 3 4 8 1 4 5 2 7 5 
5 4 4 6 6 3 8 3 7 1 
8 8 3 2 3 8 6 2 7 2 
a) Formar un cuadro estadístico.
PROBABILIDAD Y ESTADÍSTICA 
41 
b) Construir un Histograma. 
c) Construir un Polígono de Frecuencia. 
d) Graficar una Ojiva. 
e) Construir un Diagrama de Pastel. 
3.- Con las siguientes estaturas de los estudiantes de un grupo de la Fac. de 
Derecho: 
1.87 1.79 1.75 1.90 1.84 1.82 1.77 1.85 
1.73 1.98 1.87 1.81 1.79 1.85 1.89 1.90 
1.77 1.83 1.91 1.94 1.79 1.80 1.92 1.84 
1.76 1.85 1.82 1.91 1.90 1.87 1.86 1.91 
1.91 1.89 1.86 1.86 1.97 1.78 1.74 1.76 
a) Construir un Cuadro Estadístico. 
b) Elaborar las cuatro gráficas estadísticas más usuales.
PROBABILIDAD Y ESTADÍSTICA 
42 
LA MEDIA ARITMÉTICA 
También se le conoce como promedio; es la suma de todos los 
elementos dividida entre el número total de ellos. Matemáticamente se 
representa de la siguiente manera: 
" Sea X una variable; X1, X2, . . . , Xn , la población generada 
por X, el promedio de la población será : 
 
Xi 
n 
n 
i=1 
 
 
(1) 
Existen dos tipos de medias, la Media Poblacional que se 
representa con la letra griega "  ", y la Media Muestral que se representa con 
una X testada " X ", ambas se obtienen de la misma forma. La Media 
Aritmética es una medida que se utiliza para describir poblaciones, por 
ejemplo: 
1.- La vida media de una pila es cierto número de horas. 
2.- La calificación promedio de los estudiantes de un grupo. 
3.- El gasto promedio de gasolina por kilómetro recorrido en un auto. 
4.- El salario medio de los empleados de una empresa. 
5.- La altura media de los jugadores de un equipo de básquetbol. 
Una característica de la Media Aritmética que debe tenerse en 
cuenta cuando se describe una población es que esta medida es afectada por 
los valores extremos de la muestra o población. Así por ejemplo: Si se le 
pide a un empresario que informe sobre el salario promedio de los
PROBABILIDAD Y ESTADÍSTICA 
trabajadores de su empresa, esta información se verá totalmente afectada si 
en el cálculo se incluye su propio salario y el de sus trabajadores de más alta 
jerarquía, ya que elevaría el salario promedio, en caso contrario, al calcular el 
salario promedio de los ejecutivos, no se incluiría el sueldo de los intendentes, 
porque esto bajaría el salario promedio de estas personas. La Media 
Aritmética es una buena medida descriptiva de una población, si los datos de 
ésta no se encuentran muy dispersos. Veamos a continuación algunos 
ejemplos. 
* Obtenga la media aritmética o promedio de las calificaciones de 
un grupo de 18 alumnos en la materia de Filosofía, las calificaciones de los 
alumnos son: 
43 
7 9 6 9 4 8 5 8 7 
6 9 8 5 7 5 8 4 7 
para obtener la media aritmética de los datos anteriores, debemos aplicar la 
fórmula (1), teniéndose entonces que : 
X = 
2 4 3 5 2 6 4 7 4 8 3 9 
18 
122 
18 
6 77 
( ) ( ) ( ) ( ) ( ) ( ) 
. 
     
  
teniéndose entonces que el promedio de los alumnos es: X = 6.77 
* Si la estatura de 12 jugadores de Básquet Bol de la 
Universidad de Colima son: 
1.97 1.92 1.84 1.86 1.88 1.92 
1.82 1.85 1.94 1.87 1.80 1.93 
¿cuál es la estatura promedio de los 12 jugadores?
PROBABILIDAD Y ESTADÍSTICA 
Aplicando la misma fórmula (1), tenemos que la media aritmética o 
44 
estatura promedio es: 
X = 
1.80 +1.82 +1.84 +1.85 +1.86 +1.87 +1.88 +1.92 +1.92 +1.93 +1.94 +1.97 
12 
X = 
22 . 
6 
12 
= 1.88 mts 
* Si la producción mensual de maíz en toneladas, durante un año 
en Tlaxcala fue : 
12,000 14,280 15,720 13,318 14,420 13,300 
12,800 13,618 14,710 15,127 14,360 13,750 
¿cuál es la producción promedio mensual y cuál es la producción anual ?. 
Aplicando la fórmula (1) tenemos: 
X = 
12,000 +14,280 +15,720 + + 15,127 +14,360 +13750 
12 
= 
167,403 
12 
   
X = 13,950.25 toneladas 
para obtener la producción anual, sólo debemos sumar todos datos de 
producción mensual, para lo cual, aplicaremos el concepto de sumatoria visto 
en la unidad 2. 
Producción anual = 
12  xi = 12,000 + 14,280 + * * * + 14,360 + 13,750 
i = 1 
Producción anual = 167,403 toneladas
PROBABILIDAD Y ESTADÍSTICA 
45 
LA MEDIANA 
Es otra medida que se utiliza para describir el valor central de 
una población. Para calcular la Mediana se ordenan los datos en forma 
ascendente o descendente, si el tamaño de la población es impar, la Mediana 
es el dato que queda al centro del los datos ordenados; si es par, la Mediana es 
el promedio de los dos datos que ocupan el centro de la ordenación. Se 
observa que la Mediana divide en dos partes iguales a los datos de una 
muestra o población. La Mediana es una medida que no es afectada por los 
valores extremos de la muestra o población. Veamos algunos ejemplos. 
* Calcular la mediana de los siguientes datos: 
46, 54, 58, 56, 48, 58, 112 
Para calcular la Mediana, primero se ordenan los datos en forma ascendente o 
descendente, teniéndose: 
46, 48, 54, 56, 58, 58, 112 
Una vez ordenados, se toma el dato al centro de la ordenación ya 
que en este caso tenemos un número impar de datos, por lo tanto, la Mediana 
es: 56 
* En un grupo de 15 alumnos de la Fac. de Medicina, los 
alumnos obtuvieron las siguientes calificaciones en Anatomía: 
85 92 78 87 96 
87 79 90 77 92 
87 94 83 78 89 
Determine la Mediana.
PROBABILIDAD Y ESTADÍSTICA 
Para obtener la Mediana es necesario ordenar los datos, 
46 
teniéndose entonces que: 
77 78 78 79 83 85 87 87 87 89 90 92 92 94 96 
La Mediana de los datos o el dato que divide en dos partes iguales a la 
muestra es 87 debido a ser el dato que ocupa el centro de la muestra por ser 
un número impar. A partir de este momento, representaremos a la Mediana de 
la siguiente manera: X 
* Determine la Mediana del siguiente conjunto de datos: 
12 18 23 16 24 17 18 20 
15 9 16 22 18 11 14 19 
para obtener la Mediana debemos ordenar los datos en forma ascendente y 
escoger el dato que se encuentre en el centro de la colección, por lo tanto: 
9 11 12 14 15 16 16 17 
18 18 18 19 20 22 23 24 
como podemos observar en este caso el número de datos es par y por lo tanto 
la Mediana de esta colección de datos será el media aritmética de los datos 
que ocupan el centro de la colección, siendo estos datos los números 17 y 18 
teniéndose entonces que la Mediana en este ejercicio es : X 
= 
17 18 
2 
17 5 
 
 . .
PROBABILIDAD Y ESTADÍSTICA 
47 
LA MODA 
Es otra medida de tendencia central y que se utiliza para describir 
el valor típico de una población. La Moda en una población o muestra es el 
valor que se presenta con mayor frecuencia. Sí en una muestra de 10 casas, se 
considera la siguiente distribución en número de hijos, 3, 0, 1, 5, 6, 2, 1, 2, 7, 
2, entonces la Moda es el número 2, ya que es el elemento que aparece con 
mayor frecuencia. La Moda la representaremos de la siguiente manera : Mo . 
Debemos aclarar que pudiera existir una colección de datos en la que existan 
dos o más modas, lo cual sucedería cuando existieran dos o más elementos 
que aparecen la misma cantidad de veces y que además son el que mayor 
frecuencia tienen. Veamos algunos ejemplos. 
* En un grupo de 15 alumnos de la Fac. de Medicina, los 
alumnos obtuvieron las siguientes calificaciones en Anatomía: 
85 92 78 87 96 
87 79 90 77 92 
87 94 83 78 89 
¿ Cuál es la Moda ?. La Moda es la calificación que se presentó con mayor 
frecuencia en el grupo, teniéndose entonces que: Mo = 87 
* Si la estatura de 12 jugadores de Básquet Bol de la Universidad 
de Colima son: 
1.97 1.92 1.84 1.86 1.88 1.92 
1.82 1.85 1.94 1.87 1.80 1.93
PROBABILIDAD Y ESTADÍSTICA 
¿cual es la estatura que existe en mayor cantidad en los 12 jugadores? A la 
estatura que mayor frecuencia tenga es la que llamaremos la Moda, 
teniéndose entonces que: Mo = 1.92 
48 
* Obtenga la Moda de la siguiente colección de datos: 
9 11 12 14 16 16 16 17 
18 18 18 19 20 22 23 24 
en este ejemplo tenemos que los números que mayor veces aparecen son el 16 
y el 18, por lo tanto, en esta colección de datos tenemos un ejemplo de 
distribución bimodal ( existen 2 modas en la colección ), por lo que las modas 
son: Mo = 16 y 18 
COMPARACIÓN DE LA MEDIA 
ARITMETICA, LA MEDIANA Y LA MODA 
Hemos visto 3 medidas de tendencia central que describen a una 
población, pero, ¿cuál debe usarse en una situación determinada?. La elección 
de la medida de tendencia central a usarse depende del tipo de variable que 
genera la población y de las finalidades del estudio que se está realizando. Un 
criterio fuerte para la elección de alguna de estas medidas es el de escoger la 
que presente ventajas significativas sobre las otras dos, por ejemplo: En el 
caso de una fábrica de automóviles la empresa deber decidir que marca de 
acumuladores usar en sus vehículos, para lo que le puede ser útil además del 
costo, comparar la durabilidad de los acumuladores de diversas marcas. En 
poblaciones de este tipo, la media, la mediana, y la moda son en la mayor 
parte de los casos valores muy parecidos.
PROBABILIDAD Y ESTADÍSTICA 
La media sólo puede calcularse cuando la variable de interés es 
numérica. A pesar de que la media puede ser afectada por valores muy 
grandes o muy pequeños respecto al resto de la población, es una medida que 
se emplea con mucha frecuencia para orientar la toma de decisiones, porque 
su naturaleza numérica facilita el tratamiento estadístico. 
La mediana es una medida que sólo se puede obtener si la 
variable al menos es cardinal, en general, se acude a esta medida cuando no se 
puede calcular la media o ésta no sea representativa de la población. 
La moda es una medida que puede obtenerse para cualquier tipo 
de variable. Hay muchas ocasiones en que esta medida presenta ventajas 
sobre las otras dos para describir a una población. Por ejemplo: Consideremos 
el caso de planear la producción de un nuevo tipo de chamarras, para el largo 
de la manga y la talla, el fabricante considerará las de mayor frecuencia, es 
decir, la moda. En este caso, la media o la mediana no le aportan la 
información requerida. Veamos un ejemplo: 
El siguiente conjunto de datos contiene las calificaciones de 50 
49 
alumnos de la materia de Economía: 
5 2 3 8 4 5 4 7 5 8 
6 8 7 7 2 9 1 10 9 6 
9 7 10 8 9 9 10 5 9 5 
9 10 10 2 8 2 10 2 7 3 
3 10 5 10 9 6 1 9 7 6 
a) Obtener La Media Aritmética, La Mediana y La Moda. 
X = ( 1 + 1 + 2 + . . . + 10 + 10 + 10 ) / 50 
X = 326 / 50 = 6.52 
Mediana = X 
= 7 ( por ocupar los lugares 25 y 26 en el arreglo ) 
La Moda = Mo = 9 ( por ser el que más se repite ó aparece )
PROBABILIDAD Y ESTADÍSTICA 
b) Mencione cuál de las tres medidas de tendencia central es la más 
50 
adecuada y ¿por que? 
La más representativa es la Media Aritmética, ya que los datos no se 
encuentran muy dispersos, además de que la Mediana y la Moda tienden a 
cargarse más hacia un extremo. 
Debemos señalar que las tres medidas de tendencia central 
mencionadas anteriormente son las más comunes, más no son las únicas. 
Existen otras medidas de tendencia central como son la Media Geométrica, La 
Media Armónica, La Media Ponderada, La Media Supuesta, y algunas otras. 
Veamos un ejemplo de lo anterior. 
* La duración en horas de una muestra de focos tomados de la 
producción diaria de una fabrica son: 
129 145 168 164 165 172 168 179 168 170 
159 168 175 164 179 168 180 173 149 159 
168 178 177 178 168 172 168 158 154 168 
a) Calcular la Media Aritmética, la Mediana y la Moda. 
X = 
129 + 145 + + 154 + 168 
30 
= 
4991 
30 
= 166.36 horas 
   
X 
= 168 por ocupar el lugar 15 y 16 de la ordenación 
Mo = 168 por ser el número en horas que más se repite. 
b) Mencione cuál de las tres medidas de tendencia central es la más 
apropiada para este evento. 
Para este evento, consideramos que la medida de tendencia 
central más apropiada es la Media Aritmética, ya que es el dato que se
PROBABILIDAD Y ESTADÍSTICA 
encuentra más hacia el centro de la distribución aun cuando es afectado por la 
medida de 129 horas. 
51 
MEDIA GEOMÉTRICA 
La Media Geométrica es muy usual para el cálculo de promedios 
de tasas de variación, en la elaboración de Números Índice, etc. Se define de 
la siguiente manera: “Sí tenemos n elementos, la Media Geométrica es la raíz 
n-ésima del producto de todos los elementos ”. La fórmula para obtenerla es: 
MEDIA GEOMÉTRICA ( g ) = n X X X 1 * 2 * . . . * n 
donde: n = Tamaño de la Muestra 
Xi = Elemento de la Muestra 
* Obtener la Media Geométrica de los siguientes números: 3, 5, 
7, 9, 8. 
g = 5 3 5 7 8 9 
* * * * = 5 7,560 = 5.966 
Veamos algunos ejercicios de lo visto hasta este momento. 
* Obtener la Media Aritmética de los datos: 
6 3 8 5 2 
X = 
    
6 3 8 5 2 
5 
= 
24 
5 
= 4.8 
* Los ingresos anuales de 12 profesores en nuevos pesos son: 
72,000 72,000 75,000 81,000 163,000 78,000 
81,000 89,000 72,000 90,000 84,000 81,000
PROBABILIDAD Y ESTADÍSTICA 
Calcular las medidas de tendencia central. Indique cual es la más significativa 
y ¿por que? 
52 
X = 
72,000 + 72,000 + + 90,000 +163,000 
12 
= 
1' 038,000 
12 
   
X = 86,500 nuevos pesos 
Mo = 72,000 y 81,000 
X 
= 81,000 
La más significativa es la Mediana, por que es el valor que se 
encuentra al centro de la distribución, mientras que la Moda toma un valor 
extremo lo que la hace no muy significativa y a la Media la afecta el valor de 
163,000 por estar muy disperso. 
* Obtener la Media Geométrica de los siguientes datos: 
12 15 17 13 18 14 18 13 17 15 
g = 10 12 x 15 x 17 x 13 x18 x 14 x 18 x 13 x 17 x 15 
g = 10 5,981,655,000,000 = 15.05 
MEDIA ARMÓNICA 
La idea de promedio es tan manejable que no es sorprendente que 
se hayan inventado diversos tipos de promedio de modo que pueda 
representarse con un mínimo de deformación un campo tan amplio como sea 
posible. Podemos escoger nuestro promedio, y tomamos el apropiado para 
nuestro propósito. El promedio aritmético de un conjunto de números es el 
más simple de los promedios ó medidas de centralización.
PROBABILIDAD Y ESTADÍSTICA 
Un segundo tipo de promedio importante es la Media Armónica, 
que es el recíproco de la media aritmética de los recíprocos de los valores que 
queremos promediar. La Media Armónica es el promedio adecuado cuando 
tratamos con tarifas y precios. Consideremos un ejemplo para explicar este 
tipo de promedio. 
* Un aeroplano vuela alrededor de un cuadrado cuyo lado tiene 
100 Km de largo, tomando el primer lado a 100 Km/h , el segundo lado a 200 
Km/h , el tercer lado a 300 Km/h y el cuarto lado a 400 Km/h. ¿Cuál es la 
velocidad media del aeroplano en su vuelo alrededor del cuadrado? 
Si promediamos las velocidades usando la media aritmética de la 
53 
manera usual, tenemos: 
100 200 300 400 
4 
X = 
   = 250 Km/h 
pero éste no es el resultado correcto, ya que lo podemos comprobar de la 
siguiente manera : 
Tiempo para viajar el primer lado 1 hora 
Tiempo para viajar el segundo lado 30 minutos 
Tiempo para viajar el tercer lado 20 minutos 
Tiempo para viajar el cuarto lado 15 minutos 
De el desglose anterior tenemos que el tiempo total empleado en 
recorrer los 400 kilómetros fue de 2 horas 5 minutos, con este total se 
deduce que la velocidad media del aeroplano en recorrer los 400 Km del 
cuadrado fue de 192 Km/h. 
El promedio aritmético nos da por lo tanto un resultado 
equivocado. Podemos deducir la razón de esto a partir del hecho de que no
PROBABILIDAD Y ESTADÍSTICA 
todas las velocidades se mantienen durante el mismo tiempo, sólo lo hacen 
para la misma distancia. 
El promedio correcto para usar en este caso es la Media 
Armónica. Para dar la fórmula introduciremos la notación de sumatoria ya 
analizada anteriormente, teniéndose entonces que: 
54 
Media Armónica (H) = 
n 
1 
n 
i=1 Xi 
a partir de este momento, cuando hablemos de la Media Armónica, la 
representaremos con la letra H. Para ilustrar esta fórmula, apliquémosla a 
nuestro ejemplo del aeroplano. 
Las cuatro velocidades que se mantenían cada una sobre la 
misma distancia, eran 100 Km/h, 200 Km/h, 300 Km/h y 400 Km/h. Estos 
son los valores de Xi . Puesto que hay cuatro valores, el valor de n en 
nuestro ejemplo es 4, y tenemos entonces: 
H = 
4 
1 
100 
= 
4 
25 
1200 
= 
4,800 
25 
= 192 Km/ h 
1 
200 
1 
300 
   
1 
400 
en donde 192 Km/h es la respuesta correcta. 
Como podemos ver, la media armónica es adecuada aquí porque 
los tiempos eran variables con las distancias constantes. De haber sido las 
tiempos constantes y las distancias variables, la media aritmética hubiese sido 
la correcta. Cabe señalar que el tipo de promedio adecuado depende siempre 
de los términos del problema en curso. Las fórmulas no se han de aplicar 
indiscriminadamente. Veamos algunos ejemplos.
PROBABILIDAD Y ESTADÍSTICA 
* Un agricultor puede arar un terreno empleando un tractor en 
cuatro días; un ayudante suyo puede hacer el mismo trabajo con un tractor 
más pequeño en 6 días. ¿Cuál es el rendimiento representativo de los dos 
tractores?, ¿En cuántos días pueden arar el mismo campo si trabajan 
conjuntamente? 
55 
Para calcular el rendimiento representativo, tenemos: 
H 
n 
n   
i xi 
 
     
  
1 
2 
1 
4 
1 
6 
2 
3 2 
12 
2 
5 
12 
24 
5 
4 
4 
5 
1 
por lo tanto el rendimiento representativo de los dos tractores es de 4 
4 
5 
días. 
Para determinar en cuántos días los tractores pueden arar el 
campo si trabajan conjuntamente tenemos que su rendimiento representativo 
es de 4 
4 
5 
días, por lo que al trabajar conjuntamente resulta: 
4 
5 
2 
4 
24 
5 
2 
24 
10 
2 
2 
5 
   
por lo tanto para arar el campo si los dos tractores trabajan conjuntamente, se 
requiere 2 
2 
5 
días. 
Comprobación: Los dos tractores pueden arar en un día 
1 
4 
1 
6 
5 
12 
  del campo; en arar todo el campo tardarán : por dos días de arado 
conjuntamente habrán arado 
10 
12 
del campo, pero como araron juntos 
2 
5 
de un 
día más, eso es en proporción del campo lo siguiente : 
2 
5 
de un día por 
5 
12 
de
PROBABILIDAD Y ESTADÍSTICA 
56 
campo arado conjuntamente en un día da 
2 
12 
de campo, que es el complemento 
de 
10 
12 
del campo, entonces, en arar todo el campo tardarán 2 
2 
5 
días. 
* En una ruta ferroviaria la velocidad a la que se desplaza un tren 
es: los primeros 90 Km. a 70 Km/h, en el segundo tramo de 70 Km. a 100 
Km/h; determinar la velocidad promedio para todo el recorrido. 
Dado que las distancias de los tramos no son iguales, se debe 
utilizar una ecuación representativa que denominamos “media armónica 
ponderada” para las velocidades donde los “pesos” son las distancias 
respectivas, es decir: 
1 1 
H N 
f 
X 
  en donde N = f , o también puede ser 
N 
H 
f 
X 
  sustituyendo los datos de velocidad y distancia, resulta: 
d + d + d + . . . + d 
v 
d 
v 
d 
v 
d 
v 
. . . + 
d 
v 
1 2 3 N 1 
1 
2 
2 
3 
3 
N 
N 
    
sustituyendo los datos en la ecuación de la media armónica ponderada para la 
velocidad media, resulta: 
9 0 7 0 
1 6 0 
1 9 8 5 7 
 
 
 
v 
= 
9 0 
7 0 
7 0 
1 0 0 
v 
= 1 . 2 8 5 7 + 0 . 7 
1 6 0 
. 
v 
v = 8 0 . 5 7 
por lo tanto la velocidad promedio para todo el recorrido es 80.57 Km/h. 
Comprobación: Determinamos primeramente el tiempo 
requerido para recorrer el primer tramo:
PROBABILIDAD Y ESTADÍSTICA 
57 
TIEMPO ( t ) = 
DISTANCIA ( d ) 
VELOCIDAD ( v ) 
= 
90 Km 
70 Km / h 
horas 
El tiempo requerido para recorrer el segundo tramo es: 
( t ) = 
d 
v 
Km 
100 Km / h 
horas. 
La velocidad media para todo el recorrido es: 
VELOCIDAD MEDIA = 
DISTANCIA TOTAL 
TIEMPO TOTAL 
90 Km + 70 Km 
1.2857 h + 0.7 h 
Km 
1.9857 h 
VELOCIDAD MEDIA = 80.57 Km / h 
 
  
  
 
12857 
70 
0 7 
160 
. 
. 
MEDIA ARMONICA PARA DATOS AGRUPADOS 
Si consideramos los elementos ( X1 , X2 , X3 , . . . , XN ) que se 
presentan con frecuencias ( f1 , f2 , f3 , . . . , fN ) en donde ( f1 + f2 + f3 + . . . + 
fN = N ) representa la frecuencia total; la ecuación de la Media Armónica para 
datos agrupados se expresa por: 
H = 
 
  
f 
f 
X 
N 
f 
X 
 
donde: H = Media Armónica 
N =  f = Número total de frecuencias 
XN = Marcas de clases de datos agrupados. 
fN = Frecuencias de clase. 
* La siguiente tabla de distribuciones de frecuencias registra las 
longitudes en centímetros que en una semana tienen 100 plantas de frijol; con 
esta información obtener la Media Armónica.
PROBABILIDAD Y ESTADÍSTICA 
  15.2632252 
58 
INTERVALOS 
( LONGITUDES ) 
FRECUENCIAS ( f ) 
( No. DE PLANTAS ) 
5.4 - 5.7 7 
5.8 - 6.1 16 
6.2 - 6.5 21 
6.6 - 6.9 29 
7.0 - 7.3 18 
7.4 - 7.7 9 
100 
SOLUCION: Para determinar la Media Armónica es necesario construir la 
siguiente tabla de distribuciones: 
INTERVALOS 
( LONGITUDES ) 
MARCA DE 
CLASE ( X) 
FRECUENCIAS ( f ) 
(No. DE PLANTAS) 
f 
X 
5.4 - 5.7 5.55 7 1.261261 
5.8 - 6.1 5.95 16 2.689075 
6.2 - 6.5 6.35 21 3.307086 
6.6 - 6.9 6.75 29 4.296296 
7.0 - 7.3 7.15 18 2.517482 
7.4 - 7.7 7.55 9 1.192052 
N = 100 = f f 
X 
Sustituyendo los datos anteriores en la correspondiente ecuación tenemos: 
H = 
N 
f 
X 
= 
100 
15.2632252 
= 6.55 
 
La media armónica calculada a partir de los datos agrupados es de 6.55 cm. 
EJERCICIOS PROPUESTOS 
1.- ¿Qué es una medida de tendencia central?
PROBABILIDAD Y ESTADÍSTICA 
2.- Describa el proceso para la obtención de la Media Aritmética, la 
Mediana y la Moda. 
3.- ¿Qué criterio se sigue para determinar la medida de tendencia central 
más significativa? 
4.- Determine la Media, la Mediana, la Moda y la Media Geométrica de los 
siguientes datos: 
59 
1 1 2 2 3 3 3 4 
4 4 4 5 5 6 7 8 
5.- Los siguientes datos representan el tiempo de vida en años de una 
muestra aleatoria de 30 motores eléctricos similares. 
2.0 3.0 0.3 3.3 1.3 0.4 
0.2 6.0 5.5 6.5 0.2 2.3 
1.5 4.0 5.9 1.8 4.7 0.7 
4.6 0.3 1.5 0.5 2.5 5.0 
1.0 6.0 5.6 6.0 1.2 0.2 
a) Construya un cuadro estadístico. 
b) Construya un Histograma, un Polígono de Frecuencias y un 
Diagrama de Pastel. 
c) Con los datos calcular la Media Aritmética, la Mediana y la 
Moda.
PROBABILIDAD Y ESTADÍSTICA 
60 
MEDIDAS DE DISPERSIÓN 
Cuando una población es generada por una variable numérica, 
además de poderla describir mediante una medida de tendencia central, 
también se puede obtener una medida que nos indique el grado de 
homogeneidad de sus datos. A este tipo de medidas se les conoce como 
medidas de variabilidad o de dispersión. Existen varias medidas de 
dispersión, como son el Rango, la Desviación Media, la Varianza, y algunas 
otras, las cuales estudiaremos en este capítulo. 
RANGO: Es una medida de dispersión que se obtiene restando al 
mayor elemento de la colección de datos, el elemento menor. Aunque el rango 
es una medida que tiene la ventaja de calcularse fácilmente, tiene la 
desventaja de sólo considerar los valores extremos de la población (También 
se le conoce como Amplitud Total ). 
DESVIACIÓN ESTÁNDAR 
Esta medida nos indica que tan dispersos se encuentran en 
promedio, los datos con respecto a la media aritmética. Existen dos tipos de 
desviación estándar, la Desviación Estándar Muestral y la Desviación 
Estándar Poblacional. 
La Desviación Estándar Poblacional se calcula en base a la media 
aritmética poblacional, utilizando la siguiente fórmula: 
 
 
 
n 
 ( X i 
- ) ² 
N 
i = 1 
donde: N = Tamaño de la Población.
PROBABILIDAD Y ESTADÍSTICA 
61 
 = Media Aritmética Poblacional. 
Xi = Elemento de la Población. 
 = Desviación Estándar Poblacional. 
La desviación estándar nos puede indicar como se comportan los 
datos alrededor de una medida de tendencia central y como en ocasiones a 
pesar de tener el mismo valor dos muestras diferentes, en su medida de 
tendencia central, el grado de dispersión es distinto. Pudiéramos tener una 
muestra en que su media aritmética fuera 4 y que los datos oscilaran entre 3 
y 5, y otra muestra que su media aritmética fuera 4 y que sus datos oscilaran 
entre 0 y 8. Aunque ambas tienen el mismo valor en su medida de tendencia 
central, tienen distinta distribución de los datos, de aquí la importancia de 
tener una medida que nos indique el grado de dispersión de los datos con 
respecto al dato central. 
La Desviación Estándar Muestral tiene dos modificaciones con 
respecto a la Poblacional, ya que se utiliza la media aritmética muestral y el 
tamaño de la muestra menos 1, quedando la fórmula de la siguiente manera: 
s = 
( X i 
- X )² 
n - 1 
n 
i=1 
donde: n = Tamaño de la Muestra. 
Xi = Elemento de la Población 
X = Media Aritmética Muestral. 
s = Desviación Estándar Muestral.
PROBABILIDAD Y ESTADÍSTICA 
Existe otra medida de dispersión llamada Desviación Media, que 
requiere del cálculo de la Amplitud, aún cuando no es muy utilizada, es 
necesario tener conocimiento de ella. Se obtiene con la siguiente fórmula: 
62 
 m = 
X i 
- X 
n 
n 
i=1 
ahora bien, este tipo de medida de dispersión no nos proporciona un grado 
adecuado de homogeneidad, por lo que es necesario utilizar el de la 
desviación estándar para representar el grado de dispersión de la muestra con 
respecto a su media, además, de que no sirve para calcular la varianza. 
VARIANZA 
Es el cuadrado de la desviación estándar. Dependiendo de la 
desviación estándar de que se trate, recibirá el nombre de Varianza Muestral o 
Varianza Poblacional ( s2 si es la muestral y  2 si es la poblacional ). 
Veamos algunos ejemplos. 
* Se tomó la presión sanguínea de diez personas antes y después 
de fumar. Los cambios fueron: 
+10, -5, +7, +4, +2, +3 -4, -5, -3, +9 
Calcular la Varianza y Desviación Estándar con esos datos. 
X = 
10  5 7  4  2  3 4  5 3 9 
10 
= 
18 
10 
= 1.8 
s2 = 
   
(10 - 1.8)² + (-5 - 1.8)² + + (-3 - 1.8)² + (9 - 1.8)² 
10 - 1 
s2 = 33.511
PROBABILIDAD Y ESTADÍSTICA 
Como la desviación estándar es la raíz cuadrada de la varianza, 
entonces tenemos que la desviación estándar de las diez presiones sanguíneas 
registradas es: s = 5.788 
63 
* Dados los siguientes datos: 
3, 5, 16, 23, 31, 12, 23, 13, 15. 
a).- Calcular las medidas de tendencia central. 
X = 
        
3 5 16 23 31 12 23 13 15 
9 
= 
141 
9 
X = 15.66 
Ordenando los elementos tenemos que: 
3 5 12 13 15 16 23 23 31 
teniéndose que la mediana será el dato que se encuentre al centro del arreglo, 
por lo tanto : Mediana = 15 La Moda = 23 
b).- Calcular las medidas de Dispersión 
s2 = 
   
(3 - 15.66)² + (5 -15.66)² + + (23 -15.66)² + (31- 15.66)² 
9 - 1 
s2 = 
160.27 +113.63 +13.39 + 7.07 + 0.43 + 0.12 + 3.87 + 53.87 + 235.31 
8 
637 . 
96 
8 
  79 . 
745 
por lo tanto, la desviación estándar es entonces: s = 79.745 = 8.93 
* En el departamento de Inglés de la UAS se informó que el 
sueldo anual de los profesores es en promedio de 72,000 dólares, con una 
desviación estándar de 0.0 ¿Cuál será la mediana y la moda de estos sueldos? 
R.- Tanto la Mediana y la Moda es 72,000; ya que cuando la 
desviación estándar es 0, se tiene que no existe dispersión entre los valores de 
la muestra (dicho de otra manera, no existe variación entre los datos).
PROBABILIDAD Y ESTADÍSTICA 
* Si en una colonia se registró el número de personas que viven 
por casa tomando una muestra de 18 viviendas, obteniéndose los siguientes 
resultados: 
64 
6 5 6 4 9 2 
8 4 5 3 3 5 
6 5 7 2 5 7 
determine la media aritmética, la varianza y desviación estándar de la 
muestra. 
X = 
( )  ( )  ( )  ( )  ( )  ( )   
2 2 2 3 2 4 5 5 3 6 2 7 8 9 
18 
= 
92 
18 
= 5.11 
s2 = 
( X i 
- X )² 
n - 1 
n 
i=1 
s2 = 
2(2-5.11)²+2(3-5.11)²+2(4-5.11)²+5(5-5.11)²+3(6-5.11)²+2(7-5.11)²+(8-5.11)²+(9-5.11)² 
18 - 1 
s2 = 
19.3442+8.9042+2.4642+0.0605+2.3763+7.1442+8.3521+ 15.1321 
17 
= 
63 . 
7778 
17 
s2 = 3.7516353 
por lo tanto la desviación estándar es s = 1.9369135 
* Calcule la media aritmética, la varianza y desviación estándar 
de los siguientes datos: 5 7 1 2 4 
X = 
5 7 1 2 4 
5 
19 
5 
3 8 
    
  . 
s2 = 
(5 - 3.8)² + (7 - 3.8)² + (1- 3.8)² + (2 - 3.8)² + (4 - 3.8)² 
5 - 1 
 
22 . 
8 
4 
s2 = 5.7 ; 
por lo tanto la desviación estándar es : s = 2.3874673
PROBABILIDAD Y ESTADÍSTICA 
65 
CALCULO DE LA MEDIA Y DESVIACIÓN 
ESTÁNDAR PARA DATOS AGRUPADOS 
Generalmente cuando se agrupan en clases los datos generados 
por una variable numérica, es posible calcular la media y la desviación 
estándar con los datos tabulados. En estos casos, tanto la media como la 
desviación estándar son aproximaciones de los valores reales, debido a que 
uno conoce la cantidad de elementos que pertenecen a la clase, pero 
desconocemos sus valores. 
Para calcular la Media Aritmética de un conjunto de datos 
agrupados, se emplea la siguiente fórmula: 
 ( mi * fi )  ( mi * fi ) 
X= = 
 fi n 
Donde: mi = Marca de Clase. 
fi = Frecuencia de Clase. 
n = Tamaño de la Muestra. 
X = Media Aritmética. 
Para el cálculo de la Varianza se utiliza: 
s2  
( m - X )²  f 
i i 
n - 1 
Existe otra forma de calcular la varianza, llamada forma 
simplificada, la cual se obtiene sustituyendo en la fórmula de la varianza la de 
la media, y al simplificar quedaría así:
PROBABILIDAD Y ESTADÍSTICA 
66 
    
s² = 
 i  i  i  i 
n (X)² f - (X f ) ² 
n(n-1) 
donde : n = Tamaño de la Muestra 
Xi = Elemento de la Muestra 
fi = Frecuencia de la Clase 
La fórmula anterior es para calcular la Varianza de un grupo de 
variables colocadas en un cuadro estadístico, para determinar la varianza de 
un cuadro estadístico cuando esté agrupado por clases, entonces sustituimos 
en el lugar de la variable ( Xi ) la marca de clase ( mi ) teniéndose entonces 
que la fórmula a aplicar será: 
n[ {(mi)2 
* fi }] - [ ( mi * fi )]2 
s2 = 
n ( n - 1 ) 
donde : n = Tamaño de la Muestra 
mi = Marca de Clase 
fi = Frecuencia de Clase 
En los dos casos anteriores, la Desviación Estándar se obtiene 
sacando la raíz cuadrada de la Varianza. 
INTERPRETACIÓN PRACTICA DE LA 
DESVIACIÓN ESTÁNDAR 
Introduciremos ahora un teorema interesante y útil, desarrollado 
por el matemático ruso Tchebysheff. La demostración del teorema no es 
difícil, pero la omitiremos para manejar directamente su significado.
PROBABILIDAD Y ESTADÍSTICA 
El teorema de Tchebysheff dice : “ Dado un número k mayor o 
igual a 1 y un conjunto de n observaciones x1, x2, x3, * * * , xn , por lo 
menos ( 1 - 1/k2 ) de las observaciones se encuentran dentro de k 
desviaciones estándar de la media ”. 
El teorema de Tchebysheff se aplica a cualquier conjunto de 
observaciones y, para propósitos de ilustración, nos podríamos referir tanto a 
la muestra como a la población. Usaremos la notación correspondiente a 
poblaciones, pero deben darse cuenta que bien podríamos usar la media 
aritmética y la desviación estándar muestral. La idea contenida en el teorema 
de Tchebysheff se ilustra en la siguiente figura: 
67 
k 1 - 1/k2 
1 
2 3/4 
3 8/9 
4 15/16 
-3 -2 -1 0 1 2 3 
Se construye un intervalo midiendo una distancia de k veces la 
 en unidades a ambos lados de la media aritmética  . Note que el teorema 
es cierto para cualquier valor que le demos a k , siempre y cuando k sea 
mayor o igual a 1. Entonces, calculando la fracción 1 - 1/k2 , vemos que el 
teorema de Tchebysheff establece que al menos esa fracción del número de 
observaciones caerán en el intervalo construido. 
Ponemos énfasis en la expresión “ al menos ” del teorema de 
Tchebysheff porque el teorema es muy conservador, siendo aplicable a
PROBABILIDAD Y ESTADÍSTICA 
cualquier distribución. En la mayoría de las situaciones, la fracción de las 
observaciones que caen en el intervalo especificado excede a 1 - 1/k2. 
Enunciaremos ahora una regla que describe con precisión la variabilidad de 
una distribución particular en forma de campana y que describe 
razonablemente bien la variabilidad de otras distribuciones de datos de forma 
monticular. La frecuente ocurrencia de distribuciones acampanadas y 
monticulares en la naturaleza, y por tanto la aplicabilidad de nuestra regla, 
nos conduce a llamarla la “ regla empírica ”. 
Regla empírica: Dada una distribución de observaciones que es 
68 
aproximadamente acampanada, el intervalo : 
1)    contiene aproximadamente el 68 % de las observaciones. 
2)   2 contiene aproximadamente el 95 % de las observaciones. 
3)   3 contiene todas o casi todas las observaciones. 
Las relaciones anteriores las podemos mostrar por medio de una 
gráfica en la cual se muestra la distribución en porcentajes de los datos 
alrededor de la media aritmética. 
-3 -2 -   2 3 
68.27 % 
95.45 % 
99.95 %
PROBABILIDAD Y ESTADÍSTICA 
La distribución acampanada se conoce comúnmente como la 
Distribución Normal y será discutida con detalle en el capítulo 7. Lo que 
quisiéramos recalcar aquí, es que la regla empírica es sumamente útil y 
proporciona una descripción excelente de la variación para muchos tipos de 
datos. Note que el Teorema de Tchebysheff es un hecho que puede ser 
demostrado matemáticamente y sin embargo dejamos el razonamiento 
matemático para un curso de Cálculo. 
Aunque los porcentajes mencionados en la regla corresponden a 
áreas bajo la curva normal, los mismos porcentajes son validos 
aproximadamente para distribuciones con formas diversas, siempre que 
tiendan a ser más o menos monticulares. Veamos algunos ejemplos. 
* La media y varianza de un conjunto de n = 25 observaciones 
son 75 y 100 respectivamente. Usando la regla empírica para describir esta 
distribución tendríamos : Sabemos que  = 75 y que  2 =100 . La 
desviación estándar es  = 10. La distribución de las observaciones esta 
centrado alrededor de  = 75, y la regla empírica establece que: 
69 
a)   = 75  10 ; que el 68 % de las observaciones esta entre 65 y 85. 
b)  2 = 7520; que el 95 % de las observaciones esta entre 55 y 95. 
c)  3 = 7530; que todas o casi todas las observaciones se 
encuentran entre 45 y 105. 
* En la siguiente tabla se especifica la vida útil de una marca de 
pilas que se utilizan en una misma marca de reloj. 
Vida Útil 
(Horas ) 
fi mi mi x fi ( mi )2 x fi 
420 - 439 15 429.5 06,442.5 2’767,053.75 
440 - 459 20 449.5 08,990.0 4’041,005.00 
460 - 479 25 469.5 11,737.5 5’510,756.25 
480 - 499 25 489.5 12,237.5 5’990,256.25 
500 - 519 32 509.5 16,304.0 8’306,888.00
PROBABILIDAD Y ESTADÍSTICA 
520 - 539 30 529.5 15,885.0 8’411,107.50 
540 - 559 24 549.5 13,188.0 7’246,806.00 
560 - 579 14 569.5 07,913.0 4’540,623.50 
580 - 599 7 589.5 04,126.5 2’432,571.75 
TOTALES 190 95,945.0 48’806,208.00 
Obtener la Media Aritmética, la Varianza y Desviación Estándar 
70 
(por el método general y el simplificado). 
 ( mi * fi ) 95,945 
X= = = 504.97 
n 190 
La Varianza en su forma simplificada es : 
n[ {(mi)2 
* fi }] - [ ( mi * fi )]2 
s2 = 
n ( n - 1 ) 
s2 = 
( )( ' , ) , ' , , ' , 
190 48806 208 9 273179 500 9 205443 000 
35 , 
910 
- (95,945)² 
190(190 -1) 
 
 
s2 = 
67 ' 736 , 
500 
35 , 
910 
= 1,886.2852 
por lo tanto : s = 43.43 
si a continuación obtenemos la varianza en su forma general para datos 
agrupados tendremos : 
 [( mi - X )2 
* fi] 
s2 = 
n - 1 
s2 = 
 
(429.5-504.97)² (15)+ (449.5-504.97)² (20)+ +(569.5-504.97)² (14)+ (589.5-504.97)² (7) 
190-1
PROBABILIDAD Y ESTADÍSTICA 
71 
s2 = 
, .  , .     , . 
85 435814 61 538 418 360 950 31 
189 
 
+ 58,297.693+ 50,017.246 
189 
s2 = 1,909.79 
s = 1,909.79 = 43.701 
Como podemos observar, no existe gran diferencia entre la 
desviación estándar obtenida por la forma simplificada y la obtenida por la 
forma general. 
* Obtener la Varianza y Desviación Estándar para los siguientes 
datos: 6, 3, 8, 5, 2 
X = 
6 3 8 5 2 
5 
24 
5 
4 8 
    
  . 
s2 = 
(6 - 4.8)² + (3 - 4.8)² + (8 - 4.8)² + (5 - 4.8)² + (2 - 4.8)² 
5-1 
s2 = 
1.44 + 3.24 + 10.24 + 0.04 + 7.84 
4 
 
22 . 
8 
4 
s2 = 5.7 por lo tanto s = 57 . = 2.387 
* Los ingresos anuales de 12 profesores en nuevos pesos son: 
72,000 72,000 75,000 81,000 163,000 78,000 
81,000 89,000 72,000 90,000 84,000 81,000 
Calcular la Varianza y Desviación Estándar. 
La media aritmética se determino en el capitulo anterior, por lo que tenemos 
que X = 86,500, por lo tanto la varianza es: 
s2 = 
    
(72,000 86,500) 
² + + (163,000 - 86,500)² 
 
12 1
PROBABILIDAD Y ESTADÍSTICA 
72 
s2 = 
   
210 ' 250 , 000 + + 5,852' 250,000 6 , 803000 ' , 
000 
11 
11 
 
s2 = 6.1845455 x 108 
como la desviación estándar se obtiene sacando la raíz cuadrada a la 
varianza, tenemos entonces que esta es: s = 24,868.746 
* Se sabe que la frecuencia de respiración en los humanos puede 
variar desde 4 respiraciones por minuto hasta 70 ó 75 para una persona que 
realiza ejercicios extenuantes. Supongamos que las frecuencias de respiración 
en estado de reposo, para estudiantes universitarios, poseen una distribución 
de forma monticular con media 12 y desviación estándar 2.3 respiraciones por 
minuto. ¿Qué fracción de los estudiantes poseen frecuencias en los siguientes 
intervalos: 
a).- 9.7 a 14.3 respiraciones por minuto? 
Aplicando la regla empírica, tenemos que la relación de 9.7 a 14.3 es lo 
mismo que señalar una desviación estándar alrededor de la media aritmética, 
ya que 12 + 2.3 nos da el límite superior y 12 - 2.3 nos da el límite inferior, y 
por tratarse de una relación con distribución monticular, tenemos que en ese 
intervalo se encuentra el 68 % de los estudiantes o bien la fracción es 0.68 
b).- 7.4 a 16.6 respiraciones por minuto? 
Basándonos en el inciso anterior tenemos que la fracción que se 
encuentra alrededor de la media a 2 desviaciones estándar es 0.95 o el 95 % 
de los estudiantes. 
c).- más de 18.9 o menos de 5.1 respiraciones por minuto? 
En este inciso vemos que tenemos una relación alrededor de la media 
de tres desviaciones estándar, por lo que se encuentran todos o casi todos los 
estudiantes universitarios.
PROBABILIDAD Y ESTADÍSTICA 
* La siguiente tabla muestra el concentrado de los resultados de 
73 
25 estudiantes universitarios: 
2 x fi 
Num C. Int. de Clase Frecuencia mi mi x fi mi 
1 1.8 - 2.1 4 1.95 07.80 15.210 
2 2.2 - 2.5 6 2.35 14.10 33.135 
3 2.6 - 2.9 8 2.75 22.00 60.500 
4 3.0 - 3.3 4 3.15 12.60 39.690 
5 3.4 - 3.7 3 3.55 10.65 37.808 
Totales 25 67.15 186.343 
En base al cuadro estadístico, calcule la media aritmética, la 
desviación estándar y la varianza 
X= 
 ( i  i 
6 7 . 
1 5 
  . 
m f ) 
n 
2 5 
2 6 8 6 
s2 = 
n (m)² f  -  m f ² 
  25(186.343) 
n(n - 1) 
- (67.15)² 
25(25 - 1) 
i  i i  i 
 
s2 = 
4,658.575 - 4,509.125 
600 
= 
149.45 
600 
s2 = 0.25 ; 
por lo tanto, la desviación estándar es : s = 0.5
PROBABILIDAD Y ESTADÍSTICA 
74 
EJERCICIOS PROPUESTOS 
1.- ¿Qué es una medida de dispersión? 
2.- Describa el proceso para la obtención de la Varianza. 
3.- ¿Qué es el Rango? 
4.- ¿Qué diferencia hay entre la forma simplificada para la obtención de la 
Varianza y la forma general? 
5.- Defina la desviación media. 
6.- Los siguientes datos representan el tiempo de vida en años de una 
muestra aleatoria de 30 motores eléctricos similares. 
2.0 3.0 0.3 3.3 1.3 0.4 
0.2 6.0 5.5 6.5 0.2 2.3 
1.5 4.0 5.9 1.8 4.7 0.7 
4.6 0.3 1.5 0.5 2.5 5.0 
1.0 6.0 5.6 6.0 1.2 0.2 
Calcular la Desviación Media , la Varianza y la Desviación Estándar. 
7.- El cociente de inteligencia (CI) expresa la inteligencia como la razón 
de la edad mental a la edad cronológica multiplicada por 100. 
Así, el promedio cuando la edad mental es igual a la edad 
cronológica es 100. Para los siguientes CI. 
100 103 99 101 100 120 109 82 
101 112 95 118 118 114 113 89 
92 137 94 130 87 93 111 96 
93 101 98 96 84 86 89 90
PROBABILIDAD Y ESTADÍSTICA 
a) Construya un histograma de frecuencias relativas. 
b) Calcule X , s2 y s. 
c) Encuentre el número de puntuaciones en los intervalos X  s; 
X  2s y X  3s. Compare las proporciones de observaciones en 
estos intervalos con las especificadas por el teorema de Tchebysheff 
y la regla empírica. 
75
PROBABILIDAD Y ESTADÍSTICA 
En este capítulo veremos lo que es la Probabilidad, o sea, la 
relación que existe entre la muestra y el conjunto original de datos, por eso 
para poder tomar decisiones se necesita tener conocimientos de la 
Probabilidad. 
En general, la Estadística entra al método científico a través de la 
experimentación o de la observación. Cualquier investigación es únicamente 
un medio para lograr un fin determinado. Es un dispositivo para someter a 
prueba una hipótesis establecida a partir de la cual desea hacerse una 
conclusión. La mayor parte de los enunciados que resultan de investigaciones 
son únicamente inferencias. Son de carácter incierto. La cuantificación de esa 
incertidumbre por el uso de la Teoría de Probabilidades es una de las 
contribuciones más importantes de la Estadística. 
Probabilidad es una medida de la frecuencia de ocurrencia de un 
evento casual. Una definición clara y simple de Probabilidad (definición 
clásica), es: 
“Si un evento puede ocurrir de N maneras mutuamente 
exclusivas e igualmente posibles, y si n de ellas tienen una característica E , 
entonces la Probabilidad de ocurrencia de E es la fracción 
76 
n 
N 
. Esto se 
acostumbra indicarlo o representarlo con P(E) = 
n 
N 
.” 
Para el estudio de la Probabilidad surge como necesidad el 
estudio de la Teoría de conjuntos, por lo cual veremos a continuación su 
definición y sus operaciones básicas.
PROBABILIDAD Y ESTADÍSTICA 
77 
CONJUNTOS Y SUS OPERACIONES 
El estudio de la Probabilidad se simplifica utilizando la Teoría de 
Conjuntos, por lo tanto, analizaremos algunas ideas básicas de esta teoría. La 
Teoría de Conjuntos fue desarrollada por Georg Cantor entre 1874 y 1895, es 
un instrumento básico que se utiliza en las distintas ramas de la Matemática, 
como en la Teoría de Probabilidad, el Cálculo Infinitesimal, Geometría, etc. 
Un Conjunto es un grupo de objetos dentro de un todo definido y 
bien diferenciado; por ejemplo: 
* Un grupo de estudiantes de la materia de Biología. 
* Un juego de cartas. 
* Las cuentas de un collar. 
A continuación definiremos algunas de las operaciones y 
símbolos que se utilizan en la Teoría de Conjuntos. A los conjuntos los 
representamos con mayúsculas y a sus elementos con minúsculas. 
* Conjunto Universo o Universal ( U ): Es el conjunto que contiene a 
todos los elementos. 
* Conjunto Vacío (  ): Es un conjunto que no contiene a ningún 
elemento. 
* Pertenencia (  ): Indica que un elemento pertenece a un conjunto. 
* No Pertenencia ( ): Indica que un elemento no pertenece a un 
conjunto determinado. 
* Subconjunto (  ): Se dice que un conjunto A es subconjunto de 
B, cuando todos los elementos de A pertenecen a B.
PROBABILIDAD Y ESTADÍSTICA 
* Unión (  ): La unión de dos conjunto A y B, es el conjunto de 
78 
elementos que están en A, en B ó en ambos. 
A  B = { x / x  A ó x  B } 
* Intersección ( ): La intersección de dos conjuntos A y B, es el 
conjunto de elemento que están en A y B simultáneamente. 
A  B = { x / x  A y x  B } 
* Complemento ( A', ~A, Ac ) : El conjunto A' , recibe el nombre 
de complemento de A debido a que contiene a todos los elementos del 
universo que no están en A. 
A' = { x / x  A } 
Para la comprensión de los conjuntos se recomienda utilizar los 
diagramas de Venn, que son la representación gráfica de los conjuntos y sus 
operaciones. 
U U U 
A U B A  B Ac 
* Sea A = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t }; 
B = { a, e, i, o, u } ; 
C = { b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t } y 
el conjunto Universo el abecedario. Realizar las siguientes operaciones entre 
conjuntos: 
a) A U B ; b) A  ( B U C ) c) ( A  B ) U ( B  C ) 
a) A U B = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t, u }
PROBABILIDAD Y ESTADÍSTICA 
b) A  ( B U C ) = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t } = A 
c) ( A  B ) U ( B  C ) = { a, e, i, o } 
* Sea U el conjunto de todos los valores posibles que pueden 
caer al lanzar dos dados normales, defina los siguientes conjuntos : el 
conjunto A contiene a todos los elementos en que la primera cara es mayor 
que 3 pero menor que 6, A = { ( x, y ) / 3 < x < 6 ; 0 < y < 7 } ; el conjunto B 
contiene a todos los elementos en que la suma de las caras es mayor que 5 
pero menor que 8, B = { ( x, y ) / 5 < x + y < 8 } 
 
79 
Sea U = 
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) 
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) 
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 
 
 
 
 entonces, A = 
 
 
 
 
 
 
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
 
 
y B = 
(1,5) ; (1,6) ; (2,4) 
(2,5) ; (3,3) ; (3,4) 
(4,2) ; (4,3) ; (5,1) 
(5,2) ; (6,1) 
 
 
 
 
 
 
 
 
 
¿QUE ES ESPACIO MUESTRAL? 
El Espacio Muestral se define como el conjunto de todos los 
resultados posibles de un experimento E, usualmente se designa a este 
conjunto con la letra S. Un Espacio Muestral se puede representar por medio 
de un diagrama de Venn, una línea recta, un producto cartesiano, etc. 
Producto Cartesiano : Es el conjunto de todos los pares 
ordenados de dos conjuntos A y B. 
A X B = { (x , y) / x  A , y  B }
PROBABILIDAD Y ESTADÍSTICA 
Debemos tener cuidado de respetar el orden de las parejas 
ordenadas, ya que ( a, b ) es diferente de ( b, a ). Lo anterior puede describirse 
con la siguiente gráfica: 
80 
A 
M (a,b) c 
N (b,a) b M 
M  N a N 
B 
a b c 
El número de elementos del espacio muestral1 del Producto 
Cartesiano es igual al producto del número de elementos de A por el de B. 
Ejemplo: En la gráfica anterior se tiene un espacio muestral de 9 elementos, el 
cual se obtuvo de n(A) x n(B). 
* Dados los siguientes conjuntos: 
U = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } 
A = { 1,5,7,13,15,18,23 } B = { 7,15,23,29,37,48,63 } 
C = { 7,8 } 
Obtener: a) A U B ; b) A' U A ; c) A  B ; d) B' U A ; e) A X C 
a).- A U B = { 1,5,7,13,15,18,23,29,37,48,63 } 
b).- A' = { 29,37,48,63,71,96 } 
A' U A = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } = U 
c).- A  B = { 7,15,23 } 
1 Dentro de los espacios muestrales cuando tenemos un conjunto de varios elementos, el orden de estos 
no se toma en cuenta, esto es, {a,b} y {b,a} son conjuntos equivalentes.
PROBABILIDAD Y ESTADÍSTICA 
81 
d).- B' = { 1,5,13,18,71,96 } 
B' U A = { 1,5,13,15,23,71,96 } 
e).- A X C = { (1,7);(1,8);(5,7);(5,8);(7,7);(7,8);(13,7);(13,8); 
(15,7);(15,8);(18,7);(18,8);(23,7);(23,8) } 
SUCESOS SIMPLES Y COMPUESTOS 
En un conjunto de resultados posibles de un experimento E. Los 
sucesos pueden ser Simples o Compuestos. 
Consideremos el experimento de lanzar un dado y observar que 
cara cae hacia arriba, la variable X tiene los resultados posibles X1, X2 ,* * *, 
X6, cada uno de estos resultados se denomina Suceso Elemental Simple. En 
otras palabras, un suceso simple es aquel que no se puede descomponer en 
otros sucesos simples y se representa con Ei . 
Un suceso que se puede descomponer en dos o más sucesos 
simples se llama Suceso Compuesto, por ejemplo, en el lanzamiento de un 
dado, la ocurrencia de X  3, es un Suceso Compuesto, ya que tendríamos que 
el suceso E estaría constituido por todas las caras de el dado de valor mayor o 
igual a 3, quedando de la siguiente manera : E = { 3,4,5,6 }. 
Una vez definidos los sucesos, se expresarán ahora en términos 
de la Teoría de Conjuntos. El conjunto Universo representará al espacio 
muestral, mientras que los conjuntos que lo constituyan serán los sucesos 
compuestos y sus elementos los sucesos simples.
PROBABILIDAD Y ESTADÍSTICA 
82 
PROBABILIDAD 
La Probabilidad tiene dos enfoques, llamados enfoques de la 
teoría de Probabilidades, los cuales son: El enfoque objetivo de la 
probabilidad y el enfoque subjetivo de la probabilidad. En este cuaderno 
definiremos únicamente el concepto de probabilidad y dejaremos el estudio 
de estos enfoques a los cursos de Estadística del Nivel Superior. 
El famoso matemático Jacobo Bernoulli señala que cuando no 
hay fundamentos para preferir uno de los posibles resultados o sucesos a 
cualquier otro, todos deben de considerarse que tienen la misma probabilidad 
de ocurrir. El famoso matemático francés P. S. Laplace estableció este 
concepto en su libro “A Philosophical Essay on Probabilities” de esta manera: 
“La teoría de la probabilidad consiste en reducir todos los elementos de la 
misma clase a cierto número de casos iguales o igualmente posibles, es decir, 
que nosotros debemos estar igualmente indecisos ante su existencia para 
determinar la cantidad de casos favorables para el suceso cuya probabilidad se 
busca”. La relación de este número con el de todos los casos posibles es la 
medida de la probabilidad, que, es por tanto sencillamente una fracción cuyo 
numerador es el número de casos favorables y el denominador es el número 
de todos los casos posibles (definición de probabilidad clásica). 
Por otra parte, puesto que los cálculos de la probabilidad no 
dependen de la experiencia, esto permite calcular las probabilidades sin
PROBABILIDAD Y ESTADÍSTICA 
realizar una gran cantidad de ensayos. Este tipo de cálculos se denomina 
algunas veces a priori. 
En base a lo anterior podemos especificar algunos puntos 
83 
referentes a la teoría de probabilidades, los cuales son: 
1.- Se asigna un número P(E) al suceso y lo da cuando la cantidad 
de ensayos es grande, M/n y P(E) son iguales. 
2.- En esta relación se define la probabilidad del suceso E como 
el límite de M/n cuando n tiende a infinito. Matemáticamente este enfoque 
se expresa así: 
P(E) = l í m 
M 
n   n 
Veamos algunos ejemplos de cálculo de probabilidades. 
* ¿Cuál es la probabilidad de que al lanzar dos dados legales, a) 
la suma de las caras sea par? ; b) las caras sean diferentes? ; c) las caras sean 
iguales? 
S = 
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) 
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) 
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 
 
 
 
 
 
 
 
 
 
 
a).- P(A) = 
M 
n 
= 
18 
36 
= 
1 
2
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)

Más contenido relacionado

La actualidad más candente

Tarea 12 de probabilidad y estadística con respuestas
Tarea 12 de probabilidad y  estadística con respuestasTarea 12 de probabilidad y  estadística con respuestas
Tarea 12 de probabilidad y estadística con respuestasIPN
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resueltosaposapoloko
 
La distribucion binomial power point
La distribucion binomial power pointLa distribucion binomial power point
La distribucion binomial power pointEileen Rodriguez
 
Autocorrelación
AutocorrelaciónAutocorrelación
AutocorrelaciónUTPL UTPL
 
Ejercicios de distribuciones de probabilidad
Ejercicios de distribuciones de probabilidadEjercicios de distribuciones de probabilidad
Ejercicios de distribuciones de probabilidadrossee2012
 
Ejemplos distribución poisson
Ejemplos distribución poissonEjemplos distribución poisson
Ejemplos distribución poissonFeLipe PueNntes
 
Distribución de poisson ejercicio práctico-
Distribución de poisson  ejercicio práctico-Distribución de poisson  ejercicio práctico-
Distribución de poisson ejercicio práctico-Jhonatan Arroyave Montoya
 
Distrib.binomial
Distrib.binomialDistrib.binomial
Distrib.binomialbetyglo
 

La actualidad más candente (20)

Tarea 12 de probabilidad y estadística con respuestas
Tarea 12 de probabilidad y  estadística con respuestasTarea 12 de probabilidad y  estadística con respuestas
Tarea 12 de probabilidad y estadística con respuestas
 
577544365.u04 poisson - ejercicio resuelto
577544365.u04   poisson - ejercicio resuelto577544365.u04   poisson - ejercicio resuelto
577544365.u04 poisson - ejercicio resuelto
 
La distribucion binomial power point
La distribucion binomial power pointLa distribucion binomial power point
La distribucion binomial power point
 
Autocorrelación
AutocorrelaciónAutocorrelación
Autocorrelación
 
Regresión lineal múltiple
Regresión lineal múltipleRegresión lineal múltiple
Regresión lineal múltiple
 
Distribucion de la diferencia de medias
Distribucion de la diferencia de mediasDistribucion de la diferencia de medias
Distribucion de la diferencia de medias
 
DISTRIBUCION BINOMIAL
DISTRIBUCION BINOMIALDISTRIBUCION BINOMIAL
DISTRIBUCION BINOMIAL
 
Probabilidad condicional1
Probabilidad condicional1Probabilidad condicional1
Probabilidad condicional1
 
Distribucion normal completo
Distribucion normal completoDistribucion normal completo
Distribucion normal completo
 
Distribución de bernoulli para combinar
Distribución de bernoulli   para combinarDistribución de bernoulli   para combinar
Distribución de bernoulli para combinar
 
Ejercicios de distribuciones de probabilidad
Ejercicios de distribuciones de probabilidadEjercicios de distribuciones de probabilidad
Ejercicios de distribuciones de probabilidad
 
Ejemplos distribución poisson
Ejemplos distribución poissonEjemplos distribución poisson
Ejemplos distribución poisson
 
Distribución de poisson ejercicio práctico-
Distribución de poisson  ejercicio práctico-Distribución de poisson  ejercicio práctico-
Distribución de poisson ejercicio práctico-
 
Distribucion uniforme continua
Distribucion uniforme continuaDistribucion uniforme continua
Distribucion uniforme continua
 
Probabilidad1
Probabilidad1Probabilidad1
Probabilidad1
 
Distrib.binomial
Distrib.binomialDistrib.binomial
Distrib.binomial
 
Aproximacion normal a la binomial
Aproximacion normal a la binomialAproximacion normal a la binomial
Aproximacion normal a la binomial
 
Logica y conjuntos
Logica y conjuntosLogica y conjuntos
Logica y conjuntos
 
Econometria
EconometriaEconometria
Econometria
 
Matematica 2 do bimestre
Matematica 2 do bimestreMatematica 2 do bimestre
Matematica 2 do bimestre
 

Similar a 52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)

Sistemas tercer periodo 2
Sistemas tercer periodo 2Sistemas tercer periodo 2
Sistemas tercer periodo 2jfelipe16
 
Sistemas tercer periodo 2
Sistemas tercer periodo 2Sistemas tercer periodo 2
Sistemas tercer periodo 2jfelipe16
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata hamlet mata mata
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptivaCecilia Loeza
 
Modulo descriptiva
Modulo descriptivaModulo descriptiva
Modulo descriptivaUMSA
 
calidad de la calidad de vida de los vecinos de san cristobal ffff
calidad de la calidad de vida de los vecinos de san cristobal ffffcalidad de la calidad de vida de los vecinos de san cristobal ffff
calidad de la calidad de vida de los vecinos de san cristobal ffffFrankl Huiza M
 
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docxMartha García
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadisticaEdith Llanos
 
Modulo de estadística aplicada
Modulo de estadística aplicadaModulo de estadística aplicada
Modulo de estadística aplicadaJohn Guevara
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.THETINTER
 
Proyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaProyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaElsa Dominini
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)valentinasatizabalar
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)daniela515873
 

Similar a 52812712 probabilidad-y-estadistica-m-isaias-e-farias (1) (20)

Sistemas tercer periodo 2
Sistemas tercer periodo 2Sistemas tercer periodo 2
Sistemas tercer periodo 2
 
Sistemas tercer periodo 2
Sistemas tercer periodo 2Sistemas tercer periodo 2
Sistemas tercer periodo 2
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
 
Lupita camarena
Lupita camarenaLupita camarena
Lupita camarena
 
Metodos estadisticos
Metodos estadisticosMetodos estadisticos
Metodos estadisticos
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Modulo descriptiva
Modulo descriptivaModulo descriptiva
Modulo descriptiva
 
calidad de la calidad de vida de los vecinos de san cristobal ffff
calidad de la calidad de vida de los vecinos de san cristobal ffffcalidad de la calidad de vida de los vecinos de san cristobal ffff
calidad de la calidad de vida de los vecinos de san cristobal ffff
 
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
 
Py e t1
Py e t1Py e t1
Py e t1
 
Clase1 unidad1
Clase1 unidad1Clase1 unidad1
Clase1 unidad1
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadistica
 
ESTADISTICA
ESTADISTICAESTADISTICA
ESTADISTICA
 
Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2
 
Modulo de estadística aplicada
Modulo de estadística aplicadaModulo de estadística aplicada
Modulo de estadística aplicada
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
 
Ensayo 1
Ensayo 1Ensayo 1
Ensayo 1
 
Proyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaProyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuela
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 

Más de Luisa Santa María (14)

Tema 15
Tema 15Tema 15
Tema 15
 
Tema 14
Tema 14Tema 14
Tema 14
 
95 numeros reales
95 numeros reales95 numeros reales
95 numeros reales
 
0 probabilida
0 probabilida0 probabilida
0 probabilida
 
Tema 4
Tema 4Tema 4
Tema 4
 
Sociologia
SociologiaSociologia
Sociologia
 
1 compr texto
1 compr texto1 compr texto
1 compr texto
 
Actitudes
ActitudesActitudes
Actitudes
 
Probabilidad clásica
Probabilidad clásicaProbabilidad clásica
Probabilidad clásica
 
Ingles
InglesIngles
Ingles
 
Descubrimientos de los portugueses
Descubrimientos de los portuguesesDescubrimientos de los portugueses
Descubrimientos de los portugueses
 
Historia de la electricidad
Historia de la electricidadHistoria de la electricidad
Historia de la electricidad
 
4 funcion cuadratica
4 funcion cuadratica4 funcion cuadratica
4 funcion cuadratica
 
Problema 1. fisica
Problema  1. fisicaProblema  1. fisica
Problema 1. fisica
 

52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)

  • 1. ÍNDICE TEMÁTICO CAP. 1.- ¿ QUE ES ESTADÍSTICA ? 3 Introducción ; Estadística ; Usos y Abusos de la Estadística; Introducción a los Términos Básicos; Relación entre Probabilidad y Estadística; Examen de Autoevaluación. CAP. 2.- ELABORACIÓN DE CUADROS ESTADÍSTICOS 11 Introducción ; Toma de Datos ; Técnicas Estadísticas; Frecuencias ; Concepto de Variable ; Intervalos ; Cua-dro estadístico ; Ejercicios Propuestos. CAP. 3.- GRÁFICAS ESTADÍSTICAS 30 Introducción ; Representaciones gráficas ; Histograma ó diagrama de barras ; Polígono de frecuencias ; Diagra-ma de Pastel ; Ojiva o curva de frecuencias ; Curva de Lorenz ; Curvas de frecuencias ; Curva de la Distribución Normal ; Examen de Autoevaluación CAP. 4.- MEDIDAS DE TENDENCIA CENTRAL 42 La Media Aritmética; La Mediana; La Moda; Comparación de la Media, la Mediana y la Moda; Media Geométrica; Media Armónica; Media Ar-mónica para datos agrupados; Ejercicios Propuestos. CAP. 5.- MEDIDAS DE DISPERSIÓN 60 Medidas de Dispersión; Desviación estándar; Varianza; Cálculo de la Media y Desviación Estándar para Datos Agrupados; Interpretación practica de la desviación estándar; Ejercicios Propuestos. CAP. 6.- PROBABILIDAD 76 Conjuntos y sus operaciones; ¿ Qué es Espacio Muestral ?; Sucesos Simples y Compuestos; Probabilidad; Axiomas de la Probabilidad; Análisis Combinatorio; Probabilidad Condicional; Independencia Probabilistica; Leyes de Probabili-dad; Ejercicios Propuestos.
  • 2. PROBABILIDAD Y ESTADÍSTICA 1 CAP. 7.- DISTRIBUCIONES DE PROBABILIDAD 98 Distribución Binomial; Distribución de Poisson; Distribución Normal; Distribución t de Student; Ejercicos Propuestos. APÉNDICE : TABLAS DE PROBABILIDADES Tabla 1 Distribución Normal 115 Tabla 2 Distribución t de Student 116 Tabla 3 Distribución Binomial 117 Tabla 4 Valores de e- x 119 BIBLIOGRAFÍA 120
  • 3. PROBABILIDAD Y ESTADÍSTICA 2 PRESENTACIÓN Tomando en consideración que los estudiantes deben contar con los elementos necesarios para un curso, ya que esto les facilitaría el proceso del aprendizaje, nos dimos a la tarea de elaborar los apuntes del curso de PROBABILIDAD Y ESTADÍSTICA en el Nivel Medio Superior, mismos que se elaboraron tomando en consideración la bibliografía actualizada existente en está área. El contenido de este libro se determino en base a los programas que rigen en el Nivel Medio Superior en la Universidad de Colima. En este cuaderno de apuntes se ha tratado de evitar al máximo las demostraciones áridas, que en muchas ocasiones en lugar de aclarar, obscurecen más el panorama del lector. El objetivo del cuaderno de apuntes (La superación académica), es ambicioso y sería presuntuoso afirmar que materiales como el presente lo satisfacen. Con este material se pretende que al final el alumno tenga las herramientas necesarias para concentrar y representar información, y al mismo tiempo tenga las bases necesarias para posteriores cursos en el Nivel Superior. Esperamos que este cuaderno sea de utilidad tanto para los alumnos como para los maestros, esperando de estos últimos sus comentarios al utilizarlo. LOS AUTORES
  • 4. PROBABILIDAD Y ESTADÍSTICA 3 INTRODUCCIÓN Para tratar de predecir el resultado de una elección nacional, los encuestadores entrevistan a un número predeterminado de personas en todo el país y registran sus preferencias. Sobre la base de esta información se construye una predicción. Problemas similares se encuentran en investigaciones de mercado, en sociología, en la industria, etc. La producción de una planta química depende de muchos factores. Observando estos factores y la producción durante cierto periodo de tiempo, podemos construir una ecuación de predicción que relacione a la producción con los factores observados. Si usamos esas ecuaciones para predecir la producción, la predicción raramente será igual a la verdadera producción, esto es, la predicción casi siempre tendrá algún error. Encontramos problemas similares en los campos de la educación, la sociología, la psicología, las ciencias físicas y muchas otras ciencias. A estos predictores se les llama estadísticos de prueba, que son la base de toda investigación y desarrollo científico. Además de la predicción, el estadístico también sirve para tomar decisiones acerca de poblaciones a partir de resultados obtenidos de investigaciones desarrolladas a muestras o pequeñas partes de la población. La Estadística es una ciencia que es de gran utilidad y en la actualidad nos es mucho más difícil mencionar algún lugar en el que la Estadística no se aplique que uno en el que tenga una gran importancia. Por ejemplo, las Universidades podrían desear predecir el rendimiento promedio de los estudiantes universitarios, para lo cual sería necesario utilizar la
  • 5. PROBABILIDAD Y ESTADÍSTICA Estadística. Podría desearse comparar dos técnicas de enseñanza físicamente distintas; podríamos considerar la inspección de artículos comprados en una fabrica en donde la inspección podría consistir en seleccionar diez artículos de cada lote y registrar el número de defectuosos, en donde, la decisión de aceptar o rechazar el lote, podría basarse en el número de defectuosos encontrados. Los ejemplos anteriores son una muestra de lo importante que resulta ser el estudio de la Estadística, por lo que en el presente curso se presenta una definición de Estadística y se da una relación que existe con la Probabilidad para poder hacer toma de decisiones respecto de investigaciones desarrolladas. 4 ESTADÍSTICA Es un lenguaje universal de la ciencia tanto en sus ramas físicas como sociales, la comunicación y el uso de la Estadística nos permiten comunicar más exactamente los descubrimientos en las investigaciones. La Estadística es también un instrumento que utilizado con cuidado y precisión nos permite describir nuestros resultados y adoptar decisiones respecto a lo que nos dicen. Aprender Estadística es algo simple y se llega a su comprensión total por medio de ejercicios; en la Estadística intervienen números y letras como parte de su lenguaje, además, la Estadística posee significados diversos para personas de formaciones e intereses diversos. El campo de la Estadística se divide ampliamente en dos ramas, que son: La Estadística descriptiva y la Estadística Inferencial.
  • 6. PROBABILIDAD Y ESTADÍSTICA La Estadística Descriptiva está dedicada a la recolección, descripción y presentación de datos numéricos. La Estadística Inferencial se refiere a las técnicas de interpretar los valores que se obtienen a partir de las técnicas descriptivas, además de las técnicas de tomar decisiones sobre la base de los datos obtenidos. Estadística es la ciencia de recolectar, clasificar, describir e 5 interpretar datos numéricos. USOS Y ABUSOS DE LA ESTADÍSTICA Las aplicaciones de la Estadística son ilimitadas, pues sería más difícil nombrar un campo en donde no se utiliza la Estadística, que señalar uno en donde la Estadística desempeñe un papel importante. Ejemplos sobre la utilización de la Estadística: 1.- En la Educación se usa mucho para describir resultados de pruebas. 2.- En la ciencia los datos obtenidos en experimentos deben recogerse y analizarse estadísticamente para tomar una decisión. 3.- Los gobiernos utilizan la Estadística para la recolección de información en sus diversos campos. Los abusos de la Estadística suelen ser muy pintorescos y a veces ocasionan muchas dificultades, a numerosas personas les preocupa la lejanía de las descripciones estadísticas y a otras les preocupa toda la información (dependiendo de sus necesidades) debido a que creen que es falsa, y sin embargo, la mayoría de las mentiras estadísticas se deben a: 1.- La utilización de valores estadísticos inadecuados. 2.- Utilización de enunciados abiertos y no explícitos.
  • 7. PROBABILIDAD Y ESTADÍSTICA 6 3.- Utilización de datos derivados de un diseño experimental defectuoso. 4.- Una mala presentación de resultados. Todos estos factores comunes acarrean una sola consecuencia, que es la mala concepción de la información por parte del investigador. INTRODUCCIÓN A LOS TÉRMINOS BÁSICOS Para estudiar Estadística debemos ser capaces de hablar su lenguaje, por lo que definiremos primeramente sus términos básicos: 1.- POBLACIÓN : Colección completa de individuos, objetos o medidas que tienen una característica en común, el concepto de Población es la idea fundamental más importante de la Estadística. La Población debe definirse cuidadosamente en cada caso a fin de poder determinar la preferencia de ella. 2.- MUESTRA : Es un subconjunto de la población, es decir, una Muestra se compone de algunos de los individuos, objetos o medidas que componen la población. 3.- VARIABLE DE RESPUESTA : Es una característica individual de cada elemento de la población o de una muestra; por ejemplo: la edad de un alumno al ingresar a la Universidad, el color del pelo, su estatura, su peso, etc., son Variables de Respuesta y el valor de la variable será la medida de la característica que interese. 4.- PIEZA DE DATOS : El valor de la variable de respuesta asociado con cada elemento, será la Pieza de Datos, por ejemplo: el coche es verde, Jorge ingresó a la Universidad a la edad de 23 años. Si nos damos cuenta estamos asignando a cada elemento su variable o característica.
  • 8. PROBABILIDAD Y ESTADÍSTICA 5.- DATOS : Comprende el conjunto de valores asignados a la variable de respuesta para cada elemento perteneciente a la muestra. 6.- EXPERIMENTO : Es una actividad planificada cuyos resultados nos producen un conjunto de datos. 7.- PARÁMETRO : Es una característica medida de una población completa, por ejemplo: la proporción de alumnos de más de 21 años que ingresan a la Universidad. En Estadística se asignan símbolos del alfabeto griego para designar un Parámetro. 8.- ESTADÍSTICO : Es la medida de una característica relativa a la muestra, al valor promedio de los datos y la imagen de éstos; la mayoría de los Estadísticos muestrales se encuentran por medio de fórmulas y suelen asignárseles símbolos del alfabeto latino. Fundamentalmente existen dos clases de datos, los que presentan información cualitativa y los datos consistentes en información cuantitativa. Los que están dentro de los cualitativos se llaman Datos de Atributo, mientras que los cuantitativos se dividen en Discretos y Continuos. 7 DATOS CUALITATIVOS CUANTITATIVOS ATRIBUTO DISCRETOS CONTINUOS
  • 9. PROBABILIDAD Y ESTADÍSTICA Los Datos de Atributo o Cualitativos son los que agrupan a una muestra en características semejantes, pero no tienen medidas numéricas. Los Datos Cuantitativos se dividen en: Discretos : Son los datos que resultan de un conteo o una simple observación. Continuos : Son los datos que se obtienen cuando la medida es un proceso infinito. 8 RELACIÓN ENTRE PROBABILIDAD Y ESTADÍSTICA La Probabilidad y Estadística son dos campos distintos aunque relacionados entre sí, en las matemáticas, se dice a veces que la Probabilidad es el vehículo de la Estadística es decir, de no ser por las leyes de Probabilidad, no existirían las teorías estadísticas, así que investigaremos la diferencia entre estas dos ramas del árbol matemático. Observaremos un ejemplo o modelo de dos cajas: 10 FICHAS 5 ROJAS PROBABILIDAD 3 VERDES ESTADÍSTICA ? ? ? ? 2 AMARILLAS En la caja de Probabilidad hay 10 fichas ( 5 Rojas, 3 Verdes y 2 Amarillas ), en el terreno de la Probabilidad se intenta responder preguntas; por ejemplo, ¿ Cuál es la probabilidad de que si se saca una ficha de la caja, sea Roja ?, ¿ Cuál es la probabilidad de la ocurrencia de un evento ?, por otra
  • 10. PROBABILIDAD Y ESTADÍSTICA parte, dentro de la Estadística necesitaremos extraer una muestra de ella para hacernos conjeturas sobre lo que en ella existe. Por lo que se podría decir como diferencia bien marcada entre una y otra, lo siguiente: " La Probabilidad estudia la oportunidad de que algo ocurra, cuando se conocen las posibilidades; mientras que la Estadística pregunta, cuales son esas posibilidades a partir de los resultados de una muestra ". 9 EXAMEN DE AUTOEVALUACIÓN 1.- ¿Qué es la Estadística? 2.- Dé tres ejemplos en donde se utilice la Estadística. 3.- Explique los factores que ocasionan un mal uso de la Estadística. 4.- Mencione los ocho términos básicos de la Estadística. 5.- Defina los siguientes términos en base a lo que usted comprenda: Población, Muestra, Pieza de Datos, Parámetro. 6.- Mencione como se clasifican los datos y defínalos. 7.- ¿ Qué relación existe entre la Probabilidad y la Estadística?. 8.- Suponga que desea obtener una estimación del consumo de gasolina (Km por litro) del FORD COUGAR. Describa la población que sería de interés para usted, de la cual tendría que seleccionar la muestra.
  • 11. PROBABILIDAD Y ESTADÍSTICA 9.- Un investigador médico desea estimar el tiempo de supervivencia de un paciente después de la aparición de un tipo particular de cáncer y después de un régimen particular de radioterapia. Identifique la población de interés para el investigador médico. ¿ Puede percibir algún problema en el muestreo de esta población ? 10.- Suponga que usted es un candidato para la legislatura y que desea evaluar la opinión de los votantes respecto a sus posibilidades de ganar. Identifique la población de interés para usted y de la cual desearía seleccionar su muestra. 10
  • 12. PROBABILIDAD Y ESTADÍSTICA 11 INTRODUCCIÓN Como veremos más adelante, el análisis estadístico de datos requiere numerosas operaciones aritméticas, y sería muy tedioso describir todas estas operaciones con palabras. La solución de esta dificultad es expresar las operaciones en términos de una o más fórmulas. Entonces, para analizar un conjunto dado de datos muéstrales se sustituirían las mediciones muéstrales en el conjunto apropiado de fórmulas. Una de las operaciones mas comunes en el análisis estadístico de datos es el proceso de sumas (adición). Por lo tanto necesitaremos un símbolo para indicarle que sume las mediciones muéstrales, o que sume un conjunto de números calculados a partir de las mediciones muéstrales. Este símbolo, llamado sumatoria, puede ser muy familiar para algunos y completamente nuevo para otros (  ). A continuación presentaremos algunos conceptos necesarios para la elaboración de cuadros estadísticos, conceptos como frecuencia, frecuencia relativa, frecuencia acumulada, etc. TOMA DE DATOS Si tuviéramos la población frente a nosotros, ¿ cómo podríamos describir este subconjunto grande de mediciones ?. Muchos textos se han dedicado a los métodos de la estadística descriptiva, es decir, a los métodos para describir conjuntos de datos numéricos.
  • 13. PROBABILIDAD Y ESTADÍSTICA Esencialmente estos métodos se pueden clasificar como métodos gráficos y métodos numéricos. En este texto hablaremos de los dos métodos para describir información, y comenzaremos con el método numérico, el cual se basa esencialmente en la recolección de datos para presentarlos en un cuadro estadístico, cuadro en el que nosotros podremos leer la información que se encontraba dispersa en la muestra o población. En la actualidad es muy común encontrarnos con cuadros estadísticos, y lo más general es la presentación de información en los distintos medios de comunicación de las posiciones que ocupan los distintos equipos en los diferentes deportes. 12 TÉCNICAS ESTADÍSTICAS Las técnicas estadísticas, los gráficos, las distribuciones de frecuencias, promedios, etc., son términos de indudable valor práctico para la descripción de los datos. Sin embargo la mayor utilidad estadística se encuentra en el análisis de los datos numéricos. El análisis de los datos numéricos por técnicas estadísticas es una expresión abstracta. La característica esencial común a todas las técnicas es el elemento de inferencia estadística, que se define como un proceso de inducción lógica, que partiendo de los datos establece un juicio sobre todo el conjunto, obteniéndose una medida de la incertidumbre para la consecuencia que se infiere. Por ejemplo; consideremos el problema de estimar la proporción de votos a favor de una determinada propuesta o candidato, se toma una muestra de los votantes y se calcula la proporción de los que lo hacen a favor de un sólo candidato, suponiendo que el 60% de la muestra
  • 14. PROBABILIDAD Y ESTADÍSTICA vota a favor de un candidato, entonces, se infiere que el 60% de todos los votantes están a favor de ese candidato. En otras palabras, hay un grado de incertidumbre vinculado a la conclusión cuya medición se obtiene aplicando las técnicas estadísticas. La Estadística reúne un conjunto de procedimientos para describir y analizar los datos de diversas disciplinas, ésta debe ser neutral y por ello puede emplearse la misma técnica de muestreo en economía, finanzas, educación, ingeniería, y otras. Sin embargo, la Estadística ha elaborado técnicas peculiares para cada campo de aplicación. Por lo que podemos concluir que las TÉCNICAS-ESTADÍSTICAS se basan en: la recolección de datos, los gráficos, las frecuencias, los promedios, etc. En los negocios la Estadística ha desarrollado técnicas como las de: Índices de Precios, Sucesiones, Series de Tiempo, y otras. En las ciencias biológicas alcanzan el más alto nivel e interés las técnicas para el diseño de experimentos. Mientras que en la Industria se desarrollan técnicas para el control de calidad. Así como se enunciaron anteriormente algunas ramas en las que tiene aplicación la Estadística y en las cuales se han desarrollado técnicas peculiares para cada una, podríamos mencionar algunas otras, pero con la práctica nos daremos cuenta de cómo es el desarrollo en ellas. 13 FRECUENCIAS Antes de comenzar con la distribución de frecuencias, será conveniente definir el vocablo Frecuencia, ya que se ha mencionado con
  • 15. PROBABILIDAD Y ESTADÍSTICA anterioridad, sin embargo, no ha sido definido. Así mismo se hará una clasificación de los tipos de frecuencias utilizados en la Estadística. FRECUENCIA: Es el número total de repeticiones de un elemento determinado, en una muestra o población. Existen varios tipos de frecuencias a saber: Frecuencia de clase, Frecuencia relativa, Frecuencia acumulada, Frecuencia relativa acumulada, etc. Para los objetivos que se persiguen en este curso, definiremos las frecuencias de datos agrupados. FRECUENCIA RELATIVA: Es el tanto por ciento o porcentaje correspondiente a cada intervalo de clase. La manera de obtenerla es dividiendo el número de elementos de esa clase entre el número total de elementos de la muestra o población. La frecuencia relativa tiene gran utilidad, ya que puede especificarnos el porcentaje de ocurrencia de un evento dentro de una muestra, la elaboración de gráficas estadísticas, etc.. Por ejemplo: la distribución de presupuestos por áreas, el porcentaje de producción de ciertos productos, la distribución por edades de ciertas poblaciones, etc. FRECUENCIA ACUMULADA: Esta frecuencia se obtiene al sumar a la frecuencia de cada clase, las frecuencias de las clases anteriores a ella. Las frecuencias de las demás clases serán la suma sucesiva de las frecuencias de las clases anteriores, de tal forma que en la última clase se tendrá una frecuencia igual al tamaño de la muestra o población. FRECUENCIA RELATIVA ACUMULADA: Se sigue el mismo procedimiento que en la frecuencia acumulada, sólo que en este caso se toma como base la frecuencia relativa, expresándose como porcentaje. 14
  • 16. PROBABILIDAD Y ESTADÍSTICA 15 CONCEPTO DE VARIABLE Consideremos la desigualdad X + 2 > 5, los valores de X que satisfacen dicha desigualdad son todos los valores mayores que 3, dado que: X + 2 > 5 X > 5 - 2 X > 3 como X > 3, entonces X puede ser: 4, 5, 6, ... X se llama variable porque toma distintos valores posibles dentro de la desigualdad ( por lo que se dice que una variable es aquella que puede tomar distintos posibles valores dentro de un suceso ). Desde los tiempos más remotos dos tendencias opuestas, a veces colaborando la una con la otra, han gobernado todo el desarrollo de la matemática. Estas dos son el dominio de lo continuo y lo discreto. Una de las grandes tareas de la matemática actual consiste en armonizar lo continuo y lo discreto para incluirlos en una matemática única y para iluminar la oscuridad de ambas. Siguiendo con el concepto de variable, veremos que una variable discreta es una regla bien definida para asignar valores numéricos a todos los resultados posibles de un experimento. Lo anterior significa que una variable aleatoria discreta es aquella que se asocia a todo experimento siempre y cuando el conteo sea finito o infinito numerable y con datos numéricos enteros. Una variable continua es aquella cuyos valores posibles no tienen interrupción, es decir, son aquellos valores que podemos obtener no mediante un conteo o simple observación, si no mediante observaciones más concretas
  • 17. PROBABILIDAD Y ESTADÍSTICA y sus valores son no numerables (Los Reales). Veamos algunos ejemplos sobre lo anterior: 16 a) Los posibles resultados de lanzar un dado normal. S = { 1, 2, 3, 4, 5, 6 } Es discreto por poderse obtener por un conteo. b) Lanzar una moneda normal hasta que caiga sol. S = { 1, 2, 3, 4, ... , n } Es discreto por ser un proceso infinito numerable. c) La cantidad de descargue de un Río hacia el Océano. Es continua, ya que es imposible determinarlo por un conteo o por una simple observación, y se requiere de un método más concreto para estimarlo. INTERVALOS Es importante que repasemos un concepto ya manejado en matemáticas, como es el de INTERVALO, ya que con el será necesario trabajar en la formación de cuadros estadísticos, en donde hablaremos de intervalos de clases, por lo que definimos lo siguiente: “ Un intervalo de clase es aquel que contiene a una cierta cantidad de elementos de la muestra o población ”, por ejemplo, el número de alumnos que obtienen una calificación entre 5 y 8, en este ejemplo, el intervalo es [5, 8], y como frecuencia contendrá a todos los alumnos que
  • 18. PROBABILIDAD Y ESTADÍSTICA hayan obtenido esas calificaciones, el 5 recibe el nombre de límite inferior del intervalo y el 8 el de límite superior del intervalo. En la construcción de cuadros estadísticos será necesario este concepto en la formación de clases. 17 CUADRO ESTADÍSTICO El cuadro estadístico más usual es aquél en el que se representa el número total de clases o de variables, con el número de elementos correspondientes a cada uno, llamándose a esto frecuencia, así mismo, veremos cuadros estadísticos en los que tendremos frecuencias acumuladas (Suma de los elementos anteriores a la clase), frecuencia relativa (porcentaje de cada clase con respecto a la muestra), frecuencia relativa acumulada, marcas de clases, desviaciones medias, mediana, etc. A continuación se presenta una forma de distribución en un cuadro estadístico: CLASE o VARIABLE FRECUENCIA FRECUENCIA ACUMULADA FRECUENCIA RELATIVA FREC. REL. ACUMULADA 30 - 36 6 6 6/14 6/14 37 - 43 5 11 5/14 11/14 44 - 50 3 14 3/14 14/14 TOTAL 14 14/14 A continuación se muestra un conjunto de datos, con los que vamos a elaborar un cuadro estadístico: 30 42 50 73 60 63 38 27 67 83 70 63 52 83 97 49 83 73 30 35 63 59 84 75 84 90 80 95 85 68
  • 19. PROBABILIDAD Y ESTADÍSTICA Para formar un cuadro estadístico es necesario primeramente ordenar todos los elementos de la muestra en forma ascendente, para después agruparlos en clases. 18 27 42 60 67 75 84 30 49 60 68 80 85 30 50 63 70 83 90 35 52 63 73 83 95 38 59 63 73 83 97 Para elegir el número de clases se deben observar ciertos criterios; se debe evitar que queden demasiados elementos en una clase, así como también clases sin elementos. Una clase con demasiados elementos oculta información que en ocasiones es indispensable para el estadístico y una clase vacía ocasiona problemas a la hora de calcular las medidas estadísticas. Se recomienda un mínimo de 5 clases y un máximo de 20 clases, dependiendo del número de elementos de la muestra y de lo disperso que se encuentren. Es recomendable tomar entre 5 y 9 clases cuando la muestra cuenta con menos de 50 elementos y entre 10 y 20 cuando tenga más de 50 elementos. Para obtener el número de clases existen dos formas, una conocida como forma empírica y otra de fórmula general. A continuación enunciaremos la forma empírica: Número de Clases = Elementomáximo - Elementomínimo 1 Intervalode Clase
  • 20. PROBABILIDAD Y ESTADÍSTICA En este caso, dependiendo del número de elementos con que cuente la muestra, se elige un Intervalo de clase y se realiza la operación anterior para obtener el número de clases que se deben de colocar en el cuadro estadístico, pero pudiese en lugar de elegir el Intervalo de clase, escogerse el número de clases que se desean, entonces se aplicaría la siguiente fórmula: 19 Intervalo de Clase = Elementomáximo - Elementomínimo 1 Número de Clases Ahora bien, si no se desea de esta manera se utiliza la fórmula general, la cual se aplicará de la siguiente manera: Si se tienen menos de 50 elementos en la muestra, el número de clases se obtiene con la siguiente fórmula: No. de Clases = 1 + 3.3 log N pero si se tienen más de 50 elementos, entonces se utiliza: No. de Clases = 3 + 3.3 log N Continuando con el ejemplo anterior, procedemos a calcular el número de clases en forma empírica para elaborar el cuadro estadístico. Como el número de elementos es 30, escogemos un número en forma aleatoria para el Intervalo de Clase o Amplitud de Clase de 9. Ahora bien, aplicando la fórmula presentada para el número de clases, tenemos: No. de clases = Elem. Má x. - Elem. Mín. + 1 Int. de Clase = 97 - 27 + 1 9 = 71 9 = 7.88 como podemos ver tenemos 7.88 clases, pero debido a tener una porción de una clase más, debemos incrementar o redondear a el inmediato superior,
  • 21. PROBABILIDAD Y ESTADÍSTICA teniendo entonces que el número de clases a utilizar será de 8 clases ya que si utilizáramos 7 clases, tendríamos al final un valor que no entraría en el número de clases escogidas para la colección de datos. Para hacer una comparación entre el método empírico y la forma 20 general, aplicaremos la fórmula. No. de clases = 1 + 3.3 log N teniéndose al sustituir N = 30 lo siguiente: No. de clases = 1 + 3.3 log(30) = 1 + 3.3 (1.4771) = 1 + 4.87 = 5.87 en este caso aproximaríamos a 6 clases y procederíamos a calcular el Intervalo de Clase o Amplitud de Clase. El hecho de que en un procedimiento se tengan 8 clases y en el otro 6 clases no afecta a los cálculos que el estadístico hará, con lo que podemos decir que el estadista utilizará el método que considere más práctico para sus fines. Para elaborar el cuadro estadístico es necesario formar los intervalos de clases, por lo que debemos escoger los límites inferior y superior de los intervalos de clase de la siguiente manera: En la primera clase tomamos el menor elemento de la colección de datos como el límite inferior de esta clase, que es 27, para obtener el límite superior de la primera clase debemos sumar 9 a el 27 debido a que el Intervalo de Clase es 9 (por que estamos utilizando el método empírico ), teniéndose entonces que el límite superior de la primera clase es 35. De esta manera tenemos que el Intervalo de Clase de la primera clase es de 27 a 35, en este intervalo aparentemente
  • 22. PROBABILIDAD Y ESTADÍSTICA tenemos un intervalo de clase de 8, sin embargo debemos tomar en cuenta que los extremos del intervalo están incluidos en él, teniéndose que del número 27 a el número 35 existen 9 unidades, que para mayor entendimiento lo desarrollamos a continuación. 21 27 28 29 30 31 32 33 34 35 en donde claramente se ve que son 9. Ahora bien, para obtener el conteo de cada intervalo o frecuencia de clase, debemos observar en la colección original de datos cuantos elementos se encuentran en ese intervalo, teniéndose que en este intervalo se encuentran los siguientes elementos de la colección de datos, 27, 30, 30 y 35. Para formar el Intervalo de Clase de la clase 2, tomamos el inmediato superior a el límite superior de clase de la primera clase para obtener el límite inferior de clase de la segunda clase ( Si la colección de datos son números enteros, se suma uno a el límite superior de clase para obtener el límite inferior de la clase siguiente, si la colección de datos es en decimales se suma una unidad correspondiente a los decimales), por lo tanto el intervalo de clase de la clase 2 inicia en 36 que al sumarle 9 y restarle 1 debido a que están incluidos los extremos tenemos que el límite superior de la clase dos es 44 y en este intervalo los elementos de la colección original que se encuentran son 38 y 42. De la misma forma que se obtuvieron los intervalos de clase de las clases 1 y 2 lo hacemos para las clases restantes de esta colección de datos.
  • 23. PROBABILIDAD Y ESTADÍSTICA Anteriormente en este capítulo definimos los conceptos de frecuencia, frecuencia acumulada, frecuencia relativa y frecuencia relativa acumulada, por lo tanto procederemos a explicar como se obtiene cada una para poder terminar con nuestro cuadro estadístico. Para obtener la frecuencia acumulada se deben tomar como referencia los límites superiores de clase; de lo anterior tenemos que hasta el límite superior de la clase 1 (35) existen 4 datos; hasta el límite superior de la clase 2 (44) los datos que van son 6; para el límite superior de la clase 3 (53) los datos acumulados de las clases es 9 y asi sucesivamente hasta la última clase que deberá contener a la totalidad de elementos. Con la explicación anterior concluimos que la frecuencia acumulada se obtiene sumando a la frecuencia de clase la frecuencia de las clases anteriores. En lo que se refiere a la frecuencia relativa, tenemos que en cada clase debemos especificar en razón a cuantos elementos tiene el intervalo de clase con respecto a la colección total de datos, para el intervalo de clase 1 tenemos que la razón de elementos es 4/30 ( 4 de 30 ), para el intervalo de clase 2 la razón es 2/30 ( 2 de 30 ) y así sucesivamente hasta la última clase. Para las frecuencias relativas acumuladas se tienen que obtener las razones acumuladas en cada intervalo de clase especificando que la última clase deberá contener al total de elementos, por lo cual deberá aparecer la unidad. Un punto más que debe aparecer en el cuadro estadístico es la marca de clase, la cual nos servirá para elaborar las gráficas estadísticas en el capítulo 3. La marca de clase se obtiene sumando el límite inferior de clase con el límite superior de la misma clase y dividiendo entre dos, así para el 22
  • 24. PROBABILIDAD Y ESTADÍSTICA 23 intervalo de clase 1, su marca de clase es 27 35 2 31   , para el intervalo de clase 2 su marca de clase es 40 y así sucesivamente. En base a todos los datos obtenidos anteriormente, procedemos a desarrollar nuestro cuadro estadístico, el cual queda de la siguiente manera: Número de Clase Intervalo de Clase Frecuencia Frecuencia Acumulada Frecuencia Relativa Frecuencia Rel. Acum. Marca de Clase 1 27 - 35 4 4 4 / 30 4 / 30 31 2 36 - 44 2 6 2 / 30 6 / 30 40 3 45 - 53 3 9 3 / 30 9 / 30 49 4 54 - 62 3 12 3 / 30 12 / 30 58 5 63 - 71 6 18 6 / 30 18 / 30 67 6 72 - 80 4 22 4 / 30 22 / 30 76 7 81 - 89 5 27 5 / 30 27 / 30 85 8 90 - 98 3 30 3 / 30 30 / 30 94 Totales 30 30 / 30 Cuando se obtienen más de 20 clases por el método empírico al escoger aleatoriamente el Intervalo de Clase o Amplitud de Clase, entonces se recomienda usar el método general, debido a que se pueden obtener malos resultados a causa de la dispersión de datos que existirá entre ellos. Ejemplo: Con la siguiente distribución: 6 42 49 6 52 36 8 32 33 9 53 33 12 31 41 8 50 50 23 41 32 11 49 10 15 28 31 13 48 9 17 9 27 15 41 32 7 28 17 13 47 6 35 47 15 53 5 42 53 27 que nos muestra las edades de una comunidad, elaborar: Un cuadro estadístico, especificando las Clases, Frecuencia, Frecuencia Relativa y la Frecuencia Acumulada.
  • 25. PROBABILIDAD Y ESTADÍSTICA 24 Primero ordenamos los datos: 5 8 10 15 23 31 33 41 47 50 6 8 11 15 27 31 33 41 48 52 6 9 12 15 27 32 35 42 49 53 6 9 13 17 28 32 36 42 49 53 7 9 13 17 28 32 41 47 50 53 ahora calculamos el Intervalo de Clases eligiendo un número de clase igual a 9 Intervalo de Clase = (53 - 5 + 1) / 9 = 5.44 con estos datos elaboramos el cuadro estadístico, con 9 clases y un Intervalo de Clase de 6. # Clase Int. Clase Frecuencia Frec. Acum. Frec. Rel. Frec. R. A. Marca de Clase 1 5 - 10 11 11 0.22 0.22 7.5 2 11 - 16 7 18 0.14 0.36 13.5 3 17 - 22 2 20 0.04 0.40 19.5 4 23 - 28 5 25 0.10 0.50 25.5 5 29 - 34 7 32 0.14 0.64 31.5 6 35 - 40 2 34 0.04 0.68 37.5 7 41 - 46 5 39 0.10 0.78 43.5 8 47 - 52 8 47 0.16 0.94 49.5 9 53 - 58 3 50 0.06 1.00 55.5 Totales 50 1.00 Para elaborar las gráficas estadísticas es necesario conocer además de la marca de clase, los límites reales de clases. L.R.C. = Lim.Sup. de la Clase (n)  Lim. Inf.de la Clase (n 1) 2 ( L.R.C. = Límite Real de Clase )
  • 26. PROBABILIDAD Y ESTADÍSTICA 25 CUADRO ESTADÍSTICO CON LIMITES REALES DE CLASE Número de Clase Intervalo de Clase Intervalo de Clase con Limites Reales Frecuencia Marca de Clase 1 5 - 10 4.5 - 10.5 11 7.5 2 11 - 16 10.5 - 16.5 7 13.5 3 17 - 22 16.5 - 22.5 2 19.5 4 23 - 28 22.5 - 28.5 5 25.5 5 29 - 34 28.5 - 34.5 7 31.5 6 35 - 40 34.5 - 40.5 2 37.5 7 41 - 46 40.5 - 46.5 5 43.5 8 47 - 52 46.5 - 52.5 8 49.5 9 53 - 58 52.5 - 58.5 3 55.5 En el capítulo tres veremos de la necesidad de utilizar cuadros estadísticos como el anterior para la elaboración de gráficas estadísticas. A continuación presentamos una serie de ejercicios resueltos referentes a este capítulo. * Evalué las siguientes sumas: 5 a) (y - 4) = y = 0 6 b) (y y = 2 2 - 5) = c) 4 i = 1 3 (yi - 2) = d) (y + 2i) = i = 1 5 a) (y - 4) = y = 0 (0 - 4) + (1 - 4) + (2 - 4) + (3 - 4) + (4 - 4) + (5 - 4) = - 4 - 3 - 2 - 1 + 0 + 1 = - 9 como podemos observar, se fue sustituyendo en el lugar de y el valor consecutivo desde el cero hasta el máximo valor que era el 5. Lo hecho anteriormente es similar para los incisos b), c) y d).
  • 27. PROBABILIDAD Y ESTADÍSTICA 26 6 b) (y y = 2 2 - 5) = (4 - 5) + (9 - 5) + (16 - 5) + (25 - 5) + (36 - 5) = - 1 + 4 + 11 + 20 + 31 = 65 c) 4 i = 1 (yi - 2) = (y1 - 2) + (y2 - 2) + (y3 - 2) + (y4 - 2) = y1 + y2 + y3 + y4 - 8 3 d) (y + 2i) = i = 1 [y + 2(1)] + [y + 2(2)] + [y + 2(3)] = 3y + 12 * Si y es la variable de posición de una sucesión y la fórmula para el elemento típico es y2 - 1: a) Escriba los primeros cuatro elementos de la sucesión. Los primeros cuatro elementos son: si y = 1 entonces : (1)2 - 1 = 0 primer elemento si y = 2 entonces : (2)2 - 1 = 3 segundo elemento si y = 3 entonces : (3)2 - 1 = 8 tercer elemento si y = 4 entonces : (4)2 - 1 = 15 cuarto elemento b) Use el signo de sumatoria para escribir una expresión para la suma de los primeros cuatro elementos. La fórmula de sumatoria es : 4 y = 1 (y2 - 1) c) Encuentre la suma de los primeros cuatro números. 4 y = 1 (y2 - 1) = [(1)2 - 1] + [(2)2 - 1] + [(3)2 - 1] + [(4)2 - 1] = 0 + 3 + 8 + 15 = 26
  • 28. PROBABILIDAD Y ESTADÍSTICA * Para estimar la pérdida semanal debida a robos, una tienda de ropas registró el total en nuevos pesos de las pérdidas durante un período de 10 semanas. Estas pérdidas, redondeadas a la decena más cercana fueron: 27 y1 = 360.00 y2 = 430.00 y3 = 210.00 y4 = 320.00 y5 = 550.00 y6 = 170.00 y7 = 240.00 y8 = 370.00 y9 = 280.00 y10 = 290.00 a) Encuentre 10  yi = 360 + 430 + 210 + 320 + 550 + 170 + 240 + 370 i = 1 + 280 + 290 = 3,220.00 b) Encuentre: i) 4 i = 2 yi ii) 4 i = 2 2 yi i) 4 i = 2 yi = 430.00 + 210.00 + 320.00 = 960.00 ii) 4 i = 2 2 = (430.00)2 + (210.00)2 + (320.00)2 = 331,400.00 yi * Dados el siguiente conjunto de elementos: 16 19 17 8 11 9 14 8 11 13 19 17 7 6 5 9 16 8 9 13 12 17 16 14 9 16 15 18 6 8 5 7 16 17 13 9 7 5 7 11 elaborar un cuadro estadístico en el podamos observar la frecuencia, frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada, marca de clase, amplitud de clase y límites reales de clase. Primero procederemos a ordenar los datos presentados anteriormente: 5 7 8 9 11 14 16 17 5 7 8 9 12 14 16 17 5 7 8 9 13 15 16 18 6 7 9 11 13 16 17 19
  • 29. PROBABILIDAD Y ESTADÍSTICA 28 6 8 9 11 13 16 17 19 como tenemos 40 elementos en la muestra, aplicaremos la fórmula de menos de 50 elementos: Num. de Clases = 1 + 3.3 log N Num. de Clases = 1 + 3.3 log (40) Num. de Clases = 1 + 3.3(1.602) Num. de Clases = 1 + 5.28 = 6.28 como tenemos 6.28 clases, redondeamos al inmediato inferior, por lo que utilizaremos 6 clases para la distribución anterior. Con 6 clases, el intervalo de clase será: Int. de Clase = ( 19 - 5 + 1 ) / 6 = 2.5 como el intervalo de clase es un número no entero, utilizaremos 3 como intervalo de clase, y entonces el número de clases será 5, quedando nuestro cuadro estadístico de la siguiente manera: # de C Intervalo de Clase Int. Clase Lim. Real Frecuencia Frecuencia relativa Frecuencia Acumulada Frec. Rel. Acumulada Marca de Clase 1 5 - 7 4.5 - 7.5 9 0.225 9 0.225 6 2 8 - 10 7.5 - 10.5 9 0.225 18 0.450 9 3 11 - 13 10.5 - 13.5 7 0.175 25 0.625 12 4 14 - 16 13.5 - 16.5 8 0.200 33 0.825 15 5 17 - 19 16.5 - 19.5 7 0.175 40 1.000 18 Totales 40 1.000 los límites reales se obtuvieron aplicando la relación de la página 23 vista en este capítulo.
  • 30. PROBABILIDAD Y ESTADÍSTICA 29 EJERCICIOS PROPUESTOS 1.- Defina los siguientes conceptos: a) Frecuencia b) Frecuencia Relativa c) Cuadro Estadístico. d) Amplitud de Clase. 2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son: 2 8 5 2 7 2 5 5 5 6 1 6 2 3 6 7 7 6 3 3 4 3 4 8 1 4 5 2 7 5 5 4 4 6 6 3 8 3 7 1 8 8 3 2 3 8 6 2 7 2 Formar un cuadro estadístico con toda la información manejada en este capítulo. 3.- Evalúe las siguientes sumas: a) 3 y = 1 y3 b) 3 x = 1 ( 1 + 2x + x2 ) c) 3 x = 0 ( x3 + 2x )
  • 31. PROBABILIDAD Y ESTADÍSTICA 30 INTRODUCCIÓN Es natural introducir los métodos gráficos para describir conjuntos de datos a través de la consideración de un conjunto real de datos. Anteriormente vimos el análisis de datos por métodos numéricos, métodos con los que nosotros podemos leer información respecto a promedios, poblaciones, etc. En los cuadros estadísticos se habló de clases y variables, ahora podremos representar gráficamente esas clases o variables y a ello es lo que llamaremos métodos estadísticos gráficos. Note que en los extremos de los subintervalos o clases se han escogido de manera que ningún elemento coincida con dos subintervalos o clases a la vez, eliminando así cualquier ambigüedad relacionada con la ubicación de una observación particular. Justo con los cuadros estadísticos vistos en el capítulo anterior es con los que deberemos elaborar nuestras gráficas estadísticas para el desarrollo de los métodos gráficos. REPRESENTACIONES GRÁFICAS En muchos casos una representación gráfica de una tabla de frecuencias da una información concisa y clara de una distribución de frecuencias. Son cuatro los tipos de representaciones gráficas más usuales, también existen dos tipos de representación gráfica no muy común y que sin embargo se deben de conocer; las representaciones gráficas son : 1.- Histograma ó Diagrama de Barras. 2.- Polígono de frecuencias. 3.- Diagrama de Pastel. 4.- Ojiva o Curva de frecuencias.
  • 32. PROBABILIDAD Y ESTADÍSTICA 31 Los dos tipos de gráficas no muy usuales son: 1.- Curva de Lorenz. 2.- Curva de la distribución Normal. HISTOGRAMA ó DIAGRAMA DE BARRAS Es aquel en el que se representan los datos mediante un plano coordenado, en el eje horizontal o de abcisas anotaremos la amplitud de clase o valor de la variable, mientras que en el eje vertical o de ordenadas se anota el número de elementos o frecuencias de clase; existen dos formas de presentar un histograma, por ejemplo, utilizando los datos del siguiente cuadro tendríamos: Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total Frecuencia 4 6 8 12 8 8 4 50 PRIMERA FORMA
  • 33. PROBABILIDAD Y ESTADÍSTICA 32 SEGUNDA FORMA POLÍGONO DE FRECUENCIAS Se obtiene relacionando la marca de clase (punto medio de cada intervalo) con su frecuencia respectiva. Ahora bien, para poder formar el polígono de frecuencias es necesario tomar una clase antes de la primera clase y una clase después de la última clase ambas con frecuencia cero, de esta manera al unir todos los puntos de relación marca de clase con frecuencia quedara formado el polígono respectivo. Veamos un polígono de frecuencias en base al siguiente cuadro estadístico. Las marcas de clase se obtienen como se menciono en el capítulo 2. Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total Frecuencia 4 6 8 12 8 8 4 50 Marca de Clase 34.5 44.5 54.5 64.5 74.5 84.5 94.5
  • 34. PROBABILIDAD Y ESTADÍSTICA 33 DIAGRAMA DE PASTEL Este diagrama se forma con la distribución de frecuencias relativas y se llama así debido a su configuración, la forma de obtener las rebanadas que le dan la forma de un pastel es multiplicando la frecuencia relativa por 360 grados que es el número de grados que tiene una circunferencia, su configuración es la siguiente: Extracción de el estudiante Z. Urbana Z. Suburbana Z. Rural Totales Frecuencia 240 1400 360 2000 Porcentaje ( % ) 12 70 18 100
  • 35. PROBABILIDAD Y ESTADÍSTICA 34 OJIVA O CURVA DE FRECUENCIA ACUMULADA Esta gráfica y distribución nos sirve para saber o poder responder preguntas como las siguientes: a) ¿Cuántos alumnos reciben calificaciones superiores a 60? b) ¿Cuántos alumnos tienen calificaciones inferiores a 60? Estas interrogantes en las que se desea conocer la frecuencia por encima o por debajo de cierto valor de la variable, son preguntas muy visuales en los distintos campos de la ciencia. Variable Frecuencia Frec. Acum. 40 0 0 50 3 3 60 1 4 70 2 6 80 3 9 90 1 10 Totales 10 Si hiciéramos un histograma de frecuencias obtendríamos la siguiente gráfica:
  • 36. PROBABILIDAD Y ESTADÍSTICA En base al mismo cuadro estadístico elaboraremos a continuación 35 un histograma de frecuencias acumuladas. Sobre el mismo histograma de frecuencia acumulada podríamos formar la curva u Ojiva, que es otra gráfica característica de la Estadística Descriptiva, la cual se forma de la siguiente manera: a).- Se eligirán los ejes coordenados en los cuales se especifica-rán la clase (o variable) y la frecuencia acumulada. b).- Si se trabaja con clases, para la formación de la Ojiva utilizaremos los limites superiores de clase, mientras que si trabajamos con variables, utilizaremos el punto donde se localiza la variable. Tanto el histograma de frecuencia acumulada como la Ojiva son utilizados en los cuadros estadísticos por clases o variables, veamos la gráfica de una Ojiva.
  • 37. PROBABILIDAD Y ESTADÍSTICA Existe una curva más sobre frecuencia acumulada que toma el nombre de Curva de Lorenz. La elaboración de esta curva se realiza de la misma manera que la Ojiva, sólo que la unión entre puntos son líneas rectas, además, de que se cierran los cuadros quedando la gráfica de la manera siguiente: 36
  • 38. PROBABILIDAD Y ESTADÍSTICA Está curva no es muy utilizada en el campo de las Ciencias Sociales, sin embargo, es muy importante dentro de las investigaciones en Física, Matemáticas, Fisiología, Ingeniería, etc. Las curvas de frecuencias son representaciones graficas de distribuciones de frecuencias teóricas. Ciertas formas de curvas de frecuencias reciben nombres específicos que guardan correspondencia con tipos específicos de distribuciones de frecuencias. Existen cuatro tipos de distribución correspondientes a estos tipos específicos, que son: La distribución Rectangular, La distribución Normal, La distribución Asimétrica y La distribución Bimodal. En este cuaderno hablaremos de la distribución Normal o curva acampanada ya que será utilizada más adelante. 37 DISTRIBUCION NORMAL Es una distribución simétrica alrededor de la media, con una curva de frecuencias en forma acampanada; es la principal distribución dentro de la Estadística Inferencial, más adelante en el capítulo siete esta distribución será tratada con más detalle, su representación gráfica es: A continuación se muestra un conjunto de datos, con los que vamos a elaborar las graficas estadísticas que se mencionaron: un histograma, un polígono de frecuencias, un diagrama de pastel y una ojiva.
  • 39. PROBABILIDAD Y ESTADÍSTICA 38 30 42 50 73 60 63 38 27 67 83 70 63 52 83 97 49 83 73 30 35 63 59 84 75 84 90 80 95 85 68 Basándonos en que se trata del ejercicio presentado en el capítulo anterior para la formación de un cuadro estadístico, procederemos a colocar nuevamente dicho cuadro, el cual queda de la siguiente manera: Número de Clase Intervalo de Clase Frecuencia Frecuencia Acumulada Frecuencia Relativa Frecuencia Rel. Acum. Marca de Clase 1 27 - 35 4 4 4 / 30 4 / 30 31 2 36 - 44 2 6 2 / 30 6 / 30 40 3 45 - 53 3 9 3 / 30 9 / 30 49 4 54 - 62 3 12 3 / 30 12 / 30 58 5 63 - 71 6 18 6 / 30 18 / 30 67 6 72 - 80 4 22 4 / 30 22 / 30 76 7 81 - 89 5 27 5 / 30 27 / 30 85 8 90 - 98 3 30 3 / 30 30 / 30 94 Totales 30 30 / 30 Basándose en el cuadro anterior, se procede a formar las gráficas estadísticas. a) HISTOGRAMA
  • 40. PROBABILIDAD Y ESTADÍSTICA 39 b) POLÍGONO DE FRECUENCIAS c).- CÁLCULOS PARA OBTENER EL DIAGRAMA DE PASTEL Num. de Clase Frecuencia Relativa Frecuencia Relativa x 360 Grados por Clase 1 0.133 0.133 x 360 48 2 0.067 0.067 x 360 24 3 0.100 0.100 x 360 36 4 0.100 0.100 x 360 36 5 0.200 0.200 x 360 72 6 0.133 0.133 x 360 48 7 0.167 0.167 x 360 60 8 0.100 0.100 x 360 36
  • 41. PROBABILIDAD Y ESTADÍSTICA 40 d) O J I V A frec. 30 26.5 35.5 44.5 53.5 62.5 71.5 80.5 89.5 98.5 Límites superiores de las clases EXAMEN DE AUTOEVALUACIÓN 1.- Explique la elaboración de las siguientes gráficas estadísticas : a) Histograma. b) Diagrama de Pastel. c) Pictograma d) Polígono de Frecuencias 2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son: 2 8 5 2 7 2 5 5 5 6 1 6 2 3 6 7 7 6 3 3 4 3 4 8 1 4 5 2 7 5 5 4 4 6 6 3 8 3 7 1 8 8 3 2 3 8 6 2 7 2 a) Formar un cuadro estadístico.
  • 42. PROBABILIDAD Y ESTADÍSTICA 41 b) Construir un Histograma. c) Construir un Polígono de Frecuencia. d) Graficar una Ojiva. e) Construir un Diagrama de Pastel. 3.- Con las siguientes estaturas de los estudiantes de un grupo de la Fac. de Derecho: 1.87 1.79 1.75 1.90 1.84 1.82 1.77 1.85 1.73 1.98 1.87 1.81 1.79 1.85 1.89 1.90 1.77 1.83 1.91 1.94 1.79 1.80 1.92 1.84 1.76 1.85 1.82 1.91 1.90 1.87 1.86 1.91 1.91 1.89 1.86 1.86 1.97 1.78 1.74 1.76 a) Construir un Cuadro Estadístico. b) Elaborar las cuatro gráficas estadísticas más usuales.
  • 43. PROBABILIDAD Y ESTADÍSTICA 42 LA MEDIA ARITMÉTICA También se le conoce como promedio; es la suma de todos los elementos dividida entre el número total de ellos. Matemáticamente se representa de la siguiente manera: " Sea X una variable; X1, X2, . . . , Xn , la población generada por X, el promedio de la población será :  Xi n n i=1   (1) Existen dos tipos de medias, la Media Poblacional que se representa con la letra griega "  ", y la Media Muestral que se representa con una X testada " X ", ambas se obtienen de la misma forma. La Media Aritmética es una medida que se utiliza para describir poblaciones, por ejemplo: 1.- La vida media de una pila es cierto número de horas. 2.- La calificación promedio de los estudiantes de un grupo. 3.- El gasto promedio de gasolina por kilómetro recorrido en un auto. 4.- El salario medio de los empleados de una empresa. 5.- La altura media de los jugadores de un equipo de básquetbol. Una característica de la Media Aritmética que debe tenerse en cuenta cuando se describe una población es que esta medida es afectada por los valores extremos de la muestra o población. Así por ejemplo: Si se le pide a un empresario que informe sobre el salario promedio de los
  • 44. PROBABILIDAD Y ESTADÍSTICA trabajadores de su empresa, esta información se verá totalmente afectada si en el cálculo se incluye su propio salario y el de sus trabajadores de más alta jerarquía, ya que elevaría el salario promedio, en caso contrario, al calcular el salario promedio de los ejecutivos, no se incluiría el sueldo de los intendentes, porque esto bajaría el salario promedio de estas personas. La Media Aritmética es una buena medida descriptiva de una población, si los datos de ésta no se encuentran muy dispersos. Veamos a continuación algunos ejemplos. * Obtenga la media aritmética o promedio de las calificaciones de un grupo de 18 alumnos en la materia de Filosofía, las calificaciones de los alumnos son: 43 7 9 6 9 4 8 5 8 7 6 9 8 5 7 5 8 4 7 para obtener la media aritmética de los datos anteriores, debemos aplicar la fórmula (1), teniéndose entonces que : X = 2 4 3 5 2 6 4 7 4 8 3 9 18 122 18 6 77 ( ) ( ) ( ) ( ) ( ) ( ) .        teniéndose entonces que el promedio de los alumnos es: X = 6.77 * Si la estatura de 12 jugadores de Básquet Bol de la Universidad de Colima son: 1.97 1.92 1.84 1.86 1.88 1.92 1.82 1.85 1.94 1.87 1.80 1.93 ¿cuál es la estatura promedio de los 12 jugadores?
  • 45. PROBABILIDAD Y ESTADÍSTICA Aplicando la misma fórmula (1), tenemos que la media aritmética o 44 estatura promedio es: X = 1.80 +1.82 +1.84 +1.85 +1.86 +1.87 +1.88 +1.92 +1.92 +1.93 +1.94 +1.97 12 X = 22 . 6 12 = 1.88 mts * Si la producción mensual de maíz en toneladas, durante un año en Tlaxcala fue : 12,000 14,280 15,720 13,318 14,420 13,300 12,800 13,618 14,710 15,127 14,360 13,750 ¿cuál es la producción promedio mensual y cuál es la producción anual ?. Aplicando la fórmula (1) tenemos: X = 12,000 +14,280 +15,720 + + 15,127 +14,360 +13750 12 = 167,403 12    X = 13,950.25 toneladas para obtener la producción anual, sólo debemos sumar todos datos de producción mensual, para lo cual, aplicaremos el concepto de sumatoria visto en la unidad 2. Producción anual = 12  xi = 12,000 + 14,280 + * * * + 14,360 + 13,750 i = 1 Producción anual = 167,403 toneladas
  • 46. PROBABILIDAD Y ESTADÍSTICA 45 LA MEDIANA Es otra medida que se utiliza para describir el valor central de una población. Para calcular la Mediana se ordenan los datos en forma ascendente o descendente, si el tamaño de la población es impar, la Mediana es el dato que queda al centro del los datos ordenados; si es par, la Mediana es el promedio de los dos datos que ocupan el centro de la ordenación. Se observa que la Mediana divide en dos partes iguales a los datos de una muestra o población. La Mediana es una medida que no es afectada por los valores extremos de la muestra o población. Veamos algunos ejemplos. * Calcular la mediana de los siguientes datos: 46, 54, 58, 56, 48, 58, 112 Para calcular la Mediana, primero se ordenan los datos en forma ascendente o descendente, teniéndose: 46, 48, 54, 56, 58, 58, 112 Una vez ordenados, se toma el dato al centro de la ordenación ya que en este caso tenemos un número impar de datos, por lo tanto, la Mediana es: 56 * En un grupo de 15 alumnos de la Fac. de Medicina, los alumnos obtuvieron las siguientes calificaciones en Anatomía: 85 92 78 87 96 87 79 90 77 92 87 94 83 78 89 Determine la Mediana.
  • 47. PROBABILIDAD Y ESTADÍSTICA Para obtener la Mediana es necesario ordenar los datos, 46 teniéndose entonces que: 77 78 78 79 83 85 87 87 87 89 90 92 92 94 96 La Mediana de los datos o el dato que divide en dos partes iguales a la muestra es 87 debido a ser el dato que ocupa el centro de la muestra por ser un número impar. A partir de este momento, representaremos a la Mediana de la siguiente manera: X * Determine la Mediana del siguiente conjunto de datos: 12 18 23 16 24 17 18 20 15 9 16 22 18 11 14 19 para obtener la Mediana debemos ordenar los datos en forma ascendente y escoger el dato que se encuentre en el centro de la colección, por lo tanto: 9 11 12 14 15 16 16 17 18 18 18 19 20 22 23 24 como podemos observar en este caso el número de datos es par y por lo tanto la Mediana de esta colección de datos será el media aritmética de los datos que ocupan el centro de la colección, siendo estos datos los números 17 y 18 teniéndose entonces que la Mediana en este ejercicio es : X = 17 18 2 17 5   . .
  • 48. PROBABILIDAD Y ESTADÍSTICA 47 LA MODA Es otra medida de tendencia central y que se utiliza para describir el valor típico de una población. La Moda en una población o muestra es el valor que se presenta con mayor frecuencia. Sí en una muestra de 10 casas, se considera la siguiente distribución en número de hijos, 3, 0, 1, 5, 6, 2, 1, 2, 7, 2, entonces la Moda es el número 2, ya que es el elemento que aparece con mayor frecuencia. La Moda la representaremos de la siguiente manera : Mo . Debemos aclarar que pudiera existir una colección de datos en la que existan dos o más modas, lo cual sucedería cuando existieran dos o más elementos que aparecen la misma cantidad de veces y que además son el que mayor frecuencia tienen. Veamos algunos ejemplos. * En un grupo de 15 alumnos de la Fac. de Medicina, los alumnos obtuvieron las siguientes calificaciones en Anatomía: 85 92 78 87 96 87 79 90 77 92 87 94 83 78 89 ¿ Cuál es la Moda ?. La Moda es la calificación que se presentó con mayor frecuencia en el grupo, teniéndose entonces que: Mo = 87 * Si la estatura de 12 jugadores de Básquet Bol de la Universidad de Colima son: 1.97 1.92 1.84 1.86 1.88 1.92 1.82 1.85 1.94 1.87 1.80 1.93
  • 49. PROBABILIDAD Y ESTADÍSTICA ¿cual es la estatura que existe en mayor cantidad en los 12 jugadores? A la estatura que mayor frecuencia tenga es la que llamaremos la Moda, teniéndose entonces que: Mo = 1.92 48 * Obtenga la Moda de la siguiente colección de datos: 9 11 12 14 16 16 16 17 18 18 18 19 20 22 23 24 en este ejemplo tenemos que los números que mayor veces aparecen son el 16 y el 18, por lo tanto, en esta colección de datos tenemos un ejemplo de distribución bimodal ( existen 2 modas en la colección ), por lo que las modas son: Mo = 16 y 18 COMPARACIÓN DE LA MEDIA ARITMETICA, LA MEDIANA Y LA MODA Hemos visto 3 medidas de tendencia central que describen a una población, pero, ¿cuál debe usarse en una situación determinada?. La elección de la medida de tendencia central a usarse depende del tipo de variable que genera la población y de las finalidades del estudio que se está realizando. Un criterio fuerte para la elección de alguna de estas medidas es el de escoger la que presente ventajas significativas sobre las otras dos, por ejemplo: En el caso de una fábrica de automóviles la empresa deber decidir que marca de acumuladores usar en sus vehículos, para lo que le puede ser útil además del costo, comparar la durabilidad de los acumuladores de diversas marcas. En poblaciones de este tipo, la media, la mediana, y la moda son en la mayor parte de los casos valores muy parecidos.
  • 50. PROBABILIDAD Y ESTADÍSTICA La media sólo puede calcularse cuando la variable de interés es numérica. A pesar de que la media puede ser afectada por valores muy grandes o muy pequeños respecto al resto de la población, es una medida que se emplea con mucha frecuencia para orientar la toma de decisiones, porque su naturaleza numérica facilita el tratamiento estadístico. La mediana es una medida que sólo se puede obtener si la variable al menos es cardinal, en general, se acude a esta medida cuando no se puede calcular la media o ésta no sea representativa de la población. La moda es una medida que puede obtenerse para cualquier tipo de variable. Hay muchas ocasiones en que esta medida presenta ventajas sobre las otras dos para describir a una población. Por ejemplo: Consideremos el caso de planear la producción de un nuevo tipo de chamarras, para el largo de la manga y la talla, el fabricante considerará las de mayor frecuencia, es decir, la moda. En este caso, la media o la mediana no le aportan la información requerida. Veamos un ejemplo: El siguiente conjunto de datos contiene las calificaciones de 50 49 alumnos de la materia de Economía: 5 2 3 8 4 5 4 7 5 8 6 8 7 7 2 9 1 10 9 6 9 7 10 8 9 9 10 5 9 5 9 10 10 2 8 2 10 2 7 3 3 10 5 10 9 6 1 9 7 6 a) Obtener La Media Aritmética, La Mediana y La Moda. X = ( 1 + 1 + 2 + . . . + 10 + 10 + 10 ) / 50 X = 326 / 50 = 6.52 Mediana = X = 7 ( por ocupar los lugares 25 y 26 en el arreglo ) La Moda = Mo = 9 ( por ser el que más se repite ó aparece )
  • 51. PROBABILIDAD Y ESTADÍSTICA b) Mencione cuál de las tres medidas de tendencia central es la más 50 adecuada y ¿por que? La más representativa es la Media Aritmética, ya que los datos no se encuentran muy dispersos, además de que la Mediana y la Moda tienden a cargarse más hacia un extremo. Debemos señalar que las tres medidas de tendencia central mencionadas anteriormente son las más comunes, más no son las únicas. Existen otras medidas de tendencia central como son la Media Geométrica, La Media Armónica, La Media Ponderada, La Media Supuesta, y algunas otras. Veamos un ejemplo de lo anterior. * La duración en horas de una muestra de focos tomados de la producción diaria de una fabrica son: 129 145 168 164 165 172 168 179 168 170 159 168 175 164 179 168 180 173 149 159 168 178 177 178 168 172 168 158 154 168 a) Calcular la Media Aritmética, la Mediana y la Moda. X = 129 + 145 + + 154 + 168 30 = 4991 30 = 166.36 horas    X = 168 por ocupar el lugar 15 y 16 de la ordenación Mo = 168 por ser el número en horas que más se repite. b) Mencione cuál de las tres medidas de tendencia central es la más apropiada para este evento. Para este evento, consideramos que la medida de tendencia central más apropiada es la Media Aritmética, ya que es el dato que se
  • 52. PROBABILIDAD Y ESTADÍSTICA encuentra más hacia el centro de la distribución aun cuando es afectado por la medida de 129 horas. 51 MEDIA GEOMÉTRICA La Media Geométrica es muy usual para el cálculo de promedios de tasas de variación, en la elaboración de Números Índice, etc. Se define de la siguiente manera: “Sí tenemos n elementos, la Media Geométrica es la raíz n-ésima del producto de todos los elementos ”. La fórmula para obtenerla es: MEDIA GEOMÉTRICA ( g ) = n X X X 1 * 2 * . . . * n donde: n = Tamaño de la Muestra Xi = Elemento de la Muestra * Obtener la Media Geométrica de los siguientes números: 3, 5, 7, 9, 8. g = 5 3 5 7 8 9 * * * * = 5 7,560 = 5.966 Veamos algunos ejercicios de lo visto hasta este momento. * Obtener la Media Aritmética de los datos: 6 3 8 5 2 X =     6 3 8 5 2 5 = 24 5 = 4.8 * Los ingresos anuales de 12 profesores en nuevos pesos son: 72,000 72,000 75,000 81,000 163,000 78,000 81,000 89,000 72,000 90,000 84,000 81,000
  • 53. PROBABILIDAD Y ESTADÍSTICA Calcular las medidas de tendencia central. Indique cual es la más significativa y ¿por que? 52 X = 72,000 + 72,000 + + 90,000 +163,000 12 = 1' 038,000 12    X = 86,500 nuevos pesos Mo = 72,000 y 81,000 X = 81,000 La más significativa es la Mediana, por que es el valor que se encuentra al centro de la distribución, mientras que la Moda toma un valor extremo lo que la hace no muy significativa y a la Media la afecta el valor de 163,000 por estar muy disperso. * Obtener la Media Geométrica de los siguientes datos: 12 15 17 13 18 14 18 13 17 15 g = 10 12 x 15 x 17 x 13 x18 x 14 x 18 x 13 x 17 x 15 g = 10 5,981,655,000,000 = 15.05 MEDIA ARMÓNICA La idea de promedio es tan manejable que no es sorprendente que se hayan inventado diversos tipos de promedio de modo que pueda representarse con un mínimo de deformación un campo tan amplio como sea posible. Podemos escoger nuestro promedio, y tomamos el apropiado para nuestro propósito. El promedio aritmético de un conjunto de números es el más simple de los promedios ó medidas de centralización.
  • 54. PROBABILIDAD Y ESTADÍSTICA Un segundo tipo de promedio importante es la Media Armónica, que es el recíproco de la media aritmética de los recíprocos de los valores que queremos promediar. La Media Armónica es el promedio adecuado cuando tratamos con tarifas y precios. Consideremos un ejemplo para explicar este tipo de promedio. * Un aeroplano vuela alrededor de un cuadrado cuyo lado tiene 100 Km de largo, tomando el primer lado a 100 Km/h , el segundo lado a 200 Km/h , el tercer lado a 300 Km/h y el cuarto lado a 400 Km/h. ¿Cuál es la velocidad media del aeroplano en su vuelo alrededor del cuadrado? Si promediamos las velocidades usando la media aritmética de la 53 manera usual, tenemos: 100 200 300 400 4 X =    = 250 Km/h pero éste no es el resultado correcto, ya que lo podemos comprobar de la siguiente manera : Tiempo para viajar el primer lado 1 hora Tiempo para viajar el segundo lado 30 minutos Tiempo para viajar el tercer lado 20 minutos Tiempo para viajar el cuarto lado 15 minutos De el desglose anterior tenemos que el tiempo total empleado en recorrer los 400 kilómetros fue de 2 horas 5 minutos, con este total se deduce que la velocidad media del aeroplano en recorrer los 400 Km del cuadrado fue de 192 Km/h. El promedio aritmético nos da por lo tanto un resultado equivocado. Podemos deducir la razón de esto a partir del hecho de que no
  • 55. PROBABILIDAD Y ESTADÍSTICA todas las velocidades se mantienen durante el mismo tiempo, sólo lo hacen para la misma distancia. El promedio correcto para usar en este caso es la Media Armónica. Para dar la fórmula introduciremos la notación de sumatoria ya analizada anteriormente, teniéndose entonces que: 54 Media Armónica (H) = n 1 n i=1 Xi a partir de este momento, cuando hablemos de la Media Armónica, la representaremos con la letra H. Para ilustrar esta fórmula, apliquémosla a nuestro ejemplo del aeroplano. Las cuatro velocidades que se mantenían cada una sobre la misma distancia, eran 100 Km/h, 200 Km/h, 300 Km/h y 400 Km/h. Estos son los valores de Xi . Puesto que hay cuatro valores, el valor de n en nuestro ejemplo es 4, y tenemos entonces: H = 4 1 100 = 4 25 1200 = 4,800 25 = 192 Km/ h 1 200 1 300    1 400 en donde 192 Km/h es la respuesta correcta. Como podemos ver, la media armónica es adecuada aquí porque los tiempos eran variables con las distancias constantes. De haber sido las tiempos constantes y las distancias variables, la media aritmética hubiese sido la correcta. Cabe señalar que el tipo de promedio adecuado depende siempre de los términos del problema en curso. Las fórmulas no se han de aplicar indiscriminadamente. Veamos algunos ejemplos.
  • 56. PROBABILIDAD Y ESTADÍSTICA * Un agricultor puede arar un terreno empleando un tractor en cuatro días; un ayudante suyo puede hacer el mismo trabajo con un tractor más pequeño en 6 días. ¿Cuál es el rendimiento representativo de los dos tractores?, ¿En cuántos días pueden arar el mismo campo si trabajan conjuntamente? 55 Para calcular el rendimiento representativo, tenemos: H n n   i xi         1 2 1 4 1 6 2 3 2 12 2 5 12 24 5 4 4 5 1 por lo tanto el rendimiento representativo de los dos tractores es de 4 4 5 días. Para determinar en cuántos días los tractores pueden arar el campo si trabajan conjuntamente tenemos que su rendimiento representativo es de 4 4 5 días, por lo que al trabajar conjuntamente resulta: 4 5 2 4 24 5 2 24 10 2 2 5    por lo tanto para arar el campo si los dos tractores trabajan conjuntamente, se requiere 2 2 5 días. Comprobación: Los dos tractores pueden arar en un día 1 4 1 6 5 12   del campo; en arar todo el campo tardarán : por dos días de arado conjuntamente habrán arado 10 12 del campo, pero como araron juntos 2 5 de un día más, eso es en proporción del campo lo siguiente : 2 5 de un día por 5 12 de
  • 57. PROBABILIDAD Y ESTADÍSTICA 56 campo arado conjuntamente en un día da 2 12 de campo, que es el complemento de 10 12 del campo, entonces, en arar todo el campo tardarán 2 2 5 días. * En una ruta ferroviaria la velocidad a la que se desplaza un tren es: los primeros 90 Km. a 70 Km/h, en el segundo tramo de 70 Km. a 100 Km/h; determinar la velocidad promedio para todo el recorrido. Dado que las distancias de los tramos no son iguales, se debe utilizar una ecuación representativa que denominamos “media armónica ponderada” para las velocidades donde los “pesos” son las distancias respectivas, es decir: 1 1 H N f X   en donde N = f , o también puede ser N H f X   sustituyendo los datos de velocidad y distancia, resulta: d + d + d + . . . + d v d v d v d v . . . + d v 1 2 3 N 1 1 2 2 3 3 N N     sustituyendo los datos en la ecuación de la media armónica ponderada para la velocidad media, resulta: 9 0 7 0 1 6 0 1 9 8 5 7    v = 9 0 7 0 7 0 1 0 0 v = 1 . 2 8 5 7 + 0 . 7 1 6 0 . v v = 8 0 . 5 7 por lo tanto la velocidad promedio para todo el recorrido es 80.57 Km/h. Comprobación: Determinamos primeramente el tiempo requerido para recorrer el primer tramo:
  • 58. PROBABILIDAD Y ESTADÍSTICA 57 TIEMPO ( t ) = DISTANCIA ( d ) VELOCIDAD ( v ) = 90 Km 70 Km / h horas El tiempo requerido para recorrer el segundo tramo es: ( t ) = d v Km 100 Km / h horas. La velocidad media para todo el recorrido es: VELOCIDAD MEDIA = DISTANCIA TOTAL TIEMPO TOTAL 90 Km + 70 Km 1.2857 h + 0.7 h Km 1.9857 h VELOCIDAD MEDIA = 80.57 Km / h       12857 70 0 7 160 . . MEDIA ARMONICA PARA DATOS AGRUPADOS Si consideramos los elementos ( X1 , X2 , X3 , . . . , XN ) que se presentan con frecuencias ( f1 , f2 , f3 , . . . , fN ) en donde ( f1 + f2 + f3 + . . . + fN = N ) representa la frecuencia total; la ecuación de la Media Armónica para datos agrupados se expresa por: H =    f f X N f X  donde: H = Media Armónica N =  f = Número total de frecuencias XN = Marcas de clases de datos agrupados. fN = Frecuencias de clase. * La siguiente tabla de distribuciones de frecuencias registra las longitudes en centímetros que en una semana tienen 100 plantas de frijol; con esta información obtener la Media Armónica.
  • 59. PROBABILIDAD Y ESTADÍSTICA   15.2632252 58 INTERVALOS ( LONGITUDES ) FRECUENCIAS ( f ) ( No. DE PLANTAS ) 5.4 - 5.7 7 5.8 - 6.1 16 6.2 - 6.5 21 6.6 - 6.9 29 7.0 - 7.3 18 7.4 - 7.7 9 100 SOLUCION: Para determinar la Media Armónica es necesario construir la siguiente tabla de distribuciones: INTERVALOS ( LONGITUDES ) MARCA DE CLASE ( X) FRECUENCIAS ( f ) (No. DE PLANTAS) f X 5.4 - 5.7 5.55 7 1.261261 5.8 - 6.1 5.95 16 2.689075 6.2 - 6.5 6.35 21 3.307086 6.6 - 6.9 6.75 29 4.296296 7.0 - 7.3 7.15 18 2.517482 7.4 - 7.7 7.55 9 1.192052 N = 100 = f f X Sustituyendo los datos anteriores en la correspondiente ecuación tenemos: H = N f X = 100 15.2632252 = 6.55  La media armónica calculada a partir de los datos agrupados es de 6.55 cm. EJERCICIOS PROPUESTOS 1.- ¿Qué es una medida de tendencia central?
  • 60. PROBABILIDAD Y ESTADÍSTICA 2.- Describa el proceso para la obtención de la Media Aritmética, la Mediana y la Moda. 3.- ¿Qué criterio se sigue para determinar la medida de tendencia central más significativa? 4.- Determine la Media, la Mediana, la Moda y la Media Geométrica de los siguientes datos: 59 1 1 2 2 3 3 3 4 4 4 4 5 5 6 7 8 5.- Los siguientes datos representan el tiempo de vida en años de una muestra aleatoria de 30 motores eléctricos similares. 2.0 3.0 0.3 3.3 1.3 0.4 0.2 6.0 5.5 6.5 0.2 2.3 1.5 4.0 5.9 1.8 4.7 0.7 4.6 0.3 1.5 0.5 2.5 5.0 1.0 6.0 5.6 6.0 1.2 0.2 a) Construya un cuadro estadístico. b) Construya un Histograma, un Polígono de Frecuencias y un Diagrama de Pastel. c) Con los datos calcular la Media Aritmética, la Mediana y la Moda.
  • 61. PROBABILIDAD Y ESTADÍSTICA 60 MEDIDAS DE DISPERSIÓN Cuando una población es generada por una variable numérica, además de poderla describir mediante una medida de tendencia central, también se puede obtener una medida que nos indique el grado de homogeneidad de sus datos. A este tipo de medidas se les conoce como medidas de variabilidad o de dispersión. Existen varias medidas de dispersión, como son el Rango, la Desviación Media, la Varianza, y algunas otras, las cuales estudiaremos en este capítulo. RANGO: Es una medida de dispersión que se obtiene restando al mayor elemento de la colección de datos, el elemento menor. Aunque el rango es una medida que tiene la ventaja de calcularse fácilmente, tiene la desventaja de sólo considerar los valores extremos de la población (También se le conoce como Amplitud Total ). DESVIACIÓN ESTÁNDAR Esta medida nos indica que tan dispersos se encuentran en promedio, los datos con respecto a la media aritmética. Existen dos tipos de desviación estándar, la Desviación Estándar Muestral y la Desviación Estándar Poblacional. La Desviación Estándar Poblacional se calcula en base a la media aritmética poblacional, utilizando la siguiente fórmula:    n  ( X i - ) ² N i = 1 donde: N = Tamaño de la Población.
  • 62. PROBABILIDAD Y ESTADÍSTICA 61  = Media Aritmética Poblacional. Xi = Elemento de la Población.  = Desviación Estándar Poblacional. La desviación estándar nos puede indicar como se comportan los datos alrededor de una medida de tendencia central y como en ocasiones a pesar de tener el mismo valor dos muestras diferentes, en su medida de tendencia central, el grado de dispersión es distinto. Pudiéramos tener una muestra en que su media aritmética fuera 4 y que los datos oscilaran entre 3 y 5, y otra muestra que su media aritmética fuera 4 y que sus datos oscilaran entre 0 y 8. Aunque ambas tienen el mismo valor en su medida de tendencia central, tienen distinta distribución de los datos, de aquí la importancia de tener una medida que nos indique el grado de dispersión de los datos con respecto al dato central. La Desviación Estándar Muestral tiene dos modificaciones con respecto a la Poblacional, ya que se utiliza la media aritmética muestral y el tamaño de la muestra menos 1, quedando la fórmula de la siguiente manera: s = ( X i - X )² n - 1 n i=1 donde: n = Tamaño de la Muestra. Xi = Elemento de la Población X = Media Aritmética Muestral. s = Desviación Estándar Muestral.
  • 63. PROBABILIDAD Y ESTADÍSTICA Existe otra medida de dispersión llamada Desviación Media, que requiere del cálculo de la Amplitud, aún cuando no es muy utilizada, es necesario tener conocimiento de ella. Se obtiene con la siguiente fórmula: 62  m = X i - X n n i=1 ahora bien, este tipo de medida de dispersión no nos proporciona un grado adecuado de homogeneidad, por lo que es necesario utilizar el de la desviación estándar para representar el grado de dispersión de la muestra con respecto a su media, además, de que no sirve para calcular la varianza. VARIANZA Es el cuadrado de la desviación estándar. Dependiendo de la desviación estándar de que se trate, recibirá el nombre de Varianza Muestral o Varianza Poblacional ( s2 si es la muestral y  2 si es la poblacional ). Veamos algunos ejemplos. * Se tomó la presión sanguínea de diez personas antes y después de fumar. Los cambios fueron: +10, -5, +7, +4, +2, +3 -4, -5, -3, +9 Calcular la Varianza y Desviación Estándar con esos datos. X = 10  5 7  4  2  3 4  5 3 9 10 = 18 10 = 1.8 s2 =    (10 - 1.8)² + (-5 - 1.8)² + + (-3 - 1.8)² + (9 - 1.8)² 10 - 1 s2 = 33.511
  • 64. PROBABILIDAD Y ESTADÍSTICA Como la desviación estándar es la raíz cuadrada de la varianza, entonces tenemos que la desviación estándar de las diez presiones sanguíneas registradas es: s = 5.788 63 * Dados los siguientes datos: 3, 5, 16, 23, 31, 12, 23, 13, 15. a).- Calcular las medidas de tendencia central. X =         3 5 16 23 31 12 23 13 15 9 = 141 9 X = 15.66 Ordenando los elementos tenemos que: 3 5 12 13 15 16 23 23 31 teniéndose que la mediana será el dato que se encuentre al centro del arreglo, por lo tanto : Mediana = 15 La Moda = 23 b).- Calcular las medidas de Dispersión s2 =    (3 - 15.66)² + (5 -15.66)² + + (23 -15.66)² + (31- 15.66)² 9 - 1 s2 = 160.27 +113.63 +13.39 + 7.07 + 0.43 + 0.12 + 3.87 + 53.87 + 235.31 8 637 . 96 8   79 . 745 por lo tanto, la desviación estándar es entonces: s = 79.745 = 8.93 * En el departamento de Inglés de la UAS se informó que el sueldo anual de los profesores es en promedio de 72,000 dólares, con una desviación estándar de 0.0 ¿Cuál será la mediana y la moda de estos sueldos? R.- Tanto la Mediana y la Moda es 72,000; ya que cuando la desviación estándar es 0, se tiene que no existe dispersión entre los valores de la muestra (dicho de otra manera, no existe variación entre los datos).
  • 65. PROBABILIDAD Y ESTADÍSTICA * Si en una colonia se registró el número de personas que viven por casa tomando una muestra de 18 viviendas, obteniéndose los siguientes resultados: 64 6 5 6 4 9 2 8 4 5 3 3 5 6 5 7 2 5 7 determine la media aritmética, la varianza y desviación estándar de la muestra. X = ( )  ( )  ( )  ( )  ( )  ( )   2 2 2 3 2 4 5 5 3 6 2 7 8 9 18 = 92 18 = 5.11 s2 = ( X i - X )² n - 1 n i=1 s2 = 2(2-5.11)²+2(3-5.11)²+2(4-5.11)²+5(5-5.11)²+3(6-5.11)²+2(7-5.11)²+(8-5.11)²+(9-5.11)² 18 - 1 s2 = 19.3442+8.9042+2.4642+0.0605+2.3763+7.1442+8.3521+ 15.1321 17 = 63 . 7778 17 s2 = 3.7516353 por lo tanto la desviación estándar es s = 1.9369135 * Calcule la media aritmética, la varianza y desviación estándar de los siguientes datos: 5 7 1 2 4 X = 5 7 1 2 4 5 19 5 3 8       . s2 = (5 - 3.8)² + (7 - 3.8)² + (1- 3.8)² + (2 - 3.8)² + (4 - 3.8)² 5 - 1  22 . 8 4 s2 = 5.7 ; por lo tanto la desviación estándar es : s = 2.3874673
  • 66. PROBABILIDAD Y ESTADÍSTICA 65 CALCULO DE LA MEDIA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS Generalmente cuando se agrupan en clases los datos generados por una variable numérica, es posible calcular la media y la desviación estándar con los datos tabulados. En estos casos, tanto la media como la desviación estándar son aproximaciones de los valores reales, debido a que uno conoce la cantidad de elementos que pertenecen a la clase, pero desconocemos sus valores. Para calcular la Media Aritmética de un conjunto de datos agrupados, se emplea la siguiente fórmula:  ( mi * fi )  ( mi * fi ) X= =  fi n Donde: mi = Marca de Clase. fi = Frecuencia de Clase. n = Tamaño de la Muestra. X = Media Aritmética. Para el cálculo de la Varianza se utiliza: s2  ( m - X )²  f i i n - 1 Existe otra forma de calcular la varianza, llamada forma simplificada, la cual se obtiene sustituyendo en la fórmula de la varianza la de la media, y al simplificar quedaría así:
  • 67. PROBABILIDAD Y ESTADÍSTICA 66     s² =  i  i  i  i n (X)² f - (X f ) ² n(n-1) donde : n = Tamaño de la Muestra Xi = Elemento de la Muestra fi = Frecuencia de la Clase La fórmula anterior es para calcular la Varianza de un grupo de variables colocadas en un cuadro estadístico, para determinar la varianza de un cuadro estadístico cuando esté agrupado por clases, entonces sustituimos en el lugar de la variable ( Xi ) la marca de clase ( mi ) teniéndose entonces que la fórmula a aplicar será: n[ {(mi)2 * fi }] - [ ( mi * fi )]2 s2 = n ( n - 1 ) donde : n = Tamaño de la Muestra mi = Marca de Clase fi = Frecuencia de Clase En los dos casos anteriores, la Desviación Estándar se obtiene sacando la raíz cuadrada de la Varianza. INTERPRETACIÓN PRACTICA DE LA DESVIACIÓN ESTÁNDAR Introduciremos ahora un teorema interesante y útil, desarrollado por el matemático ruso Tchebysheff. La demostración del teorema no es difícil, pero la omitiremos para manejar directamente su significado.
  • 68. PROBABILIDAD Y ESTADÍSTICA El teorema de Tchebysheff dice : “ Dado un número k mayor o igual a 1 y un conjunto de n observaciones x1, x2, x3, * * * , xn , por lo menos ( 1 - 1/k2 ) de las observaciones se encuentran dentro de k desviaciones estándar de la media ”. El teorema de Tchebysheff se aplica a cualquier conjunto de observaciones y, para propósitos de ilustración, nos podríamos referir tanto a la muestra como a la población. Usaremos la notación correspondiente a poblaciones, pero deben darse cuenta que bien podríamos usar la media aritmética y la desviación estándar muestral. La idea contenida en el teorema de Tchebysheff se ilustra en la siguiente figura: 67 k 1 - 1/k2 1 2 3/4 3 8/9 4 15/16 -3 -2 -1 0 1 2 3 Se construye un intervalo midiendo una distancia de k veces la  en unidades a ambos lados de la media aritmética  . Note que el teorema es cierto para cualquier valor que le demos a k , siempre y cuando k sea mayor o igual a 1. Entonces, calculando la fracción 1 - 1/k2 , vemos que el teorema de Tchebysheff establece que al menos esa fracción del número de observaciones caerán en el intervalo construido. Ponemos énfasis en la expresión “ al menos ” del teorema de Tchebysheff porque el teorema es muy conservador, siendo aplicable a
  • 69. PROBABILIDAD Y ESTADÍSTICA cualquier distribución. En la mayoría de las situaciones, la fracción de las observaciones que caen en el intervalo especificado excede a 1 - 1/k2. Enunciaremos ahora una regla que describe con precisión la variabilidad de una distribución particular en forma de campana y que describe razonablemente bien la variabilidad de otras distribuciones de datos de forma monticular. La frecuente ocurrencia de distribuciones acampanadas y monticulares en la naturaleza, y por tanto la aplicabilidad de nuestra regla, nos conduce a llamarla la “ regla empírica ”. Regla empírica: Dada una distribución de observaciones que es 68 aproximadamente acampanada, el intervalo : 1)    contiene aproximadamente el 68 % de las observaciones. 2)   2 contiene aproximadamente el 95 % de las observaciones. 3)   3 contiene todas o casi todas las observaciones. Las relaciones anteriores las podemos mostrar por medio de una gráfica en la cual se muestra la distribución en porcentajes de los datos alrededor de la media aritmética. -3 -2 -   2 3 68.27 % 95.45 % 99.95 %
  • 70. PROBABILIDAD Y ESTADÍSTICA La distribución acampanada se conoce comúnmente como la Distribución Normal y será discutida con detalle en el capítulo 7. Lo que quisiéramos recalcar aquí, es que la regla empírica es sumamente útil y proporciona una descripción excelente de la variación para muchos tipos de datos. Note que el Teorema de Tchebysheff es un hecho que puede ser demostrado matemáticamente y sin embargo dejamos el razonamiento matemático para un curso de Cálculo. Aunque los porcentajes mencionados en la regla corresponden a áreas bajo la curva normal, los mismos porcentajes son validos aproximadamente para distribuciones con formas diversas, siempre que tiendan a ser más o menos monticulares. Veamos algunos ejemplos. * La media y varianza de un conjunto de n = 25 observaciones son 75 y 100 respectivamente. Usando la regla empírica para describir esta distribución tendríamos : Sabemos que  = 75 y que  2 =100 . La desviación estándar es  = 10. La distribución de las observaciones esta centrado alrededor de  = 75, y la regla empírica establece que: 69 a)   = 75  10 ; que el 68 % de las observaciones esta entre 65 y 85. b)  2 = 7520; que el 95 % de las observaciones esta entre 55 y 95. c)  3 = 7530; que todas o casi todas las observaciones se encuentran entre 45 y 105. * En la siguiente tabla se especifica la vida útil de una marca de pilas que se utilizan en una misma marca de reloj. Vida Útil (Horas ) fi mi mi x fi ( mi )2 x fi 420 - 439 15 429.5 06,442.5 2’767,053.75 440 - 459 20 449.5 08,990.0 4’041,005.00 460 - 479 25 469.5 11,737.5 5’510,756.25 480 - 499 25 489.5 12,237.5 5’990,256.25 500 - 519 32 509.5 16,304.0 8’306,888.00
  • 71. PROBABILIDAD Y ESTADÍSTICA 520 - 539 30 529.5 15,885.0 8’411,107.50 540 - 559 24 549.5 13,188.0 7’246,806.00 560 - 579 14 569.5 07,913.0 4’540,623.50 580 - 599 7 589.5 04,126.5 2’432,571.75 TOTALES 190 95,945.0 48’806,208.00 Obtener la Media Aritmética, la Varianza y Desviación Estándar 70 (por el método general y el simplificado).  ( mi * fi ) 95,945 X= = = 504.97 n 190 La Varianza en su forma simplificada es : n[ {(mi)2 * fi }] - [ ( mi * fi )]2 s2 = n ( n - 1 ) s2 = ( )( ' , ) , ' , , ' , 190 48806 208 9 273179 500 9 205443 000 35 , 910 - (95,945)² 190(190 -1)   s2 = 67 ' 736 , 500 35 , 910 = 1,886.2852 por lo tanto : s = 43.43 si a continuación obtenemos la varianza en su forma general para datos agrupados tendremos :  [( mi - X )2 * fi] s2 = n - 1 s2 =  (429.5-504.97)² (15)+ (449.5-504.97)² (20)+ +(569.5-504.97)² (14)+ (589.5-504.97)² (7) 190-1
  • 72. PROBABILIDAD Y ESTADÍSTICA 71 s2 = , .  , .     , . 85 435814 61 538 418 360 950 31 189  + 58,297.693+ 50,017.246 189 s2 = 1,909.79 s = 1,909.79 = 43.701 Como podemos observar, no existe gran diferencia entre la desviación estándar obtenida por la forma simplificada y la obtenida por la forma general. * Obtener la Varianza y Desviación Estándar para los siguientes datos: 6, 3, 8, 5, 2 X = 6 3 8 5 2 5 24 5 4 8       . s2 = (6 - 4.8)² + (3 - 4.8)² + (8 - 4.8)² + (5 - 4.8)² + (2 - 4.8)² 5-1 s2 = 1.44 + 3.24 + 10.24 + 0.04 + 7.84 4  22 . 8 4 s2 = 5.7 por lo tanto s = 57 . = 2.387 * Los ingresos anuales de 12 profesores en nuevos pesos son: 72,000 72,000 75,000 81,000 163,000 78,000 81,000 89,000 72,000 90,000 84,000 81,000 Calcular la Varianza y Desviación Estándar. La media aritmética se determino en el capitulo anterior, por lo que tenemos que X = 86,500, por lo tanto la varianza es: s2 =     (72,000 86,500) ² + + (163,000 - 86,500)²  12 1
  • 73. PROBABILIDAD Y ESTADÍSTICA 72 s2 =    210 ' 250 , 000 + + 5,852' 250,000 6 , 803000 ' , 000 11 11  s2 = 6.1845455 x 108 como la desviación estándar se obtiene sacando la raíz cuadrada a la varianza, tenemos entonces que esta es: s = 24,868.746 * Se sabe que la frecuencia de respiración en los humanos puede variar desde 4 respiraciones por minuto hasta 70 ó 75 para una persona que realiza ejercicios extenuantes. Supongamos que las frecuencias de respiración en estado de reposo, para estudiantes universitarios, poseen una distribución de forma monticular con media 12 y desviación estándar 2.3 respiraciones por minuto. ¿Qué fracción de los estudiantes poseen frecuencias en los siguientes intervalos: a).- 9.7 a 14.3 respiraciones por minuto? Aplicando la regla empírica, tenemos que la relación de 9.7 a 14.3 es lo mismo que señalar una desviación estándar alrededor de la media aritmética, ya que 12 + 2.3 nos da el límite superior y 12 - 2.3 nos da el límite inferior, y por tratarse de una relación con distribución monticular, tenemos que en ese intervalo se encuentra el 68 % de los estudiantes o bien la fracción es 0.68 b).- 7.4 a 16.6 respiraciones por minuto? Basándonos en el inciso anterior tenemos que la fracción que se encuentra alrededor de la media a 2 desviaciones estándar es 0.95 o el 95 % de los estudiantes. c).- más de 18.9 o menos de 5.1 respiraciones por minuto? En este inciso vemos que tenemos una relación alrededor de la media de tres desviaciones estándar, por lo que se encuentran todos o casi todos los estudiantes universitarios.
  • 74. PROBABILIDAD Y ESTADÍSTICA * La siguiente tabla muestra el concentrado de los resultados de 73 25 estudiantes universitarios: 2 x fi Num C. Int. de Clase Frecuencia mi mi x fi mi 1 1.8 - 2.1 4 1.95 07.80 15.210 2 2.2 - 2.5 6 2.35 14.10 33.135 3 2.6 - 2.9 8 2.75 22.00 60.500 4 3.0 - 3.3 4 3.15 12.60 39.690 5 3.4 - 3.7 3 3.55 10.65 37.808 Totales 25 67.15 186.343 En base al cuadro estadístico, calcule la media aritmética, la desviación estándar y la varianza X=  ( i  i 6 7 . 1 5   . m f ) n 2 5 2 6 8 6 s2 = n (m)² f  -  m f ²   25(186.343) n(n - 1) - (67.15)² 25(25 - 1) i  i i  i  s2 = 4,658.575 - 4,509.125 600 = 149.45 600 s2 = 0.25 ; por lo tanto, la desviación estándar es : s = 0.5
  • 75. PROBABILIDAD Y ESTADÍSTICA 74 EJERCICIOS PROPUESTOS 1.- ¿Qué es una medida de dispersión? 2.- Describa el proceso para la obtención de la Varianza. 3.- ¿Qué es el Rango? 4.- ¿Qué diferencia hay entre la forma simplificada para la obtención de la Varianza y la forma general? 5.- Defina la desviación media. 6.- Los siguientes datos representan el tiempo de vida en años de una muestra aleatoria de 30 motores eléctricos similares. 2.0 3.0 0.3 3.3 1.3 0.4 0.2 6.0 5.5 6.5 0.2 2.3 1.5 4.0 5.9 1.8 4.7 0.7 4.6 0.3 1.5 0.5 2.5 5.0 1.0 6.0 5.6 6.0 1.2 0.2 Calcular la Desviación Media , la Varianza y la Desviación Estándar. 7.- El cociente de inteligencia (CI) expresa la inteligencia como la razón de la edad mental a la edad cronológica multiplicada por 100. Así, el promedio cuando la edad mental es igual a la edad cronológica es 100. Para los siguientes CI. 100 103 99 101 100 120 109 82 101 112 95 118 118 114 113 89 92 137 94 130 87 93 111 96 93 101 98 96 84 86 89 90
  • 76. PROBABILIDAD Y ESTADÍSTICA a) Construya un histograma de frecuencias relativas. b) Calcule X , s2 y s. c) Encuentre el número de puntuaciones en los intervalos X  s; X  2s y X  3s. Compare las proporciones de observaciones en estos intervalos con las especificadas por el teorema de Tchebysheff y la regla empírica. 75
  • 77. PROBABILIDAD Y ESTADÍSTICA En este capítulo veremos lo que es la Probabilidad, o sea, la relación que existe entre la muestra y el conjunto original de datos, por eso para poder tomar decisiones se necesita tener conocimientos de la Probabilidad. En general, la Estadística entra al método científico a través de la experimentación o de la observación. Cualquier investigación es únicamente un medio para lograr un fin determinado. Es un dispositivo para someter a prueba una hipótesis establecida a partir de la cual desea hacerse una conclusión. La mayor parte de los enunciados que resultan de investigaciones son únicamente inferencias. Son de carácter incierto. La cuantificación de esa incertidumbre por el uso de la Teoría de Probabilidades es una de las contribuciones más importantes de la Estadística. Probabilidad es una medida de la frecuencia de ocurrencia de un evento casual. Una definición clara y simple de Probabilidad (definición clásica), es: “Si un evento puede ocurrir de N maneras mutuamente exclusivas e igualmente posibles, y si n de ellas tienen una característica E , entonces la Probabilidad de ocurrencia de E es la fracción 76 n N . Esto se acostumbra indicarlo o representarlo con P(E) = n N .” Para el estudio de la Probabilidad surge como necesidad el estudio de la Teoría de conjuntos, por lo cual veremos a continuación su definición y sus operaciones básicas.
  • 78. PROBABILIDAD Y ESTADÍSTICA 77 CONJUNTOS Y SUS OPERACIONES El estudio de la Probabilidad se simplifica utilizando la Teoría de Conjuntos, por lo tanto, analizaremos algunas ideas básicas de esta teoría. La Teoría de Conjuntos fue desarrollada por Georg Cantor entre 1874 y 1895, es un instrumento básico que se utiliza en las distintas ramas de la Matemática, como en la Teoría de Probabilidad, el Cálculo Infinitesimal, Geometría, etc. Un Conjunto es un grupo de objetos dentro de un todo definido y bien diferenciado; por ejemplo: * Un grupo de estudiantes de la materia de Biología. * Un juego de cartas. * Las cuentas de un collar. A continuación definiremos algunas de las operaciones y símbolos que se utilizan en la Teoría de Conjuntos. A los conjuntos los representamos con mayúsculas y a sus elementos con minúsculas. * Conjunto Universo o Universal ( U ): Es el conjunto que contiene a todos los elementos. * Conjunto Vacío (  ): Es un conjunto que no contiene a ningún elemento. * Pertenencia (  ): Indica que un elemento pertenece a un conjunto. * No Pertenencia ( ): Indica que un elemento no pertenece a un conjunto determinado. * Subconjunto (  ): Se dice que un conjunto A es subconjunto de B, cuando todos los elementos de A pertenecen a B.
  • 79. PROBABILIDAD Y ESTADÍSTICA * Unión (  ): La unión de dos conjunto A y B, es el conjunto de 78 elementos que están en A, en B ó en ambos. A  B = { x / x  A ó x  B } * Intersección ( ): La intersección de dos conjuntos A y B, es el conjunto de elemento que están en A y B simultáneamente. A  B = { x / x  A y x  B } * Complemento ( A', ~A, Ac ) : El conjunto A' , recibe el nombre de complemento de A debido a que contiene a todos los elementos del universo que no están en A. A' = { x / x  A } Para la comprensión de los conjuntos se recomienda utilizar los diagramas de Venn, que son la representación gráfica de los conjuntos y sus operaciones. U U U A U B A  B Ac * Sea A = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t }; B = { a, e, i, o, u } ; C = { b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t } y el conjunto Universo el abecedario. Realizar las siguientes operaciones entre conjuntos: a) A U B ; b) A  ( B U C ) c) ( A  B ) U ( B  C ) a) A U B = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t, u }
  • 80. PROBABILIDAD Y ESTADÍSTICA b) A  ( B U C ) = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t } = A c) ( A  B ) U ( B  C ) = { a, e, i, o } * Sea U el conjunto de todos los valores posibles que pueden caer al lanzar dos dados normales, defina los siguientes conjuntos : el conjunto A contiene a todos los elementos en que la primera cara es mayor que 3 pero menor que 6, A = { ( x, y ) / 3 < x < 6 ; 0 < y < 7 } ; el conjunto B contiene a todos los elementos en que la suma de las caras es mayor que 5 pero menor que 8, B = { ( x, y ) / 5 < x + y < 8 }  79 Sea U = (1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) (3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) (5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) (6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6)     entonces, A =       (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) (5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6)   y B = (1,5) ; (1,6) ; (2,4) (2,5) ; (3,3) ; (3,4) (4,2) ; (4,3) ; (5,1) (5,2) ; (6,1)          ¿QUE ES ESPACIO MUESTRAL? El Espacio Muestral se define como el conjunto de todos los resultados posibles de un experimento E, usualmente se designa a este conjunto con la letra S. Un Espacio Muestral se puede representar por medio de un diagrama de Venn, una línea recta, un producto cartesiano, etc. Producto Cartesiano : Es el conjunto de todos los pares ordenados de dos conjuntos A y B. A X B = { (x , y) / x  A , y  B }
  • 81. PROBABILIDAD Y ESTADÍSTICA Debemos tener cuidado de respetar el orden de las parejas ordenadas, ya que ( a, b ) es diferente de ( b, a ). Lo anterior puede describirse con la siguiente gráfica: 80 A M (a,b) c N (b,a) b M M  N a N B a b c El número de elementos del espacio muestral1 del Producto Cartesiano es igual al producto del número de elementos de A por el de B. Ejemplo: En la gráfica anterior se tiene un espacio muestral de 9 elementos, el cual se obtuvo de n(A) x n(B). * Dados los siguientes conjuntos: U = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } A = { 1,5,7,13,15,18,23 } B = { 7,15,23,29,37,48,63 } C = { 7,8 } Obtener: a) A U B ; b) A' U A ; c) A  B ; d) B' U A ; e) A X C a).- A U B = { 1,5,7,13,15,18,23,29,37,48,63 } b).- A' = { 29,37,48,63,71,96 } A' U A = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } = U c).- A  B = { 7,15,23 } 1 Dentro de los espacios muestrales cuando tenemos un conjunto de varios elementos, el orden de estos no se toma en cuenta, esto es, {a,b} y {b,a} son conjuntos equivalentes.
  • 82. PROBABILIDAD Y ESTADÍSTICA 81 d).- B' = { 1,5,13,18,71,96 } B' U A = { 1,5,13,15,23,71,96 } e).- A X C = { (1,7);(1,8);(5,7);(5,8);(7,7);(7,8);(13,7);(13,8); (15,7);(15,8);(18,7);(18,8);(23,7);(23,8) } SUCESOS SIMPLES Y COMPUESTOS En un conjunto de resultados posibles de un experimento E. Los sucesos pueden ser Simples o Compuestos. Consideremos el experimento de lanzar un dado y observar que cara cae hacia arriba, la variable X tiene los resultados posibles X1, X2 ,* * *, X6, cada uno de estos resultados se denomina Suceso Elemental Simple. En otras palabras, un suceso simple es aquel que no se puede descomponer en otros sucesos simples y se representa con Ei . Un suceso que se puede descomponer en dos o más sucesos simples se llama Suceso Compuesto, por ejemplo, en el lanzamiento de un dado, la ocurrencia de X  3, es un Suceso Compuesto, ya que tendríamos que el suceso E estaría constituido por todas las caras de el dado de valor mayor o igual a 3, quedando de la siguiente manera : E = { 3,4,5,6 }. Una vez definidos los sucesos, se expresarán ahora en términos de la Teoría de Conjuntos. El conjunto Universo representará al espacio muestral, mientras que los conjuntos que lo constituyan serán los sucesos compuestos y sus elementos los sucesos simples.
  • 83. PROBABILIDAD Y ESTADÍSTICA 82 PROBABILIDAD La Probabilidad tiene dos enfoques, llamados enfoques de la teoría de Probabilidades, los cuales son: El enfoque objetivo de la probabilidad y el enfoque subjetivo de la probabilidad. En este cuaderno definiremos únicamente el concepto de probabilidad y dejaremos el estudio de estos enfoques a los cursos de Estadística del Nivel Superior. El famoso matemático Jacobo Bernoulli señala que cuando no hay fundamentos para preferir uno de los posibles resultados o sucesos a cualquier otro, todos deben de considerarse que tienen la misma probabilidad de ocurrir. El famoso matemático francés P. S. Laplace estableció este concepto en su libro “A Philosophical Essay on Probabilities” de esta manera: “La teoría de la probabilidad consiste en reducir todos los elementos de la misma clase a cierto número de casos iguales o igualmente posibles, es decir, que nosotros debemos estar igualmente indecisos ante su existencia para determinar la cantidad de casos favorables para el suceso cuya probabilidad se busca”. La relación de este número con el de todos los casos posibles es la medida de la probabilidad, que, es por tanto sencillamente una fracción cuyo numerador es el número de casos favorables y el denominador es el número de todos los casos posibles (definición de probabilidad clásica). Por otra parte, puesto que los cálculos de la probabilidad no dependen de la experiencia, esto permite calcular las probabilidades sin
  • 84. PROBABILIDAD Y ESTADÍSTICA realizar una gran cantidad de ensayos. Este tipo de cálculos se denomina algunas veces a priori. En base a lo anterior podemos especificar algunos puntos 83 referentes a la teoría de probabilidades, los cuales son: 1.- Se asigna un número P(E) al suceso y lo da cuando la cantidad de ensayos es grande, M/n y P(E) son iguales. 2.- En esta relación se define la probabilidad del suceso E como el límite de M/n cuando n tiende a infinito. Matemáticamente este enfoque se expresa así: P(E) = l í m M n   n Veamos algunos ejemplos de cálculo de probabilidades. * ¿Cuál es la probabilidad de que al lanzar dos dados legales, a) la suma de las caras sea par? ; b) las caras sean diferentes? ; c) las caras sean iguales? S = (1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) (3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) (5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) (6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6)           a).- P(A) = M n = 18 36 = 1 2