1. ÍNDICE TEMÁTICO
CAP. 1.- ¿ QUE ES ESTADÍSTICA ? 3
Introducción ; Estadística ; Usos y Abusos de la
Estadística; Introducción a los Términos Básicos;
Relación entre Probabilidad y Estadística; Examen
de Autoevaluación.
CAP. 2.- ELABORACIÓN DE CUADROS ESTADÍSTICOS 11
Introducción ; Toma de Datos ; Técnicas Estadísticas;
Frecuencias ; Concepto de Variable ; Intervalos ; Cua-dro
estadístico ; Ejercicios Propuestos.
CAP. 3.- GRÁFICAS ESTADÍSTICAS 30
Introducción ; Representaciones gráficas ; Histograma
ó diagrama de barras ; Polígono de frecuencias ; Diagra-ma
de Pastel ; Ojiva o curva de frecuencias ; Curva de
Lorenz ; Curvas de frecuencias ; Curva de la Distribución
Normal ; Examen de Autoevaluación
CAP. 4.- MEDIDAS DE TENDENCIA CENTRAL 42
La Media Aritmética; La Mediana; La Moda;
Comparación de la Media, la Mediana y la Moda;
Media Geométrica; Media Armónica; Media Ar-mónica
para datos agrupados; Ejercicios Propuestos.
CAP. 5.- MEDIDAS DE DISPERSIÓN 60
Medidas de Dispersión; Desviación estándar;
Varianza; Cálculo de la Media y Desviación
Estándar para Datos Agrupados; Interpretación
practica de la desviación estándar; Ejercicios
Propuestos.
CAP. 6.- PROBABILIDAD 76
Conjuntos y sus operaciones; ¿ Qué es Espacio
Muestral ?; Sucesos Simples y Compuestos;
Probabilidad; Axiomas de la Probabilidad;
Análisis Combinatorio; Probabilidad Condicional;
Independencia Probabilistica; Leyes de Probabili-dad;
Ejercicios Propuestos.
2. PROBABILIDAD Y ESTADÍSTICA
1
CAP. 7.- DISTRIBUCIONES DE PROBABILIDAD 98
Distribución Binomial; Distribución de Poisson;
Distribución Normal; Distribución t de Student;
Ejercicos Propuestos.
APÉNDICE : TABLAS DE PROBABILIDADES
Tabla 1 Distribución Normal 115
Tabla 2 Distribución t de Student 116
Tabla 3 Distribución Binomial 117
Tabla 4 Valores de e- x 119
BIBLIOGRAFÍA 120
3. PROBABILIDAD Y ESTADÍSTICA
2
PRESENTACIÓN
Tomando en consideración que los estudiantes deben contar con
los elementos necesarios para un curso, ya que esto les facilitaría el proceso
del aprendizaje, nos dimos a la tarea de elaborar los apuntes del curso de
PROBABILIDAD Y ESTADÍSTICA en el Nivel Medio Superior, mismos
que se elaboraron tomando en consideración la bibliografía actualizada
existente en está área. El contenido de este libro se determino en base a los
programas que rigen en el Nivel Medio Superior en la Universidad de Colima.
En este cuaderno de apuntes se ha tratado de evitar al máximo las
demostraciones áridas, que en muchas ocasiones en lugar de aclarar,
obscurecen más el panorama del lector.
El objetivo del cuaderno de apuntes (La superación académica),
es ambicioso y sería presuntuoso afirmar que materiales como el presente lo
satisfacen. Con este material se pretende que al final el alumno tenga las
herramientas necesarias para concentrar y representar información, y al
mismo tiempo tenga las bases necesarias para posteriores cursos en el Nivel
Superior.
Esperamos que este cuaderno sea de utilidad tanto para los
alumnos como para los maestros, esperando de estos últimos sus comentarios
al utilizarlo.
LOS AUTORES
4. PROBABILIDAD Y ESTADÍSTICA
3
INTRODUCCIÓN
Para tratar de predecir el resultado de una elección nacional, los
encuestadores entrevistan a un número predeterminado de personas en todo el
país y registran sus preferencias. Sobre la base de esta información se
construye una predicción. Problemas similares se encuentran en
investigaciones de mercado, en sociología, en la industria, etc.
La producción de una planta química depende de muchos
factores. Observando estos factores y la producción durante cierto periodo de
tiempo, podemos construir una ecuación de predicción que relacione a la
producción con los factores observados. Si usamos esas ecuaciones para
predecir la producción, la predicción raramente será igual a la verdadera
producción, esto es, la predicción casi siempre tendrá algún error.
Encontramos problemas similares en los campos de la educación, la
sociología, la psicología, las ciencias físicas y muchas otras ciencias. A estos
predictores se les llama estadísticos de prueba, que son la base de toda
investigación y desarrollo científico. Además de la predicción, el estadístico
también sirve para tomar decisiones acerca de poblaciones a partir de
resultados obtenidos de investigaciones desarrolladas a muestras o pequeñas
partes de la población.
La Estadística es una ciencia que es de gran utilidad y en la
actualidad nos es mucho más difícil mencionar algún lugar en el que la
Estadística no se aplique que uno en el que tenga una gran importancia. Por
ejemplo, las Universidades podrían desear predecir el rendimiento promedio
de los estudiantes universitarios, para lo cual sería necesario utilizar la
5. PROBABILIDAD Y ESTADÍSTICA
Estadística. Podría desearse comparar dos técnicas de enseñanza físicamente
distintas; podríamos considerar la inspección de artículos comprados en una
fabrica en donde la inspección podría consistir en seleccionar diez artículos
de cada lote y registrar el número de defectuosos, en donde, la decisión de
aceptar o rechazar el lote, podría basarse en el número de defectuosos
encontrados.
Los ejemplos anteriores son una muestra de lo importante que
resulta ser el estudio de la Estadística, por lo que en el presente curso se
presenta una definición de Estadística y se da una relación que existe con la
Probabilidad para poder hacer toma de decisiones respecto de investigaciones
desarrolladas.
4
ESTADÍSTICA
Es un lenguaje universal de la ciencia tanto en sus ramas físicas
como sociales, la comunicación y el uso de la Estadística nos permiten
comunicar más exactamente los descubrimientos en las investigaciones. La
Estadística es también un instrumento que utilizado con cuidado y precisión
nos permite describir nuestros resultados y adoptar decisiones respecto a lo
que nos dicen.
Aprender Estadística es algo simple y se llega a su comprensión total
por medio de ejercicios; en la Estadística intervienen números y letras como
parte de su lenguaje, además, la Estadística posee significados diversos para
personas de formaciones e intereses diversos. El campo de la Estadística se
divide ampliamente en dos ramas, que son: La Estadística descriptiva y la
Estadística Inferencial.
6. PROBABILIDAD Y ESTADÍSTICA
La Estadística Descriptiva está dedicada a la recolección,
descripción y presentación de datos numéricos. La Estadística Inferencial se
refiere a las técnicas de interpretar los valores que se obtienen a partir de las
técnicas descriptivas, además de las técnicas de tomar decisiones sobre la
base de los datos obtenidos.
Estadística es la ciencia de recolectar, clasificar, describir e
5
interpretar datos numéricos.
USOS Y ABUSOS DE LA ESTADÍSTICA
Las aplicaciones de la Estadística son ilimitadas, pues sería más
difícil nombrar un campo en donde no se utiliza la Estadística, que señalar
uno en donde la Estadística desempeñe un papel importante. Ejemplos sobre
la utilización de la Estadística:
1.- En la Educación se usa mucho para describir resultados de pruebas.
2.- En la ciencia los datos obtenidos en experimentos deben recogerse y
analizarse estadísticamente para tomar una decisión.
3.- Los gobiernos utilizan la Estadística para la recolección de información en
sus diversos campos.
Los abusos de la Estadística suelen ser muy pintorescos y a veces
ocasionan muchas dificultades, a numerosas personas les preocupa la lejanía
de las descripciones estadísticas y a otras les preocupa toda la información
(dependiendo de sus necesidades) debido a que creen que es falsa, y sin
embargo, la mayoría de las mentiras estadísticas se deben a:
1.- La utilización de valores estadísticos inadecuados.
2.- Utilización de enunciados abiertos y no explícitos.
7. PROBABILIDAD Y ESTADÍSTICA
6
3.- Utilización de datos derivados de un diseño experimental defectuoso.
4.- Una mala presentación de resultados.
Todos estos factores comunes acarrean una sola consecuencia, que
es la mala concepción de la información por parte del investigador.
INTRODUCCIÓN A LOS TÉRMINOS BÁSICOS
Para estudiar Estadística debemos ser capaces de hablar su lenguaje,
por lo que definiremos primeramente sus términos básicos:
1.- POBLACIÓN : Colección completa de individuos, objetos o medidas que
tienen una característica en común, el concepto de Población es la idea
fundamental más importante de la Estadística. La Población debe definirse
cuidadosamente en cada caso a fin de poder determinar la preferencia de ella.
2.- MUESTRA : Es un subconjunto de la población, es decir, una Muestra se
compone de algunos de los individuos, objetos o medidas que componen la
población.
3.- VARIABLE DE RESPUESTA : Es una característica individual de cada
elemento de la población o de una muestra; por ejemplo: la edad de un
alumno al ingresar a la Universidad, el color del pelo, su estatura, su peso,
etc., son Variables de Respuesta y el valor de la variable será la medida de la
característica que interese.
4.- PIEZA DE DATOS : El valor de la variable de respuesta asociado con
cada elemento, será la Pieza de Datos, por ejemplo: el coche es verde, Jorge
ingresó a la Universidad a la edad de 23 años. Si nos damos cuenta estamos
asignando a cada elemento su variable o característica.
8. PROBABILIDAD Y ESTADÍSTICA
5.- DATOS : Comprende el conjunto de valores asignados a la variable de
respuesta para cada elemento perteneciente a la muestra.
6.- EXPERIMENTO : Es una actividad planificada cuyos resultados nos
producen un conjunto de datos.
7.- PARÁMETRO : Es una característica medida de una población completa,
por ejemplo: la proporción de alumnos de más de 21 años que ingresan a la
Universidad. En Estadística se asignan símbolos del alfabeto griego para
designar un Parámetro.
8.- ESTADÍSTICO : Es la medida de una característica relativa a la muestra,
al valor promedio de los datos y la imagen de éstos; la mayoría de los
Estadísticos muestrales se encuentran por medio de fórmulas y suelen
asignárseles símbolos del alfabeto latino.
Fundamentalmente existen dos clases de datos, los que presentan
información cualitativa y los datos consistentes en información cuantitativa.
Los que están dentro de los cualitativos se llaman Datos de Atributo, mientras
que los cuantitativos se dividen en Discretos y Continuos.
7
DATOS
CUALITATIVOS CUANTITATIVOS
ATRIBUTO DISCRETOS CONTINUOS
9. PROBABILIDAD Y ESTADÍSTICA
Los Datos de Atributo o Cualitativos son los que agrupan a una
muestra en características semejantes, pero no tienen medidas numéricas.
Los Datos Cuantitativos se dividen en:
Discretos : Son los datos que resultan de un conteo o una simple observación.
Continuos : Son los datos que se obtienen cuando la medida es un proceso
infinito.
8
RELACIÓN ENTRE PROBABILIDAD Y
ESTADÍSTICA
La Probabilidad y Estadística son dos campos distintos aunque
relacionados entre sí, en las matemáticas, se dice a veces que la Probabilidad
es el vehículo de la Estadística es decir, de no ser por las leyes de
Probabilidad, no existirían las teorías estadísticas, así que investigaremos la
diferencia entre estas dos ramas del árbol matemático. Observaremos un
ejemplo o modelo de dos cajas:
10 FICHAS
5 ROJAS
PROBABILIDAD 3 VERDES ESTADÍSTICA ? ? ? ?
2 AMARILLAS
En la caja de Probabilidad hay 10 fichas ( 5 Rojas, 3 Verdes y 2
Amarillas ), en el terreno de la Probabilidad se intenta responder preguntas;
por ejemplo, ¿ Cuál es la probabilidad de que si se saca una ficha de la caja,
sea Roja ?, ¿ Cuál es la probabilidad de la ocurrencia de un evento ?, por otra
10. PROBABILIDAD Y ESTADÍSTICA
parte, dentro de la Estadística necesitaremos extraer una muestra de ella para
hacernos conjeturas sobre lo que en ella existe. Por lo que se podría decir
como diferencia bien marcada entre una y otra, lo siguiente: " La Probabilidad
estudia la oportunidad de que algo ocurra, cuando se conocen las
posibilidades; mientras que la Estadística pregunta, cuales son esas
posibilidades a partir de los resultados de una muestra ".
9
EXAMEN DE AUTOEVALUACIÓN
1.- ¿Qué es la Estadística?
2.- Dé tres ejemplos en donde se utilice la Estadística.
3.- Explique los factores que ocasionan un mal uso de la Estadística.
4.- Mencione los ocho términos básicos de la Estadística.
5.- Defina los siguientes términos en base a lo que usted comprenda:
Población, Muestra, Pieza de Datos, Parámetro.
6.- Mencione como se clasifican los datos y defínalos.
7.- ¿ Qué relación existe entre la Probabilidad y la Estadística?.
8.- Suponga que desea obtener una estimación del consumo de gasolina
(Km por litro) del FORD COUGAR. Describa la población que sería de
interés para usted, de la cual tendría que seleccionar la muestra.
11. PROBABILIDAD Y ESTADÍSTICA
9.- Un investigador médico desea estimar el tiempo de supervivencia de un
paciente después de la aparición de un tipo particular de cáncer y después de
un régimen particular de radioterapia. Identifique la población de interés para
el investigador médico. ¿ Puede percibir algún problema en el muestreo de
esta población ?
10.- Suponga que usted es un candidato para la legislatura y que desea
evaluar la opinión de los votantes respecto a sus posibilidades de ganar.
Identifique la población de interés para usted y de la cual desearía seleccionar
su muestra.
10
12. PROBABILIDAD Y ESTADÍSTICA
11
INTRODUCCIÓN
Como veremos más adelante, el análisis estadístico de datos
requiere numerosas operaciones aritméticas, y sería muy tedioso describir
todas estas operaciones con palabras. La solución de esta dificultad es
expresar las operaciones en términos de una o más fórmulas. Entonces, para
analizar un conjunto dado de datos muéstrales se sustituirían las mediciones
muéstrales en el conjunto apropiado de fórmulas.
Una de las operaciones mas comunes en el análisis estadístico de
datos es el proceso de sumas (adición). Por lo tanto necesitaremos un símbolo
para indicarle que sume las mediciones muéstrales, o que sume un conjunto
de números calculados a partir de las mediciones muéstrales. Este símbolo,
llamado sumatoria, puede ser muy familiar para algunos y completamente
nuevo para otros ( ).
A continuación presentaremos algunos conceptos necesarios para
la elaboración de cuadros estadísticos, conceptos como frecuencia, frecuencia
relativa, frecuencia acumulada, etc.
TOMA DE DATOS
Si tuviéramos la población frente a nosotros, ¿ cómo podríamos
describir este subconjunto grande de mediciones ?. Muchos textos se han
dedicado a los métodos de la estadística descriptiva, es decir, a los métodos
para describir conjuntos de datos numéricos.
13. PROBABILIDAD Y ESTADÍSTICA
Esencialmente estos métodos se pueden clasificar como métodos
gráficos y métodos numéricos. En este texto hablaremos de los dos métodos
para describir información, y comenzaremos con el método numérico, el cual
se basa esencialmente en la recolección de datos para presentarlos en un
cuadro estadístico, cuadro en el que nosotros podremos leer la información
que se encontraba dispersa en la muestra o población. En la actualidad es muy
común encontrarnos con cuadros estadísticos, y lo más general es la
presentación de información en los distintos medios de comunicación de las
posiciones que ocupan los distintos equipos en los diferentes deportes.
12
TÉCNICAS ESTADÍSTICAS
Las técnicas estadísticas, los gráficos, las distribuciones de
frecuencias, promedios, etc., son términos de indudable valor práctico para la
descripción de los datos. Sin embargo la mayor utilidad estadística se
encuentra en el análisis de los datos numéricos.
El análisis de los datos numéricos por técnicas estadísticas es
una expresión abstracta. La característica esencial común a todas las técnicas
es el elemento de inferencia estadística, que se define como un proceso de
inducción lógica, que partiendo de los datos establece un juicio sobre todo el
conjunto, obteniéndose una medida de la incertidumbre para la consecuencia
que se infiere. Por ejemplo; consideremos el problema de estimar la
proporción de votos a favor de una determinada propuesta o candidato, se
toma una muestra de los votantes y se calcula la proporción de los que lo
hacen a favor de un sólo candidato, suponiendo que el 60% de la muestra
14. PROBABILIDAD Y ESTADÍSTICA
vota a favor de un candidato, entonces, se infiere que el 60% de todos los
votantes están a favor de ese candidato.
En otras palabras, hay un grado de incertidumbre vinculado a la
conclusión cuya medición se obtiene aplicando las técnicas estadísticas. La
Estadística reúne un conjunto de procedimientos para describir y analizar los
datos de diversas disciplinas, ésta debe ser neutral y por ello puede emplearse
la misma técnica de muestreo en economía, finanzas, educación, ingeniería,
y otras. Sin embargo, la Estadística ha elaborado técnicas peculiares para
cada campo de aplicación.
Por lo que podemos concluir que las TÉCNICAS-ESTADÍSTICAS
se basan en: la recolección de datos, los gráficos, las
frecuencias, los promedios, etc. En los negocios la Estadística ha
desarrollado técnicas como las de: Índices de Precios, Sucesiones, Series de
Tiempo, y otras. En las ciencias biológicas alcanzan el más alto nivel e
interés las técnicas para el diseño de experimentos. Mientras que en la
Industria se desarrollan técnicas para el control de calidad.
Así como se enunciaron anteriormente algunas ramas en las que
tiene aplicación la Estadística y en las cuales se han desarrollado técnicas
peculiares para cada una, podríamos mencionar algunas otras, pero con la
práctica nos daremos cuenta de cómo es el desarrollo en ellas.
13
FRECUENCIAS
Antes de comenzar con la distribución de frecuencias, será
conveniente definir el vocablo Frecuencia, ya que se ha mencionado con
15. PROBABILIDAD Y ESTADÍSTICA
anterioridad, sin embargo, no ha sido definido. Así mismo se hará una
clasificación de los tipos de frecuencias utilizados en la Estadística.
FRECUENCIA: Es el número total de repeticiones de un
elemento determinado, en una muestra o población. Existen varios tipos de
frecuencias a saber: Frecuencia de clase, Frecuencia relativa, Frecuencia
acumulada, Frecuencia relativa acumulada, etc. Para los objetivos que se
persiguen en este curso, definiremos las frecuencias de datos agrupados.
FRECUENCIA RELATIVA: Es el tanto por ciento o porcentaje
correspondiente a cada intervalo de clase. La manera de obtenerla es
dividiendo el número de elementos de esa clase entre el número total de
elementos de la muestra o población. La frecuencia relativa tiene gran
utilidad, ya que puede especificarnos el porcentaje de ocurrencia de un evento
dentro de una muestra, la elaboración de gráficas estadísticas, etc.. Por
ejemplo: la distribución de presupuestos por áreas, el porcentaje de
producción de ciertos productos, la distribución por edades de ciertas
poblaciones, etc.
FRECUENCIA ACUMULADA: Esta frecuencia se obtiene al sumar a
la frecuencia de cada clase, las frecuencias de las clases anteriores a ella. Las
frecuencias de las demás clases serán la suma sucesiva de las frecuencias de
las clases anteriores, de tal forma que en la última clase se tendrá una
frecuencia igual al tamaño de la muestra o población.
FRECUENCIA RELATIVA ACUMULADA: Se sigue el mismo
procedimiento que en la frecuencia acumulada, sólo que en este caso se toma
como base la frecuencia relativa, expresándose como porcentaje.
14
16. PROBABILIDAD Y ESTADÍSTICA
15
CONCEPTO DE VARIABLE
Consideremos la desigualdad X + 2 > 5, los valores de X que
satisfacen dicha desigualdad son todos los valores mayores que 3, dado que:
X + 2 > 5
X > 5 - 2
X > 3
como X > 3, entonces X puede ser: 4, 5, 6, ...
X se llama variable porque toma distintos valores posibles
dentro de la desigualdad ( por lo que se dice que una variable es aquella que
puede tomar distintos posibles valores dentro de un suceso ).
Desde los tiempos más remotos dos tendencias opuestas, a veces
colaborando la una con la otra, han gobernado todo el desarrollo de la
matemática. Estas dos son el dominio de lo continuo y lo discreto. Una de las
grandes tareas de la matemática actual consiste en armonizar lo continuo y lo
discreto para incluirlos en una matemática única y para iluminar la oscuridad
de ambas.
Siguiendo con el concepto de variable, veremos que una variable
discreta es una regla bien definida para asignar valores numéricos a todos los
resultados posibles de un experimento. Lo anterior significa que una variable
aleatoria discreta es aquella que se asocia a todo experimento siempre y
cuando el conteo sea finito o infinito numerable y con datos numéricos
enteros.
Una variable continua es aquella cuyos valores posibles no tienen
interrupción, es decir, son aquellos valores que podemos obtener no mediante
un conteo o simple observación, si no mediante observaciones más concretas
17. PROBABILIDAD Y ESTADÍSTICA
y sus valores son no numerables (Los Reales). Veamos algunos ejemplos
sobre lo anterior:
16
a) Los posibles resultados de lanzar un dado normal.
S = { 1, 2, 3, 4, 5, 6 }
Es discreto por poderse obtener por un conteo.
b) Lanzar una moneda normal hasta que caiga sol.
S = { 1, 2, 3, 4, ... , n }
Es discreto por ser un proceso infinito numerable.
c) La cantidad de descargue de un Río hacia el Océano.
Es continua, ya que es imposible determinarlo por un conteo o por
una simple observación, y se requiere de un método más concreto para
estimarlo.
INTERVALOS
Es importante que repasemos un concepto ya manejado en
matemáticas, como es el de INTERVALO, ya que con el será necesario
trabajar en la formación de cuadros estadísticos, en donde hablaremos de
intervalos de clases, por lo que definimos lo siguiente:
“ Un intervalo de clase es aquel que contiene a una cierta
cantidad de elementos de la muestra o población ”, por ejemplo, el número de
alumnos que obtienen una calificación entre 5 y 8, en este ejemplo, el
intervalo es [5, 8], y como frecuencia contendrá a todos los alumnos que
18. PROBABILIDAD Y ESTADÍSTICA
hayan obtenido esas calificaciones, el 5 recibe el nombre de límite inferior
del intervalo y el 8 el de límite superior del intervalo. En la construcción de
cuadros estadísticos será necesario este concepto en la formación de clases.
17
CUADRO ESTADÍSTICO
El cuadro estadístico más usual es aquél en el que se representa
el número total de clases o de variables, con el número de elementos
correspondientes a cada uno, llamándose a esto frecuencia, así mismo,
veremos cuadros estadísticos en los que tendremos frecuencias acumuladas
(Suma de los elementos anteriores a la clase), frecuencia relativa (porcentaje
de cada clase con respecto a la muestra), frecuencia relativa acumulada,
marcas de clases, desviaciones medias, mediana, etc.
A continuación se presenta una forma de distribución en un
cuadro estadístico:
CLASE o
VARIABLE
FRECUENCIA FRECUENCIA
ACUMULADA
FRECUENCIA
RELATIVA
FREC. REL.
ACUMULADA
30 - 36 6 6 6/14 6/14
37 - 43 5 11 5/14 11/14
44 - 50 3 14 3/14 14/14
TOTAL 14 14/14
A continuación se muestra un conjunto de datos, con los que
vamos a elaborar un cuadro estadístico:
30 42 50 73 60 63
38 27 67 83 70 63
52 83 97 49 83 73
30 35 63 59 84 75
84 90 80 95 85 68
19. PROBABILIDAD Y ESTADÍSTICA
Para formar un cuadro estadístico es necesario primeramente
ordenar todos los elementos de la muestra en forma ascendente, para después
agruparlos en clases.
18
27 42 60 67 75 84
30 49 60 68 80 85
30 50 63 70 83 90
35 52 63 73 83 95
38 59 63 73 83 97
Para elegir el número de clases se deben observar ciertos
criterios; se debe evitar que queden demasiados elementos en una clase, así
como también clases sin elementos. Una clase con demasiados elementos
oculta información que en ocasiones es indispensable para el estadístico y una
clase vacía ocasiona problemas a la hora de calcular las medidas estadísticas.
Se recomienda un mínimo de 5 clases y un máximo de 20 clases,
dependiendo del número de elementos de la muestra y de lo disperso que se
encuentren. Es recomendable tomar entre 5 y 9 clases cuando la muestra
cuenta con menos de 50 elementos y entre 10 y 20 cuando tenga más de 50
elementos.
Para obtener el número de clases existen dos formas, una
conocida como forma empírica y otra de fórmula general. A continuación
enunciaremos la forma empírica:
Número de Clases =
Elementomáximo - Elementomínimo 1
Intervalode Clase
20. PROBABILIDAD Y ESTADÍSTICA
En este caso, dependiendo del número de elementos con que
cuente la muestra, se elige un Intervalo de clase y se realiza la operación
anterior para obtener el número de clases que se deben de colocar en el cuadro
estadístico, pero pudiese en lugar de elegir el Intervalo de clase, escogerse el
número de clases que se desean, entonces se aplicaría la siguiente fórmula:
19
Intervalo de Clase =
Elementomáximo - Elementomínimo 1
Número de Clases
Ahora bien, si no se desea de esta manera se utiliza la fórmula
general, la cual se aplicará de la siguiente manera:
Si se tienen menos de 50 elementos en la muestra, el número de
clases se obtiene con la siguiente fórmula:
No. de Clases = 1 + 3.3 log N
pero si se tienen más de 50 elementos, entonces se utiliza:
No. de Clases = 3 + 3.3 log N
Continuando con el ejemplo anterior, procedemos a calcular el
número de clases en forma empírica para elaborar el cuadro estadístico.
Como el número de elementos es 30, escogemos un número en
forma aleatoria para el Intervalo de Clase o Amplitud de Clase de 9. Ahora
bien, aplicando la fórmula presentada para el número de clases, tenemos:
No. de clases =
Elem. Má x. - Elem. Mín. + 1
Int. de Clase
=
97 - 27 + 1
9
=
71
9
= 7.88
como podemos ver tenemos 7.88 clases, pero debido a tener una porción de
una clase más, debemos incrementar o redondear a el inmediato superior,
21. PROBABILIDAD Y ESTADÍSTICA
teniendo entonces que el número de clases a utilizar será de 8 clases ya que
si utilizáramos 7 clases, tendríamos al final un valor que no entraría en el
número de clases escogidas para la colección de datos.
Para hacer una comparación entre el método empírico y la forma
20
general, aplicaremos la fórmula.
No. de clases = 1 + 3.3 log N
teniéndose al sustituir N = 30 lo siguiente:
No. de clases = 1 + 3.3 log(30)
= 1 + 3.3 (1.4771)
= 1 + 4.87 = 5.87
en este caso aproximaríamos a 6 clases y procederíamos a calcular el
Intervalo de Clase o Amplitud de Clase. El hecho de que en un procedimiento
se tengan 8 clases y en el otro 6 clases no afecta a los cálculos que el
estadístico hará, con lo que podemos decir que el estadista utilizará el método
que considere más práctico para sus fines.
Para elaborar el cuadro estadístico es necesario formar los
intervalos de clases, por lo que debemos escoger los límites inferior y superior
de los intervalos de clase de la siguiente manera: En la primera clase
tomamos el menor elemento de la colección de datos como el límite inferior
de esta clase, que es 27, para obtener el límite superior de la primera clase
debemos sumar 9 a el 27 debido a que el Intervalo de Clase es 9 (por que
estamos utilizando el método empírico ), teniéndose entonces que el límite
superior de la primera clase es 35. De esta manera tenemos que el Intervalo de
Clase de la primera clase es de 27 a 35, en este intervalo aparentemente
22. PROBABILIDAD Y ESTADÍSTICA
tenemos un intervalo de clase de 8, sin embargo debemos tomar en cuenta que
los extremos del intervalo están incluidos en él, teniéndose que del número 27
a el número 35 existen 9 unidades, que para mayor entendimiento lo
desarrollamos a continuación.
21
27 28 29 30 31 32 33 34 35
en donde claramente se ve que son 9. Ahora bien, para obtener el conteo de
cada intervalo o frecuencia de clase, debemos observar en la colección
original de datos cuantos elementos se encuentran en ese intervalo,
teniéndose que en este intervalo se encuentran los siguientes elementos de la
colección de datos, 27, 30, 30 y 35.
Para formar el Intervalo de Clase de la clase 2, tomamos el
inmediato superior a el límite superior de clase de la primera clase para
obtener el límite inferior de clase de la segunda clase ( Si la colección de
datos son números enteros, se suma uno a el límite superior de clase para
obtener el límite inferior de la clase siguiente, si la colección de datos es en
decimales se suma una unidad correspondiente a los decimales), por lo tanto
el intervalo de clase de la clase 2 inicia en 36 que al sumarle 9 y restarle 1
debido a que están incluidos los extremos tenemos que el límite superior de la
clase dos es 44 y en este intervalo los elementos de la colección original que
se encuentran son 38 y 42.
De la misma forma que se obtuvieron los intervalos de clase de
las clases 1 y 2 lo hacemos para las clases restantes de esta colección de datos.
23. PROBABILIDAD Y ESTADÍSTICA
Anteriormente en este capítulo definimos los conceptos de
frecuencia, frecuencia acumulada, frecuencia relativa y frecuencia relativa
acumulada, por lo tanto procederemos a explicar como se obtiene cada una
para poder terminar con nuestro cuadro estadístico. Para obtener la frecuencia
acumulada se deben tomar como referencia los límites superiores de clase; de
lo anterior tenemos que hasta el límite superior de la clase 1 (35) existen 4
datos; hasta el límite superior de la clase 2 (44) los datos que van son 6; para
el límite superior de la clase 3 (53) los datos acumulados de las clases es 9 y
asi sucesivamente hasta la última clase que deberá contener a la totalidad de
elementos. Con la explicación anterior concluimos que la frecuencia
acumulada se obtiene sumando a la frecuencia de clase la frecuencia de las
clases anteriores.
En lo que se refiere a la frecuencia relativa, tenemos que en cada
clase debemos especificar en razón a cuantos elementos tiene el intervalo de
clase con respecto a la colección total de datos, para el intervalo de clase 1
tenemos que la razón de elementos es 4/30 ( 4 de 30 ), para el intervalo de
clase 2 la razón es 2/30 ( 2 de 30 ) y así sucesivamente hasta la última clase.
Para las frecuencias relativas acumuladas se tienen que obtener las razones
acumuladas en cada intervalo de clase especificando que la última clase
deberá contener al total de elementos, por lo cual deberá aparecer la unidad.
Un punto más que debe aparecer en el cuadro estadístico es la
marca de clase, la cual nos servirá para elaborar las gráficas estadísticas en el
capítulo 3. La marca de clase se obtiene sumando el límite inferior de clase
con el límite superior de la misma clase y dividiendo entre dos, así para el
22
24. PROBABILIDAD Y ESTADÍSTICA
23
intervalo de clase 1, su marca de clase es
27 35
2
31
, para el intervalo de
clase 2 su marca de clase es 40 y así sucesivamente.
En base a todos los datos obtenidos anteriormente, procedemos a
desarrollar nuestro cuadro estadístico, el cual queda de la siguiente manera:
Número
de
Clase
Intervalo de
Clase
Frecuencia Frecuencia
Acumulada
Frecuencia
Relativa
Frecuencia
Rel. Acum.
Marca de
Clase
1 27 - 35 4 4 4 / 30 4 / 30 31
2 36 - 44 2 6 2 / 30 6 / 30 40
3 45 - 53 3 9 3 / 30 9 / 30 49
4 54 - 62 3 12 3 / 30 12 / 30 58
5 63 - 71 6 18 6 / 30 18 / 30 67
6 72 - 80 4 22 4 / 30 22 / 30 76
7 81 - 89 5 27 5 / 30 27 / 30 85
8 90 - 98 3 30 3 / 30 30 / 30 94
Totales 30 30 / 30
Cuando se obtienen más de 20 clases por el método empírico al
escoger aleatoriamente el Intervalo de Clase o Amplitud de Clase, entonces
se recomienda usar el método general, debido a que se pueden obtener malos
resultados a causa de la dispersión de datos que existirá entre ellos.
Ejemplo: Con la siguiente distribución:
6 42 49 6 52 36 8 32 33 9
53 33 12 31 41 8 50 50 23 41
32 11 49 10 15 28 31 13 48 9
17 9 27 15 41 32 7 28 17 13
47 6 35 47 15 53 5 42 53 27
que nos muestra las edades de una comunidad, elaborar: Un cuadro
estadístico, especificando las Clases, Frecuencia, Frecuencia Relativa y la
Frecuencia Acumulada.
25. PROBABILIDAD Y ESTADÍSTICA
24
Primero ordenamos los datos:
5 8 10 15 23 31 33 41 47 50
6 8 11 15 27 31 33 41 48 52
6 9 12 15 27 32 35 42 49 53
6 9 13 17 28 32 36 42 49 53
7 9 13 17 28 32 41 47 50 53
ahora calculamos el Intervalo de Clases eligiendo un número de
clase igual a 9
Intervalo de Clase = (53 - 5 + 1) / 9 = 5.44
con estos datos elaboramos el cuadro estadístico, con 9 clases y un Intervalo
de Clase de 6.
# Clase Int. Clase Frecuencia Frec. Acum. Frec. Rel. Frec. R. A. Marca de
Clase
1 5 - 10 11 11 0.22 0.22 7.5
2 11 - 16 7 18 0.14 0.36 13.5
3 17 - 22 2 20 0.04 0.40 19.5
4 23 - 28 5 25 0.10 0.50 25.5
5 29 - 34 7 32 0.14 0.64 31.5
6 35 - 40 2 34 0.04 0.68 37.5
7 41 - 46 5 39 0.10 0.78 43.5
8 47 - 52 8 47 0.16 0.94 49.5
9 53 - 58 3 50 0.06 1.00 55.5
Totales 50 1.00
Para elaborar las gráficas estadísticas es necesario conocer
además de la marca de clase, los límites reales de clases.
L.R.C. =
Lim.Sup. de la Clase (n) Lim. Inf.de la Clase (n 1)
2
( L.R.C. = Límite Real de Clase )
26. PROBABILIDAD Y ESTADÍSTICA
25
CUADRO ESTADÍSTICO CON LIMITES REALES DE CLASE
Número
de Clase
Intervalo de
Clase
Intervalo de Clase
con Limites Reales
Frecuencia Marca de Clase
1 5 - 10 4.5 - 10.5 11 7.5
2 11 - 16 10.5 - 16.5 7 13.5
3 17 - 22 16.5 - 22.5 2 19.5
4 23 - 28 22.5 - 28.5 5 25.5
5 29 - 34 28.5 - 34.5 7 31.5
6 35 - 40 34.5 - 40.5 2 37.5
7 41 - 46 40.5 - 46.5 5 43.5
8 47 - 52 46.5 - 52.5 8 49.5
9 53 - 58 52.5 - 58.5 3 55.5
En el capítulo tres veremos de la necesidad de utilizar cuadros
estadísticos como el anterior para la elaboración de gráficas estadísticas. A
continuación presentamos una serie de ejercicios resueltos referentes a este
capítulo.
* Evalué las siguientes sumas:
5
a) (y - 4) =
y = 0
6
b) (y
y = 2
2 - 5) =
c)
4
i = 1
3
(yi - 2) = d) (y + 2i) =
i = 1
5
a) (y - 4) =
y = 0
(0 - 4) + (1 - 4) + (2 - 4) + (3 - 4) + (4 - 4) + (5 - 4)
= - 4 - 3 - 2 - 1 + 0 + 1 = - 9
como podemos observar, se fue sustituyendo en el lugar de y el valor
consecutivo desde el cero hasta el máximo valor que era el 5. Lo hecho
anteriormente es similar para los incisos b), c) y d).
27. PROBABILIDAD Y ESTADÍSTICA
26
6
b) (y
y = 2
2 - 5) = (4 - 5) + (9 - 5) + (16 - 5) + (25 - 5) + (36 - 5)
= - 1 + 4 + 11 + 20 + 31 = 65
c)
4
i = 1
(yi - 2) = (y1 - 2) + (y2 - 2) + (y3 - 2) + (y4 - 2)
= y1 + y2 + y3 + y4 - 8
3
d) (y + 2i) =
i = 1
[y + 2(1)] + [y + 2(2)] + [y + 2(3)] = 3y + 12
* Si y es la variable de posición de una sucesión y la
fórmula para el elemento típico es y2 - 1:
a) Escriba los primeros cuatro elementos de la sucesión.
Los primeros cuatro elementos son:
si y = 1 entonces : (1)2 - 1 = 0 primer elemento
si y = 2 entonces : (2)2 - 1 = 3 segundo elemento
si y = 3 entonces : (3)2 - 1 = 8 tercer elemento
si y = 4 entonces : (4)2 - 1 = 15 cuarto elemento
b) Use el signo de sumatoria para escribir una expresión para la suma de
los primeros cuatro elementos. La fórmula de sumatoria es :
4
y = 1
(y2 - 1)
c) Encuentre la suma de los primeros cuatro números.
4
y = 1
(y2 - 1) = [(1)2 - 1] + [(2)2 - 1] + [(3)2 - 1] + [(4)2 - 1]
= 0 + 3 + 8 + 15 = 26
28. PROBABILIDAD Y ESTADÍSTICA
* Para estimar la pérdida semanal debida a robos, una tienda
de ropas registró el total en nuevos pesos de las pérdidas durante un período
de 10 semanas. Estas pérdidas, redondeadas a la decena más cercana fueron:
27
y1 = 360.00 y2 = 430.00 y3 = 210.00 y4 = 320.00 y5 = 550.00
y6 = 170.00 y7 = 240.00 y8 = 370.00 y9 = 280.00 y10 = 290.00
a) Encuentre
10 yi = 360 + 430 + 210 + 320 + 550 + 170 + 240 + 370
i = 1
+ 280 + 290 = 3,220.00
b) Encuentre: i)
4
i = 2
yi ii)
4
i = 2
2
yi
i)
4
i = 2
yi = 430.00 + 210.00 + 320.00 = 960.00
ii)
4
i = 2
2 = (430.00)2 + (210.00)2 + (320.00)2 = 331,400.00
yi
* Dados el siguiente conjunto de elementos:
16 19 17 8 11 9 14 8
11 13 19 17 7 6 5 9
16 8 9 13 12 17 16 14
9 16 15 18 6 8 5 7
16 17 13 9 7 5 7 11
elaborar un cuadro estadístico en el podamos observar la frecuencia,
frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada,
marca de clase, amplitud de clase y límites reales de clase.
Primero procederemos a ordenar los datos presentados
anteriormente:
5 7 8 9 11 14 16 17
5 7 8 9 12 14 16 17
5 7 8 9 13 15 16 18
6 7 9 11 13 16 17 19
29. PROBABILIDAD Y ESTADÍSTICA
28
6 8 9 11 13 16 17 19
como tenemos 40 elementos en la muestra, aplicaremos la fórmula de menos
de 50 elementos:
Num. de Clases = 1 + 3.3 log N
Num. de Clases = 1 + 3.3 log (40)
Num. de Clases = 1 + 3.3(1.602)
Num. de Clases = 1 + 5.28 = 6.28
como tenemos 6.28 clases, redondeamos al inmediato inferior, por lo que
utilizaremos 6 clases para la distribución anterior. Con 6 clases, el intervalo
de clase será:
Int. de Clase = ( 19 - 5 + 1 ) / 6 = 2.5
como el intervalo de clase es un número no entero, utilizaremos 3 como
intervalo de clase, y entonces el número de clases será 5, quedando nuestro
cuadro estadístico de la siguiente manera:
# de C Intervalo
de Clase
Int. Clase
Lim. Real
Frecuencia Frecuencia
relativa
Frecuencia
Acumulada
Frec. Rel.
Acumulada
Marca de
Clase
1 5 - 7 4.5 - 7.5 9 0.225 9 0.225 6
2 8 - 10 7.5 - 10.5 9 0.225 18 0.450 9
3 11 - 13 10.5 - 13.5 7 0.175 25 0.625 12
4 14 - 16 13.5 - 16.5 8 0.200 33 0.825 15
5 17 - 19 16.5 - 19.5 7 0.175 40 1.000 18
Totales 40 1.000
los límites reales se obtuvieron aplicando la relación de la página 23 vista en
este capítulo.
30. PROBABILIDAD Y ESTADÍSTICA
29
EJERCICIOS PROPUESTOS
1.- Defina los siguientes conceptos:
a) Frecuencia
b) Frecuencia Relativa
c) Cuadro Estadístico.
d) Amplitud de Clase.
2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son:
2 8 5 2 7 2 5 5 5 6
1 6 2 3 6 7 7 6 3 3
4 3 4 8 1 4 5 2 7 5
5 4 4 6 6 3 8 3 7 1
8 8 3 2 3 8 6 2 7 2
Formar un cuadro estadístico con toda la información manejada
en este capítulo.
3.- Evalúe las siguientes sumas:
a)
3
y = 1
y3
b)
3
x = 1
( 1 + 2x + x2 )
c)
3
x = 0
( x3 + 2x )
31. PROBABILIDAD Y ESTADÍSTICA
30
INTRODUCCIÓN
Es natural introducir los métodos gráficos para describir
conjuntos de datos a través de la consideración de un conjunto real de datos.
Anteriormente vimos el análisis de datos por métodos numéricos, métodos
con los que nosotros podemos leer información respecto a promedios,
poblaciones, etc. En los cuadros estadísticos se habló de clases y variables,
ahora podremos representar gráficamente esas clases o variables y a ello es lo
que llamaremos métodos estadísticos gráficos. Note que en los extremos de
los subintervalos o clases se han escogido de manera que ningún elemento
coincida con dos subintervalos o clases a la vez, eliminando así cualquier
ambigüedad relacionada con la ubicación de una observación particular. Justo
con los cuadros estadísticos vistos en el capítulo anterior es con los que
deberemos elaborar nuestras gráficas estadísticas para el desarrollo de los
métodos gráficos.
REPRESENTACIONES GRÁFICAS
En muchos casos una representación gráfica de una tabla de
frecuencias da una información concisa y clara de una distribución de
frecuencias. Son cuatro los tipos de representaciones gráficas más usuales,
también existen dos tipos de representación gráfica no muy común y que sin
embargo se deben de conocer; las representaciones gráficas son :
1.- Histograma ó Diagrama de Barras.
2.- Polígono de frecuencias.
3.- Diagrama de Pastel.
4.- Ojiva o Curva de frecuencias.
32. PROBABILIDAD Y ESTADÍSTICA
31
Los dos tipos de gráficas no muy usuales son:
1.- Curva de Lorenz.
2.- Curva de la distribución Normal.
HISTOGRAMA ó DIAGRAMA DE BARRAS
Es aquel en el que se representan los datos mediante un plano
coordenado, en el eje horizontal o de abcisas anotaremos la amplitud de clase
o valor de la variable, mientras que en el eje vertical o de ordenadas se
anota el número de elementos o frecuencias de clase; existen dos formas de
presentar un histograma, por ejemplo, utilizando los datos del siguiente
cuadro tendríamos:
Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total
Frecuencia 4 6 8 12 8 8 4 50
PRIMERA FORMA
33. PROBABILIDAD Y ESTADÍSTICA
32
SEGUNDA FORMA
POLÍGONO DE FRECUENCIAS
Se obtiene relacionando la marca de clase (punto medio de cada
intervalo) con su frecuencia respectiva. Ahora bien, para poder formar el
polígono de frecuencias es necesario tomar una clase antes de la primera clase
y una clase después de la última clase ambas con frecuencia cero, de esta
manera al unir todos los puntos de relación marca de clase con frecuencia
quedara formado el polígono respectivo. Veamos un polígono de frecuencias
en base al siguiente cuadro estadístico. Las marcas de clase se obtienen como
se menciono en el capítulo 2.
Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total
Frecuencia 4 6 8 12 8 8 4 50
Marca de Clase 34.5 44.5 54.5 64.5 74.5 84.5 94.5
34. PROBABILIDAD Y ESTADÍSTICA
33
DIAGRAMA DE PASTEL
Este diagrama se forma con la distribución de frecuencias
relativas y se llama así debido a su configuración, la forma de obtener las
rebanadas que le dan la forma de un pastel es multiplicando la frecuencia
relativa por 360 grados que es el número de grados que tiene una
circunferencia, su configuración es la siguiente:
Extracción de el estudiante Z. Urbana Z. Suburbana Z. Rural Totales
Frecuencia 240 1400 360 2000
Porcentaje ( % ) 12 70 18 100
35. PROBABILIDAD Y ESTADÍSTICA
34
OJIVA O CURVA DE FRECUENCIA ACUMULADA
Esta gráfica y distribución nos sirve para saber o poder
responder preguntas como las siguientes:
a) ¿Cuántos alumnos reciben calificaciones superiores a 60?
b) ¿Cuántos alumnos tienen calificaciones inferiores a 60?
Estas interrogantes en las que se desea conocer la frecuencia por
encima o por debajo de cierto valor de la variable, son preguntas muy visuales
en los distintos campos de la ciencia.
Variable Frecuencia Frec. Acum.
40 0 0
50 3 3
60 1 4
70 2 6
80 3 9
90 1 10
Totales 10
Si hiciéramos un histograma de frecuencias obtendríamos la
siguiente gráfica:
36. PROBABILIDAD Y ESTADÍSTICA
En base al mismo cuadro estadístico elaboraremos a continuación
35
un histograma de frecuencias acumuladas.
Sobre el mismo histograma de frecuencia acumulada podríamos
formar la curva u Ojiva, que es otra gráfica característica de la Estadística
Descriptiva, la cual se forma de la siguiente manera:
a).- Se eligirán los ejes coordenados en los cuales se especifica-rán
la clase (o variable) y la frecuencia acumulada.
b).- Si se trabaja con clases, para la formación de la Ojiva
utilizaremos los limites superiores de clase, mientras que si trabajamos con
variables, utilizaremos el punto donde se localiza la variable.
Tanto el histograma de frecuencia acumulada como la Ojiva son
utilizados en los cuadros estadísticos por clases o variables, veamos la gráfica
de una Ojiva.
37. PROBABILIDAD Y ESTADÍSTICA
Existe una curva más sobre frecuencia acumulada que toma el
nombre de Curva de Lorenz. La elaboración de esta curva se realiza de la
misma manera que la Ojiva, sólo que la unión entre puntos son líneas rectas,
además, de que se cierran los cuadros quedando la gráfica de la manera
siguiente:
36
38. PROBABILIDAD Y ESTADÍSTICA
Está curva no es muy utilizada en el campo de las Ciencias
Sociales, sin embargo, es muy importante dentro de las investigaciones en
Física, Matemáticas, Fisiología, Ingeniería, etc.
Las curvas de frecuencias son representaciones graficas de
distribuciones de frecuencias teóricas. Ciertas formas de curvas de
frecuencias reciben nombres específicos que guardan correspondencia con
tipos específicos de distribuciones de frecuencias. Existen cuatro tipos de
distribución correspondientes a estos tipos específicos, que son: La
distribución Rectangular, La distribución Normal, La distribución Asimétrica
y La distribución Bimodal. En este cuaderno hablaremos de la distribución
Normal o curva acampanada ya que será utilizada más adelante.
37
DISTRIBUCION NORMAL
Es una distribución simétrica alrededor de la media, con una
curva de frecuencias en forma acampanada; es la principal distribución
dentro de la Estadística Inferencial, más adelante en el capítulo siete esta
distribución será tratada con más detalle, su representación gráfica es:
A continuación se muestra un conjunto de datos, con los que
vamos a elaborar las graficas estadísticas que se mencionaron: un histograma,
un polígono de frecuencias, un diagrama de pastel y una ojiva.
39. PROBABILIDAD Y ESTADÍSTICA
38
30 42 50 73 60 63
38 27 67 83 70 63
52 83 97 49 83 73
30 35 63 59 84 75
84 90 80 95 85 68
Basándonos en que se trata del ejercicio presentado en el capítulo
anterior para la formación de un cuadro estadístico, procederemos a colocar
nuevamente dicho cuadro, el cual queda de la siguiente manera:
Número
de
Clase
Intervalo de
Clase
Frecuencia Frecuencia
Acumulada
Frecuencia
Relativa
Frecuencia
Rel. Acum.
Marca de
Clase
1 27 - 35 4 4 4 / 30 4 / 30 31
2 36 - 44 2 6 2 / 30 6 / 30 40
3 45 - 53 3 9 3 / 30 9 / 30 49
4 54 - 62 3 12 3 / 30 12 / 30 58
5 63 - 71 6 18 6 / 30 18 / 30 67
6 72 - 80 4 22 4 / 30 22 / 30 76
7 81 - 89 5 27 5 / 30 27 / 30 85
8 90 - 98 3 30 3 / 30 30 / 30 94
Totales 30 30 / 30
Basándose en el cuadro anterior, se procede a formar las gráficas estadísticas.
a) HISTOGRAMA
40. PROBABILIDAD Y ESTADÍSTICA
39
b) POLÍGONO DE FRECUENCIAS
c).- CÁLCULOS PARA OBTENER EL DIAGRAMA DE PASTEL
Num. de Clase Frecuencia Relativa Frecuencia Relativa x 360 Grados por Clase
1 0.133 0.133 x 360 48
2 0.067 0.067 x 360 24
3 0.100 0.100 x 360 36
4 0.100 0.100 x 360 36
5 0.200 0.200 x 360 72
6 0.133 0.133 x 360 48
7 0.167 0.167 x 360 60
8 0.100 0.100 x 360 36
41. PROBABILIDAD Y ESTADÍSTICA
40
d) O J I V A
frec. 30
26.5 35.5 44.5 53.5 62.5 71.5 80.5 89.5 98.5
Límites superiores de las clases
EXAMEN DE AUTOEVALUACIÓN
1.- Explique la elaboración de las siguientes gráficas estadísticas :
a) Histograma.
b) Diagrama de Pastel.
c) Pictograma
d) Polígono de Frecuencias
2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son:
2 8 5 2 7 2 5 5 5 6
1 6 2 3 6 7 7 6 3 3
4 3 4 8 1 4 5 2 7 5
5 4 4 6 6 3 8 3 7 1
8 8 3 2 3 8 6 2 7 2
a) Formar un cuadro estadístico.
42. PROBABILIDAD Y ESTADÍSTICA
41
b) Construir un Histograma.
c) Construir un Polígono de Frecuencia.
d) Graficar una Ojiva.
e) Construir un Diagrama de Pastel.
3.- Con las siguientes estaturas de los estudiantes de un grupo de la Fac. de
Derecho:
1.87 1.79 1.75 1.90 1.84 1.82 1.77 1.85
1.73 1.98 1.87 1.81 1.79 1.85 1.89 1.90
1.77 1.83 1.91 1.94 1.79 1.80 1.92 1.84
1.76 1.85 1.82 1.91 1.90 1.87 1.86 1.91
1.91 1.89 1.86 1.86 1.97 1.78 1.74 1.76
a) Construir un Cuadro Estadístico.
b) Elaborar las cuatro gráficas estadísticas más usuales.
43. PROBABILIDAD Y ESTADÍSTICA
42
LA MEDIA ARITMÉTICA
También se le conoce como promedio; es la suma de todos los
elementos dividida entre el número total de ellos. Matemáticamente se
representa de la siguiente manera:
" Sea X una variable; X1, X2, . . . , Xn , la población generada
por X, el promedio de la población será :
Xi
n
n
i=1
(1)
Existen dos tipos de medias, la Media Poblacional que se
representa con la letra griega " ", y la Media Muestral que se representa con
una X testada " X ", ambas se obtienen de la misma forma. La Media
Aritmética es una medida que se utiliza para describir poblaciones, por
ejemplo:
1.- La vida media de una pila es cierto número de horas.
2.- La calificación promedio de los estudiantes de un grupo.
3.- El gasto promedio de gasolina por kilómetro recorrido en un auto.
4.- El salario medio de los empleados de una empresa.
5.- La altura media de los jugadores de un equipo de básquetbol.
Una característica de la Media Aritmética que debe tenerse en
cuenta cuando se describe una población es que esta medida es afectada por
los valores extremos de la muestra o población. Así por ejemplo: Si se le
pide a un empresario que informe sobre el salario promedio de los
44. PROBABILIDAD Y ESTADÍSTICA
trabajadores de su empresa, esta información se verá totalmente afectada si
en el cálculo se incluye su propio salario y el de sus trabajadores de más alta
jerarquía, ya que elevaría el salario promedio, en caso contrario, al calcular el
salario promedio de los ejecutivos, no se incluiría el sueldo de los intendentes,
porque esto bajaría el salario promedio de estas personas. La Media
Aritmética es una buena medida descriptiva de una población, si los datos de
ésta no se encuentran muy dispersos. Veamos a continuación algunos
ejemplos.
* Obtenga la media aritmética o promedio de las calificaciones de
un grupo de 18 alumnos en la materia de Filosofía, las calificaciones de los
alumnos son:
43
7 9 6 9 4 8 5 8 7
6 9 8 5 7 5 8 4 7
para obtener la media aritmética de los datos anteriores, debemos aplicar la
fórmula (1), teniéndose entonces que :
X =
2 4 3 5 2 6 4 7 4 8 3 9
18
122
18
6 77
( ) ( ) ( ) ( ) ( ) ( )
.
teniéndose entonces que el promedio de los alumnos es: X = 6.77
* Si la estatura de 12 jugadores de Básquet Bol de la
Universidad de Colima son:
1.97 1.92 1.84 1.86 1.88 1.92
1.82 1.85 1.94 1.87 1.80 1.93
¿cuál es la estatura promedio de los 12 jugadores?
45. PROBABILIDAD Y ESTADÍSTICA
Aplicando la misma fórmula (1), tenemos que la media aritmética o
44
estatura promedio es:
X =
1.80 +1.82 +1.84 +1.85 +1.86 +1.87 +1.88 +1.92 +1.92 +1.93 +1.94 +1.97
12
X =
22 .
6
12
= 1.88 mts
* Si la producción mensual de maíz en toneladas, durante un año
en Tlaxcala fue :
12,000 14,280 15,720 13,318 14,420 13,300
12,800 13,618 14,710 15,127 14,360 13,750
¿cuál es la producción promedio mensual y cuál es la producción anual ?.
Aplicando la fórmula (1) tenemos:
X =
12,000 +14,280 +15,720 + + 15,127 +14,360 +13750
12
=
167,403
12
X = 13,950.25 toneladas
para obtener la producción anual, sólo debemos sumar todos datos de
producción mensual, para lo cual, aplicaremos el concepto de sumatoria visto
en la unidad 2.
Producción anual =
12 xi = 12,000 + 14,280 + * * * + 14,360 + 13,750
i = 1
Producción anual = 167,403 toneladas
46. PROBABILIDAD Y ESTADÍSTICA
45
LA MEDIANA
Es otra medida que se utiliza para describir el valor central de
una población. Para calcular la Mediana se ordenan los datos en forma
ascendente o descendente, si el tamaño de la población es impar, la Mediana
es el dato que queda al centro del los datos ordenados; si es par, la Mediana es
el promedio de los dos datos que ocupan el centro de la ordenación. Se
observa que la Mediana divide en dos partes iguales a los datos de una
muestra o población. La Mediana es una medida que no es afectada por los
valores extremos de la muestra o población. Veamos algunos ejemplos.
* Calcular la mediana de los siguientes datos:
46, 54, 58, 56, 48, 58, 112
Para calcular la Mediana, primero se ordenan los datos en forma ascendente o
descendente, teniéndose:
46, 48, 54, 56, 58, 58, 112
Una vez ordenados, se toma el dato al centro de la ordenación ya
que en este caso tenemos un número impar de datos, por lo tanto, la Mediana
es: 56
* En un grupo de 15 alumnos de la Fac. de Medicina, los
alumnos obtuvieron las siguientes calificaciones en Anatomía:
85 92 78 87 96
87 79 90 77 92
87 94 83 78 89
Determine la Mediana.
47. PROBABILIDAD Y ESTADÍSTICA
Para obtener la Mediana es necesario ordenar los datos,
46
teniéndose entonces que:
77 78 78 79 83 85 87 87 87 89 90 92 92 94 96
La Mediana de los datos o el dato que divide en dos partes iguales a la
muestra es 87 debido a ser el dato que ocupa el centro de la muestra por ser
un número impar. A partir de este momento, representaremos a la Mediana de
la siguiente manera: X
* Determine la Mediana del siguiente conjunto de datos:
12 18 23 16 24 17 18 20
15 9 16 22 18 11 14 19
para obtener la Mediana debemos ordenar los datos en forma ascendente y
escoger el dato que se encuentre en el centro de la colección, por lo tanto:
9 11 12 14 15 16 16 17
18 18 18 19 20 22 23 24
como podemos observar en este caso el número de datos es par y por lo tanto
la Mediana de esta colección de datos será el media aritmética de los datos
que ocupan el centro de la colección, siendo estos datos los números 17 y 18
teniéndose entonces que la Mediana en este ejercicio es : X
=
17 18
2
17 5
. .
48. PROBABILIDAD Y ESTADÍSTICA
47
LA MODA
Es otra medida de tendencia central y que se utiliza para describir
el valor típico de una población. La Moda en una población o muestra es el
valor que se presenta con mayor frecuencia. Sí en una muestra de 10 casas, se
considera la siguiente distribución en número de hijos, 3, 0, 1, 5, 6, 2, 1, 2, 7,
2, entonces la Moda es el número 2, ya que es el elemento que aparece con
mayor frecuencia. La Moda la representaremos de la siguiente manera : Mo .
Debemos aclarar que pudiera existir una colección de datos en la que existan
dos o más modas, lo cual sucedería cuando existieran dos o más elementos
que aparecen la misma cantidad de veces y que además son el que mayor
frecuencia tienen. Veamos algunos ejemplos.
* En un grupo de 15 alumnos de la Fac. de Medicina, los
alumnos obtuvieron las siguientes calificaciones en Anatomía:
85 92 78 87 96
87 79 90 77 92
87 94 83 78 89
¿ Cuál es la Moda ?. La Moda es la calificación que se presentó con mayor
frecuencia en el grupo, teniéndose entonces que: Mo = 87
* Si la estatura de 12 jugadores de Básquet Bol de la Universidad
de Colima son:
1.97 1.92 1.84 1.86 1.88 1.92
1.82 1.85 1.94 1.87 1.80 1.93
49. PROBABILIDAD Y ESTADÍSTICA
¿cual es la estatura que existe en mayor cantidad en los 12 jugadores? A la
estatura que mayor frecuencia tenga es la que llamaremos la Moda,
teniéndose entonces que: Mo = 1.92
48
* Obtenga la Moda de la siguiente colección de datos:
9 11 12 14 16 16 16 17
18 18 18 19 20 22 23 24
en este ejemplo tenemos que los números que mayor veces aparecen son el 16
y el 18, por lo tanto, en esta colección de datos tenemos un ejemplo de
distribución bimodal ( existen 2 modas en la colección ), por lo que las modas
son: Mo = 16 y 18
COMPARACIÓN DE LA MEDIA
ARITMETICA, LA MEDIANA Y LA MODA
Hemos visto 3 medidas de tendencia central que describen a una
población, pero, ¿cuál debe usarse en una situación determinada?. La elección
de la medida de tendencia central a usarse depende del tipo de variable que
genera la población y de las finalidades del estudio que se está realizando. Un
criterio fuerte para la elección de alguna de estas medidas es el de escoger la
que presente ventajas significativas sobre las otras dos, por ejemplo: En el
caso de una fábrica de automóviles la empresa deber decidir que marca de
acumuladores usar en sus vehículos, para lo que le puede ser útil además del
costo, comparar la durabilidad de los acumuladores de diversas marcas. En
poblaciones de este tipo, la media, la mediana, y la moda son en la mayor
parte de los casos valores muy parecidos.
50. PROBABILIDAD Y ESTADÍSTICA
La media sólo puede calcularse cuando la variable de interés es
numérica. A pesar de que la media puede ser afectada por valores muy
grandes o muy pequeños respecto al resto de la población, es una medida que
se emplea con mucha frecuencia para orientar la toma de decisiones, porque
su naturaleza numérica facilita el tratamiento estadístico.
La mediana es una medida que sólo se puede obtener si la
variable al menos es cardinal, en general, se acude a esta medida cuando no se
puede calcular la media o ésta no sea representativa de la población.
La moda es una medida que puede obtenerse para cualquier tipo
de variable. Hay muchas ocasiones en que esta medida presenta ventajas
sobre las otras dos para describir a una población. Por ejemplo: Consideremos
el caso de planear la producción de un nuevo tipo de chamarras, para el largo
de la manga y la talla, el fabricante considerará las de mayor frecuencia, es
decir, la moda. En este caso, la media o la mediana no le aportan la
información requerida. Veamos un ejemplo:
El siguiente conjunto de datos contiene las calificaciones de 50
49
alumnos de la materia de Economía:
5 2 3 8 4 5 4 7 5 8
6 8 7 7 2 9 1 10 9 6
9 7 10 8 9 9 10 5 9 5
9 10 10 2 8 2 10 2 7 3
3 10 5 10 9 6 1 9 7 6
a) Obtener La Media Aritmética, La Mediana y La Moda.
X = ( 1 + 1 + 2 + . . . + 10 + 10 + 10 ) / 50
X = 326 / 50 = 6.52
Mediana = X
= 7 ( por ocupar los lugares 25 y 26 en el arreglo )
La Moda = Mo = 9 ( por ser el que más se repite ó aparece )
51. PROBABILIDAD Y ESTADÍSTICA
b) Mencione cuál de las tres medidas de tendencia central es la más
50
adecuada y ¿por que?
La más representativa es la Media Aritmética, ya que los datos no se
encuentran muy dispersos, además de que la Mediana y la Moda tienden a
cargarse más hacia un extremo.
Debemos señalar que las tres medidas de tendencia central
mencionadas anteriormente son las más comunes, más no son las únicas.
Existen otras medidas de tendencia central como son la Media Geométrica, La
Media Armónica, La Media Ponderada, La Media Supuesta, y algunas otras.
Veamos un ejemplo de lo anterior.
* La duración en horas de una muestra de focos tomados de la
producción diaria de una fabrica son:
129 145 168 164 165 172 168 179 168 170
159 168 175 164 179 168 180 173 149 159
168 178 177 178 168 172 168 158 154 168
a) Calcular la Media Aritmética, la Mediana y la Moda.
X =
129 + 145 + + 154 + 168
30
=
4991
30
= 166.36 horas
X
= 168 por ocupar el lugar 15 y 16 de la ordenación
Mo = 168 por ser el número en horas que más se repite.
b) Mencione cuál de las tres medidas de tendencia central es la más
apropiada para este evento.
Para este evento, consideramos que la medida de tendencia
central más apropiada es la Media Aritmética, ya que es el dato que se
52. PROBABILIDAD Y ESTADÍSTICA
encuentra más hacia el centro de la distribución aun cuando es afectado por la
medida de 129 horas.
51
MEDIA GEOMÉTRICA
La Media Geométrica es muy usual para el cálculo de promedios
de tasas de variación, en la elaboración de Números Índice, etc. Se define de
la siguiente manera: “Sí tenemos n elementos, la Media Geométrica es la raíz
n-ésima del producto de todos los elementos ”. La fórmula para obtenerla es:
MEDIA GEOMÉTRICA ( g ) = n X X X 1 * 2 * . . . * n
donde: n = Tamaño de la Muestra
Xi = Elemento de la Muestra
* Obtener la Media Geométrica de los siguientes números: 3, 5,
7, 9, 8.
g = 5 3 5 7 8 9
* * * * = 5 7,560 = 5.966
Veamos algunos ejercicios de lo visto hasta este momento.
* Obtener la Media Aritmética de los datos:
6 3 8 5 2
X =
6 3 8 5 2
5
=
24
5
= 4.8
* Los ingresos anuales de 12 profesores en nuevos pesos son:
72,000 72,000 75,000 81,000 163,000 78,000
81,000 89,000 72,000 90,000 84,000 81,000
53. PROBABILIDAD Y ESTADÍSTICA
Calcular las medidas de tendencia central. Indique cual es la más significativa
y ¿por que?
52
X =
72,000 + 72,000 + + 90,000 +163,000
12
=
1' 038,000
12
X = 86,500 nuevos pesos
Mo = 72,000 y 81,000
X
= 81,000
La más significativa es la Mediana, por que es el valor que se
encuentra al centro de la distribución, mientras que la Moda toma un valor
extremo lo que la hace no muy significativa y a la Media la afecta el valor de
163,000 por estar muy disperso.
* Obtener la Media Geométrica de los siguientes datos:
12 15 17 13 18 14 18 13 17 15
g = 10 12 x 15 x 17 x 13 x18 x 14 x 18 x 13 x 17 x 15
g = 10 5,981,655,000,000 = 15.05
MEDIA ARMÓNICA
La idea de promedio es tan manejable que no es sorprendente que
se hayan inventado diversos tipos de promedio de modo que pueda
representarse con un mínimo de deformación un campo tan amplio como sea
posible. Podemos escoger nuestro promedio, y tomamos el apropiado para
nuestro propósito. El promedio aritmético de un conjunto de números es el
más simple de los promedios ó medidas de centralización.
54. PROBABILIDAD Y ESTADÍSTICA
Un segundo tipo de promedio importante es la Media Armónica,
que es el recíproco de la media aritmética de los recíprocos de los valores que
queremos promediar. La Media Armónica es el promedio adecuado cuando
tratamos con tarifas y precios. Consideremos un ejemplo para explicar este
tipo de promedio.
* Un aeroplano vuela alrededor de un cuadrado cuyo lado tiene
100 Km de largo, tomando el primer lado a 100 Km/h , el segundo lado a 200
Km/h , el tercer lado a 300 Km/h y el cuarto lado a 400 Km/h. ¿Cuál es la
velocidad media del aeroplano en su vuelo alrededor del cuadrado?
Si promediamos las velocidades usando la media aritmética de la
53
manera usual, tenemos:
100 200 300 400
4
X =
= 250 Km/h
pero éste no es el resultado correcto, ya que lo podemos comprobar de la
siguiente manera :
Tiempo para viajar el primer lado 1 hora
Tiempo para viajar el segundo lado 30 minutos
Tiempo para viajar el tercer lado 20 minutos
Tiempo para viajar el cuarto lado 15 minutos
De el desglose anterior tenemos que el tiempo total empleado en
recorrer los 400 kilómetros fue de 2 horas 5 minutos, con este total se
deduce que la velocidad media del aeroplano en recorrer los 400 Km del
cuadrado fue de 192 Km/h.
El promedio aritmético nos da por lo tanto un resultado
equivocado. Podemos deducir la razón de esto a partir del hecho de que no
55. PROBABILIDAD Y ESTADÍSTICA
todas las velocidades se mantienen durante el mismo tiempo, sólo lo hacen
para la misma distancia.
El promedio correcto para usar en este caso es la Media
Armónica. Para dar la fórmula introduciremos la notación de sumatoria ya
analizada anteriormente, teniéndose entonces que:
54
Media Armónica (H) =
n
1
n
i=1 Xi
a partir de este momento, cuando hablemos de la Media Armónica, la
representaremos con la letra H. Para ilustrar esta fórmula, apliquémosla a
nuestro ejemplo del aeroplano.
Las cuatro velocidades que se mantenían cada una sobre la
misma distancia, eran 100 Km/h, 200 Km/h, 300 Km/h y 400 Km/h. Estos
son los valores de Xi . Puesto que hay cuatro valores, el valor de n en
nuestro ejemplo es 4, y tenemos entonces:
H =
4
1
100
=
4
25
1200
=
4,800
25
= 192 Km/ h
1
200
1
300
1
400
en donde 192 Km/h es la respuesta correcta.
Como podemos ver, la media armónica es adecuada aquí porque
los tiempos eran variables con las distancias constantes. De haber sido las
tiempos constantes y las distancias variables, la media aritmética hubiese sido
la correcta. Cabe señalar que el tipo de promedio adecuado depende siempre
de los términos del problema en curso. Las fórmulas no se han de aplicar
indiscriminadamente. Veamos algunos ejemplos.
56. PROBABILIDAD Y ESTADÍSTICA
* Un agricultor puede arar un terreno empleando un tractor en
cuatro días; un ayudante suyo puede hacer el mismo trabajo con un tractor
más pequeño en 6 días. ¿Cuál es el rendimiento representativo de los dos
tractores?, ¿En cuántos días pueden arar el mismo campo si trabajan
conjuntamente?
55
Para calcular el rendimiento representativo, tenemos:
H
n
n
i xi
1
2
1
4
1
6
2
3 2
12
2
5
12
24
5
4
4
5
1
por lo tanto el rendimiento representativo de los dos tractores es de 4
4
5
días.
Para determinar en cuántos días los tractores pueden arar el
campo si trabajan conjuntamente tenemos que su rendimiento representativo
es de 4
4
5
días, por lo que al trabajar conjuntamente resulta:
4
5
2
4
24
5
2
24
10
2
2
5
por lo tanto para arar el campo si los dos tractores trabajan conjuntamente, se
requiere 2
2
5
días.
Comprobación: Los dos tractores pueden arar en un día
1
4
1
6
5
12
del campo; en arar todo el campo tardarán : por dos días de arado
conjuntamente habrán arado
10
12
del campo, pero como araron juntos
2
5
de un
día más, eso es en proporción del campo lo siguiente :
2
5
de un día por
5
12
de
57. PROBABILIDAD Y ESTADÍSTICA
56
campo arado conjuntamente en un día da
2
12
de campo, que es el complemento
de
10
12
del campo, entonces, en arar todo el campo tardarán 2
2
5
días.
* En una ruta ferroviaria la velocidad a la que se desplaza un tren
es: los primeros 90 Km. a 70 Km/h, en el segundo tramo de 70 Km. a 100
Km/h; determinar la velocidad promedio para todo el recorrido.
Dado que las distancias de los tramos no son iguales, se debe
utilizar una ecuación representativa que denominamos “media armónica
ponderada” para las velocidades donde los “pesos” son las distancias
respectivas, es decir:
1 1
H N
f
X
en donde N = f , o también puede ser
N
H
f
X
sustituyendo los datos de velocidad y distancia, resulta:
d + d + d + . . . + d
v
d
v
d
v
d
v
. . . +
d
v
1 2 3 N 1
1
2
2
3
3
N
N
sustituyendo los datos en la ecuación de la media armónica ponderada para la
velocidad media, resulta:
9 0 7 0
1 6 0
1 9 8 5 7
v
=
9 0
7 0
7 0
1 0 0
v
= 1 . 2 8 5 7 + 0 . 7
1 6 0
.
v
v = 8 0 . 5 7
por lo tanto la velocidad promedio para todo el recorrido es 80.57 Km/h.
Comprobación: Determinamos primeramente el tiempo
requerido para recorrer el primer tramo:
58. PROBABILIDAD Y ESTADÍSTICA
57
TIEMPO ( t ) =
DISTANCIA ( d )
VELOCIDAD ( v )
=
90 Km
70 Km / h
horas
El tiempo requerido para recorrer el segundo tramo es:
( t ) =
d
v
Km
100 Km / h
horas.
La velocidad media para todo el recorrido es:
VELOCIDAD MEDIA =
DISTANCIA TOTAL
TIEMPO TOTAL
90 Km + 70 Km
1.2857 h + 0.7 h
Km
1.9857 h
VELOCIDAD MEDIA = 80.57 Km / h
12857
70
0 7
160
.
.
MEDIA ARMONICA PARA DATOS AGRUPADOS
Si consideramos los elementos ( X1 , X2 , X3 , . . . , XN ) que se
presentan con frecuencias ( f1 , f2 , f3 , . . . , fN ) en donde ( f1 + f2 + f3 + . . . +
fN = N ) representa la frecuencia total; la ecuación de la Media Armónica para
datos agrupados se expresa por:
H =
f
f
X
N
f
X
donde: H = Media Armónica
N = f = Número total de frecuencias
XN = Marcas de clases de datos agrupados.
fN = Frecuencias de clase.
* La siguiente tabla de distribuciones de frecuencias registra las
longitudes en centímetros que en una semana tienen 100 plantas de frijol; con
esta información obtener la Media Armónica.
59. PROBABILIDAD Y ESTADÍSTICA
15.2632252
58
INTERVALOS
( LONGITUDES )
FRECUENCIAS ( f )
( No. DE PLANTAS )
5.4 - 5.7 7
5.8 - 6.1 16
6.2 - 6.5 21
6.6 - 6.9 29
7.0 - 7.3 18
7.4 - 7.7 9
100
SOLUCION: Para determinar la Media Armónica es necesario construir la
siguiente tabla de distribuciones:
INTERVALOS
( LONGITUDES )
MARCA DE
CLASE ( X)
FRECUENCIAS ( f )
(No. DE PLANTAS)
f
X
5.4 - 5.7 5.55 7 1.261261
5.8 - 6.1 5.95 16 2.689075
6.2 - 6.5 6.35 21 3.307086
6.6 - 6.9 6.75 29 4.296296
7.0 - 7.3 7.15 18 2.517482
7.4 - 7.7 7.55 9 1.192052
N = 100 = f f
X
Sustituyendo los datos anteriores en la correspondiente ecuación tenemos:
H =
N
f
X
=
100
15.2632252
= 6.55
La media armónica calculada a partir de los datos agrupados es de 6.55 cm.
EJERCICIOS PROPUESTOS
1.- ¿Qué es una medida de tendencia central?
60. PROBABILIDAD Y ESTADÍSTICA
2.- Describa el proceso para la obtención de la Media Aritmética, la
Mediana y la Moda.
3.- ¿Qué criterio se sigue para determinar la medida de tendencia central
más significativa?
4.- Determine la Media, la Mediana, la Moda y la Media Geométrica de los
siguientes datos:
59
1 1 2 2 3 3 3 4
4 4 4 5 5 6 7 8
5.- Los siguientes datos representan el tiempo de vida en años de una
muestra aleatoria de 30 motores eléctricos similares.
2.0 3.0 0.3 3.3 1.3 0.4
0.2 6.0 5.5 6.5 0.2 2.3
1.5 4.0 5.9 1.8 4.7 0.7
4.6 0.3 1.5 0.5 2.5 5.0
1.0 6.0 5.6 6.0 1.2 0.2
a) Construya un cuadro estadístico.
b) Construya un Histograma, un Polígono de Frecuencias y un
Diagrama de Pastel.
c) Con los datos calcular la Media Aritmética, la Mediana y la
Moda.
61. PROBABILIDAD Y ESTADÍSTICA
60
MEDIDAS DE DISPERSIÓN
Cuando una población es generada por una variable numérica,
además de poderla describir mediante una medida de tendencia central,
también se puede obtener una medida que nos indique el grado de
homogeneidad de sus datos. A este tipo de medidas se les conoce como
medidas de variabilidad o de dispersión. Existen varias medidas de
dispersión, como son el Rango, la Desviación Media, la Varianza, y algunas
otras, las cuales estudiaremos en este capítulo.
RANGO: Es una medida de dispersión que se obtiene restando al
mayor elemento de la colección de datos, el elemento menor. Aunque el rango
es una medida que tiene la ventaja de calcularse fácilmente, tiene la
desventaja de sólo considerar los valores extremos de la población (También
se le conoce como Amplitud Total ).
DESVIACIÓN ESTÁNDAR
Esta medida nos indica que tan dispersos se encuentran en
promedio, los datos con respecto a la media aritmética. Existen dos tipos de
desviación estándar, la Desviación Estándar Muestral y la Desviación
Estándar Poblacional.
La Desviación Estándar Poblacional se calcula en base a la media
aritmética poblacional, utilizando la siguiente fórmula:
n
( X i
- ) ²
N
i = 1
donde: N = Tamaño de la Población.
62. PROBABILIDAD Y ESTADÍSTICA
61
= Media Aritmética Poblacional.
Xi = Elemento de la Población.
= Desviación Estándar Poblacional.
La desviación estándar nos puede indicar como se comportan los
datos alrededor de una medida de tendencia central y como en ocasiones a
pesar de tener el mismo valor dos muestras diferentes, en su medida de
tendencia central, el grado de dispersión es distinto. Pudiéramos tener una
muestra en que su media aritmética fuera 4 y que los datos oscilaran entre 3
y 5, y otra muestra que su media aritmética fuera 4 y que sus datos oscilaran
entre 0 y 8. Aunque ambas tienen el mismo valor en su medida de tendencia
central, tienen distinta distribución de los datos, de aquí la importancia de
tener una medida que nos indique el grado de dispersión de los datos con
respecto al dato central.
La Desviación Estándar Muestral tiene dos modificaciones con
respecto a la Poblacional, ya que se utiliza la media aritmética muestral y el
tamaño de la muestra menos 1, quedando la fórmula de la siguiente manera:
s =
( X i
- X )²
n - 1
n
i=1
donde: n = Tamaño de la Muestra.
Xi = Elemento de la Población
X = Media Aritmética Muestral.
s = Desviación Estándar Muestral.
63. PROBABILIDAD Y ESTADÍSTICA
Existe otra medida de dispersión llamada Desviación Media, que
requiere del cálculo de la Amplitud, aún cuando no es muy utilizada, es
necesario tener conocimiento de ella. Se obtiene con la siguiente fórmula:
62
m =
X i
- X
n
n
i=1
ahora bien, este tipo de medida de dispersión no nos proporciona un grado
adecuado de homogeneidad, por lo que es necesario utilizar el de la
desviación estándar para representar el grado de dispersión de la muestra con
respecto a su media, además, de que no sirve para calcular la varianza.
VARIANZA
Es el cuadrado de la desviación estándar. Dependiendo de la
desviación estándar de que se trate, recibirá el nombre de Varianza Muestral o
Varianza Poblacional ( s2 si es la muestral y 2 si es la poblacional ).
Veamos algunos ejemplos.
* Se tomó la presión sanguínea de diez personas antes y después
de fumar. Los cambios fueron:
+10, -5, +7, +4, +2, +3 -4, -5, -3, +9
Calcular la Varianza y Desviación Estándar con esos datos.
X =
10 5 7 4 2 3 4 5 3 9
10
=
18
10
= 1.8
s2 =
(10 - 1.8)² + (-5 - 1.8)² + + (-3 - 1.8)² + (9 - 1.8)²
10 - 1
s2 = 33.511
64. PROBABILIDAD Y ESTADÍSTICA
Como la desviación estándar es la raíz cuadrada de la varianza,
entonces tenemos que la desviación estándar de las diez presiones sanguíneas
registradas es: s = 5.788
63
* Dados los siguientes datos:
3, 5, 16, 23, 31, 12, 23, 13, 15.
a).- Calcular las medidas de tendencia central.
X =
3 5 16 23 31 12 23 13 15
9
=
141
9
X = 15.66
Ordenando los elementos tenemos que:
3 5 12 13 15 16 23 23 31
teniéndose que la mediana será el dato que se encuentre al centro del arreglo,
por lo tanto : Mediana = 15 La Moda = 23
b).- Calcular las medidas de Dispersión
s2 =
(3 - 15.66)² + (5 -15.66)² + + (23 -15.66)² + (31- 15.66)²
9 - 1
s2 =
160.27 +113.63 +13.39 + 7.07 + 0.43 + 0.12 + 3.87 + 53.87 + 235.31
8
637 .
96
8
79 .
745
por lo tanto, la desviación estándar es entonces: s = 79.745 = 8.93
* En el departamento de Inglés de la UAS se informó que el
sueldo anual de los profesores es en promedio de 72,000 dólares, con una
desviación estándar de 0.0 ¿Cuál será la mediana y la moda de estos sueldos?
R.- Tanto la Mediana y la Moda es 72,000; ya que cuando la
desviación estándar es 0, se tiene que no existe dispersión entre los valores de
la muestra (dicho de otra manera, no existe variación entre los datos).
65. PROBABILIDAD Y ESTADÍSTICA
* Si en una colonia se registró el número de personas que viven
por casa tomando una muestra de 18 viviendas, obteniéndose los siguientes
resultados:
64
6 5 6 4 9 2
8 4 5 3 3 5
6 5 7 2 5 7
determine la media aritmética, la varianza y desviación estándar de la
muestra.
X =
( ) ( ) ( ) ( ) ( ) ( )
2 2 2 3 2 4 5 5 3 6 2 7 8 9
18
=
92
18
= 5.11
s2 =
( X i
- X )²
n - 1
n
i=1
s2 =
2(2-5.11)²+2(3-5.11)²+2(4-5.11)²+5(5-5.11)²+3(6-5.11)²+2(7-5.11)²+(8-5.11)²+(9-5.11)²
18 - 1
s2 =
19.3442+8.9042+2.4642+0.0605+2.3763+7.1442+8.3521+ 15.1321
17
=
63 .
7778
17
s2 = 3.7516353
por lo tanto la desviación estándar es s = 1.9369135
* Calcule la media aritmética, la varianza y desviación estándar
de los siguientes datos: 5 7 1 2 4
X =
5 7 1 2 4
5
19
5
3 8
.
s2 =
(5 - 3.8)² + (7 - 3.8)² + (1- 3.8)² + (2 - 3.8)² + (4 - 3.8)²
5 - 1
22 .
8
4
s2 = 5.7 ;
por lo tanto la desviación estándar es : s = 2.3874673
66. PROBABILIDAD Y ESTADÍSTICA
65
CALCULO DE LA MEDIA Y DESVIACIÓN
ESTÁNDAR PARA DATOS AGRUPADOS
Generalmente cuando se agrupan en clases los datos generados
por una variable numérica, es posible calcular la media y la desviación
estándar con los datos tabulados. En estos casos, tanto la media como la
desviación estándar son aproximaciones de los valores reales, debido a que
uno conoce la cantidad de elementos que pertenecen a la clase, pero
desconocemos sus valores.
Para calcular la Media Aritmética de un conjunto de datos
agrupados, se emplea la siguiente fórmula:
( mi * fi ) ( mi * fi )
X= =
fi n
Donde: mi = Marca de Clase.
fi = Frecuencia de Clase.
n = Tamaño de la Muestra.
X = Media Aritmética.
Para el cálculo de la Varianza se utiliza:
s2
( m - X )² f
i i
n - 1
Existe otra forma de calcular la varianza, llamada forma
simplificada, la cual se obtiene sustituyendo en la fórmula de la varianza la de
la media, y al simplificar quedaría así:
67. PROBABILIDAD Y ESTADÍSTICA
66
s² =
i i i i
n (X)² f - (X f ) ²
n(n-1)
donde : n = Tamaño de la Muestra
Xi = Elemento de la Muestra
fi = Frecuencia de la Clase
La fórmula anterior es para calcular la Varianza de un grupo de
variables colocadas en un cuadro estadístico, para determinar la varianza de
un cuadro estadístico cuando esté agrupado por clases, entonces sustituimos
en el lugar de la variable ( Xi ) la marca de clase ( mi ) teniéndose entonces
que la fórmula a aplicar será:
n[ {(mi)2
* fi }] - [ ( mi * fi )]2
s2 =
n ( n - 1 )
donde : n = Tamaño de la Muestra
mi = Marca de Clase
fi = Frecuencia de Clase
En los dos casos anteriores, la Desviación Estándar se obtiene
sacando la raíz cuadrada de la Varianza.
INTERPRETACIÓN PRACTICA DE LA
DESVIACIÓN ESTÁNDAR
Introduciremos ahora un teorema interesante y útil, desarrollado
por el matemático ruso Tchebysheff. La demostración del teorema no es
difícil, pero la omitiremos para manejar directamente su significado.
68. PROBABILIDAD Y ESTADÍSTICA
El teorema de Tchebysheff dice : “ Dado un número k mayor o
igual a 1 y un conjunto de n observaciones x1, x2, x3, * * * , xn , por lo
menos ( 1 - 1/k2 ) de las observaciones se encuentran dentro de k
desviaciones estándar de la media ”.
El teorema de Tchebysheff se aplica a cualquier conjunto de
observaciones y, para propósitos de ilustración, nos podríamos referir tanto a
la muestra como a la población. Usaremos la notación correspondiente a
poblaciones, pero deben darse cuenta que bien podríamos usar la media
aritmética y la desviación estándar muestral. La idea contenida en el teorema
de Tchebysheff se ilustra en la siguiente figura:
67
k 1 - 1/k2
1
2 3/4
3 8/9
4 15/16
-3 -2 -1 0 1 2 3
Se construye un intervalo midiendo una distancia de k veces la
en unidades a ambos lados de la media aritmética . Note que el teorema
es cierto para cualquier valor que le demos a k , siempre y cuando k sea
mayor o igual a 1. Entonces, calculando la fracción 1 - 1/k2 , vemos que el
teorema de Tchebysheff establece que al menos esa fracción del número de
observaciones caerán en el intervalo construido.
Ponemos énfasis en la expresión “ al menos ” del teorema de
Tchebysheff porque el teorema es muy conservador, siendo aplicable a
69. PROBABILIDAD Y ESTADÍSTICA
cualquier distribución. En la mayoría de las situaciones, la fracción de las
observaciones que caen en el intervalo especificado excede a 1 - 1/k2.
Enunciaremos ahora una regla que describe con precisión la variabilidad de
una distribución particular en forma de campana y que describe
razonablemente bien la variabilidad de otras distribuciones de datos de forma
monticular. La frecuente ocurrencia de distribuciones acampanadas y
monticulares en la naturaleza, y por tanto la aplicabilidad de nuestra regla,
nos conduce a llamarla la “ regla empírica ”.
Regla empírica: Dada una distribución de observaciones que es
68
aproximadamente acampanada, el intervalo :
1) contiene aproximadamente el 68 % de las observaciones.
2) 2 contiene aproximadamente el 95 % de las observaciones.
3) 3 contiene todas o casi todas las observaciones.
Las relaciones anteriores las podemos mostrar por medio de una
gráfica en la cual se muestra la distribución en porcentajes de los datos
alrededor de la media aritmética.
-3 -2 - 2 3
68.27 %
95.45 %
99.95 %
70. PROBABILIDAD Y ESTADÍSTICA
La distribución acampanada se conoce comúnmente como la
Distribución Normal y será discutida con detalle en el capítulo 7. Lo que
quisiéramos recalcar aquí, es que la regla empírica es sumamente útil y
proporciona una descripción excelente de la variación para muchos tipos de
datos. Note que el Teorema de Tchebysheff es un hecho que puede ser
demostrado matemáticamente y sin embargo dejamos el razonamiento
matemático para un curso de Cálculo.
Aunque los porcentajes mencionados en la regla corresponden a
áreas bajo la curva normal, los mismos porcentajes son validos
aproximadamente para distribuciones con formas diversas, siempre que
tiendan a ser más o menos monticulares. Veamos algunos ejemplos.
* La media y varianza de un conjunto de n = 25 observaciones
son 75 y 100 respectivamente. Usando la regla empírica para describir esta
distribución tendríamos : Sabemos que = 75 y que 2 =100 . La
desviación estándar es = 10. La distribución de las observaciones esta
centrado alrededor de = 75, y la regla empírica establece que:
69
a) = 75 10 ; que el 68 % de las observaciones esta entre 65 y 85.
b) 2 = 7520; que el 95 % de las observaciones esta entre 55 y 95.
c) 3 = 7530; que todas o casi todas las observaciones se
encuentran entre 45 y 105.
* En la siguiente tabla se especifica la vida útil de una marca de
pilas que se utilizan en una misma marca de reloj.
Vida Útil
(Horas )
fi mi mi x fi ( mi )2 x fi
420 - 439 15 429.5 06,442.5 2’767,053.75
440 - 459 20 449.5 08,990.0 4’041,005.00
460 - 479 25 469.5 11,737.5 5’510,756.25
480 - 499 25 489.5 12,237.5 5’990,256.25
500 - 519 32 509.5 16,304.0 8’306,888.00
71. PROBABILIDAD Y ESTADÍSTICA
520 - 539 30 529.5 15,885.0 8’411,107.50
540 - 559 24 549.5 13,188.0 7’246,806.00
560 - 579 14 569.5 07,913.0 4’540,623.50
580 - 599 7 589.5 04,126.5 2’432,571.75
TOTALES 190 95,945.0 48’806,208.00
Obtener la Media Aritmética, la Varianza y Desviación Estándar
70
(por el método general y el simplificado).
( mi * fi ) 95,945
X= = = 504.97
n 190
La Varianza en su forma simplificada es :
n[ {(mi)2
* fi }] - [ ( mi * fi )]2
s2 =
n ( n - 1 )
s2 =
( )( ' , ) , ' , , ' ,
190 48806 208 9 273179 500 9 205443 000
35 ,
910
- (95,945)²
190(190 -1)
s2 =
67 ' 736 ,
500
35 ,
910
= 1,886.2852
por lo tanto : s = 43.43
si a continuación obtenemos la varianza en su forma general para datos
agrupados tendremos :
[( mi - X )2
* fi]
s2 =
n - 1
s2 =
(429.5-504.97)² (15)+ (449.5-504.97)² (20)+ +(569.5-504.97)² (14)+ (589.5-504.97)² (7)
190-1
72. PROBABILIDAD Y ESTADÍSTICA
71
s2 =
, . , . , .
85 435814 61 538 418 360 950 31
189
+ 58,297.693+ 50,017.246
189
s2 = 1,909.79
s = 1,909.79 = 43.701
Como podemos observar, no existe gran diferencia entre la
desviación estándar obtenida por la forma simplificada y la obtenida por la
forma general.
* Obtener la Varianza y Desviación Estándar para los siguientes
datos: 6, 3, 8, 5, 2
X =
6 3 8 5 2
5
24
5
4 8
.
s2 =
(6 - 4.8)² + (3 - 4.8)² + (8 - 4.8)² + (5 - 4.8)² + (2 - 4.8)²
5-1
s2 =
1.44 + 3.24 + 10.24 + 0.04 + 7.84
4
22 .
8
4
s2 = 5.7 por lo tanto s = 57 . = 2.387
* Los ingresos anuales de 12 profesores en nuevos pesos son:
72,000 72,000 75,000 81,000 163,000 78,000
81,000 89,000 72,000 90,000 84,000 81,000
Calcular la Varianza y Desviación Estándar.
La media aritmética se determino en el capitulo anterior, por lo que tenemos
que X = 86,500, por lo tanto la varianza es:
s2 =
(72,000 86,500)
² + + (163,000 - 86,500)²
12 1
73. PROBABILIDAD Y ESTADÍSTICA
72
s2 =
210 ' 250 , 000 + + 5,852' 250,000 6 , 803000 ' ,
000
11
11
s2 = 6.1845455 x 108
como la desviación estándar se obtiene sacando la raíz cuadrada a la
varianza, tenemos entonces que esta es: s = 24,868.746
* Se sabe que la frecuencia de respiración en los humanos puede
variar desde 4 respiraciones por minuto hasta 70 ó 75 para una persona que
realiza ejercicios extenuantes. Supongamos que las frecuencias de respiración
en estado de reposo, para estudiantes universitarios, poseen una distribución
de forma monticular con media 12 y desviación estándar 2.3 respiraciones por
minuto. ¿Qué fracción de los estudiantes poseen frecuencias en los siguientes
intervalos:
a).- 9.7 a 14.3 respiraciones por minuto?
Aplicando la regla empírica, tenemos que la relación de 9.7 a 14.3 es lo
mismo que señalar una desviación estándar alrededor de la media aritmética,
ya que 12 + 2.3 nos da el límite superior y 12 - 2.3 nos da el límite inferior, y
por tratarse de una relación con distribución monticular, tenemos que en ese
intervalo se encuentra el 68 % de los estudiantes o bien la fracción es 0.68
b).- 7.4 a 16.6 respiraciones por minuto?
Basándonos en el inciso anterior tenemos que la fracción que se
encuentra alrededor de la media a 2 desviaciones estándar es 0.95 o el 95 %
de los estudiantes.
c).- más de 18.9 o menos de 5.1 respiraciones por minuto?
En este inciso vemos que tenemos una relación alrededor de la media
de tres desviaciones estándar, por lo que se encuentran todos o casi todos los
estudiantes universitarios.
74. PROBABILIDAD Y ESTADÍSTICA
* La siguiente tabla muestra el concentrado de los resultados de
73
25 estudiantes universitarios:
2 x fi
Num C. Int. de Clase Frecuencia mi mi x fi mi
1 1.8 - 2.1 4 1.95 07.80 15.210
2 2.2 - 2.5 6 2.35 14.10 33.135
3 2.6 - 2.9 8 2.75 22.00 60.500
4 3.0 - 3.3 4 3.15 12.60 39.690
5 3.4 - 3.7 3 3.55 10.65 37.808
Totales 25 67.15 186.343
En base al cuadro estadístico, calcule la media aritmética, la
desviación estándar y la varianza
X=
( i i
6 7 .
1 5
.
m f )
n
2 5
2 6 8 6
s2 =
n (m)² f - m f ²
25(186.343)
n(n - 1)
- (67.15)²
25(25 - 1)
i i i i
s2 =
4,658.575 - 4,509.125
600
=
149.45
600
s2 = 0.25 ;
por lo tanto, la desviación estándar es : s = 0.5
75. PROBABILIDAD Y ESTADÍSTICA
74
EJERCICIOS PROPUESTOS
1.- ¿Qué es una medida de dispersión?
2.- Describa el proceso para la obtención de la Varianza.
3.- ¿Qué es el Rango?
4.- ¿Qué diferencia hay entre la forma simplificada para la obtención de la
Varianza y la forma general?
5.- Defina la desviación media.
6.- Los siguientes datos representan el tiempo de vida en años de una
muestra aleatoria de 30 motores eléctricos similares.
2.0 3.0 0.3 3.3 1.3 0.4
0.2 6.0 5.5 6.5 0.2 2.3
1.5 4.0 5.9 1.8 4.7 0.7
4.6 0.3 1.5 0.5 2.5 5.0
1.0 6.0 5.6 6.0 1.2 0.2
Calcular la Desviación Media , la Varianza y la Desviación Estándar.
7.- El cociente de inteligencia (CI) expresa la inteligencia como la razón
de la edad mental a la edad cronológica multiplicada por 100.
Así, el promedio cuando la edad mental es igual a la edad
cronológica es 100. Para los siguientes CI.
100 103 99 101 100 120 109 82
101 112 95 118 118 114 113 89
92 137 94 130 87 93 111 96
93 101 98 96 84 86 89 90
76. PROBABILIDAD Y ESTADÍSTICA
a) Construya un histograma de frecuencias relativas.
b) Calcule X , s2 y s.
c) Encuentre el número de puntuaciones en los intervalos X s;
X 2s y X 3s. Compare las proporciones de observaciones en
estos intervalos con las especificadas por el teorema de Tchebysheff
y la regla empírica.
75
77. PROBABILIDAD Y ESTADÍSTICA
En este capítulo veremos lo que es la Probabilidad, o sea, la
relación que existe entre la muestra y el conjunto original de datos, por eso
para poder tomar decisiones se necesita tener conocimientos de la
Probabilidad.
En general, la Estadística entra al método científico a través de la
experimentación o de la observación. Cualquier investigación es únicamente
un medio para lograr un fin determinado. Es un dispositivo para someter a
prueba una hipótesis establecida a partir de la cual desea hacerse una
conclusión. La mayor parte de los enunciados que resultan de investigaciones
son únicamente inferencias. Son de carácter incierto. La cuantificación de esa
incertidumbre por el uso de la Teoría de Probabilidades es una de las
contribuciones más importantes de la Estadística.
Probabilidad es una medida de la frecuencia de ocurrencia de un
evento casual. Una definición clara y simple de Probabilidad (definición
clásica), es:
“Si un evento puede ocurrir de N maneras mutuamente
exclusivas e igualmente posibles, y si n de ellas tienen una característica E ,
entonces la Probabilidad de ocurrencia de E es la fracción
76
n
N
. Esto se
acostumbra indicarlo o representarlo con P(E) =
n
N
.”
Para el estudio de la Probabilidad surge como necesidad el
estudio de la Teoría de conjuntos, por lo cual veremos a continuación su
definición y sus operaciones básicas.
78. PROBABILIDAD Y ESTADÍSTICA
77
CONJUNTOS Y SUS OPERACIONES
El estudio de la Probabilidad se simplifica utilizando la Teoría de
Conjuntos, por lo tanto, analizaremos algunas ideas básicas de esta teoría. La
Teoría de Conjuntos fue desarrollada por Georg Cantor entre 1874 y 1895, es
un instrumento básico que se utiliza en las distintas ramas de la Matemática,
como en la Teoría de Probabilidad, el Cálculo Infinitesimal, Geometría, etc.
Un Conjunto es un grupo de objetos dentro de un todo definido y
bien diferenciado; por ejemplo:
* Un grupo de estudiantes de la materia de Biología.
* Un juego de cartas.
* Las cuentas de un collar.
A continuación definiremos algunas de las operaciones y
símbolos que se utilizan en la Teoría de Conjuntos. A los conjuntos los
representamos con mayúsculas y a sus elementos con minúsculas.
* Conjunto Universo o Universal ( U ): Es el conjunto que contiene a
todos los elementos.
* Conjunto Vacío ( ): Es un conjunto que no contiene a ningún
elemento.
* Pertenencia ( ): Indica que un elemento pertenece a un conjunto.
* No Pertenencia ( ): Indica que un elemento no pertenece a un
conjunto determinado.
* Subconjunto ( ): Se dice que un conjunto A es subconjunto de
B, cuando todos los elementos de A pertenecen a B.
79. PROBABILIDAD Y ESTADÍSTICA
* Unión ( ): La unión de dos conjunto A y B, es el conjunto de
78
elementos que están en A, en B ó en ambos.
A B = { x / x A ó x B }
* Intersección ( ): La intersección de dos conjuntos A y B, es el
conjunto de elemento que están en A y B simultáneamente.
A B = { x / x A y x B }
* Complemento ( A', ~A, Ac ) : El conjunto A' , recibe el nombre
de complemento de A debido a que contiene a todos los elementos del
universo que no están en A.
A' = { x / x A }
Para la comprensión de los conjuntos se recomienda utilizar los
diagramas de Venn, que son la representación gráfica de los conjuntos y sus
operaciones.
U U U
A U B A B Ac
* Sea A = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t };
B = { a, e, i, o, u } ;
C = { b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t } y
el conjunto Universo el abecedario. Realizar las siguientes operaciones entre
conjuntos:
a) A U B ; b) A ( B U C ) c) ( A B ) U ( B C )
a) A U B = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t, u }
80. PROBABILIDAD Y ESTADÍSTICA
b) A ( B U C ) = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t } = A
c) ( A B ) U ( B C ) = { a, e, i, o }
* Sea U el conjunto de todos los valores posibles que pueden
caer al lanzar dos dados normales, defina los siguientes conjuntos : el
conjunto A contiene a todos los elementos en que la primera cara es mayor
que 3 pero menor que 6, A = { ( x, y ) / 3 < x < 6 ; 0 < y < 7 } ; el conjunto B
contiene a todos los elementos en que la suma de las caras es mayor que 5
pero menor que 8, B = { ( x, y ) / 5 < x + y < 8 }
79
Sea U =
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6)
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6)
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6)
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6)
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6)
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6)
entonces, A =
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6)
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6)
y B =
(1,5) ; (1,6) ; (2,4)
(2,5) ; (3,3) ; (3,4)
(4,2) ; (4,3) ; (5,1)
(5,2) ; (6,1)
¿QUE ES ESPACIO MUESTRAL?
El Espacio Muestral se define como el conjunto de todos los
resultados posibles de un experimento E, usualmente se designa a este
conjunto con la letra S. Un Espacio Muestral se puede representar por medio
de un diagrama de Venn, una línea recta, un producto cartesiano, etc.
Producto Cartesiano : Es el conjunto de todos los pares
ordenados de dos conjuntos A y B.
A X B = { (x , y) / x A , y B }
81. PROBABILIDAD Y ESTADÍSTICA
Debemos tener cuidado de respetar el orden de las parejas
ordenadas, ya que ( a, b ) es diferente de ( b, a ). Lo anterior puede describirse
con la siguiente gráfica:
80
A
M (a,b) c
N (b,a) b M
M N a N
B
a b c
El número de elementos del espacio muestral1 del Producto
Cartesiano es igual al producto del número de elementos de A por el de B.
Ejemplo: En la gráfica anterior se tiene un espacio muestral de 9 elementos, el
cual se obtuvo de n(A) x n(B).
* Dados los siguientes conjuntos:
U = { 1,5,7,13,15,18,23,29,37,48,63,71,96 }
A = { 1,5,7,13,15,18,23 } B = { 7,15,23,29,37,48,63 }
C = { 7,8 }
Obtener: a) A U B ; b) A' U A ; c) A B ; d) B' U A ; e) A X C
a).- A U B = { 1,5,7,13,15,18,23,29,37,48,63 }
b).- A' = { 29,37,48,63,71,96 }
A' U A = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } = U
c).- A B = { 7,15,23 }
1 Dentro de los espacios muestrales cuando tenemos un conjunto de varios elementos, el orden de estos
no se toma en cuenta, esto es, {a,b} y {b,a} son conjuntos equivalentes.
82. PROBABILIDAD Y ESTADÍSTICA
81
d).- B' = { 1,5,13,18,71,96 }
B' U A = { 1,5,13,15,23,71,96 }
e).- A X C = { (1,7);(1,8);(5,7);(5,8);(7,7);(7,8);(13,7);(13,8);
(15,7);(15,8);(18,7);(18,8);(23,7);(23,8) }
SUCESOS SIMPLES Y COMPUESTOS
En un conjunto de resultados posibles de un experimento E. Los
sucesos pueden ser Simples o Compuestos.
Consideremos el experimento de lanzar un dado y observar que
cara cae hacia arriba, la variable X tiene los resultados posibles X1, X2 ,* * *,
X6, cada uno de estos resultados se denomina Suceso Elemental Simple. En
otras palabras, un suceso simple es aquel que no se puede descomponer en
otros sucesos simples y se representa con Ei .
Un suceso que se puede descomponer en dos o más sucesos
simples se llama Suceso Compuesto, por ejemplo, en el lanzamiento de un
dado, la ocurrencia de X 3, es un Suceso Compuesto, ya que tendríamos que
el suceso E estaría constituido por todas las caras de el dado de valor mayor o
igual a 3, quedando de la siguiente manera : E = { 3,4,5,6 }.
Una vez definidos los sucesos, se expresarán ahora en términos
de la Teoría de Conjuntos. El conjunto Universo representará al espacio
muestral, mientras que los conjuntos que lo constituyan serán los sucesos
compuestos y sus elementos los sucesos simples.
83. PROBABILIDAD Y ESTADÍSTICA
82
PROBABILIDAD
La Probabilidad tiene dos enfoques, llamados enfoques de la
teoría de Probabilidades, los cuales son: El enfoque objetivo de la
probabilidad y el enfoque subjetivo de la probabilidad. En este cuaderno
definiremos únicamente el concepto de probabilidad y dejaremos el estudio
de estos enfoques a los cursos de Estadística del Nivel Superior.
El famoso matemático Jacobo Bernoulli señala que cuando no
hay fundamentos para preferir uno de los posibles resultados o sucesos a
cualquier otro, todos deben de considerarse que tienen la misma probabilidad
de ocurrir. El famoso matemático francés P. S. Laplace estableció este
concepto en su libro “A Philosophical Essay on Probabilities” de esta manera:
“La teoría de la probabilidad consiste en reducir todos los elementos de la
misma clase a cierto número de casos iguales o igualmente posibles, es decir,
que nosotros debemos estar igualmente indecisos ante su existencia para
determinar la cantidad de casos favorables para el suceso cuya probabilidad se
busca”. La relación de este número con el de todos los casos posibles es la
medida de la probabilidad, que, es por tanto sencillamente una fracción cuyo
numerador es el número de casos favorables y el denominador es el número
de todos los casos posibles (definición de probabilidad clásica).
Por otra parte, puesto que los cálculos de la probabilidad no
dependen de la experiencia, esto permite calcular las probabilidades sin
84. PROBABILIDAD Y ESTADÍSTICA
realizar una gran cantidad de ensayos. Este tipo de cálculos se denomina
algunas veces a priori.
En base a lo anterior podemos especificar algunos puntos
83
referentes a la teoría de probabilidades, los cuales son:
1.- Se asigna un número P(E) al suceso y lo da cuando la cantidad
de ensayos es grande, M/n y P(E) son iguales.
2.- En esta relación se define la probabilidad del suceso E como
el límite de M/n cuando n tiende a infinito. Matemáticamente este enfoque
se expresa así:
P(E) = l í m
M
n n
Veamos algunos ejemplos de cálculo de probabilidades.
* ¿Cuál es la probabilidad de que al lanzar dos dados legales, a)
la suma de las caras sea par? ; b) las caras sean diferentes? ; c) las caras sean
iguales?
S =
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6)
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6)
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6)
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6)
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6)
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6)
a).- P(A) =
M
n
=
18
36
=
1
2