SlideShare una empresa de Scribd logo
1 de 130
Descargar para leer sin conexión
Presentación
En el año 2000, la Universidad Autónoma de Guerrero (UAGro) llevó acabo su
tercer congreso general universitario, acontecimiento que tuvo resolutivos
importantes para darle a la universidad una identidad acorde a los tiempos
actuales.
Derivado del congreso, se diseñó el nuevo Modelo Educativo y Académico que en
el año 2005 fue aprobado por el H. Consejo Universitario. Tres años mas tarde (en
el 2008), dicho modelo se inicia en el bachillerato universitario con planes de
estudio centrados en el aprendizaje y en el estudiante, tratando con esto de ser
congruente con el nuevo modelo que contempla impartir una educación integral al
educando.
Al año siguiente (2009), la Secretaría de Educación Pública (SEP), acuerda darle
al bachillerato mexicano una educación integral; pero con enfoque en
competencias. Con esto, la SEP propone la Reforma Integral para la Educación
Media Superior (RIEMS), que fue aceptada por casi la totalidad de los diferentes
subsistemas de educación media superior del país, entre ellos, el bachillerato que
se imparte en la UAGro.
Para ajustarse a la RIEMS, el bachillerato de la UAGro, cambia la estructura de los
planes y programas que estaban diseñados en el aprendizaje y en el estudiante, a
otros nuevos (los actuales) que tienen la estructura del enfoque por competencias.
Pero no únicamente se diseñaron los nuevos planes, sino que se procedió a
capacitar al personal docente (profesores) para que a través de un Diplomado
conociéramos la RIEMS y cambiar nuestro trabajo docente por otro con enfoque
por competencias. Sumado a lo anterior, se “nos invitó” a varios profesores a
capacitarnos en escribir los textos de las asignaturas del bachillerato, trabajo que
hicimos con gran entusiasmo.
Se escribieron varios textos; pero resulta que faltó el de la materia de Estadística,
asignatura que se imparte únicamente en el cuarto semestre del bachillerato con
solamente 3 horas a la semana. En el quinto semestre aparece nuevamente; pero
con la etiqueta de optativa. Por desgracia, se tienen indicadores que muestran que
casi ninguna preparatoria de la UAGro oferta esta optativa y en consecuencia
nadie la cursa.
Desde mi opinión, este es un problema que debe resolverse. Por un lado,
incrementar el número de horas del cuarto semestre y por el otro, hacerla obligada
en el quinto. Esto lo justifico en el sentido que prácticamente todas las
licenciaturas contemplan al menos uno o dos cursos de Estadística y Probabilidad.
Consciente del problema anterior, se procedió a escribir los presentes apuntes,
que titulé “Estadística con enfoque a la Bioestadística” que tienen un doble
propósito: servir como material de apoyo tanto a profesores como a estudiantes
del bachillerato universitario y servir de igual manera a las mismas figuras; pero en
licenciaturas como enfermería o en aquellas donde se imparta la bioestadística
con enfoque a las ciencias de la salud.
Los apuntes se hicieron en base al programa de estudios por competencias que
actualmente existe en el bachillerato de la UAGro y aunque no están escritos con
la estructura de las competencias, considero que al no existir el texto
correspondiente puede ayudar en mucho tanto al alumno como al maestro.
Los apuntes se dividieron en dos partes: En la primera se trata de los Sucesos con
una variable; es decir, lo que tradicionalmente se conoce como la Estadística
Descriptiva. En la segunda, se trata el Azar y su medida; es decir, la Probabilidad.
Me sentiré satisfecho si se cumplen los propósitos mencionados.
Cd. Altamirano Gro, mes de agosto de 2013
JESÚS FERNÁNDEZ ALMAZÁN
Unidad Académica: Preparatoria No 8.
CONTENIDO
CONCEPTOS BÁSICOS 1
La estadística y su utilidad 1
¿Qué es la estadística? 1
Definición 1
Clasificación 1
Datos 2
Población 2
Muestra 2
Variable 2
PARTE I
ESTUDIOS DE SUCESOS CON UNA VARIABLE
LA ESTADÍSTICA DESCRIPTIVA
4
1 Recolección, ordenación, análisis e interpretación de datos 4
1.1 Recolección 4
1.2 Ordenación 4
1.3 Intervalos de clase 6
1.4 Distribución de frecuencias 7
1.5 Frecuencias acumuladas 7
1.6 Histograma y polígono de frecuencias 8
2 Medidas de tendencia central a partir de una colección de
datos.
13
2.1 Media aritmética 14
2.2 Mediana 15
2.3 Moda 17
3 Medidas de dispersión a partir de una colección de datos 19
3.1 Rango o recorrido 19
3.2 Desviación media 20
3.3 Varianza 23
3.4 Desviación estándar 25
4 Medidas de tendencia central y de dispersión a partir de
datos agrupados.
30
4.1 Media aritmética a partir de datos agrupados 31
4.2 Mediana a partir de datos agrupados 34
4.3 Moda a partir de datos agrupados 40
4.4 Varianza y desviación estándar a partir de datos
agrupados
41
PARTE II
EL AZAR Y SU MEDIDA
CONCEPTOS BÁSICOS DE PROBABILIDAD
INTRODUCCIÓN A LA ESTADISTICA INFERENCIAL
48
1 La probabilidad 48
2 Teoría de conjuntos 49
2.1 Definición de conjunto 49
2.2 Descripción de conjuntos 49
2.3 Tipos de conjuntos 51
2.4 Cardinalidad de un conjunto 51
2.5 Operaciones con conjuntos 52
3 Iniciación a la teoría de la probabilidad 57
3.1 Conceptos básicos 58
3.1.1 Experimento 58
3.1.2 Evento 58
3.1.3 Espacio muestral 59
3.1.4 Punto muestral 60
4 Enfoques de la probabilidad 60
4.1 Enfoque clásico o modelo de Laplace 61
4.2 Enfoque empírico 69
4.3 Enfoque subjetivo 72
5 Las técnicas de conteo 73
5.1 Listas de resultados 74
5.2 Diagramas de árbol 74
5.3 Fórmulas matemáticas 80
5.3.1 Ley fundamental de la multiplicación 80
5.3.2 Permutaciones 82
5.3.3 Combinaciones 86
6 Distribuciones de la probabilidad 89
6.1 Distribución con variable discreta 89
6.2 Distribución acumulada 92
6.3 Probabilidades como consideraciones teóricas 93
6.3.1 Distribución Binomial o de Bernoulli 94
6.3.2 Distribución de Poisson 100
6.3.3 Distribución normal 103
6.3.3.1 Ecuación matemática de la curva de distribución normal 104
6.3.3.2 Propiedades de la curva de distribución normal 108
6.3.3.3 Estandarización de datos o valores “z” 110
6.3.3.4 Significado geométrico de “z”. 114
6.3.3.5 Áreas bajo la curva de distribución normal 115
1
CONCEPTOS BÁSICOS
La estadística y su utilidad
Desde tiempos lejanos, el hombre ha usado datos para conocer su entorno o para
describir su región. Se sabe que en la época de Cristo, cierto día “José y María
llevaron al niño Jesús a registrarse en un censo ordenado por el rey Herodes”.
En la época actual, vivimos rodeado e inundado de las nuevas tecnologías:
celulares, computadoras, calculadoras digitales, televisiones planas y muy
modernas etc. A través de estos instrumentos, se escuchan noticias como “Las
estadísticas de la Procuraduría de Justicia de Guerrero indican que en el año 2012
se registraron 1539 extorsiones en Cd. Altamirano” o noticias como “La obesidad
de los niños de tierra caliente sigue en aumento. La estadística indica que en lugar
de consumir 800 calorías, los niños consumen cantidades entre 2000 o 2500”.
Así también la palabra estadística se escucha en los censos de población, en las
encuestas cuando vienen las elecciones, en los torneos de futbol etc. En fin
estamos rodeados de números, de datos, de informes que tratan de explicar lo
que sucede en algún fenómeno social o científico. Es la Estadística la que se
encarga de ordenarlos, analizarlos e interpretarlos.
Pero ¿Qué es la Estadística?
La palabra estadística proviene del vocablo latino “Estatus” que significa estado o
condición. Este vocablo se usó desde la época de la Edad Media para describir las
características del Estado: cuántas personas había en la ciudad, a cuántas se les
cobraban impuestos, cuántas contaban con determinado número de cabezas de
ganado, etc.
Pasaron los años y la necesidad de manipular colecciones de datos, hizo que
naciera la Estadística Teórica que tiene sus orígenes en el siglo XVIII. Con dicha
Estadística se establece un orden para recolectar datos, procesarlos e
interpretarlos. Con esto, se formaliza la Estadística.
Definición de Estadística.
Es la ciencia que brinda los instrumentos (métodos y técnicas) para recopilar,
organizar, presentar, analizar e interpretar información que apoye los procesos de
toma de decisiones en cualquier ámbito.
Clasificación de la Estadística.
Son dos ramas en que se divide la estadística:
2
 Estadística Descriptiva.
 Estadística Inferencial.
La Estadística descriptiva se apoya en las matemáticas para recolectar, ordenar,
analizar y presentar una colección de datos que se tomaron de alguna población o
de alguna muestra tomada de dicha población. Esto le sirve al investigador para
hacer predicciones, sacar conclusiones y tomar decisiones sobre el
comportamiento que puede tener la población o la muestra de la población donde
fue tomada.
La Estadística inferencial es la que se apoya en la teoría de las probabilidades y
las técnicas de muestreos para obtener ciertos juicios de la población en estudio.
Términos básicos usados en la Estadística.
Datos
Son los valores numéricos o tal vez características que se cuentan, observan o se
miden. Ejemplos de ellos pueden ser la colección de calificaciones de un grupo
escolar, las respuestas que se dan de alguna pregunta hecha en el Facebook, el
número de boletos vendidos para el concurso de la reina de la escuela, el número
de enfermos que ingresan a un hospital durante una semana, etc.
Población
También se le conoce como universo y es el conjunto finito o infinito de personas,
cosas u objetos que presentan características comunes.
Muestra
Es una parte representativa de una población. Su uso se debe a que existen
casos en que la población es muy grande y en consecuencia resulta difícil y a
veces imposible poderla contar; razón por la cual se recurre a una muestra
representativa. Los resultados que se obtengan, se hacen extensivos a la
población donde fue tomada.
Variable
Por variable entendemos toda característica que se estudia a cierto fenómeno,
acontecimiento o simplemente a un sujeto.
Comúnmente las variables suelen clasificarse en cualitativas y cuantitativas. Las
cualitativas se refieren a cualidades que no pueden medirse; así por ejemplo el
3
sexo de las personas o animales, la nacionalidad de un grupo de extranjeros que
llegaron a Cd. Altamirano, la responsabilidad de los alumnos de hacer las tareas,
el color de la piel de los habitantes del Estado de Guerrero, etc. Por su parte las
variables cuantitativas si pueden medirse usando números. Estas variables se
clasifican a su vez en continuas y discontinuas. Las continuas se pueden medir
con números enteros y fracciones; así por ejemplo las estaturas de los alumnos de
una escuela (existen medidas como 1.65 m, 1.72 m, 1.76 m etc), otro ejemplo
sería el peso de los niños al nacer (3.200 kg, 3.500 kg, 3.650 kg, etc). Por su
parte, las discontinuas se miden únicamente con números enteros; así por ejemplo
el número de hijos de las familias de tierra caliente (no puede decirse que una
familia tiene 4.56 hijos), el número de alumnos de cada grupo de la escuela (no
puede decirse que un grupo tiene 50. 45 alumnos), etc.
También existen otras variables conocidas como aleatorias. Estas variables se
asocian al término "azar". Así que una variable aleatoria no representa con certeza
el valor que tomará al ser medida o determinada. Ejemplo de esto sería un caso
como el siguiente: Existe una epidemia de cólera donde se trata de conocer el
índice de propagación. Para ello, una persona cualquiera (tomada al azar) puede o
no estar enferma y en consecuencia, no se sabe con certeza que suceso va a
ocurrir, es decir, tal vez se enferme o tal vez no. Aquí entra la probabilidad de que
tal vez la persona elegida enferme. Esta persona es una variable aleatoria.
4
PARTE I
ESTUDIO DE SUCESOS CON UNA VARIABLE.
LA ESTADÍSTICA DESCRIPTIVA.
Anteriormente dijimos que la Estadística Descriptiva se encarga de recolectar,
ordenar, analizar y presentar una colección de datos que se tomaron de alguna
población o de alguna muestra de ella. Con esto, se pretende hacer predicciones,
conjeturas y tomar decisiones en apego a los resultados encontrados.
1. RECOLECCIÓN, ORDENACIÓN, ANÁLISIS E INTERPRETACIÓN DE DATOS
1.1.-La recolección de datos
Consiste en recoger la información cualitativa o tal vez cuantitativa necesaria para
estudiar algún proceso. Los datos que se recogen son las variables.
Cuando se aplica la estadística al área de las ciencias de la salud, se le conoce
como Bioestadística. Aquí los principales métodos para la recolección de los datos
son las encuestas, los experimentos, los censos y los sistemas de registro.
No abundaremos en detalle de estos métodos, ni tampoco aplicaremos el rigor de
las matemáticas; sino mas bien, nos concretamos a resolver casos de la vida real.
1.2.- Ordenación de datos.
Cuando se recogen las variables de alguna población, comúnmente le llegan al
investigador en forma desordenada. Para poder trabajarlas, necesitamos darles un
orden y para ello, procedemos a colocarlas en forma ascendente, colocando en
primera instancia el valor mas pequeño y terminar con el mas grande.
Ejemplo 1.- La tabla siguiente muestra los pesos en gramos de tumores malignos
que le fueron extirpados a 57 personas. Se pide:
Trazar:
1. Construye una tabla donde ordenes los datos (de menor a mayor)
2. Calcula el número de intervalos de clase y su ancho correspondiente para
propósitos de tabulación.
3. Construye una tabla de distribución de frecuencias.
5
4. Construye una tabla de frecuencias acumuladas y frecuencias relativas
acumuladas.
5. Construye un histograma y un polígono de frecuencias.
Tabla:
68 65 12 22
63 43 32 43
42 25 49 27
27 74 38 49
30 51 42 28
36 36 27 23
28 42 31 19
32 28 50 46
79 31 38 30
27 28 21 43
22 25 16 49
23 45 24 12
24 12 69
25 57 47
44 51 23
Solución:
Ordenación de los datos de menor a mayor.
12 27 42 63
12 27 42 65
12 27 42 68
16 28 43 69
19 28 43 74
21 28 43 79
22 28 44
22 30 45
23 30 46
23 31 47
23 31 49
24 32 49
24 32 49
25 36 50
25 36 51
25 38 51
27 38 57
6
1.3.- Número de intervalos de clase y su ancho correspondiente.
Para analizar y presentar los datos los vamos a agrupar en intervalos de clase y
para ello, calculemos primero el número de intervalos en los cuales los vamos
agrupar.
El número de intervalos se deja casi siempre a juicio de un experimentado
investigador; pero muchas veces se hace uso de una fórmula propuesta por
Sturges. Esta fòrmula dice:
K = 1 + 3.322 (LOG10 N)
Donde:
K = Número de intervalos de clase.
N= Número de datos
LOG10 = Logaritmo base 10 que se puede calcular usando una calculadora.
Para el ejemplo que nos ocupa, tendremos que:
K = 1 + 3.322(LOG 57) = 1 + 3.322(1.7559) = 6.833
Aceptemos 7 como el número de intervalos.
Calculemos ahora la amplitud (A) o ancho de los intervalos propuestos. Esta
amplitud se puede calcular dividiendo el recorrido de los datos entre el número de
intervalos. El recorrido se obtiene restando el valor del dato mayor menos el valor
del dato menor.
Recorrido = 79 – 12 = 67.
Amplitud o ancho del intervalo = A = 6.9
7
67Re

K
corrido
Aceptemos el valor 10 como ancho del intervalo
Resumen.
Los intervalos serán:
7
Intervalo 1 A = de 10 a 19 = 10
Intervalo 2 A = de 20 a 29 = 10
Intervalo 3 A = de 30 a 39 = 10
Intervalo 4 A = de 40 a 49 = 10
Intervalo 5 A = de 50 a 59 = 10
Intervalo 6 A = de 60 a 69 = 10
Intervalo 7 A = de 70 a 79 = 10
1.4.- Tabla de distribución de frecuencias.
Construyamos una tabla que nos indique qué intervalo de clase es el mas
frecuente y cual será el de menor frecuencia.
Intervalo de clase Tarjado Frecuencia
“f”
10-19 5
20-29 19
30-39 10
40-49 13
50-59 4
60-69 4
70-79 2
TOTAL DE DATOS = 57
La tabla indica que el intervalo mas frecuente es de 20 a 29; es decir, el mayor
número de tumores malignos extirpados se tiene entre 20 y 29 gramos de peso.
Por su parte el intervalo menos frecuente se tiene en el intervalo de 70 a 79; es
decir, es el menos frecuente, o sea, son poco frecuentes los enfermos que tienen
tumores malignos con pesos entre 70 y 79 gramos.
1.5.- Tabla de frecuencia acumulada, frecuencia relativa de ocurrencia y
frecuencia relativa acumulada:
Intervalo de
clase
IC
Frecuencia
f
Frecuencia
acumulada
fa
Frecuencia
relativa de
ocurrencia
fr =
57
f
N
f

Frecuencia
relativa
acumulada.
fra
10-19 5 5 0.0877 0.0877
20-29 19 24 0.3333 0.4210
30-39 10 34 0.1754 0.5964
40-49 13 47 0.2281 0.8245
8
50-59 4 51 0.0702 0.8947
60-69 4 55 0.0702 0.9649
70-79 2 57 0.0351 1.0000
TOTALES 57 1.0000
La columna 4 que indica la frecuencia relativa acumulada, nos señala el
porcentaje (en forma decimal) de la ocurrencia de cada intervalo de clase. Ahí
vemos que el porcentaje mayor de ocurrencia se tiene en el intervalo de 20 a 29
donde se tiene un 33.33% de ocurrencia y el menor porcentaje lo presenta el
intervalo de 70 a 79.
1.6.- El histograma y el polígono de frecuencias.
La distribución de frecuencias (f) puede representarse en forma gráfica usando un
histograma. Para esto, se hace uso de un sistema de ejes cartesianos. En el eje
horizontal (conocido como de las “x”) se dibujan los intervalos de clase (utilizando
su ancho “A”) y en el eje vertical (conocido como de las “y”) se marcan las
frecuencias (f) de cada intervalo.
Nota: en el problema que estamos resolviendo, vemos que los intervalos son de
10 a 19, de 20 a 29, de 30 a 39 etc. Así que del valor 19 (del primer intervalo) al
valor 20 (del segundo intervalo), existe UN UNO de diferencia el cual debe
tomarse en cuenta al dibujar la gráfica. Lo mismo sucede entre el valor 29 del
segundo intervalo con el valor 30 del tercero, donde también existe UN UNO de
diferencia que debe tomarse en cuenta. Algo parecido sucede con el resto de
intervalos.
Para subsanar lo anterior, lo que podemos hacer es iniciar con el primer intervalo
en el valor 9.5 y terminar su ancho en 19.5, teniendo de todas formas un ancho de
10. Para el segundo intervalo, lo iniciamos en 19.5 y terminamos su ancho en
29.5, cuyo ancho sigue siendo 10. Algo parecido hacemos con el resto de los
intervalos. De acuerdo a esto, los intervalos a dibujar serían así:
Primer intervalo de 9.5 a 19.5
Segundo intervalo de 19.5 a 29.5
Tercer intervalo de 29.5 a 39.5
Cuarto intervalo de 39.5 a 49.5
Quinto intervalo de 49.5 a 59.5
9
Sexto intervalo de 59.5 a 69.5
Séptimo intervalo de 69.5 a 79.5
Debe observarse que los valores reales de los intervalos están dentro del
polígono. Recordemos que el dato menor era 12 y el mayor era 79 que estarían
dentro del histograma.
Dibujemos este histograma:
El área de cada barra nos indica la frecuencia de ocurrencia de los valores
comprendidos entre los límites de la escala horizontal. Así por ejemplo la segunda
barra (o celda) es la frecuencia relativa de ocurrencia de los valores comprendidos
entre 19.5 y 29.5. En forma parecida se tienen las frecuencias relativas de las
otras barras (o celdas).
2
4
6
8
10
12
14
16
18
20
F r e
c u e
n c i
a
“f”
9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5
I n t e r v a l o d e c l a s e IC
10
Otra forma de explicar esto, sería:
La barra 1 representa el
57
5
del área del histograma.
La barra 2 representa el
57
19
del área del histograma
La barra 3 representa el
57
10
del área del histograma
La barra 4 representa el
57
13
del área del histograma
La barra 5 representa el
57
4
del área del histograma
La barra 6 representa el
57
4
del área del histograma
La barra 7 representa el
57
2
del área del histograma.
Nota: la suma de todas estas fracciones es 1
57
57

Ahora dibujemos el polígono de frecuencias.
Este polígono representa otra forma de representar a la distribución de
frecuencias. Para trazarlo se marcan los puntos medios de la parte superior de
cada una de las barras que representan a los intervalos de clase. Se unen dichos
puntos y se tiene el polígono de frecuencias.
Veamos el trazo de este polígono:
11
POLÍGONO DE FRECUENCIAS
Nota: El área total del polígono de frecuencias, es igual al área del histograma.
TAREA: Hagan equipos de 5 estudiantes y resuelvan los problemas siguientes.
Problema.- En el hospital regional de Coyuca de Catalán se practicaron 100
exámenes de niveles de glucosa a igual número de niños. Los resultados
encontrados se reportaron en la tabla siguiente. Se pide:
Construye una tabla donde ordenes los datos (de menor a mayor)
1. Calcula el número de intervalos de clase y su ancho correspondiente para
propósitos de tabulación.
2. Construye una tabla de distribución de frecuencias.
14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.54.5
2
4
5
10
13
19
F r e
c u
e n
c i a
f
I n t e r v a l o d e c l a s e IC
Polígono de frecuencias
12
3. Construye una tabla de frecuencias acumuladas y frecuencias relativas
acumuladas.
4. Construye un histograma y un polígono de frecuencias.
Tabla reportada:
56 61 57 77 62 75 63 55 64 60
60 57 61 57 67 62 69 67 68 59
65 72 65 61 68 73 65 62 75 80
66 61 69 76 72 57 75 68 81 64
69 64 66 65 65 76 65 58 65 64
68 71 72 58 73 55 73 79 81 56
65 60 65 80 66 80 68 55 66 71
72 73 73 75 75 74 66 68 73 65
73 74 68 59 69 55 67 65 67 63
67 56 67 62 65 75 62 63 63 59
Problema.- A 45 enfermos de la clínica del ISSSTE en Cd. Altamirano, se les
aplicó un anestésico para que durmieran. La tabla siguiente reportada por una
enfermera muestran los resultados en horas. Se pide calcular lo siguiente:
1. Construye una tabla donde ordenes los datos (de menor a mayor)
2. Calcula el número de intervalos de clase y su ancho correspondiente para
propósitos de tabulación.
3. Construye una tabla de distribución de frecuencias.
4. Construye una tabla de frecuencias acumuladas y frecuencias relativas
acumuladas.
5. Construye un histograma y un polígono de frecuencias.
Tabla reportada por la enfermera:
7 10 12 4 8 7 3 8 5
12 11 3 8 1 1 13 10 4
4 5 5 8 7 7 3 2 3
8 13 1 7 17 3 4 5 5
3 1 17 10 4 7 7 11 8
Problema.- Se aplicó un examen de matemáticas a 40 estudiantes del grupo 402
turno matutino de la Preparatoria No 8 de Cd. Altamirano. Las calificaciones
obtenidas se muestran en la tabla siguiente. La escala usada por el maestro es de
0 a 100.
13
Se pide hagas lo siguiente:
1. Construye una tabla donde ordenes los datos (de menor a mayor)
2. Calcula el número de intervalos de clase y su ancho correspondiente para
propósitos de tabulación.
3. Construye una tabla de distribución de frecuencias.
4. Construye una tabla de frecuencias acumuladas y frecuencias relativas
acumuladas.
5. Construye un histograma y un polígono de frecuencias.
Tabla de calificaciones obtenidas por los alumnos:
56 78 62 37 54 39 62 60
28 82 38 72 62 44 54 42
42 55 57 65 68 47 42 56
56 56 55 66 42 52 48 48
47 41 50 52 47 48 53 68
2.- LAS MEDIDAS DE TENDENCIA CENTRAL A PARTIR DE UNA COLECCIÓN
DE DATOS.
En muchos problemas de la vida real es de interés conocer el centro del problema.
Se habla muchas veces que el centro de la república mexicana es el Distrito
Federal, que el centro de una población es el zócalo, que el centro de nuestro
cuerpo es el corazón, etc.
Si algo parecido a lo anterior lo lleváramos a una colección de datos que fueron
obtenidos de una población o de alguna muestra de ella, tendríamos una idea de
“hacia donde tienden dichos datos respecto a un centro”. Para medir estas
tendencias se usan ciertas medidas, siendo las mas conocidas las siguientes:
1. La media aritmética.
2. La mediana
3. La moda.
Si los datos que se usen son la totalidad de la población, entonces las medidas
antes mencionadas (media aritmética, mediana y moda) se les conoce como
parámetros; pero si los datos son de una muestra tomada de la población,
entonces a dichas medidas se les nombra medidas estadísticas o simplemente
estadística.
Veamos el significado de cada una de estas medidas:
14
2.1.- La media aritmética.
Esta medida es lo que comúnmente conocemos como “el promedio” o “la media”.
Recordemos que el promedio es una división donde el numerador es la suma de
todos los valores; que para nuestro caso, sería la suma de los datos y el
denominador es el número de valores, que para nuestro caso, sería el número de
datos.
Si la media que se calcula se hace con los datos de la población (no de una
muestra), se tendrá lo siguiente:
µ =
N
x
N
i
i1
Donde:
µ es la media aritmética de la población.

N
i 1
es la suma o sumatoria de todos los datos de la población
N es el número de sumandos que tiene la sumatoria, es decir, el número de
datos.
Cuando la media se calcula con los datos de una muestra (no de toda la
población), se usa un cociente parecido. Esto es lo siguiente:
x =
n
x
n
i
i1
Donde:
x es la media aritmética de la muestra
15

n
i 1
es la suma o sumatoria de los datos de la muestra.
n es el número de datos que contiene la muestra.
Veamos el ejemplo siguiente:
Problema.- la tabla siguiente, indica una muestra constituida por 5 datos (o
valores) que en forma aleatoria se tomaron de una población formada por cien
valores. Estos datos corresponden a las edades de enfermos de diarrea que
ingresaron al Centro de Salud de Cutzamala Gro.
Dato de la población
Dato tomado de la
población para tener LA
MUESTRA.
Dato
X12 es el enfermo 12 X1 10
X20 es el enfermo 20 X2 54
X36 es el enfermo 36 X3 21
X62 es el enfermo 62 X4 33
X98 es el enfermo 98 X5 53
Se pide calcular la media aritmética:
Solución:
Empleando la fórmula para la muestra:
x = n
x
n
i
i1
x = 2.34
5
171
5
5333215410


La media aritmética o promedio será entonces 34.2
2.2.- La mediana.
16
La mediana es aquel valor que divide a un conjunto de valores en dos partes
iguales, tales que el número de valores iguales a la mediana o mayores que ella,
es igual al número de valores iguales a ella o menores que ella.
Se recomienda el siguiente algoritmo para calcularla:
1. Se ordenan los datos de menor a mayor.
2. Si el número de datos es impar, la mediana será el valor que está en medio.
3. Si el número de datos es par, no se tiene una sola observación en medio,
sino dos. La mediana será la media aritmética de estas dos observaciones.
Veamos el siguiente ejemplo:
Problema.- Calcular la mediana a los 5 valores o datos de la muestra que se tomó
de la población de 100 valores de los enfermos reportados con diarrea del Centro
de Salud de Cutzamala Gro.
Solución.
Aplicando el algoritmo.
1.- Ordenando los datos tendremos: 10 21 33 53 54
2.- El numero de datos es impar (son 5), entonces la mediana es el valor que está
en medio o sea 33.
10 21 33 53 54
Problema.- Calcular la mediana a una muestra constituida por 6 valores que se
tomaron de la misma población del Centro de Salud de Cutzamala Gro.
Muestra reportada: 22 15 18 23 9 31
Solución:
Aplicando el algoritmo.
1.- Ordenando los datos de menor a mayor: 9 15 18 22 23 31
2.- El número de datos es par (son 6), entonces la mediana será el promedio de
los dos valores centrales.
Mediana
17
9 15 18 22 23 31
Valores centrales
Mediana = 20
2
40
2
2218


2.3.- La moda.
La moda de una colección de datos (valores), es aquel dato (valor) que se
presenta con mayor frecuencia. Si la colección tiene puros datos diferentes
entonces no hay moda.
Veamos los ejemplos siguientes:
Problema.- Una muestra de datos tomados de una población fueron: 4, 7, 11, 15,
15, 18, 21 y 27. Esta muestra se refiere a edades de enfermos que ingresaron al
Centro de Salud de Cd. Altamirano presentando síntomas de gripe.
Se pregunta ¿Cuánto vale la moda de esa muestra?.
Solución:
Analizando la muestra vemos que el dato que mas se presenta es 15, entonces el
valor de la moda es 15.
Problema.- En el conjunto de valores 20, 31, 20, 20, 34, 22, 24, 27, 27 y 27
¿Cuánto vale la moda?.
Solución:
Analizando los datos, se tienen 2 modas: 20 y 27.
Problema.- En la colección de datos: 10, 21, 33, 53, 54 y 60. ¿Cuánto vale la
moda?.
Solución. La colección NO TIENE MODA.
TAREA.
18
Formen equipos de 5 estudiantes y resuelvan los problemas siguientes.
Problema.- Los valores de la tabla siguiente son los niveles de glucosa en sangre
extraída a 10 niños en ayunas.
Niño No. Nivel de glucosa Niño No. Nivel de glucosa
1 56 6 65
2 62 7 65
3 63 8 68
4 65 9 70
5 65 10 72
Se pide que calculen:
1. La media
2. La mediana
3. La moda.
Problema.- Los contenidos de nicotina en una muestra aleatoria de 6 cigarros de
cierta marca fueron: 2.3, 2.7, 2.5, 2.9, 3.1 y 1.9 miligramos.
Se pide que calculen:
La mediana de la muestra.
Problema.- Los donativos para construir una aula en la Preparatoria No 8 de los
habitantes de la colonia Esquipulas de Cd. Altamirano fueron: 9, 10, 5, 9, 9, 7, 8, 6,
10 y 11 dólares.
Se pide calcular la moda de dicha colección.
Problema.- Quince pacientes que vinieron de diferentes lugares, realizaron una
visita a un Departamento Sanitario que existe en Tanganhuato. Los pacientes
recorrieron las distancias indicadas en la tabla siguiente.
Paciente
No
Distancia en
Km
Paciente
No
Distancia en
Km
Paciente
No
Distancia en
Km
1 5 6 13 11 3
2 9 7 12 12 15
3 11 8 6 13 12
19
4 3 9 13 14 15
5 12 10 7 15 5
Se pide calcular:
1. La media de las distancias recorridas por los pacientes.
2. La mediana de las distancias recorridas.
3.-MEDIDAS DE DISPERSIÓN A PARTIR DE UNA COLECCIÓN DE DATOS.
La dispersión de una colección de datos o valores, se refiere a la variabilidad que
presentan. Si tuviéramos por ejemplo una colección de datos como 35,35,35,35,35
y 35, su variabilidad es cero; es decir, tanto la media aritmética, la mediana y la
moda serían 35 o sea iguales. Pero esto nunca sucede y por lo tanto la
variabilidad existe.
Así que en una colección de datos, no basta con las medidas de tendencia central
(media aritmética, mediana y moda) para conocer ciertos aspectos de los datos y
se recurre a otras medidas llamadas de dispersión. Esto significa entonces que en
una colección de datos son necesarias tanto las medidas de tendencia central
como otras llamadas de dispersión.
Las medidas de dispersión mas usadas son:
1. El Recorrido o Rango.
2. La desviación media y la varianza.
3. La desviación Estándar (que no es otra cosa que una medida de
desviaciones).
3.1.-Recorrido o rango.
En una colección de datos, el Rango se calcula restando al dato mayor el dato
menor.
Ejemplo: Pensemos que de la Rectoría de Chilpancingo, le pidieron al Director de
la Preparatoria 8 enviara una relación de los sueldos quincenales de los 19
maestros que aquí trabajan.
El Director envió el cuadro siguiente:
20
Trabajador
No
Sueldo
quincenal
Trabajador
No
Sueldo
quincenal
Trabajador
No
Sueldo
quincenal
1 $1400.00 8 $2000.00 15 $7000.00
2 $1500.00 9 $6000.00 16 $1500.00
3 $3000.00 10 $1400.00 17 $7500.00
4 $4000.00 11 $2000.00 18 $2000.00
5 $2000.00 12 $2500.00 19 $3000.00
6 $6500.00 13 $1500.00
7 $7000.00 14 $7500.00
El Rango de la colección de datos será: R = 7500 – 1400 = 6100
En realidad el rango no indica algo significativo. Su valor es muy escueto y poco
se usa. Esto lo podemos constatar si existiera un valor muy grande “o disparado”
respecto a los otros. Si en la tabla hubiera por ejemplo un trabajador con sueldo
de $15000.00, entonces el rango sería:
R = 15000 – 1400 = 13600 el cual no es representativo para la variabilidad de los
otros datos.
3.2.-La desviación media.
La desviación media es una media o promedio de todas las desviaciones con
respecto a la media.
Supongamos por ejemplo que tuviéramos el conjunto de datos 5, 10,15, 20, 25, 30
y 35. La media (promedio) de dicho conjunto es 20. Si quisiéramos conocer la
desviación de cada dato, tendríamos:
La desviación de 5 con respecto a la media será: 5 – 20 = - 15
La desviación de 10 con respecto a la media será: 10 – 20 = - 10
La desviación de 15 con respecto a la media será: 15 – 20 = - 5
La desviación de 20 respecto a la media será: 20 – 20 = 0
La desviación de 25 con respecto a la media será: 25 – 20 = 5
La desviación de 30 con respecto a la media será: 30 – 20 = 10
La desviación de 35 con respecto a la media será: 35 – 20 = 15
21
Si observamos, la suma de todas las desviaciones con respecto a la media es
cero.
Si a la media o promedio lo llamamos x y al dato lo llamamos x entonces la
Desviación Media (DM) se calcula por la fórmula siguiente:
N
xx
DM
 

El numerador es la sumatoria de las restas, pero en valor absoluto. Esto se hace
para evitar los signos negativos (recordemos que el valor absoluto de cualquier
número sea positivo o negativo, siempre es positivo).
En la fórmula anterior, DM es la desviación media y N es el número de datos que
componen a la colección (o sea el número de datos de la población).
Para la colección de datos del ejemplo anterior, tendremos que la desviación
media sería:




7
51015051015
DM 57.8
7
60

Debemos observar que el valor absoluto de los números negativos son siempre
números positivos.
Calculemos ahora la Desviación Media de los sueldos de los 19 maestros de la
Preparatoria 8 que la Rectoría le solicitó al Director de la Preparatoria 8.
Primero arreglemos los datos del valor menor al valor mayor:
Trabajador
No
Sueldo
quincenal
Trabajador
No
Sueldo
quincenal
Trabajador
No
Sueldo
quincenal
1 1400 8 2000 15 6500
2 1400 9 2000 16 7000
3 1500 10 2500 17 7000
22
4 1500 11 3000 18 7500
5 1500 12 3000 19 7500
6 2000 13 4000
7 2000 14 6000
Ahora calculemos la media o promedio x de la colección de datos:
19
)2(7500)2(7000650060004000)2(30002500)4(2000)3(1500)2(1400 
x = 3647
19
69300

Ahora calculemos los valores absolutos xx 
224736471400 
214736471500 
164736472000 
114736472500 
64736473000 
35336474000 
235336476000 
285336476500 
335336477000 
385336477500 
Calculemos la Desviación Media:
23
19
)2(3853)2(335328532353353)2(6471147)4(1647)3(2147)2(2247 
DM
84.2101
19
39935
DM
3.3.-La varianza.
Como ya se trató, el uso de la Desviación Media (DM), exige la necesidad de usar
el valor absoluto y se hace con el propósito de evitar los signos negativos. Para
salvar este obstáculo, se opta por elevar al cuadrado a la resta ( )xx  y con ello
los valores siempre serán positivos. Esto da lugar a lo que se conoce como
varianza que no es otra cosa que una media de la dispersión de los datos. A la
varianza se acostumbra escribirla como S2
.
Así que la varianza será la fórmula siguiente:
S2
=
N
xx  2
)(
Nota. El valor “N” se refiere al número de datos que corresponden a la población.
Algunos autores proponen que si se trata de calcular la varianza de una muestra
extraída de una población, entonces la fórmula de la varianza debe ser:
S2
=
1
)( 2


n
xx
n = número de datos de la muestra.
El hecho de restarle un uno a la “n”, es para considerar el grado de libertad de la
muestra extraída de la población.
24
Ejemplo1.
Calcular la varianza de la colección de los 19 sueldos de igual número de
trabajadores que la Rectoría de la UAG solicitó al Director de la Preparatoria 8.
Solución.
Aplicando la fórmula correspondiente:
S2
=
N
xx  2
)(
Por facilidad, hagamos una tabla:
Recordemos que la media (promedio) es:
x = 3647
19
69300

Sueldo
(x)
Frecuencia
“f”
Totales
(x)(f)
(x - )x 2
)( xx  2
)( xxf 
1400 2 2800 -2247 5049009 10098018
1500 3 4500 -2147 4609609 13828827
2000 4 8000 -1647 2712609 10850436
2500 1 2500 -1147 1315609 1315609
3000 2 6000 -647 418609 837218
4000 1 4000 353 124609 124609
6000 1 6000 2353 5536609 5536609
6500 1 6500 2853 8139609 8139609
7000 2 14000 3353 11242609 22485218
7500 2 15000 3853 14845609 29691218
 69300  102907371
La varianza será:
S2
= 5416177
19
102907371

Nota: Debe observarse que se usó la última columna que contiene los productos
de 2
)( xxf  . Esto se hizo para tomar en cuenta a las frecuencias de los valores.
25
3.4.- La desviación estándar.
Al calcular la varianza tuvimos que elevar al cuadrado a la resta )( xx  ; esto
origina que resulten unidades cuadradas, lo cual no representa a las medidas
originales que deben ser lineales. Para obtener estas medidas bastará con extraer
la raíz cuadrada a S2
y el problema estaría resuelto. La raíz aplicada a S2
se le
conoce como Desviación Estándar que contiene las medidas originales.
De acuerdo a lo anterior, la desviación estándar se calcula con cualquiera de las
dos fórmulas siguientes:
Desviación Estándar = S =
N
xx
S
2
2 )( 

Esto, cuando se trata de una población completa, siendo “N” el número de datos o
elementos de la población.
Desviación Estándar = S =
1
)( 2
2



n
xx
S
Esto, cuando se trata de una muestra tomada de una población, siendo “n” el
número de datos o elementos de la muestra.
Conocida la Desviación Estándar, se puede calcular el coeficiente de variación,
el cual se obtiene dividiendo a la Desviación Estándar entre la media aritmética (o
promedio); pero en por ciento.
Si llamamos C.V. al coeficiente de variación, éste se calculará de la forma
siguiente:
C.V = )100(
x
S
26
Ejemplo 1.
Calcular la Desviación Estándar “S” y el coeficiente de variación (CV), a la
colección de sueldos que la Rectoría de la UAG solicitó al Director de la
Preparatoria 8.
Solución:
La varianza fue: S2
= 5416177
La Desviación Estándar será: S = 26.232754161772
S
El coeficiente de variación será: C.V = 8.63)100(638.0
3647
26.2327
)100( 
x
S
Ejemplo 2.
Las edades de 6 niños que presentaron síntomas de diarrea en el municipio de
Pungarabato, fueron 2, 4, 6, 8, 10 y 12 años.
Calcular:
1. La media aritmética
2. La desviación media
3. La varianza
4. La desviación Estándar.
5. El coeficiente de variación.
Solución:
La media aritmética:
x = n
x
n
i
i1
x = 7
6
42
6
12108642


27
Media Aritmética = 7
La desviación media:
N
xx
DM
 
 =
6
71271078767472 
3
6
18
6
531135



DM
Desviación Media = DM = 3
La varianza:
S2
=
N
xx  2
)(
S2
=
6
)712()710()78()76()74()72( 222222
 
S2
=
6
)5()3()1()1()3()5( 222222

S2
= 667.11
6
70
6
25911925


Varianza = S2
= 11.667
La Desviación Estándar:
S = 415.3667.112
S
28
Desviación Estándar = S = 3.415
Coeficiente de Variación = C.V = )100(
x
S
= 7.48)100(487.0)100(
7
415.3

TAREA.
Hagan equipos de 5 alumnos y resuelvan los problemas siguientes:
Problema 1.
De una población de 100 observaciones realizadas a igual número de pacientes
que padecen una enfermedad crónica, se tomó una muestra de solamente 5
observaciones tomadas en forma aleatoria. Se construyó la siguiente tabla:
Observaciones de la
población.
Observaciones de la
muestra
Dato o valor de la
observación
X12 X1 10
X20 X2 54
X36 X3 21
X62 X4 33
X98 X5 53
Se pide calcular:
1. La media aritmética
2. La desviación media
3. La varianza
4. La desviación estándar
5. El coeficiente de variación.
Problema 2.
En la carretera que existe de Cd. Altamirano a Cutzamala, se construyó un
terraplén de arcilla compactada. La compañía constructora hizo 28 pruebas de
control de la compactación y reportó los resultados en la tabla siguiente. La
29
compañía reporta que dichos resultados son los grados de compactación respecto
a la prueba Proctor de laboratorio de mecánica de suelos.
Tabla:
Prueba
No
Grado de compactación
respecto a la prueba Proctor
X
XX  2
)( XX 
1 97.7
2 99.7
3 99.4
4 96.3
5 97.4
6 97.7
7 97.1
8 102.2
9 97.8
10 96.5
11 97.0
12 99.6
13 98.0
14 100.0
15 98.2
16 102.8
17 98.8
18 96.0
19 98.8
20 98.5
21 97.6
22 99.9
23 98.3
24 100.0
25 96.5
26 96.2
27 98.4
28 98.4
 
Se pide calcular:
1. La media aritmética (promedio)
2. La desviación media
30
3. La varianza
4. La desviación estándar
5. El coeficiente de variación.
Respuesta:
Media aritmética = X = 98.4
Varianza = S2
= 2.36
Desviación Estándar = S = 1.54
Coeficiente de Variación = C.V = 1.56
4.- LAS MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN A PARTIR
DE DATOS AGRUPADOS.
En los problemas anteriores aprendimos a calcular tanto las medidas de tendencia
central como de dispersión partiendo de un listado de datos o sea de una
colección. Estas listas pueden venir de algún hospital, de alguna escuela, de
alguna compañía constructora, etc. Cada una de estas fuentes, tienen una misión
que cumplir. Los hospitales por ejemplo buscan conocer medidas que le son de su
incumbencia (enfermos, médicos, enfermeras, medicamentos etc). En alguna
escuela es de su interés conocer medidas de lo que ahí se hace (alumnos,
maestros, sueldos, exámenes, etc). En alguna compañía constructora tal vez
interese conocer cantidades de materiales que se consumen mensualmente,
combustibles, personal, etc.
Los datos que de esas fuentes provienen, se reportan como listas o colecciones
que aprendimos a manejar para calcular tanto las medidas de tendencia central
como de dispersión.
Ahora aprenderemos a calcular las mismas medidas; pero ya no provenientes de
un listado de datos, sino de datos agrupados en los intervalos de clase y la
frecuencia de cada uno de esos intervalos.
En otras palabras, lo que ahora conocemos como datos del problema son los
intervalos de clase y sus frecuencias y con esto, calcularemos las medidas de
tendencia central y de dispersión.
31
4.1.- La media aritmética a partir de datos agrupados.
Para calcular la media aritmética a partir de datos agrupados, se acepta que todos
los valores que caen dentro de un intervalo de clase se localizan en el punto
medio de dicho intervalo.
El punto medio de un intervalo de clase, se obtiene calculando la media
(promedio) de los límites superior e inferior del intervalo.
Ejemplo 1.
La tabla siguiente muestra los pesos en gramos de tumores malignos que le
fueron extirpados a 57 personas.
Nota: La tabla se elaboró colocando los datos de menor a mayor valor.
12 27 42 63
12 27 42 65
12 27 42 68
16 28 43 69
19 28 43 74
21 28 43 79
22 28 44
22 30 45
23 30 46
23 31 47
23 31 49
24 32 49
24 32 49
25 36 50
25 36 51
25 38 51
27 38 57
Los intervalos de clase y sus frecuencias ya fueron calculados anteriormente.
Estos resultados fueron los siguientes:
Intervalo de clase: Ic Frecuencia: “f”
10-19 5
20-29 19
30-39 10
40-49 13
50-59 4
32
60-69 4
70-79 2
Cálculo de los puntos medios (mi) de los intervalos de clase.
 Intervalo de 10 a 19 mi = 5.14
2
29
2
1910


Puesto que los intervalos de clase tienen el mismo ancho (10) y además existe
continuidad de intervalos, entonces los puntos medios de cada intervalo se podrán
calcular sumando el valor 10 a cada punto medio del intervalo anterior.
En caso de no existir continuidad de intervalos no debemos sumar el ancho
referido.
Veamos la tabla siguiente:
Intervalo de clase: Ic Punto medio (mi) del intervalo de clase
10-19 14.5
20-29 14.5+10 = 24.5
30-39 24.5+10 = 34.5
40-49 34.5+10 = 44.5
50-59 44.5+10 = 54.5
60-69 54.5+10 = 64.5
70-79 64.5+10 = 74.5
La media aritmética que se busca a través de datos agrupados, se calcula
multiplicando cada punto medio (mi), por su frecuencia correspondiente (fi); se
suman estos productos y se divide entre la suma de las frecuencias (fi).
X =


i
ii
f
fm
Para el ejemplo anterior, tendremos lo siguiente:
Intervalo de clase
IC
Punto medio del
intervalo.
mi
Frecuencia del
intervalo.
f
Producto
(mi)(f)
33
10-19 14.5 5 72.5
20-29 24.5 19 465.5
30-39 34.5 10 345.0
40-49 44.5 13 578.5
50-59 54.5 4 218.0
60-69 64.5 4 258.0
70-79 74.5 2 149.0
 57 2086.5
Media aritmética = X =


i
ii
f
fm
= 6.36
57
5.2086

Ejemplo 2.
La tabla siguiente muestra 7 intervalos de clase que agrupan salarios que cobran
100 enfermeras que trabajan en el ISSSTE de Cd. Altamirano. Asimismo, se indica
la frecuencia de cada intervalo (número de enfermeras que cobran el salario
comprendido dentro de ese intervalo).
Se pide calcular la media aritmética.
Intervalos de clase (salarios
mensuales)
IC
Frecuencia.
f
De 419 a 437 9
De 238 a 456 25
De 457 a 475 36
De 476 a 494 14
De 495 a 513 0
De 514 a 532 8
De 533 a 551 8
 100
Solución:
Calculemos los puntos medios (mi) de los intervalos.
 Del intervalo 419 a 437: mi = 428
2
437419


34
 Del intervalo 238 a 456: mi = 447
2
456438


 Del intervalo 457 a 475 mi = 466
2
475457


 Del intervalo 476 a 494 mi = 485
2
494476


 Del intervalo 495 a 513 mi = 504
2
513495


 Del intervalo 514 a 532 mi = 523
2
532514


 Del intervalo 533 a 551 mi = 542
2
551533


Ahora construyamos una tabla donde tengamos los productos (mi)(fi)
Intervalo de clase
Ic
Frecuencia
f
Puntos medios
mi
Productos
(mi)(fi)
419 a 437 9 428 3852
438 a 456 25 447 11175
457 a 475 36 466 16776
476 a 494 14 485 6790
495 a 513 0 504 0
514 a 532 8 523 4184
533 a 551 8 542 4336
 100  47113
La media aritmética será: X =


i
ii
f
fm
X = 13.471
100
47113

4.2.- La mediana a partir de datos agrupados.
Cuando los datos se tienen agrupados en intervalos de clase, la mediana se
calcula siguiendo la secuencia siguiente:
35
a) Se calcula el intervalo de clase que contiene a la mediana. Este intervalo es
aquel que ocupa el lugar
2
N
, donde N es el número total de datos u
observaciones.
b) Se calcula la frecuencia acumulada que corresponde al intervalo inmediato
inferior al intervalo que contiene a la mediana.
c) Se calcula la frecuencia del intervalo de la mediana.
d) Se calcula el ancho del intervalo de clase.
e) Se calcula el límite real inferior del intervalo que contiene a la mediana.
f) Para calcular a la mediana se aplica la fórmula siguiente:
Mediana = )(2 i
f
f
N
L
a

Donde:
L = Límite real inferior del intervalo que contiene a la mediana.
N = Número de datos u observaciones.
fa = Frecuencia acumulada en el intervalo inmediato inferior al intervalo que
contiene a la mediana, la cual es la misma que la frecuencia acumulada de “L”.
f = frecuencia del intervalo que contiene a la mediana.
i = ancho o longitud del intervalo que contiene a la mediana.
Ejemplo 1.
La tabla siguiente, muestra datos agrupados de edades de 180 personas que en el
año 2102 se practicaron examen de glucosa en el IMSS de Cd. Altamirano.
Intervalo de clase
Ic
Frecuencia
f
Frecuencia acumulada
fa
41.5 – 46.5 2 2
46.5 – 51.5 9 11
51.5 – 56.5 31 42
56.5 – 61.5 50 92
61.5 – 66.5 51 143
66.5 – 71.5 30 173
36
71.5 – 76.5 7 180
 180
Se pide calcular la mediana.
Solución.
Apliquemos la secuencia que hemos mencionado.
a) Cálculo del intervalo que contiene a la mediana.
Lugar = 90
2
180
2

N
Si observamos la columna de las frecuencias acumuladas, se tiene que el valor 90
está en el intervalo 56.5 – 61.5 donde se tienen 92 frecuencias acumuladas; es
decir, el intervalo 56.5 – 61.5 contiene aquellos valores que ocupan desde el lugar
43 hasta el lugar 92 y ahí está el lugar 90.
b) Cálculo de la frecuencia acumulada que corresponde al intervalo inmediato
inferior al intervalo que contiene a la mediana.
El intervalo inmediato inferior a 56.5 – 61.5 es el intervalo 51.5 – 56.5. La
frecuencia acumulada para este intervalo es 42. Así que:
fa = 42
c) Cálculo de la frecuencia del intervalo de la mediana.
El intervalo donde está la mediana es como ya dijimos el 56.5 – 61.5 y ahí la
frecuencia es 50. Así que:
f = 50
d) Cálculo del ancho del intervalo (i).
Si observamos la tabla, el ancho es el mismo para todos los intervalos y su valor
es 5.
i = 5
e) Cálculo del límite inferior del intervalo donde está la mediana.
El intervalo es como ya dijimos el 56.5 – 61.5; así que el límite inferior es 56.5
37
L = 56.5
f) Sustituyendo valores en la fórmula, tenemos:
MEDIANA = L + )(2 i
f
f
N
a
= 56.5 + )5(
50
4290 
MEDIANA = 61.3
Ejemplo 2.
La tabla siguiente muestra datos agrupados que corresponden a pesos en gramos
de tumores malignos que le fueron extirpados a 57 personas.
Intervalo de clase (pesos
en gramos)
Ic
Frecuencia
f
Frecuencia acumulada
fa
10 -19 5 5
20 - 29 19 24
30 - 39 10 34
40 - 49 13 47
50 - 59 4 51
60 - 69 4 55
70 - 79 2 57
 57
Se pide calcular la Mediana.
Solución:
Aplicando la secuencia tenemos:
a) Cálculo del intervalo que contiene a la mediana.
Lugar = 5.28
2
57

38
Al observar la columna de frecuencia acumulada, se tiene que dicho lugar se
encuentra en el intervalo 30 – 39; es decir, este intervalo contiene valores
comprendidos desde el lugar 24 hasta el 34, que es el espacio donde está el lugar
28.5
b) Cálculo de la frecuencia acumulada que corresponde al intervalo inferior al
intervalo donde está la mediana.
El intervalo inferior al 30 – 39 es el 20 – 29. La frecuencia acumulada para este
intervalo es 24. Entonces se tendrá que:
fa = 24
c) Cálculo de la frecuencia del intervalo donde está la mediana. Este intervalo
es como ya se dijo el 30 – 39. La frecuencia para este intervalo es 10. Así
que:
f = 10
d) Cálculo del ancho (i) del intervalo donde está la mediana.
Según la tabla, todos los anchos de los intervalos son iguales y su valor es 10.
Así que:
i = 10
e) Cálculo del límite inferior del intervalo donde está la mediana.
El intervalo es como ya se dijo el 30 – 39; así que el límite inferior es 30. Así
que
L = 30
f) Apliquemos la fórmula:
MEDIANA = L +
f
f
N
a
2
39
MEDIANA = 30 + )10(
10
245.28 
MEDIANA = 34.5
Tarea.
Hagan equipos de 5 estudiantes y resuelvan el siguiente problema.
Problema.
La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias.
Estos intervalos representan pesos en gramos de tumores malignos que le fueron
extirpados a 57 pacientes enfermos.
Intervalo de clase (pesos
en gramos)
IC
Frecuencia
f
Frecuencia acumulada
fa
9.5 – 19.5 5 5
19.5 – 29.5 19 24
29.5 – 39.5 10 34
39.5 – 49.5 13 47
49.5 – 59.5 4 51
59.5 – 69.5 4 55
69.5 – 79.5 2 57
 57
Se pide que calculen la Mediana.
Respuesta: Mediana = 34
40
4.3.- La moda a partir de datos agrupados.
Al estudiar las medidas de tendencia central para una colección de datos, se dijo
que la moda es el valor que ocurre con mayor frecuencia. En el mismo sentido, si
lo único que se conoce son datos agrupados (intervalos de clase), la moda es el
intervalo que tiene la más alta frecuencia.
Ejemplo 1.
La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias.
Estos intervalos representan pesos en gramos de tumores malignos que le fueron
extirpados a 57 pacientes enfermos.
Intervalo de clase (pesos en gramos)
IC
Frecuencia
f
10 – 19 5
20 – 29 19
30 – 39 10
40 – 49 13
50 – 59 4
60 – 69 4
70 - 79 2
 57
Se pide calcular la Moda.
Solución:
Al observar la tabla se tiene que el intervalo de mayor frecuencia es el 20 – 29 (su
frecuencia es 19); entonces ese intervalo es LA CLASE MODAL.
Si se trata de dar un valor numérico para la moda, entonces recurrimos a la media
(promedio) de los límites del intervalo de la CLASE MODAL.
MODA = 5.24
2
2920


41
4.4.- La varianza y la desviación estándar a partir de datos agrupados.
Cuando se estudió a la varianza a partir de una colección de datos, se dijo que su
valor se encontraba con la fórmula siguiente:
S2
=
N
xx  2
)(
Cuando lo único que conoce son los intervalos de clase (los datos están
agrupados), la varianza se calcula con la fórmula siguiente:
S2
=
 

1
)( 2
f
xmi
(f)
Donde:
f = frecuencia
mi = punto medio del intervalo
Ejemplo 1.
En la escuela de enfermería se aplicó un examen de bioestadística a 51
estudiantes. Las calificaciones variaron entre 50 y 95 puntos. Se hicieron 8
intervalos de clase con una amplitud (ancho) de 6 unidades.
La tabla siguiente muestra los intervalos de clase (puntos obtenidos por los
estudiantes) y las frecuencias que se presentaron.
Intervalo de clase (puntos obtenidos por
los estudiantes)
Ic
Frecuencia
f
48 - 54 2
54 – 60 3
60 – 66 5
66 – 72 8
72 – 78 10
78 – 84 12
84 – 90 10
90 - 96 1
 51
42
Se pide calcular la varianza S2
y la Desviación Estándar S.
Solución:
La solución del problema requiere que se conozca primeramente la media
aritmética ( X ). Para lograrlo, necesitamos conocer los puntos medios (mi) y los
productos (mi)(fi). Construyamos una tabla como la siguiente:
Intervalo de clase
Ic
Punto medio del
intervalo:
mi
Frecuencia:
fi
Producto:
(mi)(fi)
48 – 54 51 2 102
54 – 60 57 3 171
60 – 66 63 5 315
66 – 72 69 8 552
72 – 78 75 10 750
78 – 84 81 12 972
84 – 90 87 10 870
90 - 96 93 1 93
51  3825
Cálculo de X : X = 75
51
3825



i
ii
f
fm
Ahora conviene ampliar la tabla para poder calcular la varianza:
Productos
(mi)(fi)
La resta
xmi 
Elevando al
cuadrado
2
)( xmi 
El
producto
ii fxm 2
)( 
La varianza
102 51 - 75 = -24 576 1152
)(
1
)( 2
2
i
i
i
f
f
xm
S





171 57 – 75 = -18 324 972
315 63 – 75 = - 12 144 720
552 69 – 75 = - 6 36 288
750 75 – 75 = 0 0 0
972 81 – 75 = 6 36 432
870 87 – 75 = 12 144 1440
43
93 93 – 75 = 18 324 324
 1584 5328
La varianza: 56.106
50
5328
151
53282


S
La desviación estándar: S = 323.1056.1062
S
Ejemplo 2.
En la Clínica Avenida de Cd. Altamirano, los Doctores Franco Rojo y René
Fernández extirparon 57 tumores cancerosos a igual número de pacientes. Los
tumores se pesaron en gramos y de acuerdo a los pesos que se tuvieron se
agruparon en 7 intervalos de clase. La tabla siguiente muestra dichos intervalos y
la frecuencia de cada intervalo.
Intervalo de clase que agrupa pesos en
gramos de tumores extirpados.
IC
Frecuencia presentada o sea número
de pacientes agrupados en el intervalo.
f
10 – 19 5
20 – 29 19
30 – 39 10
40 – 49 13
50 – 59 4
60 – 69 4
70 – 79 2
 57
Se pide calcular la varianza y la desviación estándar.
44
Solución.
Para resolver el problema, necesitamos por principio conocer a la media aritmética
o sea x .
x =


i
ii
f
fm
Construyamos la tabla siguiente:
Intervalo de clase
Ic
Punto medio del
intervalo:
mi
Frecuencia:
fi
Producto:
(mi)(fi)
10 - 19 14.5 5 72.5
20 - 29 24.5 19 465.5
30 - 39 34.5 10 345.0
40 - 49 44.5 13 578.5
50 - 59 54.5 4 218.0
60 - 69 64.5 4 258.0
70 - 79 74.5 2 149.0
 57 2086.5
x = 6.36
57
5.2086



i
ii
f
fm
Ahora construyamos la siguiente tabla donde se tiene la varianza:
Productos
(mi)(fi)
La resta
xmi 
Elevando
al
cuadrado
2
)( xmi 
El
producto
ii fxm 2
)( 
La varianza
72.5 14.5 – 36.6 = - 22.1 488.41 2442.05
)(
1
)( 2
2
i
i
i
f
f
xm
S





465.5 24.5 – 36.6 = - 12.1 146.41 2781.79
345.0 34.5 – 36.6 = - 2.1 4.41 44.10
578.5 44.5 – 36.6 = 7.9 62.41 811.33
218.0 54.5 – 36.6 = 17.9 320.41 1281.64
258.0 64.5 – 36.6 = 27.9 778.41 3113.64
45
149.0 74.5 – 36.6 = 37.9 1436.41 2872.82
2086.5  13347.37
La varianza es:
)(
1
)( 2
2
i
i
i
f
f
xm
S





34.238
56
37.13347
1.57
37.13347
)(
1
)( 2
2






i
i
i
f
f
xm
S
La desviación estándar “S” será entonces:
43.1534.2382
 SS
El coeficiente de variación C.V. sería entonces:
)100(..
x
S
VC 
42
6.36
43.15
)100(.. 
x
S
VC
Tarea:
Hagan equipos de 5 estudiantes y resuelvan el problema siguiente:
Problema.
El grupo 401 de la Preparatoria 8 hicieron un trabajo de investigación que consistió
en recabar el número de ancianos y sus respectivas edades que solicitaron
consulta en el ISSSTE de Cd. Altamirano durante el mes de julio de 2013.
La jefa de grupo (Karla) reportó que fueron 100 ancianos y sus edades las escribió
en la tabla siguiente:
46
62 72 72 69 69 69 61 68 71 71
64 67 64 67 60 64 67 66 64 67
65 64 74 64 73 65 63 74 64 63
73 64 67 73 71 71 67 65 67 67
67 63 63 63 64 71 64 74 71 71
70 67 70 66 70 67 70 66 70 66
66 68 66 66 69 67 67 68 68 68
68 66 68 70 70 66 67 66 66 70
68 68 68 70 67 67 68 68 67 69
67 67 67 70 70 70 70 61 70 70
Calcular:
1. Construye una tabla donde ordenes los datos (de menor a mayor)
2. Calcula el número de intervalos de clase y su ancho correspondiente para
propósitos de tabulación.
3. Construye una tabla de distribución de frecuencias.
4. Construye una tabla de frecuencias acumuladas y frecuencias relativas
acumuladas.
5. Construye un histograma y un polígono de frecuencias.
Calcular también:
1. La media
2. La mediana
3. La moda.
Calcular también:
1. La desviación media
2. La varianza
3. La desviación estándar
4. El coeficiente de variación.
Hacer una tabla con los datos agrupados (los intervalos de clase) y a partir de
estos datos calcular:
47
1. La media aritmética
2. La moda
3. La varianza
4. La desviación estándar.
48
PARTE II
EL AZAR Y SU MEDIDA
CONCEPTOS BÁSICOS DE PROBABILIDAD COMO UNA
INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL.
En la parte I de estos apuntes, se trataron algunos puntos de vista para describir
datos que bien pueden venir de alguna colección o estar agrupados en
intervalos de clase. Estos puntos de vista constituyen la Estadística Descriptiva.
También dijimos que la Estadística propiamente dicha se acostumbra dividirla en
dos partes: La Descriptiva y la Inferencial.
La Estadística Inferencial tiene como propósito hacer inferencias; es decir se trata
de “predecir algo que puede suceder”, de “tomar decisiones”, de “hacer
estimaciones de algo”, de “sacar conclusiones”, etc.
La Estadística Inferencial requiere de LA TEORIA DE LA PROBABILIDAD y
debido a ello, trataremos en esta parte II algunos conceptos básicos de esta
teoría.
1.- LA PROBABILIDAD.
Esta palabra es un concepto un tanto vago que se usa en la vida cotidiana. Su uso
trata de indicar cuán posible es que ocurra un evento en el futuro. Un médico por
ejemplo suele decir: “ Se tiene una probabilidad de un 80% que el medicamento
tenga buenos resultados”. Un agricultor dice “ Presiento que tengo una
probabilidad de un 90% de tener buena cosecha”. Un meteorólogo dice “Se tiene
una probabilidad del 100% que hoy por la tarde lloverá”.
Así entonces conocer algo o mucho nos ayuda a tomar decisiones. Es por esto
que es importante estudiar la aplicación de la probabilidad y cómo medirla, lo
mismo que cómo emplearla para hacer inferencias.
49
Hacer inferencias ayuda en mucho en estudios que se hacen a procesos físicos,
químicos, biológicos, económicos, sociales etc., que generan acontecimientos que
no son tan fáciles de predecir con exactitud.
También se tiene que la probabilidad aparece en rubros como los juegos de azar,
casinos, fenómenos meteorológicos, deportes organizados, demandas que tendrá
un producto nuevo, eficacia de un suero, presupuestar, estimación de la carga que
soporta un puente antes de derrumbarse y caer, etc.
Pero antes de iniciar con el estudio de esta teoría, recordemos un poco a la Teoría
de Conjuntos en la cual se apoya.
2.- LA TEORÍA DE CONJUNTOS.
2.1.-Definición de conjunto.
Un conjunto se define como una colección bien definida.
La colección puede ser números, objetos, personas, cualidades de algo, cosas,
etc. A los elementos de la colección se les llama miembros del conjunto o
simplemente elementos.
Los conjuntos se representan con letras mayúsculas y a los elementos se les
encierra en un par de llaves.
Ejemplos:
Conjunto de las vocales del abecedario: A =  uoiea ,,,,
Conjunto de los hijos de Adán y Eva: A =  AbelCain,
Conjunto de los números naturales del 1 al 10: A =  10,9,8,7,6,5,4,3,2,1
Conjunto de los municipios de la tierra caliente de Guerrero:






Zirandaro
oPungarabatCoyucaTlalchapaCutzamalaTlapehualaAjuchitlanMiguelTSArcelia ,,,,,,,.,
Conjunto de las Preparatorias de la UAG en tierra caliente:
A =  39,37,20,18,8
2.2.- Descripción de conjuntos.
50
Existen tres formas para describir un conjunto:
1. Por enumeración
2. Por una regla (comprensión)
3. Por diagramas de Venn.
Los de enumeración se escriben conteniendo una lista de los elementos que
constituyen el conjunto.
Los de la regla se escriben usando símbolos matemáticos propios del lenguaje de
esta disciplina.
Los escritos usando los diagramas de Venn, consisten en dibujos geométricos que
expresan a los conjuntos.
De los tres anteriores, usaremos en estos apuntes a los de enumeración y los
diagramas de Venn. Los de la regla les daremos poca atención ya que estos
sirven principalmente a los matemáticos interesados en la estadística.
A manera de ejemplo, describamos al conjunto formado por los números naturales
comprendidos del 0 (inclusive) al 10 (inclusive). Recordemos que los números
naturales son los que se usan para contar: 1, 2, 3 , 4 etc; algunos matemáticos
dicen que el cero también es natural (aceptemos esta opinión).
1. Por enumeración será: A =  10,9,8,7,6,5,4,3,2,1,0
2. Usando la regla de los matemáticos: A = {x I x es natural donde 0 ≤ x ≤10}
Se lee diciendo: x es natural tal que (el matemático le llama “tal que” a la rayita
vertical) x cumple conque cero es menor o igual a x y x es menor o igual a 10.
3. Usando los diagramas de Venn.
Este diagrama consiste en hacer un dibujo donde una circunferencia encierra a los
elementos del conjunto. Esta circunferencia es encerrada en un rectángulo que
representa al conjunto universal (U) que es aquel conjunto universo donde
pertenecen los elementos del conjunto que se está estudiando.
Para nuestro ejemplo tendríamos:
1 3 5 2
4 10 6 8
7 0 9
U
A
51
2.3.-Algunos tipos de conjuntos.
Para los propósitos de este curso y tomando en cuenta a los elementos de un
conjunto y asimismo, evadiendo lo mas posible el rigor de las matemáticas,
tenemos los tipos de conjuntos siguientes:
1. Conjunto unitario.- Es aquel que tiene un solo elemento.
2. Conjunto vacío.- Es el que carece de elementos. Se acostumbra escribirlos
con la letra griega Ф. Es importante decir que este conjunto no debe
confundirse con aquel que tiene como único elemento al cero.
3. Conjunto Universal.- Es el que contiene todos los elementos posibles del
conjunto. Se acostumbra escribirlo con la letra U.
4. Un conjunto “A” es subconjunto de otro conjunto “B”, si y solo si cada
elemento de “A” es también elemento de “B”. Para indicar que “A” es
subconjunto de “B” se escribe A С B.
5. El conjunto vacío escrito como Ф es subconjunto de cualquier otro conjunto.
6. Dos conjuntos son iguales si y solo si contienen los mismos elementos.
2.4.- Cardinalidad de un conjunto.
La cardinalidad de un conjunto “A” es el número de elementos que contiene
distintos unos de otros, y se acostumbra simbolizarlos con #(A).
Ejemplos.
Determina la cardinalidad de cada uno de los conjuntos siguientes:
A = {días de la semana}
#(A) = 7
B = {los dedos de una mano normal}
#(B) = 5
C = {0}
#(C) = 1
Ф= { }
#(D) = 0
E = {Aníbal, René, Karla}
52
#(E) = 3
2.5.- Operaciones con conjuntos.
Son cuatro las operaciones básicas que se hacen con un par de conjuntos
llamados “A” y “B”.
1. Unión
2. Intersección
3. Complemento
4. Diferencia.
UNIÓN.- La unión de dos conjuntos A y B es otro conjunto C cuyos elementos
están en A o están en B. Para indicar la operación unión se acostumbra usar el
símbolo U.
Ejemplo.
Sea el conjunto A = {1,2,3,4,5,6} y el conjunto B = {2,4,7,8,9,10,11}
Calcular el conjunto unión.
Solución:
C = A U B = {1,2,3,4,5,6,7,8,9,10,11}
Usando los diagramas de Venn se tendrá:
U =
INTERSECCIÓN.- La intersección de dos conjuntos A y B es otro conjunto C
cuyos elementos son comunes tanto en A como en B. En otras palabras, los
elementos de C, se tienen tanto en A como en B.
Para indicar esta operación se acostumbra usar el símbolo
1 2 3
4 5 6
A
2 4 7 8
9 10 11
B
1 2 3 4 5 6
7 8 9 10 11
C
U
53
Ejemplo 1.
Se tiene el conjunto A = {a b c d e} y el conjunto B = { b d f g}
Calcular su intersección.
Solución:
A B = { b d }
Nota: Nótese que los elementos b y d son comunes en A y B.
Usando los diagramas de Venn se tiene:
También es común hacer el siguiente diagrama como intersección:
Ejemplo 2.
El conjunto de médicos que trabajan en la Preparatoria 8 de Cd Altamirano es:
A = {René, Franco, Jorge, Alejandro, Alfonso}
El conjunto de médicos que trabajan en el ISSSTE de Cd. Altamirano es:
B = {René, Natividad, Hildebrando, Alejandro, Xetzael}
Calcular el conjunto intersección:
Solución:
A B = {René, Alejandro}
U
a b c d e U b d f g = b d
b
d
a c e
f
g
A B
C
A
B
U
54
Usando el diagrama de Venn:
René, Alejandro
COMPLEMENTO.- El complemento de un conjunto “A” escrito como AC
es el
conjunto de todos los elementos del universo que no están en A. En otras
palabras, son todos los elementos que le faltan a A para ser U. Entonces:
AC
= U – A
Ejemplo 1.
Un conjunto A = {a, b, c, d} y el conjunto universal es el alfabeto completo.
Calcular el complemento de A; es decir AC
.
Solución:
AC
= {e, f, g, h….x, y, z}
Usando el diagrama de Venn:
Franco
Jorge
Alfonso
Natividad
Hildebrando
Xetzael
A
B
a b c
d
e f g h i
j k l m n
ñ o p q
r s t u v
w x y z
A
U
55
Ejemplo 2
El conjunto de Preparatorias de la UAG en la tierra caliente es:
A = {8, 18, 20, 37, 39}
El universo de las preparatorias de la UAG está formado por 40 preparatorias
distribuidas en todo el estado de Guerrero.
Calcular el complemento de A; es decir AC
.
Solución:
A
C
= {1,2,3,4,5,6,7,9,10,11,12,13,14,15,16,17,19,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,38,40}
Usando el diagrama de Venn:
DIFERENCIA.- La diferencia de dos conjuntos A y B, escrito como A – B, es el
conjunto de elementos que pertenecen a “A”; pero no pertenecen a “B”.
Ejemplo.
Sea el conjunto A = {a, b, c, d, e} y sea otro conjunto B = {b, d, f, g}
Calcular A – B.
Solución:
A – B = {a, c, e}
A
8, 18, 20, 37,
39
1,2,3,4,5,6,7,9,10,11,12,13,14,15
16,17,19,21,22,23,24,25,26,27,28
29,30,31,32,33,34,35,36,38,39,40
U
56
Usando el diagrama de Venn:
TAREA.
Hagan equipos de 5 estudiantes y resuelvan lo siguiente:
1.-Se tienen los conjuntos:
A = { a, b, c, d, e, f, g, h, i, j }
B = { a, c, e, g, i, k, n, p }
Calcular numéricamente y con diagramas de Venn lo siguiente:
A U B
A B
AC
A – B
2.- Se tienen los conjuntos:
SEA EL CONJUNTO UNIVERSAL U = { A,B,C,D,E,F,G,H,I,J,K,L}
A
a,
c
e
b, d f, g
B
U
57
A = {A,B,C,D,E}
B = {E,F,G,H}
Calcular lo siguiente:
A U B
A B
BC
B – A
(A U B)C
(A B)C
AC
U BC
AC
BC
3.- INICIACIÓN A LA TEORIA DE LA PROBABILIDAD.
Anteriormente explicamos la importancia de la probabilidad en diferentes
contextos sociales.
Iniciamos esta teoría diciendo que la medida de la probabilidad se hace en una
escala comprendida entre cero y uno ( o entre 0% y 100%). Esta medida indica
la factibilidad que ocurra cierto resultado al cual se le llama evento. La figura
siguiente muestra esquemáticamente la medida de la probabilidad:
U
U
U
0 10.5
Evento con medida
cero de probabilidad:
El rector de la UAG
estará 100 años en el
cargo.
Evento con medida 0.5
de probabilidad:
Al nacer el bebé será
HOMBRE.
Evento con medida 1
de probabilidad:
A toda persona se le
llega la hora de su
muerte
58
3.1. Conceptos básicos de la probabilidad.
3.1.1.-Experimento.
Es la operación que consiste en observar los resultados obtenidos en ciertas
condiciones de trabajo.
Los experimentos pueden ser aleatorios (también se les llama estocásticos) o
deterministas. Los aleatorios son aquellos que pueden tener uno de varios
resultados y por lo tanto no puede predecirse cuál será el que ocurrirá. Los
deterministas en cambio, son aquellos que tienen un único resultado o sea ya se
sabe lo que ocurrirá.
Un ejemplo de experimento aleatorio sería “el lanzamiento de una moneda al aire”.
Al caer la moneda, puede caer en sol o en águila. Es decir, no podemos predecir
lo que ocurrirá.
Otro ejemplo de experimento aleatorio sería “el tirar un dado”. Puede suceder que
caiga en 1, en 2, en 3, en 4, en 5 o en 6. Es decir, no podemos predecir lo que
ocurrirá.
Un ejemplo de experimento determinista sería “el sacar una bola azul de una caja
que contiene 10 bolas todas azules”. Es decir, sabemos de antemano que saldrá
azul.
Otro ejemplo de experimento determinista sería “la elección del puerto turístico
mas importante de Guerrero: Acapulco o Zihuatanejo”. Sabemos de antemano que
es Acapulco.
3.1.2.-Evento.
Es el conjunto de uno o mas resultados de un experimento.
El evento puede ser simple o compuesto. Un evento es simple cuando es un solo
resultado del espacio muestral. Un ejemplo sería que en el experimento de “tirar
un dado” el evento fuera “que salga número par”. Así el evento puede ser un solo
elemento del conjunto {2, 4, 6}. En cambio, un evento será compuesto cuando el
resultado esperado sea un solo resultado; pero con dos características. Así en el
experimento de “tirar un dado”, que el evento fuera “un número par mayor a 4”
59
(aquí existen dos características: que sea par y mayor que 4). El evento esperado
será el conjunto unitario {6}.
3.1.3.-Espacio muestral.
Es el conjunto de todos los posibles eventos o resultados que pueden ocurrir del
experimento. Se acostumbra representarlo con la letra ῼ
En el experimento “lanzar al aire una moneda”, el espacio muestral será águila (a)
y sol (s).
ῼ = {a, s}
En el experimento “tirar un dado”, el espacio muestral será el conjunto:
ῼ = {1, 2, 3, 4, 5, 6}.
En el experimento “de una carta americana (tiene 52 cartas) sacar un rey de
diamantes”. ¿Cuál es el espacio muestral?
Será: ῼ = {52 cartas}
En el experimento “se observa el funcionamiento de tres aparatos electrónicos
durante una semana. Nos interesa saber el número de aparatos diferentes que se
descompongan una o mas veces durante la semana”. Indicar el espacio muestral
a considerar.
Será:
ῼ = {0,1,2,3}
No olvidemos que el espacio muestral es el conjunto de todos los resultados
posibles del experimento. Así que:
Resultado posible 1: Se descomponen 0 aparatos.
Resultado posible 2: Se descompone un aparato.
Resultado posible 3: Se descomponen 2 aparatos.
Resultado posible 4: Se descomponen 3 aparatos.
60
3.1.4.-Punto muestral.
Es cada uno de los valores del espacio muestral. A cada punto muestral le
corresponde una probabilidad, de tal suerte que la suma de todas las
probabilidades de ese espacio muestral es igual a uno.
Algunos se preguntan ¿Porqué se le da importancia a los juegos de azar como
lanzar monedas, tirar dados, sacar alguna carta, etc en la teoría de la
probabilidad.?. La respuesta es que para estructurar esta teoría, los iniciadores
como Girolamo Cardano (1501-1576) físico, astrólogo y matemático se valió de
esas situaciones para estructurar su teoría. Apoyándose en las conclusiones así
determinadas, hoy en día, se aplica en otras áreas del saber; así por ejemplo, en
medicina se puede presentar un caso como el siguiente: “Si un médico desea
probar que cierta droga cura determinada enfermedad, procede a su aplicación en
pacientes enfermos. Supongamos que la mitad de los enfermos recobran la salud;
pero la otra mitad muere. Ahora el médico sabe que tiene “cierta idea de
probabilidad de que si es posible sanar algunos enfermos”. Ahora elige 100
enfermos y se le presenta el caso que 55 sanaron; pero 45 murieron. Estos
nuevos resultados indican que el caso que se le está presentando al médico es
parecido al problema de tirar 100 veces una moneda, donde 55 salieron soles y 45
águilas. Así tenemos que los famosos juegos de azar sirven de comparación con
otras áreas como la medicina por ejemplo.
.
4.- LOS ENFOQUES DE LA PROBABILIDAD
Para asignar una medida de probabilidad, se tienen dos enfoques: Uno llamado
objetivo y el otro conocido como subjetivo.
El enfoque objetivo se apoya en las teorías y métodos matemáticos para asignar
una medida de probabilidad a un evento determinado.
El enfoque subjetivo se apoya en la experiencia o conocimientos de quien hace la
investigación.
El enfoque objetivo se divide a su vez en probabilidad clásica y probabilidad
empírica.
Veamos el esquema siguiente:
61
4.1.-El enfoque clásico o modelo de Laplace.
Este enfoque o modelo se le debe al ilustre matemático francés Pierre Simón
Laplace (1749-1827).
Se basa en la idea de que los resultados de un experimento son igualmente
posibles.
Su medida o cálculo es de la forma siguiente:
Probabilidad de un evento =
esCasosTotal
ablesCasosFavor
Ejemplo 1.
Dentro de una caja hay 10 pelotas, de las cuales 4 son azules. ¿Cuál es la
probabilidad de que sin ver saques una pelota azul?.
Solución:
Sea “A” el evento de sacar una pelota azul. Como cada pelota tiene la misma
probabilidad de ser sacada, utilizamos el enfoque Clásico:
P(A) = 4.0
10
4

Enfoques de la Probabilidad
Objetivo Subjetivo
Clásico Empírico
62
La probabilidad es 0.4 (el 40%).
Ejemplo 2.
Se tiene una baraja americana (la baraja tiene 52 cartas, donde 26 son color
negro). Calcular la probabilidad de sacar una carta negra al azar.
Solución:
Sea A el evento de sacar una carta negra. Todas las cartas sean negras o no,
tienen la misma posibilidad de ser sacadas. Llamando P(A) a la probabilidad del
evento A, se tiene:
P(A) = 5.0
2
1
52
26

esCasosTotal
ablesCasosFavor
La probabilidad de sacar una carta negra será 0.5 o sea un 50%.
Ejemplo 3.
El experimento consiste ahora en sacar un “as” de una carta americana. La carta
tiene 4 ases.
Solución:
Llamando “A” al evento de sacar un “as”. Todas las cartas (son 52) tienen la
misma posibilidad de ser sacadas y puesto que únicamente son 4 ases:
P(A) = 0769.0
13
1
52
4

esCasosTotal
ablesCasosFavor
La probabilidad de sacar un “as” será 0.0769 o sea el 7.69%
Ejemplo 4.
Experimento: Se tiene una caja dentro de la cual existen 15 bolas numeradas del 1
al 15.
63
Un alumno elige al azar una de esas bolas. ¿Cuál será la probabilidad de que la
bola elegida sea un número primo mayor a 5?.
Nota: Recordemos que un número es primo cuando se puede dividir únicamente
entre uno o él mismo. Son números primos el 2, 3, 5, 7, 11, 13, 17,19 etc.
Solución:
Las bolas tienen los números 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15.
Los números primos mayores a 5 son 7, 11 y 13 (las bolas están numeradas hasta
el 15). En este sentido se tienen 3 casos favorables.
Llamando “A” al evento de sacar un primo mayor a 5 y P(A) a la probabilidad del
evento se tendrá:
P(A) = 20.0
5
1
15
3

esCasosTotal
ablesCasosFavor
La probabilidad es 0.20 es decir, un 20%.
Ejemplo 5.
Experimento: “La escuela preparatoria 8 de Cd. Altamirano tiene 1500 estudiantes.
Se hizo una encuesta para saber qué áreas del conocimiento les gusta más”.
325 alumnos dijeron que matemáticas y ciencias experimentales. 550 contestaron
que ciencias de la salud y 625 humanístico sociales.
Construye una tabla y determina la probabilidad de que un estudiante elegido al
azar:
 Estudie ingeniería
 Estudie medicina
 Estudie para abogado.
 Estudie para ingeniero o para odontólogo.
64
Solución.
Tabla:
Área del conocimiento Evento Número de estudiantes
Matemáticas y ciencias
experimentales.
ME 325
Ciencias de la salud CS 550
Humanístico-Sociales HS 625
Totales 1500
Probabilidad que un estudiante estudie ingeniería:
2166.0
1500
325
)( MEP
La probabilidad es 21.66%
Probabilidad que un estudiante estudie medicina:
3666.0
1500
550
)( CSP
La probabilidad es 36.66%
Probabilidad que un estudiante estudie abogacía:
4166.0
1500
625
)( HSP
La probabilidad es 41.66%
Probabilidad que un estudiante estudie para ingeniero u odontólogo.
P(ME U CS) = P(ME) + P(CS)
5833.0
1500
875
1500
550
1500
325
)()(  CSPMEP
65
Ejemplo 6.
La tabla siguiente muestra el personal técnico y profesional de un grupo de
hospitales tabulada por edad y categoría de trabajo.
SIGNOS: ≤ Menor o igual que > Mayor que
Conjunto A1
≤25
A2
26-30
A3
31-35
A4
>35
Totales
B1 Médicos 0 5 25 75 105
B2 Laboratoristas 20 30 35 35 120
B3 Servicios de dietas 3 6 6 10 25
B4 Servicios de registros 7 15 8 12 42
B5 Servicios de
enfermería
200 375 442 203 1220
B6 Farmacia 1 12 8 3 24
B7 Tecnología radiológica 4 10 19 12 45
B8 Servicios terapéuticos 5 25 15 10 55
B9 Otros servicios
profesionales.
20 35 50 25 130
Totales 260 513 608 385 1766
a) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho
empleado tenga menos de 25 años de edad ?.
b) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho
empleado sea médico?.
c) Si del personal que tiene mas de 35 años se elige al azar un empleado
cualquiera . ¿Cuál será la probabilidad de que sea médico?.
Edades
Categoría
66
Solución:
a) Debemos considerar que al elegir un empleado cualquiera, entonces puede ser
electo cualquiera de los 1766 (conjunto universal). En consecuencia, el total de
casos totales es 1766. De los 1766 empleados, solamente 260 (conjunto A1)
tienen una edad menor a 25 años; así que el total de casos favorables es 260.
La cardinalidad del conjunto A1 es: #(A1) = 260
La cardinalidad del conjunto Universal U es: #(U) = 1766
La probabilidad de A1 que llamamos P(A1) es:
La probabilidad de que un empleado cualquiera de los 1766 sea menor a 25 años
es 0.1472 o sea el 14.72%.
b) Para calcular la probabilidad de que un empleado cualquiera electo al azar sea
un médico, debemos considerar que la elección se hará con cualquiera de las
1766 personas. Así que el total de casos es 1766. De estos 1766, se tiene que
105 son médicos. Así que el total de casos favorables es 105.
La cardinalidad del conjunto B1 es: #(B1) = 105
La cardinalidad del conjunto universal U es: #(U) = 1766
La probabilidad de que de los 1766 empleados sea un médico es 0.059 o sea un
5.9%.
c) Para calcular la probabilidad de que un empleado electo al azar con
característica de que sea mayor a 35 años sea un médico, debemos considerar lo
siguiente:
1472.0
1766
260
)(#
)(#
)( 1
1 
U
A
AP
059.0
1766
105
)(#
)(#
)( 1
1 
U
B
AP
67
Los casos totales o sea aquellos que son mayores a 35 años están representados
por el conjunto A4. De estos 385 se tiene que únicamente 75 son médicos; así que
el conjunto de casos favorables es el conjunto formado por la intersección de B1
con A4.
Cardinalidad de la intersección B1 con A4 es: # (B1 A4) = 75
Cardinalidad del conjunto A4 : # (A4) = 385
La probabilidad pedida es:
1948.0
385
75
)( MP
Donde P(M) es la probabilidad de que alguien sea médico o sea 0.1948 = 19.48%
TAREA.
Hagan equipos de 5 estudiantes y resuelvan lo siguiente.
1.- En un grupo de 502 personas se determinó que la distribución de los grupos
sanguíneos era la siguiente:
Grupo Sanguíneo Número
O 226
A 206
B 50
AB 20
TOTAL 502
1.-Si se elige al azar una persona de este grupo, ¿cuál será la probabilidad de que
tenga el grupo sanguíneo:
U
68
a) O? b) A? c) B? d) AB?
2.- Uno de los graves problemas que enfrenta actualmente la sociedad es el
alcoholismo. En fechas recientes se ha visto una tendencia a la alza en el
consumo de bebidas alcohólicas entre los jóvenes. La embriaguez causa muchos
accidentes de tránsito, como se muestra en la tabla siguiente:
Tipo de accidente Presentó aliento alcohólico
Colisión con vehículo automotor 22733
Colisión con peatón (atropellamiento) 934
Colisión con animal 135
Colisión con objeto fijo 7533
Volcadura 1164
Caída de pasajero 239
Salida del camino 1316
Incendio 48
Colisión con ferrocarril 9
Colisión con motocicleta 1705
Colisión con ciclista 587
Otro 326
Total 36729
a) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido
una colisión con vehículo automotor?
b) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido
una volcadura?.
69
c) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido
una colisión con un peatón?
d) Investiguen ¿Qué es la responsabilidad social?. Discutan qué se pudiera
hacer al respecto para reducir la cantidad de accidentes y cuál es la
responsabilidad de cada ciudadano.
4.2.-El enfoque empírico.
Este enfoque se basa principalmente en frecuencias relativas, esto es, en el
número de veces que ocurrió cierto evento en el pasado y se calcula de la forma
siguiente:
Probabilidad del evento =
Nota: Conforme crece el número de observaciones, el enfoque empírico se acerca
al valor del enfoque clásico.
En otras palabras, el enfoque empírico se puede explicar diciendo que si un
experimento “E”, se repite “n” veces y si en cada caso de “n” se toma el resultado
“m”, entonces la probabilidad de “E” es aproximadamente igual a la frecuencia
relativa acumulada calculada como
Ejemplo 1.
Se lanza una moneda al aire 100 veces y se registra el número de soles en cada
20 tiradas. La tabla siguiente indica las frecuencias que se presentaron:
Número de
tiradas:
“n”
Número de soles
que salieron
Frecuencia
acumulada:
“m”
Frecuencia relativa
acumulada:
n
m
Número de veces que ocurrió en el pasado
Número total de observaciones
n
m
70
20 8 8 0.40
40 10 18 0.45
60 12 30 0.50
80 11 41 0.51
100 9 50 0.50
Un promedio de las frecuencias acumuladas es 0. 47 o sea un 47% que es muy
parecido al enfoque clásico.
Si recordamos el enfoque clásico, se tiene que el espacio muestral es {s,a} o sea
la totalidad de casos es 2 y si hablamos de la probabilidad que salga “sol”, el caso
favorable es 1. Entonces la probabilidad que salga sol es:
5.0
2
1
)( SP
Este valor es muy parecido a los valores de la columna de frecuencias relativas
acumuladas y en consecuencia al promedio de ellas.
Por eso hemos dicho que si aumenta el número “n”, la probabilidad es casi igual a
la frecuencia relativa acumulada.
Ejemplo 2.
Una persona lanza un dado “justo” 40 veces y anota cuántas veces salió cada
número del dado. Al terminar los lanzamientos, calcula cada una de las
probabilidades como el número de veces que salió cada número dividido entre el
número de lanzamientos realizados. Los resultados los anotó en la tabla siguiente:
Número del dado que
salió en las 40 tiradas
Número de veces que
salió el número del
dado
Probabilidad
1 8
20.0
40
8

2 6
15.0
40
6

3 10
25.0
40
10

4 4
10.0
40
4

71
5 6
15.0
40
6

6 6
15.0
40
6

Si se aumentara el número de lanzamientos, se tendrían probabilidades muy
cercanas a que es lo que se tiene en el enfoque clásico,
Ejemplo 3.
El profesor Gabriel López Sarabio de la Preparatoria No 8 de Cd. Altamirano se
puso a jugar a los dados. El profesor lanzó 150 veces el dado y anotó las veces
que el dado cayó en números mayores que 4, es decir, el evento fue {5,6}. Cada
vez que caía en número mayor que cuatro, trazaba una rayita (tarjado) y por
separado trazaba otra cuando no caía en número mayor que 4.
El profesor calculó la frecuencia relativa dividiendo las veces que cayó en número
mayor que 4 entre el total de lanzamientos. El profesor elaboró la tabla siguiente:
Evento A
Veces que cayó
en número mayor
que 4 (se usó un
tarjado de 5
rayitas)
Frecuencia Frecuencia relativa
A 45 rayitas 45
3.0
150
45
)( AP
AC
105 rayitas 105
7.0
150
105
)( C
AP
Del resultado de la tabla, se concluye que la probabilidad del evento A o sea la
probabilidad que caiga en número mayor que 4, es de 0.3 o sea un 30%.
La probabilidad que no se cumpla lo anterior, representa el complemento de A, es
decir (AC
). La probabilidad de que no se cumpla el número mayor que 4 será
entonces 0.7, es decir el 70%.
1667.0
6
1

72
TAREA.
Formen equipos de 5 estudiantes y resuelvan el siguiente problema:
Antes de incluir la cobertura para ciertos tipos de problemas dentales en pólizas
de seguros médicos para adultos con empleo, una compañía de seguros desea
determinar la probabilidad de ocurrencia de esa clase de problemas, para que
pueda fijarse la prima de seguros de acuerdo con esas cifras. Para ello, un
especialista en estadística recopila datos para 10, 000 adultos que se encuentran
en categorías de edad apropiadas y encuentra que 100 de ellos han
experimentado el problema dental específico durante el año anterior.
Calculen la probabilidad de ocurrencia y comenten el resultado.
RESPUESTA: 0.01 o sea el 1%.
4.3.-El enfoque subjetivo.
Este enfoque consiste en confiar en la experiencia del investigador para asignar la
probabilidad de algún evento. Debido a esto, al enfoque subjetivo también se le
llama enfoque personalista.
Debemos decir, que este enfoque está cobrando mucha fuerza en los tiempos
actuales. Para ello, se concentra toda la información disponible del evento al que
se le asignará una probabilidad en manos de un experto, quien valiéndose de su
experiencia asigna la probabilidad.
Ejemplo 1.
Para asignar la probabilidad que el América sea campeón en la clausura 2013 del
futbol mexicano, se puso en manos de José Ramón Fernández (JOSERA) toda la
información del desempeño que ha tenido el América en la presente temporada.
JOSERA tiene la palabra (recordemos que no es mas que una probabilidad).
Ejemplo 2.
Un experto en mercado de la bodega Aurrera de Cd. Altamirano asigna una
probabilidad del 90% de que las ventas mejoren este año.
73
Ejemplo 3.
En muchas ocasiones, las empresas desean conocer la probabilidad de que un
nuevo producto tenga éxito en el mercado. Para ello, recurren a la experiencia o
conocimiento del negocio de sus directivos o de sus vendedores. Tal vez
organicen grupos foco (focus group) , en los que las personas expresan el grado
de aceptación del producto. De esta manera, se utiliza el criterio o experiencia o
punto de vista personal para asignar una probabilidad de éxito o de un fracaso.
TAREA.
Formen equipos de 5 estudiantes y escriban 3 ejemplos de enfoques subjetivos.
Pueden consultar el internet. Comenten los ejemplos.
5.- LAS TÉCNICAS DE CONTEO
Cuando iniciamos la teoría de la probabilidad, dijimos que se tienen algunos
enfoques para ser estudiada. Uno de ellos fue el enfoque clásico, en el cual la
asignación de la probabilidad se hace dividiendo el número de casos favorables
entre el número de casos totales. En los ejemplos que al respecto se dieron,
pudimos fácilmente calcular ambos casos. Estos ejemplos fueron sencillos; así por
ejemplo en el experimento de “tirar un dado”, la probabilidad de que aparezca en
la cara superior un número para (2, 4, 6) dividimos el número total de pares (en
este caso 3) entre el número total de caras que tiene el dado (es 6). y la
probabilidad es ; es decir, de un 50%.
Pero se tienen experimentos donde no es tan fácil enumerar los casos favorables
y totales. Para salvar esta dificultad, se hace uso de las llamadas técnicas de
conteo que facilitan enumerar ambos casos.
El esquema siguiente ilustra estas técnicas:
5.0
2
1
6
3

74
5.1.-Listar Resultados.
Esta técnica es la que empleamos en los ejemplos antes vistos. Contábamos los
casos, los enlistábamos y formábamos el espacio muestral. Una vez hecho esto,
procedíamos a calcular probabilidades.
5.2.-Diagrama de árbol.
En algunos experimentos resulta sencillo construir una especie de árbol donde se
anotan los puntos muestrales. Se cuentan estos puntos y se tiene el espacio
muestral.
Ejemplo 1.
Experimento: Se trata de lanzar dos dados. Trazar el diagrama de árbol y anotar el
espacio muestral.
Solución.
Cada dado tiene 6 caras numeradas del 1 al 6. Si el primer dado llega a caer en 1,
en 2, en 3, en 4, en 5 o en 6; el otro puede caer en cualquiera de esos mismos
números. El árbol puede ser entonces un dibujo como el siguiente:
Técnicas de conteo
Diagrama de
árbol
Fórmulas matemáticas:
 Ley fundamental de la
multiplicación.
 Permutaciones
 Combinaciones
Listar resultado
75
La barra de la izquierda representa las posibilidades del dado 1 y la barra de la
derecha las posibilidades del dado 2 en cada una de las posibilidades del dado 1.
El espacio muestral de este experimento es:
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
76
ῼ =
Nota: Observar que la cardinalidad del espacio muestral es 36. En otras palabras,
el número de puntos muestrales es 36.
En base a lo encontrado, podemos calcular probabilidades como las siguientes:
1.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados en uno
de ellos “caiga un 3 y en el otro caiga un 6”?
P( E ) = La probabilidad es del 2.7%
2.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados salgan
números nones (en un dado un non y en el otro también non)?.
Si analizamos el espacio muestral, los casos favorables son 9 puntos muestrales;
es decir, (1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5). La probabilidad
será:
25.0
36
9
)( EP
Ejemplo 2.
La preparatoria No 8 de Cd. Altamirano tiene 1500 estudiantes. De esta cantidad,
325 les gusta el campo de las matemáticas y las ciencias experimentales, 550 las
ciencias de la salud y los 625 restantes el campo de humanístico-sociales.
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Casos favorables
Casos totales
027.0
36
1

La probabilidad es el 25%
77
Con esta información, trace un diagrama de árbol y calcula la probabilidad de que
un estudiante elegido al azar estudie:
 Ingeniería
 Optometría
 Historia
Solución:
El diagrama de árbol puede ser el siguiente:
Probabilidad de que un estudiante elegido al azar estudie ingeniería:
2166.0
1500
325
)( IP
Probabilidad de que un estudiante elegido al azar estudie Optometría:
Estudiantes
# ῼ = 1500
Matemáticas y ciencias
experimentales
# (M y CE) = 325
Ciencias de la salud
# (CS) =550
Humanístico-sociales
# (HS) = 625
78
3666.0
1500
550
)( OP
Probabilidad de que un estudiante elegido al azar estudie Historia:
4166.0
1500
625
)( HP
Ejemplo 3.
Un restaurante de Cd. Altamirano presenta la posibilidad de elegir como menú de
comidas corridas: un plato de entrada que puede ser sopa o arroz; como plato
principal puede elegir o carne o pollo o pescado y de postre puede ser o pastel o
helado.
Dibujar un diagrama de árbol que represente todas las posibilidades de comidas
corridas (espacio muestral) que ofrece el restaurante.
Solución:
Arroz
Sopa
Carne
Pollo
Pescado
Carne
Pollo
Pescado
Pastel
Helado
Pastel
Helado
Pastel
Helado
Pastel
Helado
Pastel
Helado
Pastel
Helado
79
Si escribimos el espacio muestral, tendremos 12 comidas diferentes:
Nota: Debe observarse que la cardinalidad del espacio muestral es 12 y que
equivale al número de las últimas “ramitas” (las flechas) del árbol.
TAREA.
Hagan equipos de 5 estudiantes y resuelvan lo siguiente:
Problema.
En un restaurante de Cd. Altamirano se ofrece un menú de comidas corridas que
consiste en lo siguiente:
Como platillo de entrada se puede elegir entre sopa, jugo de naranja o jugo de
verduras.
Como platillo principal se puede elegir entre birria, aporreado o pollo.
Como postre se puede elegir entre pastel o gelatina.
1) Arroz-carne pastel
2) Arroz-carne-helado
3) Arroz-pollo-pastel
4) Arroz-pollo-helado
5) Arroz-pescado-pastel
6) Arroz-pescado-helado
7) Sopa-carne-pastel
8) Sopa-carne-helado
9) Sopa-pollo-pastel
10) Sopa-pollo-helado
11) Sopa-pescado-pastel
12) Sopa-pescado-helado
80
Dibujen un diagrama de árbol, escriban el espacio muestral e indiquen la
cardinalidad.
Problema.
Se tiene un dado y una moneda. Se lanza el dado y se anota el número que queda
hacia arriba. En seguida se lanza la moneda y se anota el resultado. Dibujar un
diagrama de árbol que represente este experimento, escriban el espacio muestral
e indiquen la cardinalidad.
5.3.-Fórmulas matemáticas.
5.3.1.-Ley fundamental de la multiplicación.
En muchos experimentos no se prefiere el dibujo del árbol ya que resulta difícil de
trazarlo y se opta por usar la ley fundamental de la multiplicación. Con esta ley se
obtiene la cardinalidad del espacio maestral o sea el número de puntos
muestrales.
La ley dice que si en un experimento, una operación se puede hacer en “m”
formas y otra segunda operación se puede hacer en “n” formas, entonces las dos
operaciones pueden hacerse juntas en “m· n” formas .
Ejemplo 1.
En un experimento se lanza un par de dados. ¿Cuál es la cardinalidad del espacio
muestral de este experimento?
Solución.
El dado 1 puede caer en 6 maneras diferentes. Entonces puede caer en “m = 6”
formas distintas. El dado 2 presenta también “n = 6” formas distintas de caer. De
acuerdo con la ley fundamental de la multiplicación, la cardinalidad del espacio
muestral será:
# ῼ = m·n = (6) (6) = 36
81
Ejemplo 2.
Un experimento consiste en lanzar un dado y posteriormente una moneda. ¿Cuál
es la cardinalidad del espacio muestral?.
Solución.
El dado presenta m = 6 formas de caer. La moneda presenta n = 2 formas de caer.
De acuerdo con la ley de la multiplicación la cardinalidad del espacio muestral
será:
# ῼ = m·n = (6) (2) = 12
Ejemplo 3.
En la tienda COPEL de Cd. Altamirano se ofertan camisas en 3 colores. Cada
color se presenta en 4 tallas diferentes y están marcadas como S, M, L, XL. Cada
talla tiene 2 tipos de estampados. ¿Cuántas camisas diferentes (cardinalidad del
espacio muestral) oferta la tienda la tienda COPEL?.
Solución.
Aplicando la ley de la multiplicación, la cardinalidad del espacio muestral será:
# ῼ = m·n·p = (3) (4) (2) = 24
TAREA.
Hagan equipos de 5 estudiantes y resuelvan lo siguiente:
1.- Un experimento consiste en lanzar 3 dados. calculen la cardinalidad del
espacio muestral y argumenten el resultado.
2.- Entre Cd. Altamirano y Arcelia se tiene la Ciudad de Tlapehuala. Supongamos
que entre Cd. Altamirano y Tlapehuala se tienen 4 caminos que comunican a esas
ciudades (Cd. Altamirano y Tlapehual) y entre Tlapehuala y Arcelia son 6 caminos
los que comunican a esas dos ciudades (Tlapehuala y Arcelia). Hagan un dibujo
que represente esta situación y calculen de cuantas formas es posible viajar de
Cd. Altamirano a Arcelia.
82
3.-¿De cuantas formas diferentes se pueden seleccionar parejas de diferente sexo
de un grupo de 4 hombres y 6 mujeres?.
5.3.2.- Permutaciones.
Antes de explicar esta técnica de conteo, se requiere conocer el significado del
concepto “factorial de un número entero positivo”.
Factorial de un número “n” entero positivo.
Si se tiene un número “n” que sea entero y positivo (1,2,3,4,5,6…+∞), su factorial
escrito como “nỊ” y que se lee diciendo “ene factorial” o “factorial de ene”, es el
producto de todos los números enteros positivos que existan desde 1 hasta “n”.
Si “n” es cero, su factorial es 1 (por definición).
Si “n” ni es entero positivo y ni tampoco es cero, entonces no tiene sentido su
factorial.
Ejemplos de factorial de números “n” siendo todos enteros y positivos (se incluye
el factorial de 0):
0Ị = 1 (por definición)
1Ị = 1
2Ị = 1x2 = 2
3Ị = 1x2x3 = 6
4Ị = 1x2x3x4 = 24
5Ị = 1x2x3x4x5 = 120
6Ị = 1x2x3x4x5x6 = 720
7Ị = 1x2x3x4x5x6x7= 5040
0.5Ị = Sin sentido, ya que 0.5 no es entero positivo.
- 4Ị = Sin sentido, ya que – 4 no es entero positivo.
83
La técnica Permutaciones.
Muchas veces es importante un espacio muestral que contenga como elementos
todos los posibles arreglos u ordenes de un grupo de objetos; en otras palabras,
cuando el orden en que se disponen los términos es importante, el número
total de resultados posibles recibe el nombre de permutación.
En forma por demás simple, podemos decir que una permutación es un arreglo
ordenado de objetos.
Para entender lo anterior, pongamos el siguiente ejemplo:
Ejemplo 1.
Problema:
Entre Cd. Altamirano y Tejupilco se encuentra la ciudad de Cutzamala. Pensemos
que entre Altamirano y Cutzamala se tienen 3 carreteras que unen a esas
poblaciones (Altamirano y Cutzamala) y entre Cutzamala y Tejupilco existen 2
carreteras que las unen (a Cutzamala con Tejupilco). Una persona estando en Cd.
Altamirano, desea viajar de este lugar (Altamirano) hasta Tejupilco. ¿De cuantas
formas puede hacerlo?.
Solución:
Hagamos un dibujo representativo:
Es lógico pensar que si la persona sale de Cd. Altamirano, al partir a Cutzamala,
únicamente puede tomar una sola carretera (de las 3 existentes) y cuando parte
de Cutzamala a Tejupilco, puede también tomar una sola (de las 2 existentes). Así
que, en su partida de Cd. Altamirano, ÚNICAMENTE TIENE 3 formas distintas
para emprender su viaje.
CD. ALTAMIRANO CUTZAMALA TEJUPILCO
r1
r2
r3
r4
r5
84
Usando factoriales tendríamos:
3Ị = 1x2x3 = 6 que serían las distintas formas que puede elegir para hacer el
viaje.
El valor 6 representa la cardinalidad del espacio muestral de ese experimento (o
problema); es decir, son 6 los puntos muestrales del espacio muestral.
Ω = (r1 r4) (r1 r5) (r2 r4) (r2 r5) (r3 r4) (r3 r5)
Del análisis del problema anterior, se puede desprender el siguiente teorema:
Teorema:
El número de permutaciones de “n” objetos distintos es “nỊ”.
El número de permutaciones de “n” objetos distintos, tomando “r” a la vez es:
nPr =
Algunos autores usan otras escrituras para escribir nPr ; nosotros consideramos
que la mas sencilla es esta.
Por otra parte, obsérvese que cuando n = r, se llegaría al valor nỊ
Ejemplo 2.
En la clínica del ISSSTE de Cd. Altamirano, se tienen 5 consultorios que serán
ocupados por 5 médicos. ¿De cuántas maneras distintas pueden asignarse a los 5
médicos los 5 consultorios?.
Solución.
Para este problema, n = 5, r = 5. Aplicando la fórmula se tendrá:
nPr = = = = 120
nỊ
(n – r)Ị
nỊ
(n – r)Ị
5Ị
(5 – 5)Ị
1·2·3·4·5
0Ị
85
Ejemplo 3.
En la clínica del IMSS de Cd. Altamirano, se tienen 6 enfermeras, de las cuales 4
se asignarán para ocupar 4 cubículos. Se pide calcular el número de
permutaciones posibles.
Solución.
Para este caso, se tienen 6 objetos (las enfermeras), de las cuales se toman 4 a la
vez. Así que n = 6 ; r = 4
nPr = 6P4 = = = = 360
Ejemplo 4.
Calcular el número de permutaciones de las letras a, b, c. tomadas de dos en dos.
Escribir el espacio muestral de estas permutaciones.
Solución.
nPr = 3P2 = = = = 6
El espacio muestral es: ab,ac,ba,ba,ca,cb. (Son 6 los números muestrales).
Ejemplo 5.
Una combi que sale de Cd. Altamirano a Arcelia, tiene un asiento para 4 personas.
En Tanganhuato suben 8 pasajeros. ¿De cuantas maneras pueden estar sentadas
en el asiento?.
Solución:
Para este problema se tiene que n = 8, r = 4; entonces tendremos:
nPr = 8P4 = = = = = 1680
nỊ
(n – r)Ị
6Ị
(6 – 4)Ị
1·2·3·4·5·6
2Ị
nỊ
(n – r)Ị
3Ị
(3 – 2)Ị
1·2·3
1Ị
nỊ
(n – r)Ị
8Ị
(8 – 4)Ị
40320
24
1·2·3·4·5·6·7·8
1·2·3·4
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica
Apuntes de estadistica con enfoque a la bioestadistica

Más contenido relacionado

La actualidad más candente

4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencialrbarriosm
 
Intervalos de confianza 2018
Intervalos de confianza 2018Intervalos de confianza 2018
Intervalos de confianza 2018franciscoe71
 
Medidas de tendencias central y dispersión
Medidas de tendencias central y dispersiónMedidas de tendencias central y dispersión
Medidas de tendencias central y dispersiónAngie Pm
 
6.medidas de posición no central
6.medidas de posición no central6.medidas de posición no central
6.medidas de posición no centralrosa61
 
Medidas de resumen distribuciones de frecuencia proporciones y razones
Medidas de resumen distribuciones de frecuencia proporciones y razonesMedidas de resumen distribuciones de frecuencia proporciones y razones
Medidas de resumen distribuciones de frecuencia proporciones y razonesBrenda Aurora Tafur Hoyos
 
Indicadores
IndicadoresIndicadores
Indicadorescardol02
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptivasusoigto
 
Medidas de frecuencia
Medidas de frecuenciaMedidas de frecuencia
Medidas de frecuenciadolgoncam1
 
Informe estadistica
Informe estadisticaInforme estadistica
Informe estadisticanoeliatoro95
 
Presentacion de datos estadisticos en ciencias de la salud
Presentacion de datos estadisticos en ciencias de la saludPresentacion de datos estadisticos en ciencias de la salud
Presentacion de datos estadisticos en ciencias de la saluddamaca64
 

La actualidad más candente (20)

4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencial
 
Medidas de-asociacion
Medidas de-asociacionMedidas de-asociacion
Medidas de-asociacion
 
Probabilidad y Estadística
Probabilidad y EstadísticaProbabilidad y Estadística
Probabilidad y Estadística
 
Bioestadistica
Bioestadistica Bioestadistica
Bioestadistica
 
Intervalos de confianza 2018
Intervalos de confianza 2018Intervalos de confianza 2018
Intervalos de confianza 2018
 
Análisis Estadístico
Análisis EstadísticoAnálisis Estadístico
Análisis Estadístico
 
Medidas de tendencias central y dispersión
Medidas de tendencias central y dispersiónMedidas de tendencias central y dispersión
Medidas de tendencias central y dispersión
 
Clase 02. parametros y estadistica en epidemiologia
Clase 02. parametros y estadistica en epidemiologiaClase 02. parametros y estadistica en epidemiologia
Clase 02. parametros y estadistica en epidemiologia
 
6.medidas de posición no central
6.medidas de posición no central6.medidas de posición no central
6.medidas de posición no central
 
Medidas de resumen distribuciones de frecuencia proporciones y razones
Medidas de resumen distribuciones de frecuencia proporciones y razonesMedidas de resumen distribuciones de frecuencia proporciones y razones
Medidas de resumen distribuciones de frecuencia proporciones y razones
 
Distribucion de frecuencias
Distribucion de frecuenciasDistribucion de frecuencias
Distribucion de frecuencias
 
Indicadores
IndicadoresIndicadores
Indicadores
 
Regla sturges
Regla sturgesRegla sturges
Regla sturges
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptiva
 
Analisis parametricos-y-no-parametricos
Analisis parametricos-y-no-parametricosAnalisis parametricos-y-no-parametricos
Analisis parametricos-y-no-parametricos
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Medidas de frecuencia
Medidas de frecuenciaMedidas de frecuencia
Medidas de frecuencia
 
Medidas de Tendencia Central
Medidas de Tendencia CentralMedidas de Tendencia Central
Medidas de Tendencia Central
 
Informe estadistica
Informe estadisticaInforme estadistica
Informe estadistica
 
Presentacion de datos estadisticos en ciencias de la salud
Presentacion de datos estadisticos en ciencias de la saludPresentacion de datos estadisticos en ciencias de la salud
Presentacion de datos estadisticos en ciencias de la salud
 

Destacado

Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011cesarzatta
 
Problemas resueltos-cap-2-fisica-serway
Problemas resueltos-cap-2-fisica-serwayProblemas resueltos-cap-2-fisica-serway
Problemas resueltos-cap-2-fisica-serwayKeos21
 
CALCULO 12 GRADO AMERICANO
CALCULO 12 GRADO AMERICANOCALCULO 12 GRADO AMERICANO
CALCULO 12 GRADO AMERICANOcarmenvivianalbj
 
Taller No 2 .. soluciones y unidades de concentracion...
Taller No 2 .. soluciones y unidades de concentracion...Taller No 2 .. soluciones y unidades de concentracion...
Taller No 2 .. soluciones y unidades de concentracion...j_wilsonmontana
 
Ejercicios estadistica
Ejercicios estadisticaEjercicios estadistica
Ejercicios estadisticaVivi42
 
Medidas de tendencia central taller
Medidas de tendencia central tallerMedidas de tendencia central taller
Medidas de tendencia central tallerCarmen Carranza
 
Estadística Unidades Desarrolladas
Estadística Unidades DesarrolladasEstadística Unidades Desarrolladas
Estadística Unidades Desarrolladaslourdes zuñiga
 
Actividades de Estadística
Actividades de EstadísticaActividades de Estadística
Actividades de EstadísticaDiana Garcia
 
Cinematica Nivel Cero Problemas Resueltos Y Propuestos
Cinematica Nivel Cero Problemas Resueltos Y PropuestosCinematica Nivel Cero Problemas Resueltos Y Propuestos
Cinematica Nivel Cero Problemas Resueltos Y Propuestosguest229a344
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaYohana Bonilla Gutiérrez
 

Destacado (20)

Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 
Bioestadistica ss14
Bioestadistica ss14Bioestadistica ss14
Bioestadistica ss14
 
Ejercicios bioestadistica
Ejercicios bioestadisticaEjercicios bioestadistica
Ejercicios bioestadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Problemas resueltos-cap-2-fisica-serway
Problemas resueltos-cap-2-fisica-serwayProblemas resueltos-cap-2-fisica-serway
Problemas resueltos-cap-2-fisica-serway
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 
CALCULO 12 GRADO AMERICANO
CALCULO 12 GRADO AMERICANOCALCULO 12 GRADO AMERICANO
CALCULO 12 GRADO AMERICANO
 
Modulo de estadistica ii
Modulo de estadistica iiModulo de estadistica ii
Modulo de estadistica ii
 
Taller No 2 .. soluciones y unidades de concentracion...
Taller No 2 .. soluciones y unidades de concentracion...Taller No 2 .. soluciones y unidades de concentracion...
Taller No 2 .. soluciones y unidades de concentracion...
 
Estadística Probabilidad
Estadística ProbabilidadEstadística Probabilidad
Estadística Probabilidad
 
Ejercicios estadistica
Ejercicios estadisticaEjercicios estadistica
Ejercicios estadistica
 
Modulo probabilidad i 2010
Modulo probabilidad i 2010Modulo probabilidad i 2010
Modulo probabilidad i 2010
 
Resueltos estimacion
Resueltos estimacionResueltos estimacion
Resueltos estimacion
 
Medidas de tendencia central taller
Medidas de tendencia central tallerMedidas de tendencia central taller
Medidas de tendencia central taller
 
Diapos de vibrio cholerae
Diapos de vibrio choleraeDiapos de vibrio cholerae
Diapos de vibrio cholerae
 
Estadística Unidades Desarrolladas
Estadística Unidades DesarrolladasEstadística Unidades Desarrolladas
Estadística Unidades Desarrolladas
 
Actividades de Estadística
Actividades de EstadísticaActividades de Estadística
Actividades de Estadística
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Cinematica Nivel Cero Problemas Resueltos Y Propuestos
Cinematica Nivel Cero Problemas Resueltos Y PropuestosCinematica Nivel Cero Problemas Resueltos Y Propuestos
Cinematica Nivel Cero Problemas Resueltos Y Propuestos
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptiva
 

Similar a Apuntes de estadistica con enfoque a la bioestadistica

Introducción a la estadística
Introducción a la estadística Introducción a la estadística
Introducción a la estadística cinthyaolivares4
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)Luisa Santa María
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.THETINTER
 
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdfalbeiro mendoza
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasEmmanuelSantos11
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasAngelicaAguado2
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciassalomepereaquintero
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasSofaGarzn1
 
QUE ES LA ESTADISTICA
QUE ES LA ESTADISTICAQUE ES LA ESTADISTICA
QUE ES LA ESTADISTICAbrandcho0511
 
PROYECTO_FINAL
PROYECTO_FINALPROYECTO_FINAL
PROYECTO_FINALaleja2014
 
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...UNI - UCH - UCV - UNMSM - UNFV
 
Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologiaGusVaron
 
Investigacion estadisitica
Investigacion estadisiticaInvestigacion estadisitica
Investigacion estadisiticaEdinsonGomez11
 
Capítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística AplicadaCapítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística Aplicadaug-dipa
 

Similar a Apuntes de estadistica con enfoque a la bioestadistica (20)

Introducción a la estadística
Introducción a la estadística Introducción a la estadística
Introducción a la estadística
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
 
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.CONCEPTOS  DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
CONCEPTOS DE PROGRAMACIÓN, MÉTODOS ESTADÍSTICOS.
 
7. metodologia y estadistica aplicada a la educacion
7. metodologia y estadistica aplicada a la educacion7. metodologia y estadistica aplicada a la educacion
7. metodologia y estadistica aplicada a la educacion
 
Metodos estadisticos
Metodos estadisticosMetodos estadisticos
Metodos estadisticos
 
Estadistica
Estadistica Estadistica
Estadistica
 
Deestadistica
DeestadisticaDeestadistica
Deestadistica
 
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf
008_Gómez(2006)_Pensamientoaleatorioysistemadedatos.pdf
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
QUE ES LA ESTADISTICA
QUE ES LA ESTADISTICAQUE ES LA ESTADISTICA
QUE ES LA ESTADISTICA
 
PROYECTO_FINAL
PROYECTO_FINALPROYECTO_FINAL
PROYECTO_FINAL
 
Estadistica sebas
Estadistica sebasEstadistica sebas
Estadistica sebas
 
estadistica_aplicada.pdf
estadistica_aplicada.pdfestadistica_aplicada.pdf
estadistica_aplicada.pdf
 
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...
Estadística Descriptiva - Geometría Analítica - Función Exponencial y Logarít...
 
Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Investigacion estadisitica
Investigacion estadisiticaInvestigacion estadisitica
Investigacion estadisitica
 
Capítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística AplicadaCapítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística Aplicada
 

Último

Informe Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasInforme Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasRevista Saber Mas
 
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdfFowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdffrank0071
 
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdf
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdfSEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdf
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdfrvillegasp16001
 
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaDiapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaAgustin535878
 
Procedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfProcedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfCarlaLSarita1
 
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...Juan Carlos Fonseca Mata
 
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanica
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanicaproblemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanica
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanicaArturoDavilaObando
 
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALozadaAcuaMonserratt
 
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA EN EQUINOS.pptx
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA  EN EQUINOS.pptxEXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA  EN EQUINOS.pptx
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA EN EQUINOS.pptxJhonFonseca16
 
Pielonefritis en imagenologia clinica.pptx
Pielonefritis en imagenologia clinica.pptxPielonefritis en imagenologia clinica.pptx
Pielonefritis en imagenologia clinica.pptxLuisGuzmnHernndez1
 
registro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionregistro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionMarcoAntonioJimenez14
 
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONHISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONAleMena14
 
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismo
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismoPIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismo
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismoArturoDavilaObando
 
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdfFritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdffrank0071
 
Ejercicios de estimulación prenatales.pptx
Ejercicios de estimulación prenatales.pptxEjercicios de estimulación prenatales.pptx
Ejercicios de estimulación prenatales.pptxYahairaVaraDiaz1
 
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdfHolland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdffrank0071
 
Límites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxLímites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxErichManriqueCastill
 
ESQUELETO HUMANO ARTICULADO PARA PRIMARIA
ESQUELETO HUMANO ARTICULADO PARA PRIMARIAESQUELETO HUMANO ARTICULADO PARA PRIMARIA
ESQUELETO HUMANO ARTICULADO PARA PRIMARIAjuliocesartolucarami
 
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...frank0071
 
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...frank0071
 

Último (20)

Informe Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena ParadasInforme Aemet Tornados Sabado Santo Marchena Paradas
Informe Aemet Tornados Sabado Santo Marchena Paradas
 
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdfFowler, Will. - Santa Anna, héroe o villano [2018].pdf
Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
 
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdf
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdfSEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdf
SEMIOLOGIA RESPIRATORIA, CLINICA BASICA .pdf
 
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundariaDiapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
Diapositiva sobre el conflicto de Israel - Palestina para nivel secundaria
 
Procedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdfProcedimiento e interpretación de los coprocultivos.pdf
Procedimiento e interpretación de los coprocultivos.pdf
 
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...
Documento Técnico Base del Inventario de Especies Vegetales Nativas del Estad...
 
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanica
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanicaproblemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanica
problemas_oscilaciones_amortiguadas.pdf aplicadas a la mecanica
 
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIALOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
LOS DISTINTOS MUNICIPIO_SALUDABLE DE BOLIVIA
 
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA EN EQUINOS.pptx
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA  EN EQUINOS.pptxEXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA  EN EQUINOS.pptx
EXAMEN ANDROLOGICO O CAPACIDAD REPRODUCTIVA EN EQUINOS.pptx
 
Pielonefritis en imagenologia clinica.pptx
Pielonefritis en imagenologia clinica.pptxPielonefritis en imagenologia clinica.pptx
Pielonefritis en imagenologia clinica.pptx
 
registro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracionregistro cardiotocografico interpretacion y valoracion
registro cardiotocografico interpretacion y valoracion
 
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPIONHISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
HISTORIA NATURAL DE LA ENFEREMEDAD: SARAMPION
 
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismo
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismoPIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismo
PIZARRO-parte4.pdf apuntes de física 3, electricidad y magnetismo
 
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdfFritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
Fritzsche, Peter. - Vida y muerte en el Tercer Reich [ocr] [2009].pdf
 
Ejercicios de estimulación prenatales.pptx
Ejercicios de estimulación prenatales.pptxEjercicios de estimulación prenatales.pptx
Ejercicios de estimulación prenatales.pptx
 
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdfHolland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
Holland, Tom - Milenio. El fin del mundo y el origen del cristianismo [2010].pdf
 
Límites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptxLímites derivadas e integrales y análisis matemático.pptx
Límites derivadas e integrales y análisis matemático.pptx
 
ESQUELETO HUMANO ARTICULADO PARA PRIMARIA
ESQUELETO HUMANO ARTICULADO PARA PRIMARIAESQUELETO HUMANO ARTICULADO PARA PRIMARIA
ESQUELETO HUMANO ARTICULADO PARA PRIMARIA
 
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
 
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
 

Apuntes de estadistica con enfoque a la bioestadistica

  • 1.
  • 2. Presentación En el año 2000, la Universidad Autónoma de Guerrero (UAGro) llevó acabo su tercer congreso general universitario, acontecimiento que tuvo resolutivos importantes para darle a la universidad una identidad acorde a los tiempos actuales. Derivado del congreso, se diseñó el nuevo Modelo Educativo y Académico que en el año 2005 fue aprobado por el H. Consejo Universitario. Tres años mas tarde (en el 2008), dicho modelo se inicia en el bachillerato universitario con planes de estudio centrados en el aprendizaje y en el estudiante, tratando con esto de ser congruente con el nuevo modelo que contempla impartir una educación integral al educando. Al año siguiente (2009), la Secretaría de Educación Pública (SEP), acuerda darle al bachillerato mexicano una educación integral; pero con enfoque en competencias. Con esto, la SEP propone la Reforma Integral para la Educación Media Superior (RIEMS), que fue aceptada por casi la totalidad de los diferentes subsistemas de educación media superior del país, entre ellos, el bachillerato que se imparte en la UAGro. Para ajustarse a la RIEMS, el bachillerato de la UAGro, cambia la estructura de los planes y programas que estaban diseñados en el aprendizaje y en el estudiante, a otros nuevos (los actuales) que tienen la estructura del enfoque por competencias. Pero no únicamente se diseñaron los nuevos planes, sino que se procedió a capacitar al personal docente (profesores) para que a través de un Diplomado conociéramos la RIEMS y cambiar nuestro trabajo docente por otro con enfoque por competencias. Sumado a lo anterior, se “nos invitó” a varios profesores a capacitarnos en escribir los textos de las asignaturas del bachillerato, trabajo que hicimos con gran entusiasmo. Se escribieron varios textos; pero resulta que faltó el de la materia de Estadística, asignatura que se imparte únicamente en el cuarto semestre del bachillerato con solamente 3 horas a la semana. En el quinto semestre aparece nuevamente; pero con la etiqueta de optativa. Por desgracia, se tienen indicadores que muestran que casi ninguna preparatoria de la UAGro oferta esta optativa y en consecuencia nadie la cursa. Desde mi opinión, este es un problema que debe resolverse. Por un lado, incrementar el número de horas del cuarto semestre y por el otro, hacerla obligada en el quinto. Esto lo justifico en el sentido que prácticamente todas las licenciaturas contemplan al menos uno o dos cursos de Estadística y Probabilidad.
  • 3. Consciente del problema anterior, se procedió a escribir los presentes apuntes, que titulé “Estadística con enfoque a la Bioestadística” que tienen un doble propósito: servir como material de apoyo tanto a profesores como a estudiantes del bachillerato universitario y servir de igual manera a las mismas figuras; pero en licenciaturas como enfermería o en aquellas donde se imparta la bioestadística con enfoque a las ciencias de la salud. Los apuntes se hicieron en base al programa de estudios por competencias que actualmente existe en el bachillerato de la UAGro y aunque no están escritos con la estructura de las competencias, considero que al no existir el texto correspondiente puede ayudar en mucho tanto al alumno como al maestro. Los apuntes se dividieron en dos partes: En la primera se trata de los Sucesos con una variable; es decir, lo que tradicionalmente se conoce como la Estadística Descriptiva. En la segunda, se trata el Azar y su medida; es decir, la Probabilidad. Me sentiré satisfecho si se cumplen los propósitos mencionados. Cd. Altamirano Gro, mes de agosto de 2013 JESÚS FERNÁNDEZ ALMAZÁN Unidad Académica: Preparatoria No 8.
  • 4. CONTENIDO CONCEPTOS BÁSICOS 1 La estadística y su utilidad 1 ¿Qué es la estadística? 1 Definición 1 Clasificación 1 Datos 2 Población 2 Muestra 2 Variable 2 PARTE I ESTUDIOS DE SUCESOS CON UNA VARIABLE LA ESTADÍSTICA DESCRIPTIVA 4 1 Recolección, ordenación, análisis e interpretación de datos 4 1.1 Recolección 4 1.2 Ordenación 4 1.3 Intervalos de clase 6 1.4 Distribución de frecuencias 7 1.5 Frecuencias acumuladas 7 1.6 Histograma y polígono de frecuencias 8 2 Medidas de tendencia central a partir de una colección de datos. 13 2.1 Media aritmética 14 2.2 Mediana 15 2.3 Moda 17 3 Medidas de dispersión a partir de una colección de datos 19 3.1 Rango o recorrido 19 3.2 Desviación media 20 3.3 Varianza 23 3.4 Desviación estándar 25 4 Medidas de tendencia central y de dispersión a partir de datos agrupados. 30 4.1 Media aritmética a partir de datos agrupados 31 4.2 Mediana a partir de datos agrupados 34 4.3 Moda a partir de datos agrupados 40 4.4 Varianza y desviación estándar a partir de datos agrupados 41
  • 5. PARTE II EL AZAR Y SU MEDIDA CONCEPTOS BÁSICOS DE PROBABILIDAD INTRODUCCIÓN A LA ESTADISTICA INFERENCIAL 48 1 La probabilidad 48 2 Teoría de conjuntos 49 2.1 Definición de conjunto 49 2.2 Descripción de conjuntos 49 2.3 Tipos de conjuntos 51 2.4 Cardinalidad de un conjunto 51 2.5 Operaciones con conjuntos 52 3 Iniciación a la teoría de la probabilidad 57 3.1 Conceptos básicos 58 3.1.1 Experimento 58 3.1.2 Evento 58 3.1.3 Espacio muestral 59 3.1.4 Punto muestral 60 4 Enfoques de la probabilidad 60 4.1 Enfoque clásico o modelo de Laplace 61 4.2 Enfoque empírico 69 4.3 Enfoque subjetivo 72 5 Las técnicas de conteo 73 5.1 Listas de resultados 74 5.2 Diagramas de árbol 74 5.3 Fórmulas matemáticas 80 5.3.1 Ley fundamental de la multiplicación 80 5.3.2 Permutaciones 82 5.3.3 Combinaciones 86 6 Distribuciones de la probabilidad 89 6.1 Distribución con variable discreta 89 6.2 Distribución acumulada 92 6.3 Probabilidades como consideraciones teóricas 93 6.3.1 Distribución Binomial o de Bernoulli 94 6.3.2 Distribución de Poisson 100 6.3.3 Distribución normal 103 6.3.3.1 Ecuación matemática de la curva de distribución normal 104 6.3.3.2 Propiedades de la curva de distribución normal 108 6.3.3.3 Estandarización de datos o valores “z” 110 6.3.3.4 Significado geométrico de “z”. 114 6.3.3.5 Áreas bajo la curva de distribución normal 115
  • 6. 1 CONCEPTOS BÁSICOS La estadística y su utilidad Desde tiempos lejanos, el hombre ha usado datos para conocer su entorno o para describir su región. Se sabe que en la época de Cristo, cierto día “José y María llevaron al niño Jesús a registrarse en un censo ordenado por el rey Herodes”. En la época actual, vivimos rodeado e inundado de las nuevas tecnologías: celulares, computadoras, calculadoras digitales, televisiones planas y muy modernas etc. A través de estos instrumentos, se escuchan noticias como “Las estadísticas de la Procuraduría de Justicia de Guerrero indican que en el año 2012 se registraron 1539 extorsiones en Cd. Altamirano” o noticias como “La obesidad de los niños de tierra caliente sigue en aumento. La estadística indica que en lugar de consumir 800 calorías, los niños consumen cantidades entre 2000 o 2500”. Así también la palabra estadística se escucha en los censos de población, en las encuestas cuando vienen las elecciones, en los torneos de futbol etc. En fin estamos rodeados de números, de datos, de informes que tratan de explicar lo que sucede en algún fenómeno social o científico. Es la Estadística la que se encarga de ordenarlos, analizarlos e interpretarlos. Pero ¿Qué es la Estadística? La palabra estadística proviene del vocablo latino “Estatus” que significa estado o condición. Este vocablo se usó desde la época de la Edad Media para describir las características del Estado: cuántas personas había en la ciudad, a cuántas se les cobraban impuestos, cuántas contaban con determinado número de cabezas de ganado, etc. Pasaron los años y la necesidad de manipular colecciones de datos, hizo que naciera la Estadística Teórica que tiene sus orígenes en el siglo XVIII. Con dicha Estadística se establece un orden para recolectar datos, procesarlos e interpretarlos. Con esto, se formaliza la Estadística. Definición de Estadística. Es la ciencia que brinda los instrumentos (métodos y técnicas) para recopilar, organizar, presentar, analizar e interpretar información que apoye los procesos de toma de decisiones en cualquier ámbito. Clasificación de la Estadística. Son dos ramas en que se divide la estadística:
  • 7. 2  Estadística Descriptiva.  Estadística Inferencial. La Estadística descriptiva se apoya en las matemáticas para recolectar, ordenar, analizar y presentar una colección de datos que se tomaron de alguna población o de alguna muestra tomada de dicha población. Esto le sirve al investigador para hacer predicciones, sacar conclusiones y tomar decisiones sobre el comportamiento que puede tener la población o la muestra de la población donde fue tomada. La Estadística inferencial es la que se apoya en la teoría de las probabilidades y las técnicas de muestreos para obtener ciertos juicios de la población en estudio. Términos básicos usados en la Estadística. Datos Son los valores numéricos o tal vez características que se cuentan, observan o se miden. Ejemplos de ellos pueden ser la colección de calificaciones de un grupo escolar, las respuestas que se dan de alguna pregunta hecha en el Facebook, el número de boletos vendidos para el concurso de la reina de la escuela, el número de enfermos que ingresan a un hospital durante una semana, etc. Población También se le conoce como universo y es el conjunto finito o infinito de personas, cosas u objetos que presentan características comunes. Muestra Es una parte representativa de una población. Su uso se debe a que existen casos en que la población es muy grande y en consecuencia resulta difícil y a veces imposible poderla contar; razón por la cual se recurre a una muestra representativa. Los resultados que se obtengan, se hacen extensivos a la población donde fue tomada. Variable Por variable entendemos toda característica que se estudia a cierto fenómeno, acontecimiento o simplemente a un sujeto. Comúnmente las variables suelen clasificarse en cualitativas y cuantitativas. Las cualitativas se refieren a cualidades que no pueden medirse; así por ejemplo el
  • 8. 3 sexo de las personas o animales, la nacionalidad de un grupo de extranjeros que llegaron a Cd. Altamirano, la responsabilidad de los alumnos de hacer las tareas, el color de la piel de los habitantes del Estado de Guerrero, etc. Por su parte las variables cuantitativas si pueden medirse usando números. Estas variables se clasifican a su vez en continuas y discontinuas. Las continuas se pueden medir con números enteros y fracciones; así por ejemplo las estaturas de los alumnos de una escuela (existen medidas como 1.65 m, 1.72 m, 1.76 m etc), otro ejemplo sería el peso de los niños al nacer (3.200 kg, 3.500 kg, 3.650 kg, etc). Por su parte, las discontinuas se miden únicamente con números enteros; así por ejemplo el número de hijos de las familias de tierra caliente (no puede decirse que una familia tiene 4.56 hijos), el número de alumnos de cada grupo de la escuela (no puede decirse que un grupo tiene 50. 45 alumnos), etc. También existen otras variables conocidas como aleatorias. Estas variables se asocian al término "azar". Así que una variable aleatoria no representa con certeza el valor que tomará al ser medida o determinada. Ejemplo de esto sería un caso como el siguiente: Existe una epidemia de cólera donde se trata de conocer el índice de propagación. Para ello, una persona cualquiera (tomada al azar) puede o no estar enferma y en consecuencia, no se sabe con certeza que suceso va a ocurrir, es decir, tal vez se enferme o tal vez no. Aquí entra la probabilidad de que tal vez la persona elegida enferme. Esta persona es una variable aleatoria.
  • 9. 4 PARTE I ESTUDIO DE SUCESOS CON UNA VARIABLE. LA ESTADÍSTICA DESCRIPTIVA. Anteriormente dijimos que la Estadística Descriptiva se encarga de recolectar, ordenar, analizar y presentar una colección de datos que se tomaron de alguna población o de alguna muestra de ella. Con esto, se pretende hacer predicciones, conjeturas y tomar decisiones en apego a los resultados encontrados. 1. RECOLECCIÓN, ORDENACIÓN, ANÁLISIS E INTERPRETACIÓN DE DATOS 1.1.-La recolección de datos Consiste en recoger la información cualitativa o tal vez cuantitativa necesaria para estudiar algún proceso. Los datos que se recogen son las variables. Cuando se aplica la estadística al área de las ciencias de la salud, se le conoce como Bioestadística. Aquí los principales métodos para la recolección de los datos son las encuestas, los experimentos, los censos y los sistemas de registro. No abundaremos en detalle de estos métodos, ni tampoco aplicaremos el rigor de las matemáticas; sino mas bien, nos concretamos a resolver casos de la vida real. 1.2.- Ordenación de datos. Cuando se recogen las variables de alguna población, comúnmente le llegan al investigador en forma desordenada. Para poder trabajarlas, necesitamos darles un orden y para ello, procedemos a colocarlas en forma ascendente, colocando en primera instancia el valor mas pequeño y terminar con el mas grande. Ejemplo 1.- La tabla siguiente muestra los pesos en gramos de tumores malignos que le fueron extirpados a 57 personas. Se pide: Trazar: 1. Construye una tabla donde ordenes los datos (de menor a mayor) 2. Calcula el número de intervalos de clase y su ancho correspondiente para propósitos de tabulación. 3. Construye una tabla de distribución de frecuencias.
  • 10. 5 4. Construye una tabla de frecuencias acumuladas y frecuencias relativas acumuladas. 5. Construye un histograma y un polígono de frecuencias. Tabla: 68 65 12 22 63 43 32 43 42 25 49 27 27 74 38 49 30 51 42 28 36 36 27 23 28 42 31 19 32 28 50 46 79 31 38 30 27 28 21 43 22 25 16 49 23 45 24 12 24 12 69 25 57 47 44 51 23 Solución: Ordenación de los datos de menor a mayor. 12 27 42 63 12 27 42 65 12 27 42 68 16 28 43 69 19 28 43 74 21 28 43 79 22 28 44 22 30 45 23 30 46 23 31 47 23 31 49 24 32 49 24 32 49 25 36 50 25 36 51 25 38 51 27 38 57
  • 11. 6 1.3.- Número de intervalos de clase y su ancho correspondiente. Para analizar y presentar los datos los vamos a agrupar en intervalos de clase y para ello, calculemos primero el número de intervalos en los cuales los vamos agrupar. El número de intervalos se deja casi siempre a juicio de un experimentado investigador; pero muchas veces se hace uso de una fórmula propuesta por Sturges. Esta fòrmula dice: K = 1 + 3.322 (LOG10 N) Donde: K = Número de intervalos de clase. N= Número de datos LOG10 = Logaritmo base 10 que se puede calcular usando una calculadora. Para el ejemplo que nos ocupa, tendremos que: K = 1 + 3.322(LOG 57) = 1 + 3.322(1.7559) = 6.833 Aceptemos 7 como el número de intervalos. Calculemos ahora la amplitud (A) o ancho de los intervalos propuestos. Esta amplitud se puede calcular dividiendo el recorrido de los datos entre el número de intervalos. El recorrido se obtiene restando el valor del dato mayor menos el valor del dato menor. Recorrido = 79 – 12 = 67. Amplitud o ancho del intervalo = A = 6.9 7 67Re  K corrido Aceptemos el valor 10 como ancho del intervalo Resumen. Los intervalos serán:
  • 12. 7 Intervalo 1 A = de 10 a 19 = 10 Intervalo 2 A = de 20 a 29 = 10 Intervalo 3 A = de 30 a 39 = 10 Intervalo 4 A = de 40 a 49 = 10 Intervalo 5 A = de 50 a 59 = 10 Intervalo 6 A = de 60 a 69 = 10 Intervalo 7 A = de 70 a 79 = 10 1.4.- Tabla de distribución de frecuencias. Construyamos una tabla que nos indique qué intervalo de clase es el mas frecuente y cual será el de menor frecuencia. Intervalo de clase Tarjado Frecuencia “f” 10-19 5 20-29 19 30-39 10 40-49 13 50-59 4 60-69 4 70-79 2 TOTAL DE DATOS = 57 La tabla indica que el intervalo mas frecuente es de 20 a 29; es decir, el mayor número de tumores malignos extirpados se tiene entre 20 y 29 gramos de peso. Por su parte el intervalo menos frecuente se tiene en el intervalo de 70 a 79; es decir, es el menos frecuente, o sea, son poco frecuentes los enfermos que tienen tumores malignos con pesos entre 70 y 79 gramos. 1.5.- Tabla de frecuencia acumulada, frecuencia relativa de ocurrencia y frecuencia relativa acumulada: Intervalo de clase IC Frecuencia f Frecuencia acumulada fa Frecuencia relativa de ocurrencia fr = 57 f N f  Frecuencia relativa acumulada. fra 10-19 5 5 0.0877 0.0877 20-29 19 24 0.3333 0.4210 30-39 10 34 0.1754 0.5964 40-49 13 47 0.2281 0.8245
  • 13. 8 50-59 4 51 0.0702 0.8947 60-69 4 55 0.0702 0.9649 70-79 2 57 0.0351 1.0000 TOTALES 57 1.0000 La columna 4 que indica la frecuencia relativa acumulada, nos señala el porcentaje (en forma decimal) de la ocurrencia de cada intervalo de clase. Ahí vemos que el porcentaje mayor de ocurrencia se tiene en el intervalo de 20 a 29 donde se tiene un 33.33% de ocurrencia y el menor porcentaje lo presenta el intervalo de 70 a 79. 1.6.- El histograma y el polígono de frecuencias. La distribución de frecuencias (f) puede representarse en forma gráfica usando un histograma. Para esto, se hace uso de un sistema de ejes cartesianos. En el eje horizontal (conocido como de las “x”) se dibujan los intervalos de clase (utilizando su ancho “A”) y en el eje vertical (conocido como de las “y”) se marcan las frecuencias (f) de cada intervalo. Nota: en el problema que estamos resolviendo, vemos que los intervalos son de 10 a 19, de 20 a 29, de 30 a 39 etc. Así que del valor 19 (del primer intervalo) al valor 20 (del segundo intervalo), existe UN UNO de diferencia el cual debe tomarse en cuenta al dibujar la gráfica. Lo mismo sucede entre el valor 29 del segundo intervalo con el valor 30 del tercero, donde también existe UN UNO de diferencia que debe tomarse en cuenta. Algo parecido sucede con el resto de intervalos. Para subsanar lo anterior, lo que podemos hacer es iniciar con el primer intervalo en el valor 9.5 y terminar su ancho en 19.5, teniendo de todas formas un ancho de 10. Para el segundo intervalo, lo iniciamos en 19.5 y terminamos su ancho en 29.5, cuyo ancho sigue siendo 10. Algo parecido hacemos con el resto de los intervalos. De acuerdo a esto, los intervalos a dibujar serían así: Primer intervalo de 9.5 a 19.5 Segundo intervalo de 19.5 a 29.5 Tercer intervalo de 29.5 a 39.5 Cuarto intervalo de 39.5 a 49.5 Quinto intervalo de 49.5 a 59.5
  • 14. 9 Sexto intervalo de 59.5 a 69.5 Séptimo intervalo de 69.5 a 79.5 Debe observarse que los valores reales de los intervalos están dentro del polígono. Recordemos que el dato menor era 12 y el mayor era 79 que estarían dentro del histograma. Dibujemos este histograma: El área de cada barra nos indica la frecuencia de ocurrencia de los valores comprendidos entre los límites de la escala horizontal. Así por ejemplo la segunda barra (o celda) es la frecuencia relativa de ocurrencia de los valores comprendidos entre 19.5 y 29.5. En forma parecida se tienen las frecuencias relativas de las otras barras (o celdas). 2 4 6 8 10 12 14 16 18 20 F r e c u e n c i a “f” 9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 I n t e r v a l o d e c l a s e IC
  • 15. 10 Otra forma de explicar esto, sería: La barra 1 representa el 57 5 del área del histograma. La barra 2 representa el 57 19 del área del histograma La barra 3 representa el 57 10 del área del histograma La barra 4 representa el 57 13 del área del histograma La barra 5 representa el 57 4 del área del histograma La barra 6 representa el 57 4 del área del histograma La barra 7 representa el 57 2 del área del histograma. Nota: la suma de todas estas fracciones es 1 57 57  Ahora dibujemos el polígono de frecuencias. Este polígono representa otra forma de representar a la distribución de frecuencias. Para trazarlo se marcan los puntos medios de la parte superior de cada una de las barras que representan a los intervalos de clase. Se unen dichos puntos y se tiene el polígono de frecuencias. Veamos el trazo de este polígono:
  • 16. 11 POLÍGONO DE FRECUENCIAS Nota: El área total del polígono de frecuencias, es igual al área del histograma. TAREA: Hagan equipos de 5 estudiantes y resuelvan los problemas siguientes. Problema.- En el hospital regional de Coyuca de Catalán se practicaron 100 exámenes de niveles de glucosa a igual número de niños. Los resultados encontrados se reportaron en la tabla siguiente. Se pide: Construye una tabla donde ordenes los datos (de menor a mayor) 1. Calcula el número de intervalos de clase y su ancho correspondiente para propósitos de tabulación. 2. Construye una tabla de distribución de frecuencias. 14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.54.5 2 4 5 10 13 19 F r e c u e n c i a f I n t e r v a l o d e c l a s e IC Polígono de frecuencias
  • 17. 12 3. Construye una tabla de frecuencias acumuladas y frecuencias relativas acumuladas. 4. Construye un histograma y un polígono de frecuencias. Tabla reportada: 56 61 57 77 62 75 63 55 64 60 60 57 61 57 67 62 69 67 68 59 65 72 65 61 68 73 65 62 75 80 66 61 69 76 72 57 75 68 81 64 69 64 66 65 65 76 65 58 65 64 68 71 72 58 73 55 73 79 81 56 65 60 65 80 66 80 68 55 66 71 72 73 73 75 75 74 66 68 73 65 73 74 68 59 69 55 67 65 67 63 67 56 67 62 65 75 62 63 63 59 Problema.- A 45 enfermos de la clínica del ISSSTE en Cd. Altamirano, se les aplicó un anestésico para que durmieran. La tabla siguiente reportada por una enfermera muestran los resultados en horas. Se pide calcular lo siguiente: 1. Construye una tabla donde ordenes los datos (de menor a mayor) 2. Calcula el número de intervalos de clase y su ancho correspondiente para propósitos de tabulación. 3. Construye una tabla de distribución de frecuencias. 4. Construye una tabla de frecuencias acumuladas y frecuencias relativas acumuladas. 5. Construye un histograma y un polígono de frecuencias. Tabla reportada por la enfermera: 7 10 12 4 8 7 3 8 5 12 11 3 8 1 1 13 10 4 4 5 5 8 7 7 3 2 3 8 13 1 7 17 3 4 5 5 3 1 17 10 4 7 7 11 8 Problema.- Se aplicó un examen de matemáticas a 40 estudiantes del grupo 402 turno matutino de la Preparatoria No 8 de Cd. Altamirano. Las calificaciones obtenidas se muestran en la tabla siguiente. La escala usada por el maestro es de 0 a 100.
  • 18. 13 Se pide hagas lo siguiente: 1. Construye una tabla donde ordenes los datos (de menor a mayor) 2. Calcula el número de intervalos de clase y su ancho correspondiente para propósitos de tabulación. 3. Construye una tabla de distribución de frecuencias. 4. Construye una tabla de frecuencias acumuladas y frecuencias relativas acumuladas. 5. Construye un histograma y un polígono de frecuencias. Tabla de calificaciones obtenidas por los alumnos: 56 78 62 37 54 39 62 60 28 82 38 72 62 44 54 42 42 55 57 65 68 47 42 56 56 56 55 66 42 52 48 48 47 41 50 52 47 48 53 68 2.- LAS MEDIDAS DE TENDENCIA CENTRAL A PARTIR DE UNA COLECCIÓN DE DATOS. En muchos problemas de la vida real es de interés conocer el centro del problema. Se habla muchas veces que el centro de la república mexicana es el Distrito Federal, que el centro de una población es el zócalo, que el centro de nuestro cuerpo es el corazón, etc. Si algo parecido a lo anterior lo lleváramos a una colección de datos que fueron obtenidos de una población o de alguna muestra de ella, tendríamos una idea de “hacia donde tienden dichos datos respecto a un centro”. Para medir estas tendencias se usan ciertas medidas, siendo las mas conocidas las siguientes: 1. La media aritmética. 2. La mediana 3. La moda. Si los datos que se usen son la totalidad de la población, entonces las medidas antes mencionadas (media aritmética, mediana y moda) se les conoce como parámetros; pero si los datos son de una muestra tomada de la población, entonces a dichas medidas se les nombra medidas estadísticas o simplemente estadística. Veamos el significado de cada una de estas medidas:
  • 19. 14 2.1.- La media aritmética. Esta medida es lo que comúnmente conocemos como “el promedio” o “la media”. Recordemos que el promedio es una división donde el numerador es la suma de todos los valores; que para nuestro caso, sería la suma de los datos y el denominador es el número de valores, que para nuestro caso, sería el número de datos. Si la media que se calcula se hace con los datos de la población (no de una muestra), se tendrá lo siguiente: µ = N x N i i1 Donde: µ es la media aritmética de la población.  N i 1 es la suma o sumatoria de todos los datos de la población N es el número de sumandos que tiene la sumatoria, es decir, el número de datos. Cuando la media se calcula con los datos de una muestra (no de toda la población), se usa un cociente parecido. Esto es lo siguiente: x = n x n i i1 Donde: x es la media aritmética de la muestra
  • 20. 15  n i 1 es la suma o sumatoria de los datos de la muestra. n es el número de datos que contiene la muestra. Veamos el ejemplo siguiente: Problema.- la tabla siguiente, indica una muestra constituida por 5 datos (o valores) que en forma aleatoria se tomaron de una población formada por cien valores. Estos datos corresponden a las edades de enfermos de diarrea que ingresaron al Centro de Salud de Cutzamala Gro. Dato de la población Dato tomado de la población para tener LA MUESTRA. Dato X12 es el enfermo 12 X1 10 X20 es el enfermo 20 X2 54 X36 es el enfermo 36 X3 21 X62 es el enfermo 62 X4 33 X98 es el enfermo 98 X5 53 Se pide calcular la media aritmética: Solución: Empleando la fórmula para la muestra: x = n x n i i1 x = 2.34 5 171 5 5333215410   La media aritmética o promedio será entonces 34.2 2.2.- La mediana.
  • 21. 16 La mediana es aquel valor que divide a un conjunto de valores en dos partes iguales, tales que el número de valores iguales a la mediana o mayores que ella, es igual al número de valores iguales a ella o menores que ella. Se recomienda el siguiente algoritmo para calcularla: 1. Se ordenan los datos de menor a mayor. 2. Si el número de datos es impar, la mediana será el valor que está en medio. 3. Si el número de datos es par, no se tiene una sola observación en medio, sino dos. La mediana será la media aritmética de estas dos observaciones. Veamos el siguiente ejemplo: Problema.- Calcular la mediana a los 5 valores o datos de la muestra que se tomó de la población de 100 valores de los enfermos reportados con diarrea del Centro de Salud de Cutzamala Gro. Solución. Aplicando el algoritmo. 1.- Ordenando los datos tendremos: 10 21 33 53 54 2.- El numero de datos es impar (son 5), entonces la mediana es el valor que está en medio o sea 33. 10 21 33 53 54 Problema.- Calcular la mediana a una muestra constituida por 6 valores que se tomaron de la misma población del Centro de Salud de Cutzamala Gro. Muestra reportada: 22 15 18 23 9 31 Solución: Aplicando el algoritmo. 1.- Ordenando los datos de menor a mayor: 9 15 18 22 23 31 2.- El número de datos es par (son 6), entonces la mediana será el promedio de los dos valores centrales. Mediana
  • 22. 17 9 15 18 22 23 31 Valores centrales Mediana = 20 2 40 2 2218   2.3.- La moda. La moda de una colección de datos (valores), es aquel dato (valor) que se presenta con mayor frecuencia. Si la colección tiene puros datos diferentes entonces no hay moda. Veamos los ejemplos siguientes: Problema.- Una muestra de datos tomados de una población fueron: 4, 7, 11, 15, 15, 18, 21 y 27. Esta muestra se refiere a edades de enfermos que ingresaron al Centro de Salud de Cd. Altamirano presentando síntomas de gripe. Se pregunta ¿Cuánto vale la moda de esa muestra?. Solución: Analizando la muestra vemos que el dato que mas se presenta es 15, entonces el valor de la moda es 15. Problema.- En el conjunto de valores 20, 31, 20, 20, 34, 22, 24, 27, 27 y 27 ¿Cuánto vale la moda?. Solución: Analizando los datos, se tienen 2 modas: 20 y 27. Problema.- En la colección de datos: 10, 21, 33, 53, 54 y 60. ¿Cuánto vale la moda?. Solución. La colección NO TIENE MODA. TAREA.
  • 23. 18 Formen equipos de 5 estudiantes y resuelvan los problemas siguientes. Problema.- Los valores de la tabla siguiente son los niveles de glucosa en sangre extraída a 10 niños en ayunas. Niño No. Nivel de glucosa Niño No. Nivel de glucosa 1 56 6 65 2 62 7 65 3 63 8 68 4 65 9 70 5 65 10 72 Se pide que calculen: 1. La media 2. La mediana 3. La moda. Problema.- Los contenidos de nicotina en una muestra aleatoria de 6 cigarros de cierta marca fueron: 2.3, 2.7, 2.5, 2.9, 3.1 y 1.9 miligramos. Se pide que calculen: La mediana de la muestra. Problema.- Los donativos para construir una aula en la Preparatoria No 8 de los habitantes de la colonia Esquipulas de Cd. Altamirano fueron: 9, 10, 5, 9, 9, 7, 8, 6, 10 y 11 dólares. Se pide calcular la moda de dicha colección. Problema.- Quince pacientes que vinieron de diferentes lugares, realizaron una visita a un Departamento Sanitario que existe en Tanganhuato. Los pacientes recorrieron las distancias indicadas en la tabla siguiente. Paciente No Distancia en Km Paciente No Distancia en Km Paciente No Distancia en Km 1 5 6 13 11 3 2 9 7 12 12 15 3 11 8 6 13 12
  • 24. 19 4 3 9 13 14 15 5 12 10 7 15 5 Se pide calcular: 1. La media de las distancias recorridas por los pacientes. 2. La mediana de las distancias recorridas. 3.-MEDIDAS DE DISPERSIÓN A PARTIR DE UNA COLECCIÓN DE DATOS. La dispersión de una colección de datos o valores, se refiere a la variabilidad que presentan. Si tuviéramos por ejemplo una colección de datos como 35,35,35,35,35 y 35, su variabilidad es cero; es decir, tanto la media aritmética, la mediana y la moda serían 35 o sea iguales. Pero esto nunca sucede y por lo tanto la variabilidad existe. Así que en una colección de datos, no basta con las medidas de tendencia central (media aritmética, mediana y moda) para conocer ciertos aspectos de los datos y se recurre a otras medidas llamadas de dispersión. Esto significa entonces que en una colección de datos son necesarias tanto las medidas de tendencia central como otras llamadas de dispersión. Las medidas de dispersión mas usadas son: 1. El Recorrido o Rango. 2. La desviación media y la varianza. 3. La desviación Estándar (que no es otra cosa que una medida de desviaciones). 3.1.-Recorrido o rango. En una colección de datos, el Rango se calcula restando al dato mayor el dato menor. Ejemplo: Pensemos que de la Rectoría de Chilpancingo, le pidieron al Director de la Preparatoria 8 enviara una relación de los sueldos quincenales de los 19 maestros que aquí trabajan. El Director envió el cuadro siguiente:
  • 25. 20 Trabajador No Sueldo quincenal Trabajador No Sueldo quincenal Trabajador No Sueldo quincenal 1 $1400.00 8 $2000.00 15 $7000.00 2 $1500.00 9 $6000.00 16 $1500.00 3 $3000.00 10 $1400.00 17 $7500.00 4 $4000.00 11 $2000.00 18 $2000.00 5 $2000.00 12 $2500.00 19 $3000.00 6 $6500.00 13 $1500.00 7 $7000.00 14 $7500.00 El Rango de la colección de datos será: R = 7500 – 1400 = 6100 En realidad el rango no indica algo significativo. Su valor es muy escueto y poco se usa. Esto lo podemos constatar si existiera un valor muy grande “o disparado” respecto a los otros. Si en la tabla hubiera por ejemplo un trabajador con sueldo de $15000.00, entonces el rango sería: R = 15000 – 1400 = 13600 el cual no es representativo para la variabilidad de los otros datos. 3.2.-La desviación media. La desviación media es una media o promedio de todas las desviaciones con respecto a la media. Supongamos por ejemplo que tuviéramos el conjunto de datos 5, 10,15, 20, 25, 30 y 35. La media (promedio) de dicho conjunto es 20. Si quisiéramos conocer la desviación de cada dato, tendríamos: La desviación de 5 con respecto a la media será: 5 – 20 = - 15 La desviación de 10 con respecto a la media será: 10 – 20 = - 10 La desviación de 15 con respecto a la media será: 15 – 20 = - 5 La desviación de 20 respecto a la media será: 20 – 20 = 0 La desviación de 25 con respecto a la media será: 25 – 20 = 5 La desviación de 30 con respecto a la media será: 30 – 20 = 10 La desviación de 35 con respecto a la media será: 35 – 20 = 15
  • 26. 21 Si observamos, la suma de todas las desviaciones con respecto a la media es cero. Si a la media o promedio lo llamamos x y al dato lo llamamos x entonces la Desviación Media (DM) se calcula por la fórmula siguiente: N xx DM    El numerador es la sumatoria de las restas, pero en valor absoluto. Esto se hace para evitar los signos negativos (recordemos que el valor absoluto de cualquier número sea positivo o negativo, siempre es positivo). En la fórmula anterior, DM es la desviación media y N es el número de datos que componen a la colección (o sea el número de datos de la población). Para la colección de datos del ejemplo anterior, tendremos que la desviación media sería:     7 51015051015 DM 57.8 7 60  Debemos observar que el valor absoluto de los números negativos son siempre números positivos. Calculemos ahora la Desviación Media de los sueldos de los 19 maestros de la Preparatoria 8 que la Rectoría le solicitó al Director de la Preparatoria 8. Primero arreglemos los datos del valor menor al valor mayor: Trabajador No Sueldo quincenal Trabajador No Sueldo quincenal Trabajador No Sueldo quincenal 1 1400 8 2000 15 6500 2 1400 9 2000 16 7000 3 1500 10 2500 17 7000
  • 27. 22 4 1500 11 3000 18 7500 5 1500 12 3000 19 7500 6 2000 13 4000 7 2000 14 6000 Ahora calculemos la media o promedio x de la colección de datos: 19 )2(7500)2(7000650060004000)2(30002500)4(2000)3(1500)2(1400  x = 3647 19 69300  Ahora calculemos los valores absolutos xx  224736471400  214736471500  164736472000  114736472500  64736473000  35336474000  235336476000  285336476500  335336477000  385336477500  Calculemos la Desviación Media:
  • 28. 23 19 )2(3853)2(335328532353353)2(6471147)4(1647)3(2147)2(2247  DM 84.2101 19 39935 DM 3.3.-La varianza. Como ya se trató, el uso de la Desviación Media (DM), exige la necesidad de usar el valor absoluto y se hace con el propósito de evitar los signos negativos. Para salvar este obstáculo, se opta por elevar al cuadrado a la resta ( )xx  y con ello los valores siempre serán positivos. Esto da lugar a lo que se conoce como varianza que no es otra cosa que una media de la dispersión de los datos. A la varianza se acostumbra escribirla como S2 . Así que la varianza será la fórmula siguiente: S2 = N xx  2 )( Nota. El valor “N” se refiere al número de datos que corresponden a la población. Algunos autores proponen que si se trata de calcular la varianza de una muestra extraída de una población, entonces la fórmula de la varianza debe ser: S2 = 1 )( 2   n xx n = número de datos de la muestra. El hecho de restarle un uno a la “n”, es para considerar el grado de libertad de la muestra extraída de la población.
  • 29. 24 Ejemplo1. Calcular la varianza de la colección de los 19 sueldos de igual número de trabajadores que la Rectoría de la UAG solicitó al Director de la Preparatoria 8. Solución. Aplicando la fórmula correspondiente: S2 = N xx  2 )( Por facilidad, hagamos una tabla: Recordemos que la media (promedio) es: x = 3647 19 69300  Sueldo (x) Frecuencia “f” Totales (x)(f) (x - )x 2 )( xx  2 )( xxf  1400 2 2800 -2247 5049009 10098018 1500 3 4500 -2147 4609609 13828827 2000 4 8000 -1647 2712609 10850436 2500 1 2500 -1147 1315609 1315609 3000 2 6000 -647 418609 837218 4000 1 4000 353 124609 124609 6000 1 6000 2353 5536609 5536609 6500 1 6500 2853 8139609 8139609 7000 2 14000 3353 11242609 22485218 7500 2 15000 3853 14845609 29691218  69300  102907371 La varianza será: S2 = 5416177 19 102907371  Nota: Debe observarse que se usó la última columna que contiene los productos de 2 )( xxf  . Esto se hizo para tomar en cuenta a las frecuencias de los valores.
  • 30. 25 3.4.- La desviación estándar. Al calcular la varianza tuvimos que elevar al cuadrado a la resta )( xx  ; esto origina que resulten unidades cuadradas, lo cual no representa a las medidas originales que deben ser lineales. Para obtener estas medidas bastará con extraer la raíz cuadrada a S2 y el problema estaría resuelto. La raíz aplicada a S2 se le conoce como Desviación Estándar que contiene las medidas originales. De acuerdo a lo anterior, la desviación estándar se calcula con cualquiera de las dos fórmulas siguientes: Desviación Estándar = S = N xx S 2 2 )(   Esto, cuando se trata de una población completa, siendo “N” el número de datos o elementos de la población. Desviación Estándar = S = 1 )( 2 2    n xx S Esto, cuando se trata de una muestra tomada de una población, siendo “n” el número de datos o elementos de la muestra. Conocida la Desviación Estándar, se puede calcular el coeficiente de variación, el cual se obtiene dividiendo a la Desviación Estándar entre la media aritmética (o promedio); pero en por ciento. Si llamamos C.V. al coeficiente de variación, éste se calculará de la forma siguiente: C.V = )100( x S
  • 31. 26 Ejemplo 1. Calcular la Desviación Estándar “S” y el coeficiente de variación (CV), a la colección de sueldos que la Rectoría de la UAG solicitó al Director de la Preparatoria 8. Solución: La varianza fue: S2 = 5416177 La Desviación Estándar será: S = 26.232754161772 S El coeficiente de variación será: C.V = 8.63)100(638.0 3647 26.2327 )100(  x S Ejemplo 2. Las edades de 6 niños que presentaron síntomas de diarrea en el municipio de Pungarabato, fueron 2, 4, 6, 8, 10 y 12 años. Calcular: 1. La media aritmética 2. La desviación media 3. La varianza 4. La desviación Estándar. 5. El coeficiente de variación. Solución: La media aritmética: x = n x n i i1 x = 7 6 42 6 12108642  
  • 32. 27 Media Aritmética = 7 La desviación media: N xx DM    = 6 71271078767472  3 6 18 6 531135    DM Desviación Media = DM = 3 La varianza: S2 = N xx  2 )( S2 = 6 )712()710()78()76()74()72( 222222   S2 = 6 )5()3()1()1()3()5( 222222  S2 = 667.11 6 70 6 25911925   Varianza = S2 = 11.667 La Desviación Estándar: S = 415.3667.112 S
  • 33. 28 Desviación Estándar = S = 3.415 Coeficiente de Variación = C.V = )100( x S = 7.48)100(487.0)100( 7 415.3  TAREA. Hagan equipos de 5 alumnos y resuelvan los problemas siguientes: Problema 1. De una población de 100 observaciones realizadas a igual número de pacientes que padecen una enfermedad crónica, se tomó una muestra de solamente 5 observaciones tomadas en forma aleatoria. Se construyó la siguiente tabla: Observaciones de la población. Observaciones de la muestra Dato o valor de la observación X12 X1 10 X20 X2 54 X36 X3 21 X62 X4 33 X98 X5 53 Se pide calcular: 1. La media aritmética 2. La desviación media 3. La varianza 4. La desviación estándar 5. El coeficiente de variación. Problema 2. En la carretera que existe de Cd. Altamirano a Cutzamala, se construyó un terraplén de arcilla compactada. La compañía constructora hizo 28 pruebas de control de la compactación y reportó los resultados en la tabla siguiente. La
  • 34. 29 compañía reporta que dichos resultados son los grados de compactación respecto a la prueba Proctor de laboratorio de mecánica de suelos. Tabla: Prueba No Grado de compactación respecto a la prueba Proctor X XX  2 )( XX  1 97.7 2 99.7 3 99.4 4 96.3 5 97.4 6 97.7 7 97.1 8 102.2 9 97.8 10 96.5 11 97.0 12 99.6 13 98.0 14 100.0 15 98.2 16 102.8 17 98.8 18 96.0 19 98.8 20 98.5 21 97.6 22 99.9 23 98.3 24 100.0 25 96.5 26 96.2 27 98.4 28 98.4   Se pide calcular: 1. La media aritmética (promedio) 2. La desviación media
  • 35. 30 3. La varianza 4. La desviación estándar 5. El coeficiente de variación. Respuesta: Media aritmética = X = 98.4 Varianza = S2 = 2.36 Desviación Estándar = S = 1.54 Coeficiente de Variación = C.V = 1.56 4.- LAS MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN A PARTIR DE DATOS AGRUPADOS. En los problemas anteriores aprendimos a calcular tanto las medidas de tendencia central como de dispersión partiendo de un listado de datos o sea de una colección. Estas listas pueden venir de algún hospital, de alguna escuela, de alguna compañía constructora, etc. Cada una de estas fuentes, tienen una misión que cumplir. Los hospitales por ejemplo buscan conocer medidas que le son de su incumbencia (enfermos, médicos, enfermeras, medicamentos etc). En alguna escuela es de su interés conocer medidas de lo que ahí se hace (alumnos, maestros, sueldos, exámenes, etc). En alguna compañía constructora tal vez interese conocer cantidades de materiales que se consumen mensualmente, combustibles, personal, etc. Los datos que de esas fuentes provienen, se reportan como listas o colecciones que aprendimos a manejar para calcular tanto las medidas de tendencia central como de dispersión. Ahora aprenderemos a calcular las mismas medidas; pero ya no provenientes de un listado de datos, sino de datos agrupados en los intervalos de clase y la frecuencia de cada uno de esos intervalos. En otras palabras, lo que ahora conocemos como datos del problema son los intervalos de clase y sus frecuencias y con esto, calcularemos las medidas de tendencia central y de dispersión.
  • 36. 31 4.1.- La media aritmética a partir de datos agrupados. Para calcular la media aritmética a partir de datos agrupados, se acepta que todos los valores que caen dentro de un intervalo de clase se localizan en el punto medio de dicho intervalo. El punto medio de un intervalo de clase, se obtiene calculando la media (promedio) de los límites superior e inferior del intervalo. Ejemplo 1. La tabla siguiente muestra los pesos en gramos de tumores malignos que le fueron extirpados a 57 personas. Nota: La tabla se elaboró colocando los datos de menor a mayor valor. 12 27 42 63 12 27 42 65 12 27 42 68 16 28 43 69 19 28 43 74 21 28 43 79 22 28 44 22 30 45 23 30 46 23 31 47 23 31 49 24 32 49 24 32 49 25 36 50 25 36 51 25 38 51 27 38 57 Los intervalos de clase y sus frecuencias ya fueron calculados anteriormente. Estos resultados fueron los siguientes: Intervalo de clase: Ic Frecuencia: “f” 10-19 5 20-29 19 30-39 10 40-49 13 50-59 4
  • 37. 32 60-69 4 70-79 2 Cálculo de los puntos medios (mi) de los intervalos de clase.  Intervalo de 10 a 19 mi = 5.14 2 29 2 1910   Puesto que los intervalos de clase tienen el mismo ancho (10) y además existe continuidad de intervalos, entonces los puntos medios de cada intervalo se podrán calcular sumando el valor 10 a cada punto medio del intervalo anterior. En caso de no existir continuidad de intervalos no debemos sumar el ancho referido. Veamos la tabla siguiente: Intervalo de clase: Ic Punto medio (mi) del intervalo de clase 10-19 14.5 20-29 14.5+10 = 24.5 30-39 24.5+10 = 34.5 40-49 34.5+10 = 44.5 50-59 44.5+10 = 54.5 60-69 54.5+10 = 64.5 70-79 64.5+10 = 74.5 La media aritmética que se busca a través de datos agrupados, se calcula multiplicando cada punto medio (mi), por su frecuencia correspondiente (fi); se suman estos productos y se divide entre la suma de las frecuencias (fi). X =   i ii f fm Para el ejemplo anterior, tendremos lo siguiente: Intervalo de clase IC Punto medio del intervalo. mi Frecuencia del intervalo. f Producto (mi)(f)
  • 38. 33 10-19 14.5 5 72.5 20-29 24.5 19 465.5 30-39 34.5 10 345.0 40-49 44.5 13 578.5 50-59 54.5 4 218.0 60-69 64.5 4 258.0 70-79 74.5 2 149.0  57 2086.5 Media aritmética = X =   i ii f fm = 6.36 57 5.2086  Ejemplo 2. La tabla siguiente muestra 7 intervalos de clase que agrupan salarios que cobran 100 enfermeras que trabajan en el ISSSTE de Cd. Altamirano. Asimismo, se indica la frecuencia de cada intervalo (número de enfermeras que cobran el salario comprendido dentro de ese intervalo). Se pide calcular la media aritmética. Intervalos de clase (salarios mensuales) IC Frecuencia. f De 419 a 437 9 De 238 a 456 25 De 457 a 475 36 De 476 a 494 14 De 495 a 513 0 De 514 a 532 8 De 533 a 551 8  100 Solución: Calculemos los puntos medios (mi) de los intervalos.  Del intervalo 419 a 437: mi = 428 2 437419  
  • 39. 34  Del intervalo 238 a 456: mi = 447 2 456438    Del intervalo 457 a 475 mi = 466 2 475457    Del intervalo 476 a 494 mi = 485 2 494476    Del intervalo 495 a 513 mi = 504 2 513495    Del intervalo 514 a 532 mi = 523 2 532514    Del intervalo 533 a 551 mi = 542 2 551533   Ahora construyamos una tabla donde tengamos los productos (mi)(fi) Intervalo de clase Ic Frecuencia f Puntos medios mi Productos (mi)(fi) 419 a 437 9 428 3852 438 a 456 25 447 11175 457 a 475 36 466 16776 476 a 494 14 485 6790 495 a 513 0 504 0 514 a 532 8 523 4184 533 a 551 8 542 4336  100  47113 La media aritmética será: X =   i ii f fm X = 13.471 100 47113  4.2.- La mediana a partir de datos agrupados. Cuando los datos se tienen agrupados en intervalos de clase, la mediana se calcula siguiendo la secuencia siguiente:
  • 40. 35 a) Se calcula el intervalo de clase que contiene a la mediana. Este intervalo es aquel que ocupa el lugar 2 N , donde N es el número total de datos u observaciones. b) Se calcula la frecuencia acumulada que corresponde al intervalo inmediato inferior al intervalo que contiene a la mediana. c) Se calcula la frecuencia del intervalo de la mediana. d) Se calcula el ancho del intervalo de clase. e) Se calcula el límite real inferior del intervalo que contiene a la mediana. f) Para calcular a la mediana se aplica la fórmula siguiente: Mediana = )(2 i f f N L a  Donde: L = Límite real inferior del intervalo que contiene a la mediana. N = Número de datos u observaciones. fa = Frecuencia acumulada en el intervalo inmediato inferior al intervalo que contiene a la mediana, la cual es la misma que la frecuencia acumulada de “L”. f = frecuencia del intervalo que contiene a la mediana. i = ancho o longitud del intervalo que contiene a la mediana. Ejemplo 1. La tabla siguiente, muestra datos agrupados de edades de 180 personas que en el año 2102 se practicaron examen de glucosa en el IMSS de Cd. Altamirano. Intervalo de clase Ic Frecuencia f Frecuencia acumulada fa 41.5 – 46.5 2 2 46.5 – 51.5 9 11 51.5 – 56.5 31 42 56.5 – 61.5 50 92 61.5 – 66.5 51 143 66.5 – 71.5 30 173
  • 41. 36 71.5 – 76.5 7 180  180 Se pide calcular la mediana. Solución. Apliquemos la secuencia que hemos mencionado. a) Cálculo del intervalo que contiene a la mediana. Lugar = 90 2 180 2  N Si observamos la columna de las frecuencias acumuladas, se tiene que el valor 90 está en el intervalo 56.5 – 61.5 donde se tienen 92 frecuencias acumuladas; es decir, el intervalo 56.5 – 61.5 contiene aquellos valores que ocupan desde el lugar 43 hasta el lugar 92 y ahí está el lugar 90. b) Cálculo de la frecuencia acumulada que corresponde al intervalo inmediato inferior al intervalo que contiene a la mediana. El intervalo inmediato inferior a 56.5 – 61.5 es el intervalo 51.5 – 56.5. La frecuencia acumulada para este intervalo es 42. Así que: fa = 42 c) Cálculo de la frecuencia del intervalo de la mediana. El intervalo donde está la mediana es como ya dijimos el 56.5 – 61.5 y ahí la frecuencia es 50. Así que: f = 50 d) Cálculo del ancho del intervalo (i). Si observamos la tabla, el ancho es el mismo para todos los intervalos y su valor es 5. i = 5 e) Cálculo del límite inferior del intervalo donde está la mediana. El intervalo es como ya dijimos el 56.5 – 61.5; así que el límite inferior es 56.5
  • 42. 37 L = 56.5 f) Sustituyendo valores en la fórmula, tenemos: MEDIANA = L + )(2 i f f N a = 56.5 + )5( 50 4290  MEDIANA = 61.3 Ejemplo 2. La tabla siguiente muestra datos agrupados que corresponden a pesos en gramos de tumores malignos que le fueron extirpados a 57 personas. Intervalo de clase (pesos en gramos) Ic Frecuencia f Frecuencia acumulada fa 10 -19 5 5 20 - 29 19 24 30 - 39 10 34 40 - 49 13 47 50 - 59 4 51 60 - 69 4 55 70 - 79 2 57  57 Se pide calcular la Mediana. Solución: Aplicando la secuencia tenemos: a) Cálculo del intervalo que contiene a la mediana. Lugar = 5.28 2 57 
  • 43. 38 Al observar la columna de frecuencia acumulada, se tiene que dicho lugar se encuentra en el intervalo 30 – 39; es decir, este intervalo contiene valores comprendidos desde el lugar 24 hasta el 34, que es el espacio donde está el lugar 28.5 b) Cálculo de la frecuencia acumulada que corresponde al intervalo inferior al intervalo donde está la mediana. El intervalo inferior al 30 – 39 es el 20 – 29. La frecuencia acumulada para este intervalo es 24. Entonces se tendrá que: fa = 24 c) Cálculo de la frecuencia del intervalo donde está la mediana. Este intervalo es como ya se dijo el 30 – 39. La frecuencia para este intervalo es 10. Así que: f = 10 d) Cálculo del ancho (i) del intervalo donde está la mediana. Según la tabla, todos los anchos de los intervalos son iguales y su valor es 10. Así que: i = 10 e) Cálculo del límite inferior del intervalo donde está la mediana. El intervalo es como ya se dijo el 30 – 39; así que el límite inferior es 30. Así que L = 30 f) Apliquemos la fórmula: MEDIANA = L + f f N a 2
  • 44. 39 MEDIANA = 30 + )10( 10 245.28  MEDIANA = 34.5 Tarea. Hagan equipos de 5 estudiantes y resuelvan el siguiente problema. Problema. La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias. Estos intervalos representan pesos en gramos de tumores malignos que le fueron extirpados a 57 pacientes enfermos. Intervalo de clase (pesos en gramos) IC Frecuencia f Frecuencia acumulada fa 9.5 – 19.5 5 5 19.5 – 29.5 19 24 29.5 – 39.5 10 34 39.5 – 49.5 13 47 49.5 – 59.5 4 51 59.5 – 69.5 4 55 69.5 – 79.5 2 57  57 Se pide que calculen la Mediana. Respuesta: Mediana = 34
  • 45. 40 4.3.- La moda a partir de datos agrupados. Al estudiar las medidas de tendencia central para una colección de datos, se dijo que la moda es el valor que ocurre con mayor frecuencia. En el mismo sentido, si lo único que se conoce son datos agrupados (intervalos de clase), la moda es el intervalo que tiene la más alta frecuencia. Ejemplo 1. La tabla siguiente contiene 7 intervalos de clase con sus respectivas frecuencias. Estos intervalos representan pesos en gramos de tumores malignos que le fueron extirpados a 57 pacientes enfermos. Intervalo de clase (pesos en gramos) IC Frecuencia f 10 – 19 5 20 – 29 19 30 – 39 10 40 – 49 13 50 – 59 4 60 – 69 4 70 - 79 2  57 Se pide calcular la Moda. Solución: Al observar la tabla se tiene que el intervalo de mayor frecuencia es el 20 – 29 (su frecuencia es 19); entonces ese intervalo es LA CLASE MODAL. Si se trata de dar un valor numérico para la moda, entonces recurrimos a la media (promedio) de los límites del intervalo de la CLASE MODAL. MODA = 5.24 2 2920  
  • 46. 41 4.4.- La varianza y la desviación estándar a partir de datos agrupados. Cuando se estudió a la varianza a partir de una colección de datos, se dijo que su valor se encontraba con la fórmula siguiente: S2 = N xx  2 )( Cuando lo único que conoce son los intervalos de clase (los datos están agrupados), la varianza se calcula con la fórmula siguiente: S2 =    1 )( 2 f xmi (f) Donde: f = frecuencia mi = punto medio del intervalo Ejemplo 1. En la escuela de enfermería se aplicó un examen de bioestadística a 51 estudiantes. Las calificaciones variaron entre 50 y 95 puntos. Se hicieron 8 intervalos de clase con una amplitud (ancho) de 6 unidades. La tabla siguiente muestra los intervalos de clase (puntos obtenidos por los estudiantes) y las frecuencias que se presentaron. Intervalo de clase (puntos obtenidos por los estudiantes) Ic Frecuencia f 48 - 54 2 54 – 60 3 60 – 66 5 66 – 72 8 72 – 78 10 78 – 84 12 84 – 90 10 90 - 96 1  51
  • 47. 42 Se pide calcular la varianza S2 y la Desviación Estándar S. Solución: La solución del problema requiere que se conozca primeramente la media aritmética ( X ). Para lograrlo, necesitamos conocer los puntos medios (mi) y los productos (mi)(fi). Construyamos una tabla como la siguiente: Intervalo de clase Ic Punto medio del intervalo: mi Frecuencia: fi Producto: (mi)(fi) 48 – 54 51 2 102 54 – 60 57 3 171 60 – 66 63 5 315 66 – 72 69 8 552 72 – 78 75 10 750 78 – 84 81 12 972 84 – 90 87 10 870 90 - 96 93 1 93 51  3825 Cálculo de X : X = 75 51 3825    i ii f fm Ahora conviene ampliar la tabla para poder calcular la varianza: Productos (mi)(fi) La resta xmi  Elevando al cuadrado 2 )( xmi  El producto ii fxm 2 )(  La varianza 102 51 - 75 = -24 576 1152 )( 1 )( 2 2 i i i f f xm S      171 57 – 75 = -18 324 972 315 63 – 75 = - 12 144 720 552 69 – 75 = - 6 36 288 750 75 – 75 = 0 0 0 972 81 – 75 = 6 36 432 870 87 – 75 = 12 144 1440
  • 48. 43 93 93 – 75 = 18 324 324  1584 5328 La varianza: 56.106 50 5328 151 53282   S La desviación estándar: S = 323.1056.1062 S Ejemplo 2. En la Clínica Avenida de Cd. Altamirano, los Doctores Franco Rojo y René Fernández extirparon 57 tumores cancerosos a igual número de pacientes. Los tumores se pesaron en gramos y de acuerdo a los pesos que se tuvieron se agruparon en 7 intervalos de clase. La tabla siguiente muestra dichos intervalos y la frecuencia de cada intervalo. Intervalo de clase que agrupa pesos en gramos de tumores extirpados. IC Frecuencia presentada o sea número de pacientes agrupados en el intervalo. f 10 – 19 5 20 – 29 19 30 – 39 10 40 – 49 13 50 – 59 4 60 – 69 4 70 – 79 2  57 Se pide calcular la varianza y la desviación estándar.
  • 49. 44 Solución. Para resolver el problema, necesitamos por principio conocer a la media aritmética o sea x . x =   i ii f fm Construyamos la tabla siguiente: Intervalo de clase Ic Punto medio del intervalo: mi Frecuencia: fi Producto: (mi)(fi) 10 - 19 14.5 5 72.5 20 - 29 24.5 19 465.5 30 - 39 34.5 10 345.0 40 - 49 44.5 13 578.5 50 - 59 54.5 4 218.0 60 - 69 64.5 4 258.0 70 - 79 74.5 2 149.0  57 2086.5 x = 6.36 57 5.2086    i ii f fm Ahora construyamos la siguiente tabla donde se tiene la varianza: Productos (mi)(fi) La resta xmi  Elevando al cuadrado 2 )( xmi  El producto ii fxm 2 )(  La varianza 72.5 14.5 – 36.6 = - 22.1 488.41 2442.05 )( 1 )( 2 2 i i i f f xm S      465.5 24.5 – 36.6 = - 12.1 146.41 2781.79 345.0 34.5 – 36.6 = - 2.1 4.41 44.10 578.5 44.5 – 36.6 = 7.9 62.41 811.33 218.0 54.5 – 36.6 = 17.9 320.41 1281.64 258.0 64.5 – 36.6 = 27.9 778.41 3113.64
  • 50. 45 149.0 74.5 – 36.6 = 37.9 1436.41 2872.82 2086.5  13347.37 La varianza es: )( 1 )( 2 2 i i i f f xm S      34.238 56 37.13347 1.57 37.13347 )( 1 )( 2 2       i i i f f xm S La desviación estándar “S” será entonces: 43.1534.2382  SS El coeficiente de variación C.V. sería entonces: )100(.. x S VC  42 6.36 43.15 )100(..  x S VC Tarea: Hagan equipos de 5 estudiantes y resuelvan el problema siguiente: Problema. El grupo 401 de la Preparatoria 8 hicieron un trabajo de investigación que consistió en recabar el número de ancianos y sus respectivas edades que solicitaron consulta en el ISSSTE de Cd. Altamirano durante el mes de julio de 2013. La jefa de grupo (Karla) reportó que fueron 100 ancianos y sus edades las escribió en la tabla siguiente:
  • 51. 46 62 72 72 69 69 69 61 68 71 71 64 67 64 67 60 64 67 66 64 67 65 64 74 64 73 65 63 74 64 63 73 64 67 73 71 71 67 65 67 67 67 63 63 63 64 71 64 74 71 71 70 67 70 66 70 67 70 66 70 66 66 68 66 66 69 67 67 68 68 68 68 66 68 70 70 66 67 66 66 70 68 68 68 70 67 67 68 68 67 69 67 67 67 70 70 70 70 61 70 70 Calcular: 1. Construye una tabla donde ordenes los datos (de menor a mayor) 2. Calcula el número de intervalos de clase y su ancho correspondiente para propósitos de tabulación. 3. Construye una tabla de distribución de frecuencias. 4. Construye una tabla de frecuencias acumuladas y frecuencias relativas acumuladas. 5. Construye un histograma y un polígono de frecuencias. Calcular también: 1. La media 2. La mediana 3. La moda. Calcular también: 1. La desviación media 2. La varianza 3. La desviación estándar 4. El coeficiente de variación. Hacer una tabla con los datos agrupados (los intervalos de clase) y a partir de estos datos calcular:
  • 52. 47 1. La media aritmética 2. La moda 3. La varianza 4. La desviación estándar.
  • 53. 48 PARTE II EL AZAR Y SU MEDIDA CONCEPTOS BÁSICOS DE PROBABILIDAD COMO UNA INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL. En la parte I de estos apuntes, se trataron algunos puntos de vista para describir datos que bien pueden venir de alguna colección o estar agrupados en intervalos de clase. Estos puntos de vista constituyen la Estadística Descriptiva. También dijimos que la Estadística propiamente dicha se acostumbra dividirla en dos partes: La Descriptiva y la Inferencial. La Estadística Inferencial tiene como propósito hacer inferencias; es decir se trata de “predecir algo que puede suceder”, de “tomar decisiones”, de “hacer estimaciones de algo”, de “sacar conclusiones”, etc. La Estadística Inferencial requiere de LA TEORIA DE LA PROBABILIDAD y debido a ello, trataremos en esta parte II algunos conceptos básicos de esta teoría. 1.- LA PROBABILIDAD. Esta palabra es un concepto un tanto vago que se usa en la vida cotidiana. Su uso trata de indicar cuán posible es que ocurra un evento en el futuro. Un médico por ejemplo suele decir: “ Se tiene una probabilidad de un 80% que el medicamento tenga buenos resultados”. Un agricultor dice “ Presiento que tengo una probabilidad de un 90% de tener buena cosecha”. Un meteorólogo dice “Se tiene una probabilidad del 100% que hoy por la tarde lloverá”. Así entonces conocer algo o mucho nos ayuda a tomar decisiones. Es por esto que es importante estudiar la aplicación de la probabilidad y cómo medirla, lo mismo que cómo emplearla para hacer inferencias.
  • 54. 49 Hacer inferencias ayuda en mucho en estudios que se hacen a procesos físicos, químicos, biológicos, económicos, sociales etc., que generan acontecimientos que no son tan fáciles de predecir con exactitud. También se tiene que la probabilidad aparece en rubros como los juegos de azar, casinos, fenómenos meteorológicos, deportes organizados, demandas que tendrá un producto nuevo, eficacia de un suero, presupuestar, estimación de la carga que soporta un puente antes de derrumbarse y caer, etc. Pero antes de iniciar con el estudio de esta teoría, recordemos un poco a la Teoría de Conjuntos en la cual se apoya. 2.- LA TEORÍA DE CONJUNTOS. 2.1.-Definición de conjunto. Un conjunto se define como una colección bien definida. La colección puede ser números, objetos, personas, cualidades de algo, cosas, etc. A los elementos de la colección se les llama miembros del conjunto o simplemente elementos. Los conjuntos se representan con letras mayúsculas y a los elementos se les encierra en un par de llaves. Ejemplos: Conjunto de las vocales del abecedario: A =  uoiea ,,,, Conjunto de los hijos de Adán y Eva: A =  AbelCain, Conjunto de los números naturales del 1 al 10: A =  10,9,8,7,6,5,4,3,2,1 Conjunto de los municipios de la tierra caliente de Guerrero:       Zirandaro oPungarabatCoyucaTlalchapaCutzamalaTlapehualaAjuchitlanMiguelTSArcelia ,,,,,,,., Conjunto de las Preparatorias de la UAG en tierra caliente: A =  39,37,20,18,8 2.2.- Descripción de conjuntos.
  • 55. 50 Existen tres formas para describir un conjunto: 1. Por enumeración 2. Por una regla (comprensión) 3. Por diagramas de Venn. Los de enumeración se escriben conteniendo una lista de los elementos que constituyen el conjunto. Los de la regla se escriben usando símbolos matemáticos propios del lenguaje de esta disciplina. Los escritos usando los diagramas de Venn, consisten en dibujos geométricos que expresan a los conjuntos. De los tres anteriores, usaremos en estos apuntes a los de enumeración y los diagramas de Venn. Los de la regla les daremos poca atención ya que estos sirven principalmente a los matemáticos interesados en la estadística. A manera de ejemplo, describamos al conjunto formado por los números naturales comprendidos del 0 (inclusive) al 10 (inclusive). Recordemos que los números naturales son los que se usan para contar: 1, 2, 3 , 4 etc; algunos matemáticos dicen que el cero también es natural (aceptemos esta opinión). 1. Por enumeración será: A =  10,9,8,7,6,5,4,3,2,1,0 2. Usando la regla de los matemáticos: A = {x I x es natural donde 0 ≤ x ≤10} Se lee diciendo: x es natural tal que (el matemático le llama “tal que” a la rayita vertical) x cumple conque cero es menor o igual a x y x es menor o igual a 10. 3. Usando los diagramas de Venn. Este diagrama consiste en hacer un dibujo donde una circunferencia encierra a los elementos del conjunto. Esta circunferencia es encerrada en un rectángulo que representa al conjunto universal (U) que es aquel conjunto universo donde pertenecen los elementos del conjunto que se está estudiando. Para nuestro ejemplo tendríamos: 1 3 5 2 4 10 6 8 7 0 9 U A
  • 56. 51 2.3.-Algunos tipos de conjuntos. Para los propósitos de este curso y tomando en cuenta a los elementos de un conjunto y asimismo, evadiendo lo mas posible el rigor de las matemáticas, tenemos los tipos de conjuntos siguientes: 1. Conjunto unitario.- Es aquel que tiene un solo elemento. 2. Conjunto vacío.- Es el que carece de elementos. Se acostumbra escribirlos con la letra griega Ф. Es importante decir que este conjunto no debe confundirse con aquel que tiene como único elemento al cero. 3. Conjunto Universal.- Es el que contiene todos los elementos posibles del conjunto. Se acostumbra escribirlo con la letra U. 4. Un conjunto “A” es subconjunto de otro conjunto “B”, si y solo si cada elemento de “A” es también elemento de “B”. Para indicar que “A” es subconjunto de “B” se escribe A С B. 5. El conjunto vacío escrito como Ф es subconjunto de cualquier otro conjunto. 6. Dos conjuntos son iguales si y solo si contienen los mismos elementos. 2.4.- Cardinalidad de un conjunto. La cardinalidad de un conjunto “A” es el número de elementos que contiene distintos unos de otros, y se acostumbra simbolizarlos con #(A). Ejemplos. Determina la cardinalidad de cada uno de los conjuntos siguientes: A = {días de la semana} #(A) = 7 B = {los dedos de una mano normal} #(B) = 5 C = {0} #(C) = 1 Ф= { } #(D) = 0 E = {Aníbal, René, Karla}
  • 57. 52 #(E) = 3 2.5.- Operaciones con conjuntos. Son cuatro las operaciones básicas que se hacen con un par de conjuntos llamados “A” y “B”. 1. Unión 2. Intersección 3. Complemento 4. Diferencia. UNIÓN.- La unión de dos conjuntos A y B es otro conjunto C cuyos elementos están en A o están en B. Para indicar la operación unión se acostumbra usar el símbolo U. Ejemplo. Sea el conjunto A = {1,2,3,4,5,6} y el conjunto B = {2,4,7,8,9,10,11} Calcular el conjunto unión. Solución: C = A U B = {1,2,3,4,5,6,7,8,9,10,11} Usando los diagramas de Venn se tendrá: U = INTERSECCIÓN.- La intersección de dos conjuntos A y B es otro conjunto C cuyos elementos son comunes tanto en A como en B. En otras palabras, los elementos de C, se tienen tanto en A como en B. Para indicar esta operación se acostumbra usar el símbolo 1 2 3 4 5 6 A 2 4 7 8 9 10 11 B 1 2 3 4 5 6 7 8 9 10 11 C U
  • 58. 53 Ejemplo 1. Se tiene el conjunto A = {a b c d e} y el conjunto B = { b d f g} Calcular su intersección. Solución: A B = { b d } Nota: Nótese que los elementos b y d son comunes en A y B. Usando los diagramas de Venn se tiene: También es común hacer el siguiente diagrama como intersección: Ejemplo 2. El conjunto de médicos que trabajan en la Preparatoria 8 de Cd Altamirano es: A = {René, Franco, Jorge, Alejandro, Alfonso} El conjunto de médicos que trabajan en el ISSSTE de Cd. Altamirano es: B = {René, Natividad, Hildebrando, Alejandro, Xetzael} Calcular el conjunto intersección: Solución: A B = {René, Alejandro} U a b c d e U b d f g = b d b d a c e f g A B C A B U
  • 59. 54 Usando el diagrama de Venn: René, Alejandro COMPLEMENTO.- El complemento de un conjunto “A” escrito como AC es el conjunto de todos los elementos del universo que no están en A. En otras palabras, son todos los elementos que le faltan a A para ser U. Entonces: AC = U – A Ejemplo 1. Un conjunto A = {a, b, c, d} y el conjunto universal es el alfabeto completo. Calcular el complemento de A; es decir AC . Solución: AC = {e, f, g, h….x, y, z} Usando el diagrama de Venn: Franco Jorge Alfonso Natividad Hildebrando Xetzael A B a b c d e f g h i j k l m n ñ o p q r s t u v w x y z A U
  • 60. 55 Ejemplo 2 El conjunto de Preparatorias de la UAG en la tierra caliente es: A = {8, 18, 20, 37, 39} El universo de las preparatorias de la UAG está formado por 40 preparatorias distribuidas en todo el estado de Guerrero. Calcular el complemento de A; es decir AC . Solución: A C = {1,2,3,4,5,6,7,9,10,11,12,13,14,15,16,17,19,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,38,40} Usando el diagrama de Venn: DIFERENCIA.- La diferencia de dos conjuntos A y B, escrito como A – B, es el conjunto de elementos que pertenecen a “A”; pero no pertenecen a “B”. Ejemplo. Sea el conjunto A = {a, b, c, d, e} y sea otro conjunto B = {b, d, f, g} Calcular A – B. Solución: A – B = {a, c, e} A 8, 18, 20, 37, 39 1,2,3,4,5,6,7,9,10,11,12,13,14,15 16,17,19,21,22,23,24,25,26,27,28 29,30,31,32,33,34,35,36,38,39,40 U
  • 61. 56 Usando el diagrama de Venn: TAREA. Hagan equipos de 5 estudiantes y resuelvan lo siguiente: 1.-Se tienen los conjuntos: A = { a, b, c, d, e, f, g, h, i, j } B = { a, c, e, g, i, k, n, p } Calcular numéricamente y con diagramas de Venn lo siguiente: A U B A B AC A – B 2.- Se tienen los conjuntos: SEA EL CONJUNTO UNIVERSAL U = { A,B,C,D,E,F,G,H,I,J,K,L} A a, c e b, d f, g B U
  • 62. 57 A = {A,B,C,D,E} B = {E,F,G,H} Calcular lo siguiente: A U B A B BC B – A (A U B)C (A B)C AC U BC AC BC 3.- INICIACIÓN A LA TEORIA DE LA PROBABILIDAD. Anteriormente explicamos la importancia de la probabilidad en diferentes contextos sociales. Iniciamos esta teoría diciendo que la medida de la probabilidad se hace en una escala comprendida entre cero y uno ( o entre 0% y 100%). Esta medida indica la factibilidad que ocurra cierto resultado al cual se le llama evento. La figura siguiente muestra esquemáticamente la medida de la probabilidad: U U U 0 10.5 Evento con medida cero de probabilidad: El rector de la UAG estará 100 años en el cargo. Evento con medida 0.5 de probabilidad: Al nacer el bebé será HOMBRE. Evento con medida 1 de probabilidad: A toda persona se le llega la hora de su muerte
  • 63. 58 3.1. Conceptos básicos de la probabilidad. 3.1.1.-Experimento. Es la operación que consiste en observar los resultados obtenidos en ciertas condiciones de trabajo. Los experimentos pueden ser aleatorios (también se les llama estocásticos) o deterministas. Los aleatorios son aquellos que pueden tener uno de varios resultados y por lo tanto no puede predecirse cuál será el que ocurrirá. Los deterministas en cambio, son aquellos que tienen un único resultado o sea ya se sabe lo que ocurrirá. Un ejemplo de experimento aleatorio sería “el lanzamiento de una moneda al aire”. Al caer la moneda, puede caer en sol o en águila. Es decir, no podemos predecir lo que ocurrirá. Otro ejemplo de experimento aleatorio sería “el tirar un dado”. Puede suceder que caiga en 1, en 2, en 3, en 4, en 5 o en 6. Es decir, no podemos predecir lo que ocurrirá. Un ejemplo de experimento determinista sería “el sacar una bola azul de una caja que contiene 10 bolas todas azules”. Es decir, sabemos de antemano que saldrá azul. Otro ejemplo de experimento determinista sería “la elección del puerto turístico mas importante de Guerrero: Acapulco o Zihuatanejo”. Sabemos de antemano que es Acapulco. 3.1.2.-Evento. Es el conjunto de uno o mas resultados de un experimento. El evento puede ser simple o compuesto. Un evento es simple cuando es un solo resultado del espacio muestral. Un ejemplo sería que en el experimento de “tirar un dado” el evento fuera “que salga número par”. Así el evento puede ser un solo elemento del conjunto {2, 4, 6}. En cambio, un evento será compuesto cuando el resultado esperado sea un solo resultado; pero con dos características. Así en el experimento de “tirar un dado”, que el evento fuera “un número par mayor a 4”
  • 64. 59 (aquí existen dos características: que sea par y mayor que 4). El evento esperado será el conjunto unitario {6}. 3.1.3.-Espacio muestral. Es el conjunto de todos los posibles eventos o resultados que pueden ocurrir del experimento. Se acostumbra representarlo con la letra ῼ En el experimento “lanzar al aire una moneda”, el espacio muestral será águila (a) y sol (s). ῼ = {a, s} En el experimento “tirar un dado”, el espacio muestral será el conjunto: ῼ = {1, 2, 3, 4, 5, 6}. En el experimento “de una carta americana (tiene 52 cartas) sacar un rey de diamantes”. ¿Cuál es el espacio muestral? Será: ῼ = {52 cartas} En el experimento “se observa el funcionamiento de tres aparatos electrónicos durante una semana. Nos interesa saber el número de aparatos diferentes que se descompongan una o mas veces durante la semana”. Indicar el espacio muestral a considerar. Será: ῼ = {0,1,2,3} No olvidemos que el espacio muestral es el conjunto de todos los resultados posibles del experimento. Así que: Resultado posible 1: Se descomponen 0 aparatos. Resultado posible 2: Se descompone un aparato. Resultado posible 3: Se descomponen 2 aparatos. Resultado posible 4: Se descomponen 3 aparatos.
  • 65. 60 3.1.4.-Punto muestral. Es cada uno de los valores del espacio muestral. A cada punto muestral le corresponde una probabilidad, de tal suerte que la suma de todas las probabilidades de ese espacio muestral es igual a uno. Algunos se preguntan ¿Porqué se le da importancia a los juegos de azar como lanzar monedas, tirar dados, sacar alguna carta, etc en la teoría de la probabilidad.?. La respuesta es que para estructurar esta teoría, los iniciadores como Girolamo Cardano (1501-1576) físico, astrólogo y matemático se valió de esas situaciones para estructurar su teoría. Apoyándose en las conclusiones así determinadas, hoy en día, se aplica en otras áreas del saber; así por ejemplo, en medicina se puede presentar un caso como el siguiente: “Si un médico desea probar que cierta droga cura determinada enfermedad, procede a su aplicación en pacientes enfermos. Supongamos que la mitad de los enfermos recobran la salud; pero la otra mitad muere. Ahora el médico sabe que tiene “cierta idea de probabilidad de que si es posible sanar algunos enfermos”. Ahora elige 100 enfermos y se le presenta el caso que 55 sanaron; pero 45 murieron. Estos nuevos resultados indican que el caso que se le está presentando al médico es parecido al problema de tirar 100 veces una moneda, donde 55 salieron soles y 45 águilas. Así tenemos que los famosos juegos de azar sirven de comparación con otras áreas como la medicina por ejemplo. . 4.- LOS ENFOQUES DE LA PROBABILIDAD Para asignar una medida de probabilidad, se tienen dos enfoques: Uno llamado objetivo y el otro conocido como subjetivo. El enfoque objetivo se apoya en las teorías y métodos matemáticos para asignar una medida de probabilidad a un evento determinado. El enfoque subjetivo se apoya en la experiencia o conocimientos de quien hace la investigación. El enfoque objetivo se divide a su vez en probabilidad clásica y probabilidad empírica. Veamos el esquema siguiente:
  • 66. 61 4.1.-El enfoque clásico o modelo de Laplace. Este enfoque o modelo se le debe al ilustre matemático francés Pierre Simón Laplace (1749-1827). Se basa en la idea de que los resultados de un experimento son igualmente posibles. Su medida o cálculo es de la forma siguiente: Probabilidad de un evento = esCasosTotal ablesCasosFavor Ejemplo 1. Dentro de una caja hay 10 pelotas, de las cuales 4 son azules. ¿Cuál es la probabilidad de que sin ver saques una pelota azul?. Solución: Sea “A” el evento de sacar una pelota azul. Como cada pelota tiene la misma probabilidad de ser sacada, utilizamos el enfoque Clásico: P(A) = 4.0 10 4  Enfoques de la Probabilidad Objetivo Subjetivo Clásico Empírico
  • 67. 62 La probabilidad es 0.4 (el 40%). Ejemplo 2. Se tiene una baraja americana (la baraja tiene 52 cartas, donde 26 son color negro). Calcular la probabilidad de sacar una carta negra al azar. Solución: Sea A el evento de sacar una carta negra. Todas las cartas sean negras o no, tienen la misma posibilidad de ser sacadas. Llamando P(A) a la probabilidad del evento A, se tiene: P(A) = 5.0 2 1 52 26  esCasosTotal ablesCasosFavor La probabilidad de sacar una carta negra será 0.5 o sea un 50%. Ejemplo 3. El experimento consiste ahora en sacar un “as” de una carta americana. La carta tiene 4 ases. Solución: Llamando “A” al evento de sacar un “as”. Todas las cartas (son 52) tienen la misma posibilidad de ser sacadas y puesto que únicamente son 4 ases: P(A) = 0769.0 13 1 52 4  esCasosTotal ablesCasosFavor La probabilidad de sacar un “as” será 0.0769 o sea el 7.69% Ejemplo 4. Experimento: Se tiene una caja dentro de la cual existen 15 bolas numeradas del 1 al 15.
  • 68. 63 Un alumno elige al azar una de esas bolas. ¿Cuál será la probabilidad de que la bola elegida sea un número primo mayor a 5?. Nota: Recordemos que un número es primo cuando se puede dividir únicamente entre uno o él mismo. Son números primos el 2, 3, 5, 7, 11, 13, 17,19 etc. Solución: Las bolas tienen los números 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15. Los números primos mayores a 5 son 7, 11 y 13 (las bolas están numeradas hasta el 15). En este sentido se tienen 3 casos favorables. Llamando “A” al evento de sacar un primo mayor a 5 y P(A) a la probabilidad del evento se tendrá: P(A) = 20.0 5 1 15 3  esCasosTotal ablesCasosFavor La probabilidad es 0.20 es decir, un 20%. Ejemplo 5. Experimento: “La escuela preparatoria 8 de Cd. Altamirano tiene 1500 estudiantes. Se hizo una encuesta para saber qué áreas del conocimiento les gusta más”. 325 alumnos dijeron que matemáticas y ciencias experimentales. 550 contestaron que ciencias de la salud y 625 humanístico sociales. Construye una tabla y determina la probabilidad de que un estudiante elegido al azar:  Estudie ingeniería  Estudie medicina  Estudie para abogado.  Estudie para ingeniero o para odontólogo.
  • 69. 64 Solución. Tabla: Área del conocimiento Evento Número de estudiantes Matemáticas y ciencias experimentales. ME 325 Ciencias de la salud CS 550 Humanístico-Sociales HS 625 Totales 1500 Probabilidad que un estudiante estudie ingeniería: 2166.0 1500 325 )( MEP La probabilidad es 21.66% Probabilidad que un estudiante estudie medicina: 3666.0 1500 550 )( CSP La probabilidad es 36.66% Probabilidad que un estudiante estudie abogacía: 4166.0 1500 625 )( HSP La probabilidad es 41.66% Probabilidad que un estudiante estudie para ingeniero u odontólogo. P(ME U CS) = P(ME) + P(CS) 5833.0 1500 875 1500 550 1500 325 )()(  CSPMEP
  • 70. 65 Ejemplo 6. La tabla siguiente muestra el personal técnico y profesional de un grupo de hospitales tabulada por edad y categoría de trabajo. SIGNOS: ≤ Menor o igual que > Mayor que Conjunto A1 ≤25 A2 26-30 A3 31-35 A4 >35 Totales B1 Médicos 0 5 25 75 105 B2 Laboratoristas 20 30 35 35 120 B3 Servicios de dietas 3 6 6 10 25 B4 Servicios de registros 7 15 8 12 42 B5 Servicios de enfermería 200 375 442 203 1220 B6 Farmacia 1 12 8 3 24 B7 Tecnología radiológica 4 10 19 12 45 B8 Servicios terapéuticos 5 25 15 10 55 B9 Otros servicios profesionales. 20 35 50 25 130 Totales 260 513 608 385 1766 a) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho empleado tenga menos de 25 años de edad ?. b) Si se elige un empleado al azar. ¿Cuál será la probabilidad de que dicho empleado sea médico?. c) Si del personal que tiene mas de 35 años se elige al azar un empleado cualquiera . ¿Cuál será la probabilidad de que sea médico?. Edades Categoría
  • 71. 66 Solución: a) Debemos considerar que al elegir un empleado cualquiera, entonces puede ser electo cualquiera de los 1766 (conjunto universal). En consecuencia, el total de casos totales es 1766. De los 1766 empleados, solamente 260 (conjunto A1) tienen una edad menor a 25 años; así que el total de casos favorables es 260. La cardinalidad del conjunto A1 es: #(A1) = 260 La cardinalidad del conjunto Universal U es: #(U) = 1766 La probabilidad de A1 que llamamos P(A1) es: La probabilidad de que un empleado cualquiera de los 1766 sea menor a 25 años es 0.1472 o sea el 14.72%. b) Para calcular la probabilidad de que un empleado cualquiera electo al azar sea un médico, debemos considerar que la elección se hará con cualquiera de las 1766 personas. Así que el total de casos es 1766. De estos 1766, se tiene que 105 son médicos. Así que el total de casos favorables es 105. La cardinalidad del conjunto B1 es: #(B1) = 105 La cardinalidad del conjunto universal U es: #(U) = 1766 La probabilidad de que de los 1766 empleados sea un médico es 0.059 o sea un 5.9%. c) Para calcular la probabilidad de que un empleado electo al azar con característica de que sea mayor a 35 años sea un médico, debemos considerar lo siguiente: 1472.0 1766 260 )(# )(# )( 1 1  U A AP 059.0 1766 105 )(# )(# )( 1 1  U B AP
  • 72. 67 Los casos totales o sea aquellos que son mayores a 35 años están representados por el conjunto A4. De estos 385 se tiene que únicamente 75 son médicos; así que el conjunto de casos favorables es el conjunto formado por la intersección de B1 con A4. Cardinalidad de la intersección B1 con A4 es: # (B1 A4) = 75 Cardinalidad del conjunto A4 : # (A4) = 385 La probabilidad pedida es: 1948.0 385 75 )( MP Donde P(M) es la probabilidad de que alguien sea médico o sea 0.1948 = 19.48% TAREA. Hagan equipos de 5 estudiantes y resuelvan lo siguiente. 1.- En un grupo de 502 personas se determinó que la distribución de los grupos sanguíneos era la siguiente: Grupo Sanguíneo Número O 226 A 206 B 50 AB 20 TOTAL 502 1.-Si se elige al azar una persona de este grupo, ¿cuál será la probabilidad de que tenga el grupo sanguíneo: U
  • 73. 68 a) O? b) A? c) B? d) AB? 2.- Uno de los graves problemas que enfrenta actualmente la sociedad es el alcoholismo. En fechas recientes se ha visto una tendencia a la alza en el consumo de bebidas alcohólicas entre los jóvenes. La embriaguez causa muchos accidentes de tránsito, como se muestra en la tabla siguiente: Tipo de accidente Presentó aliento alcohólico Colisión con vehículo automotor 22733 Colisión con peatón (atropellamiento) 934 Colisión con animal 135 Colisión con objeto fijo 7533 Volcadura 1164 Caída de pasajero 239 Salida del camino 1316 Incendio 48 Colisión con ferrocarril 9 Colisión con motocicleta 1705 Colisión con ciclista 587 Otro 326 Total 36729 a) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido una colisión con vehículo automotor? b) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido una volcadura?.
  • 74. 69 c) ¿Cuál es la probabilidad de que una persona elegida al azar haya tenido una colisión con un peatón? d) Investiguen ¿Qué es la responsabilidad social?. Discutan qué se pudiera hacer al respecto para reducir la cantidad de accidentes y cuál es la responsabilidad de cada ciudadano. 4.2.-El enfoque empírico. Este enfoque se basa principalmente en frecuencias relativas, esto es, en el número de veces que ocurrió cierto evento en el pasado y se calcula de la forma siguiente: Probabilidad del evento = Nota: Conforme crece el número de observaciones, el enfoque empírico se acerca al valor del enfoque clásico. En otras palabras, el enfoque empírico se puede explicar diciendo que si un experimento “E”, se repite “n” veces y si en cada caso de “n” se toma el resultado “m”, entonces la probabilidad de “E” es aproximadamente igual a la frecuencia relativa acumulada calculada como Ejemplo 1. Se lanza una moneda al aire 100 veces y se registra el número de soles en cada 20 tiradas. La tabla siguiente indica las frecuencias que se presentaron: Número de tiradas: “n” Número de soles que salieron Frecuencia acumulada: “m” Frecuencia relativa acumulada: n m Número de veces que ocurrió en el pasado Número total de observaciones n m
  • 75. 70 20 8 8 0.40 40 10 18 0.45 60 12 30 0.50 80 11 41 0.51 100 9 50 0.50 Un promedio de las frecuencias acumuladas es 0. 47 o sea un 47% que es muy parecido al enfoque clásico. Si recordamos el enfoque clásico, se tiene que el espacio muestral es {s,a} o sea la totalidad de casos es 2 y si hablamos de la probabilidad que salga “sol”, el caso favorable es 1. Entonces la probabilidad que salga sol es: 5.0 2 1 )( SP Este valor es muy parecido a los valores de la columna de frecuencias relativas acumuladas y en consecuencia al promedio de ellas. Por eso hemos dicho que si aumenta el número “n”, la probabilidad es casi igual a la frecuencia relativa acumulada. Ejemplo 2. Una persona lanza un dado “justo” 40 veces y anota cuántas veces salió cada número del dado. Al terminar los lanzamientos, calcula cada una de las probabilidades como el número de veces que salió cada número dividido entre el número de lanzamientos realizados. Los resultados los anotó en la tabla siguiente: Número del dado que salió en las 40 tiradas Número de veces que salió el número del dado Probabilidad 1 8 20.0 40 8  2 6 15.0 40 6  3 10 25.0 40 10  4 4 10.0 40 4 
  • 76. 71 5 6 15.0 40 6  6 6 15.0 40 6  Si se aumentara el número de lanzamientos, se tendrían probabilidades muy cercanas a que es lo que se tiene en el enfoque clásico, Ejemplo 3. El profesor Gabriel López Sarabio de la Preparatoria No 8 de Cd. Altamirano se puso a jugar a los dados. El profesor lanzó 150 veces el dado y anotó las veces que el dado cayó en números mayores que 4, es decir, el evento fue {5,6}. Cada vez que caía en número mayor que cuatro, trazaba una rayita (tarjado) y por separado trazaba otra cuando no caía en número mayor que 4. El profesor calculó la frecuencia relativa dividiendo las veces que cayó en número mayor que 4 entre el total de lanzamientos. El profesor elaboró la tabla siguiente: Evento A Veces que cayó en número mayor que 4 (se usó un tarjado de 5 rayitas) Frecuencia Frecuencia relativa A 45 rayitas 45 3.0 150 45 )( AP AC 105 rayitas 105 7.0 150 105 )( C AP Del resultado de la tabla, se concluye que la probabilidad del evento A o sea la probabilidad que caiga en número mayor que 4, es de 0.3 o sea un 30%. La probabilidad que no se cumpla lo anterior, representa el complemento de A, es decir (AC ). La probabilidad de que no se cumpla el número mayor que 4 será entonces 0.7, es decir el 70%. 1667.0 6 1 
  • 77. 72 TAREA. Formen equipos de 5 estudiantes y resuelvan el siguiente problema: Antes de incluir la cobertura para ciertos tipos de problemas dentales en pólizas de seguros médicos para adultos con empleo, una compañía de seguros desea determinar la probabilidad de ocurrencia de esa clase de problemas, para que pueda fijarse la prima de seguros de acuerdo con esas cifras. Para ello, un especialista en estadística recopila datos para 10, 000 adultos que se encuentran en categorías de edad apropiadas y encuentra que 100 de ellos han experimentado el problema dental específico durante el año anterior. Calculen la probabilidad de ocurrencia y comenten el resultado. RESPUESTA: 0.01 o sea el 1%. 4.3.-El enfoque subjetivo. Este enfoque consiste en confiar en la experiencia del investigador para asignar la probabilidad de algún evento. Debido a esto, al enfoque subjetivo también se le llama enfoque personalista. Debemos decir, que este enfoque está cobrando mucha fuerza en los tiempos actuales. Para ello, se concentra toda la información disponible del evento al que se le asignará una probabilidad en manos de un experto, quien valiéndose de su experiencia asigna la probabilidad. Ejemplo 1. Para asignar la probabilidad que el América sea campeón en la clausura 2013 del futbol mexicano, se puso en manos de José Ramón Fernández (JOSERA) toda la información del desempeño que ha tenido el América en la presente temporada. JOSERA tiene la palabra (recordemos que no es mas que una probabilidad). Ejemplo 2. Un experto en mercado de la bodega Aurrera de Cd. Altamirano asigna una probabilidad del 90% de que las ventas mejoren este año.
  • 78. 73 Ejemplo 3. En muchas ocasiones, las empresas desean conocer la probabilidad de que un nuevo producto tenga éxito en el mercado. Para ello, recurren a la experiencia o conocimiento del negocio de sus directivos o de sus vendedores. Tal vez organicen grupos foco (focus group) , en los que las personas expresan el grado de aceptación del producto. De esta manera, se utiliza el criterio o experiencia o punto de vista personal para asignar una probabilidad de éxito o de un fracaso. TAREA. Formen equipos de 5 estudiantes y escriban 3 ejemplos de enfoques subjetivos. Pueden consultar el internet. Comenten los ejemplos. 5.- LAS TÉCNICAS DE CONTEO Cuando iniciamos la teoría de la probabilidad, dijimos que se tienen algunos enfoques para ser estudiada. Uno de ellos fue el enfoque clásico, en el cual la asignación de la probabilidad se hace dividiendo el número de casos favorables entre el número de casos totales. En los ejemplos que al respecto se dieron, pudimos fácilmente calcular ambos casos. Estos ejemplos fueron sencillos; así por ejemplo en el experimento de “tirar un dado”, la probabilidad de que aparezca en la cara superior un número para (2, 4, 6) dividimos el número total de pares (en este caso 3) entre el número total de caras que tiene el dado (es 6). y la probabilidad es ; es decir, de un 50%. Pero se tienen experimentos donde no es tan fácil enumerar los casos favorables y totales. Para salvar esta dificultad, se hace uso de las llamadas técnicas de conteo que facilitan enumerar ambos casos. El esquema siguiente ilustra estas técnicas: 5.0 2 1 6 3 
  • 79. 74 5.1.-Listar Resultados. Esta técnica es la que empleamos en los ejemplos antes vistos. Contábamos los casos, los enlistábamos y formábamos el espacio muestral. Una vez hecho esto, procedíamos a calcular probabilidades. 5.2.-Diagrama de árbol. En algunos experimentos resulta sencillo construir una especie de árbol donde se anotan los puntos muestrales. Se cuentan estos puntos y se tiene el espacio muestral. Ejemplo 1. Experimento: Se trata de lanzar dos dados. Trazar el diagrama de árbol y anotar el espacio muestral. Solución. Cada dado tiene 6 caras numeradas del 1 al 6. Si el primer dado llega a caer en 1, en 2, en 3, en 4, en 5 o en 6; el otro puede caer en cualquiera de esos mismos números. El árbol puede ser entonces un dibujo como el siguiente: Técnicas de conteo Diagrama de árbol Fórmulas matemáticas:  Ley fundamental de la multiplicación.  Permutaciones  Combinaciones Listar resultado
  • 80. 75 La barra de la izquierda representa las posibilidades del dado 1 y la barra de la derecha las posibilidades del dado 2 en cada una de las posibilidades del dado 1. El espacio muestral de este experimento es: 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
  • 81. 76 ῼ = Nota: Observar que la cardinalidad del espacio muestral es 36. En otras palabras, el número de puntos muestrales es 36. En base a lo encontrado, podemos calcular probabilidades como las siguientes: 1.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados en uno de ellos “caiga un 3 y en el otro caiga un 6”? P( E ) = La probabilidad es del 2.7% 2.- ¿Qué probabilidad se tendrá para que en una tirada de los dos dados salgan números nones (en un dado un non y en el otro también non)?. Si analizamos el espacio muestral, los casos favorables son 9 puntos muestrales; es decir, (1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5). La probabilidad será: 25.0 36 9 )( EP Ejemplo 2. La preparatoria No 8 de Cd. Altamirano tiene 1500 estudiantes. De esta cantidad, 325 les gusta el campo de las matemáticas y las ciencias experimentales, 550 las ciencias de la salud y los 625 restantes el campo de humanístico-sociales. (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Casos favorables Casos totales 027.0 36 1  La probabilidad es el 25%
  • 82. 77 Con esta información, trace un diagrama de árbol y calcula la probabilidad de que un estudiante elegido al azar estudie:  Ingeniería  Optometría  Historia Solución: El diagrama de árbol puede ser el siguiente: Probabilidad de que un estudiante elegido al azar estudie ingeniería: 2166.0 1500 325 )( IP Probabilidad de que un estudiante elegido al azar estudie Optometría: Estudiantes # ῼ = 1500 Matemáticas y ciencias experimentales # (M y CE) = 325 Ciencias de la salud # (CS) =550 Humanístico-sociales # (HS) = 625
  • 83. 78 3666.0 1500 550 )( OP Probabilidad de que un estudiante elegido al azar estudie Historia: 4166.0 1500 625 )( HP Ejemplo 3. Un restaurante de Cd. Altamirano presenta la posibilidad de elegir como menú de comidas corridas: un plato de entrada que puede ser sopa o arroz; como plato principal puede elegir o carne o pollo o pescado y de postre puede ser o pastel o helado. Dibujar un diagrama de árbol que represente todas las posibilidades de comidas corridas (espacio muestral) que ofrece el restaurante. Solución: Arroz Sopa Carne Pollo Pescado Carne Pollo Pescado Pastel Helado Pastel Helado Pastel Helado Pastel Helado Pastel Helado Pastel Helado
  • 84. 79 Si escribimos el espacio muestral, tendremos 12 comidas diferentes: Nota: Debe observarse que la cardinalidad del espacio muestral es 12 y que equivale al número de las últimas “ramitas” (las flechas) del árbol. TAREA. Hagan equipos de 5 estudiantes y resuelvan lo siguiente: Problema. En un restaurante de Cd. Altamirano se ofrece un menú de comidas corridas que consiste en lo siguiente: Como platillo de entrada se puede elegir entre sopa, jugo de naranja o jugo de verduras. Como platillo principal se puede elegir entre birria, aporreado o pollo. Como postre se puede elegir entre pastel o gelatina. 1) Arroz-carne pastel 2) Arroz-carne-helado 3) Arroz-pollo-pastel 4) Arroz-pollo-helado 5) Arroz-pescado-pastel 6) Arroz-pescado-helado 7) Sopa-carne-pastel 8) Sopa-carne-helado 9) Sopa-pollo-pastel 10) Sopa-pollo-helado 11) Sopa-pescado-pastel 12) Sopa-pescado-helado
  • 85. 80 Dibujen un diagrama de árbol, escriban el espacio muestral e indiquen la cardinalidad. Problema. Se tiene un dado y una moneda. Se lanza el dado y se anota el número que queda hacia arriba. En seguida se lanza la moneda y se anota el resultado. Dibujar un diagrama de árbol que represente este experimento, escriban el espacio muestral e indiquen la cardinalidad. 5.3.-Fórmulas matemáticas. 5.3.1.-Ley fundamental de la multiplicación. En muchos experimentos no se prefiere el dibujo del árbol ya que resulta difícil de trazarlo y se opta por usar la ley fundamental de la multiplicación. Con esta ley se obtiene la cardinalidad del espacio maestral o sea el número de puntos muestrales. La ley dice que si en un experimento, una operación se puede hacer en “m” formas y otra segunda operación se puede hacer en “n” formas, entonces las dos operaciones pueden hacerse juntas en “m· n” formas . Ejemplo 1. En un experimento se lanza un par de dados. ¿Cuál es la cardinalidad del espacio muestral de este experimento? Solución. El dado 1 puede caer en 6 maneras diferentes. Entonces puede caer en “m = 6” formas distintas. El dado 2 presenta también “n = 6” formas distintas de caer. De acuerdo con la ley fundamental de la multiplicación, la cardinalidad del espacio muestral será: # ῼ = m·n = (6) (6) = 36
  • 86. 81 Ejemplo 2. Un experimento consiste en lanzar un dado y posteriormente una moneda. ¿Cuál es la cardinalidad del espacio muestral?. Solución. El dado presenta m = 6 formas de caer. La moneda presenta n = 2 formas de caer. De acuerdo con la ley de la multiplicación la cardinalidad del espacio muestral será: # ῼ = m·n = (6) (2) = 12 Ejemplo 3. En la tienda COPEL de Cd. Altamirano se ofertan camisas en 3 colores. Cada color se presenta en 4 tallas diferentes y están marcadas como S, M, L, XL. Cada talla tiene 2 tipos de estampados. ¿Cuántas camisas diferentes (cardinalidad del espacio muestral) oferta la tienda la tienda COPEL?. Solución. Aplicando la ley de la multiplicación, la cardinalidad del espacio muestral será: # ῼ = m·n·p = (3) (4) (2) = 24 TAREA. Hagan equipos de 5 estudiantes y resuelvan lo siguiente: 1.- Un experimento consiste en lanzar 3 dados. calculen la cardinalidad del espacio muestral y argumenten el resultado. 2.- Entre Cd. Altamirano y Arcelia se tiene la Ciudad de Tlapehuala. Supongamos que entre Cd. Altamirano y Tlapehuala se tienen 4 caminos que comunican a esas ciudades (Cd. Altamirano y Tlapehual) y entre Tlapehuala y Arcelia son 6 caminos los que comunican a esas dos ciudades (Tlapehuala y Arcelia). Hagan un dibujo que represente esta situación y calculen de cuantas formas es posible viajar de Cd. Altamirano a Arcelia.
  • 87. 82 3.-¿De cuantas formas diferentes se pueden seleccionar parejas de diferente sexo de un grupo de 4 hombres y 6 mujeres?. 5.3.2.- Permutaciones. Antes de explicar esta técnica de conteo, se requiere conocer el significado del concepto “factorial de un número entero positivo”. Factorial de un número “n” entero positivo. Si se tiene un número “n” que sea entero y positivo (1,2,3,4,5,6…+∞), su factorial escrito como “nỊ” y que se lee diciendo “ene factorial” o “factorial de ene”, es el producto de todos los números enteros positivos que existan desde 1 hasta “n”. Si “n” es cero, su factorial es 1 (por definición). Si “n” ni es entero positivo y ni tampoco es cero, entonces no tiene sentido su factorial. Ejemplos de factorial de números “n” siendo todos enteros y positivos (se incluye el factorial de 0): 0Ị = 1 (por definición) 1Ị = 1 2Ị = 1x2 = 2 3Ị = 1x2x3 = 6 4Ị = 1x2x3x4 = 24 5Ị = 1x2x3x4x5 = 120 6Ị = 1x2x3x4x5x6 = 720 7Ị = 1x2x3x4x5x6x7= 5040 0.5Ị = Sin sentido, ya que 0.5 no es entero positivo. - 4Ị = Sin sentido, ya que – 4 no es entero positivo.
  • 88. 83 La técnica Permutaciones. Muchas veces es importante un espacio muestral que contenga como elementos todos los posibles arreglos u ordenes de un grupo de objetos; en otras palabras, cuando el orden en que se disponen los términos es importante, el número total de resultados posibles recibe el nombre de permutación. En forma por demás simple, podemos decir que una permutación es un arreglo ordenado de objetos. Para entender lo anterior, pongamos el siguiente ejemplo: Ejemplo 1. Problema: Entre Cd. Altamirano y Tejupilco se encuentra la ciudad de Cutzamala. Pensemos que entre Altamirano y Cutzamala se tienen 3 carreteras que unen a esas poblaciones (Altamirano y Cutzamala) y entre Cutzamala y Tejupilco existen 2 carreteras que las unen (a Cutzamala con Tejupilco). Una persona estando en Cd. Altamirano, desea viajar de este lugar (Altamirano) hasta Tejupilco. ¿De cuantas formas puede hacerlo?. Solución: Hagamos un dibujo representativo: Es lógico pensar que si la persona sale de Cd. Altamirano, al partir a Cutzamala, únicamente puede tomar una sola carretera (de las 3 existentes) y cuando parte de Cutzamala a Tejupilco, puede también tomar una sola (de las 2 existentes). Así que, en su partida de Cd. Altamirano, ÚNICAMENTE TIENE 3 formas distintas para emprender su viaje. CD. ALTAMIRANO CUTZAMALA TEJUPILCO r1 r2 r3 r4 r5
  • 89. 84 Usando factoriales tendríamos: 3Ị = 1x2x3 = 6 que serían las distintas formas que puede elegir para hacer el viaje. El valor 6 representa la cardinalidad del espacio muestral de ese experimento (o problema); es decir, son 6 los puntos muestrales del espacio muestral. Ω = (r1 r4) (r1 r5) (r2 r4) (r2 r5) (r3 r4) (r3 r5) Del análisis del problema anterior, se puede desprender el siguiente teorema: Teorema: El número de permutaciones de “n” objetos distintos es “nỊ”. El número de permutaciones de “n” objetos distintos, tomando “r” a la vez es: nPr = Algunos autores usan otras escrituras para escribir nPr ; nosotros consideramos que la mas sencilla es esta. Por otra parte, obsérvese que cuando n = r, se llegaría al valor nỊ Ejemplo 2. En la clínica del ISSSTE de Cd. Altamirano, se tienen 5 consultorios que serán ocupados por 5 médicos. ¿De cuántas maneras distintas pueden asignarse a los 5 médicos los 5 consultorios?. Solución. Para este problema, n = 5, r = 5. Aplicando la fórmula se tendrá: nPr = = = = 120 nỊ (n – r)Ị nỊ (n – r)Ị 5Ị (5 – 5)Ị 1·2·3·4·5 0Ị
  • 90. 85 Ejemplo 3. En la clínica del IMSS de Cd. Altamirano, se tienen 6 enfermeras, de las cuales 4 se asignarán para ocupar 4 cubículos. Se pide calcular el número de permutaciones posibles. Solución. Para este caso, se tienen 6 objetos (las enfermeras), de las cuales se toman 4 a la vez. Así que n = 6 ; r = 4 nPr = 6P4 = = = = 360 Ejemplo 4. Calcular el número de permutaciones de las letras a, b, c. tomadas de dos en dos. Escribir el espacio muestral de estas permutaciones. Solución. nPr = 3P2 = = = = 6 El espacio muestral es: ab,ac,ba,ba,ca,cb. (Son 6 los números muestrales). Ejemplo 5. Una combi que sale de Cd. Altamirano a Arcelia, tiene un asiento para 4 personas. En Tanganhuato suben 8 pasajeros. ¿De cuantas maneras pueden estar sentadas en el asiento?. Solución: Para este problema se tiene que n = 8, r = 4; entonces tendremos: nPr = 8P4 = = = = = 1680 nỊ (n – r)Ị 6Ị (6 – 4)Ị 1·2·3·4·5·6 2Ị nỊ (n – r)Ị 3Ị (3 – 2)Ị 1·2·3 1Ị nỊ (n – r)Ị 8Ị (8 – 4)Ị 40320 24 1·2·3·4·5·6·7·8 1·2·3·4