Este documento presenta los conceptos básicos de probabilidad. Introduce la probabilidad intuitiva y clásica, así como el rango de valores de probabilidad. Explica conceptos de combinatoria como tuplas, permutaciones y combinaciones. Finalmente, describe la teoría moderna de probabilidad, incluyendo la función de probabilidad y sus axiomas, así como conceptos como probabilidad condicional e independencia de eventos.
1. Estadística Aplicada a los Negocios I
Profesor: Jerome Smith
Año 2023 2° Semestre
6. Probabilidad
2. Contenido
1. Probabilidad – Intuitiva y Clásica
1. Incertidumbre
2. Probabilidad Clásica o Frecuentista
3. Rango de Valores de la Probabilidad
2. Combinatoria
1. Tuplas
2. Permutaciones
3. Combinaciones
3. Teoría Moderna de Probabilidad
1. Problema Lógico de la Probabilidad Clásica
2. Nociones Fundamentales
3. Función de Probabilidad y sus Axiomas
4. Probabilidad de la Unión
5. Probabilidad Condicional
6. Independencia de Eventos
7. Probabilidad Conjunta
8. Teorema de Bayes
3. Probabilidad – Intuitiva y
Clásica
• Incertidumbre
• Probabilidad Clásica o Frecuentista
• Rango de Valores de la Probabilidad
4. Incertidumbre y Probabilidad
En la vida diaria y en la gestión pública y privada, nos vemos
enfrentados a la necesidad de tomar decisiones con información
incompleta. Es decir, a diario nos vemos enfrentados a la
incertidumbre.
No podemos siempre operar bajo la certeza absoluta; la incertidumbre
es parte de la vida y tenemos que aprender a operar con ella.
La teoría de la probabilidad surge como una herramienta para manejar
la incertidumbre.
5. Probabilidad Clásica o Frecuentista
La probabilidad clásica, (gracias a Bernoulli y Laplace) define la
probabilidad de un evento como su frecuencia, esto es, el porcentaje
de casos en que el evento sucede, dentro de todos los casos posibles,
cuando todos los casos son igualmente probables. Matemáticamente:
Probabilidad de X =
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠
Esta definición es muy intuitiva, y ese es su valor como punto de
partida.
Más adelante vamos a ver una debilidad lógica que tiene.
6. Rango de Valores de la Probabilidad
La definición frecuentista define el rango de valores posibles para la probabilidad, y sus
interpretaciones.
A partir de la definición:
Probabilidad de X =
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠
• Cuando 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋 = 0, significa que X no sucede nunca, y la probabilidad es 0.
• Cuando 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋 = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠, significa que X sucede siempre,
y la probabilidad, p, es 1.
• Cuando 0 < 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋 < 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠, X sucede a veces y 0 < p < 1.
En general, 0 ≤ 𝑝 ≤ 1
0 significa imposible, no sucede nunca.
1 significa certeza absoluta, sucede siempre.
Entonces p representa la probabilidad de que suceda un evento incierto.
Si p es bajo (cercano a 0) es poco probable, si es alto (cercano a 1) es muy probable.
7. Ejercicios
1) Tiras una moneda 100 veces y 50 veces sale “cara”. ¿Cuál es la
probabilidad de sacar “cara” al tirarla una vez?
2) En la línea de producción de una empresa, 1 producto de cada 100
sale defectuoso. Al elegir un producto al azar, ¿cuál es la
probabilidad de que esté defectuoso?
3) Un dado bien fabricado debería ser perfectamente simétrico. Si
tiras un dado 600 veces, ¿cuantos números 6 esperarías, y por qué?
9. Combinatoria
La definición clásica de probabilidad nos lleva a la necesidad de contar
elementos de diversos conjuntos y espacios muestrales discretos. Esto
constituye la rama matemática llamada combinatoria.
Distinguimos tres conceptos:
• Tuplas
• Combinaciones
• Permutaciones
10. Tuplas
Una n-tupla es un conjunto ordenado de n elementos, o un vector de largo n:
(𝑥1, 𝑥2, … 𝑥𝑛)
Los 𝑥𝑖 pueden pertenecer a cualquier conjunto, numérico o no.
𝑥𝑖 ∈ 𝑋
Si 𝑋 = 𝑛, la cantidad total de n-tuplas posibles es 𝑛𝑟.
Ejemplos:
1) Sea X = {0, 1, … 9} los 10 dígitos de nuestro sistema numérico, y sea r = 3.
Hay 103 = 1000 3-tuplas posibles, correspondientes a los 1000 números entre 0 y 999.
2) Sea X = {0, 1}, los dos dígitos del sistema binario, y sea r = 5.
Hay 25 = 32 5-tuplas posibles.
Por ejemplo, esto podría representar todas las secuencias posibles de tirar una moneda 5
veces.
{00000, 00001, 00010, 00011, … etc.}
11. Ejercicio
Marcela está a cargo de la seguridad computacional de una empresa.
Define como política que cada nombre de usuario sea de largo 4
caracteres, con las 26 letras del abecedario sin incluir la ñ. ¿Cuántos
usuarios podrá crear con esta política?
12. Permutaciones
Una permutación es un subconjunto (o muestra) de r elementos distintos de un
conjunto de n elementos.
Es distinto de una tupla, en la cual los elementos pueden repetirse.
Ejemplos:
1) Se tiene 3 bolitas de colores: rojo, azul, y blanco. ¿Cuántas permutaciones de 2
bolitas se pueden hacer?
Respuesta: Las permutaciones posibles son:
{RA, AR, RB, BR, AB, BA}
Hay 6 permutaciones.
2) ¿Cuántas permutaciones de 3 dígitos numéricos se pueden hacer?
Respuesta: Para el 1° dígito, hay 10 posibilidades, para el 2°, 9 y para el 3°, 8.
Entonces hay 10 x 9 x 8 = 720 permutaciones.
{012, 021, 102, 210, 013, 014, … etc.}
13. Permutaciones de n Elementos
Para permutar n elementos entre sí:
Para el 1° elemento, hay n posibilidades
Para el 2° elemento, hay n-1 posibilidades
…
Para el n° elemento, hay 1 posibilidad
Entonces la cantidad total de permutaciones es:
𝑛 𝑛 − 1 𝑛 − 2 … 3 ∙ 2 ∙ 1 = 𝑛!
Ejemplo: ¿Cuántas permutaciones de 3 bolitas, color rojo, azul, blanco
se pueden hacer?
Respuesta: n=3 3! = 3⋅2⋅1 = 6
{RAB, RBA, ARB, ABR, BRA, BAR}
14. Ejercicio
Jorge acaba de cumplir 21 años. Sabe preparar exactamente 7 platos
distintos de comida. Como no le gusta la rutina, decide, cada semana,
preparar un plato por día de la semana, pero cambiando el orden cada
semana de modo que nunca se repita un orden (permutación). ¿Qué
edad va a tener cuando se acaben las permutaciones y tenga que
repetir una pasada?
15. Permutaciones de r Elementos de n
En general, para una permutación de r elementos de un total de n:
Para el 1° elemento, hay n posibilidades
Para el 2° elemento, hay n-1 posibilidades
…
Para el r° elemento, hay n-r+1 posibilidades
Entonces hay n(n-1)(n-2)…(n-r+1) posibilidades en total
Pero
𝑛 𝑛 − 1 (𝑛 − 2) … 𝑛 − 𝑟 + 1 =
𝑛!
𝑛 − 𝑟 !
Notación:
𝑃 𝑛, 𝑟 =
𝑛!
𝑛 − 𝑟 !
16. Combinaciones
Una combinación es un subconjunto (o muestra) de r elementos distintos de
un conjunto de n elementos, sin importar el orden.
Ejemplos:
1) Se tienen 3 bolitas de colores: rojo, azul, y blanco. ¿Cuántas
combinaciones de 2 bolitas se pueden hacer?
Respuesta: Las combinaciones posibles son: {RA, RB, AB}. Hay 3
combinaciones.
2) Cuantas combinaciones de 3 dígitos numéricos se pueden hacer?
Respuesta: Ya hemos visto que hay 10x9x8 = 720 permutaciones. Pero todas
las permutaciones con los mismos 3 dígitos corresponden a la misma
combinación, y para 3 dígitos hay 3! = 3x2x1 = 6 permutaciones. Entonces la
cantidad total de combinaciones es 720/6 = 120.
17. Combinaciones de r Elementos de n
Todas las combinaciones posibles de r elementos de n es igual a todas las
maneras de elegir r de n, sin importar el orden.
Se usan tres notaciones equivalentes:
𝐶(𝑛, 𝑟) ≡ 𝐶𝑟
𝑛
≡
𝑛
𝑟
Ya hemos visto en el ejemplo (2) que podemos contar las permutaciones y
luego dividir por la cantidad de permutaciones entre sí, porque no importa el
orden.
𝐶 𝑛, 𝑟 =
𝑃(𝑛, 𝑟)
𝑟!
∴ 𝐶 𝑛, 𝑟 =
𝑛!
𝑛 − 𝑟 ! 𝑟!
18. Ejercicio
Cada 4 años se juega la copa mundial de fútbol, en la cual participan 32
selecciones nacionales. En la primera ronda los equipos se dividen en
grupos de 4. ¿Cuántas maneras hay de elegir 4 equipos de 32 para el
grupo A?
19. Teoría Moderna de Probabilidad
• Problema Lógico de la Probabilidad Clásica
• Nociones Fundamentales
• Función de Probabilidad y sus Axiomas
• Probabilidad Condicional
• Independencia de Eventos
• Probabilidad Conjunta
20. Problema Lógico de la Probabilidad Clásica
Examinemos con cuidado la definición de la probabilidad clásica:
La probabilidad de un evento es su frecuencia, medido como el
porcentaje de casos en que el evento sucede, dentro de todos los casos
posibles, cuando todos los casos son igualmente probables.
Matemáticamente:
Probabilidad de X =
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑐𝑜𝑛 𝑋
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠
Esta definición tiene un grave error lógico, y es que se está usando la
palabra “probabilidad” dentro de la definición de probabilidad, o sea,
adolece de lógica circular.
Debido a esta falencia, en el siglo 19 se desarrolló la Teoría Moderna de
Probabilidad, sobre bases axiomáticas rigurosas.
21. Teoría Moderna de Probabilidad
Nociones Fundamentales
Experimento Aleatorio: Cualquier fenómeno que podemos imaginar
que está sujeto a incertidumbre.
Espacio Muestral: El conjunto de resultados (o eventos atómicos) del
experimento.
S = {s1, s2, … sn}
Los elementos de S cumplen dos propiedades fundamentales:
1) Mutualmente excluyentes: No pueden suceder si y sj con si ≠ sj en
el mismo experimento.
2) Colectivamente exhaustivos: Al menos uno de los si tiene que
suceder.
22. Función de Probabilidad y Sus Axiomas
La probabilidad es una función del espacio muestral en el intervalo [0, 1].
𝑃: 𝑆 → [0, 1]
Cumple 2 axiomas:
1) La probabilidad de un evento es la suma de las probabilidades de sus resultados
que lo constituyen:
𝑃 𝐸 =
𝑒∈𝐸
𝑃 𝑒 ∀ 𝐸 ⊆ 𝑆
2) La suma de las probabilidades de todos los resultados del espacio muestral es 1.
𝑠∈𝑆
𝑃 𝑠 = 1
Es posible demostrar que la definición de probabilidad clásica se cumple bajo esta
definición moderna, como un caso particular.
23. Ejercicios
1) Al tirar un dado, ¿cuál es la probabilidad de sacar un número par?
2) Al tirar dos dados y sumar ambos, ¿cuál es la probabilidad de sacar
un número 7?
3) Una lotería tiene un solo premio de 100 millones y vende 1 millón
de números. Si un vendedor te dice que cada número tiene una
probabilidad de ganar de 1,2 × 10−6, ¿qué le dirías?
25. Ejercicios
1) Al tirar un dado, ¿cuál es la probabilidad de sacar un número par?
2) Al tirar un dado, ¿cuál es la probabilidad de sacar un número
primo?
3) Al tirar un dado, ¿cuál es la probabilidad de sacar un número par ó
un número primo?
27. Ejercicios
1) En un restaurante, el 50% de los clientes pide porotos granados, y el
10% pide porotos granados y además macedonia. ¿Si un cliente ya
pidió porotos granados, cuál es la probabilidad de que elegirá
macedonia?
2) Para todas las familias con exactamente dos hijos, la probabilidad
de tener un niño o una niña es la misma. Al elegir una familia al
azar, y saber que uno de los hijos es niño, ¿cuál es la probabilidad
que su hermana sea niña?
28. Eventos Independientes
Dos eventos, A y B, son independientes si la probabilidad de uno es la
misma si sucede el otro o no.
Matemáticamente, A y B son independientes si la probabilidad de A es
igual a la probabilidad de A dado B, y viceversa.
P(A) = P(A|B) y P(B) = P(B|A)
Se puede demostrar que esto es equivalente a:
P(A ∩ B) = P(A)∙P(B)
29. Ejercicios
1) Al tirar dos monedas, ¿cuál es la probabilidad de sacar dos caras?
2) Al tirar dos dados, ¿cuál es la probabilidad de que la suma sea 2?
3) En Chile el 2% de la población tiene o ha tenido coronavirus. Al
entrevistar a 3 personas al azar, ¿cuál es la probabilidad de que los
tres tengan o hayan tenido coronavirus?
30. Probabilidad Conjunta
De dos espacios muestrales diferentes, X e Y, se puede construir el espacio muestral
conjunto, consistente en pares de eventos atómicos (x, y), con x ∈ X, y ∈ Y. La
probabilidad de cada evento atómico es la probabilidad conjunta:
𝑃 𝑥, 𝑦 = 𝑃(𝑥 ∩ 𝑦)
Hay dos casos:
1) X e Y son independientes. En este caso conocemos la probabilidad conjunta:
𝑃 𝑥, 𝑦 = 𝑃 𝑥 𝑃 𝑦 ∀𝑥 ∈ 𝑋, 𝑦 ∈ 𝑌
2) X e Y NO son independientes. En este caso podríamos conocer la probabilidad
conjunta o no. De lo que sí estamos seguros es que:
∃𝑥 ∈ 𝑋, 𝑦 ∈ 𝑌 𝑡𝑞 𝑃 𝑥, 𝑦 ≠ 𝑃 𝑥 𝑃 𝑦
En general no conocemos la probabilidad conjunta, ya que no necesariamente
sabemos si X e Y son independientes o no.
31. Ejemplo: X e Y Independientes
Tiras dos dados, llamémoslos X e Y. Es razonable suponer que son
independientes. Por lo tanto podemos construir un diagrama de su
probabilidad conjunta así:
X 1 2 3 4 5 6
Y 1/6 1/6 1/6 1/6 1/6 1/6
1 1/6 1/36 1/36 1/36 1/36 1/36 1/36
2 1/6 1/36 1/36 1/36 1/36 1/36 1/36
3 1/6 1/36 1/36 1/36 1/36 1/36 1/36
4 1/6 1/36 1/36 1/36 1/36 1/36 1/36
5 1/6 1/36 1/36 1/36 1/36 1/36 1/36
6 1/6 1/36 1/36 1/36 1/36 1/36 1/36
32. Ejemplo: X e Y NO Independientes
Una empresa de retail resume sus ventas por categoría de producto y
rango de edad así (ventas expresadas en $ millones):
A simple vista parece que los espacios muestrales no son independientes,
porque los clientes de 18-30 años compran mayormente tecnología, los
de 31-50 sobre todo mejoramiento del hogar, y los mayores de 51
prefieren la jardinería.
Edad 18-30 31-50 > 51
Categoría 1.016 279 454 283
Tecnología 349 207 73 69
Mejoramiento del Hogar 416 52 282 82
Jardinería 251 20 99 132
33. Ejemplo: X e Y NO Independientes
Podemos convertir los montos en probabilidades dividiendo por el total:
1.016:
Así obtenemos la probabilidad conjunta, y también la de cada espacio
muestral solo.
Edad 18-30 31-50 > 51
Categoría 1,00 0,27 0,45 0,28
Tecnología 0,34 0,20 0,07 0,07
Mejoramiento del Hogar 0,41 0,05 0,28 0,08
Jardinería 0,25 0,02 0,10 0,13
34. Ejemplo: X e Y NO Independientes
Si comparamos la tabla de probabilidad conjunta obtenida con la que sería si
fueran independientes, podemos saber con certeza si son independientes o no.
Claramente, vemos que los espacios muestrales NO son independientes, y
además para todo x, y.
SI FUERAN INDEPENDIENTES
Edad 18-30 31-50 > 51 Edad 18-30 31-50 > 51
Categoría 1,00 0,27 0,45 0,28 Categoría 0,27 0,45 0,28
Tecnología 0,34 0,20 0,07 0,07 Tecnología 0,34 0,09 0,15 0,10
Mejoramiento del Hogar 0,41 0,05 0,28 0,08 Mejoramiento del Hogar 0,41 0,11 0,18 0,11
Jardinería 0,25 0,02 0,10 0,13 Jardinería 0,25 0,07 0,11 0,07
≠
35. Probabilidad Marginal
No importa que no necesariamente conozcamos la probabilidad
conjunta, porque siempre se cumple una propiedad importante, la de la
probabilidad marginal.
36. Probabilidad Marginal
La probabilidad marginal de una probabilidad conjunta es la probabilidad
de que suceda un evento atómico x dado que se cumplen todas las de Y, y
viceversa. Para cada uno es la suma de las probabilidades conjuntas.
P x =
𝑦∈𝑌
𝑃(𝑥, 𝑦)
P y =
𝑥∈𝑋
𝑃(𝑥, 𝑦)
Este importante resultado se puede demostrar fácilmente de los axiomas
de probabilidad.
38. Probabilidad Marginal
Incluso podemos conocer la probabilidad marginal sin conocer la
probabilidad conjunta:
Edad 18-30 31-50 > 51
Categoría 0,27 0,45 0,28
Tecnología 0,34
Mejoramiento del Hogar 0,41
Jardinería 0,25
39. Ejercicio
Calcula la probabilidad conjunta y marginal de cada categoría y edificio
del diagrama:
Edificio A Edificio B Edificio C
Frutas y Verduras 6 6 17
Lácteos 9 5 10
Abarrotes 6 18 9
Panes y Tortas 11 9 13
119
40. Diagrama de Árbol
La probabilidad conjunta también se puede representar con un
diagrama de árbol.
41. Teorema de Bayes
El Teorema de Bayes tiene muchas aplicaciones útiles.
Además hay varias versiones. Vamos a ver las tres versiones discretas.
1) Un solo conjunto
2) Partición simple
3) Partición múltiple
42. Teorema de Bayes – Un Solo Conjunto
A menudo nos interesa una probabilidad condicional P(A|B) pero no
podemos calcularlo directamente a partir de nuestros datos. Si
tenemos la probabilidad condicional inversa: P(B|A), podemos calcular
lo que nos interesa: P(A|B), mediante el Teorema de Bayes simple:
𝑃 𝐴 𝐵 =
𝑃 𝐵 𝐴 𝑃(𝐴)
𝑃(𝐵)
43. Teorema de Bayes – Partición Simple
En algunos problemas el espacio muestral está particionado en dos eventos
discretos:
𝐴 ∪ 𝐴𝐶
En estos casos, el Teorema de Bayes tiene la siguiente forma conveniente:
𝑃 𝐴 𝐵 =
𝑃 𝐵 𝐴 𝑃(𝐴)
𝑃 𝐵 ∩ 𝐴 + 𝑃(𝐵 ∩ 𝐴𝐶)
O:
𝑃 𝐴 𝐵 =
𝑃 𝐵 𝐴 𝑃(𝐴)
𝑃 𝐵 𝐴 𝑃(𝐴) + 𝑃(𝐵|𝐴𝐶)𝑃(𝐴𝐶)
44. Teorema de Bayes – Discreto General
En general, el espacio muestral está particionado en varios eventos discretos:
𝑆 = 𝐴1 ∪ 𝐴2 ∪ ⋯ 𝐴𝑛 =
𝑖=1
𝑛
𝐴𝑖
El Teorema de Bayes discreto general es:
𝑃 𝐴𝑖 𝐵 =
𝑃 𝐵 𝐴𝑖 𝑃(𝐴𝑖)
𝑃(𝐵)
∀𝑖
O:
𝑃 𝐴𝑖 𝐵 =
𝑃 𝐵 𝐴𝑖 𝑃(𝐴𝑖)
𝑗=1
𝑛
𝑃(𝐵 ∩ 𝐴𝑗)
O:
𝑃 𝐴𝑖 𝐵 =
𝑃 𝐵 𝐴𝑖 𝑃(𝐴𝑖)
𝑗=1
𝑛
𝑃 𝐵 𝐴𝑗 𝑃(𝐴𝑗)
Ya que claramente: 𝐵 = ⋃𝑗=1
𝑛
𝐵 ∩ 𝐴𝑗
45. Ejercicio
Basado en información histórica de los estados financieros de una
empresa, un auditor encuentra que el 15% tiene errores. De los
informes con errores, 60% se consideraron como inusuales. De todos
los informes, el 20% se consideraron como inusuales. Si un informe es
inusual, cuál es la probabilidad de que tenga errores?