Este documento presenta conceptos básicos sobre probabilidad, incluyendo diferentes enfoques para determinar la probabilidad de ocurrencia de eventos aleatorios como el enfoque clásico, el enfoque frecuentista y el enfoque axiomático. También describe cómo calcular probabilidades utilizando conceptos como eventos mutuamente excluyentes, eventos no mutuamente excluyentes, probabilidad conjunta, probabilidad condicional e independencia de eventos.
2. Cuando realizamos un
experimento, diremos que es:
• Determinista: dadas unas
condiciones iniciales, el
resultado es siempre el
mismo. Ejemplo: calentar agua
a 100 °C, soltar un objeto
• Aleatorio: dadas unas
condiciones iniciales,
conocemos el conjunto
de resultados posibles,
pero NO el resultado final.
Ejemplo: lanzar un dado,
resultado de un partido,
SUCESOS DETERMINISTAS Y ALEATORIOS
3. Conceptos Básicos de Probabilidad: experimento aleatorio
Un experimento es aleatorio si se verifica las siguientes condiciones:
se puede repetir indefinidamente, siempre en las mismas
condiciones,
no se puede predecir el resultado que se va a obtener,
el resultado que se obtenga pertenece a un conjunto conocido
previamente de resultados posibles, denominado “espacio muestral”
y se denota por S ó Ω. Los espacios muestrales pueden ser finitos o
infinitos.
4. Probabilidad, es la posibilidad o la oportunidad de que
ocurra un evento o suceso específico.-
La probabilidad es una proporción o fracción
cuyo valor se encuentra entre 0 y 1
inclusive.-
Se la explica siempre en %.-
La probabilidad
es 0 cuando el
evento nunca va
a ocurrir.-
La probabilidad es 1 cuando
el evento ocurrirá con
seguridad.-
El término Probabilidad se refiere al estudio de la aleatoriedad y la
incertidumbre.-
5. Teoría de la probabilidad
La teoría de la probabilidad es una teoría matemática axiomatizada, sobre la
cual existe un amplio consenso.
La formulación usual de la teoría de la probabilidad se hace en el lenguaje de
la teoría de conjuntos.
El dominio de la teoría es un conjunto no vacío de elementos cualesquiera,
habitualmente simbolizado como .
La probabilidad es una función que asigna números reales a los
subconjuntos de .
6. CONCEPTO DE PROBABILIDAD
A
A’
Complemento
A B
Mutuamente excluyentes
A B
No mutuamente excluyentes
0.3
0.5 0.1
0.1
A B C
0.02 0.94 0.04
Colectivamente Exhaustivo
El objetivo de la PROBABILIDAD es medir la certidumbre(o incertidumbre) de que
ocurran determinados sucesos
7. Probabilidad
clásica o a
priori o de
Laplace
Probabilidad
subjetiva
Probabilidad
empírica o
probabilidad
frecuencial
Se estudian diferentes enfoques para
determinar la probabilidad de ocurrencia
de ciertos fenómenos aleatorios
Axiomas
8. Enfoque clásico o a priori
•Este enfoque permite determinar valores de probabilidad antes de ser observado el experimento por
lo que se le denomina enfoque a priori. Asigna probabilidades basadas en la suposición de
resultados igualmente probables.
•El enfoque clásico es aplicado cuando todos los resultados son igualmente probables y no pueden
ocurrir al mismo tiempo. (Monedas, dados, naipes, etc.).
•Si un experimento tiene n resultados posibles, este método asignará una probabilidad de1/n para
cada resultado (Regla de Laplace, 1811).
Si queremos conocer la probabilidad del evento A según este enfoque debemos calcular el siguiente
cociente:
)S(N
)A(N
)A(P
Donde:
N(A): resultados elementales posibles son favorables en el evento A
N(S): posibles resultados en el espacio muestral
Ejemplo
Experimento: Rodar un del dado
Espacio muestral: S = {1, 2, 3, 4, 5, 6}
Probabilidades: Cada punto de la muestra tiene una
probabilidad de ocurrir de 1/6.
9. Enfoque frecuentista (Richard Von Mises (1883-1953)
•Este enfoque permite determinar la probabilidad con base en la proporción de veces que ocurre un
resultado favorable en cierto número de experimentos. Asigna probabilidades basadas en
experimentación o datos históricos.
•No implica ningún supuesto previo de igualdad de probabilidades.
•A este enfoque se le denomina también enfoque empírico debido a que para determinar los
valores de probabilidad se requiere de la observación y de la recopilación de datos.
•También se le denomina a posteriori, ya que el resultado se obtiene después de realizar el
experimento un cierto número de veces.
•Si queremos conocer la probabilidad del evento A según este enfoque debemos calcular el
siguiente cociente:
n
)A(n
muestraladeTamaño
AdenesobservaciodeNúmero
)A(P
10. Ejemplo
Para la asignación de probabilidades es el más conveniente cuando existen datos para estimar la
proporción de veces que se presentarán los resultados si el experimento se repite muchas veces.
Considere, por ejemplo un estudio sobre los tiempos de espera en el departamento de rayos x de un
hospital pequeño. Durante 20 días sucesivos un empleado registra el número de personas que están
esperando el servicio a las 9:00 a.m.; los resultados son los siguientes.
En estos datos aparece que 2 de los 20 días, había cero pacientes esperando el servicio, 5 días había un paciente
en espera y así sucesivamente. Con el método de la frecuencia relativa, la probabilidad que se le asignará al
resultado experimental cero pacientes esperan el servicio, será 2/20 = 0.10; al resultado experimental un paciente
espera el servicio (5/20 = 0.25); 6/20 = 0.30 a dos pacientes esperan el servicio; 4/20 = 0.20, a tres pacientes
esperan el servicio, y 3/20 = 0.15 a cuatro pacientes esperan el servicio.
Número de personas que esperan Número de días: Resultados de
ocurrencia
0 2
1 5
2 6
3 4
4 3
Total 20
11. Enfoque axiomatico
En matemáticas un axioma no es necesariamente una verdad evidente, sino
una expresión lógica utilizada en una deducción para llegar a una
conclusión. De tal manera que se llama probabilidad (definida por
(Kolmogorov, 1933, en el siglo XX) a cualquier función P que asigna a
cada suceso A un valor númerico P(A) y que verifica las siguientes reglas
(axiomas):
•Axioma 1: La probabilidad P(A) de cualquier evento no debe ser menor que
cero ni mayor que uno. 0 ≤ P(A) ≤ 1. Si estamos seguros de que algo
puede ocurrir o no, podemos asignar al evento la probabilidad de 1 ó
0, según el caso.
•Axioma 2: P(S) = 1. Probabilidad del espacio muestral
•Axioma 3: Si A y B son dos eventos mutuamente exclusivos, por lo que A∩B
=Ø entonces P(AUB) = P(A) + P(B)
12. Enfoque subjetivo. (Finetti, 1975; French, 1986)
Asigna probabilidades basadas en el juicio de quién asigna o en base a cualquier información disponible.
Es apropiada para asignar probabilidad cuando se da un experimento en donde no se puede aplicar
ninguno de los enfoques vistos, y asignamos probabilidad en base al conocimiento del hecho que
tenemos.
Por ejemplo: la probabilidad de que mañana llueva es del 70%.
13. CLASIFICACION DE EVENTOS Y REGLAS QUE SE UTILIZAN PARA EL CALCULO DE
PROBABILIDAD
DOS EVENTOS A Y B
Mutuamente excluyentes
P(AB) = 0
P(A B) = P(A) + P(B)
No mutuamente excluyentes
P(A B) = P(A) + P(B) - P(AB)
Independientes
P(AB) = P(A) P(B)
Dependientes
P(AB) = P(A) P(B/A)
P(AB) = P(B) P(A/B))
Regla Aditiva
Regla Aditiva
Regla
multiplicativa
Cuatro tipos de probabilidad
Marginal Unión Conjunta Condicional
P X Y( )P X( ) P X Y( ) P X Y( | )
La probabilidad
de que ocurra
X
La probabilidad
de que ocurra
X o Y
La probabilidad
de que ocurra
X y Y
La probabilidad
de que ocurra X
Sabiendo que
ha ocurrido Y
X YX YX
Y
14. Recuento
189 280 469
108 359 467
6 58 64
303 697 1000
NORMAL
OSTEOPENIA
OSTEOPOROSIS
CLASIFICACION
OMS
Total
NO SI
MENOPAUSIA
Total
Ejemplo (I)
• Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de
una población muy grande. El resultado está en la tabla.
• ¿Cuál es la probabilidad de que una mujer tenga osteoporosis?
• P(Osteoporosis)=64/1000=0,064=6,4%
• Noción frecuentista de probabilidad, a esta probabilidad también se le conoce
como marginal
• ¿Cuál es la probabilidad de que una mujer no tenga
osteoporosis?
• P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%
Para calcular esta probabilidad nos valemos del concepto de
complemento
15. Recuento
189 280 469
108 359 467
6 58 64
303 697 1000
NORMAL
OSTEOPENIA
OSTEOPOROSIS
CLASIFICACION
OMS
Total
NO SI
MENOPAUSIA
Total
Ejemplo (II)
• ¿Probabilidad de tener osteopenia u osteoporosis?
• P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-
P(Osteopenia∩Osteoporosis)=467/1000+64/1000=0,531
• Son sucesos disjuntos, o sea excluyentes
• Osteopenia ∩ Osteoporosis=Ø
• Concepto de Regla aditiva
• ¿Probabilidad de tener osteoporosis o menopausia?
• P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis ∩
Menopausia)=64/1000+697/1000-58/1000=0,703
• No son sucesos disjuntos, existe la intercepción entre ellos
• De igual manera. Para calcular esta probabilidad nos valemos del concepto Regla aditiva
• ¿Probabilidad de una mujer normal?
• P(Normal)=469/1000=0,469
• P(Normal)=1-P(Normal’)=1-P(OsteopeniaUOsteoporosis) =1-0,531=0,469
• Para calcular esta probabilidad nos valemos del concepto de probabilidad complementaria
16. Probabilidad Condicional
Como su nombre lo indica se trata de determinar la probabilidad de que ocurra un evento A
(aposteriori) dado que ya aconteció un evento B (apriori), y se representa mediante P(A/B), se
lee probabilidad de A dado B o probabilidad de A condicionada a B.
Sean A, B dos sucesos tal que P(B) > 0. La probabilidad de A condicionada a la ocurrencia de B,
denotada como P(A/B)
No confundir probabilidad condicionada con intersección.
En ambos se mide efectivamente la intersección, pero…
En P(A∩B), intersección con respecto a P(S)=1
En P(A|B) , intersección con respecto a P(B)
“tamaño” de uno con
respecto al otro A
S espacio muestral
B
P(A/B) = P(AB)
P(B)
17. Ejemplo (III)
• Si es menopáusica… ¿probabilidad de osteoporosis?
• P(Osteoporosis|Menopausia)=58/697=0,098
• Probabilidad Condicional
• ¿Probabilidad de menopausia y osteoporosis?
• P(Menop ∩ Osteoporosis) = 58/1000=0,058
• Probabilidad conjunta
• Otra forma:
Recuento
189 280 469
108 359 467
6 58 64
303 697 1000
NORMAL
OSTEOPENIA
OSTEOPOROSIS
CLASIFICACION
OMS
Total
NO SI
MENOPAUSIA
Total
058,01000/58
697
58
1000
697
)|()()(
MenopisOsteoporosPMenopPisOsteoporosMenopP
18. Ejemplo (III)
• Si tiene osteoporosis… ¿probabilidad de menopausia?
• P(Menopausia|Osteoporosis)=58/64=0,906
• ¿Probabilidad de menopausia y no osteoporosis?
• P(Menop ∩ No Osteoporosis) = 639/1000=0,639
• Si tiene no tiene osteoporosis… ¿probabilidad de no menopausia?
• P(No Menopausia|NoOsteoporosis)=297/936=0,317
Recuento
189 280 469
108 359 467
6 58 64
303 697 1000
NORMAL
OSTEOPENIA
OSTEOPOROSIS
CLASIFICACION
OMS
Total
NO SI
MENOPAUSIA
Total
19. Ejemplo (IV)
• ¿Son independientes menopausia y osteoporosis?
• Una forma de hacerlo
• P(Osteoporosis)=64/1000=0,064
• P(Osteoporosis|Menopausia)=58/697=0,098
• La probabilidad de tener osteoporosis es mayor si ha pasado la menopausia. Añade información extra. ¡No son
independientes!
• ¿Otra forma?
• P(Menop ∩ Osteoporosis) = 58/1000 = 0,058
• P(Menop) P(Osteoporosis)= (697/1000) x (64/1000) = 0,045
• La probabilidad de la intersección no es el producto de probabilidades. No son independientes.
Recuento
189 280 469
108 359 467
6 58 64
303 697 1000
NORMAL
OSTEOPENIA
OSTEOPOROSIS
CLASIFICACION
OMS
Total
NO SI
MENOPAUSIA
Total
Independencia de sucesos
• Dos sucesos son independientes si el que ocurra uno, no añade información sobre
el otro.
• A es independiente de B
P(A|B) = P(A)
P(AB) = P(A) P(B)
20. EJEMPLO DE CALCULO DE PROBABILIDADES UTILIZANDO
TABLAS DE PROBABILIDAD
El Colegio de Ingenieros tiene los siguientes datos sobre la edad y
el estado civil de sus 140 socios.
EDAD
ESTADO CIVIL
TOTALS.- soltero C.- casado
A.- menos
de
30 años
77 14 91
B.- 30 años
o más 28 21 49
TOTAL 105 35 140
21. EJEMPLO DE CALCULO DE PROBABILIDADES UTILIZANDO TABLAS DE
PROBABILIDAD
Se decide seleccionar un socio al azar:
a) Aplique las probabilidades marginales para comentar sobre la edad de los
socios del Colegio.
b) Aplique las probabilidades marginales para comentar sobre el estado civil de
los socios del Colegio.
c) ¿Cuál es la probabilidad de que sea soltero y tenga menos de 30 años?.
d) Si un socio tiene menos de 30 años.- ¿Cuál es la probabilidad de que sea
soltero?.
e) El estado civil de los socios, ¿es independiente de su edad?.- Explique
aplicando probabilidad.
Solución
22. SOLUCIÓN
a) P (A) = 91/140 = 0,65 65 %
P (B) = 49/140 = 0,35 35 %
Hay mayor probabilidad de que al elegir un socio al azar por edad este se
menor de 30 años.
b) P (S) = 105/140 = 0,75 75%
P (C) = 35 / 140 = 0,25 25%
Hay mayor probabilidad de que al elegir un socio al azar por estado civil este
sea soltero.
c) ¿Cuál es la probabilidad de que sea soltero y tenga menos de 30 años?.
Calculado por probabilidad conjunta será:
P (S ∩ A) = 77 / 140 = 0,55 55 %.
Calculado por regla de la multiplicación será:
P (S ⋂ A) = P (A) P( S/A) = 91/140 * 77/91 = 77/140 = 0,55 55 %.
o también
P (S ⋂ A) = P (S) P (A/S) = 105/140 * 77/ 105 = 77/140 = 0,55 55 %
23. SOLUCIÓN
d) Si un socio tiene menos de 30 años.- ¿Cuál es la probabilidad de que sea soltero?.
P (S / A) por definición será:
Por espacio muestral reducido, el calculo sería:
e) Para demostrar que Estado Civil y Edad son eventos independientes se tiene que cumplir
la igualdad,
P ( S ∩ A) = P (S) * P (A)
Luego:
P (S ∩ A) = 77 / 140 = 0,55 ⇒ 55 %
P (S) * P (A) = 105/140 * 91/ 140 = 9555/19600 = 0, 4875 ⇒ 49 %.
Luego P ( S ∩ A) ≠ P (S) * P (A)
Entonces S y A no son independientes.
%858462.0
91
77
140
91
140
77
)(
)(
)|(
AP
ASP
ASP
%858462.0
91
77
)|( ASP
24. Supongamos que A1, A2, ... ,An son una partición de E,
es decir que los sucesos son mútuamente excluyentes entre sí (AiAj= para
todo par) y su unión es E entonces:
)()|()(
1
i
n
i
i APABPBP
La ley de probabilidad total
)()(
1
n
i
iABPBPA1 A2
A3 A4
B
25. Ejemplo: En una aula el 70% de los alumnos son hombres. De ellos el 10% son fumadores.
El 20% de las mujeres son fumadoras. ¿Qué porcentaje de fumadores hay en total?
Podemos aplicar la ley de
la probabilidad total:
Hombres y mujeres forman
un sistema exhaustivo y
excluyente de sucesos.
Mujeres
Hombres
Fumadores P(F) = P(F∩H) + P(F∩M) = P(F|H) P(H) + P(F|M) P(M)
= 0,1 · 0,7 + 0,2 · 0,3 = 0,13
Estudiante
Hombre
No fuma
Fuma
No fuma
Fuma
0,7
0,1
0,2
0,3
0,8
0,9
Mujer
26. TEOREMA DE BAYES
Las leyes aditiva y multiplicativa, junto con la noción de probabilidades
condicionadas y el teorema de las probabilidades totales se han empleado para
desarrollar el llamado Teorema de Bayes, de indudable interés en la aplicación de la
estadística en todos los campos de las ciencias. De la definición de probabilidad
condicional se puede deducir:
BP
P
BAP
ByA
o
siempre que P(A) 0 y P(B) 0. Aplicando además el teorema de las
probabilidades totales se llega a que:
APABPAPABP
APABP
BAP
APABPP
AP
P
ABP ByA
ByA
Sirve para “invertir” probabilidades condicionales, combinando información previa
con información nueva. Es aplicable cuando los eventos por los cuales queremos
calcular las probabilidades posteriores son mutuamente exclusivas y su unión es el
total del espacio muestral
Nueva
Información
Aplicación
del teorema
de Bayes’
Probabilidades
A Posteriori
Probabilidades
a priori
27. Teorema de Bayes
A1 A2
A3 A4
B
Si conocemos la probabilidad de B en
cada uno de los n componentes de un
sistema exhaustivo y excluyente de
sucesos, entonces…
…si ocurre B, podemos calcular la
probabilidad (a posteriori) de
ocurrencia de cada Ai, (i = 1, 2, ... , n):
donde P(B) se puede calcular usando el teorema de la probabilidad total:
P(B)
)AP(B
|B)P(A i
i
)()(
1
n
i
iABPBP
28. P(M) = 0,3, P(F) = 0,13
P(M|F) = P(F ∩ M)/P(F) = P(F|M) P(M) / P(F) =
0,2·0,3 / 0,13 = 0,46
Estudiante
Hombre
No fuma
Fuma
No fuma
Fuma
0,7
0,1
0,2
0,3
0,8
0,9
Mujer
En el problema anterior: Se
elige a un individuo al azar
y resulta fumador. ¿Cuál es la
probabilidad de que sea una
mujer?
29. Ejemplo: Pruebas diagnósticas
Las pruebas o tests de diagnóstico se evalúan con anterioridad sobre
dos grupos de individuos: sanos y enfermos. De modo frecuentista se
estima:
La sensibilidad de una prueba (o síntoma) es la probabilidad de un
resultado positivo de la prueba (presencia o ausencia del síntoma)
dada la presencia de la enfermedad.
•Sensibilidad (verdaderos +) = Tasa de acierto sobre enfermos.
•Especificidad (verdaderos -) = Tasa de acierto sobre sanos.
A partir de lo anterior y usando el teorema de Bayes, podemos calcular las probabilidades a posteriori (en función de los
resultados del test) de los llamados índices predictivos:
La especificidad de una prueba (o síntoma) es la probabilidad de un
resultado negativo de 1a prueba (o ausencia del síntoma) dada la
ausencia de la enfermedad.
P(Enfermo | Test +) = Índice predictivo positivo
P(Sano | Test -) = Índice predictivo negativo
30. La diabetes afecta al 20% de los individuos que acuden a una consulta. La presencia de
glucosuria se usa como indicador de diabetes. Su sensibilidad (la tasa de aciertos sobre
enfermos) es de 0,3 y la especificidad (tasa de aciertos sobre sanos) de 0,99.
Calcular los índices predictivos (P(Enfermo | Test +) = Índice predictivo positivo y
P(Sano | Test -) = Índice predictivo negativo).
Individuo
Enfermo
Sano
T-
T+
T-
T+
0,3
1 - 0,99 = 0,01
1 - 0,3 = 0,7
0,99
0,2
1 - 0,2 = 0,8
31. 31
)(
)(
)|(
TP
TEnfP
TEnfP
Los índices predictivos son: la probabilidad de que, sabiendo que el test sea positivo, el
paciente sea diabético y la probabilidad de que, sabiendo que el test es negativo, el paciente
está sano.
Individuo
Enfermo
Sano
T-
T+
T-
T+
0,3
0,01
0,7
0,99
0,2
0,8
06,03,02,0)( TEnfP
068,001,08,03,02,0)( TP
88,0
068,0
06,0
33. Observaciones
• En el ejemplo anterior, al llegar un
individuo a la consulta tenemos una idea
a priori sobre la probabilidad de que
tenga una enfermedad.
• A continuación se le pasa una prueba
diagnóstica que nos aportará nueva
información: Presenta glucosuria o no.
• En función del resultado tenemos una
nueva idea (a posteriori) sobre la
probabilidad de que esté enfermo.
• Nuestra opinión a priori ha sido
modificada por el resultado de un
experimento.
-¿Qué probabilidad
tengo de estar
enfermo?
- En principio un 20%.
Le haremos unas
pruebas.
- Presenta glucosuria.
La probabilidad ahora
es del 88%.
34. La probabilidad de que una mujer con edad comprendida entre los 40-50 tenga cáncer de mama es
0.8%. Si una mujer tiene cáncer de mama, la probabilidad de positivo en test = 90%. Si una mujer no
tiene cáncer de mama, la probabilidad de positivo en test = 7%. Supongamos que una paciente da
positivo en un test. ¿Cuál es la probabilidad de que tenga cáncer de mama?
1000 mujeres
8: enfermas 992: no enfermas
7: positivos 1: negativo 69: positivos 923: negativos
p(enferma | positivo) = 7 / (7+69) = 0.09
0.09
enf)no|(posenf)(noenf)|(pos(enf)
enf)|(pos(enf)
pos)|(enf
0.07enf)no|(pos0.90,enf)|(pos0.992,enf)(no0.008,(enf)
PPPP
PP
P
PPPP
35. Un equipo de investigación medica pretende evaluar una prueba de detección propuesta para la enfermedad de Alzheimer. La
prueba se basa en una muestra aleatoria de 450 enfermos y en otra muestra aleatoria independiente de 500 pacientes que no
presentan síntomas de la enfermedad. Las dos muestras se obtuvieron de una población de individuos con edades de 65 años y
más. Los resultados son los siguientes:
Prueba de sensibilidad (D/T) = 436/450 = 0.97
Especificidad de la prueba 449/599 = 0.99
Probabilidad de que un individuo con prueba positiva
este enfermo de Alzheimer.
P(TID) = 436/ 450 = 0.9689, y P(TID) 5/500 = 0.01
Tasa de la enfermedad en la
población (se estima)
36. Concepto de distribución de probabilidades
Son modelos teóricos de como sería la distribución de un
fenómeno (variable), para una población completa; es decir, como
se comportaría el fenómeno, si este se realizara un número infinito
de veces.
Su utilidad radica en que, si se conoce el modelo teórico al que se
ha de adaptar un fenómeno, y varía algún factor, se podrá
comparar los resultados obtenidos en un nuevo estudio de
frecuencias y saber hasta que punto ese determinado factor influye
en el fenómeno.
37. Distribución de probabilidad para
variables discretas
Tipo Definiciòn Gràfico Ejemplo
Binomial Cuenta el número de éxitos en una secuencia
de n ensayos de Bernoulli independientes entre
sí, con una probabilidad fija p de ocurrencia del
éxito entre los ensayos. Un experimento de
Bernoulli se caracteriza por ser dicotómico, esto
es, sólo son posibles dos resultados. A uno de
estos se denomina éxito y tiene una
probabilidad de ocurrencia p y al otro, fracaso,
con una probabilidad q = 1 - p
Supongamos que se sabe que el
30% de cierta población es
inmune a alguna enfermedad. Si
se escoge una muestra aleatoria
de 10 elementos de entre esa
población, ¿cuál es la
probabilidad de que dicha
muestra contenga exactamente
4 individuos inmunes?
Poisson Expresa, a partir de una frecuencia de
ocurrencia media, la probabilidad de que ocurra
un determinado número de eventos durante
cierto período de tiempo. Concretamente, se
especializa en la probabilidad de ocurrencia de
sucesos con probabilidades muy pequeñas, o
sucesos "raros"
Durante el estudio de cierto
organismo acuático, se tomó un
gran número de muestras de una
laguna, y se contó el número de
organismos en cada muestra. El
número promedio de organismos
encontrados por muestra fue de 2.
Suponga que el número de
organismos sigue una distribución
de Poisson, y calcule la
probabilidad de que la próxima
muestra que se tome tenga un
organismo o menos.
38. Distribución normal
Una de las herramientas de mayor uso en el modelaje de los comportamientos de los
fenómenos aleatorios es a través de la distribución normal, gaussiana o de Laplace-
Gauss, pues permite describir situaciones donde pueden recopilarse datos. Esto permite
tomar decisiones que vayan a la par con las metas y objetivos de una investigación o de
un problema dado. Fue descubierta y publicada por primera vez en 1733 por De Moivre.
A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación
con la teoría de los errores de observación astronómica y física .
Pierre Simon de Laplace
(1749-1827)
Karl F. Gauss
(1777-1855)
Abraham de
Moivre
(1667-1754)
39. Utilidad
• Se utiliza muy a menudo porque hay muchas variables asociadas a fenómenos naturales
que siguen el modelo de la norma.
• Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie,
por ejemplo: tallas, pesos, diámetros, distancias, perímetros,...
• Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una
misma cantidad de abono, …
• Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo
de individuos, puntuaciones de examen, ...
• Errores cometidos al medir ciertas magnitudes.
Valores estadísticos muestrales, por ejemplo : la media.
• Y en general cualquier característica que se obtenga como suma de muchos factores.
40. Distribución Normal
2
2
2
2
1
)(
x
exf
La distribución normal fue reconocida por primera vez por el francés
Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss
(1777-1855) elaboró desarrollos más profundos y formuló la ecuación
de la curva; de ahí que también se la conozca, más comúnmente, como
la "campana de Gauss". La distribución de una variable normal está
completamente determinada por dos parámetros, su media y su
desviación estándar, denotadas generalmente por y . Con esta
notación, la densidad de la normal viene dada por la ecuación:
que determina la curva en
forma de campana que tan
bien conocemos
41. Distribución Normal. Características
2
1
21
1
2
x
e dx
X
Simétrica con respecto a Asintótica al eje X
2
1
21
( ) , , 0
2
x
f x e x
X ~ N ( ; ²)
43. Distribución Normal. Características
N (μ,σ)
68% de los datos: (μ –1σ, μ +1σ)
95% de los datos: (μ –2σ, μ +2σ)
99% de los datos: (μ –3σ, μ +3σ)
Se puede calcular la probabilidad (o el %) de datos que queda a la derecha/izquierda de μ.
Regla Empirica
44. DISTRIBUCION NORMAL TIPICA
La distribución normal es una numerosa familia de distribuciones que
corresponden a los muchos valores diferentes de μ y de σ. De entre todas ellas,
la más utilizada es la distribución normal estándar, que corresponde a una
distribución de media 0 y varianza 1. Para ello es esencial una simplificación
para tabular las probabilidades normales para varios valores de los parámetros.
Esto es posible por medio del procedimiento llamado tipificación. Así, la
expresión que define su densidad se puede obtener de la ecuación:
2
2
2
1
)(
z
ezf
Es importante conocer que, a partir de
cualquier variable X que siga una distribución
N(,), se puede obtener otra característica Z
con una distribución normal estándar, sin más
que efectuar la transformación. Como x es
una variable aleatoria también lo es Z.
Fórmulas para calcular área debajo de la curva normal
F representa la distribución acumulada de la distribución Normal, es decir
el área acumulada a la izquierda del valor dado
P (X < a) = F(a)
P (a < X < b) = F(b) - F(a)
P (X > b) = 1 - F(b)
45. Probabilidades en la Normal
( ) ( ) ( ) ( )
b
a
P a X b f x dx F b F a
( ) ( ) 1 ( )
b
P X b f x dx F b
Xa b
P(a X b)
P(X<a) P(X>b)
( ) ( ) ( )
a
P X a f x dx F a
46. Cómo encontrar las probabilidades de un valor z en la
Tabla y con excel?
z 0.00 0.01 0.02 … 0.08 0.09
-3.4 0.0003 0.0003 0.0003 … 0.0003 0.0002
: : : : … : :
-1.5 0.0668 0.0655 0.0643 0.0571 0.0559
: : : : … : :
0 Z-1.58
P(Z < -1.58) = 0.0571
-∞ ∞
47. Cómo encontrar las probabilidades de un valor z en la
Tabla?
z 0.00 0.01 0.02 … 0.08 0.09
: : : : … : :
-1.5 0.0668 0.0655 0.0643 0.0571 0.0559
: : : : … : :
2.2 0.9861 0.9864 0.9868 … 0.9887 0.9890
: : : : … : :
0 Z2.21
P( -1,58 < Z < 2.21 ) =P(Z<2.21)-P(Z<1.58)
=0.9864 – 0.0571
-1.58
=0.9293
∞-∞
48. Cómo encontrar las probabilidades de un valor z en la
Tabla?
z 0.00 0.01 0.02 … 0.08 0.09
: : : : … : :
2.2 0.9861 0.9864 0.9868 … 0.9887 0.9890
: : : : … : :
3.4 0.9997 0.9997 0.9997 … 0.9997 0.9998
0 Z2.21
P(Z > 2.21) =1 - P(Z<2.21)
=1 – 0.9864 = 0.0136
0.9864
-∞ ∞
49. DISTRIBUCION NORMAL TIPICA. Uso de la Tabla
Si X es una población Normal con media = 70 y = 10. Hallar las siguientes probabilidades:
a. P (X < 60) = F (z (60-70)/10) = F(z -1) = 0.1587
b. P (X > 95) = 1 – F (z (95-70)/10) = 1 – F (z 2.5) = 1 – 0.9938 = 0.0062
c. P (50 < X < 80) = F (z (80-70)/10) – F (z (50-70)/10) = F (z 1) – F (z --2) = 0.8413 – 0.0228 = 0.8185
Z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
-3.5 0.00017 0.00017 0.00018 0.00019 0.00019 0.00020 0.00021 0.00022 0.00022 0.00023
-1.0 0.1379 0.1401 0.1423 0.1446 0.1469 0.1492 0.1515 0.1539 0.1562 0.1587
-0.9 0.1611 0.1635 0.1660 0.1685 0.1711 0.1736 0.1762 0.1788 0.1814 0.1841
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
Z 0 .0 9 0 .0 8 0 .0 7 0 .0 6 0 .0 5 0 .0 4 0 .0 3 0 .0 2 0 .0 1 0 .0 0
-3.5 0.00017 0.00017 0.00018 0.00019 0.00019 0.00020 0.00021 0.00022 0.00022 0.00023
-2.0 0.0183 0.0188 0.0192 0.0197 0.0202 0.0207 0.0212 0.0217 0.0222 0.0228
-1.9 0.0233 0.0239 0.0244 0.0250 0.0256 0.0262 0.0268 0.0274 0.0281 0.0287
50. DISTRIBUCION NORMAL TIPICA. Con excel
Si X es una población Normal con media = 70 y = 10. Hallar las siguientes probabilidades:
b. P (X > 95) = 1 – F (z (95-70)/10)
= 1 – F (z 2.5)
= 1 – 0.9938
= 0.0062
c. P (50 < X < 80) = F (z (80-70)/10) – F (z (50-70)/10) = F (z 1) – F (z --2) = 0.8413 – 0.0228 = 0.8185
a. P (X < 60) = F (z (60-70)/10) = F(z -1) = 0.1587
51. Cómo encontrar el valor z, dada una probabilidad, en la tabla y en excel?
Determinar el valor o valores de z en cada uno de los siguientes casos, donde el área se
refiere a una curva normal.
a. El área entre 0 y z es 0.3770 = P (Z z) = 0.5 + 0.3770 = 0.8770 = P (Z 1.16) = 0.88770
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
0.5 0.3770
0.8770
1.16
52. Cómo encontrar el valor z, dada una probabilidad?
Determinar el valor o valores de z en cada uno de los siguientes casos, donde el área se
refiere a una curva normal.
b. El área a la izquierda de z es 0.8621 = P (Z z ) = 0.8621 = P (Z 1.09 ) = 0.8621
Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
0.8621
1.09
53. Cómo encontrar el valor z, dada una probabilidad, usando la tabla?
Determinar el valor o valores de z en cada uno de los siguientes casos, donde el área se
refiere a una curva normal.
c. El área entre –1.5 y z es 0.0217
Caso 1 = P (Z z) – P(Z -1.5) = 0.0217 = 0.0217 + 0.0668 = 0.0885 , z = -1.35
Caso 2 = P (Z -1.5) – P(Z z) = 0.0217 = 0.0668 – 0.0227= 0.0451 , z = -1.70
Z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
-1.7 0.0367 0.0375 0.0384 0.0392 0.0401 0.0409 0.0418 0.0427 0.0436 0.0446
-1.6 0.0455 0.0465 0.0475 0.0485 0.0495 0.0505 0.0516 0.0526 0.0537 0.0548
-1.5 0.0559 0.0571 0.0582 0.0594 0.0606 0.0618 0.0630 0.0643 0.0655 0.0668
-1.4 0.0681 0.0694 0.0708 0.0721 0.0735 0.0749 0.0764 0.0778 0.0793 0.0808
-1.3 0.0823 0.0838 0.0853 0.0869 0.0885 0.0901 0.0918 0.0934 0.0951 0.0968
-1.5 -z
0.0217
0.0668
-1.5-z
0.0217
0.0668
54. Cómo encontrar el valor z, dada una probabilidad usando excel?
Determinar el valor o valores de z en cada uno de los siguientes casos, donde el área se
refiere a una curva normal.
c. El área entre –1.5 y z es 0.0217
Caso 1 = P (Z z) – P(Z -1.5) = 0.0217 = 0.0217 + 0.0668 = 0.0885 , z = -1.35
Caso 2 = P (Z -1.5) – P(Z z) = 0.0217 = 0.0668 – 0.0227= 0.0451 , z = -1.70
-1.5 -z
0.0217
0.0668
-1.5-z
0.0217
0.0668
55. Distribución normal. Cálculos de probabilidades con excel,
utilizando la función normal estándar
El gerente de personal de una gran compañía requiere que los solicitantes a un
puesto efectúen cierta prueba y alcancen una calificación de 500. Si las
calificaciones de la prueba se distribuyen normalmente con media 485 y desviación
estándar 30 ¿Qué porcentaje de los solicitantes pasará la prueba?
Calculando el valor de Z obtenemos:
X
Z 5.0
30
485500
485
Z.05
30.85%
56. Distribución normal. Cálculos de probabilidades con excel, utilizando la
función normal
Tras un test de cultura general se observa que las
puntuaciones obtenidas siguen una distribución
una distribución N (65,18). Se desea clasificar a
los examinados en tres grupos (de baja cultura
general, de cultura general aceptable, de
excelente cultura general) de modo que hay en el
primero un 20% de la población, un 65% el
segundo y un 15% en el tercero. ¿Cuáles han de
ser las puntuaciones que marcan el paso de un
grupo al otro?
Localizamos en nuestra tabla el parámetro
correspondiente a la probabilidad 0.2 (20%), el
cual es - 0.84
P (Z ≤ z1) = 0.2 z1 ≈ - 0.84
Por lo que, si z1 = X1 – 65 / 18 = -0.84
X1 = (-0.84)(18) + 65
X1 = 49.88
Ahora localizamos en la tabla el parámetro para la probabilidad de
0.85 (65%), el cual es de 1.04, lo que significa que
P (Z ≤ z2) = 0.85 z2 ≈ 1.04
Por lo que, si z2 = X2 – 65 / 18 = 1.04
X2 = (1.04)(18) + 65
X2 = 83.72
La clasificación quedaría así: Menos de 50, puntos baja cultura; entre 50 y 84 puntos, cultura aceptable y más
de 84 puntos, cultura excelente.
57. Distribución t de Student
La distribución de Student fue descrita en el año 1908 por William Sealy Gosset.
Gosset trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus
empleados la publicación de artículos científicos debido a una difusión previa de
secretos industriales. De ahí que Gosset publicase sus resultados bajo
el seudónimo de Student. Es importante en cálculos relacionados con la estimación
de medias a través de intervalos de confianza y de pruebas de hipótesis. Entre sus
propiedades se puede mencionar: Es continua, tiene forma de campana y es
simétrica respecto al cero como la distribución z. La distribución t está más dispersa
y es más plana en el centro que la distribución z, pero se acerca a ella cuando el
tamaño de la muestra crece. Se utiliza, sobre todo, para hacer inferencias
estadísticas cuando se tienen muestras pequeñas.
59. Cómo encontrar la probabilidad para un valor de t dado,
usando tabla?
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se
selecciona de una distribución normal. Si se busca en la tabla el valor de t =1.761 con 14
grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la
izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de
0.005, que equivale a α.
Luego se busca el valor de 0.005 en el primer renglón con 14
grados de libertad y se obtiene un valor de t = 2.977, pero como el
valor de α está en el extremo izquierdo de la curva entonces la
respuesta es t = -2.977 por lo tanto:
60. Cómo encontrar la probabilidad para un valor de t dado,
usando excel?
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se
selecciona de una distribución normal. Si se busca en la tabla el valor de t =1.761 con 14
grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la
izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de
0.005, que equivale a α.
Luego se busca el valor de 0.005 en el primer renglón con 14
grados de libertad y se obtiene un valor de t = 2.977, pero como el
valor de α está en el extremo izquierdo de la curva entonces la
respuesta es t = -2.977 por lo tanto:
P(k < t < -1.761) = 0.045
P(t < -1.761) – P (k < t) = 0.045
0.05 - 0.045 = P(k < t)
0.005 = P(k < t)
0.005 = P(k < -2.98)
61. Cómo encontrar la probabilidad con un valor de t
dado usando excel?
Cual es la probabilidad acumulada de una Distribución t de Student de 9 grados
de libertad, de que x < 0,25:
P (t9 ≤ 0.25) = 0.596
Cual es la probabilidad acumulada a la derecha de 2,45, en una variable t de
Student de 15 grados de libertad:
P (t15 ≥ 2.45) = 1 - P (t15 ≤ 2.45)
= 1 – 0.9865
= 0.0135
62. Cómo encontrar el valor t en la Tabla con
probabilidades dadas?
El valor t con v = 14 grados de libertad que deja un área de 0.025 a la izquierda y,
por lo tanto, un área de 0.975 a la derecha, es
t 0.975 = −t0.025 = −2.145
64. Distribución Chi - Cuadrada
En realidad la distribución ji-cuadrada es la distribución muestral de la varianza muestral (s2). O
sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se
le calcula su varianza, se obtendrá la distribución muestral de varianzas. Entre sus propiedades:
1. Asimétrica y asintótica al eje x por la derecha;
2. Su dominio va de 0 a +∞ y el área bajo la curva desde 0 a +∞=1
3. Tiene parámetro ᴠ,= n-1, grados de libertad (gl)
4. Al aumentar n se aproxima a la normal
Entre sus aplicaciones:
Determinación intervalos confianza para
varianzas
Pruebas de hipótesis para una varianza
Tablas de contingencia
El ajuste de datos a una distribución
dada conocida (Prueba de Bondad de
ajuste)
Pruebas de independencia.
Pruebas de homogeneidad
66. Ejemplo de cómo utilizar la Distribución Chi – Cuadrada. Buscar la
probabilidad dado un valor de la función
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus
destinos en una ciudad grande forman una distribución normal con una desviación
estándar σ = 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral (s) sea mayor que 2.
P(s2>2) = 1- P(s2<2)
= 1- 0.99
= 0.01
67. Ejemplo de cómo utilizar la Distribución Chi – Cuadrada. Buscar un valor de la
función dada una probabilidad
La variable aleatoria U sigue una
distribución Chi-cuadrado. Calcular
"a":
P(U>a) = 0.05, para 18 grados de
libertad.
P(U>a) = 1 - 0.05 = 0.95;
en este caso a = 28.9
P(U>a) = 0.05, para 55 grados
de libertad.
P(U>a) = 1 - 0.05 = 0.95;
en este caso a = 73.3
68. Distribución F de Fisher
Usada en teoría de probabilidad y estadística, la distribución F es una distribución de
probabilidad continua. También se le conoce como distribución F de Snedecor (por George
Snedecor) o como distribución F de Fisher-Snedecor (por Ronald Fisher). Surge de la
necesidad de disponer de métodos estadísticos para comparar las varianzas de dos
poblaciones evidentes a partir del análisis de una sola población. Frecuentemente se desea
comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un
proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para
calificar de un profesor universitario con la de otro.
Su tabla es compleja porque depende de dos
parámetros, esto complica su diseño. Se
acostumbran, pues, a publicar tantas tablas
como niveles de significación interese
Sus características son:
•La forma gráfica de la F depende de los
grados de libertad que tenga
•No es simétrica, sino que es asimétrica
positiva
•Toda la gráfica es el Total
Toma valores positivos
Propiedad reciproca. Relaciona la distribución
Fgl1, gl2 con Fgl2, gl1
70. Ejemplos de cómo buscar valores de F, usando Excel. Buscar la
probabilidad dado un valor de la función
Buscar P (F ≥ 1.97), con v1 = 15 y v2 = 15
P (F ≥ 1.97) = 1 - P (F ≤ 1.97)
= 1 – 0.8996
= 0.1004
Buscar P (F ≤ 3.52), con v1 = 15 y v2 = 15
P (F ≤ 3.52) = 0.99
71. Ejemplos de cómo buscar valores de F, usando Excel. Buscar un
valor de la función dada una probabilidad
Encuentra el valor de F, si el área a la
derecha de F, es de 0.25 con gl1= 4 y
gl2= 9
P (F > f) = 1 - P (F < f)
= 1 - 0.25 = 0.75
Encuentra el valor de F, si el área a
la izquierda de F, es de 0.95 con
gl1= 15 y gl2= 10