Tema 5.- BASES DE DATOS Y GESTIÓN DE LA INF. PARA EL MARKETING.pdf
Doc. Probabilidad.
1. UNIVAD IV: PROBABILIDAD
4.1. DEFINICIONES BÁSICAS EN PROBABILIDAD
Experimento: Todo proceso que produce un resultado u observación.
Ejemplo:
ξ1: Lanzar un Dado y observar el número que queda arriba.
ξ2: Lanzar al aire una moneda y anotar el resultado.
Resultado: Consecuencia de un experimento.
Ejemplo, Para ξ1 Se puede tener el resultado 6, 2, 5, etc.
Experimento Aleatorio: Es aquel que proporciona diferentes resultados aun
cuando se repita siempre de la misma manera.
Los anteriores experimentos son aleatorios
Espacio Muestral: Conjunto de resultados posibles de un experimento.
Ejemplo:
Para ξ1 tenemos S1 = {1, 2, 3, 4, 5, 6 }
Para ξ2 tenemos S2 = {C, N}
Evento: Cualquier subconjunto del espacio muestral.
Ejemplo:
A: Al lanzar un dado el número que aparece es impar.
A = {1, 3, 5 }
Espacio Muestral Discreto: Es el espacio muestral formado por un conjunto
finito (o infinito contable) de resultados.
4.2. DEFINICIÓN DE PROBABILIDAD
Definición 1: Cada vez que un espacio muestral esté formado por N posibles
resultados igualmente probables, la probabilidad de cada uno de ellos será
1/N.
Definición 2: Para un evento muestral discreto, la probabilidad de un evento E,
se denota por P(E), es igual a la suma de las probabilidades de los resultados
en E.
posiblesCasos
favorablesCasos
Sn
En
EP ==
)(
)(
)(
2. Axiomas de Probabilidad.
La probabilidad es un número que se asigna a cada miembro de una colección
de Eventos de un experimento aleatorio y que satisface las siguientes
propiedades:
1. P(S) = 1, S es el Espacio Muestral.
2. P(∅) = 0
3. 0≤ P(E) ≤ 1, E es un evento Cualquiera.
4. Para dos eventos E1 y E2 con E1 ∩ E2 = ∅, se tiene
P(E1 ∪ E2)= P(E1)+ P(E2)
5. Si
n
i
iES
1=
= , donde Ei ∩ Ej = ∅ para i≠j, entonces ( ) ( )∑=
=
n
i
iEPSP
1
.
4.3. EVENTOS MUTUAMENTE EXCLUYENTES
Definición: Dos eventos son mutuamente excluyentes si no pueden ocurrir
simultáneamente. Es decir, si la ocurrencia de uno imposibilita la ocurrencia
de los demás, en este caso A ∩ B = ∅.
Así la P(A ∪ B) = P(A) + P(B)
Gráficamente lo podemos ver en el siguiente diagrama
Ejemplo:
Consideremos el siguiente experimento ξ: Se escoge un paciente de una
clínica
S = {pacientes 1, 2, 3, 4, 5, 6, 7, 8, 9 } y los eventos A = {pacientes 1, 3, 6,
9}, B = {pacientes 2, 4, 6, 8 }
A ∪ B ={1, 2, 3, 4, 6, 8, 9 }
A ∩ B = { 6}
P(A ∪ B)= 7/9; P(A) = 4/9; P(B) = 4/9; P( A ∩ B) = 1/9
3. P(A)+ P(B) = 4/9 + 4/9 = 8/9 ≠ P(A ∪ B)= 7/9, pero lo que si es cierto es que
7/9 = 4/9 + 4/9 - 1/9, ó lo que es lo mismo P(A ∪ B)= P(A)+ P(B) – P( A ∩ B)
En general cuando los eventos no son mutuamente excluyentes tenemos
P(A ∪ B) = P(A)+ P(B) – P( A ∩ B)
Para tres eventos tenemos:
P(A∪B∪C)= P(A)+ P(B) + P(C) –P( A∩B) – P( A∩C) – P( B∩C) + P(A∩B ∩
C)
4.4. EVENTOS INDEPENDIENTES
Definición: Dos eventos A y B Son independientes si la ocurrencia de uno (o la
no ocurrencia) no afecta la probabilidad asignada a la ocurrencia del otro.
y se define como ( ) )()( BPAPBAP =∩
Ejemplo:
Consideremos el siguiente experimento
ξ: Se lanza un dado y lego se lanza una moneda y se anotan los resultados.
Encontrar la probabilidad de que el dado caiga par y la moneda caiga cara.
Solución:
Para encontrar el espacio muestral, utilicemos el siguiente diagrama de arbol.
Diagrama de Árbol,
Dado Moneda Resultado
C 1, C
1
N 1, N
C 2, C
2
N 2, N
C 3, C
3
N 3, N
C 4, C
4
N 4, N
C 5, C
5
N 5, N
C 6, C
6
N 6, N
Luego tenemos
S={(1,C), (2,C), (3,C), (4,C), (5,C), (6,C), (1,N), (2,N), (3,N), (4,N), (5,N), (6,N)}
4. Y sean los eventos A: El dado cae par y B: la moneda cae cara.
A ∩ B: el dado caiga par y la moneda caiga cara
A ∩ B = {(2,C), (4,C), (6,C)}
P( A ∩ B) = 3/12 = ¼ = 0.25
Pero P( A ) = 3/6 = ½ = 0.5 y P( B) = ½ = 0.5
Así P( A ) P( B) = (½)(½ ) = ¼ =0.25 = P( A ∩ B)
Lo cual demuestra que son independientes los eventos.
4.5. PROBABILIDAD CONDICIONAL
El Símbolo ( )B
AP representa la probabilidad de que ocurra A dado que ya
ocurrió B, y se define como: ( ) )(
)(
BP
BAP
B
AP
∩
=
O escrito de otra manera tenemos: ( ) )()( BAP
B
APBP ∩=
Así, cuando A y B son evento independientes, tenemos
( ) )(
)(
)()(
)(
)(
AP
BP
BPAP
BP
BAP
B
AP ==
∩
=
Y Así, ( ) )(BP
A
BP =
Ejemplo:
Consideremos el siguiente experimento
ξ: Se extraen dos bolas una por una y sin reemplazo de una caja donde hay 6
bolas negras y 4 rojas. Encontrar la probabilidad de que:
a) Las dos bolas sean negras
b) La primera bola sea negra y la segunda bola sea roja.
Solución
Sean los eventos
A1: la primera bola es negra
A2: la segunda bola es negra
B2: la segunda bola es roja
Para a) tenemos:
P(A1∩ A2) = P(A1) P(A2 /A1)= (5/10) ( 5/9) = 5/18
5. Para b) tenemos:
P(A1∩ B2) = P(A1) P(B2 /A1) = (5/10) (4/9) = 2/9
4.6. TEOREMA DE BAYES
Sea A1, A2,. . ., An ⊂ S un sistema exhaustivo y excluyente de Eventos.
Es decir
n
i
iAS
1=
= , Ei ∩ Ej = ∅ para i≠j. y Sea B ⊂ S un evento del que
conocemos todas las cantidades
iA
BP , i = 1,. . . ., n, a las que
denominamos verosimilitudes. Entonces se verifica:
)()(
1
i
n
i i
AP
A
BPBP ∑=
=
Y así podemos encontrar
)(
)(
)(
1
i
n
i i
i
kk
AP
A
BP
AP
A
BP
B
A
P
∑=
=
Ejemplo: Se tienen tres urnas. Cada una de ellas contiene un número diferente
de bolas blancas y rojas:
Primera urna, A1: 3 bolas blancas y 2 rojas;
Segunda urna, A2: 4 bolas blancas y 2 rojas;
Tercera urna, A3: 3 bolas rojas.
Se realiza el siguiente experimento aleatorio
ξ: Alguien elije al azar y con la misma probabilidad una de las tres urnas, y
saca una bola.
Si el resultado del experimento es que ha salido una bola blanca, ¿cuál es la
probabilidad de que provenga de la primera urna? Calcular lo mismo para las
otras dos urnas.
Solución:
Sea B: que se saque una bola Blanca.
6.
1A
BP es la probabilidad de sacar una bola blanca dado que se eligió la
primera urna, Así
1A
BP = 3/5.
2A
BP es la probabilidad de sacar una bola blanca dado que se eligió la
segunda urna, Así
2A
BP = 4/6 = 2/3
3A
BP es la probabilidad de sacar una bola blanca dado que se eligió la
tercera urna, Así
3A
BP = 0/3 = 0
Para hacerlo de la una mejor manera hagamos el siguiente cuadro:
AI P(Ai)
iA
BP )()( BAP
A
BPAP i
i
i ∩=
Urna 1 1/3 3/5 (1/3)(3/5) = 1/5
Urna 2 1/3 2/3 (1/3)(2/3) = 2/9
Urna 3 1/3 0 (1/3)(0) = 0
Suma 1 1/5+2/9 = 19/45
Ahora, ya podemos resolver
)(
)(
)(
3
1
1
11
i
i i
AP
A
BP
AP
A
BP
B
A
P
∑=
= =
19
9
)19(5
)45(1
45
19
5
1
==
)(
)(
)(
3
1
2
22
i
i i
AP
A
BP
AP
A
BP
B
AP
∑=
= =
19
10
)19(9
)45(2
45
19
9
2
==
)(
)(
)(
1
3
33
i
n
i i
AP
A
BP
AP
A
BP
B
A
P
∑=
= =
0
45
19
0
=
Comentario sobre el teorema de Bayes
7. Obsérvese que en el ejemplo anterior, antes de realizar el experimento
aleatorio de extraer una bola para ver su resultado, teníamos que la
probabilidad de elegir una urna cualquiera es P(Ai). Estas probabilidades se
denominan probabilidades a priori. Sin embargo, después de realizar el
experimento, y observar que el resultado del mismo ha sido la extracción de
una bola blanca, las probabilidades de cada urna han cambiado a )(
B
A
P i .
Estas cantidades se denominan probabilidades a posteriori. Vamos a
representar en una tabla la diferencia entre ambas:
A priori A posteriori
( )
3
1
1 =AP
19
9
)( 1 =
B
AP
( )
3
1
2 =AP
19
10
)( 2 =
B
A
P
( )
3
1
3 =AP 0)( 3 =
B
A
P
Las probabilidades a priori cambian de tal modo de las a posteriori que una vez
observado el resultado del experimento aleatorio, se puede afirmar con certeza
que no fue elegida la tercera urna.
Tests diagnósticos
Los tests diagnósticos son una aplicación del teorema de Bayes a la Medicina,
y se basan en lo siguiente:
1. Se sospecha que un paciente puede padecer cierta enfermedad, que tiene
una incidencia de la enfermedad en la población (probabilidad de que la
enfermedad la padezca una persona elegida al azar) de P[E];
2. Como ayuda al diagnóstico de la enfermedad, se le hace pasar una serie de
pruebas (tests), que dan como resultado:
• Positivo, T+
, si la evidencia a favor de que el paciente esté enfermo es
alta en función de estas pruebas;
• Negativo, T−
, en caso contrario.
Previamente, sobre el test diagnóstico a utilizar, han debido ser estimadas las
cantidades:
Sensibilidad: Es la probabilidad de que el test de positivo sobre una persona
que sabemos que padece la enfermedad, P(T+
/ E).
8. Especificidad: Es la probabilidad que el test de negativo sobre una persona
que no la padece, P(T−
/Ec
).
Lo que interesa saber en la práctica es, predecir si una persona está sana o
enferma, a partir del resultado del test diagnóstico, es decir, las cantidades:
Índice predictivo positivo: Es la probabilidad de que un individuo esté
enfermo si el test dió resultado positivo, P(E /T+
).
Índice predictivo Negativo: Es la probabilidad de que un individuo esté sano
si el test dió resultado negativo, P (Ec
/ T−
).
La sensibilidad y especificidad se denominan también respectivamente tasa de
verdaderos positivos y tasa de verdaderos negativos.
Estas cantidades son calculadas de modo aproximado, antes de utilizar el test
diagnóstico, considerando grupos suficientemente numerosos de personas de
las que sabemos si padecen la enfermedad o no, y estimando los porcentajes
correspondientes. Típicamente esta labor es realizada por un laboratorio que
quiere probar la eficacia de un test diagnóstico. Los índices predictivos son
interesantes sobre todo para el clínico que efectivamente desea evaluar la
probabilidad de que un individuo esté o no enfermo, en función de los
resultados de las pruebas que se realizan sobre el mismo.
Ejemplo de cálculo en tests diagnósticos
Se toman 100 personas sanas y 100 enfermas, y se observa que
E EC
T+
89 3
T−
11 97
100 100
Tasa de verdaderos positivos: 89%
Tasa de falsos positivos: 3%
Tasa de verdaderos negativos: 97%
Tasa de falsos negativos: 11%
3. teniendo en cuenta el resultado del test diagnóstico, se utiliza el teorema de
Bayes para ver cual es, a la vista de los resultados obtenidos, la
probabilidad de que realmente esté enfermo si le dio positivo (índice
9. predictivo de verdaderos positivos),
( )
( ) ( )
( ) ( ) ( ) ( )C
C EP
E
TPEP
E
TP
EP
E
TP
T
EP ++
+
+
+
=
ó la de que esté sano si le dio negativo (índice predictivo de verdaderos
negativos): ( )
( ) ( )
( ) ( ) ( ) ( )EP
E
TPEP
E
TP
EP
E
TP
T
EP
C
C
C
C
C
−−
−
−
+
=
10. predictivo de verdaderos positivos),
( )
( ) ( )
( ) ( ) ( ) ( )C
C EP
E
TPEP
E
TP
EP
E
TP
T
EP ++
+
+
+
=
ó la de que esté sano si le dio negativo (índice predictivo de verdaderos
negativos): ( )
( ) ( )
( ) ( ) ( ) ( )EP
E
TPEP
E
TP
EP
E
TP
T
EP
C
C
C
C
C
−−
−
−
+
=