Estadistica y probabilidades cap VII

VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE
PROBABILIDAD

VARIABLE ALEATORIA
Una variable aleatoria se define asignando un valor
numérico a cada suceso simple de un experimento
que conduzca a resultados aleatorios.
VARIABLES
ALEATORIAS
DISCRETAS
VARIABLES
ALEATORIAS
CONTINUAS
Una variable aleatoria
discreta es una variable que
puede tomar solo valores de
un conjunto predeterminado
Una variable aleatoria continua
se mide en una escala numérica.
Cada observación de la variable
aleatoria puede tomar cualquier
valor dentro de un rango específico

Las distribuciones de probabilidad son idealizaciones de los polígonos
de frecuencias.
Las DP de variable continua se definen mediante una función y=f(x)
llamada función de probabilidad o función de densidad.
La probabilidad viene dada por el área bajo la curva, por lo que:
•El área encerrada bajo la totalidad de la curva es 1.
•Para obtener la probabilidad P(a≤X≤b) obtenemos la proporción de
área que hay bajo la curva desde a hasta b.
•La probabilidad de sucesos puntuales es 0, P(X=a)=0
Distribución de Probabilidad

Empleados
ausentes
por día, x
Numero
de días,
ni
Probabilid
ad, P(x)
1
2
3
4
5
6
7
8
18
25
39
46
27
25
22
10
0.085
0.118
0.184
0.217
0.127
0.118
0.104
0.047
212 1.000
Ejemplo
1 2 3 4 5 6 7 8
Número de días, x
P(x)

Parámetros en una distribución de probabilidad
Por analogía con las variables estadísticas podemos definir también
aquí la media µ y la desviación típica σ de la variable aleatoria.
•La media µ, también llamada
esperanza matemática, es un
valor representativo de todos
los valores que toma la
variable aleatoria X, lo
podemos imaginar como el
punto sobre el eje de abscisas
donde al poner una cuña la
figura plana definida por la
función de densidad quedará
en equilibrio. Para calcularla
hemos de hacer:
•La desviación típica σ es una
medida de la dispersión de los
valores que toma la variable
aleatoria de la media. Como
ocurría con las variables
estadísticas la desviación típica
será más pequeña o más
grande según la gráfica de la
función de densidad sea más
estrecha o más ancha en torno
a la media. En este caso se
calcula:

Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales
En este caso vemos que la distribución de p(x) obtenida es simétrica.
Para el caso de 1 solo dado, donde todos los valores tienen la misma
probabilidad de salir (1/6), obtendríamos una
distribución uniforme

Supongamos que un experimento aleatorio tiene las siguientes
características:
•En cada prueba del experimento sólo son posibles dos
resultados: el suceso A (éxito) y su contrario A’ (fracaso).
•El resultado obtenido en cada prueba es independiente de los
resultados obtenidos anteriormente.
•La probabilidad del suceso A es constante, la representamos
por p, y no varía de una prueba a otra. La probabilidad de A’
es 1- p y la representamos por q .
El experimento consta de un número n de pruebas.
Distribución Binomial
Todo experimento que tenga estas características diremos que sigue
el modelo de la distribución Binomial. A la variable X que expresa
el número de éxitos obtenidos en cada prueba del experimento, la
llamaremos variable aleatoria binomial.

Función de probabilidad de la distribución Binomial
o también denominada función de la distribución de Bernoulli (para n=1).
Verificándose: 0 ≤ p ≤ 1
La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores
0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.
Como hay que considerar todas las maneras posibles de obtener k-éxitos y (n-k)
fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre
k).
Se suele representar por B(n,p) siendo n y p los parámetros de dicha distribución.
Probabilidad de obtener K éxitos
qp
knk
k
n
kXp
−
••





== )(

Parámetros de la Distribución Binomial
Función de Distribución de la variable aleatoria Binomial
Esta función de distribución proporciona, para cada número real xi, la probabilidad
de que la variable X tome valores menores o iguales que xi.
Siendo K el mayor número entero menor o igual a xi
qpqpqp
knknn
k
nnn
xXpxF
−−
••





++••





+••





=≤= ....
10
)()(
110
11

Resumen Distribución Binomial
Sea X una variable aleatoria discreta correspondiente a una distribución binomial.
xnx
xnx
qp
xxn
n
pnxP
pp
xxn
n
pnxP
−
−
−
=
−
−
=
!)!(
!
),;(
)1(
!)!(
!
),;(

Ejemplo
La probabilidad de éxito de una determinada vacuna es 0.72.
Calcula la probabilidad de a que una vez administrada a 15
pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solución :
Se trata de una distribución binomial de parámetros B(15, 0.72)

Distribución de Poisson
Esta distribución aparece en algunos procesos que tienen una dimensión
temporal o espacial, y en fenomenos que tienen un alto número de
experimentos (alto n) y una baja probabilidad de que ocurran (baja p).
Ejemplos:
• número de llamadas telefónicas que recibe un servicio de atención a
urgencias durante un intervalo de tiempo determinado
•número de cultivos infectados por una plaga en una cierta región
geográfica
La función de probabilidad de una variable aleatoria de Poisson con
media λ > 0, que simplificamos con la notación P(λ), es
siendo su función de distribución el sumatorio de cada uno de los
valores menores.
La media y varianza de X son ambas iguales a λ,
E[X] = V[X] = λ.

Ejemplo
El número de enfermos que solicitan atención de urgencia en un
hospital durante un periodo de 24 horas tiene una media de m =
43.2 pacientes. Unas obras en las instalaciones mermarán las
capacidades de atención del servicio, el cual se sabe que colapsará
si el número de enfermos excede de 50. ¿Cual es la probabilidad
de que colapse el servicio de urgencias del hospital?
Bajo las condiciones del modelo de Poisson, se trata de una
distribución P(43.2). La probabilidad solicitada es
P(X > 50) = 1 – P(X <= 50) = 1 - F(50) = 0.13.
El responsable del servicio deberá valorar si esta probabilidad es lo
suficientemente alta como para reforzar la atención de urgencias
con más efectivos, materiales, espacios, etc.

Ejemplo
Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000.
Calcular la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3
personas con dicha enfermedad.
Calcular el número esperado de habitantes que la padecen.
Consideramos la v.a. X que contabiliza el número de personas que padecen la
enfermedad, es claro que sigue un modelo binomial, pero que puede ser muy bien
aproximado por un modelo de Poisson, de modo que
Así el número esperado de personas que padecen la enfermedad es
Existe una gran dispersión, y no sería extraño encontrar que en realidad hay muchas más
personas o menos que están enfermas. La probabilidad de que haya más de tres personas
enfermas es:

DISTRIBUCIÓN HIPERGEOMÉTRICA
• Está estrechamente relacionada con la distribución de
probabilidad binomial. La diferencia entre ambas está
en la independencia de los intentos y en que la
probabilidad de éxito cambia de uno a otro
• Se usa para calcular la probabilidad de que una
muestra aleatoria de n artículos seleccionados sin
reemplazo, obtengamos x elementos identificados
como éxitos, y n-x como fracasos. Para que suceda
esto debemos obtener x éxitos de los r de la
población, y n-x fracasos de los N-r de la población

CARACTERISTICAS:
1. En cada prueba solo hay dos resultados éxitos y
fracasos.
2. Las probabilidades asociadas a cada uno de los
resultados no son constantes.
3. Cada ensayo o repetición del experimento no es
independiente de los demás.
4. El número de repeticiones del experimento (n) es
constante.
5. La población es finita
N
r
nxE =)(
)
1
)(1(2
−
−
−=
N
nN
N
r
N
r
nσ
1.
.
2.

0 x r≤ ≤
( )( )
( )N
n
r
x
rN
xn
xP
−
−
=)(
Donde N= tamaño de la población
n = tamaño de la muestra
r = numero de éxitos en un población
x = numero de éxitos en una muestra para los cuales
se desea la probabilidad

1. Un círculo de calidad esta formado por 5
miembros, 3 mujeres y 2 varones; se debe elegir
2 miembros del círculo para ser capacitados.
¿Cuál es la probabilidad de elegir 2 mujeres al
azar?
• Solución
N=5, n=2, r=3 mujeres en la población
x=2 mujeres en la muestra
Ejemplos.
( )( )
( )
( )( )
( ) 10
3
)( 5
2
3
2
2
0
===
−
−
N
n
r
x
rN
xn
xP

2. En cierta clínica hay 20 pacientes de los cuales se sabe
que el 25% tienen cáncer. Se extrae aleatoriamente sin
reemplazo 4 pacientes para el despistaje de cáncer
a) ¿Cuál es la probabilidad de que al menos uno tenga
cáncer?
b) ¿Cuál es el número esperado de pacientes con cáncer?
3. Un jurado de 7 jueces va a decidir entre dos finalistas
quién es la ganadora del concurso de belleza, para lo cual
bastará una mayoría simple de los jueces. Suponga que 4
jueces votan por María y que los otros 3 votan por Susana.
Se eligen al azar 3 jueces y se les pregunta por quién van a
votar. ¿Cuál es la probabilidad de que la mayoría de los
jueces de la muestra estén a favor de María?

La distribución Normal o de Gauss es el modelo
probabilístico más importante. Se utiliza para
modelar gran número de fenómenos aleatorios,
entre ellos el ruido y los errores en la medida.
Aparece además como distribución límite en el
Teorema Central del Límite. Sus parámetros son
la media μ y la desviación típica σ ,
X ~ N(μ,σ)
DISTRIBUCIÓN NORMAL

• Está caracterizada por dos parámetros: la media, μ y
la desviación típica, σ.
• Su función de densidad es:
0)(σ
π2σ
1
)(σ)μ,(
2
2
σ2
μ)(
>==
−
−
x
exPN
La curva normal adopta un número infinito de formas,
determinadas por sus parámetros μ y σ.

− ∞ + ∞
Características de la distribución Normal
µ, Mo, Mn
σ σ
µ - σ µ + σ
• Tiene forma de campana, es asintótica al eje de las abscisas
(para x = ±∞ )
• Los puntos de inflexión tienen como abscisas los valores µ ±
σ
• Simétrica con respecto a la media (µ) donde coinciden la mediana
(Me) y la moda (Mo )
Puntos
de
inflexión

Distribución normal con µ=0 para varios valores σ
0
0.4
0.8
1.2
1.6
-2.50 -1.50 -0.50 0.50 1.50 2.50
x
σ=0.25
σ=0.5
σ=1
p(x)

20 30 40 50 60 70 80 90 100 110 120
σ = 5 σ = 5
10=σ
Curvas normales con distintas medias y desviaciones estándar.
0)(σ
π2σ
1
)(σ)μ,(
2
2
σ2
μ)(
>==
−
−
x
exPN

N(μ, σ): Interpretación probabilista
• Entre la media y una
desviación típica
tenemos siempre la
misma probabilidad:
aproximadamente el
68%.
•Si tomamos intervalos centrados en μ, y cuyos extremos están…
–a distancia σ,  tenemos probabilidad 68%
–a distancia 2 σ,  tenemos probabilidad 95%
–a distancia 2’5 σ  tenemos probabilidad 99%
• Entre la media y dos
desviaciones típicas
aprox. 95%

Podemos obtener la función de
distribución F(x) integrando la
función de densidad de probabilidad:
π2σ
1
)(
2
2
σ2
μ)(
dvexF
x v
∫∞−
−
−
=
De modo que la probabilidad de una
variable aleatoria normal X en un
intervalo a ≤ x ≤ b es:
π2σ
1
)()()(
2
2
σ2
μ)(
dveaFbFbXaP
b
a
v
∫
−
−
=−=≤≤
¡No podemos calcular analíticamente el valor de la integral!
Tabularemos sus valores numéricos...
2
2
σ2
μ)(
π2σ
1
)(σ)μ,(
−
−
==
x
exPN
1
π2σ
1 2
2
σ2
μ)(
=∫
∞
∞−
−
−
dve
v
En particular:

¿Cómo calcular probabilidades asociadas¿Cómo calcular probabilidades asociadas
a una curva normal específica?a una curva normal específica?
Dado que tanto µ como σ pueden asumir infinitos valores lo
que hace impracticable tabular las probabilidades para todas las
posibles distribuciones normales, se utiliza la distribución
normal reducida o tipificada.
Se define una variable z =
xx -- µµ
σσ
Es una traslación , y un cambio de escala de
la variable original.

La nueva variable z se distribuye como una
NORMAL con media µ = 0 y desviación típica σ = 1
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3
zz
68%95%99%
Recordemos de nuevo que en cualquier distribución normal las
probabilidades delimitadas entre :
± σ = 68 %
± 2σ = 95 %
± 3σ = 99 %
68%
99%
95%

Tipificación
• Dada una variable de media μ y desviación típica
σ, se denomina valor tipificado z, de una
observación x, a la distancia (con signo) con
respecto a la media, medido en desviaciones
típicas, es decir:
σ
µ−
=
x
z
• En el caso de variable X normal, la interpretación es clara:
asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja
exáctamente la misma probabilidad por debajo.
• Nos permite así comparar entre dos valores de dos
distribuciones normales diferentes, para saber cuál de los
dos es más extremo.

Se quiere dar una beca a uno de dos estudiantes de sistemas
educativos diferentes y se asignará al que tenga mejor
expediente académico:
– El estudiante A tiene una calificación de 8 en un sistema
donde la calificación de los alumnos se comporta como
N(6,1).
– El estudiante B tiene una calificación de 80 en un sistema
donde la calificación de los alumnos se comporta como
N(70,10).
1
10
7080
2
1
68
=
−
=
−
=
=
−
=
−
=
B
x
z
x
z
BB
B
A
AA
A
σ
µ
σ
µ
–No podemos comparar directamente 8
puntos de A frente a los 80 de B, pero
como ambas poblaciones se comportan
de modo normal, podemos tipificar y
observar las puntuaciones sobre una
distribución de referencia N(0,1).
–Como zA > zB, podemos decir que el
porcentaje de compañeros del mismo
sistema de estudios que ha superado
en calificación al estudiante A es mayor
que el que ha superado B. En principio
A es mejor candidato para la beca.

duezZpzF
zezp
∫∞−
−
−
=≤=
∞<<∞−=
z
2
u
2
z
2
2
π2
1
)()(
;
π2
1
)(
Característica de la distribución
normal tipificada (reducida o
estándar):
No depende de ningún parámetro.
Su media es 0, su varianza es 1 y su
desviación típica es 1.
La curva f(x) es simétrica respecto al
eje de ordenadas y tiene un máximo
en este eje.
Tiene dos puntos de inflexión en z =1
y z = -1.

Hay varios tipos de tablas de la distribución normal
La que se explica aquí representa las áreas para los
diferentes valores de z desde 0 hasta +∞.
00
+∞
Los valoresLos valores
negativos de znegativos de z NONO
están tabulados, yaestán tabulados, ya
que la distribuciónque la distribución
es simétricaes simétrica

0.00.0
0.10.1
0.20.2
0.30.3
0.40.4
0.50.5
0.00.0
0.10.1
0.20.2
0.30.3
0.40.4
0.50.5
0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9
.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
.0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754
.0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......
.1179 ..... ...... ...... ......
.1554 .... ..... ....
.1915 ....
La tabla consta de:La tabla consta de: *Margen izquierdo : Los enteros de z y
su primer decimal.
** Margen superior: segundo decimal
** Cuerpo de la tabla: áreas correspondientes,
acumuladas, desde 0
hasta 3.99

EJEMPLOS:EJEMPLOS:
1.-¿Cuál es la probabilidad de que un
valor de z esté entre 0 y -2.03?
2.-¿Cuál es la probabilidad de que un
valor de z esté entre -2.03 y +2.03?
3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z <∞ )
5. Hallar P ( 0.34 < z < 2.30 )

?
Ejemplo 1
¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?
zz
Cómo la curva es simétrica
P (-2.03 < z < 0) = P (0 < z <
2.03)
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

0 1 2 3 4
1.8
1.9
2.0
2.1
47. 88%
Ejemplo 1
¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3
zz
Se busca en la tabla el área correspondiente a z = 2.03
0.47882

?
47.88%47.88%
Ejemplo 2
¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3
zz
En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0
y 2.03= 0.47882
La misma área hay entre 0 y
-2.03 , por lo tanto
P ( -2.03< z< 2.03) = 0.95764
95.76%

Ejemplo 3
¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?
zz
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3
??
1.- La probabilidad de 0 < z < +∞ = 0.500
2.- La probabilidad de 0 < z < 1.25 = 0.39435
39.44%
3.- La probabilidad de z > 1.25 =
0.500 - 0.39435= 0.10565
10.56%
50%50%

Hallar P( -0.34 < z <Hallar P( -0.34 < z < ∞∞ ))
zz
P(0 < z <0.34) = 0.13307 =
P(-0.34 < z < 0)
13.31% 50%
63.31%
P( -0.34 < z < ∞) =
0.13307 + 0.50000 = 0.63307
-3 -2 -1 0 1 2-3 -2 -1 0 1 2
33
Ejemplo 4
P (0 < z < ∞ ) = 0.50000

Ejemplo 5
Hallar P( 0.34 < z < 2.30)Hallar P( 0.34 < z < 2.30)
zz
-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3
P(0< z <0.34) = 0.13307
P( 0 < z < 2.30) = 0.4893
P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623
35.62%

EJEMPLOEJEMPLO
Sea una variable distribuida normalmente con media
µ = 4 y desviación típica σ = 1.5.
¿Cuál es la probabilidad de encontrar un valor x ≥ 6
(P(x ≥ 6 ))?

x
µ = 4 σ = 1.5 Hallar P ( x > 6 )
?
6
1.-1.- transformar x en un valor de z
0.40824
0.09176
z = (6 - 4)/1.5 = 1.33
2.- Hallar P ( 0 < z < 1.33) ==
3.- 0.5000 - 0.40824 =
σ
μx
z
−
=
0.5
-0.5 1 2.5 4 5.5 7 8.5-0.5 1 2.5 4 5.5 7 8.5
-3 -2 -1 0 1 1.33 2 3 z

Hasta ahora vimos como dado un valor x de la variable,
hallar probabilidades transformando (estandarización) la
variable en valores de x - µ
σ
¿Cómo hallar un valor de x, dada la probabilidad?
x = ?
38.20%
Ejemplo: Sea una variable distribuida normalmente con µ =4 yy
σ =2 . Hallar el valor de x que deja por encima de él un 38.20%
(0.3820)
Se debe desestandarizar ::
xx = z= z σ + µ
0.5000 - 0.382 = 0.118  Se busca en
la tabla el valor más aproximado :0.1179
corresponde a z =+ 0.30
4.60
Se busca en la tabla
de acuerdo al área.
Con su signo
Sustituyendo en la fórmula
0.30x2+4 =4.60
z =

Estadistica y probabilidades cap VII

Estadistica y probabilidades cap VII

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Estadistica y probabilidades cap VII

Similar a Estadistica y probabilidades cap VII (20)

Más de Richard Huaman Durand

Más de Richard Huaman Durand (20)

Último

Último (20)

Estadistica y probabilidades cap VII

Notas del editor