La variable aleatoria X representa el número de caras obtenidas al lanzar 3 monedas. Se define la función de probabilidad f(x) que asigna la probabilidad de cada valor posible de X. La función de distribución acumulada F(x) da la probabilidad de que X sea menor o igual a x. Para variables continuas, la probabilidad de un valor puntual es 0, pero se puede calcular la probabilidad de un intervalo como el área bajo la curva de la función de densidad entre los límites del intervalo. El valor esperado y la varianza proporcionan
Distribuciones de probabilidad discretas y variables aleatorias
1. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE
PROBABILIDAD
Introducción
Continuando con nuestro estudio de las probabilidades, nos vemos ahora abocados a la dificultad de
realizar operaciones numéricas con conjuntos, por consiguiente será posible crear una nueva
herramienta matemática que nos permita esto y ésta se hará mediante el enlace entre los conjuntos y
los sistemas numéricos a través de una función llamada variable aleatoria.
Normalmente, los resultados posibles (espacio muestral E) de un experimento aleatorio no son
valores numéricos. Por ejemplo, si el experimento consiste en lanzar de modo ordenado tres
monedas al aire, para observar el número de caras (C) y sellos (S) que se obtienen, espacio muestral
asociado a dicho experimento aleatorio sería:
E = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS }
En estadística resulta más fácil utilizar valores numéricos en lugar de trabajar directamente con los
elementos de un espacio muestral como el anterior. Así preferimos identificar los eventos {CSS,
SCS, SSC} con el valor numérico 1 que representa el número total de caras obtenidas en dicho
evento al realizar el experimento. De este modo aparece el concepto de variable aleatoria
unidimensional como el de toda función
X :E →ℜ
e → X (e ) = x e
Es decir, se puede decir que una variable aleatoria es una función (o una relación de
correspondencia entre dos conjuntos) que asocia a cada eventos elemental de una espacio muestral,
un numero l que se atribuye un único número real xe, a cada eventos elemental e, del espacio
muestral E.
Para ejemplificar el concepto de función valdría pensar que un ejemplo claro de esta es como
cuando a un molino se le “aplica” maíz, lo cual éste transforma en masa. Se podría pensar que la
variable aleatoria “convierte” un eventos elemental se un espacio muestral E en un número real.
Por ejemplo, en el prototipo anterior, se define la variable aleatoria
X : número de caras obtenidas en tres lanzamientos de una moneda
De este modo:
X :E → ℜ
CCC → X (CCC ) = 3
2. X(CCS) = X(CSC) = X(SCC) = 2
X(CSS) = X(SCS) = X(SSC) = 1
X(SSS) = 0
Con lo que se formaría la siguiente tabla:
Variable Aleatoria
E P[Ei] X(Ei)=xe
CCC 0,125 3
CCS 0,125 2
CSC 0,125 2
SCC 0,125 2
SSC 0,125 1
SCS 0,125 1
CSS 0,125 1
SSS 0,125 0
Total 1,000
En función de los valores que tome la variable ya sea en los números para contar (Naturales N) o en
los números decimales (reales R), una variable aleatoria puede ser clasificada como aleatoria
discreta o continua del siguiente modo:
V. A. discreta
es aquella que sólo puede tomar un número finito o infinito numerable de valores (números
naturales).
V. A. continua
es la que puede tomar un número infinito no numerable de valores (números reales).
Observación
Si sobre los elementos de E existe una distribución de probabilidad, esta se transmite a los valores
que toma la variable X. Es decir, toda V.A. conserva la estructura probabilística del experimento
aleatorio que describe, en el sentido de que si P es la función de probabilidad definida sobre el
espacio muestral E, ésta induce otra función P* definida sobre el conjunto números Reales, de forma
que conserva los valores de las probabilidades (figura No 1):
P ∗ [ X = x 0 ] = P[{e ∈ E : X (e) = x 0 }]
Figura 1: Una V.A. transmite la estructura probabilística del
espacio muestral a ℜ.
3. E R
De ahora en adelante omitiremos el asterisco y no diferenciaremos entre las probabilidades
calculadas sobre el espacio muestral del experimento aleatorio original, E, y las calculadas sobre ℜ.
Vamos a estudiar los conceptos más importantes relacionados con la distribución de probabilidad de
una V .A., diferenciando entre los casos de v.a. discreta y v.a. continua.
Variables aleatorias discretas
Dada una v.a. discreta X : E → N, su función de probabilidad f, se define de modo que f(xi) es la
probabilidad de que X tome ese valor:
f : Ν → [0, 1]
x i → f ( x i ) = P[ X = x i ] = P[{e ∈ E : X (e) = x i }]
Si xi no es uno de los valores que puede tomar X, entonces f(xi) = 0. La representación gráfica de la
función de probabilidad se realiza mediante un histograma (diagrama de barras) análogo al de
distribución de frecuencias relativas para variables discretas. Por ejemplo, si retomamos el caso del
lanzamiento de 3 monedas de forma que cada una de ellas tenga probabilidad ½ de dar como
resultado cara o sello, se tiene que:
f(3) = P[X = 3] = P [{CCC}] = ½ × ½ × ½ = 1/8
f(2) = P[X = 2] = P [{SCC; CCS; CSC}] = 1/8 + 1/8 +1/8 = 3/8
f(1) = P[X = 1] = P [{SSC; SCS; CSS}] = 1/8 + 1/8 +1/8 = 3/8
f(0) = P[X = 0] = P [{SSS}] = ½ × ½ × ½ = 1/8
Figura No 2: Equivalencia entre las probabilidades calculadas directamente sobre el espacio
4. muestral E de resultados del experimento aleatorio, y las calculadas sobre el subconjunto {0, 1,
2, 3 } ⊂ N⊂ ℜ mediante la V.A. X.
⊂
Observación
Obsérvese que X está definido sobre el espacio muestral de eventos E, mientras que f lo está sobre
el espacio de números reales ℜ.
Las propiedades de la función de probabilidad de V.A. se deducen de forma inmediata de los
axiomas de probabilidad:
Proposición. Si x1 , x 2 , L , x k son todos los valores que puede tomar una variable aleatoria X,
entonces la suma de las probabilidades de todos los posibles valores de la variable es igual a 1; es
decir:
k k
∑ f ( x i ) = ∑ P[ X = x i ] = 1
i =1 i =1
Además las probabilidades son no negativas; es decir: f(xi) ≥ 0; para todo i : 1, 2, ..., k. Otro
concepto importante es el de función de densidad acumulada de una variable aleatoria discreta, F,
que se define de modo que si xi ∈ ℜ, F(xi) es igual a la probabilidad de que X tome un valor inferior
o igual a xi: simbólicamente sería:
F : N → [0, 1]
xi → F ( xi ) = P[ X ≤ xi ] = P[{ e ∈ E : X (e) ≤ xi }]
Esta función se representa gráficamente del mismo modo que la distribución de frecuencias
relativas acumuladas (figura No 3). Volviendo al ejemplo de las tres monedas, se tiene que
F(0)= P[X ≤ 0] = P [X = 0 ] = f (0) = 1/8
5. F(1)= P[X ≤ 1] = f (0) + f(1) = 1/8 + 3/8 = 4/8
F(2)= P[X ≤ 2] = f (0) + f(1) + f(2) = 1/8 + 3/8 + 3/8 = 7/8
F(3)= P[X ≤32] = f (0) + f(1) + f(2 + f(3) = 1/8 + 3/8 + 3/8 + 1/8 = 8/8 = 1
Hay que observar que a valores no admisibles por la variable les pueden corresponder valores de F
no nulos. Por ejemplo,
F( -1)= P[X ≤ -1] = P[∅] = 0
Figura No 3: Función de probabilidad a la izquierda, y función de distribución a la derecha de una v.a.
discreta
Funcion de densidad de probabilidad Funcion de densidad Acumulada
f(x) F(x)
1,00
0,90
0,40 0,80
0,35 0,70
F(x)
0,30 0,60
f(x)
0,25 0,50
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
-
-
0 1 2 3 0 1 2 3
X X
Es sencillo comprobar que las siguientes propiedades de la función de distribución son ciertas:
La función de distribución F, es una función no decreciente, es decir, si el valor de una
variable es menor que otro, también se cumplirá en las funciones de densidad. Por ejemplo,
sabemos que 2<5, luego F(2), será menor que F(5)
Además, es continua a la derecha. Esto indica que todo valor de la una variable aleatoria
por derecha de F, tomará el valor de dicha variable, es decir sabemos que 3,005 se acerca a
tres por la derecha, luego F(3,005) ≈ F(3)
y por ultimo F evaluada en una valor negativo muy pequeño (lo suficientemente alejado de
cero por la izquierda), la función evaluada en ese valor tendrá valor de cero. Por ejemplo
F(-15.005.620)) ≈ F(x) = 0
Además un valor de F, lo suficientemente grande se aproximará a 1, es decir por ejemplo: para el
valor de una variable que solo toma valores hasta 100 y F(1.000.000) = 1
6. Variables aleatorias continuas
Si una variable discreta toma los valores x1, ..., xk, en una proposición se afirma que las probabilidad
de que al hacer un experimento, X tome uno de esos valores es 1, de modo que cada posible valor xi
contribuye con una cantidad f(xi) al total:
k k
∑ f ( x ) = ∑ P[ X = x ] = 1
i =1
i
i =1
i
Aun cuando la variable tomase un número infinito ( ∞) de valores, x1, x2, ..., no hay ningún
problema en comprobar que cada xi contribuye con una cantidad f(xi) al total de modo que
∞ ∞
∑ f ( x ) = ∑ P[X = x ] = 1
i =1
i
i =1
i
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades de cada uno
de los términos en el sentido anterior, ya que el conjunto de valores que puede tomar la variable es
no numerable. En este caso, lo que generaliza de modo natural el concepto de suma ( Σ) es el de
integral ( ∫ ). Por otro lado, para variables continuas no tiene interés hablar de probabilidades
puntuales de que X = xi, ya que esta debe de valer siempre 0, para que la suma infinita no
numerable de las probabilidades de todos los valores de la variable no sea infinita.
Figura: Función de densidad f. La probabilidad de un intervalo,
es el área que existe entre la función y el eje de abscisas.
P[a<X<b]
Observación
Por ser f una función integrable, la probabilidad de un punto es nula (cero):
7. y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto o
cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad nula:
por
Figura: Función de distribución F, calculada a partir
de la función de densidad f.
Observación
Dado un intervalo de la forma ( a, b ], tenemos que
P[X ∈ (a, b]] = P[a < X ≤ b] = F (b) – F(a)
Es decir, la cantidad F(b) - F( representa el área de probabilidad extendida a lo largo de dicho
(a)
intervalo. Si dividimos esta cantidad por la longitud del intervalo,
Proposición
En distribuciones continuas la función de distribución F, es no decreciente
x1 ≤ x 2 ⇒ F ( x1 ) ≤ F ( x 2 )
Además, es una función absolutamente continua que verifica:
8. Valor Esperado y Varianza de una Variable Aleatoria
Como se explicó antes, una distribución de probabilidad de una variable aleatoria discreta es un
modelo matemático de las frecuencias relativas de una población, en consecuencia podemos
describir la variable y así hallar su media y su varianza.
Sea X una variable aleatoria con función de densidad de probabilidad f(x) entonces el valor
esperado ( media teórica de una variable aleatoria) de X es:
n
µ = E ( X ) = ∑ xi f ( xi )
i =1
Ejemplo: halle el valor esperado del número de caras de una moneda cuando se lanza dos veces.
Tenemos que:
x f(x)
0 0,25
1 0,50
2 0,25
E(x)=0×0,25+1×0,5+2×0,25=1
Esto indica que el valor esperado de cuando se lanza una moneda dos veces el de una cara en
promedio.
Varianza de una variable aleatoria
Sea X una variable aleatoria, entonces las varianza de X se define como:
n
σ 2 = Var ( X ) = ∑ ( xi − µ ) 2 f ( xi )
i =1
= E( X ) − µ
2 2
en el experimento del lanzamiento de las monedas, la varianza de X es:
σ2 = Var(X)= 02× 0,25 +12× 0,5 + 22× 0,25 – 1 = 0,5+1-1 = 0,5
es decir la varianza es de 0,5, la desviación estándar del número de caras seria entonces de :
σ = σ 2 = 0.707
9. Lo que indica que cada, cada resultado de los dos lanzamientos se desvía en promedio de la media
de 1, 0.707 caras.
Ejemplo: un ingeniero meteorólogo estudia planes de evacuación de emergencias para la costa del
golfo de Morrosquillo, en caso de huracanes requerirá entre 13 y 18 horas para la evacuación a la
persona que viven en tierras bajas; las siguientes son las probabilidades de evacuación:
TIEMPO DE EVACUACION
EN CASO DE HURACAN
tiempo probabilidad
13 0,04
14 0,25
15 0,40
16 0,18
17 0,10
18 0,03
Calcule la media y la desviación estándar de la distribución de probabilidad de los tiempos de
evacuación.
µ= E(X) = Σ xf(x)=13(0,04)
+14(0,25)+15(0,40)+16(0,18)+17(0,10)+18(0,03)=1
5,14 horas.
σ2 = Var(X)=(13-15,14)2(0,04)+(14-15,14)2(0,25)+⋅ ⋅ ⋅ ⋅
+(18-15,14)2(0,03)=1,24
σ =1,11 horas.
Esto indica que el valor esperado del tiempo de evacuación en caso de huracán es de 15.14 horas en
promedio, con una desviación promedio de 1,11 horas del promedio de evacuación.
Halle un intervalo de evacuación donde aproximadamente este el 100% de los tiempos de
evacuación.
Un intervalo donde aproximadamente este el 99,9% de los tiempos de evacuación esta entre µ ± 3σ
Así que 15,14 ± 3(1.11) = 15,14 ± 2.22, es decir: aproximadamente el 100% de los tiempos de
evacuación estarán entre 11,81 y 18, 47 horas.
10. Distribución uniforme
Se dice que una v.a. X posee una distribución uniforme en el intervalo [a,b],
[
si su función de densidad es la si
siguiente:
Con esta ley de probabilidad, la probabilidad de que al hacer un experimento aleatorio, el
valor de X este comprendido en cierto subintervalo de [[a,b] depende únicamente de la
epende
longitud del mismo, no de su posición. Cometiendo un pequeño abuso en el lenguaje,
podemos decir que en una distribución uniforme la probabilidad de todos los puntos del
soporte es la misma.
Teniendo en cuenta que si ,
la función de distribución de es: