1. Una distribución continua describe las probabilidades de valores que puede tomar una variable aleatoria continua, la cual puede tomar valores infinitos.
2. Las probabilidades se definen como el área debajo de la curva de la función de densidad de probabilidad (PDF).
3. La probabilidad de que una variable aleatoria continua sea igual a un valor puntual siempre es cero, a diferencia de las variables discretas.
1. ¿Qué es una distribución continua?
Una distribución continua describe las probabilidades de los posibles valores de una variable aleatoria continua.
Una variable aleatoria continua es una variable aleatoria con un conjunto de valores posibles (conocido como el
rango) que es infinito y no se puede contar.
Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo de la curva de su
PDF. Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de
que una variable aleatoria continua equivalga a algún valor siempre es cero.
Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de ellos se pueden
definir infinitos valores más. En estas condiciones no es posible deducir la probabilidad de un valor puntual de
la variable; como se puede hacer en el caso de variables discretas, pero es posible calcular la probabilidad
acumulada hasta un cierto valor (función de distribución de probabilidad), y se puede analizar como cambia la
probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro concepto: la función de
densidad.
2. Es generada por una variable continua (x).
Es una variable que puede tomar tanto valores enteros como
fraccionarios.
1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, .....,
f(x)0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser mayores o iguales a cero. Dicho
de otra forma, la función de densidad de probabilidad deberá tomar solo valores mayores o iguales a cero. La función
de densidad de probabilidad sólo puede estar definida en los cuadrantes I y II.
La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x debe ser igual a 1. El área
definida bajo la función de densidad de probabilidad deberá ser de 1.
3. Características
Con una variable discreta, cada uno de los valores que puede tomar la variable
x tiene una probabilidad; enseguida se muestra un ejemplo y una gráfica de
histograma
Como puede verse en la gráfica de la
derecha, con el histograma se forma una
superficie de tamaño 1. Se puede ver que
el área se compone de 10 cubos de 1/10
cuya suma es 1.
Con una variable continua, los valores de x son reales
(tienen decimales), como 4.3 o 4.35; entonces, a manera
de explicación, para cada valor de x se puede representar
como un rectángulo que tiene una probabilidad, así que el
área total se puede dividir en pequeños rectángulos.
4. En una variable continua las probabilidades pueden
cambiar de cada valor de x al siguiente, así que los
rectángulos pueden ir cambiando de altura. La suma del
área de todos los rectángulos deben ser 1 (uno).
Para definir la altura de cada uno de los rectángulos, se
pueden definir por separado, pero la forma correcta es
definir una función que delimite cada rectángulo en la
parte superior.
Dado que la variable es continua y puede tomar cualquier
valor en el rango definido, los rectángulos son tan
delgado que desaparecen, quedando un área con una
función que delimita la parte superior, el eje x delimitando
la parte inferior y dos límites en los extremos izquierdo y
derecho.
En una variable continua, no se puede preguntar la
probabilidad de solo un valor, por ejemplo: P(5.8), porque
el área de una línea tiende a 0 (cero). En las variables
continuas se preguntan por rangos, por ejemplo: a)
P(4.6 < x < 5.3) b) P(x > 7.4)
5. Ejemplo de la distribución de pesos
La distribución normal continua puede describir la
distribución del peso de hombres adultos. Por ejemplo,
usted puede calcular la probabilidad de que un hombre
pese entre 160 y 170 libras.
Gráfica de distribución del peso de hombres adultos
El área sombreada debajo de la curva en este ejemplo
representa el rango de 160 a 170 libras. El área de este
rango es 0.136; por lo tanto, la probabilidad de que un
hombre seleccionado aleatoriamente pese entre 160 y
170 libras es de 13.6%. Toda el área por debajo de la
curva equivale a 1.0.
Sin embargo, la probabilidad de que X sea exactamente igual a algún valor siempre es cero, porque el área
por debajo de la curva en un punto individual, que no tiene anchura, es cero. Por ejemplo, la probabilidad
de que un hombre pese exactamente 190 libras es cero. Podría calcular una probabilidad diferente de cero
de que un hombre pese más de 190 libras, menos de 190 libras o entre 189.9 y 190.1 libras, pero la
probabilidad de que pese exactamente 190 libras es cero.
6. Se tratan 120 ejemplares de una especie vegetal, todos bajo la acción destructora de un mismo microorganismo,
con un compuesto para eliminar dicho microorganismo. Se observa que, en general, 4 de cada 10 mueren antes
de que el compuesto haya surtido efecto. Calcula la probabilidad de que:
8. ¿Qué es la Distribución Normal?
La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se
utiliza más comúnmente en estadística. La distribución normal es de vital importancia en estadística por
tres razones principales:
Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan
estrechamente a la distribución normal.
La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la
distribución binomial y la distribución de Poisson.
La distribución normal proporciona la base para la estadística inferencial clásica por su relación con el
teorema de límite central.Tiene una apariencia de forma de campana (y, por ende, es simétrica).
Sus medidas de tendencia central (media, mediana y moda) son todas idénticas.
Su “50% central” es igual a 1.33 desviaciones estándar. Esto significa que el rango intercuartil está
contenido dentro de un intervalo de dos tercios de una desviación estándar por debajo de la media y de
dos tercios de una desviación estándar por encima de la media.
Su variable aleatoria asociada tiene un rango infinito (-∞ < X < ∞)
9. Cálculo de probabilidades en distribuciones normales La tabla (al final de este repartido) nos da las
probabilidades de P(z ≤ k), siendo z la variable tipificada. Estas probabilidades nos dan la función de
distribución Φ(k). Φ(k) = P(z ≤ k) En la tabla de valor de k se ubican las unidades y décimas en la columna de
la izquierda y las centésimas en la fila de arriba.
La temperatura durante setiembre está distribuida normalmente con media 18,7ºC y desviación standard 5ºC.
Calcule la probabilidad de que la temperatura durante setiembre esté por debajo de 21ºC
10.
11. La distribución normal es la más importante de todas las distribuciones de probabilidad .Es una distribución
de variable continua con campo de variación [- , ], que queda especificada a través de dos parámetros (
que acaban siendo la media y la desviación típica de la distribución).
Una variable aleatoria continua, X, definida en [- , ] seguirá una distribución normal de parámetros m y s ,
( X ~ N(m ; s ) ) , si su función de densidad es :
cuya representación gráfica es:
12. Importancia de la distribución Normal.
a) Enorme número de fenómenos que puede modelizar: Casi todas las características cuantitativas de las
poblaciones muy grades tienden a aproximar su distribución a una distribución normal.
b) Muchas de las demás distribuciones de uso frecuente, tienden a distribuirse según una Normal, bajo ciertas
condiciones.
c) (En virtud del teorema central del límite).Todas aquellas variables que pueden considerarse causadas por un
gran número de pequeños efectos (como pueden ser los errores de medida) tienden a distribuirse según una
distribución normal.
A esta forma se le llamó normal. El siguiente paso era encontrar una función de una variable continua que se
asemejara a las distribuciones de frecuencia. Se buscó una función que se pudiera ajustar a diferentes
varianzas sin perder la el patrón original. Un matemático de apellido Gauss, definió la siguiente ecuación:
Dentro de la ecuación, se cuenta con la variable x y dos
parámetros: la media y la varianza. De tal forma, que
ubicando estos parámetros en la ecuación se pueden
encontrar diferentes formas de la distribución.
13.
14.
15. Dada una variable, se mide de una población o se toma
una muestra para estimar la media y la varianza
Se visualiza la forma de la distribución normal.
Se identifica la probabilidad que se desea conocer.
Se cambia la variable normal, por una variable normal
estándar (z), como se explica mas adelante
Se cambia la variable normal, por una variable normal
estándar (z), como se explica mas adelante
16. Si X es una variable aleatoria de una distribución N(µ, σ), hallar: p(µ−3σ ≤ X ≤ µ+3σ). Solución:
sabemos que = − ; como x 1 = µ−3σ y x 2 = µ+3σ entonces la P(x 1 ≤ X ≤ x 2 ) se define como:
Es decir, que aproximadamente el 99.72% de los valores
de X están a más/menos de tres desviaciones típicas de l
media.
Si X es una variable aleatoria de una distribución N(µ, σ),
hallar: p(µ−3σ ≤ X ≤ µ+3σ).
17. OTRAS PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
Los puntos de inflexión de la curva son μ-σ y μ+σ
Relación entre σ y la probabilidad:
1σ: Área encerrada entre μ-σ y μ+σ = 68%
2σ: Área encerrada entre μ-2σ y μ+2σ = 95%
3σ: Área encerrada entre μ-3σ y μ+3σ = 99,7%
4σ: Área encerrada entre μ-4σ y μ+4σ = 99,994%
5σ: Área encerrada entre μ-5σ y μ+5σ = 99,99994%
6σ: Área encerrada entre μ-6σ y μ+6σ
= 99,9999998%
19. AREA BAJO LA CURVA
DEFINICIONES:
Para emplear la curva normal en la resolucion de los ploblemas, tenemos que familiarizarnos con el area
que esta bajo la curva y la linea base y que contiene el 100%, o todos los casos, en una distribucion normal
dada.
La curva normal tiene forma de campana, la media, la moda y la mediana de la distribucion son iguales.
Una aplicacion matematica de mucha utilidad que consiste en calcular el area delimitada entre dos puntos
del eje y la de un grafico
La curva hace mas facil el calculo en proporciones ya que por medio de la curva miramos que dato
esta cerca de la media, que dato llega a la punta de la curva o ver de que lado estan concentrados los
datos ya que como parte principal es la media porque primero tenemos que ubicar la media que nos
sirve como guia y despues se colocan los demas datos en la curva, en lo cual la curva tiene forma de
campana.
20. VALORES ESTANDARIZADOS:
Es cuando el numero de datos va a sustituir el valor de "X" y tenemos que tener la media y desviacion estandar
para poder obtener los datos ya estandarizados y despues colocarlos en la curva y ver si los datos estan
concentrados arriba de la media es positivoo abajo de la media que es negativo en lo cual los datos
estandarizados son el porcentaje que obtenemos por medio de la formula "Z"
_
Z=x-x
----
S
No importa cuáles sean los valores de la para una distribución de probabilidad normal, el área total bajo la
curva es 1.00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades
21. Calcular el área del recinto limitado por la curva y = 4x − x2 y el eje OX.
En primer lugar hallamos los puntos de corte con el eje OX para representar la curva y conocer los límites de
integración.
27. Una distribución probabilística o modelo probabilístico es una proposición concreta y
anticipada del comportamiento de una variable aleatoria, en términos de su posible
distribución. En el ejemplo que hemos considerado, y suponiendo que nuestro curso
tiene 40 alumnos, podríamos basarnos en nuestra experiencia docente y predecir una
distribución de notas como la siguiente:
Con un modelo probabilístico como el que se muestra en la tabla siguiente, que está referido
al número de incendios en instalaciones industriales que se producen semanalmente en una
determinada ciudad, una compañía de seguros podría planificar sus finanzas a (por ejemplo)
un año plazo. En este ejemplo, la variable aleatoria es el número de incendios producidos en
una semana. Esta variable se ha denotado con la letra X.
28. El promedio de estas notas es 4.0 y la varianza es 1.
Es un teorema de la teoría estadística que si la distribución de los puntajes originales es
normal, entonces la distribución de los puntajes estandarizados debe ser una normal
estándar. Ya hemos dicho que así se llama el modelo normal cuyo valor esperado vale 0 y
cuya varianza vale 1. La forma de este modelo es la de la en la que debe entenderse que casi
todos los datos (aproximadamente el 99.74% de ellos) deben encontrarse entre los valores -
3, por la izquierda, y +3, por la derecha.
Sin embargo, si la distribución original no es normal entonces la distribución de las notas
estandarizadas y, en consecuencia, la distribución de las notas finales, no tienen por qué ser
normales.
La que representa gráficamente a la tabla anterior, expresa mejor lo dicho en relación con
ella. Debe ponerse atención a los números puestos en su parte inferior, que representan a las
tres principales marcas de clase.