1. Abril 05, 2013 Jhosse Paul Marquez Ruiz
Métodos estadísticos
La integral y áreas debajo de la curva
“LA QUE NO DEBE SER NOMBRADA” DEL CÁLCULO Y SU USO EN LA ESTADÍSTICA
PRESENTACIÓN A PRUEBA DE CUALQUIER IQ HUMANO
2. Y la integral sale de…
La operación inversa a suma es la resta, a la multiplicación es la
división, a la potencia es la raíz y a la derivada es la integral.
El concepto de integral es muy importante dentro de la
estadística, ya que nos permite calcular valores muy importantes
para la inferencia (valores de probabilidad), que a su vez nos
permiten determinar conclusiones y tomar decisiones.
5. Los histogramas se acercan a formas concretas
En las ultimas dos
figuras. Podemos
observar directamente
los histogramas de
muestreos cada vez mas
grandes
(10, 100, 1000, 10000, 100
0000).
En ambos casos, cada
vez que se toman mas
muestras, aunque
diferentes, las figuras
son mas definidas.
A estas figuras se les
conoce como
distribuciones de
frecuencia
6. Insistiendo sobre el asunto: El tamaño de la muestra
determina que tanto se acerca el histograma a la
distribución de la población
Figura izquierda. Para
un muestreo pequeño
(20 datos) podemos
dibujar una curva
perfecta: la distribución
teórica (rojo). La curva
que resulta de la
aproximación de nuestro
histograma (azul).
A la derecha se
encuentra un muestreo
muy numeroso
(2000000) , y vemos que
la coincidencia es tan
perfecta que no se
distinguen las dos
curvas.
7. Calculando probabilidades
Ahora bien, si nosotros
queremos calcular la
probabilidad de que
sucediera un evento
concreto, lo que tenemos
que hacer es calcular la
altura de la curva a la
que se encuentra el valor
del que queremos
calcular su probabilidad.
Supongamos que en esta
curva queremos calcular
la probabilidad de que
suceda 1.3 exactamente.
El punto azul representa
esa probabilidad
8. Calculando la probabilidad de un intervalo
Si queremos calcular la
probabilidad de que
sucedan un conjunto de
datos dentro de un
intervalo o categoría de
nuestra tabla de
frecuencia, simplemente
tenemos que calcular el
área del rectángulo.
Esta tarea es fácil porque
corresponde exactamente a
multiplicar la base del
rectángulo (∆x) por su
altura (FR).
En este caso buscamos la
probabilidad de que suceda
un evento entre -2 y 1.5.
9. Calculando probabilidades en intervalos mas amplios
Si queremos la
probabilidad de que
evento sea igual o
menor a un
valor, entonces
tenemos que sumar las
áreas de los
rectángulos
correspondientes.
Esto es equivalente a
buscar la probabilidad
de un evento en un
intervalo mas amplio
10. Tomando en cuenta el error
Todavía tenemos que
solucionar algo en nuestro
histograma.
A pesar de que tengamos
muchísimos datos, los
rectángulos siguen dejando
áreas en blanco debajo de la
curva. Y esas áreas no son
calculadas.
Para evitar
esto, necesitamos aumentar
nuestra precisión.
Para ello reducimos
consecutivamente la base
de los rectángulos (∆x).
OJO! Esto solo se puede
hacer con millones de datos
en un histograma.
12. Uso de la integral
Integrar nos permite calcular
el área que hay debajo de una
curva, lo que en estadística
representa calcular la
probabilidad de que un evento
suceda entre un intervalo de
posibilidades.
La integral no forzosamente
necesita muchos
datos, simplemente necesita la
ecuación de la curva de
distribución.
Es por esto que podemos
calcular valores de
probabilidad si conocemos la
curva de distribución de
nuestros datos.
13. Otros usos de la integral
La integral es una herramienta con muchísimas aplicaciones. Entre
ellas encontramos al menos todas las inversas a la derivada.
Podemos calcular gastos energéticos a lo largo del tiempo.
También se usa para resolver ecuaciones diferenciales. Cuya
aplicación es bastante extensa. Buscar “ecuaciones diferenciales” en
Google.
La integral en estadística se usa muy comúnmente para calcular
valores de probabilidad y parámetros poblacionales como la
esperanza, la varianza, los momentos centrales, los momentos
medios, etc.
Sirve para calcular volúmenes y áreas de figuras complejas.
15. Algunas reglas importantes
La probabilidad de encontrar el evento bajo cualquier circunstancia
es 1. Por lo tanto, el área debajo de la curva siempre es 1.
Restar áreas es eliminar el área que se resto.
La función de la curva va a variar dependiendo de los datos.
16. Caso 1: Calcular la probabilidad de encontrar un evento
menor a un valor dado, P(x < X)
Si calculamos la
probabilidad de encontrar
un evento menor a -2 en
esta curva. Es lo mismo
que integrar la curva de
infinito negativo a -2
17. Caso 2: Calcular la probabilidad de encontrar un evento
mayor a un valor dado, P(x > X)
Si calculamos la
probabilidad de encontrar
un evento mayor a 2 en
esta curva. Es lo mismo
que integrar la curva de 2
a infinito. Que a su vez es
lo mismo que restarle a 1
el área de infinito
negativo a 2
18.
19. Caso 3: Calcular la probabilidad de encontrar un evento
entre un intervalo, P(X1 < x < X2)
Si calculamos la
probabilidad de encontrar
un evento entre -1 y 1 , es
lo mismo que integrar la
curva de -1 a 1.
Que a su vez es lo mismo
que restar las integrales de
infinito negativo a -1 y 1