*ESTADISTICA DESCRIPTIVA
Docente: Olga Garatejo
*ESTADISTICA DESCRIPTIVA
La estadística. Es el conjunto sistemático de procedimientos para la
observación, registro, organización, síntesis y análisis e interpretación
de los fenómenos y de las leyes que los regulan para poder así predecir
o concluir acerca de ellos. Esta definición claramente involucra las dos
fases de la estadística: la descriptiva y la inferencial.
*FASES DE LA
ESTADISTICA
*Descriptiva (Deductiva). Es la fase de descripción,
organización, síntesis y análisis de la información de interés.
*Inferencial (Inductiva). Esta fase busca obtener conclusiones
sólidas y más profundas que una simple descripción de la
información basados en el trabajo con muestras y su posterior
generalización de resultados para la toma de decisiones y
conclusiones sólidas.
*CONCEPTOS BÁSICOS
*Población. Conjunto total de elementos (datos, personas,
objetos, medidas, acontecimientos, atributos), que poseen
una o más características observables sobre el cual se buscan
conclusiones y decisiones.
*Muestra. Parte de la población.
*Parámetro. Medida de una característica poblacional.
*Estadístico. Medida de una característica en una muestra.
*VARIABLES Y TIPOS
Variable. Es una característica observable en un objeto de
estudio, que puede adoptar diferentes valores o categorías.
*Variable cuantitativa, es aquella para la cual las mediciones
arrojan datos numéricos. Las variables cuantitativas se pueden
clasificar en continuas y discretas.
*Variable discreta, es aquella que puede tomar finitos o infinitos
valores numerables.
*Variable continua, es aquella que puede tomar infinitos valores
dentro de un intervalo de números reales (no numerables).
*Una variable cualitativa, es aquella para la cual no es posible
hacer mediciones numéricas. Las observaciones son categorías
que se pueden solamente clasificar o rotular.
* NIVELES DE MEDIDA O
ESCALAS DE MEDICIÓN,
*Escala Nominal. Los datos de las variables son rótulos usados para
identificar un atributo del elemento de la muestra. Los rótulos no pueden
ordenarse con sentido.
*Escala Ordinal. Permiten ordenar las observaciones con sentido, como es
el caso de la variable Severidad de la enfermedad (severo, moderado y
sano) o nivel del daño en una pieza (leve, moderado y severo)
*Escala de Intervalo. Los datos tienen propiedades de dato ordinal y se
pueden determinar distancias. No hay un cero absoluto o real, el cero es
arbitrario como es el caso de la variable temperatura en grados
centígrados.
*Escala de Razón. Los datos tienen propiedades de datos de intervalo y
existe un cero real que permite considerar cocientes de mediciones,
como es el caso de la variable peso.
*DIAGRAMA DE
PUNTOS
Se construye colocando determinado número de puntos sobre
un eje horizontal de acuerdo al número de veces que se
repite el dato. (Máximo 20 datos)
DESCRIPCIÓN GRAFICA DE
DATOS CUANTITATIVOS
*DIAGRAMA DE TALLOS
Y HOJAS
Se requiere que los datos estén conformados por al menos dos
dígitos.
El último dígito constituye la hoja y el ó los restantes
conformarán el tallo. Para una adecuada descripción de los
datos es conveniente trabajar con al menos 4 tallos.
PASOS
*Hacer una lista de los diferentes valores del tallo en una
columna vertical
*Junto al valor correspondiente del tallo se registran las hojas
*HISTOGRAMAS
El histograma es una técnica gráfica utilizada para resumir una
gran cantidad de datos. Se le atribuye a Karl Pearson en 1895.
Tabla de frecuencias
Es un arreglo tabular de las frecuencias con que ocurre cada
característica en que se han dividido los datos, esta conformado
por:
*Intervalo de clase (caso continuo), es cada uno de los rangos de
valores en que se ha decidido agrupar parcialmente los datos.
*Marca de clase (caso continuo), es el punto medio del intervalo
de la clase, su valor es obtenido al promediar los extremos del
intervalo.
*HISTOGRAMAS
*Frecuencia absoluta es el número de veces que se repite un dato
(caso discreto) ó el número de mediciones dentro del intervalo (caso
continuo).
*Frecuencia absoluta acumulada de la clase es la suma de frecuencia
absoluta actual con las frecuencia anteriores
*Frecuencia relativa es el cociente entre la frecuencia absoluta y el
total de datos
*Frecuencia relativa acumulada es el cociente entre la frecuencia
absoluta acumulada y el número de observaciones
*Caso discreto
*Caso continuo
*DIAGRAMA DE BARRAS
*Se basa en las tablas de frecuencia (conteo del número de elementos o
individuos que tienen determinada característica).
*Categóricas cualitativas barras horizontales
*Categóricas cuantitativas barras verticales
*PARETO (Diagrama de Barras Ordenado)
DESCRIPCIÓN GRÁFICA DE
DATOS CUALITATIVOS
*DIAGRAMAS DE
PASTEL
*Permiten visualizar mejor la proporción en que aparece una
característica respecto del total.
*DIAGRAMA DE
DISPERSIÒN
*Consiste en un gráfico en el plano cartesiano que muestra la
relación entre dos variables.
DESCRIPCIÓN DE DOS VARIABLES
*TABLAS DE
CONTINGENCIA
*Son tablas utilizadas cuando los elementos pueden
clasificarse de acuerdo a dos o más criterios diferentes
*La media aritmética
*Propiedades
*1. La suma de las desviaciones respecto de la media es igual a
cero
*2. Si se tiene la media de un conjunto de datos y a cada
observación se multiplica por una constante b y se le suma
una constante a, entonces la nueva media de los datos se
obtiene multiplicando la media de los datos originales por b y
sumándole a.
*MEDIDAS DE TENDENCIA
CENTRAL
*Media Ponderada
Se usa principalmente para:
*Promediar observaciones con diferentes importancias o pesos
𝒙 𝒑 =
∑
𝒊=1
𝒏
𝒘 𝒊 𝒙𝒊
∑
𝒊=1
𝒏
𝒘 𝒊
*Media Geométrica
Se usa principalmente para:
*Promediar porcentajes, índices y cifras relativas.
*Determinar el incremento porcentual promedio en ventas,
producción u otras actividades o series económicas de un
periodo a otro.
𝒙𝒈=
𝒏
√𝒙1 𝒙2 𝒙3 … 𝒙𝒏
*Media Armónica
*Generalmente se utiliza para promediar variaciones con
respecto al tiempo
𝒙𝒂=
1
1
𝒏 ( 1
𝒙1
+
1
𝒙2
+…+
1
𝒙𝒏
)
*La mediana
*La Mediana es el valor que divide un conjunto de datos
ordenado en dos partes porcentualmente iguales
*La moda
Se define como el valor que se presenta con mayor frecuencia
*Para el caso de un conjunto de datos se puede presentar una moda
(unimodal) o dos modas (bimodal).
*Su importancia radica en que es la única medida de tendencia para
datos cualitativos
Medidas de posición relativa,
cuantiles o fractiles
Describen el comportamiento de una variable dividiendo la serie de valores en un
diferente número de partes porcentualmente iguales
*Los Cuartiles
Son aquellos números que dividen un conjunto de datos ordenado en cuatro partes
porcentualmente iguales. Hay tres cuartiles, Q1, Q2 y Q3. El primer cuartil Q1, es el
valor por debajo del cual queda aproximadamente un cuarto (25%) de todos los datos.
El segundo cuartil Q2 es el valor por debajo del cual queda el 50% de los datos
(Mediana), y el tercer cuartil Q3 es el valor por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
*Los Deciles
Son ciertos números que dividen el conjunto de datos ordenado en diez partes
porcentualmente iguales. Se denotan por D1, D2, . . . , D9. El decil 5 corresponde a la
mediana.
*Los Percentiles
Son ciertos números que dividen el conjunto de datos ordenados en cien partes
porcentualmente iguales. El percentil 50 equivale a la mediana.
Hallar
donde
MEDIDAS DE DISPERSIÓN
Determinan nivel de concentración de un conjunto de datos
Más variación = Heterogeneidad
Menos variación =Homogeneidad
*ABSOLUTAS: Varianza, Desviación Estándar, Rango y Rango
Intercuartilico
*RELATIVAS : Coeficiente de Variación
*Varianza
Se define como el promedio (poblacional) ó el "casi promedio"
(muestral) de los cuadrados de las desviaciones de los datos con
respecto a la media muestral.
Propiedades de la varianza
*La varianza de una constante es cero
*Si se tiene la varianza de un conjunto de datos y cada
observación se multiplica por una constante b , entonces la
nueva varianza de los datos se obtiene multiplicando la varianza
de los datos originales por b2
.
*Desviación estándar
La desviación estándar está definida como la raíz de la
Varianza
*Rango
*Es la diferencia entre el máximo y el mínimo valor
de un conjunto de datos
𝑹𝒂𝒏𝒈𝒐=𝑴á𝒙𝒊𝒎𝒐−𝑴í𝒏𝒊𝒎𝒐
*Rango Intercuartílico
Es apropiado ante la presencia de datos atípicos, es la
diferencia entre el tercer y el primer cuartil
𝑹𝑰=𝑸3−𝑸1
*MEdiana de las Desviaciones
Absolutas (MEDA)
Se utiliza ante la presencia de datos atípicos y se define como la
mediana del valor absoluto de las diferencias de los datos
respecto a su mediana
𝑴𝑬𝑫𝑨=𝑴𝒆𝒅𝒊𝒂𝒏𝒂|𝑴𝒆𝒅𝒊𝒂𝒏𝒂 −𝒙𝒊|
*Coeficiente de
Variación
Es utilizado para comparar la variabilidad entre dos grupos de
datos que tienen distinta media o referidos a distintos sistemas
de unidades de medida. Por ejemplo, kilogramos y
centímetros.
*Coeficiente de
Asimetría
*Medida que determina el grado de simetría o asimetría que
presenta la distribución de un conjunto de datos
MEDIDAS DE FORMA
∝3 =
𝜇
3
𝜎3
=
1
𝑁
∑
❑
❑
(𝑥𝑖 − 𝜇)
3
(❑
√∑
❑
❑
(𝑥𝑖 −𝜇)
2
𝑁
)
3
*Coeficiente de Curtosis o
Apuntamiento
*Determina que tan empinada o aplanada se encuentra una
distribución unimodal
∝4 =
𝜇4
𝜎 4
=
1
𝑁
∑
❑
❑
(𝑥𝑖 −𝜇)
4
(❑
√∑
❑
❑
(𝑥𝑖 −𝜇)
2
𝑁
)
4
*COEFICIENTE DE
CORRELACIÓN (r)
*Mide la fuerza de asociación entre dos variables
r=
*COEFICIENTE DE
CORRELACIÓN (r)
*Dibujar y marcar un eje de medida horizontal.
*Construir un rectángulo cuyo borde izquierdo está en el primer
cuartil y cuyo borde derecho esta en el tercer cuartil .
*Dibujar un segmento de recta vertical dentro del rectángulo en
la mediana.
*Prolongar dos rectas horizontales desde cada extremo del
rectángulo de longitud 1.5 veces el rango intercuartílico.
*Dibujar un circulo vacio para identificar cada observación que
caiga entre 1.5 y 3.0 veces el rango intercuartílico desde los
bordes del rectángulo(inusuales suaves).
*Dibujar un circulo relleno para identificar cada observación que
caiga a más de 3.0 veces el rango intercuartilico (inusuales
extremos).
*BOX PLOT
*Las probabilidades son números comprendidos entre 0 y 1.
* Probabilidades próximas a 1 indican que cabe esperar que
ocurran los sucesos en estudio.
* Probabilidades próximas a 0 indican que no cabe esperar que
ocurran los sucesos de que se trate.
* Probabilidades próximas a 0.5 indican que es tan verosímil que el
suceso se produzca como que no.
*La teoría de la probabilidad se emplea para sacar conclusiones
acerca de una población, con base en una muestra extraída
utilizando métodos estadísticos llamados métodos inferenciales y
para aplicarlos se requiere en el enfoque paramétrico del
conocimiento de la distribución de probabilidad de los datos
poblacionales.
Probabilidad y Distribuciones
de Probabilidad
*Conceptos Básicos
*Experimento aleatorio: Experimento que repetido
bajo unas mismas condiciones produce resultados
diferentes e impredecibles.
*Espacio Muestral: S, Ω. Conjunto de posibles
resultados de un experimento aleatorio.
*Evento o suceso: Característica que define un
subconjunto del espacio muestral.
*Eventos Excluyentes (Disyuntos): Sean A y B dos
eventos de Ω si A B = , estos dos eventos se
∩ ∅
dicen excluyentes.
Ejemplo: en el experimento de lanzar
una moneda al aire, Ω estaría
compuesto por los posibles resultados:
cara o sello;
Ω = {C, S}.
En la ejecución del experimento
aleatorio, aunque el resultado es
impredecible, se sabe que debe
corresponder a una de las opciones
fijadas por el espacio muestral.
Experimento aleatorio: lanzamiento de dos dados.
Espacio muestral: Ω = {(1, 1) (1, 2) (1, 3) (1, 4) (1,
5) (1, 6) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 1)
(3, 2) (3, 3) (3, 4) (3, 5) (3, 6) (4, 1) (4, 2) (4, 3) (4,
4) (4, 5) (4, 6) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)}
Evento: aparece el mismo número en ambos dados.
Diagrama de árbol para el experimento de lanzar dos dados:
Resultados igualmente posibles y mutuamente excluyentes. Casos
favorables:
Probabilidad de ocurrencia del evento :
Suponga que se seleccionan, de forma aleatoria,
tres artículos de un proceso de fabricación. Cada
artículo se inspecciona y se clasifica como
defectuoso, D, o no defectuoso, N.
Suponga que se seleccionan, de forma aleatoria,
tres artículos de un proceso de fabricación. Cada
artículo se inspecciona y se clasifica como
defectuoso, D, o no defectuoso, N
Ω={𝐷𝐷𝐷,𝐷𝐷𝑁,𝐷𝑁𝐷,𝐷𝑁𝑁 ,𝑁𝐷𝐷,𝑁𝐷𝑁,𝑁𝑁𝐷,𝑁𝑁𝑁}
Evento A: El número de artículos defectuosos sea
mayor que 1. Esto ocurrirá si el resultado es un
elemento del subconjunto.
Dado el espacio muestral = {t | t ≥ 0},
donde t es la vida en años de cierto componente
electrónico, el evento A de que el componente falle
antes de que finalice el quinto año es el subconjunto.
A = {t | 0 ≤ t < 5}.
Los espacios muestrales con un número
grande o infinito de puntos muestrales se
describen mejor mediante un enunciado o
método de la regla. Por ejemplo, si el
conjunto de resultados posibles de un
experimento fuera el conjunto de ciudades
en el mundo con una población de más de
un millón de habitantes, nuestro espacio
muestral se escribiría como:
Si es el conjunto de todos los puntos (x, y) sobre
los límites o el interior de un círculo de radio 2
con centro en el origen, escribimos la regla:
*Algebra y σ-Algebra
* es un Algebra
, entonces
, entonces
*σ-Algebra
, entonces
,… entonces
,… entonces
Probabilidad clásica
Si un experimento aleatorio resulta de formas
igualmente posibles y mutuamente excluyentes
y si de dichos resultados favorecen a la
situación de interés , la probabilidad de ,
denotada , es:
*Axiomas de
Probabilidad
Sea Ω un espacio muestral y A un evento cualquiera de Ω. Para
todo A en Ω se asigna un número llamado probabilidad de A,
notado P(A), tal que:
i) 1
ii) =1
iii) P
El complemento de un evento respecto de S
es el subconjunto de todos los elementos de S
que no están en . Denotamos el complemento
de mediante el símbolo
La intersección de dos eventos A y B, que se
denota con el símbolo A B, es el evento que
∩
contiene todos los elementos que son comunes
a A y a B.
Dos eventos A y B son mutuamente
excluyentes o disjuntos si ; es decir, si A y B
no tienen elementos en común.
La unión de dos eventos A y B, que se denota con
el símbolo A B, es el evento que contiene todos
∪
los elementos que pertenecen a A o B, o a
ambos.
Probabilidad para la unión de eventos:
Ejemplo
Las enfermedades I y II son comunes entre los
individuos de cierta población. Se supone que el 10 %
de la población contraerá la enfermedad I alguna vez
durante su vida, 15% contraerá eventualmente la
enfermedad II, y el 3 % contraerá ambas. Encuentre la
probabilidad de que un individuo elegido al azar de esta
población, contraiga al menos una enfermedad.
A: El individuo contrae la enfermedad I
B: El individuo contrae la enfermedad II
Representación de varias regiones
Ejemplo: Suponga que una familia sale de vacaciones
de verano en su casa rodante y que M es el evento de
que sufrirán fallas mecánicas, T es el evento de que
recibirán una infracción por cometer una falta de
tránsito y V es el evento de que llegarán a un lugar
para acampar que esté lleno. Exprese con palabras
los eventos representados por las siguientes regiones:
*Principio
Fundamental del
Conteo
Principio de multiplicación:
Si una operación se puede llevar a cabo en
formas, y si para cada una de éstas se puede
realizar una segunda operación en formas,
entonces las dos operaciones se pueden ejecutar
juntas de formas.
Para etapas, el experimento completo es
…
Ejemplo:
¿Cuántos puntos muestrales hay en el espacio
muestral cuando se lanza un par de dados una vez?
Un urbanista de una nueva subdivisión ofrece a los
posibles compradores de una casa elegir entre
Tudor, rústica, colonial y tradicional el estilo de la
fachada, y entre una planta, dos pisos y desniveles
el plano de construcción. ¿En cuántas formas
diferentes puede un comprador ordenar una de
estas casas?
Sam va a armar una computadora y para
comprar las partes tiene que elegir entre las
siguientes opciones: dos marcas de circuitos
integrados, cuatro marcas de discos duros, tres
marcas de memorias y cinco tiendas locales en
las que puede adquirir un conjunto de
accesorios. ¿De cuántas formas diferentes puede
Sam comprar las partes?
¿Cuántos números pares de cuatro dígitos se
pueden formar con los dígitos 0, 1, 2, 5, 6 y 9, si
cada dígito se puede usar sólo una vez?
Una permutación es un arreglo de todo o parte
de un conjunto de objetos.
Considere las tres letras a, b y c. Las
permutaciones posibles.
Factorial:
Para cualquier entero no negativo denominado “
-factorial” se define como
con el caso especial de 0! = 1.
Permutaciones posibles de a, b, c y d.
Ahora el número de permutaciones que son posibles
tomando dos de las cuatro letras a la vez. ¿?
El número de permutaciones de objetos
distintos tomados de a la vez es:
Definido como:
Ejemplo:
En un año se otorgará uno de tres premios
(a la investigación, la enseñanza y el
servicio) a algunos de los estudiantes, de
un grupo de 25, de posgrado del
departamento de estadística.
Si cada estudiante puede recibir un premio
como máximo,
¿cuántas selecciones posibles habría?
Permutaciones circulares:
Ocurren al arreglar objetos en un círculo. De
modo que el primer elemento también
representa al primero.
Ejemplo: ¿Cuántas formas hay de ubicar en
una mesa a 4 personas?
Para n giros posibles , luego
El número de permutaciones distintas de objetos, en
el que son de una clase, de una segunda clase,..., de
una k-ésima clase es:
Ejemplo:
Durante un entrenamiento de fútbol americano
colegial, el coordinador defensivo necesita tener a 10
jugadores parados en una fila. Entre estos 10
jugadores hay 1 de primer año, 2 de segundo año, 4 de
tercer año y 3 de cuarto año, respectivamente.
¿De cuántas formas diferentes se pueden arreglar en
una fila si lo único que los distingue es el grado en el
cual están?
El número de formas de partir un conjunto de n
objetos en r celdas con elementos en la primera
celda, elementos en la segunda, y así
sucesivamente, es:
donde
Ejemplo: Un hotel va a hospedar a siete
estudiantes de posgrado que asisten a una
conferencia ¿ en cuántas formas los puede
asignar a una habitación triple y a dos doble?
COMBINATORIA:
En muchos problemas nos interesamos en el número de
formas de seleccionar r objetos de n sin importar el
orden.
El número de combinaciones de objetos distintos
tomados de a la vez es:
Ejemplo: Un niño le pide a su madre que le lleve cinco
cartuchos de Game-BoyTM de su colección de 10 juegos
recreativos y 5 de deportes. ¿De cuántas maneras
podría su madre llevarle 3 juegos recreativos y 2 de
deportes?
¿Cuántos arreglos diferentes de letras se pueden
hacer con las letras de la palabra STATISTICS?
Reglas aditivas
A menudo resulta más sencillo calcular la
probabilidad de algún evento a partir de las
probabilidades conocidas de otros eventos. Esto
puede ser cierto si el evento en cuestión se puede
representar como la unión de otros dos eventos o
como el complemento de algún evento.
Si A y B son eventos, entonces:
Ejemplo: Al final del semestre John se va a
graduar en la facultad de ingeniería industrial de
una universidad. Después de tener entrevistas en
dos empresas en donde quiere trabajar,
determina que la probabilidad que tiene de
lograr una oferta de empleo en la empresa A es
0.8, y que la probabilidad de obtenerla en la
empresa B es 0.6. Si, por otro lado, considera
que la probabilidad de recibir ofertas de ambas
empresas es 0.5, ¿qué probabilidad tiene de
obtener al menos una oferta de esas dos
empresas?
Luego, la probabilidad tiene de obtener al menos
una oferta de esas dos empresas es del 90%
Si A y B son mutuamente excluyentes, entonces:
¿Cuál es la probabilidad de obtener un total de 7
u 11 cuando se lanza un par de dados?
Si A y B son mutuamente excluyentes, entonces:
¿Cuál es la probabilidad de obtener un total de 7
o 11 cuando se lanza un par de dados?
Luego, la probabilidad de obtener un total de 7
o 11 cuando se lanza un par de dados es 22,22%
Este resultado también se podría obtener
contando el número total de puntos para el
evento A B, es decir, 8 y escribir:
∪
*Si son mutuamente excluyentes, entonces:
Las probabilidades de que un individuo que compra
un automóvil nuevo elija uno de color verde, uno
blanco, uno rojo o uno azul son 0.09, 0.15, 0.21 y
0.23, respectivamente, ¿cuál es la probabilidad de
que un comprador dado adquiera un automóvil nuevo
que tenga uno de esos colores?
Las probabilidades de que un individuo que
compra un automóvil nuevo elija uno de color
verde, uno blanco, uno rojo o uno azul son 0.09,
0.15, 0.21 y 0.23, respectivamente, ¿cuál es la
probabilidad de que un comprador dado
adquiera un automóvil nuevo que tenga uno de
esos colores?
A menudo es más difícil calcular la probabilidad de
que ocurra un evento que calcular la probabilidad
de que el evento no ocurra.
Si A y A’ son eventos complementarios, entonces:
Si las probabilidades de que un mecánico
automotriz dé servicio a 3, 4, 5, 6, 7, 8 o más
vehículos en un día de trabajo dado son 0.12, 0.19,
0.28, 0.24, 0.10 y 0.07, respectivamente, ¿cuál es
la probabilidad de que dé servicio al menos a 5
vehículos el siguiente día de trabajo?
E= al menos a 5 vehículos reciban el servicio el
siguiente día de trabajo.
E’= de que menos a 5 vehículos reciban el servicio
día de trabajo
Si las probabilidades de que un mecánico automotriz dé
servicio a 3, 4, 5, 6, 7, 8 o más vehículos en un día de
trabajo dado son 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07,
respectivamente, ¿cuál es la probabilidad de que dé
servicio al menos a 5 vehículos el siguiente día de trabajo?
E= al menos a 5 vehículos reciban el servicio el siguiente
día de trabajo.
E’= de que menos a 5 vehículos reciban el servicio día de
trabajo
P(E’) = 0.12 + 0.19 = 0.31.
Entonces:
P(E) = 1 – 0.31 = 0.69.
Ejercicio 52: Suponga que se descubre que, en
un grupo de 500 estudiantes universitarios de
último año, 210 fuman, 258 consumen bebidas
alcohólicas, 216 comen entre comidas, 122
fuman y consumen bebidas alcohólicas, 83
comen entre comidas y consumen bebidas
alcohólicas, 97 fuman y comen entre comidas y
52 tienen esos tres hábitos nocivos para la salud.
Si se selecciona al azar a un miembro de este
grupo, calcule la probabilidad de que el
estudiante:
a) Fume pero no consuma bebidas alcohólicas;
b) Coma entre comidas y consuma bebidas
alcohólicas pero no fume;
c) No fume ni coma entre comidas.
*Probabilidad
condicional
Es la probabilidad de que ocurra un evento B
cuando se sabe que ya ocurrió algún evento A.
Decimos “la probabilidad de que ocurra B, dado
que ocurrió A”
“la probabilidad de B, dado A”
Caracterizar a un grupo de estudiantes según dos
variables:
género (H, M) y fumar (S, N)
La probabilidad de que un vuelo programado
normalmente salga a tiempo es P(D) = 0.83, la
probabilidad de que llegue a tiempo es P(A) =
0.82 y la probabilidad de que salga y llegue a
tiempo es P(D A) = 0.78. Calcule la
∩
probabilidad de que un avión
a) llegue a tiempo, dado que salió a tiempo;
b) salió a tiempo, dado que llegó a tiempo.
Independientes
Dos eventos A y B son independientes si y sólo si,
o
se asume la existencia de probabilidad
condicional. De otra forma, A y B son
dependientes.
Investigadores encuestaron a recién graduados
de dos universidades diferentes sobre sus
ingresos anuales. La siguiente tabla de
contingencia exhibe datos de los graduados que
respondieron la encuesta:
Ganancia
anual
Universidad
A
Universidad
B
TOTAL
Menos de
$20,000
36 24 60
De $20,000 a
39,999
109 56 165
$40,000 y
más
35 40 75
TOTAL 180 120 300
Supongamos que de estos datos elegimos
aleatoriamente a un graduado.
*¿Son independientes los eventos "el
ingreso es de $40,000 y más" y "asistió a la
Universidad B"?
*¿Son independientes los eventos "el
ingreso es de menos de $20,000" y "asistió
a la Universidad B"?
*La regla de producto
o regla multiplicativa
Si en un experimento pueden ocurrir los eventos
A y B, entonces:
P(A B) = P(A)P(B|A)
∩
siempre que P(A) > 0
Cuando son independientes
P(A B) = P(A)P(B)
∩
P(A B) = P(B A) = P(B)P(A|B)
∩ ∩
No importa qué evento se considere como A ni
qué evento se considere como B.
Ejemplo: que tenemos una caja de fusibles que contiene 20
unidades, de las cuales 5 están defectuosas. Si se seleccionan 2
fusibles al azar y se retiran de la caja, uno después del otro, sin
reemplazar el primero, ¿cuál es la probabilidad de que ambos
fusibles estén defectuosos?
Una bolsa contiene 4 bolas blancas y 3 negras, y una
segunda bolsa contiene 3 blancas y 5 negras. Se saca
una bola de la primera bolsa y se coloca sin verla en la
segunda bolsa. ¿Cuál es la probabilidad de que ahora
se saque una bola negra de la segunda bolsa?
Dos eventos A y B son independientes si y sólo si
P(A B) = P(A)P(B)
∩
Por lo tanto, para obtener la probabilidad de
que ocurran dos eventos independientes
simplemente calculamos el producto de sus
probabilidades individuales.
Una pequeña ciudad dispone de un carro de bomberos
y una ambulancia para emergencias. La probabilidad
de que el carro de bomberos esté disponible cuando se
necesite es 0.98 y la probabilidad de que la
ambulancia esté disponible cuando se le requiera es
0.92. En el evento de un herido en un incendio,
calcule la probabilidad de que tanto la ambulancia
como el carro de bomberos estén disponibles,
suponiendo que operan de forma independiente.
Sean A y B los respectivos eventos de que estén
disponibles el carro de bomberos y la ambulancia.
Entonces,
P(A B) = P(A)P(B) = (0.98)(0.92) = 0.9016.
∩
*Probabilidad total
Si los eventos constituyen una partición del
espacio muestral S, tal que
para , entonces, para cualquier evento de ,
Tres máquinas de cierta planta de ensamble, ,
montan 30%, 45% y 25% de los productos,
respectivamente. Se sabe por experiencia que 2%,
3% y 2% de los productos ensamblados por cada
máquina, respectivamente, tienen defectos. Ahora
bien, suponga que se selecciona de forma aleatoria
un producto terminado. ¿Cuál es la probabilidad de
que esté defectuoso?
*Regla de Bayes
La estadística bayesiana es un conjunto de
herramientas que se utiliza en un tipo especial
de inferencia estadística que se aplica en el
análisis de datos experimentales en muchas
situaciones prácticas de ciencia e ingeniería.
Suponga que se selecciona un producto de forma
aleatoria y que éste resulta defectuoso. ¿Cuál es la
probabilidad de que este producto haya sido
ensamblado con la máquina ? Las preguntas de este
tipo se pueden contestar usando el siguiente teorema,
denominado regla de Bayes:
Si los eventos constituyen una partición del espacio
muestral , donde para , entonces, para cualquier
evento en , tal que
,
Para
Del ejemplo anterior, si se elige al azar un producto y se
encuentra que está defectuoso, ¿cuál es la probabilidad de
que haya sido ensamblado con la máquina ?
En vista de que se seleccionó un producto defectuoso, este
resultado sugiere que probablemente no fue ensamblado
con la máquina .
Una empresa de fabricación de coches tiene tres
fábricas. La primera fábrica produce un 40 del total
de coches y la segunda fábrica produce otro 15 del
total. Por cada lote de producción se hace un
control de calidad en todas las fábricas. En la
primera fábrica, un 0,05 de los coches analizados
son defectuosos; en la segunda fábrica, esta
cantidad asciende al 0,08; mientras que en la
tercera fábrica, baja al 0,04.
¿Cuál es la probabilidad de coger un coche al azar y
que sea defectuoso?
la probabilidad de escoger un coche al azar y que
sea defectuoso es del 5%.
Suponga que los cuatro inspectores de una fábrica de
película colocan la fecha de caducidad en cada paquete de
película al final de la línea de montaje. John, quien coloca la
fecha de caducidad en 20% de los paquetes, no logra
ponerla en uno de cada 200 paquetes; Tom, quien la coloca
en 60% de los paquetes, no logra ponerla en uno de cada
100 paquetes; Jeff, quien la coloca en 15% de los paquetes,
no lo hace una vez en cada 90 paquetes; y Pat, que fecha 5%
de los paquetes, falla en uno de cada 200 paquetes. Si un
cliente se queja de que su paquete de película no muestra la
fecha de caducidad, ¿cuál es la probabilidad de que haya
sido inspeccionado por John?
Una cadena de tiendas de pintura produce y
vende pintura de látex y semiesmaltada. De
acuerdo con las ventas a largo plazo, la
probabilidad de que un cliente compre pintura
de látex es 0.75. De los que compran pintura de
látex, 60 % también compra rodillos. Sin
embargo, sólo 30 % de los que compran pintura
semiesmaltada compra rodillos. Un comprador
que se selecciona al azar adquiere un rodillo y
una lata de pintura. ¿Cuál es la probabilidad de
que sea pintura de látex?
*VARIABLES
ALEATORIAS
*VARIABLES ALEATORIAS DISCRETAS
*VARIABLES ALEATORIAS CONTINUAS
Ejercicio 54: Basado en su experiencia, un agente
bursátil considera que en las condiciones económicas
actuales la probabilidad de que un cliente invierta
en bonos libres de impuestos es 0.6, la de que
invierta en fondos comunes de inversión es 0.3 y la
de que invierta en ambos es 0.15. En esta ocasión
encuentre la probabilidad de que un cliente invierta.
a) en bonos libres de impuestos o en fondos comunes
de inversión; b) en ninguno de esos dos
instrumentos.
Ejercicio 61: En un grupo de 100 estudiantes
graduados de preparatoria, 54 estudiaron
matemáticas, 69 estudiaron historia y 35
cursaron matemáticas e historia. Si se selecciona
al azar uno de estos estudiantes, calcule la
probabilidad de que a) el estudiante haya
cursado matemáticas o historia; b) el estudiante
no haya llevado ninguna de estas materias; c) el
estudiante haya cursado historia pero no
matemáticas.
*REGLAS DE
PROBABILIDAD
*PROBABILIDAD
*TEOREMA DE PROBABILIDAD TOTAL
*TEOREMA DE BAYES
*
Consiste en la repetición de n ensayos independientes Bernoulli
Ensayo Bernoulli: Experimento con 2 posibles resultados,
mutuamente excluyentes: éxito y fracaso con probabilidades
constantes p y 1-p, respectivamente
*DISTRIBUCIÓN
BINOMIAL
*DISTRIBUCIÓN
POISSON
*Las variables aleatorias de Poisson surgen al observar un
conjunto discreto de sucesos en un intervalo continuo de
tiempo, longitud o espacio.
*Aplicaciones de la
distribución Poisson
En el campo microbiológico…
*Cuando se busca realizar del recuento de microorganismos viables por
conteo en plato o determinar el número más probable (NMP), el
suceso a observar será el número de colonias bacterianas (UFC)
desarrolladas sobre el plato de agar o el número de tubos con
crecimiento bacteriano (positivos) y el intervalo corresponderá a la
unidad de muestra analizada, llámese gramo de suelo, o mililitro de
un líquido analizado (agua, sangre, etc).
*En el caso de la determinación de la probabilidad de mutación
bacteriana, el suceso será la observación del número de bacterias
mutantes (cada célula bacteriana mutante generará una colonia en
un medio de cultivo selectivo de dicha mutación) y el intervalo
corresponderá a la concentración bacteriana bajo observación, por
ejemplo 210 células bacterianas.
*HIPERGEOMETRICA
*BINOMIAL NEGATIVA
*Distribución Normal
La mayoría de los métodos estadísticos básicos se apoyan en la
distribución normal, su importancia radica en:
*Numerosos fenómenos continuos parecen seguirla o se pueden
aproximar mediante ella.
*Se puede utilizar para aproximar varias distribuciones
discretas de probabilidad (Binomial, Hipergeométrica,
Poisson) y de esta forma simplificar cálculos tediosos.
*Proporciona la base para la inferencia estadística clásica por
su relación con el teorema central del límite.
*Propiedades de la
Distribución Normal
Algunas de sus propiedades son:
*Tiene “forma de campana”' y es de apariencia simétrica
*Sus medidas de tendencia central (Media, mediana, moda)
son idénticas y se encuentran ubicadas en el centro de la
curva
*La variable aleatoria asociada con esta distribución tiene
rango infinito
*ESTANDARIZACIÓN (NORMAL)

Presentación clase programación con temas

  • 1.
  • 2.
    *ESTADISTICA DESCRIPTIVA La estadística.Es el conjunto sistemático de procedimientos para la observación, registro, organización, síntesis y análisis e interpretación de los fenómenos y de las leyes que los regulan para poder así predecir o concluir acerca de ellos. Esta definición claramente involucra las dos fases de la estadística: la descriptiva y la inferencial.
  • 3.
    *FASES DE LA ESTADISTICA *Descriptiva(Deductiva). Es la fase de descripción, organización, síntesis y análisis de la información de interés. *Inferencial (Inductiva). Esta fase busca obtener conclusiones sólidas y más profundas que una simple descripción de la información basados en el trabajo con muestras y su posterior generalización de resultados para la toma de decisiones y conclusiones sólidas.
  • 4.
    *CONCEPTOS BÁSICOS *Población. Conjuntototal de elementos (datos, personas, objetos, medidas, acontecimientos, atributos), que poseen una o más características observables sobre el cual se buscan conclusiones y decisiones. *Muestra. Parte de la población. *Parámetro. Medida de una característica poblacional. *Estadístico. Medida de una característica en una muestra.
  • 6.
    *VARIABLES Y TIPOS Variable.Es una característica observable en un objeto de estudio, que puede adoptar diferentes valores o categorías. *Variable cuantitativa, es aquella para la cual las mediciones arrojan datos numéricos. Las variables cuantitativas se pueden clasificar en continuas y discretas. *Variable discreta, es aquella que puede tomar finitos o infinitos valores numerables. *Variable continua, es aquella que puede tomar infinitos valores dentro de un intervalo de números reales (no numerables). *Una variable cualitativa, es aquella para la cual no es posible hacer mediciones numéricas. Las observaciones son categorías que se pueden solamente clasificar o rotular.
  • 7.
    * NIVELES DEMEDIDA O ESCALAS DE MEDICIÓN, *Escala Nominal. Los datos de las variables son rótulos usados para identificar un atributo del elemento de la muestra. Los rótulos no pueden ordenarse con sentido. *Escala Ordinal. Permiten ordenar las observaciones con sentido, como es el caso de la variable Severidad de la enfermedad (severo, moderado y sano) o nivel del daño en una pieza (leve, moderado y severo) *Escala de Intervalo. Los datos tienen propiedades de dato ordinal y se pueden determinar distancias. No hay un cero absoluto o real, el cero es arbitrario como es el caso de la variable temperatura en grados centígrados. *Escala de Razón. Los datos tienen propiedades de datos de intervalo y existe un cero real que permite considerar cocientes de mediciones, como es el caso de la variable peso.
  • 10.
    *DIAGRAMA DE PUNTOS Se construyecolocando determinado número de puntos sobre un eje horizontal de acuerdo al número de veces que se repite el dato. (Máximo 20 datos) DESCRIPCIÓN GRAFICA DE DATOS CUANTITATIVOS
  • 11.
    *DIAGRAMA DE TALLOS YHOJAS Se requiere que los datos estén conformados por al menos dos dígitos. El último dígito constituye la hoja y el ó los restantes conformarán el tallo. Para una adecuada descripción de los datos es conveniente trabajar con al menos 4 tallos. PASOS *Hacer una lista de los diferentes valores del tallo en una columna vertical *Junto al valor correspondiente del tallo se registran las hojas
  • 12.
    *HISTOGRAMAS El histograma esuna técnica gráfica utilizada para resumir una gran cantidad de datos. Se le atribuye a Karl Pearson en 1895. Tabla de frecuencias Es un arreglo tabular de las frecuencias con que ocurre cada característica en que se han dividido los datos, esta conformado por: *Intervalo de clase (caso continuo), es cada uno de los rangos de valores en que se ha decidido agrupar parcialmente los datos. *Marca de clase (caso continuo), es el punto medio del intervalo de la clase, su valor es obtenido al promediar los extremos del intervalo.
  • 13.
    *HISTOGRAMAS *Frecuencia absoluta esel número de veces que se repite un dato (caso discreto) ó el número de mediciones dentro del intervalo (caso continuo). *Frecuencia absoluta acumulada de la clase es la suma de frecuencia absoluta actual con las frecuencia anteriores *Frecuencia relativa es el cociente entre la frecuencia absoluta y el total de datos *Frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada y el número de observaciones *Caso discreto *Caso continuo
  • 14.
    *DIAGRAMA DE BARRAS *Sebasa en las tablas de frecuencia (conteo del número de elementos o individuos que tienen determinada característica). *Categóricas cualitativas barras horizontales *Categóricas cuantitativas barras verticales *PARETO (Diagrama de Barras Ordenado) DESCRIPCIÓN GRÁFICA DE DATOS CUALITATIVOS
  • 15.
    *DIAGRAMAS DE PASTEL *Permiten visualizarmejor la proporción en que aparece una característica respecto del total.
  • 16.
    *DIAGRAMA DE DISPERSIÒN *Consiste enun gráfico en el plano cartesiano que muestra la relación entre dos variables. DESCRIPCIÓN DE DOS VARIABLES
  • 17.
    *TABLAS DE CONTINGENCIA *Son tablasutilizadas cuando los elementos pueden clasificarse de acuerdo a dos o más criterios diferentes
  • 18.
    *La media aritmética *Propiedades *1.La suma de las desviaciones respecto de la media es igual a cero *2. Si se tiene la media de un conjunto de datos y a cada observación se multiplica por una constante b y se le suma una constante a, entonces la nueva media de los datos se obtiene multiplicando la media de los datos originales por b y sumándole a. *MEDIDAS DE TENDENCIA CENTRAL
  • 19.
    *Media Ponderada Se usaprincipalmente para: *Promediar observaciones con diferentes importancias o pesos 𝒙 𝒑 = ∑ 𝒊=1 𝒏 𝒘 𝒊 𝒙𝒊 ∑ 𝒊=1 𝒏 𝒘 𝒊
  • 20.
    *Media Geométrica Se usaprincipalmente para: *Promediar porcentajes, índices y cifras relativas. *Determinar el incremento porcentual promedio en ventas, producción u otras actividades o series económicas de un periodo a otro. 𝒙𝒈= 𝒏 √𝒙1 𝒙2 𝒙3 … 𝒙𝒏
  • 21.
    *Media Armónica *Generalmente seutiliza para promediar variaciones con respecto al tiempo 𝒙𝒂= 1 1 𝒏 ( 1 𝒙1 + 1 𝒙2 +…+ 1 𝒙𝒏 )
  • 22.
    *La mediana *La Medianaes el valor que divide un conjunto de datos ordenado en dos partes porcentualmente iguales
  • 23.
    *La moda Se definecomo el valor que se presenta con mayor frecuencia *Para el caso de un conjunto de datos se puede presentar una moda (unimodal) o dos modas (bimodal). *Su importancia radica en que es la única medida de tendencia para datos cualitativos
  • 24.
    Medidas de posiciónrelativa, cuantiles o fractiles Describen el comportamiento de una variable dividiendo la serie de valores en un diferente número de partes porcentualmente iguales *Los Cuartiles Son aquellos números que dividen un conjunto de datos ordenado en cuatro partes porcentualmente iguales. Hay tres cuartiles, Q1, Q2 y Q3. El primer cuartil Q1, es el valor por debajo del cual queda aproximadamente un cuarto (25%) de todos los datos. El segundo cuartil Q2 es el valor por debajo del cual queda el 50% de los datos (Mediana), y el tercer cuartil Q3 es el valor por debajo del cual quedan las tres cuartas partes (75%) de los datos. *Los Deciles Son ciertos números que dividen el conjunto de datos ordenado en diez partes porcentualmente iguales. Se denotan por D1, D2, . . . , D9. El decil 5 corresponde a la mediana. *Los Percentiles Son ciertos números que dividen el conjunto de datos ordenados en cien partes porcentualmente iguales. El percentil 50 equivale a la mediana.
  • 25.
  • 26.
    MEDIDAS DE DISPERSIÓN Determinannivel de concentración de un conjunto de datos Más variación = Heterogeneidad Menos variación =Homogeneidad *ABSOLUTAS: Varianza, Desviación Estándar, Rango y Rango Intercuartilico *RELATIVAS : Coeficiente de Variación
  • 27.
    *Varianza Se define comoel promedio (poblacional) ó el "casi promedio" (muestral) de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Propiedades de la varianza *La varianza de una constante es cero *Si se tiene la varianza de un conjunto de datos y cada observación se multiplica por una constante b , entonces la nueva varianza de los datos se obtiene multiplicando la varianza de los datos originales por b2 .
  • 28.
    *Desviación estándar La desviaciónestándar está definida como la raíz de la Varianza
  • 29.
    *Rango *Es la diferenciaentre el máximo y el mínimo valor de un conjunto de datos 𝑹𝒂𝒏𝒈𝒐=𝑴á𝒙𝒊𝒎𝒐−𝑴í𝒏𝒊𝒎𝒐
  • 30.
    *Rango Intercuartílico Es apropiadoante la presencia de datos atípicos, es la diferencia entre el tercer y el primer cuartil 𝑹𝑰=𝑸3−𝑸1
  • 31.
    *MEdiana de lasDesviaciones Absolutas (MEDA) Se utiliza ante la presencia de datos atípicos y se define como la mediana del valor absoluto de las diferencias de los datos respecto a su mediana 𝑴𝑬𝑫𝑨=𝑴𝒆𝒅𝒊𝒂𝒏𝒂|𝑴𝒆𝒅𝒊𝒂𝒏𝒂 −𝒙𝒊|
  • 32.
    *Coeficiente de Variación Es utilizadopara comparar la variabilidad entre dos grupos de datos que tienen distinta media o referidos a distintos sistemas de unidades de medida. Por ejemplo, kilogramos y centímetros.
  • 33.
    *Coeficiente de Asimetría *Medida quedetermina el grado de simetría o asimetría que presenta la distribución de un conjunto de datos MEDIDAS DE FORMA ∝3 = 𝜇 3 𝜎3 = 1 𝑁 ∑ ❑ ❑ (𝑥𝑖 − 𝜇) 3 (❑ √∑ ❑ ❑ (𝑥𝑖 −𝜇) 2 𝑁 ) 3
  • 34.
    *Coeficiente de Curtosiso Apuntamiento *Determina que tan empinada o aplanada se encuentra una distribución unimodal ∝4 = 𝜇4 𝜎 4 = 1 𝑁 ∑ ❑ ❑ (𝑥𝑖 −𝜇) 4 (❑ √∑ ❑ ❑ (𝑥𝑖 −𝜇) 2 𝑁 ) 4
  • 35.
    *COEFICIENTE DE CORRELACIÓN (r) *Midela fuerza de asociación entre dos variables r=
  • 36.
  • 37.
    *Dibujar y marcarun eje de medida horizontal. *Construir un rectángulo cuyo borde izquierdo está en el primer cuartil y cuyo borde derecho esta en el tercer cuartil . *Dibujar un segmento de recta vertical dentro del rectángulo en la mediana. *Prolongar dos rectas horizontales desde cada extremo del rectángulo de longitud 1.5 veces el rango intercuartílico. *Dibujar un circulo vacio para identificar cada observación que caiga entre 1.5 y 3.0 veces el rango intercuartílico desde los bordes del rectángulo(inusuales suaves). *Dibujar un circulo relleno para identificar cada observación que caiga a más de 3.0 veces el rango intercuartilico (inusuales extremos). *BOX PLOT
  • 38.
    *Las probabilidades sonnúmeros comprendidos entre 0 y 1. * Probabilidades próximas a 1 indican que cabe esperar que ocurran los sucesos en estudio. * Probabilidades próximas a 0 indican que no cabe esperar que ocurran los sucesos de que se trate. * Probabilidades próximas a 0.5 indican que es tan verosímil que el suceso se produzca como que no. *La teoría de la probabilidad se emplea para sacar conclusiones acerca de una población, con base en una muestra extraída utilizando métodos estadísticos llamados métodos inferenciales y para aplicarlos se requiere en el enfoque paramétrico del conocimiento de la distribución de probabilidad de los datos poblacionales. Probabilidad y Distribuciones de Probabilidad
  • 39.
    *Conceptos Básicos *Experimento aleatorio:Experimento que repetido bajo unas mismas condiciones produce resultados diferentes e impredecibles. *Espacio Muestral: S, Ω. Conjunto de posibles resultados de un experimento aleatorio. *Evento o suceso: Característica que define un subconjunto del espacio muestral. *Eventos Excluyentes (Disyuntos): Sean A y B dos eventos de Ω si A B = , estos dos eventos se ∩ ∅ dicen excluyentes.
  • 40.
    Ejemplo: en elexperimento de lanzar una moneda al aire, Ω estaría compuesto por los posibles resultados: cara o sello; Ω = {C, S}. En la ejecución del experimento aleatorio, aunque el resultado es impredecible, se sabe que debe corresponder a una de las opciones fijadas por el espacio muestral.
  • 41.
    Experimento aleatorio: lanzamientode dos dados. Espacio muestral: Ω = {(1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)} Evento: aparece el mismo número en ambos dados.
  • 42.
    Diagrama de árbolpara el experimento de lanzar dos dados: Resultados igualmente posibles y mutuamente excluyentes. Casos favorables: Probabilidad de ocurrencia del evento :
  • 43.
    Suponga que seseleccionan, de forma aleatoria, tres artículos de un proceso de fabricación. Cada artículo se inspecciona y se clasifica como defectuoso, D, o no defectuoso, N.
  • 44.
    Suponga que seseleccionan, de forma aleatoria, tres artículos de un proceso de fabricación. Cada artículo se inspecciona y se clasifica como defectuoso, D, o no defectuoso, N Ω={𝐷𝐷𝐷,𝐷𝐷𝑁,𝐷𝑁𝐷,𝐷𝑁𝑁 ,𝑁𝐷𝐷,𝑁𝐷𝑁,𝑁𝑁𝐷,𝑁𝑁𝑁}
  • 45.
    Evento A: Elnúmero de artículos defectuosos sea mayor que 1. Esto ocurrirá si el resultado es un elemento del subconjunto. Dado el espacio muestral = {t | t ≥ 0}, donde t es la vida en años de cierto componente electrónico, el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto. A = {t | 0 ≤ t < 5}.
  • 46.
    Los espacios muestralescon un número grande o infinito de puntos muestrales se describen mejor mediante un enunciado o método de la regla. Por ejemplo, si el conjunto de resultados posibles de un experimento fuera el conjunto de ciudades en el mundo con una población de más de un millón de habitantes, nuestro espacio muestral se escribiría como:
  • 47.
    Si es elconjunto de todos los puntos (x, y) sobre los límites o el interior de un círculo de radio 2 con centro en el origen, escribimos la regla:
  • 48.
    *Algebra y σ-Algebra *es un Algebra , entonces , entonces *σ-Algebra , entonces ,… entonces ,… entonces
  • 49.
    Probabilidad clásica Si unexperimento aleatorio resulta de formas igualmente posibles y mutuamente excluyentes y si de dichos resultados favorecen a la situación de interés , la probabilidad de , denotada , es:
  • 50.
    *Axiomas de Probabilidad Sea Ωun espacio muestral y A un evento cualquiera de Ω. Para todo A en Ω se asigna un número llamado probabilidad de A, notado P(A), tal que: i) 1 ii) =1 iii) P
  • 51.
    El complemento deun evento respecto de S es el subconjunto de todos los elementos de S que no están en . Denotamos el complemento de mediante el símbolo La intersección de dos eventos A y B, que se denota con el símbolo A B, es el evento que ∩ contiene todos los elementos que son comunes a A y a B. Dos eventos A y B son mutuamente excluyentes o disjuntos si ; es decir, si A y B no tienen elementos en común.
  • 52.
    La unión dedos eventos A y B, que se denota con el símbolo A B, es el evento que contiene todos ∪ los elementos que pertenecen a A o B, o a ambos. Probabilidad para la unión de eventos:
  • 53.
    Ejemplo Las enfermedades Iy II son comunes entre los individuos de cierta población. Se supone que el 10 % de la población contraerá la enfermedad I alguna vez durante su vida, 15% contraerá eventualmente la enfermedad II, y el 3 % contraerá ambas. Encuentre la probabilidad de que un individuo elegido al azar de esta población, contraiga al menos una enfermedad. A: El individuo contrae la enfermedad I B: El individuo contrae la enfermedad II
  • 55.
  • 56.
    Ejemplo: Suponga queuna familia sale de vacaciones de verano en su casa rodante y que M es el evento de que sufrirán fallas mecánicas, T es el evento de que recibirán una infracción por cometer una falta de tránsito y V es el evento de que llegarán a un lugar para acampar que esté lleno. Exprese con palabras los eventos representados por las siguientes regiones:
  • 57.
    *Principio Fundamental del Conteo Principio demultiplicación: Si una operación se puede llevar a cabo en formas, y si para cada una de éstas se puede realizar una segunda operación en formas, entonces las dos operaciones se pueden ejecutar juntas de formas. Para etapas, el experimento completo es …
  • 58.
    Ejemplo: ¿Cuántos puntos muestraleshay en el espacio muestral cuando se lanza un par de dados una vez? Un urbanista de una nueva subdivisión ofrece a los posibles compradores de una casa elegir entre Tudor, rústica, colonial y tradicional el estilo de la fachada, y entre una planta, dos pisos y desniveles el plano de construcción. ¿En cuántas formas diferentes puede un comprador ordenar una de estas casas?
  • 60.
    Sam va aarmar una computadora y para comprar las partes tiene que elegir entre las siguientes opciones: dos marcas de circuitos integrados, cuatro marcas de discos duros, tres marcas de memorias y cinco tiendas locales en las que puede adquirir un conjunto de accesorios. ¿De cuántas formas diferentes puede Sam comprar las partes? ¿Cuántos números pares de cuatro dígitos se pueden formar con los dígitos 0, 1, 2, 5, 6 y 9, si cada dígito se puede usar sólo una vez?
  • 61.
    Una permutación esun arreglo de todo o parte de un conjunto de objetos. Considere las tres letras a, b y c. Las permutaciones posibles.
  • 62.
    Factorial: Para cualquier enterono negativo denominado “ -factorial” se define como con el caso especial de 0! = 1. Permutaciones posibles de a, b, c y d. Ahora el número de permutaciones que son posibles tomando dos de las cuatro letras a la vez. ¿?
  • 63.
    El número depermutaciones de objetos distintos tomados de a la vez es: Definido como:
  • 64.
    Ejemplo: En un añose otorgará uno de tres premios (a la investigación, la enseñanza y el servicio) a algunos de los estudiantes, de un grupo de 25, de posgrado del departamento de estadística. Si cada estudiante puede recibir un premio como máximo, ¿cuántas selecciones posibles habría?
  • 65.
    Permutaciones circulares: Ocurren alarreglar objetos en un círculo. De modo que el primer elemento también representa al primero. Ejemplo: ¿Cuántas formas hay de ubicar en una mesa a 4 personas?
  • 66.
    Para n girosposibles , luego
  • 67.
    El número depermutaciones distintas de objetos, en el que son de una clase, de una segunda clase,..., de una k-ésima clase es: Ejemplo: Durante un entrenamiento de fútbol americano colegial, el coordinador defensivo necesita tener a 10 jugadores parados en una fila. Entre estos 10 jugadores hay 1 de primer año, 2 de segundo año, 4 de tercer año y 3 de cuarto año, respectivamente. ¿De cuántas formas diferentes se pueden arreglar en una fila si lo único que los distingue es el grado en el cual están?
  • 68.
    El número deformas de partir un conjunto de n objetos en r celdas con elementos en la primera celda, elementos en la segunda, y así sucesivamente, es: donde Ejemplo: Un hotel va a hospedar a siete estudiantes de posgrado que asisten a una conferencia ¿ en cuántas formas los puede asignar a una habitación triple y a dos doble?
  • 69.
    COMBINATORIA: En muchos problemasnos interesamos en el número de formas de seleccionar r objetos de n sin importar el orden. El número de combinaciones de objetos distintos tomados de a la vez es: Ejemplo: Un niño le pide a su madre que le lleve cinco cartuchos de Game-BoyTM de su colección de 10 juegos recreativos y 5 de deportes. ¿De cuántas maneras podría su madre llevarle 3 juegos recreativos y 2 de deportes?
  • 70.
    ¿Cuántos arreglos diferentesde letras se pueden hacer con las letras de la palabra STATISTICS?
  • 71.
    Reglas aditivas A menudoresulta más sencillo calcular la probabilidad de algún evento a partir de las probabilidades conocidas de otros eventos. Esto puede ser cierto si el evento en cuestión se puede representar como la unión de otros dos eventos o como el complemento de algún evento.
  • 72.
    Si A yB son eventos, entonces:
  • 73.
    Ejemplo: Al finaldel semestre John se va a graduar en la facultad de ingeniería industrial de una universidad. Después de tener entrevistas en dos empresas en donde quiere trabajar, determina que la probabilidad que tiene de lograr una oferta de empleo en la empresa A es 0.8, y que la probabilidad de obtenerla en la empresa B es 0.6. Si, por otro lado, considera que la probabilidad de recibir ofertas de ambas empresas es 0.5, ¿qué probabilidad tiene de obtener al menos una oferta de esas dos empresas?
  • 74.
    Luego, la probabilidadtiene de obtener al menos una oferta de esas dos empresas es del 90% Si A y B son mutuamente excluyentes, entonces: ¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados?
  • 75.
    Si A yB son mutuamente excluyentes, entonces: ¿Cuál es la probabilidad de obtener un total de 7 o 11 cuando se lanza un par de dados? Luego, la probabilidad de obtener un total de 7 o 11 cuando se lanza un par de dados es 22,22%
  • 76.
    Este resultado tambiénse podría obtener contando el número total de puntos para el evento A B, es decir, 8 y escribir: ∪
  • 77.
    *Si son mutuamenteexcluyentes, entonces: Las probabilidades de que un individuo que compra un automóvil nuevo elija uno de color verde, uno blanco, uno rojo o uno azul son 0.09, 0.15, 0.21 y 0.23, respectivamente, ¿cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que tenga uno de esos colores?
  • 78.
    Las probabilidades deque un individuo que compra un automóvil nuevo elija uno de color verde, uno blanco, uno rojo o uno azul son 0.09, 0.15, 0.21 y 0.23, respectivamente, ¿cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que tenga uno de esos colores?
  • 79.
    A menudo esmás difícil calcular la probabilidad de que ocurra un evento que calcular la probabilidad de que el evento no ocurra. Si A y A’ son eventos complementarios, entonces:
  • 80.
    Si las probabilidadesde que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7, 8 o más vehículos en un día de trabajo dado son 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07, respectivamente, ¿cuál es la probabilidad de que dé servicio al menos a 5 vehículos el siguiente día de trabajo? E= al menos a 5 vehículos reciban el servicio el siguiente día de trabajo. E’= de que menos a 5 vehículos reciban el servicio día de trabajo
  • 81.
    Si las probabilidadesde que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7, 8 o más vehículos en un día de trabajo dado son 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07, respectivamente, ¿cuál es la probabilidad de que dé servicio al menos a 5 vehículos el siguiente día de trabajo? E= al menos a 5 vehículos reciban el servicio el siguiente día de trabajo. E’= de que menos a 5 vehículos reciban el servicio día de trabajo P(E’) = 0.12 + 0.19 = 0.31. Entonces: P(E) = 1 – 0.31 = 0.69.
  • 82.
    Ejercicio 52: Supongaque se descubre que, en un grupo de 500 estudiantes universitarios de último año, 210 fuman, 258 consumen bebidas alcohólicas, 216 comen entre comidas, 122 fuman y consumen bebidas alcohólicas, 83 comen entre comidas y consumen bebidas alcohólicas, 97 fuman y comen entre comidas y 52 tienen esos tres hábitos nocivos para la salud. Si se selecciona al azar a un miembro de este grupo, calcule la probabilidad de que el estudiante: a) Fume pero no consuma bebidas alcohólicas; b) Coma entre comidas y consuma bebidas alcohólicas pero no fume; c) No fume ni coma entre comidas.
  • 83.
    *Probabilidad condicional Es la probabilidadde que ocurra un evento B cuando se sabe que ya ocurrió algún evento A. Decimos “la probabilidad de que ocurra B, dado que ocurrió A” “la probabilidad de B, dado A”
  • 84.
    Caracterizar a ungrupo de estudiantes según dos variables: género (H, M) y fumar (S, N)
  • 85.
    La probabilidad deque un vuelo programado normalmente salga a tiempo es P(D) = 0.83, la probabilidad de que llegue a tiempo es P(A) = 0.82 y la probabilidad de que salga y llegue a tiempo es P(D A) = 0.78. Calcule la ∩ probabilidad de que un avión a) llegue a tiempo, dado que salió a tiempo; b) salió a tiempo, dado que llegó a tiempo.
  • 86.
    Independientes Dos eventos Ay B son independientes si y sólo si, o se asume la existencia de probabilidad condicional. De otra forma, A y B son dependientes.
  • 87.
    Investigadores encuestaron arecién graduados de dos universidades diferentes sobre sus ingresos anuales. La siguiente tabla de contingencia exhibe datos de los graduados que respondieron la encuesta: Ganancia anual Universidad A Universidad B TOTAL Menos de $20,000 36 24 60 De $20,000 a 39,999 109 56 165 $40,000 y más 35 40 75 TOTAL 180 120 300
  • 88.
    Supongamos que deestos datos elegimos aleatoriamente a un graduado. *¿Son independientes los eventos "el ingreso es de $40,000 y más" y "asistió a la Universidad B"? *¿Son independientes los eventos "el ingreso es de menos de $20,000" y "asistió a la Universidad B"?
  • 89.
    *La regla deproducto o regla multiplicativa Si en un experimento pueden ocurrir los eventos A y B, entonces: P(A B) = P(A)P(B|A) ∩ siempre que P(A) > 0 Cuando son independientes P(A B) = P(A)P(B) ∩
  • 90.
    P(A B) =P(B A) = P(B)P(A|B) ∩ ∩ No importa qué evento se considere como A ni qué evento se considere como B. Ejemplo: que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan 2 fusibles al azar y se retiran de la caja, uno después del otro, sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles estén defectuosos?
  • 91.
    Una bolsa contiene4 bolas blancas y 3 negras, y una segunda bolsa contiene 3 blancas y 5 negras. Se saca una bola de la primera bolsa y se coloca sin verla en la segunda bolsa. ¿Cuál es la probabilidad de que ahora se saque una bola negra de la segunda bolsa?
  • 93.
    Dos eventos Ay B son independientes si y sólo si P(A B) = P(A)P(B) ∩ Por lo tanto, para obtener la probabilidad de que ocurran dos eventos independientes simplemente calculamos el producto de sus probabilidades individuales.
  • 94.
    Una pequeña ciudaddispone de un carro de bomberos y una ambulancia para emergencias. La probabilidad de que el carro de bomberos esté disponible cuando se necesite es 0.98 y la probabilidad de que la ambulancia esté disponible cuando se le requiera es 0.92. En el evento de un herido en un incendio, calcule la probabilidad de que tanto la ambulancia como el carro de bomberos estén disponibles, suponiendo que operan de forma independiente. Sean A y B los respectivos eventos de que estén disponibles el carro de bomberos y la ambulancia. Entonces, P(A B) = P(A)P(B) = (0.98)(0.92) = 0.9016. ∩
  • 95.
    *Probabilidad total Si loseventos constituyen una partición del espacio muestral S, tal que para , entonces, para cualquier evento de ,
  • 97.
    Tres máquinas decierta planta de ensamble, , montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora bien, suponga que se selecciona de forma aleatoria un producto terminado. ¿Cuál es la probabilidad de que esté defectuoso?
  • 100.
    *Regla de Bayes Laestadística bayesiana es un conjunto de herramientas que se utiliza en un tipo especial de inferencia estadística que se aplica en el análisis de datos experimentales en muchas situaciones prácticas de ciencia e ingeniería.
  • 101.
    Suponga que seselecciona un producto de forma aleatoria y que éste resulta defectuoso. ¿Cuál es la probabilidad de que este producto haya sido ensamblado con la máquina ? Las preguntas de este tipo se pueden contestar usando el siguiente teorema, denominado regla de Bayes: Si los eventos constituyen una partición del espacio muestral , donde para , entonces, para cualquier evento en , tal que , Para
  • 102.
    Del ejemplo anterior,si se elige al azar un producto y se encuentra que está defectuoso, ¿cuál es la probabilidad de que haya sido ensamblado con la máquina ? En vista de que se seleccionó un producto defectuoso, este resultado sugiere que probablemente no fue ensamblado con la máquina .
  • 103.
    Una empresa defabricación de coches tiene tres fábricas. La primera fábrica produce un 40 del total de coches y la segunda fábrica produce otro 15 del total. Por cada lote de producción se hace un control de calidad en todas las fábricas. En la primera fábrica, un 0,05 de los coches analizados son defectuosos; en la segunda fábrica, esta cantidad asciende al 0,08; mientras que en la tercera fábrica, baja al 0,04. ¿Cuál es la probabilidad de coger un coche al azar y que sea defectuoso? la probabilidad de escoger un coche al azar y que sea defectuoso es del 5%.
  • 104.
    Suponga que loscuatro inspectores de una fábrica de película colocan la fecha de caducidad en cada paquete de película al final de la línea de montaje. John, quien coloca la fecha de caducidad en 20% de los paquetes, no logra ponerla en uno de cada 200 paquetes; Tom, quien la coloca en 60% de los paquetes, no logra ponerla en uno de cada 100 paquetes; Jeff, quien la coloca en 15% de los paquetes, no lo hace una vez en cada 90 paquetes; y Pat, que fecha 5% de los paquetes, falla en uno de cada 200 paquetes. Si un cliente se queja de que su paquete de película no muestra la fecha de caducidad, ¿cuál es la probabilidad de que haya sido inspeccionado por John?
  • 105.
    Una cadena detiendas de pintura produce y vende pintura de látex y semiesmaltada. De acuerdo con las ventas a largo plazo, la probabilidad de que un cliente compre pintura de látex es 0.75. De los que compran pintura de látex, 60 % también compra rodillos. Sin embargo, sólo 30 % de los que compran pintura semiesmaltada compra rodillos. Un comprador que se selecciona al azar adquiere un rodillo y una lata de pintura. ¿Cuál es la probabilidad de que sea pintura de látex?
  • 106.
  • 107.
    Ejercicio 54: Basadoen su experiencia, un agente bursátil considera que en las condiciones económicas actuales la probabilidad de que un cliente invierta en bonos libres de impuestos es 0.6, la de que invierta en fondos comunes de inversión es 0.3 y la de que invierta en ambos es 0.15. En esta ocasión encuentre la probabilidad de que un cliente invierta. a) en bonos libres de impuestos o en fondos comunes de inversión; b) en ninguno de esos dos instrumentos.
  • 108.
    Ejercicio 61: Enun grupo de 100 estudiantes graduados de preparatoria, 54 estudiaron matemáticas, 69 estudiaron historia y 35 cursaron matemáticas e historia. Si se selecciona al azar uno de estos estudiantes, calcule la probabilidad de que a) el estudiante haya cursado matemáticas o historia; b) el estudiante no haya llevado ninguna de estas materias; c) el estudiante haya cursado historia pero no matemáticas.
  • 109.
  • 110.
    *TEOREMA DE PROBABILIDADTOTAL *TEOREMA DE BAYES *
  • 111.
    Consiste en larepetición de n ensayos independientes Bernoulli Ensayo Bernoulli: Experimento con 2 posibles resultados, mutuamente excluyentes: éxito y fracaso con probabilidades constantes p y 1-p, respectivamente *DISTRIBUCIÓN BINOMIAL
  • 112.
    *DISTRIBUCIÓN POISSON *Las variables aleatoriasde Poisson surgen al observar un conjunto discreto de sucesos en un intervalo continuo de tiempo, longitud o espacio.
  • 113.
    *Aplicaciones de la distribuciónPoisson En el campo microbiológico… *Cuando se busca realizar del recuento de microorganismos viables por conteo en plato o determinar el número más probable (NMP), el suceso a observar será el número de colonias bacterianas (UFC) desarrolladas sobre el plato de agar o el número de tubos con crecimiento bacteriano (positivos) y el intervalo corresponderá a la unidad de muestra analizada, llámese gramo de suelo, o mililitro de un líquido analizado (agua, sangre, etc). *En el caso de la determinación de la probabilidad de mutación bacteriana, el suceso será la observación del número de bacterias mutantes (cada célula bacteriana mutante generará una colonia en un medio de cultivo selectivo de dicha mutación) y el intervalo corresponderá a la concentración bacteriana bajo observación, por ejemplo 210 células bacterianas.
  • 114.
  • 115.
  • 116.
    *Distribución Normal La mayoríade los métodos estadísticos básicos se apoyan en la distribución normal, su importancia radica en: *Numerosos fenómenos continuos parecen seguirla o se pueden aproximar mediante ella. *Se puede utilizar para aproximar varias distribuciones discretas de probabilidad (Binomial, Hipergeométrica, Poisson) y de esta forma simplificar cálculos tediosos. *Proporciona la base para la inferencia estadística clásica por su relación con el teorema central del límite.
  • 117.
    *Propiedades de la DistribuciónNormal Algunas de sus propiedades son: *Tiene “forma de campana”' y es de apariencia simétrica *Sus medidas de tendencia central (Media, mediana, moda) son idénticas y se encuentran ubicadas en el centro de la curva *La variable aleatoria asociada con esta distribución tiene rango infinito
  • 118.

Notas del editor

  • #4 La estadística. Algunas definiciones dadas por autores son: Susan: es el arte de la decisión frente a la incertidumbre. Steel and Torrie: La estadística es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre de inferencias deductivas. La Descriptiva (Deductiva). Es la fase de descripción, organización, síntesis y análisis de la información de interés, pero sin llegar a conclusiones fuertes o profundas sobre la misma; es más, una fase de recolección y organización de información para su examen cuidadoso. La Inferencial (Inductiva). Esta fase busca obtener conclusiones sólidas y más profundas que una simple descripción de la información, basados en el trabajo con muestras y su posterior generalización de resultados para la toma de decisiones y conclusiones sólidas. Variable. Se entiende de una manera ``informal'' como la característica, atributo o medida que se desea conocer y estudiar. Esta característica puede tomar un número de valores finito o infinito contable. Las variables pueden ser cuantitativas o cualitativas. Una variable cuantitativa, es aquella para la cual las mediciones arrojan datos númericos. Las variables cuantitativas se pueden clasificar en continuas y discretas. Una variable continua, es aquella que puede tomar cualquier valor dentro de cierto intervalo de números reales.