SlideShare una empresa de Scribd logo
1 de 80
Bioestadística
- colección de métodos para planear experimentos
obtener datos
organizarlos
resumirlos
presentarlos
analizarlos
interpretarlos
llegar a conclusiones basadas ellos
ESTADÍSTICA:- ciencia de los datos
ESTADÍSTICA DESCRIPTIVA: utiliza métodos numéricos y gráficos para
organizar, resumir y describir las características
importantes de un conjunto de datos para que
sean presentadas de una forma comprensible.
utiliza los datos de la muestra para inferir o
predecir parámetros poblacionales; se realizan
deducciones que van más allá de los datos
conocidos. Esto es realizado por un proceso de
razonamiento inductivo basado en la teoría
matemática de las probabilidades.
ESTADÍSTICA INFERENCIAL:
Es una serie de técnicas ligadas con el fin de recolectar por
medio de test, encuestas, censos, entre otras formas, un
conjunto de datos. Luego organizar de manera cuantitativa o
cualitativamente, según sea el caso. Presentar los resultados
ya sea por tablas o por gráficos y finalmente analizar el
conjunto de datos para sacar conclusiones y así poder tomar
una buena decisión.
Estadística Descriptiva
POBLACIÓN: colección completa de todos los elementos con ciertas
características, que estamos interesados en estudiar.
MUESTRA: subconjunto de miembros, representativo de la población,
seleccionado por un procedimiento específico.
PARÁMETRO: medición numérica que describe algunas características de una
población.
ESTADÍSTICO: medición numérica que describe algunas características de una
muestra.
métodos que no hacen suposiciones restrictivas respecto
a la forma de las distribuciones de las poblaciones
ESTADÍSTICOS
PARAMÉTRICOS:
métodos más utilizados por los investigadores, para
emplearlos suponemos que las muestras provienen de
poblaciones normalmente distribuidas
ESTADÍSTICOS NO
PARAMÉTRICOS:
MUESTRA ALEATORIA: los miembros de una población se
seleccionan de manera que cada miembro individual tiene la
misma posibilidad de ser elegido
MUESTRA ALEATORIA SIMPLE: cada posible muestra de
tamaño n tiene la misma posibilidad de ser elegida
infinitos posibles valores pueden asociarse a puntos de alguna
escala continua, cubriendo un rango de valores sin huecos,
pueden tomar cualquier valor dentro de un intervalo dado;
valores enteros y decimales;
son producto de mediciones
VARIABLE: propiedad real medida por las observaciones individuales,
con respecto a la cual los individuos de una población
difieren de algún modo verificable.
CLASIFICACIÓN DE LAS VARIABLES
CUALITATIVAS: se dividen en distintas categorías que se distinguen por
alguna característica no numérica.
CUANTITATIVAS: consisten en números que representan conteos o
mediciones; sus distintos valores pueden expresarse de
forma numéricamente ordenada.
- Discretas: puede tomar un número finito de posibles valores;
generalmente valores enteros;
son producto de conteos
- Continuas:
Determine si los siguientes valores corresponden a variables
discretas o continuas
9. La estatura media de las mujeres ecuatorianas es de 1,62 m
10. La temperatura ambiente en las aulas de la EIE varía entre 19,4
y 24,8 ºC
11. El 88,7% de los hogares en las áreas urbanas ecuatorianas
posee al menos 2 aparatos de TV
12. El peso medio de una muestra de computadores portátiles es
de 879 g
13. Más de la mitad de los nutricionistas ecuatorianos recibe un
salario mayor o igual a 1500 U$S
14. En un examen de estadística 15% de los estudiantes obtuvieron
la calificación R, 60% obtuvieron B, y el resto obtuvieron MB
15. Los usuarios de una empresa telefónica realizan una media de
1,8 llamadas internacionales por mes
Tiempo
Datos distantes
Distribución
Variación
Centro
ANÁLISIS DE DATOS
CARACTERÍSTICAS IMPORTANTES DE LOS DATOS:
Clases f fr fr %
A
B
C
D
Total
DISTRIBUCIÓN DE FRECUENCIAS: tabla que presenta las clases o
categorías de la variable y sus respectivas frecuencias
FRECUENCIA ABSOLUTA (f): número de observaciones que caen dentro de
una clase particular
CLASE: cada una de las categorías en que los datos pueden ser agrupados
FRECUENCIA RELATIVA PROPORCIONAL (fr): frecuencia de clase
dividido el total de frecuencias
FRECUENCIA RELATIVA PORCENTUAL (fr %): obtenemos el porcentaje
de cada categoría en relación al total de casos, frecuencia relativa
multiplicada por cien
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS
Clases f fr fr %
Tarifas y servicios 4473 0,21 21
Marketing 1007 0,05 5
Llamadas internacionales 766 0,04 4
Cargos de acceso 614 0,03 3
Servicios de operadora 534 0,03 3
Cambios sin consentimiento 12478 0,59 59
Forzamiento 1214 0,06 6
Total 21086 1,00 100
EJEMPLO.- Causas de quejas en contra de las compañías telefónicas
DISTRIBUCIÓN DE FRECUENCIAS
Tarifas
y
servicios
M
arketing
Internacionales
Cargos
de
acceso
Servicios
de
operadora
Cam
bios
sin
consentim
iento
Forzam
iento
Gráfica de barras: la altura de cada barra representa la frecuencia o
frecuencia relativa de cada clase
Fig.1.- Causas de quejas en contra de las compañías telefónicas
0
2000
4000
6000
8000
10000
12000
14000
frecuencia
categorías
Gráfica de barras: la altura de cada barra representa la frecuencia o
frecuencia relativa de cada clase
fr%
Tarifas
y
servicios
M
arketing
Internacionales
Cargos
de
acceso
Servicios
de
operadora
Cam
bios
sin
consentim
iento
Forzam
iento
Fig. 2.- Causas de quejas en contra de las compañías telefónicas
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
categorías
Gráficas circulares
representa datos cualitativos como si fueran rebanadas de un pastel; los
valores de frecuencia relativa se transforman a grados de un círculo
5%
4%
3%
3%
58%
6%
21% Tarifas y servicios
Marketing
Llamadas internacionales
Cargos de acceso
Servicios de operadora
Cambios sin consentimiento
Forzamiento
Fig. 3.- Causas de quejas en contra de las compañías telefónicas
Clases f fr fr % fr % *3,6
Tarifas y servicios 4473 0,21 21 76
Marketing 1007 0,05 5 17
Llamadas internacionales 766 0,04 4 13
Cargos de acceso 614 0,03 3 10
Servicios de operadora 534 0,03 3 9
Cambios sin consentimiento 12478 0,59 59 213
Forzamiento 1214 0,06 6 21
Total 21086 1,00 100 360
Intervalos
de Clase Li Ls x f fr fr% F Fr Fr%
1
2
3
4
5
Total
LÍMITES DE CLASE INFERIORES (Li): cifras más pequeñas que pueden pertenecer
a las diferentes clases
LÍMITES DE CLASE SUPERIORES (Ls): cifras más grandes que pueden pertenecer a
las diferentes clases
MARCAS DE CLASE (x): puntos medios de las clases. Se suma el límite de clase
inferior al límite de clase superior y se divide entre 2
.
FRECUENCIA ABSOLUTA ACUMULADA (F): suma de las frecuencias absolutas de
cada clase con las de las clases anteriores
FRECUENCIA RELATIVA PROPORCIONAL ACUMULADA (Fr): suma de las
frecuencias relativas proporcionales de cada clase con las de las clases anteriores
FRECUENCIA RELATIVA PORCENTUAL ACUMULADA (Fr %): suma de las
frecuencias relativas porcentuales de cada clase con las de las clases anteriores
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS
(DATOS AGRUPADOS)
2.- calcular Rango o Amplitud
3.- calcular No de clases
4.- calcular ancho del intervalo
5.- elegir un valor para el Li de la primera clase
8.- calcular marca de cada clase
6.- calcular Li de cada clase
7.- identificar Ls de cada clase
R = dato mayor – dato menor
k = n
i =
R
k
Li2 = Li1 + i
x =
Li + Ls.
1.- ordenar datos de menos a mayor
Intervalos
de Clase
Li Ls x f fr fr% F Fr Fr%
1
2
3
4
5
Total
.PASOS PARA CONSTRUCCIÓN DE DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES
CUANTITATIVAS (DATOS AGRUPADOS)
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
EJEMPLO.- Tiempo de vida de lámparas fluorescentes producidas por la
empresa XX (días)
Intervalos
de Clase
Li Ls x f fr fr% F Fr Fr%
1 154 160 157 3 0,06 6 3 0,06 6
2 161 167 164 6 0,12 12 9 0,18 18
3 168 174 171 13 0,26 26 22 0,44 44
4 175 181 178 15 0,30 30 37 0,74 74
5 182 188 185 4 0,08 8 41 0,82 82
6 189 195 192 5 0,10 10 46 0,92 92
7 196 202 199 4 0,08 8 50 1,00 100
Total 50 1,00 100
.
0
2
4
6
8
10
12
14
16
dias
frecuencia
154 -160 161-167 168-174 175-181 182-188 189-195 196-202
Fig. 4.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
Histograma: gráfica de barras donde la escala horizontal representa clases
de valores de datos y la escala vertical representa frecuencias o frecuencias
relativas (la proporción del área total por encima de un intervalo es igual a la
frecuencia relativa)
0
5
10
15
20
25
30
35
dias
fr%
154 -160 161-167 168-174 175-181 182-188 189-195 196-202
Fig. 5.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
0
5
10
15
20
25
30
35
0 157 164 171 178 185 192 199 206
dias
fr%
157 164 171 178 185 192 199
Fig. 6.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
Polígono de frecuencias: segmentos lineales conectados a puntos que se
encuentran por encima de los valores de las marcas de clase, inicia y termina
sobre el eje horizontal.
Ojiva: gráfica lineal que representa frecuencias acumuladas, utiliza las
fronteras de clase
0
10
20
30
40
50
60
0
días
Frecuenciaacumulada
Fig. 7.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
160,5 167,5 174,5 181,5 188,5 195,5 202,5
Tallo Hojas
15 444
16 3344568888
17 00234444455556677799
18 00012467
19 00112699
20 1
Gráfica de tallo y hojas: separan cada valor en dos partes, el tallo (dígito
en extremo izquierdo) y la hoja (dígito en extremo derecho); permite ver la
distribución de los datos y a la vez mantener toda la información original
Gráfica de puntos: cada valor de un dato se representa como un punto a lo
largo de una escala de valores, los puntos que representan valores iguales se
amontonan
• •••• • • •••••• •••• • •• ••• • • •
• •• • • •••• •• •• •
• • •• • •
• ••
•
150 160 170 180 190 200
Fig. 8.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
Fig. 9.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
Regla del suceso infrecuente para estadística inferencial:
Si, bajo un supuesto dado, la probabilidad de un suceso particular
observado es extremadamente pequeña, concluimos que el supuesto
probablemente es erróneo.
Suceso: cualquier conjunto de resultados o consecuencias de un
procedimiento
Suceso simple: resultado o suceso que ya no puede desglosarse
en componentes más simples
Espacio muestral: todos los sucesos simples posibles para un
procedimiento
Procedimiento o Experimento: proceso mediante el cual se
obtiene un resultado. Un experimento puede tener uno o más
resultados posibles a los que se denominan eventos o sucesos.
Suceso compuesto: cualquier suceso que combina dos o mas
sucesos simples
La Teoría de la Probabilidad (Ciencia de la Incertidumbre) nos ayuda
a evaluar en forma científica los riesgos para tomar decisiones.
Ejemplo:
Una ruleta tiene 38 ranuras distintas, y es diseñada de manera que las 38 ranuras sean
igualmente probables de resultar. Usted planea apostar al número 13 en el próximo giro.
Cual es la probabilidad de que pierda?
3 enfoques diferentes para definir la probabilidad de un suceso:
1) Método clásico de la probabilidad
P(A) =
número de formas en que puede ocurrir A
número de sucesos simples diferentes
sólo para resultados
equiprobables
− si es aplicable, la probabilidad obtenida es exacta
− no exige la realización de experiencias ni la recogida de datos
− de fácil uso
P(A) =
37
38
= 0,97
10.- En un estudio de reconocimiento de marcas, 831 consumidores conocían la marca HP y 18
no. Use dichos resultados para estimar la probabilidad de que un consumidor que se selecciona al
azar reconozca la marca HP.
3 enfoques diferentes para definir la probabilidad de un suceso:
2) Aproximación de la probabilidad por frecuencias relativas
aparece como el resultado de muchos ensayos o pruebas y consiste en dar a la frecuencia relativa
de una distribución un sentido probabilístico
P(A) =
número de veces que ocurre A
número de veces que se repitió el ensayo
− la experiencia debe ser repetible
− cualquier probabilidad obtenida a partir de la frecuencia relativa es una aproximación (en
lugar de un valor exacto)
Ley de los grandes números:
conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas de un
suceso tiende a aproximarse a la probabilidad real
P(A) =
831
849
= 0,98
3) Probabilidades subjetivas (grado de creencia)
P(A) se obtiene suponiendo o estimando su valor en base al conocimiento de las
circunstancias relevantes
− siempre es aplicable.
− su acierto depende de lo correcta que sea la información de la que dispone
− no se pueden dar reglas para su determinación precisa, y por tanto escapa al
tratamiento matemático
− difícil de defender
Ejemplo:
Cual es la probabilidad de que su auto sea impactado por un meteorito este año?
En base al conocimiento relevante se estima una
probabilidad muy cercana a 0
la probabilidad matemática de cualquier suceso es 0, 1, o un número entre 0 y 1
• 0 ≤ P(A) ≤ 1
• la probabilidad de un suceso imposible es 0
• la probabilidad de un suceso que ocurrirá con certeza es 1
cierto
probable
probabilidad 50-50
improbable
imposible
1
0
0,5
Cálculo de la Probabilidad de un Evento
−• Definir el experimento
−• Listar todos los Eventos Posibles
−• Asignar Probabilidad a cada Evento Simple
−• Determinar la Composición del Evento de interés
−• Calcular la probabilidad del Evento
Probabilidad de dos
eventos A y B
Probabilidad de dos
eventos A y B
P(A o B)
Son A y B mutuamente
excluyentes?
P(A o B)
Son A y B mutuamente
excluyentes?
P(A y B)
Son A y B
independientes?
P(A y B)
Son A y B
independientes?
P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B)
P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B)
P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B)
P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A)
NONOSISI NONOSISI
P(A o B)
Regla de la suma
son A y B
mutuamente
excluyentes?
P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B)
P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B)
P(A) P(B)
P(A y B)
P(A U B) = P(A) + P(B) - P(A ∩ B)P(A U B) = P(A) + P(B) - P(A ∩ B)
P(A) P(B)
P(A U B) = P(A) + P(B)P(A U B) = P(A) + P(B)
SISI
NONO
Dos suceso A y B son
mutuamente excluyentes
cuando ambos no pueden
ocurrir juntos
Dos suceso A y B son
mutuamente excluyentes
cuando ambos no pueden
ocurrir juntos
P(A y B)
Regla de la multiplicacion
son A y B
independientes?
P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B)
P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A)
SISI
NONO
Dos suceso A y B son independientes cuando
la ocurrencia de uno no afecta la probabilidad
de la ocurrencia del otro
Dos suceso A y B son independientes cuando
la ocurrencia de uno no afecta la probabilidad
de la ocurrencia del otro
Dos sucesos A y B
son independientes si
Dos sucesos A y B
son dependientes si
P(B | A) = P(B)
o
P(A y B) = P(A) * P(B)
P(B | A) ≠ P(B)
o
P(A y B) ≠ P(A) * P(B)
P(B | A) =
P(A)
P(A y B)
Prueba de independencia
Probabilidad
condicional
Sucesos complementarios
A = complemento del suceso A, consiste en todos los
resultados en los cuales el suceso A no ocurre
P(A) + P (A) = 1
P(A) = 1 - P(A)
P(A) = 1 - P(A)
P(A)
P(A) = 1 - P(A)
probabilidad de “uno al menos”
para calcular la probabilidad de uno al menos de algo, calcule la
probabilidad de ninguno, y reste el resultado a 1
P(uno al menos) = 1 - P(ninguno)
P(A) = 1 - P(A)
Cual es la probabilidad de seleccionar un computador que no sea de 50 Giga?
Cual es la probabilidad de sacar al menos un 5 al tirar 3 dados?
Variable aleatoria: variable que tiene
un solo valor numérico (x), determinado por el
azar, para cada resultado de un procedimiento.
Variable aleatoria discreta: tiene un
número finito de valores o un número de
valores contable (pueden asociarse con un
proceso de conteo)
Variable aleatoria continua: tiene un
número infinito de valores, los cuales pueden
asociarse a mediciones en una escala continua,
de manera que no haya huecos ni
interrupciones
DISTRIBUCIONES DE PROBABILIDAD
Distribución de probabilidad: gráfica, tabla o fórmula que da la probabilidad
de cada valor de la variable aleatoria.
Requisitos de una distribución de probabilidad
∑ P(x) = 1
0 ≤ P(x) ≤ 1
x P(x)
0 0,502
1 0,345
2 0,108
3 0,041
4 0,004
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1 2 3 4
número de defectos en cada grupo
P(x)
Ejemplo. Durante la fabricación de un modelo de DVD, se seleccionan
aleatoriamente grupos de DVD y se calcula el número de defectos en cada
grupo
Distribución Binomial
DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL
resulta de un procedimiento que cumple con todos los requisitos siguientes:
1.- el procedimiento tiene un número fijo de ensayos
2.- los ensayos deben ser independientes (el resultado de cualquier ensayo individual no
afecta las probabilidades de los otros ensayos)
3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías
4.- las probabilidades tienen que mantenerse constantes para cada ensayo
NOTACIÓN PARA DISTRIBUCIONES DE PROBABILIDAD BINOMIAL
n número fijo de ensayos
2 categorías posibles de resultado: E (éxito) y F (fracaso)
p probabilidad de éxito en uno de n ensayos p = P(E)
q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 - p
x número específico de éxitos en n ensayos (cualquier entero entre 0 y n, inclusive)
P(x) probabilidad de lograr exactamente x éxitos en los n ensayos
Respuesta a)
1.- el procedimiento tiene un número fijo de ensayos. R: si
2.- los ensayos deben ser independientes. R: si
3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías. R: si
4.- las probabilidades tienen que mantenerse constantes para cada ensayo. R: si
Respuesta b)
n número fijo de ensayos = 8
p probabilidad de éxito en uno de n ensayos p = P(E) = 1/5 = 0,20
q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 – p = 1 – 0,20 = 0,80
x número específico de éxitos en n ensayos = 6
Ejemplo. Análisis de respuestas de opción múltiple. Un profesor aplica un examen
sorpresa que consta de ocho preguntas de opción múltiple, cada una con cinco
respuestas posibles (a, b, c, d y e), pero solo una de ellas correcta. Supongamos que un
estudiante sin preparación adecuada hace adivinanzas al azar, y que queremos calcular
la probabilidad de que tenga exactamente seis respuestas correctas en las ocho
preguntas.
a) resultará este proceso en una distribución binomial?
b) si la respuesta anterior es si, identifique los valores de n, x, p y q
P(x) = . px
. qn-x
n!
(n - x)! x!
P(x) = nCx . px
. qn-x
c) calcule la probabilidad de que tenga exactamente cuatro respuestas correctas
d) calcule la probabilidad de que tenga menos de cuatro respuestas correctas
e) calcule la probabilidad de que tenga más de cuatro respuestas correctas
f) calcule la probabilidad de que tenga como máximo cuatro respuestas correctas
g) calcule la probabilidad de que tenga al menos cuatro respuestas correctas
h) calcule la probabilidad de que tenga entre cuatro y seis respuestas correctas
P(4) = 8C4 . 0,204
. 0,804
= 0,046
P(X<4) = P(0) + P(1) + P(2) + P(3) = 0,94
P(X>4) = P(5) + P(6) + P(7) + P(8) = 0,10
P(X≤4) = P(0) + P(1) + P(2) + P(3) + P(4) = 0,99
P(X≥4) = P(4) + P(5) + P(6) + P(7) + P(8) = 0,056
P(4≤X≤6) = P(4) + P(5) + P(6) = 0,056
μ = n . p σ2
= n . p . q σ = n . p . q
Ejemplo. Varios estudiantes no se prepararon para un examen sorpresa de
verdadero/falso de 10 preguntas, por lo cual todas sus repuestas son adivinanzas.
a.- calcule las media y la desviación estándar del número de respuestas correctas que
obtendrán.
b.- sería poco común que un estudiante pasara el examen adivinando y obtuviera al
menos 7 respuestas correctas?
valor mínimo “común” ≈ μ - 2 (σ)
valor máximo “común” ≈ μ + 2 (σ)
Respuestas
a.- μ = n . p = 10 . 0,5 = 5
σ = n . p . q = 10 . 0,5 . 0,5 = 2,5 = 1,58
b.- valor máximo “común” ≈ μ + 2 (σ) = 5 + 2(1,58) = 8,16
R: no, no sería poco común.
Distribución Normal
Si una variable aleatoria continua tiene una distribución con una gráfica simétrica y en
forma de campana, a la vez que puede ser descrita por medio de la siguiente ecuación,
decimos que tiene distribución normal
μ
intervalos
f(
x)
x
Propiedades de la curva normal:
- es simétrica con respecto a la media aritmética
- decrece uniformemente en ambas direcciones a partir del valor central
- las dos colas nunca tocan el eje horizontal
- a cualquier área debajo de la curva se le puede dar un criterio
probabilístico (f/n)
50% 50%
100%
-∞ ∞
z =
σ
x - μ
z =
s
x - x
s desviación estándar muestral
σ desviación estándar poblacional
x valores de datos individuales
x media de un conjunto de valores muestrales
μ media de valores de una población
ESTANDARIZACIÓN o NORMALIZACIÓN
Ej: μ = US$ 25
σ = US$ 5
x = US$ 20
2520
μµ-1σ
0-1
99,7%
95%
68%
x
+s-s
+2s
+3s
-2s
-3s
Regla empírica para datos con distribución normal
• 68% de todos los valores están dentro de una desviación
estándar de la media
• 95% de todos los valores están dentro de dos desviaciones
estándar de la media
• 99,7% de todos los valores están dentro de tres desviaciones
estándar de la media
99,74%
95,44%
68,26%
μ
+σ-σ
+2σ
+3σ
-2σ
-3σ
99,7%
95%
68%
x
+s-s
+2s
+3s
-2s
-3σ
-2,58σ +2,58σ-1,96σ +1,96σ μμ
μ
95%
2,5% 2,5%
99%
0,5% 0,5%
μ ± 1,96σ μ ± 2,58σ
95%
5%
+1,65σ μ
95%
5%
-1,65σ
Análisis de 2 colas
Análisis de 1 cola al 95%
-∞ ∞ -∞ ∞
-∞ ∞ -∞ ∞
-1,96 1,96
1) Determinar si un valor de x pertenece a la población de estudio
El tiempo de vida de las lámparas fluorescentes producidas por la empresa XX se
distribuye normalmente con una media de 176,5 días y una desviación estándar de 11,3
días. Es probable que una lámpara seleccionada aleatoriamente, con un tiempo de vida
de 207,4 días pertenezca a esta población?
z =
σ
x - μ
z =
11,3
207,4 – 176,5
= 2,73
x (días) 176,5
207,4
z 0 2,73
Interpretación:
Es probable que no pertenezca a la población de estudio
De acuerdo a un estudio, el tiempo de reemplazo de los televisores se distribuye
normalmente, con una media de 8,2 años y una desviación estándar de 1,1 años.
a) Cual es la probabilidad de que un televisor elegido al azar dure entre 8,2 y 10 años?
z =
σ
x - μ
z =
1,1
10 - 8,2
= 1,64
x (años) 8,2 10 z 0 1,64
P(0 a 1,64) = 0,4495
Interpretación:
a) la probabilidad de que un televisor dure entre 8,2 y 10 años es de 0,4495
Medidas
De
Tendencia Central
Medidas De Tendencia Central
valor que se encuentra en el centro o la mitad de un conjunto de datos
Media aritmética: medida de tendencia central que se obtiene sumando los
puntajes y dividiendo el total entre el número de puntajes
∑x
x =
n
∑x
μ =
N
x valores de datos individuales
n número de valores de una muestra
N número de valores de una población
x media de un conjunto de valores muestrales
μ media de valores de una población
Media aritmética de una distribución de frecuencias (datos agrupados)
∑(f . x)x =
n
. x marca de clase
f frecuencia
.
ANÁLISIS ESTADÍSTICO SIMPLE
clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x * f
471
984
2223
2670
740
960
796
8844
∑x
x =
n
8824
=
50
= 176,5
8844
=
50
= 176,9
∑(f . x)x =
n
.
. .
cálculo de la media aritmética a partir de un conjunto de datos sin agrupar
cálculo de la media aritmética a partir de un conjunto de datos agrupados
Mediana:
L Me =
2
n + 1
50% de los valores ≤ Me ≤ 50% de los valores
Si el número de valores es impar, la Me es el valor que se localiza
exactamente a la mitad de la lista ordenada, si el número de
valores es par se obtiene calculando la media de los dos números
que están a la mitad
valor que se encuentra en medio, cuando los valores originales se
presentan en orden de magnitud creciente
Mediana de una distribución de frecuencias (datos agrupados)
Li límite inferior de la clase que contiene Me
i ancho de clase
f frecuencia de clase que contiene Me
Fa frecuencia acumulada de clase anterior
Li + i
Me =
- (Fa+1)
f
2
n+1
8
8
3
5
9
2
4 8
8
3
5
1
1
4
3
Posición en
la lista
ordenada
2 – 3 – 4 – 5 – 8 – 8 – 9 1 – 1 – 3 – 3 – 4 – 5 – 8 – 8
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
154 154 154 163 163
164 164 165 166 168
168 168 168 170 170
172 173 174 174 174
174 174 175 175 175
175 176 176 177 177
177 179 179 180 180
180 181 182 184 186
187 190 190 191 191
192 196 199 199 201
L Me =
2
n + 1 51
=
2
= 25,5
Me =
175 + 175
2
350
=
2
= 175,0
cálculo de la mediana a partir de un conjunto de datos sin agrupar
conjunto de datos en orden ascendente
clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
Li + i
Me =
- (Fa+1)
f
2
n+1
=
175 + 7
51
- 23
2
15
= 176,2
.
cálculo de la mediana a partir de un conjunto de datos agrupados
ClasequecontienealaMe
0
20
40
60
80
100
0
días
Fr%
Fig. 7.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
160,5 167,5 174,5 181,5 188,5 195,5 202,5
cálculo de la mediana a partir de una ojiva
8
8
3
5
2
1
4
3
Moda: valor que ocurre con mayor frecuencia
8
8
3
5
9
2
48
5
9
8
7
5
2
1
4
3
6
Moda de una distribución de frecuencias (datos agrupados)
Li límite inferior de la clase modal
i ancho de clase
Δ1 diferencia entre f de clase modal y clase anterior
Δ2 diferencia entre f de clase modal y clase siguiente
Li + * i
Mo =
Δ1
Δ1 + Δ2
unimodal bimodal No hay moda
clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
.
identificación de la moda a partir de un conjunto de datos sin agrupar
cálculo de la moda a partir de un conjunto de datos agrupados
Li + * i
Mo =
Δ1
Δ1 + Δ2
175 + * 7
=
2
2 + 11
= 176,1
Clasemodal
Mitad del rango:
valor que esta a medio camino entre el puntaje más alto y
el más bajo
Mitad del rango =
2
valor máximo + valor mínimo
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Mitad del rango =
2
valor máximo + valor mínimo 201 + 154
=
2
= 177,5
cálculo de la mitad del rango a partir de un conjunto de datos sin agrupar
Media − Toma en cuanta cada valor
− Se ve afectada por valores extremos
− Siempre existe
− Confiable (cuando las muestras se extraen
de la misma población, las medias
muestrales tienden a ser más consistentes
que las otras medidas de tendencia central)
Mediana − No toma en cuanta cada valor
− No se ve afectada por valores extremos
− es más representativa que la media cuando
hay datos muy extremos
Moda − No toma en cuanta cada valor
− No se ve afectada por valores extremos
− Puede no existir o haber más de una
− No se usa mucho con datos numéricos, es
la única que puede usarse con datos de
nivel nominal
Mitad del rango − No toma en cuanta cada valor
− Se ve afectada por valores extremos
• Datos numéricos
• Distribuciones simétricas
• Datos ordinales o numéricos
• Distribuciones asimétricas
• Pocas observaciones
• Datos nominales
• Distribuciones bimodales
Características De Las Diferentes Medidas De Tendencia Central
• Una comparación de la media, la mediana y la moda puede revelar información
acerca de la característica del sesgo
• Una distribución de datos es simétrica si la mitad izquierda de su histograma es
aproximadamente una imagen especular de su mitad derecha
• Una distribución de datos está sesgada si no es simétrica y se extiende más
hacia un lado que hacia el otro
Sesgada a la derecha (sesgo positivo)
Media y mediana a la derecha de la moda
Sesgada a la izquierda (sesgo negativo)
Media y mediana a la izquierda de la moda
Mo Me x MoMex
Mo = Me = x
leptocúrtica platicúrticamesocúrtica
3 ( x – Me )
as =
s
Coeficiente de asimetría de Pearson
MEDIDAS
de
DISPERSIÓN
MEDIDAS DE DISPERSIÓN
Proporcionan información acerca de la variabilidad presente en un conjunto de datos
Rango : diferencia entre el valor máximo y el valor mínimo de un
conjunto de datos
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Rango = (valor máximo) - (valor mínimo)
Rango = (valor máximo) - (valor mínimo) = 201 - 154 = 47,0
ANÁLISIS ESTADÍSTICO SIMPLE
cálculo del rango a partir de un conjunto de datos sin agrupar
s2
=
∑ ( x - x )2
n - 1
σ2
=
∑ ( x - μ )2
N
s2
varianza muestral
σ2
varianza poblacional
x valores de datos individuales
n número de valores de una muestra
N número de valores de una población
x media de un conjunto de valores muestrales
μ media de valores de una población
Varianza : medida de variación de los valores con respecto a la media,
indica la desviación promedio de los valores, con respecto a la media
n (n - 1)
=
n ∑(x2
) - (∑x)2
=
N ∑(x2
) - (∑x)2
N2
varianza de una distribución de frecuencias (datos agrupados)
x marca de clase
f frecuencia
.
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s2
=
n (n – 1)
. .
= 127,8 días2
=
6260,48
49
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x x - x (x - x)2
154 -22,48 505,3504
199 22,52 507,1504
191 14,52 210,8304
177 0,52 0,2704
163 -13,48 181,7104
192 15,52 240,8704
176 -0,48 0,2304
180 3,52 12,3904
….. ….. …..
….. ….. …..
∑x = 8824
n = 50
x = 176,48
∑(x - x)2
= 6260,48
n - 1 = 49
s2
=
∑ ( x - x )2
n - 1
cálculo de la varianza a partir de un conjunto de datos sin agrupar
Valores a calcular
Fórmula A
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x x2
154 23716
199 39601
191 36481
177 31329
163 26569
192 36864
176 30976
180 32400
….. …..
….. …..
∑x = 8824
(∑x)2
= 77862976
∑(x2
) = 1563520
n = 50
n∑(x2
) = 78176000
n (n-1) = 2450
n (n - 1)
n ∑(x2
) - (∑x)2
50 (1563520) - 77862976
50 (49)
s2
= = = 127,8 días2
cálculo de la varianza a partir de un conjunto de datos sin agrupar
Fórmula B
50 (1570340) - 78216336s2
=
2450
= 122,7 días2
clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
f . x x2
f . x2
471 24649 73947
984 26896 161376
2223 29241 380133
2670 31684 475260
740 34225 136900
960 36864 184320
796 39601 158404
8844 223160 1570340
∑ (f . x2
) = 1570340
∑ (f . x) = 8844
[∑ (f . x)]2
= 78216336
n (n-1) = 2450
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s2
=
n (n – 1)
. .
. . ..
.
.
.
cálculo de la varianza a partir de un conjunto de datos agrupados
s desviación estándar muestral
σ desviación estándar poblacional
x valores de datos individuales
n número de valores de una muestra
N número de valores de una población
x media de un conjunto de valores muestrales
μ media de valores de una población
Desviación
Estándar :
− medida de variación de todos los valores con respecto a la media
− su valor suele ser positivo
− se puede incrementar de manera drástica con la inclusión de datos
distantes
− las unidades de la desviación estándar son las mismas de los datos
originales
=
n (n - 1)
n ∑(x2
) - (∑x)2
=
N ∑(x2
) - (∑x)2
N2
s =
∑ ( x - x )2
n - 1
σ =
∑ ( x - μ )2
N
desviación estándar de una distribución de frecuencias (datos agrupados)
x marca de clase
f frecuencia
.
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s =
n (n – 1)
. .
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
s = = 11,3 díass2
= 127,8
cálculo de la desviación estándar a partir de un conjunto de datos sin agrupar
clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
f . x x2
f . x2
471 24649 73947
984 26896 161376
2223 29241 380133
2670 31684 475260
740 34225 136900
960 36864 184320
796 39601 158404
8844 223160 1570340
. . ..
s = = 11,1 díass2
= 122,7
cálculo de la desviación estándar a partir de un conjunto de datos agrupados
s desviación estándar muestral
σ desviación estándar poblacional
x media de un conjunto de valores muestrales
μ media de valores de una población
Coeficiente de
variación
describe la desviación estándar relativa a la media
CV = .100%
x
s
CV = .100%
μ
σ
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Peso de lámparas fluorescentes producidas por la empresa YY
221,2 223,5 225,0 224,3 223,3
219,1 218,5 223,4 222,1 220,2
218,0 224,1 221,7 223,7 225,4
227,5 220,9 222,6 225,8 223,5
225,6 225,7 220,8 225,9 220,0
224,5 220,2 222,1 223,3 222,7
223,5 220,6 225,8 224,7 223,2
225,1 219,3 220,4 223,3 224,1
222,3 222,8 224,8 226,6 225,4
220,1 220,2 224,7 225,5 222,3
CV = .100%
x
s
= .100%
222,99
2,30
= 1,03%
CV = .100%
x
s
= .100%
176,5
11,3
= 6,40%
comparación del coeficiente de variación de dos conjuntos de datos
Regla práctica del intervalo
• para muchos conjuntos de datos, la vasta mayoría (tanto como el 95%) de los
valores muestrales se ubican dentro de 2 desviaciones estándar (s) de la media
valor mínimo “común” ≈ x - 2 (s)
valor máximo “común” ≈ x + 2 (s)
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
cálculo de valores mínimo y máximo común por la regla práctica del intervalo
valor mínimo “común” ≈ x - 2 (s) ≈ 176,5 - 2 (11,3) ≈ 176,5 - 22,6 ≈ 153,9 días
valor máximo “común” ≈ x + 2 (s) ≈ 176,5 + 2 (11,3) ≈ 176,5 + 22,6 ≈ 199,1 días
Regla empírica para datos con distribución normal
• aprox el 68% de todos los valores están dentro de una desviación estándas de la
media
• aprox el 95% de todos los valores están dentro de dos desviaciones estándar de la
media
• aprox el 99,7% de todos los valores están dentro de tres desviaciones estándar de la
media
Ejercicio: las puntuaciones de CI de adultos
normales tienen una distribución normal,
con una media de 100 y una desviación
estándar de 15. Qué porcentaje de adultos
tienen puntuaciones de CI entre 55 y 145?
100 - 3(15) = 55
100 + 3(15) = 145
el 99,7% de todas las puntuaciones de CI
se encuentran entre 55 y 145
Teorema de Chebyshev
• la proporción de cualquier conjunto de datos que está dentro de k
desviaciones estándar de la media es siempre al menos 1 - 1 / k2
, donde k
es cualquier número positivo mayor que 1
para k = 2
• al menos 3/4 (75%) de todos los valores están dentro de 2 desviaciones
estándar de la muestra
para k = 3
• al menos 8/9 (89%) de todos los valores están dentro de 3 desviaciones
estándar de la muestra
Ejercicio: las puntuaciones de CI de adultos normales tienen una media de 100 y una
desviación estándar de 15. Qué podemos concluir a partir del teorema de Chebyshev?
• Por lo menos 75% de todos los adultos tienen puntuaciones de CI que están entre 70 y 130
• Al menos 89% de todos los adultos tienen puntuaciones de CI que están entre 55 y 145
Medidas
de
Posición Relativa
z =
σ
x - μ
z =
s
x - x
s desviación estándar muestral
σ desviación estándar poblacional
x valores de datos individuales
x media de un conjunto de valores muestrales
μ media de valores de una población
pueden utilizarse para comparar valores de diferentes conjuntos de datos (puntuaciones z) o para
comparar valores dentro del mismo conjunto de datos (cuantiles o fractiles)
puntuación z : número de desviaciones estándar que un valor (x) se encuentra por arriba
o por debajo de la media
ANÁLISIS ESTADÍSTICO SIMPLE
MEDIDAS DE POSICIÓN RELATIVA
valores de z positivos indican que x > que la media, valores negativos indican que x < que la media
valores comunes: -2 ≤ puntuación z ≤ 2
valores infrecuentes: puntuación z < -2 o puntuación z > 2
-3 -2 -1 0 1 2 3
valores comunes valores infrecuentesvalores infrecuentes
Ejercicio:
HP lanza al mercado un nuevo modelo de computador portátil de 14 pulgadas
que pesa 1,36 kg, al mismo tiempo que SONY promociona su nuevo modelo
de 17 pulgadas de 3,08 kg.
El modelo de HP es más liviano, pero cual de los dos es relativamente mas
liviano? El peso del modelo HP entre los computadores portátiles de 14
pulgadas, es más liviano que el del modelo SONY entre los de 17 pulgadas?
Las portables de 14 pulgadas en el mercado poseen pesos con una media de
2,58 kg y una desviación estándar de 0,67 kg; mientras que los modelos de 17
pulgadas poseen pesos con una media de 4,23 kg y una desviación estándar
de 0,54 kg
14 pulgadas
μ 2,58
σ 0,67
HP 1,36
17 pulgadas
μ 4,23
σ 0,54
SONY 3,08
z =
σ
x - μ
z HP -1,82 z SONY -2,13
cuantiles o fractiles: separan los datos en grupos con casi el mismo número de valores
existen 3 cuartiles (Q1, Q2 y Q3), que dividen los valores ordenados en 4 partes iguales
• Q1 (primer cuartil): separa el 25% inferior de los valores ordenados, del 75% superior
• Q2 (segundo cuartil): separa el 50% inferior de los valores ordenados, del 50% superior
• Q3 (tercer cuartil): separa el 75% inferior de los valores ordenados, del 25% superior
existen 99 percentiles (P1, P2, …P99), que separan los datos en 100 grupos, con
aproximadamente el 1% de los valores en cada grupo
deciles…
quintiles…
percentil del valor x = . 100
número de valores menores que x
número total de valores
conversión de un valor muestral dado a su percentil correspondiente
LQ1 = ¼ (n+1), si es número decimal, redondear hacia arriba
LQ2 = Mediana = ½ (n+1), si es número decimal, promediar entre los dos valores centrales
LQ3 = ¾ (n+1), si es número decimal, redondear hacia abajo
Posición en
la lista
ordenada
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
percentil de 196?
Q1?
Q2?
Q3?
percentil del valor x = . 100
número de valores menores que x
número total de valores
percentil de 196 = . 100 = 92
46
50
LQ1 = ¼ (n+1) = 12,75 ≈ 13
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 154 154 163 163
164 164 165 166 168
168 168 168 170 170
172 173 174 174 174
174 174 175 175 175
175 176 176 177 177
177 179 179 180 180
180 181 182 184 186
187 190 190 191 191
192 196 199 199 201
Presentar conjunto de datos en orden ascendente
LQ2 = ½ (n+1) = 25,5
LQ3 = ¾ (n+1) = 38,25 ≈ 38
Q1 = 168
Q2 = (175 +175) / 2 = 175Q2 = (175 +175) / 2 = 175
Q3 = 182
VALORES ATÍPICOS
DATOS DISTANTES o VALORES ATÍPICOS:
observación que es significativamente mas grande o más pequeña con respecto a los otros
valores en una serie de datos
pueden afectar en gran medida el valor de la media y de la desviación estándar, así como
distorsionar gravemente un histograma
• observación registrada incorrectamente
• observación proviene de diferente población
• observación correcta, pero representa un evento raro
1.- puntuación z: observaciones con puntuaciones z mayores que 2 en valor absoluto son
consideradas atípicas.
2.- diagrama de caja: gráfica de un conjunto de datos que consiste en una línea
que se extiende desde el valor mín hasta el valor máx, así como una caja con
líneas trazadas en Q1, Me y Q3
métodos para detectar valores atípicos:
Pueden deberse a:
Q1 168
Q2 175
Q3 182
IQR (Q3-Q1) 14
Vmáx 201
Vmín 154
Q1 - 1,5 (IQR) 147
Q3 + 1,5 (IQR) 203
Q1 - 3 (IQR) 126
Q3 + 3 (IQR) 224
Q1 - 1,5 (IQR)
Le Li Li Le
Q3 + 1,5 (IQR)
Q3 + 3 (IQR)Q1 - 3 (IQR)
Vmín Vmáx
Pasos a seguir en la construcción de un diagrama de caja:
• Calcular Me, Q1 y Q3, y el rango intercuartilar (IQR) de una
serie de datos (IQR = Q3 - Q1)
• Construir una caja sobre el eje X con la ubicación de Q1 y Q3.
El ancho de la caja es igual al IQR. Trazar una línea vertical
dentro de la caja en el valor de la Me
• Dibujar líneas que se extiendan hacia fuera del cuadro, hasta los
valores mín y máx
• Identificar limites interiores localizados a una distancia de 1,5
(IQR) debajo de Q1 y por encima de Q3; y límites exteriores
localizados a una distancia de 3 (IQR) debajo de Q1 y por
encima de Q3
120 130 140 150 160 170 180 190 200 210 220 230
Q1 Me Q3
(IQR)valores
altamente
sospechosos
valores
altamente
sospechosos
valores
sospechosos
valores
sospechosos

Más contenido relacionado

La actualidad más candente

RENNY MENDOZA Resolucion ejercicios dist normal
 RENNY MENDOZA  Resolucion ejercicios dist normal RENNY MENDOZA  Resolucion ejercicios dist normal
RENNY MENDOZA Resolucion ejercicios dist normalrennyjse
 
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...Jose Joaquin Muñoz Gonzalez
 
Distribuciones Muestrales
Distribuciones MuestralesDistribuciones Muestrales
Distribuciones MuestralesHector Funes
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mataKassandra Gomez
 
Md ejercicios resueltos teoria de la decision
Md   ejercicios resueltos teoria de la decisionMd   ejercicios resueltos teoria de la decision
Md ejercicios resueltos teoria de la decisionSarita Carbajal
 
Programación lineal
Programación linealProgramación lineal
Programación linealMinerva RG
 
Tamaño de muestra para diferencia de dos medias y dos proporciones
Tamaño de muestra para diferencia de dos medias  y dos proporcionesTamaño de muestra para diferencia de dos medias  y dos proporciones
Tamaño de muestra para diferencia de dos medias y dos proporcionesDomingo de la Cerda
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovDavid Solis
 
Introduccion al diseño de experimentos
 Introduccion al diseño de experimentos Introduccion al diseño de experimentos
Introduccion al diseño de experimentosIsabel Leon
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesYazmin Venegas
 

La actualidad más candente (20)

Pruebas de hipotesis - Introducción
Pruebas de hipotesis - IntroducciónPruebas de hipotesis - Introducción
Pruebas de hipotesis - Introducción
 
Trabajo arbol dedecisiones
Trabajo arbol dedecisiones Trabajo arbol dedecisiones
Trabajo arbol dedecisiones
 
RENNY MENDOZA Resolucion ejercicios dist normal
 RENNY MENDOZA  Resolucion ejercicios dist normal RENNY MENDOZA  Resolucion ejercicios dist normal
RENNY MENDOZA Resolucion ejercicios dist normal
 
Tecnicas de muestreo
Tecnicas de muestreoTecnicas de muestreo
Tecnicas de muestreo
 
Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02
 
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...
Tablas de distribucion normal con la probabilidad definitiva - Con todos los ...
 
Distribuciones Muestrales
Distribuciones MuestralesDistribuciones Muestrales
Distribuciones Muestrales
 
Distribucion normal completo
Distribucion normal completoDistribucion normal completo
Distribucion normal completo
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mata
 
Md ejercicios resueltos teoria de la decision
Md   ejercicios resueltos teoria de la decisionMd   ejercicios resueltos teoria de la decision
Md ejercicios resueltos teoria de la decision
 
Chi cuadrada
Chi cuadradaChi cuadrada
Chi cuadrada
 
Ejercicios estadistica inferencial
Ejercicios estadistica inferencialEjercicios estadistica inferencial
Ejercicios estadistica inferencial
 
Estadística: Prueba de Tukey
Estadística: Prueba de TukeyEstadística: Prueba de Tukey
Estadística: Prueba de Tukey
 
Taller estadística. Guias
Taller estadística. GuiasTaller estadística. Guias
Taller estadística. Guias
 
Programación lineal
Programación linealProgramación lineal
Programación lineal
 
Tamaño de muestra para diferencia de dos medias y dos proporciones
Tamaño de muestra para diferencia de dos medias  y dos proporcionesTamaño de muestra para diferencia de dos medias  y dos proporciones
Tamaño de muestra para diferencia de dos medias y dos proporciones
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-Smirnov
 
Introduccion al diseño de experimentos
 Introduccion al diseño de experimentos Introduccion al diseño de experimentos
Introduccion al diseño de experimentos
 
Hipotesis2
Hipotesis2Hipotesis2
Hipotesis2
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporciones
 

Similar a Estadistica

Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosjennypao39
 
Tema 2: Distribuciones de Frecuencia
Tema 2: Distribuciones de FrecuenciaTema 2: Distribuciones de Frecuencia
Tema 2: Distribuciones de FrecuenciaSistemadeEstudiosMed
 
Cap 3c2 medidas numéricas si agrupadas
Cap 3c2   medidas numéricas si  agrupadasCap 3c2   medidas numéricas si  agrupadas
Cap 3c2 medidas numéricas si agrupadasleydycabade
 
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdfPaoloFranciscoHurtad
 
Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007CESAR A. RUIZ C
 
Pre estatadistica tabla de Frecuencias.ppt
Pre estatadistica tabla de Frecuencias.pptPre estatadistica tabla de Frecuencias.ppt
Pre estatadistica tabla de Frecuencias.pptImBluee
 
métodos gréficos
métodos gréficosmétodos gréficos
métodos gréficosMarco Rojas
 
Distribución de tablas en bioestadística
Distribución de tablas en bioestadísticaDistribución de tablas en bioestadística
Distribución de tablas en bioestadísticadiegofamateo123
 
Tema 1.3 métodos gráficos oficial
Tema 1.3 métodos gráficos oficialTema 1.3 métodos gráficos oficial
Tema 1.3 métodos gráficos oficialanthonymaule
 
Estadistica negocios 7
Estadistica negocios 7Estadistica negocios 7
Estadistica negocios 7johnny garcia
 
Introducción a la Estadística ccesa007
Introducción a la Estadística  ccesa007Introducción a la Estadística  ccesa007
Introducción a la Estadística ccesa007Demetrio Ccesa Rayme
 
Grouped data 04 2020
Grouped data 04   2020Grouped data 04   2020
Grouped data 04 2020Edgar Mata
 
Ordenamiento de datos en estadistica iv (1)
Ordenamiento de datos en estadistica iv (1)Ordenamiento de datos en estadistica iv (1)
Ordenamiento de datos en estadistica iv (1)YULIANA ROSAS
 

Similar a Estadistica (20)

Variables
VariablesVariables
Variables
 
Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratorios
 
Mic sesión 3
Mic sesión 3Mic sesión 3
Mic sesión 3
 
Regla sturges
Regla sturgesRegla sturges
Regla sturges
 
Tema 2: Distribuciones de Frecuencia
Tema 2: Distribuciones de FrecuenciaTema 2: Distribuciones de Frecuencia
Tema 2: Distribuciones de Frecuencia
 
Cap 3c2 medidas numéricas si agrupadas
Cap 3c2   medidas numéricas si  agrupadasCap 3c2   medidas numéricas si  agrupadas
Cap 3c2 medidas numéricas si agrupadas
 
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf
2_DISTRIBUCIÓN DE FRECUENCIAS (ORGANIZACIÓN DE DATOS)-2023-3-3 (1).pdf
 
Estadistica gral
Estadistica gralEstadistica gral
Estadistica gral
 
Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007
 
Pre estatadistica tabla de Frecuencias.ppt
Pre estatadistica tabla de Frecuencias.pptPre estatadistica tabla de Frecuencias.ppt
Pre estatadistica tabla de Frecuencias.ppt
 
métodos gréficos
métodos gréficosmétodos gréficos
métodos gréficos
 
Distribución de tablas en bioestadística
Distribución de tablas en bioestadísticaDistribución de tablas en bioestadística
Distribución de tablas en bioestadística
 
Tema 1.3 métodos gráficos oficial
Tema 1.3 métodos gráficos oficialTema 1.3 métodos gráficos oficial
Tema 1.3 métodos gráficos oficial
 
Estadistica negocios 7
Estadistica negocios 7Estadistica negocios 7
Estadistica negocios 7
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
01 presentacion de datos u ap
01 presentacion de datos u ap01 presentacion de datos u ap
01 presentacion de datos u ap
 
Introducción a la Estadística ccesa007
Introducción a la Estadística  ccesa007Introducción a la Estadística  ccesa007
Introducción a la Estadística ccesa007
 
Nociones estadistica nuevo
Nociones estadistica nuevoNociones estadistica nuevo
Nociones estadistica nuevo
 
Grouped data 04 2020
Grouped data 04   2020Grouped data 04   2020
Grouped data 04 2020
 
Ordenamiento de datos en estadistica iv (1)
Ordenamiento de datos en estadistica iv (1)Ordenamiento de datos en estadistica iv (1)
Ordenamiento de datos en estadistica iv (1)
 

Último

Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxvladisse
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfGegdielJose1
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdflupismdo
 
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdf
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdfEL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdf
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdfssuser2887fd1
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.ManfredNolte
 
Sección 13 Inventarios, NIIF PARA PYMES
Sección  13 Inventarios, NIIF PARA PYMESSección  13 Inventarios, NIIF PARA PYMES
Sección 13 Inventarios, NIIF PARA PYMESssuser10db01
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdflupismdo
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasDeniseGonzales11
 
Trabajo tres_23 de abrilkckckckkckkccckc
Trabajo tres_23 de abrilkckckckkckkccckcTrabajo tres_23 de abrilkckckckkckkccckc
Trabajo tres_23 de abrilkckckckkckkccckclauravacca3
 
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZAS
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZASVALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZAS
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZASJhonPomasongo1
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroMARTINMARTINEZ30236
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionPedroSalasSantiago
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICOlupismdo
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayEXANTE
 
Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfAdrianKreitzer
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSreyjuancarlosjose
 
ley del ISO Y acreditamientos y extensiones
ley del ISO Y acreditamientos y extensionesley del ISO Y acreditamientos y extensiones
ley del ISO Y acreditamientos y extensionesYimiLopesBarrios
 
Proyecto de catálogo de cuentas EMPRESA.
Proyecto de catálogo de cuentas EMPRESA.Proyecto de catálogo de cuentas EMPRESA.
Proyecto de catálogo de cuentas EMPRESA.ssuser10db01
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxmanuelrojash
 

Último (20)

Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptx
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
 
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdf
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdfEL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdf
EL ESTADO Y LOS ORGANISMOS AUTONOMOS.pdf
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
 
Sección 13 Inventarios, NIIF PARA PYMES
Sección  13 Inventarios, NIIF PARA PYMESSección  13 Inventarios, NIIF PARA PYMES
Sección 13 Inventarios, NIIF PARA PYMES
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuencias
 
Trabajo tres_23 de abrilkckckckkckkccckc
Trabajo tres_23 de abrilkckckckkckkccckcTrabajo tres_23 de abrilkckckckkckkccckc
Trabajo tres_23 de abrilkckckckkckkccckc
 
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZAS
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZASVALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZAS
VALOR DEL DINERO EN EL TIEMPO - 2024 - SEMINARIO DE FINANZAS
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financiero
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacion
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
 
Mercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdfMercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdf
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en Uruguay
 
Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdf
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
 
ley del ISO Y acreditamientos y extensiones
ley del ISO Y acreditamientos y extensionesley del ISO Y acreditamientos y extensiones
ley del ISO Y acreditamientos y extensiones
 
Proyecto de catálogo de cuentas EMPRESA.
Proyecto de catálogo de cuentas EMPRESA.Proyecto de catálogo de cuentas EMPRESA.
Proyecto de catálogo de cuentas EMPRESA.
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
 

Estadistica

  • 2. - colección de métodos para planear experimentos obtener datos organizarlos resumirlos presentarlos analizarlos interpretarlos llegar a conclusiones basadas ellos ESTADÍSTICA:- ciencia de los datos ESTADÍSTICA DESCRIPTIVA: utiliza métodos numéricos y gráficos para organizar, resumir y describir las características importantes de un conjunto de datos para que sean presentadas de una forma comprensible. utiliza los datos de la muestra para inferir o predecir parámetros poblacionales; se realizan deducciones que van más allá de los datos conocidos. Esto es realizado por un proceso de razonamiento inductivo basado en la teoría matemática de las probabilidades. ESTADÍSTICA INFERENCIAL:
  • 3. Es una serie de técnicas ligadas con el fin de recolectar por medio de test, encuestas, censos, entre otras formas, un conjunto de datos. Luego organizar de manera cuantitativa o cualitativamente, según sea el caso. Presentar los resultados ya sea por tablas o por gráficos y finalmente analizar el conjunto de datos para sacar conclusiones y así poder tomar una buena decisión. Estadística Descriptiva
  • 4. POBLACIÓN: colección completa de todos los elementos con ciertas características, que estamos interesados en estudiar. MUESTRA: subconjunto de miembros, representativo de la población, seleccionado por un procedimiento específico. PARÁMETRO: medición numérica que describe algunas características de una población. ESTADÍSTICO: medición numérica que describe algunas características de una muestra. métodos que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones ESTADÍSTICOS PARAMÉTRICOS: métodos más utilizados por los investigadores, para emplearlos suponemos que las muestras provienen de poblaciones normalmente distribuidas ESTADÍSTICOS NO PARAMÉTRICOS:
  • 5. MUESTRA ALEATORIA: los miembros de una población se seleccionan de manera que cada miembro individual tiene la misma posibilidad de ser elegido MUESTRA ALEATORIA SIMPLE: cada posible muestra de tamaño n tiene la misma posibilidad de ser elegida
  • 6. infinitos posibles valores pueden asociarse a puntos de alguna escala continua, cubriendo un rango de valores sin huecos, pueden tomar cualquier valor dentro de un intervalo dado; valores enteros y decimales; son producto de mediciones VARIABLE: propiedad real medida por las observaciones individuales, con respecto a la cual los individuos de una población difieren de algún modo verificable. CLASIFICACIÓN DE LAS VARIABLES CUALITATIVAS: se dividen en distintas categorías que se distinguen por alguna característica no numérica. CUANTITATIVAS: consisten en números que representan conteos o mediciones; sus distintos valores pueden expresarse de forma numéricamente ordenada. - Discretas: puede tomar un número finito de posibles valores; generalmente valores enteros; son producto de conteos - Continuas:
  • 7. Determine si los siguientes valores corresponden a variables discretas o continuas 9. La estatura media de las mujeres ecuatorianas es de 1,62 m 10. La temperatura ambiente en las aulas de la EIE varía entre 19,4 y 24,8 ºC 11. El 88,7% de los hogares en las áreas urbanas ecuatorianas posee al menos 2 aparatos de TV 12. El peso medio de una muestra de computadores portátiles es de 879 g 13. Más de la mitad de los nutricionistas ecuatorianos recibe un salario mayor o igual a 1500 U$S 14. En un examen de estadística 15% de los estudiantes obtuvieron la calificación R, 60% obtuvieron B, y el resto obtuvieron MB 15. Los usuarios de una empresa telefónica realizan una media de 1,8 llamadas internacionales por mes
  • 8. Tiempo Datos distantes Distribución Variación Centro ANÁLISIS DE DATOS CARACTERÍSTICAS IMPORTANTES DE LOS DATOS:
  • 9. Clases f fr fr % A B C D Total DISTRIBUCIÓN DE FRECUENCIAS: tabla que presenta las clases o categorías de la variable y sus respectivas frecuencias FRECUENCIA ABSOLUTA (f): número de observaciones que caen dentro de una clase particular CLASE: cada una de las categorías en que los datos pueden ser agrupados FRECUENCIA RELATIVA PROPORCIONAL (fr): frecuencia de clase dividido el total de frecuencias FRECUENCIA RELATIVA PORCENTUAL (fr %): obtenemos el porcentaje de cada categoría en relación al total de casos, frecuencia relativa multiplicada por cien DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS
  • 10. Clases f fr fr % Tarifas y servicios 4473 0,21 21 Marketing 1007 0,05 5 Llamadas internacionales 766 0,04 4 Cargos de acceso 614 0,03 3 Servicios de operadora 534 0,03 3 Cambios sin consentimiento 12478 0,59 59 Forzamiento 1214 0,06 6 Total 21086 1,00 100 EJEMPLO.- Causas de quejas en contra de las compañías telefónicas DISTRIBUCIÓN DE FRECUENCIAS
  • 11. Tarifas y servicios M arketing Internacionales Cargos de acceso Servicios de operadora Cam bios sin consentim iento Forzam iento Gráfica de barras: la altura de cada barra representa la frecuencia o frecuencia relativa de cada clase Fig.1.- Causas de quejas en contra de las compañías telefónicas 0 2000 4000 6000 8000 10000 12000 14000 frecuencia categorías
  • 12. Gráfica de barras: la altura de cada barra representa la frecuencia o frecuencia relativa de cada clase fr% Tarifas y servicios M arketing Internacionales Cargos de acceso Servicios de operadora Cam bios sin consentim iento Forzam iento Fig. 2.- Causas de quejas en contra de las compañías telefónicas 0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 categorías
  • 13. Gráficas circulares representa datos cualitativos como si fueran rebanadas de un pastel; los valores de frecuencia relativa se transforman a grados de un círculo 5% 4% 3% 3% 58% 6% 21% Tarifas y servicios Marketing Llamadas internacionales Cargos de acceso Servicios de operadora Cambios sin consentimiento Forzamiento Fig. 3.- Causas de quejas en contra de las compañías telefónicas Clases f fr fr % fr % *3,6 Tarifas y servicios 4473 0,21 21 76 Marketing 1007 0,05 5 17 Llamadas internacionales 766 0,04 4 13 Cargos de acceso 614 0,03 3 10 Servicios de operadora 534 0,03 3 9 Cambios sin consentimiento 12478 0,59 59 213 Forzamiento 1214 0,06 6 21 Total 21086 1,00 100 360
  • 14. Intervalos de Clase Li Ls x f fr fr% F Fr Fr% 1 2 3 4 5 Total LÍMITES DE CLASE INFERIORES (Li): cifras más pequeñas que pueden pertenecer a las diferentes clases LÍMITES DE CLASE SUPERIORES (Ls): cifras más grandes que pueden pertenecer a las diferentes clases MARCAS DE CLASE (x): puntos medios de las clases. Se suma el límite de clase inferior al límite de clase superior y se divide entre 2 . FRECUENCIA ABSOLUTA ACUMULADA (F): suma de las frecuencias absolutas de cada clase con las de las clases anteriores FRECUENCIA RELATIVA PROPORCIONAL ACUMULADA (Fr): suma de las frecuencias relativas proporcionales de cada clase con las de las clases anteriores FRECUENCIA RELATIVA PORCENTUAL ACUMULADA (Fr %): suma de las frecuencias relativas porcentuales de cada clase con las de las clases anteriores DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS (DATOS AGRUPADOS)
  • 15. 2.- calcular Rango o Amplitud 3.- calcular No de clases 4.- calcular ancho del intervalo 5.- elegir un valor para el Li de la primera clase 8.- calcular marca de cada clase 6.- calcular Li de cada clase 7.- identificar Ls de cada clase R = dato mayor – dato menor k = n i = R k Li2 = Li1 + i x = Li + Ls. 1.- ordenar datos de menos a mayor Intervalos de Clase Li Ls x f fr fr% F Fr Fr% 1 2 3 4 5 Total .PASOS PARA CONSTRUCCIÓN DE DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS (DATOS AGRUPADOS)
  • 16. 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 EJEMPLO.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX (días) Intervalos de Clase Li Ls x f fr fr% F Fr Fr% 1 154 160 157 3 0,06 6 3 0,06 6 2 161 167 164 6 0,12 12 9 0,18 18 3 168 174 171 13 0,26 26 22 0,44 44 4 175 181 178 15 0,30 30 37 0,74 74 5 182 188 185 4 0,08 8 41 0,82 82 6 189 195 192 5 0,10 10 46 0,92 92 7 196 202 199 4 0,08 8 50 1,00 100 Total 50 1,00 100 .
  • 17. 0 2 4 6 8 10 12 14 16 dias frecuencia 154 -160 161-167 168-174 175-181 182-188 189-195 196-202 Fig. 4.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX Histograma: gráfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias o frecuencias relativas (la proporción del área total por encima de un intervalo es igual a la frecuencia relativa)
  • 18. 0 5 10 15 20 25 30 35 dias fr% 154 -160 161-167 168-174 175-181 182-188 189-195 196-202 Fig. 5.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
  • 19. 0 5 10 15 20 25 30 35 0 157 164 171 178 185 192 199 206 dias fr% 157 164 171 178 185 192 199 Fig. 6.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX Polígono de frecuencias: segmentos lineales conectados a puntos que se encuentran por encima de los valores de las marcas de clase, inicia y termina sobre el eje horizontal.
  • 20. Ojiva: gráfica lineal que representa frecuencias acumuladas, utiliza las fronteras de clase 0 10 20 30 40 50 60 0 días Frecuenciaacumulada Fig. 7.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 160,5 167,5 174,5 181,5 188,5 195,5 202,5
  • 21. Tallo Hojas 15 444 16 3344568888 17 00234444455556677799 18 00012467 19 00112699 20 1 Gráfica de tallo y hojas: separan cada valor en dos partes, el tallo (dígito en extremo izquierdo) y la hoja (dígito en extremo derecho); permite ver la distribución de los datos y a la vez mantener toda la información original Gráfica de puntos: cada valor de un dato se representa como un punto a lo largo de una escala de valores, los puntos que representan valores iguales se amontonan • •••• • • •••••• •••• • •• ••• • • • • •• • • •••• •• •• • • • •• • • • •• • 150 160 170 180 190 200 Fig. 8.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX Fig. 9.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
  • 22. Regla del suceso infrecuente para estadística inferencial: Si, bajo un supuesto dado, la probabilidad de un suceso particular observado es extremadamente pequeña, concluimos que el supuesto probablemente es erróneo. Suceso: cualquier conjunto de resultados o consecuencias de un procedimiento Suceso simple: resultado o suceso que ya no puede desglosarse en componentes más simples Espacio muestral: todos los sucesos simples posibles para un procedimiento Procedimiento o Experimento: proceso mediante el cual se obtiene un resultado. Un experimento puede tener uno o más resultados posibles a los que se denominan eventos o sucesos. Suceso compuesto: cualquier suceso que combina dos o mas sucesos simples La Teoría de la Probabilidad (Ciencia de la Incertidumbre) nos ayuda a evaluar en forma científica los riesgos para tomar decisiones.
  • 23. Ejemplo: Una ruleta tiene 38 ranuras distintas, y es diseñada de manera que las 38 ranuras sean igualmente probables de resultar. Usted planea apostar al número 13 en el próximo giro. Cual es la probabilidad de que pierda? 3 enfoques diferentes para definir la probabilidad de un suceso: 1) Método clásico de la probabilidad P(A) = número de formas en que puede ocurrir A número de sucesos simples diferentes sólo para resultados equiprobables − si es aplicable, la probabilidad obtenida es exacta − no exige la realización de experiencias ni la recogida de datos − de fácil uso P(A) = 37 38 = 0,97
  • 24. 10.- En un estudio de reconocimiento de marcas, 831 consumidores conocían la marca HP y 18 no. Use dichos resultados para estimar la probabilidad de que un consumidor que se selecciona al azar reconozca la marca HP. 3 enfoques diferentes para definir la probabilidad de un suceso: 2) Aproximación de la probabilidad por frecuencias relativas aparece como el resultado de muchos ensayos o pruebas y consiste en dar a la frecuencia relativa de una distribución un sentido probabilístico P(A) = número de veces que ocurre A número de veces que se repitió el ensayo − la experiencia debe ser repetible − cualquier probabilidad obtenida a partir de la frecuencia relativa es una aproximación (en lugar de un valor exacto) Ley de los grandes números: conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas de un suceso tiende a aproximarse a la probabilidad real P(A) = 831 849 = 0,98
  • 25. 3) Probabilidades subjetivas (grado de creencia) P(A) se obtiene suponiendo o estimando su valor en base al conocimiento de las circunstancias relevantes − siempre es aplicable. − su acierto depende de lo correcta que sea la información de la que dispone − no se pueden dar reglas para su determinación precisa, y por tanto escapa al tratamiento matemático − difícil de defender Ejemplo: Cual es la probabilidad de que su auto sea impactado por un meteorito este año? En base al conocimiento relevante se estima una probabilidad muy cercana a 0
  • 26. la probabilidad matemática de cualquier suceso es 0, 1, o un número entre 0 y 1 • 0 ≤ P(A) ≤ 1 • la probabilidad de un suceso imposible es 0 • la probabilidad de un suceso que ocurrirá con certeza es 1 cierto probable probabilidad 50-50 improbable imposible 1 0 0,5
  • 27. Cálculo de la Probabilidad de un Evento −• Definir el experimento −• Listar todos los Eventos Posibles −• Asignar Probabilidad a cada Evento Simple −• Determinar la Composición del Evento de interés −• Calcular la probabilidad del Evento
  • 28. Probabilidad de dos eventos A y B Probabilidad de dos eventos A y B P(A o B) Son A y B mutuamente excluyentes? P(A o B) Son A y B mutuamente excluyentes? P(A y B) Son A y B independientes? P(A y B) Son A y B independientes? P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B) P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B) P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B) P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A) NONOSISI NONOSISI
  • 29. P(A o B) Regla de la suma son A y B mutuamente excluyentes? P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B) P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B) P(A) P(B) P(A y B) P(A U B) = P(A) + P(B) - P(A ∩ B)P(A U B) = P(A) + P(B) - P(A ∩ B) P(A) P(B) P(A U B) = P(A) + P(B)P(A U B) = P(A) + P(B) SISI NONO Dos suceso A y B son mutuamente excluyentes cuando ambos no pueden ocurrir juntos Dos suceso A y B son mutuamente excluyentes cuando ambos no pueden ocurrir juntos
  • 30. P(A y B) Regla de la multiplicacion son A y B independientes? P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B) P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A) SISI NONO Dos suceso A y B son independientes cuando la ocurrencia de uno no afecta la probabilidad de la ocurrencia del otro Dos suceso A y B son independientes cuando la ocurrencia de uno no afecta la probabilidad de la ocurrencia del otro Dos sucesos A y B son independientes si Dos sucesos A y B son dependientes si P(B | A) = P(B) o P(A y B) = P(A) * P(B) P(B | A) ≠ P(B) o P(A y B) ≠ P(A) * P(B) P(B | A) = P(A) P(A y B) Prueba de independencia Probabilidad condicional
  • 31. Sucesos complementarios A = complemento del suceso A, consiste en todos los resultados en los cuales el suceso A no ocurre P(A) + P (A) = 1 P(A) = 1 - P(A) P(A) = 1 - P(A) P(A) P(A) = 1 - P(A) probabilidad de “uno al menos” para calcular la probabilidad de uno al menos de algo, calcule la probabilidad de ninguno, y reste el resultado a 1 P(uno al menos) = 1 - P(ninguno) P(A) = 1 - P(A) Cual es la probabilidad de seleccionar un computador que no sea de 50 Giga? Cual es la probabilidad de sacar al menos un 5 al tirar 3 dados?
  • 32. Variable aleatoria: variable que tiene un solo valor numérico (x), determinado por el azar, para cada resultado de un procedimiento. Variable aleatoria discreta: tiene un número finito de valores o un número de valores contable (pueden asociarse con un proceso de conteo) Variable aleatoria continua: tiene un número infinito de valores, los cuales pueden asociarse a mediciones en una escala continua, de manera que no haya huecos ni interrupciones DISTRIBUCIONES DE PROBABILIDAD
  • 33. Distribución de probabilidad: gráfica, tabla o fórmula que da la probabilidad de cada valor de la variable aleatoria. Requisitos de una distribución de probabilidad ∑ P(x) = 1 0 ≤ P(x) ≤ 1 x P(x) 0 0,502 1 0,345 2 0,108 3 0,041 4 0,004 0 0,1 0,2 0,3 0,4 0,5 0,6 0 1 2 3 4 número de defectos en cada grupo P(x) Ejemplo. Durante la fabricación de un modelo de DVD, se seleccionan aleatoriamente grupos de DVD y se calcula el número de defectos en cada grupo
  • 35. DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL resulta de un procedimiento que cumple con todos los requisitos siguientes: 1.- el procedimiento tiene un número fijo de ensayos 2.- los ensayos deben ser independientes (el resultado de cualquier ensayo individual no afecta las probabilidades de los otros ensayos) 3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías 4.- las probabilidades tienen que mantenerse constantes para cada ensayo NOTACIÓN PARA DISTRIBUCIONES DE PROBABILIDAD BINOMIAL n número fijo de ensayos 2 categorías posibles de resultado: E (éxito) y F (fracaso) p probabilidad de éxito en uno de n ensayos p = P(E) q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 - p x número específico de éxitos en n ensayos (cualquier entero entre 0 y n, inclusive) P(x) probabilidad de lograr exactamente x éxitos en los n ensayos
  • 36. Respuesta a) 1.- el procedimiento tiene un número fijo de ensayos. R: si 2.- los ensayos deben ser independientes. R: si 3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías. R: si 4.- las probabilidades tienen que mantenerse constantes para cada ensayo. R: si Respuesta b) n número fijo de ensayos = 8 p probabilidad de éxito en uno de n ensayos p = P(E) = 1/5 = 0,20 q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 – p = 1 – 0,20 = 0,80 x número específico de éxitos en n ensayos = 6 Ejemplo. Análisis de respuestas de opción múltiple. Un profesor aplica un examen sorpresa que consta de ocho preguntas de opción múltiple, cada una con cinco respuestas posibles (a, b, c, d y e), pero solo una de ellas correcta. Supongamos que un estudiante sin preparación adecuada hace adivinanzas al azar, y que queremos calcular la probabilidad de que tenga exactamente seis respuestas correctas en las ocho preguntas. a) resultará este proceso en una distribución binomial? b) si la respuesta anterior es si, identifique los valores de n, x, p y q
  • 37. P(x) = . px . qn-x n! (n - x)! x! P(x) = nCx . px . qn-x c) calcule la probabilidad de que tenga exactamente cuatro respuestas correctas d) calcule la probabilidad de que tenga menos de cuatro respuestas correctas e) calcule la probabilidad de que tenga más de cuatro respuestas correctas f) calcule la probabilidad de que tenga como máximo cuatro respuestas correctas g) calcule la probabilidad de que tenga al menos cuatro respuestas correctas h) calcule la probabilidad de que tenga entre cuatro y seis respuestas correctas P(4) = 8C4 . 0,204 . 0,804 = 0,046 P(X<4) = P(0) + P(1) + P(2) + P(3) = 0,94 P(X>4) = P(5) + P(6) + P(7) + P(8) = 0,10 P(X≤4) = P(0) + P(1) + P(2) + P(3) + P(4) = 0,99 P(X≥4) = P(4) + P(5) + P(6) + P(7) + P(8) = 0,056 P(4≤X≤6) = P(4) + P(5) + P(6) = 0,056
  • 38. μ = n . p σ2 = n . p . q σ = n . p . q Ejemplo. Varios estudiantes no se prepararon para un examen sorpresa de verdadero/falso de 10 preguntas, por lo cual todas sus repuestas son adivinanzas. a.- calcule las media y la desviación estándar del número de respuestas correctas que obtendrán. b.- sería poco común que un estudiante pasara el examen adivinando y obtuviera al menos 7 respuestas correctas? valor mínimo “común” ≈ μ - 2 (σ) valor máximo “común” ≈ μ + 2 (σ) Respuestas a.- μ = n . p = 10 . 0,5 = 5 σ = n . p . q = 10 . 0,5 . 0,5 = 2,5 = 1,58 b.- valor máximo “común” ≈ μ + 2 (σ) = 5 + 2(1,58) = 8,16 R: no, no sería poco común.
  • 40. Si una variable aleatoria continua tiene una distribución con una gráfica simétrica y en forma de campana, a la vez que puede ser descrita por medio de la siguiente ecuación, decimos que tiene distribución normal μ intervalos f( x) x Propiedades de la curva normal: - es simétrica con respecto a la media aritmética - decrece uniformemente en ambas direcciones a partir del valor central - las dos colas nunca tocan el eje horizontal - a cualquier área debajo de la curva se le puede dar un criterio probabilístico (f/n) 50% 50% 100% -∞ ∞
  • 41. z = σ x - μ z = s x - x s desviación estándar muestral σ desviación estándar poblacional x valores de datos individuales x media de un conjunto de valores muestrales μ media de valores de una población ESTANDARIZACIÓN o NORMALIZACIÓN Ej: μ = US$ 25 σ = US$ 5 x = US$ 20 2520 μµ-1σ 0-1
  • 42. 99,7% 95% 68% x +s-s +2s +3s -2s -3s Regla empírica para datos con distribución normal • 68% de todos los valores están dentro de una desviación estándar de la media • 95% de todos los valores están dentro de dos desviaciones estándar de la media • 99,7% de todos los valores están dentro de tres desviaciones estándar de la media
  • 44. -2,58σ +2,58σ-1,96σ +1,96σ μμ μ 95% 2,5% 2,5% 99% 0,5% 0,5% μ ± 1,96σ μ ± 2,58σ 95% 5% +1,65σ μ 95% 5% -1,65σ Análisis de 2 colas Análisis de 1 cola al 95% -∞ ∞ -∞ ∞ -∞ ∞ -∞ ∞
  • 45. -1,96 1,96 1) Determinar si un valor de x pertenece a la población de estudio El tiempo de vida de las lámparas fluorescentes producidas por la empresa XX se distribuye normalmente con una media de 176,5 días y una desviación estándar de 11,3 días. Es probable que una lámpara seleccionada aleatoriamente, con un tiempo de vida de 207,4 días pertenezca a esta población? z = σ x - μ z = 11,3 207,4 – 176,5 = 2,73 x (días) 176,5 207,4 z 0 2,73 Interpretación: Es probable que no pertenezca a la población de estudio
  • 46. De acuerdo a un estudio, el tiempo de reemplazo de los televisores se distribuye normalmente, con una media de 8,2 años y una desviación estándar de 1,1 años. a) Cual es la probabilidad de que un televisor elegido al azar dure entre 8,2 y 10 años? z = σ x - μ z = 1,1 10 - 8,2 = 1,64 x (años) 8,2 10 z 0 1,64 P(0 a 1,64) = 0,4495 Interpretación: a) la probabilidad de que un televisor dure entre 8,2 y 10 años es de 0,4495
  • 48. Medidas De Tendencia Central valor que se encuentra en el centro o la mitad de un conjunto de datos Media aritmética: medida de tendencia central que se obtiene sumando los puntajes y dividiendo el total entre el número de puntajes ∑x x = n ∑x μ = N x valores de datos individuales n número de valores de una muestra N número de valores de una población x media de un conjunto de valores muestrales μ media de valores de una población Media aritmética de una distribución de frecuencias (datos agrupados) ∑(f . x)x = n . x marca de clase f frecuencia . ANÁLISIS ESTADÍSTICO SIMPLE
  • 49. clases x f fr fr% F Fr Fr% 154-160 157 3 0,06 6 3 0,06 6 161-167 164 6 0,12 12 9 0,18 18 168-174 171 13 0,26 26 22 0,44 44 175-181 178 15 0,30 30 37 0,74 74 182-188 185 4 0,08 8 41 0,82 82 189-195 192 5 0,10 10 46 0,92 92 196-202 199 4 0,08 8 50 1,00 100 Totales 1246 50 1,00 100 Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 x * f 471 984 2223 2670 740 960 796 8844 ∑x x = n 8824 = 50 = 176,5 8844 = 50 = 176,9 ∑(f . x)x = n . . . cálculo de la media aritmética a partir de un conjunto de datos sin agrupar cálculo de la media aritmética a partir de un conjunto de datos agrupados
  • 50. Mediana: L Me = 2 n + 1 50% de los valores ≤ Me ≤ 50% de los valores Si el número de valores es impar, la Me es el valor que se localiza exactamente a la mitad de la lista ordenada, si el número de valores es par se obtiene calculando la media de los dos números que están a la mitad valor que se encuentra en medio, cuando los valores originales se presentan en orden de magnitud creciente Mediana de una distribución de frecuencias (datos agrupados) Li límite inferior de la clase que contiene Me i ancho de clase f frecuencia de clase que contiene Me Fa frecuencia acumulada de clase anterior Li + i Me = - (Fa+1) f 2 n+1 8 8 3 5 9 2 4 8 8 3 5 1 1 4 3 Posición en la lista ordenada 2 – 3 – 4 – 5 – 8 – 8 – 9 1 – 1 – 3 – 3 – 4 – 5 – 8 – 8
  • 51. Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 154 154 154 163 163 164 164 165 166 168 168 168 168 170 170 172 173 174 174 174 174 174 175 175 175 175 176 176 177 177 177 179 179 180 180 180 181 182 184 186 187 190 190 191 191 192 196 199 199 201 L Me = 2 n + 1 51 = 2 = 25,5 Me = 175 + 175 2 350 = 2 = 175,0 cálculo de la mediana a partir de un conjunto de datos sin agrupar conjunto de datos en orden ascendente
  • 52. clases x f fr fr% F Fr Fr% 154-160 157 3 0,06 6 3 0,06 6 161-167 164 6 0,12 12 9 0,18 18 168-174 171 13 0,26 26 22 0,44 44 175-181 178 15 0,30 30 37 0,74 74 182-188 185 4 0,08 8 41 0,82 82 189-195 192 5 0,10 10 46 0,92 92 196-202 199 4 0,08 8 50 1,00 100 Totales 1246 50 1,00 100 Li + i Me = - (Fa+1) f 2 n+1 = 175 + 7 51 - 23 2 15 = 176,2 . cálculo de la mediana a partir de un conjunto de datos agrupados ClasequecontienealaMe
  • 53. 0 20 40 60 80 100 0 días Fr% Fig. 7.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 160,5 167,5 174,5 181,5 188,5 195,5 202,5 cálculo de la mediana a partir de una ojiva
  • 54. 8 8 3 5 2 1 4 3 Moda: valor que ocurre con mayor frecuencia 8 8 3 5 9 2 48 5 9 8 7 5 2 1 4 3 6 Moda de una distribución de frecuencias (datos agrupados) Li límite inferior de la clase modal i ancho de clase Δ1 diferencia entre f de clase modal y clase anterior Δ2 diferencia entre f de clase modal y clase siguiente Li + * i Mo = Δ1 Δ1 + Δ2 unimodal bimodal No hay moda
  • 55. clases x f fr fr% F Fr Fr% 154-160 157 3 0,06 6 3 0,06 6 161-167 164 6 0,12 12 9 0,18 18 168-174 171 13 0,26 26 22 0,44 44 175-181 178 15 0,30 30 37 0,74 74 182-188 185 4 0,08 8 41 0,82 82 189-195 192 5 0,10 10 46 0,92 92 196-202 199 4 0,08 8 50 1,00 100 Totales 1246 50 1,00 100 Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 . identificación de la moda a partir de un conjunto de datos sin agrupar cálculo de la moda a partir de un conjunto de datos agrupados Li + * i Mo = Δ1 Δ1 + Δ2 175 + * 7 = 2 2 + 11 = 176,1 Clasemodal
  • 56. Mitad del rango: valor que esta a medio camino entre el puntaje más alto y el más bajo Mitad del rango = 2 valor máximo + valor mínimo Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 Mitad del rango = 2 valor máximo + valor mínimo 201 + 154 = 2 = 177,5 cálculo de la mitad del rango a partir de un conjunto de datos sin agrupar
  • 57. Media − Toma en cuanta cada valor − Se ve afectada por valores extremos − Siempre existe − Confiable (cuando las muestras se extraen de la misma población, las medias muestrales tienden a ser más consistentes que las otras medidas de tendencia central) Mediana − No toma en cuanta cada valor − No se ve afectada por valores extremos − es más representativa que la media cuando hay datos muy extremos Moda − No toma en cuanta cada valor − No se ve afectada por valores extremos − Puede no existir o haber más de una − No se usa mucho con datos numéricos, es la única que puede usarse con datos de nivel nominal Mitad del rango − No toma en cuanta cada valor − Se ve afectada por valores extremos • Datos numéricos • Distribuciones simétricas • Datos ordinales o numéricos • Distribuciones asimétricas • Pocas observaciones • Datos nominales • Distribuciones bimodales Características De Las Diferentes Medidas De Tendencia Central
  • 58. • Una comparación de la media, la mediana y la moda puede revelar información acerca de la característica del sesgo • Una distribución de datos es simétrica si la mitad izquierda de su histograma es aproximadamente una imagen especular de su mitad derecha • Una distribución de datos está sesgada si no es simétrica y se extiende más hacia un lado que hacia el otro Sesgada a la derecha (sesgo positivo) Media y mediana a la derecha de la moda Sesgada a la izquierda (sesgo negativo) Media y mediana a la izquierda de la moda Mo Me x MoMex Mo = Me = x leptocúrtica platicúrticamesocúrtica 3 ( x – Me ) as = s Coeficiente de asimetría de Pearson
  • 60. MEDIDAS DE DISPERSIÓN Proporcionan información acerca de la variabilidad presente en un conjunto de datos Rango : diferencia entre el valor máximo y el valor mínimo de un conjunto de datos Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 Rango = (valor máximo) - (valor mínimo) Rango = (valor máximo) - (valor mínimo) = 201 - 154 = 47,0 ANÁLISIS ESTADÍSTICO SIMPLE cálculo del rango a partir de un conjunto de datos sin agrupar
  • 61. s2 = ∑ ( x - x )2 n - 1 σ2 = ∑ ( x - μ )2 N s2 varianza muestral σ2 varianza poblacional x valores de datos individuales n número de valores de una muestra N número de valores de una población x media de un conjunto de valores muestrales μ media de valores de una población Varianza : medida de variación de los valores con respecto a la media, indica la desviación promedio de los valores, con respecto a la media n (n - 1) = n ∑(x2 ) - (∑x)2 = N ∑(x2 ) - (∑x)2 N2 varianza de una distribución de frecuencias (datos agrupados) x marca de clase f frecuencia . n [ ∑ ( f . x2 ) ] – [ ∑ ( f . x ) ]2 s2 = n (n – 1) . .
  • 62. = 127,8 días2 = 6260,48 49 Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 x x - x (x - x)2 154 -22,48 505,3504 199 22,52 507,1504 191 14,52 210,8304 177 0,52 0,2704 163 -13,48 181,7104 192 15,52 240,8704 176 -0,48 0,2304 180 3,52 12,3904 ….. ….. ….. ….. ….. ….. ∑x = 8824 n = 50 x = 176,48 ∑(x - x)2 = 6260,48 n - 1 = 49 s2 = ∑ ( x - x )2 n - 1 cálculo de la varianza a partir de un conjunto de datos sin agrupar Valores a calcular Fórmula A
  • 63. Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 x x2 154 23716 199 39601 191 36481 177 31329 163 26569 192 36864 176 30976 180 32400 ….. ….. ….. ….. ∑x = 8824 (∑x)2 = 77862976 ∑(x2 ) = 1563520 n = 50 n∑(x2 ) = 78176000 n (n-1) = 2450 n (n - 1) n ∑(x2 ) - (∑x)2 50 (1563520) - 77862976 50 (49) s2 = = = 127,8 días2 cálculo de la varianza a partir de un conjunto de datos sin agrupar Fórmula B
  • 64. 50 (1570340) - 78216336s2 = 2450 = 122,7 días2 clases x f fr fr% F Fr Fr% 154-160 157 3 0,06 6 3 0,06 6 161-167 164 6 0,12 12 9 0,18 18 168-174 171 13 0,26 26 22 0,44 44 175-181 178 15 0,30 30 37 0,74 74 182-188 185 4 0,08 8 41 0,82 82 189-195 192 5 0,10 10 46 0,92 92 196-202 199 4 0,08 8 50 1,00 100 Totales 1246 50 1,00 100 f . x x2 f . x2 471 24649 73947 984 26896 161376 2223 29241 380133 2670 31684 475260 740 34225 136900 960 36864 184320 796 39601 158404 8844 223160 1570340 ∑ (f . x2 ) = 1570340 ∑ (f . x) = 8844 [∑ (f . x)]2 = 78216336 n (n-1) = 2450 n [ ∑ ( f . x2 ) ] – [ ∑ ( f . x ) ]2 s2 = n (n – 1) . . . . .. . . . cálculo de la varianza a partir de un conjunto de datos agrupados
  • 65. s desviación estándar muestral σ desviación estándar poblacional x valores de datos individuales n número de valores de una muestra N número de valores de una población x media de un conjunto de valores muestrales μ media de valores de una población Desviación Estándar : − medida de variación de todos los valores con respecto a la media − su valor suele ser positivo − se puede incrementar de manera drástica con la inclusión de datos distantes − las unidades de la desviación estándar son las mismas de los datos originales = n (n - 1) n ∑(x2 ) - (∑x)2 = N ∑(x2 ) - (∑x)2 N2 s = ∑ ( x - x )2 n - 1 σ = ∑ ( x - μ )2 N desviación estándar de una distribución de frecuencias (datos agrupados) x marca de clase f frecuencia . n [ ∑ ( f . x2 ) ] – [ ∑ ( f . x ) ]2 s = n (n – 1) . .
  • 66. Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 s = = 11,3 díass2 = 127,8 cálculo de la desviación estándar a partir de un conjunto de datos sin agrupar
  • 67. clases x f fr fr% F Fr Fr% 154-160 157 3 0,06 6 3 0,06 6 161-167 164 6 0,12 12 9 0,18 18 168-174 171 13 0,26 26 22 0,44 44 175-181 178 15 0,30 30 37 0,74 74 182-188 185 4 0,08 8 41 0,82 82 189-195 192 5 0,10 10 46 0,92 92 196-202 199 4 0,08 8 50 1,00 100 Totales 1246 50 1,00 100 f . x x2 f . x2 471 24649 73947 984 26896 161376 2223 29241 380133 2670 31684 475260 740 34225 136900 960 36864 184320 796 39601 158404 8844 223160 1570340 . . .. s = = 11,1 díass2 = 122,7 cálculo de la desviación estándar a partir de un conjunto de datos agrupados
  • 68. s desviación estándar muestral σ desviación estándar poblacional x media de un conjunto de valores muestrales μ media de valores de una población Coeficiente de variación describe la desviación estándar relativa a la media CV = .100% x s CV = .100% μ σ
  • 69. Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 Peso de lámparas fluorescentes producidas por la empresa YY 221,2 223,5 225,0 224,3 223,3 219,1 218,5 223,4 222,1 220,2 218,0 224,1 221,7 223,7 225,4 227,5 220,9 222,6 225,8 223,5 225,6 225,7 220,8 225,9 220,0 224,5 220,2 222,1 223,3 222,7 223,5 220,6 225,8 224,7 223,2 225,1 219,3 220,4 223,3 224,1 222,3 222,8 224,8 226,6 225,4 220,1 220,2 224,7 225,5 222,3 CV = .100% x s = .100% 222,99 2,30 = 1,03% CV = .100% x s = .100% 176,5 11,3 = 6,40% comparación del coeficiente de variación de dos conjuntos de datos
  • 70. Regla práctica del intervalo • para muchos conjuntos de datos, la vasta mayoría (tanto como el 95%) de los valores muestrales se ubican dentro de 2 desviaciones estándar (s) de la media valor mínimo “común” ≈ x - 2 (s) valor máximo “común” ≈ x + 2 (s) Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 cálculo de valores mínimo y máximo común por la regla práctica del intervalo valor mínimo “común” ≈ x - 2 (s) ≈ 176,5 - 2 (11,3) ≈ 176,5 - 22,6 ≈ 153,9 días valor máximo “común” ≈ x + 2 (s) ≈ 176,5 + 2 (11,3) ≈ 176,5 + 22,6 ≈ 199,1 días
  • 71. Regla empírica para datos con distribución normal • aprox el 68% de todos los valores están dentro de una desviación estándas de la media • aprox el 95% de todos los valores están dentro de dos desviaciones estándar de la media • aprox el 99,7% de todos los valores están dentro de tres desviaciones estándar de la media Ejercicio: las puntuaciones de CI de adultos normales tienen una distribución normal, con una media de 100 y una desviación estándar de 15. Qué porcentaje de adultos tienen puntuaciones de CI entre 55 y 145? 100 - 3(15) = 55 100 + 3(15) = 145 el 99,7% de todas las puntuaciones de CI se encuentran entre 55 y 145
  • 72. Teorema de Chebyshev • la proporción de cualquier conjunto de datos que está dentro de k desviaciones estándar de la media es siempre al menos 1 - 1 / k2 , donde k es cualquier número positivo mayor que 1 para k = 2 • al menos 3/4 (75%) de todos los valores están dentro de 2 desviaciones estándar de la muestra para k = 3 • al menos 8/9 (89%) de todos los valores están dentro de 3 desviaciones estándar de la muestra Ejercicio: las puntuaciones de CI de adultos normales tienen una media de 100 y una desviación estándar de 15. Qué podemos concluir a partir del teorema de Chebyshev? • Por lo menos 75% de todos los adultos tienen puntuaciones de CI que están entre 70 y 130 • Al menos 89% de todos los adultos tienen puntuaciones de CI que están entre 55 y 145
  • 74. z = σ x - μ z = s x - x s desviación estándar muestral σ desviación estándar poblacional x valores de datos individuales x media de un conjunto de valores muestrales μ media de valores de una población pueden utilizarse para comparar valores de diferentes conjuntos de datos (puntuaciones z) o para comparar valores dentro del mismo conjunto de datos (cuantiles o fractiles) puntuación z : número de desviaciones estándar que un valor (x) se encuentra por arriba o por debajo de la media ANÁLISIS ESTADÍSTICO SIMPLE MEDIDAS DE POSICIÓN RELATIVA valores de z positivos indican que x > que la media, valores negativos indican que x < que la media valores comunes: -2 ≤ puntuación z ≤ 2 valores infrecuentes: puntuación z < -2 o puntuación z > 2 -3 -2 -1 0 1 2 3 valores comunes valores infrecuentesvalores infrecuentes
  • 75. Ejercicio: HP lanza al mercado un nuevo modelo de computador portátil de 14 pulgadas que pesa 1,36 kg, al mismo tiempo que SONY promociona su nuevo modelo de 17 pulgadas de 3,08 kg. El modelo de HP es más liviano, pero cual de los dos es relativamente mas liviano? El peso del modelo HP entre los computadores portátiles de 14 pulgadas, es más liviano que el del modelo SONY entre los de 17 pulgadas? Las portables de 14 pulgadas en el mercado poseen pesos con una media de 2,58 kg y una desviación estándar de 0,67 kg; mientras que los modelos de 17 pulgadas poseen pesos con una media de 4,23 kg y una desviación estándar de 0,54 kg 14 pulgadas μ 2,58 σ 0,67 HP 1,36 17 pulgadas μ 4,23 σ 0,54 SONY 3,08 z = σ x - μ z HP -1,82 z SONY -2,13
  • 76. cuantiles o fractiles: separan los datos en grupos con casi el mismo número de valores existen 3 cuartiles (Q1, Q2 y Q3), que dividen los valores ordenados en 4 partes iguales • Q1 (primer cuartil): separa el 25% inferior de los valores ordenados, del 75% superior • Q2 (segundo cuartil): separa el 50% inferior de los valores ordenados, del 50% superior • Q3 (tercer cuartil): separa el 75% inferior de los valores ordenados, del 25% superior existen 99 percentiles (P1, P2, …P99), que separan los datos en 100 grupos, con aproximadamente el 1% de los valores en cada grupo deciles… quintiles… percentil del valor x = . 100 número de valores menores que x número total de valores conversión de un valor muestral dado a su percentil correspondiente LQ1 = ¼ (n+1), si es número decimal, redondear hacia arriba LQ2 = Mediana = ½ (n+1), si es número decimal, promediar entre los dos valores centrales LQ3 = ¾ (n+1), si es número decimal, redondear hacia abajo Posición en la lista ordenada
  • 77. Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 164 184 177 175 199 168 174 179 186 191 175 168 201 168 177 175 164 190 154 163 180 196 190 180 192 165 175 170 163 176 191 168 179 174 180 172 176 182 173 166 181 154 174 174 170 174 177 187 199 percentil de 196? Q1? Q2? Q3? percentil del valor x = . 100 número de valores menores que x número total de valores percentil de 196 = . 100 = 92 46 50 LQ1 = ¼ (n+1) = 12,75 ≈ 13 Tiempo de vida de lámparas fluorescentes producidas por la empresa XX 154 154 154 163 163 164 164 165 166 168 168 168 168 170 170 172 173 174 174 174 174 174 175 175 175 175 176 176 177 177 177 179 179 180 180 180 181 182 184 186 187 190 190 191 191 192 196 199 199 201 Presentar conjunto de datos en orden ascendente LQ2 = ½ (n+1) = 25,5 LQ3 = ¾ (n+1) = 38,25 ≈ 38 Q1 = 168 Q2 = (175 +175) / 2 = 175Q2 = (175 +175) / 2 = 175 Q3 = 182
  • 79. DATOS DISTANTES o VALORES ATÍPICOS: observación que es significativamente mas grande o más pequeña con respecto a los otros valores en una serie de datos pueden afectar en gran medida el valor de la media y de la desviación estándar, así como distorsionar gravemente un histograma • observación registrada incorrectamente • observación proviene de diferente población • observación correcta, pero representa un evento raro 1.- puntuación z: observaciones con puntuaciones z mayores que 2 en valor absoluto son consideradas atípicas. 2.- diagrama de caja: gráfica de un conjunto de datos que consiste en una línea que se extiende desde el valor mín hasta el valor máx, así como una caja con líneas trazadas en Q1, Me y Q3 métodos para detectar valores atípicos: Pueden deberse a:
  • 80. Q1 168 Q2 175 Q3 182 IQR (Q3-Q1) 14 Vmáx 201 Vmín 154 Q1 - 1,5 (IQR) 147 Q3 + 1,5 (IQR) 203 Q1 - 3 (IQR) 126 Q3 + 3 (IQR) 224 Q1 - 1,5 (IQR) Le Li Li Le Q3 + 1,5 (IQR) Q3 + 3 (IQR)Q1 - 3 (IQR) Vmín Vmáx Pasos a seguir en la construcción de un diagrama de caja: • Calcular Me, Q1 y Q3, y el rango intercuartilar (IQR) de una serie de datos (IQR = Q3 - Q1) • Construir una caja sobre el eje X con la ubicación de Q1 y Q3. El ancho de la caja es igual al IQR. Trazar una línea vertical dentro de la caja en el valor de la Me • Dibujar líneas que se extiendan hacia fuera del cuadro, hasta los valores mín y máx • Identificar limites interiores localizados a una distancia de 1,5 (IQR) debajo de Q1 y por encima de Q3; y límites exteriores localizados a una distancia de 3 (IQR) debajo de Q1 y por encima de Q3 120 130 140 150 160 170 180 190 200 210 220 230 Q1 Me Q3 (IQR)valores altamente sospechosos valores altamente sospechosos valores sospechosos valores sospechosos