Estadistica

- colección de métodos para planear experimentos
obtener datos
organizarlos
resumirlos
presentarlos
analizarlos
interpretarlos
llegar a conclusiones basadas ellos
ESTADÍSTICA:- ciencia de los datos
ESTADÍSTICA DESCRIPTIVA: utiliza métodos numéricos y gráficos para
organizar, resumir y describir las características
importantes de un conjunto de datos para que
sean presentadas de una forma comprensible.
utiliza los datos de la muestra para inferir o
predecir parámetros poblacionales; se realizan
deducciones que van más allá de los datos
conocidos. Esto es realizado por un proceso de
razonamiento inductivo basado en la teoría
matemática de las probabilidades.
ESTADÍSTICA INFERENCIAL:

Es una serie de técnicas ligadas con el fin de recolectar por
medio de test, encuestas, censos, entre otras formas, un
conjunto de datos. Luego organizar de manera cuantitativa o
cualitativamente, según sea el caso. Presentar los resultados
ya sea por tablas o por gráficos y finalmente analizar el
conjunto de datos para sacar conclusiones y así poder tomar
una buena decisión.
Estadística Descriptiva

POBLACIÓN: colección completa de todos los elementos con ciertas
características, que estamos interesados en estudiar.
MUESTRA: subconjunto de miembros, representativo de la población,
seleccionado por un procedimiento específico.
PARÁMETRO: medición numérica que describe algunas características de una
población.
ESTADÍSTICO: medición numérica que describe algunas características de una
muestra.
métodos que no hacen suposiciones restrictivas respecto
a la forma de las distribuciones de las poblaciones
ESTADÍSTICOS
PARAMÉTRICOS:
métodos más utilizados por los investigadores, para
emplearlos suponemos que las muestras provienen de
poblaciones normalmente distribuidas
ESTADÍSTICOS NO
PARAMÉTRICOS:

MUESTRA ALEATORIA: los miembros de una población se
seleccionan de manera que cada miembro individual tiene la
misma posibilidad de ser elegido
MUESTRA ALEATORIA SIMPLE: cada posible muestra de
tamaño n tiene la misma posibilidad de ser elegida

infinitos posibles valores pueden asociarse a puntos de alguna
escala continua, cubriendo un rango de valores sin huecos,
pueden tomar cualquier valor dentro de un intervalo dado;
valores enteros y decimales;
son producto de mediciones
VARIABLE: propiedad real medida por las observaciones individuales,
con respecto a la cual los individuos de una población
difieren de algún modo verificable.
CLASIFICACIÓN DE LAS VARIABLES
CUALITATIVAS: se dividen en distintas categorías que se distinguen por
alguna característica no numérica.
CUANTITATIVAS: consisten en números que representan conteos o
mediciones; sus distintos valores pueden expresarse de
forma numéricamente ordenada.
- Discretas: puede tomar un número finito de posibles valores;
generalmente valores enteros;
son producto de conteos
- Continuas:

Determine si los siguientes valores corresponden a variables
discretas o continuas
9. La estatura media de las mujeres ecuatorianas es de 1,62 m
10. La temperatura ambiente en las aulas de la EIE varía entre 19,4
y 24,8 ºC
11. El 88,7% de los hogares en las áreas urbanas ecuatorianas
posee al menos 2 aparatos de TV
12. El peso medio de una muestra de computadores portátiles es
de 879 g
13. Más de la mitad de los nutricionistas ecuatorianos recibe un
salario mayor o igual a 1500 U$S
14. En un examen de estadística 15% de los estudiantes obtuvieron
la calificación R, 60% obtuvieron B, y el resto obtuvieron MB
15. Los usuarios de una empresa telefónica realizan una media de
1,8 llamadas internacionales por mes

Tiempo
Datos distantes
Distribución
Variación
Centro
ANÁLISIS DE DATOS
CARACTERÍSTICAS IMPORTANTES DE LOS DATOS:

Clases f fr fr %
A
B
C
D
Total
DISTRIBUCIÓN DE FRECUENCIAS: tabla que presenta las clases o
categorías de la variable y sus respectivas frecuencias
FRECUENCIA ABSOLUTA (f): número de observaciones que caen dentro de
una clase particular
CLASE: cada una de las categorías en que los datos pueden ser agrupados
FRECUENCIA RELATIVA PROPORCIONAL (fr): frecuencia de clase
dividido el total de frecuencias
FRECUENCIA RELATIVA PORCENTUAL (fr %): obtenemos el porcentaje
de cada categoría en relación al total de casos, frecuencia relativa
multiplicada por cien
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS

Clases f fr fr %
Tarifas y servicios 4473 0,21 21
Marketing 1007 0,05 5
Llamadas internacionales 766 0,04 4
Cargos de acceso 614 0,03 3
Servicios de operadora 534 0,03 3
Cambios sin consentimiento 12478 0,59 59
Forzamiento 1214 0,06 6
Total 21086 1,00 100
EJEMPLO.- Causas de quejas en contra de las compañías telefónicas
DISTRIBUCIÓN DE FRECUENCIAS

Tarifas
y
servicios
M
arketing
Internacionales
Cargos
de
acceso
Servicios
de
operadora
Cam
bios
sin
consentim
iento
Forzam
iento
Gráfica de barras: la altura de cada barra representa la frecuencia o
frecuencia relativa de cada clase
Fig.1.- Causas de quejas en contra de las compañías telefónicas
0
2000
4000
6000
8000
10000
12000
14000
frecuencia
categorías

Gráfica de barras: la altura de cada barra representa la frecuencia o
frecuencia relativa de cada clase
fr%
Tarifas
y
servicios
M
arketing
Internacionales
Cargos
de
acceso
Servicios
de
operadora
Cam
bios
sin
consentim
iento
Forzam
iento
Fig. 2.- Causas de quejas en contra de las compañías telefónicas
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
categorías

Gráficas circulares
representa datos cualitativos como si fueran rebanadas de un pastel; los
valores de frecuencia relativa se transforman a grados de un círculo
5%
4%
3%
3%
58%
6%
21% Tarifas y servicios
Marketing
Llamadas internacionales
Cargos de acceso
Servicios de operadora
Cambios sin consentimiento
Forzamiento
Fig. 3.- Causas de quejas en contra de las compañías telefónicas
Clases f fr fr % fr % *3,6
Tarifas y servicios 4473 0,21 21 76
Marketing 1007 0,05 5 17
Llamadas internacionales 766 0,04 4 13
Cargos de acceso 614 0,03 3 10
Servicios de operadora 534 0,03 3 9
Cambios sin consentimiento 12478 0,59 59 213
Forzamiento 1214 0,06 6 21
Total 21086 1,00 100 360

Intervalos
de Clase Li Ls x f fr fr% F Fr Fr%
1
2
3
4
5
Total
LÍMITES DE CLASE INFERIORES (Li): cifras más pequeñas que pueden pertenecer
a las diferentes clases
LÍMITES DE CLASE SUPERIORES (Ls): cifras más grandes que pueden pertenecer a
las diferentes clases
MARCAS DE CLASE (x): puntos medios de las clases. Se suma el límite de clase
inferior al límite de clase superior y se divide entre 2
.
FRECUENCIA ABSOLUTA ACUMULADA (F): suma de las frecuencias absolutas de
cada clase con las de las clases anteriores
FRECUENCIA RELATIVA PROPORCIONAL ACUMULADA (Fr): suma de las
frecuencias relativas proporcionales de cada clase con las de las clases anteriores
FRECUENCIA RELATIVA PORCENTUAL ACUMULADA (Fr %): suma de las
frecuencias relativas porcentuales de cada clase con las de las clases anteriores
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS
(DATOS AGRUPADOS)

2.- calcular Rango o Amplitud
3.- calcular No de clases
4.- calcular ancho del intervalo
5.- elegir un valor para el Li de la primera clase
8.- calcular marca de cada clase
6.- calcular Li de cada clase
7.- identificar Ls de cada clase
R = dato mayor – dato menor
k = n
i =
R
k
Li2 = Li1 + i
x =
Li + Ls.
1.- ordenar datos de menos a mayor
Intervalos
de Clase
Li Ls x f fr fr% F Fr Fr%
1
2
3
4
5
Total
.PASOS PARA CONSTRUCCIÓN DE DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLES
CUANTITATIVAS (DATOS AGRUPADOS)

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
EJEMPLO.- Tiempo de vida de lámparas fluorescentes producidas por la
empresa XX (días)
Intervalos
de Clase
Li Ls x f fr fr% F Fr Fr%
1 154 160 157 3 0,06 6 3 0,06 6
2 161 167 164 6 0,12 12 9 0,18 18
3 168 174 171 13 0,26 26 22 0,44 44
4 175 181 178 15 0,30 30 37 0,74 74
5 182 188 185 4 0,08 8 41 0,82 82
6 189 195 192 5 0,10 10 46 0,92 92
7 196 202 199 4 0,08 8 50 1,00 100
Total 50 1,00 100
.

0
2
4
6
8
10
12
14
16
dias
frecuencia
154 -160 161-167 168-174 175-181 182-188 189-195 196-202
Fig. 4.- Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
Histograma: gráfica de barras donde la escala horizontal representa clases
de valores de datos y la escala vertical representa frecuencias o frecuencias
relativas (la proporción del área total por encima de un intervalo es igual a la
frecuencia relativa)

0
5
10
15
20
25
30
35
dias
fr%
154 -160 161-167 168-174 175-181 182-188 189-195 196-202

0
5
10
15
20
25
30
35
0 157 164 171 178 185 192 199 206
dias
fr%
157 164 171 178 185 192 199
Polígono de frecuencias: segmentos lineales conectados a puntos que se
encuentran por encima de los valores de las marcas de clase, inicia y termina
sobre el eje horizontal.

Ojiva: gráfica lineal que representa frecuencias acumuladas, utiliza las
fronteras de clase
0
10
20
30
40
50
60
0
días
Frecuenciaacumulada
160,5 167,5 174,5 181,5 188,5 195,5 202,5

Tallo Hojas
15 444
16 3344568888
17 00234444455556677799
18 00012467
19 00112699
20 1
Gráfica de tallo y hojas: separan cada valor en dos partes, el tallo (dígito
en extremo izquierdo) y la hoja (dígito en extremo derecho); permite ver la
distribución de los datos y a la vez mantener toda la información original
Gráfica de puntos: cada valor de un dato se representa como un punto a lo
largo de una escala de valores, los puntos que representan valores iguales se
amontonan
• •••• • • •••••• •••• • •• ••• • • •
• •• • • •••• •• •• •
• • •• • •
• ••
•
150 160 170 180 190 200

Regla del suceso infrecuente para estadística inferencial:
Si, bajo un supuesto dado, la probabilidad de un suceso particular
observado es extremadamente pequeña, concluimos que el supuesto
probablemente es erróneo.
Suceso: cualquier conjunto de resultados o consecuencias de un
procedimiento
Suceso simple: resultado o suceso que ya no puede desglosarse
en componentes más simples
Espacio muestral: todos los sucesos simples posibles para un
procedimiento
Procedimiento o Experimento: proceso mediante el cual se
obtiene un resultado. Un experimento puede tener uno o más
resultados posibles a los que se denominan eventos o sucesos.
Suceso compuesto: cualquier suceso que combina dos o mas
sucesos simples
La Teoría de la Probabilidad (Ciencia de la Incertidumbre) nos ayuda
a evaluar en forma científica los riesgos para tomar decisiones.

Ejemplo:
Una ruleta tiene 38 ranuras distintas, y es diseñada de manera que las 38 ranuras sean
igualmente probables de resultar. Usted planea apostar al número 13 en el próximo giro.
Cual es la probabilidad de que pierda?
3 enfoques diferentes para definir la probabilidad de un suceso:
1) Método clásico de la probabilidad
P(A) =
número de formas en que puede ocurrir A
número de sucesos simples diferentes
sólo para resultados
equiprobables
− si es aplicable, la probabilidad obtenida es exacta
− no exige la realización de experiencias ni la recogida de datos
− de fácil uso
P(A) =
37
38
= 0,97

10.- En un estudio de reconocimiento de marcas, 831 consumidores conocían la marca HP y 18
no. Use dichos resultados para estimar la probabilidad de que un consumidor que se selecciona al
azar reconozca la marca HP.
3 enfoques diferentes para definir la probabilidad de un suceso:
2) Aproximación de la probabilidad por frecuencias relativas
aparece como el resultado de muchos ensayos o pruebas y consiste en dar a la frecuencia relativa
de una distribución un sentido probabilístico
P(A) =
número de veces que ocurre A
número de veces que se repitió el ensayo
− la experiencia debe ser repetible
− cualquier probabilidad obtenida a partir de la frecuencia relativa es una aproximación (en
lugar de un valor exacto)
Ley de los grandes números:
conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas de un
suceso tiende a aproximarse a la probabilidad real
P(A) =
831
849
= 0,98

3) Probabilidades subjetivas (grado de creencia)
P(A) se obtiene suponiendo o estimando su valor en base al conocimiento de las
circunstancias relevantes
− siempre es aplicable.
− su acierto depende de lo correcta que sea la información de la que dispone
− no se pueden dar reglas para su determinación precisa, y por tanto escapa al
tratamiento matemático
− difícil de defender
Ejemplo:
Cual es la probabilidad de que su auto sea impactado por un meteorito este año?
En base al conocimiento relevante se estima una
probabilidad muy cercana a 0

la probabilidad matemática de cualquier suceso es 0, 1, o un número entre 0 y 1
• 0 ≤ P(A) ≤ 1
• la probabilidad de un suceso imposible es 0
• la probabilidad de un suceso que ocurrirá con certeza es 1
cierto
probable
probabilidad 50-50
improbable
imposible
1
0
0,5

Cálculo de la Probabilidad de un Evento
−• Definir el experimento
−• Listar todos los Eventos Posibles
−• Asignar Probabilidad a cada Evento Simple
−• Determinar la Composición del Evento de interés
−• Calcular la probabilidad del Evento

Probabilidad de dos
eventos A y B
Probabilidad de dos
eventos A y B
P(A o B)
Son A y B mutuamente
excluyentes?
P(A o B)
Son A y B mutuamente
excluyentes?
P(A y B)
Son A y B
independientes?
P(A y B)
Son A y B
independientes?
P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B)
P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B)
P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B)
P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A)
NONOSISI NONOSISI

P(A o B)
Regla de la suma
son A y B
mutuamente
excluyentes?
P(A o B) = P(A) + P(B)P(A o B) = P(A) + P(B)
P(A o B) = P(A) + P(B) - P(A y B)P(A o B) = P(A) + P(B) - P(A y B)
P(A) P(B)
P(A y B)
P(A U B) = P(A) + P(B) - P(A ∩ B)P(A U B) = P(A) + P(B) - P(A ∩ B)
P(A) P(B)
P(A U B) = P(A) + P(B)P(A U B) = P(A) + P(B)
SISI
NONO
Dos suceso A y B son
mutuamente excluyentes
cuando ambos no pueden
ocurrir juntos
Dos suceso A y B son
mutuamente excluyentes
cuando ambos no pueden
ocurrir juntos

P(A y B)
Regla de la multiplicacion
son A y B
independientes?
P(A y B) = P(A) * P(B)P(A y B) = P(A) * P(B)
P(A y B) = P(A) * P(B | A)P(A y B) = P(A) * P(B | A)
SISI
NONO
Dos suceso A y B son independientes cuando
la ocurrencia de uno no afecta la probabilidad
de la ocurrencia del otro
Dos suceso A y B son independientes cuando
la ocurrencia de uno no afecta la probabilidad
de la ocurrencia del otro
Dos sucesos A y B
son independientes si
Dos sucesos A y B
son dependientes si
P(B | A) = P(B)
o
P(A y B) = P(A) * P(B)
P(B | A) ≠ P(B)
o
P(A y B) ≠ P(A) * P(B)
P(B | A) =
P(A)
P(A y B)
Prueba de independencia
Probabilidad
condicional

Sucesos complementarios
A = complemento del suceso A, consiste en todos los
resultados en los cuales el suceso A no ocurre
P(A) + P (A) = 1
P(A) = 1 - P(A)
P(A) = 1 - P(A)
P(A)
P(A) = 1 - P(A)
probabilidad de “uno al menos”
para calcular la probabilidad de uno al menos de algo, calcule la
probabilidad de ninguno, y reste el resultado a 1
P(uno al menos) = 1 - P(ninguno)
P(A) = 1 - P(A)
Cual es la probabilidad de seleccionar un computador que no sea de 50 Giga?
Cual es la probabilidad de sacar al menos un 5 al tirar 3 dados?

Variable aleatoria: variable que tiene
un solo valor numérico (x), determinado por el
azar, para cada resultado de un procedimiento.
Variable aleatoria discreta: tiene un
número finito de valores o un número de
valores contable (pueden asociarse con un
proceso de conteo)
Variable aleatoria continua: tiene un
número infinito de valores, los cuales pueden
asociarse a mediciones en una escala continua,
de manera que no haya huecos ni
interrupciones
DISTRIBUCIONES DE PROBABILIDAD

Distribución de probabilidad: gráfica, tabla o fórmula que da la probabilidad
de cada valor de la variable aleatoria.
Requisitos de una distribución de probabilidad
∑ P(x) = 1
0 ≤ P(x) ≤ 1
x P(x)
0 0,502
1 0,345
2 0,108
3 0,041
4 0,004
0
0,1
0,2
0,3
0,4
0,5
0,6
0 1 2 3 4
número de defectos en cada grupo
P(x)
Ejemplo. Durante la fabricación de un modelo de DVD, se seleccionan
aleatoriamente grupos de DVD y se calcula el número de defectos en cada
grupo

DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL
resulta de un procedimiento que cumple con todos los requisitos siguientes:
1.- el procedimiento tiene un número fijo de ensayos
2.- los ensayos deben ser independientes (el resultado de cualquier ensayo individual no
afecta las probabilidades de los otros ensayos)
3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías
4.- las probabilidades tienen que mantenerse constantes para cada ensayo
NOTACIÓN PARA DISTRIBUCIONES DE PROBABILIDAD BINOMIAL
n número fijo de ensayos
2 categorías posibles de resultado: E (éxito) y F (fracaso)
p probabilidad de éxito en uno de n ensayos p = P(E)
q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 - p
x número específico de éxitos en n ensayos (cualquier entero entre 0 y n, inclusive)
P(x) probabilidad de lograr exactamente x éxitos en los n ensayos

Respuesta a)
1.- el procedimiento tiene un número fijo de ensayos. R: si
2.- los ensayos deben ser independientes. R: si
3.- todos los resultados de cada ensayo deben estar clasificados en dos categorías. R: si
4.- las probabilidades tienen que mantenerse constantes para cada ensayo. R: si
Respuesta b)
n número fijo de ensayos = 8
p probabilidad de éxito en uno de n ensayos p = P(E) = 1/5 = 0,20
q probabilidad de fracaso en uno de n ensayos q = P(F) = 1 – p = 1 – 0,20 = 0,80
x número específico de éxitos en n ensayos = 6
Ejemplo. Análisis de respuestas de opción múltiple. Un profesor aplica un examen
sorpresa que consta de ocho preguntas de opción múltiple, cada una con cinco
respuestas posibles (a, b, c, d y e), pero solo una de ellas correcta. Supongamos que un
estudiante sin preparación adecuada hace adivinanzas al azar, y que queremos calcular
la probabilidad de que tenga exactamente seis respuestas correctas en las ocho
preguntas.
a) resultará este proceso en una distribución binomial?
b) si la respuesta anterior es si, identifique los valores de n, x, p y q

P(x) = . px
. qn-x
n!
(n - x)! x!
P(x) = nCx . px
. qn-x
c) calcule la probabilidad de que tenga exactamente cuatro respuestas correctas
d) calcule la probabilidad de que tenga menos de cuatro respuestas correctas
e) calcule la probabilidad de que tenga más de cuatro respuestas correctas
f) calcule la probabilidad de que tenga como máximo cuatro respuestas correctas
g) calcule la probabilidad de que tenga al menos cuatro respuestas correctas
h) calcule la probabilidad de que tenga entre cuatro y seis respuestas correctas
P(4) = 8C4 . 0,204
. 0,804
= 0,046
P(X<4) = P(0) + P(1) + P(2) + P(3) = 0,94
P(X>4) = P(5) + P(6) + P(7) + P(8) = 0,10
P(X≤4) = P(0) + P(1) + P(2) + P(3) + P(4) = 0,99
P(X≥4) = P(4) + P(5) + P(6) + P(7) + P(8) = 0,056
P(4≤X≤6) = P(4) + P(5) + P(6) = 0,056

μ = n . p σ2
= n . p . q σ = n . p . q
Ejemplo. Varios estudiantes no se prepararon para un examen sorpresa de
verdadero/falso de 10 preguntas, por lo cual todas sus repuestas son adivinanzas.
a.- calcule las media y la desviación estándar del número de respuestas correctas que
obtendrán.
b.- sería poco común que un estudiante pasara el examen adivinando y obtuviera al
menos 7 respuestas correctas?
valor mínimo “común” ≈ μ - 2 (σ)
valor máximo “común” ≈ μ + 2 (σ)
Respuestas
a.- μ = n . p = 10 . 0,5 = 5
σ = n . p . q = 10 . 0,5 . 0,5 = 2,5 = 1,58
b.- valor máximo “común” ≈ μ + 2 (σ) = 5 + 2(1,58) = 8,16
R: no, no sería poco común.

Si una variable aleatoria continua tiene una distribución con una gráfica simétrica y en
forma de campana, a la vez que puede ser descrita por medio de la siguiente ecuación,
decimos que tiene distribución normal
μ
intervalos
f(
x)
x
Propiedades de la curva normal:
- es simétrica con respecto a la media aritmética
- decrece uniformemente en ambas direcciones a partir del valor central
- las dos colas nunca tocan el eje horizontal
- a cualquier área debajo de la curva se le puede dar un criterio
probabilístico (f/n)
50% 50%
100%
-∞ ∞

z =
σ
x - μ
z =
s
x - x
s desviación estándar muestral
σ desviación estándar poblacional
x valores de datos individuales
x media de un conjunto de valores muestrales
μ media de valores de una población
ESTANDARIZACIÓN o NORMALIZACIÓN
Ej: μ = US$ 25
σ = US$ 5
x = US$ 20
2520
μµ-1σ
0-1

99,7%
95%
68%
x
+s-s
+2s
+3s
-2s
-3s
Regla empírica para datos con distribución normal
• 68% de todos los valores están dentro de una desviación
estándar de la media
• 95% de todos los valores están dentro de dos desviaciones
• 99,7% de todos los valores están dentro de tres desviaciones

99,74%
95,44%
68,26%
μ
+σ-σ
+2σ
+3σ
-2σ
-3σ
99,7%
95%
68%
x
+s-s
+2s
+3s
-2s
-3σ

-2,58σ +2,58σ-1,96σ +1,96σ μμ
μ
95%
2,5% 2,5%
99%
0,5% 0,5%
μ ± 1,96σ μ ± 2,58σ
95%
5%
+1,65σ μ
95%
5%
-1,65σ
Análisis de 2 colas
Análisis de 1 cola al 95%
-∞ ∞ -∞ ∞
-∞ ∞ -∞ ∞

-1,96 1,96
1) Determinar si un valor de x pertenece a la población de estudio
El tiempo de vida de las lámparas fluorescentes producidas por la empresa XX se
distribuye normalmente con una media de 176,5 días y una desviación estándar de 11,3
días. Es probable que una lámpara seleccionada aleatoriamente, con un tiempo de vida
de 207,4 días pertenezca a esta población?
z =
σ
x - μ
z =
11,3
207,4 – 176,5
= 2,73
x (días) 176,5
207,4
z 0 2,73
Interpretación:
Es probable que no pertenezca a la población de estudio

De acuerdo a un estudio, el tiempo de reemplazo de los televisores se distribuye
normalmente, con una media de 8,2 años y una desviación estándar de 1,1 años.
a) Cual es la probabilidad de que un televisor elegido al azar dure entre 8,2 y 10 años?
z =
σ
x - μ
z =
1,1
10 - 8,2
= 1,64
x (años) 8,2 10 z 0 1,64
P(0 a 1,64) = 0,4495
Interpretación:
a) la probabilidad de que un televisor dure entre 8,2 y 10 años es de 0,4495

Medidas De Tendencia Central
valor que se encuentra en el centro o la mitad de un conjunto de datos
Media aritmética: medida de tendencia central que se obtiene sumando los
puntajes y dividiendo el total entre el número de puntajes
∑x
x =
n
∑x
μ =
N
n número de valores de una muestra
N número de valores de una población
Media aritmética de una distribución de frecuencias (datos agrupados)
∑(f . x)x =
n
. x marca de clase
f frecuencia
.
ANÁLISIS ESTADÍSTICO SIMPLE

clases x f fr fr% F Fr Fr%
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
Tiempo de vida de lámparas fluorescentes producidas por la empresa XX
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x * f
471
984
2223
2670
740
960
796
8844
∑x
x =
n
8824
=
50
= 176,5
8844
=
50
= 176,9
∑(f . x)x =
n
.
. .
cálculo de la media aritmética a partir de un conjunto de datos sin agrupar
cálculo de la media aritmética a partir de un conjunto de datos agrupados

Mediana:
L Me =
2
n + 1
50% de los valores ≤ Me ≤ 50% de los valores
Si el número de valores es impar, la Me es el valor que se localiza
exactamente a la mitad de la lista ordenada, si el número de
valores es par se obtiene calculando la media de los dos números
que están a la mitad
valor que se encuentra en medio, cuando los valores originales se
presentan en orden de magnitud creciente
Mediana de una distribución de frecuencias (datos agrupados)
Li límite inferior de la clase que contiene Me
i ancho de clase
f frecuencia de clase que contiene Me
Fa frecuencia acumulada de clase anterior
Li + i
Me =
- (Fa+1)
f
2
n+1
8
8
3
5
9
2
4 8
8
3
5
1
1
4
3
Posición en
la lista
ordenada
2 – 3 – 4 – 5 – 8 – 8 – 9 1 – 1 – 3 – 3 – 4 – 5 – 8 – 8

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
154 154 154 163 163
164 164 165 166 168
168 168 168 170 170
172 173 174 174 174
174 174 175 175 175
175 176 176 177 177
177 179 179 180 180
180 181 182 184 186
187 190 190 191 191
192 196 199 199 201
L Me =
2
n + 1 51
=
2
= 25,5
Me =
175 + 175
2
350
=
2
= 175,0
cálculo de la mediana a partir de un conjunto de datos sin agrupar
conjunto de datos en orden ascendente

154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
Li + i
Me =
- (Fa+1)
f
2
n+1
=
175 + 7
51
- 23
2
15
= 176,2
.
cálculo de la mediana a partir de un conjunto de datos agrupados
ClasequecontienealaMe

0
20
40
60
80
100
0
días
Fr%
160,5 167,5 174,5 181,5 188,5 195,5 202,5
cálculo de la mediana a partir de una ojiva

8
8
3
5
2
1
4
3
Moda: valor que ocurre con mayor frecuencia
8
8
3
5
9
2
48
5
9
8
7
5
2
1
4
3
6
Moda de una distribución de frecuencias (datos agrupados)
Li límite inferior de la clase modal
i ancho de clase
Δ1 diferencia entre f de clase modal y clase anterior
Δ2 diferencia entre f de clase modal y clase siguiente
Li + * i
Mo =
Δ1
Δ1 + Δ2
unimodal bimodal No hay moda

154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
.
identificación de la moda a partir de un conjunto de datos sin agrupar
cálculo de la moda a partir de un conjunto de datos agrupados
Li + * i
Mo =
Δ1
Δ1 + Δ2
175 + * 7
=
2
2 + 11
= 176,1
Clasemodal

Mitad del rango:
valor que esta a medio camino entre el puntaje más alto y
el más bajo
Mitad del rango =
2
valor máximo + valor mínimo
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Mitad del rango =
2
valor máximo + valor mínimo 201 + 154
=
2
= 177,5
cálculo de la mitad del rango a partir de un conjunto de datos sin agrupar

Media − Toma en cuanta cada valor
− Se ve afectada por valores extremos
− Siempre existe
− Confiable (cuando las muestras se extraen
de la misma población, las medias
muestrales tienden a ser más consistentes
que las otras medidas de tendencia central)
Mediana − No toma en cuanta cada valor
− No se ve afectada por valores extremos
− es más representativa que la media cuando
hay datos muy extremos
Moda − No toma en cuanta cada valor
− No se ve afectada por valores extremos
− Puede no existir o haber más de una
− No se usa mucho con datos numéricos, es
la única que puede usarse con datos de
nivel nominal
Mitad del rango − No toma en cuanta cada valor
− Se ve afectada por valores extremos
• Datos numéricos
• Distribuciones simétricas
• Datos ordinales o numéricos
• Distribuciones asimétricas
• Pocas observaciones
• Datos nominales
• Distribuciones bimodales
Características De Las Diferentes Medidas De Tendencia Central

• Una comparación de la media, la mediana y la moda puede revelar información
acerca de la característica del sesgo
• Una distribución de datos es simétrica si la mitad izquierda de su histograma es
aproximadamente una imagen especular de su mitad derecha
• Una distribución de datos está sesgada si no es simétrica y se extiende más
hacia un lado que hacia el otro
Sesgada a la derecha (sesgo positivo)
Media y mediana a la derecha de la moda
Sesgada a la izquierda (sesgo negativo)
Media y mediana a la izquierda de la moda
Mo Me x MoMex
Mo = Me = x
leptocúrtica platicúrticamesocúrtica
3 ( x – Me )
as =
s
Coeficiente de asimetría de Pearson

MEDIDAS DE DISPERSIÓN
Proporcionan información acerca de la variabilidad presente en un conjunto de datos
Rango : diferencia entre el valor máximo y el valor mínimo de un
conjunto de datos
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Rango = (valor máximo) - (valor mínimo)
Rango = (valor máximo) - (valor mínimo) = 201 - 154 = 47,0
cálculo del rango a partir de un conjunto de datos sin agrupar

s2
=
∑ ( x - x )2
n - 1
σ2
=
∑ ( x - μ )2
N
s2
varianza muestral
σ2
varianza poblacional
Varianza : medida de variación de los valores con respecto a la media,
indica la desviación promedio de los valores, con respecto a la media
n (n - 1)
=
n ∑(x2
) - (∑x)2
=
N ∑(x2
) - (∑x)2
N2
varianza de una distribución de frecuencias (datos agrupados)
x marca de clase
f frecuencia
.
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s2
=
n (n – 1)
. .

= 127,8 días2
=
6260,48
49
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x x - x (x - x)2
154 -22,48 505,3504
199 22,52 507,1504
191 14,52 210,8304
177 0,52 0,2704
163 -13,48 181,7104
192 15,52 240,8704
176 -0,48 0,2304
180 3,52 12,3904
….. ….. …..
….. ….. …..
∑x = 8824
n = 50
x = 176,48
∑(x - x)2
= 6260,48
n - 1 = 49
s2
=
∑ ( x - x )2
n - 1
cálculo de la varianza a partir de un conjunto de datos sin agrupar
Valores a calcular
Fórmula A

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
x x2
154 23716
199 39601
191 36481
177 31329
163 26569
192 36864
176 30976
180 32400
….. …..
….. …..
∑x = 8824
(∑x)2
= 77862976
∑(x2
) = 1563520
n = 50
n∑(x2
) = 78176000
n (n-1) = 2450
n (n - 1)
n ∑(x2
) - (∑x)2
50 (1563520) - 77862976
50 (49)
s2
= = = 127,8 días2
cálculo de la varianza a partir de un conjunto de datos sin agrupar
Fórmula B

50 (1570340) - 78216336s2
=
2450
= 122,7 días2
154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
f . x x2
f . x2
471 24649 73947
984 26896 161376
2223 29241 380133
2670 31684 475260
740 34225 136900
960 36864 184320
796 39601 158404
8844 223160 1570340
∑ (f . x2
) = 1570340
∑ (f . x) = 8844
[∑ (f . x)]2
= 78216336
n (n-1) = 2450
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s2
=
n (n – 1)
. .
. . ..
.
.
.
cálculo de la varianza a partir de un conjunto de datos agrupados

Desviación
Estándar :
− medida de variación de todos los valores con respecto a la media
− su valor suele ser positivo
− se puede incrementar de manera drástica con la inclusión de datos
distantes
− las unidades de la desviación estándar son las mismas de los datos
originales
=
n (n - 1)
n ∑(x2
) - (∑x)2
=
N ∑(x2
) - (∑x)2
N2
s =
∑ ( x - x )2
n - 1
σ =
∑ ( x - μ )2
N
desviación estándar de una distribución de frecuencias (datos agrupados)
x marca de clase
f frecuencia
.
n [ ∑ ( f . x2
) ] – [ ∑ ( f . x ) ]2
s =
n (n – 1)
. .

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
s = = 11,3 díass2
= 127,8
cálculo de la desviación estándar a partir de un conjunto de datos sin agrupar

154-160 157 3 0,06 6 3 0,06 6
161-167 164 6 0,12 12 9 0,18 18
168-174 171 13 0,26 26 22 0,44 44
175-181 178 15 0,30 30 37 0,74 74
182-188 185 4 0,08 8 41 0,82 82
189-195 192 5 0,10 10 46 0,92 92
196-202 199 4 0,08 8 50 1,00 100
Totales 1246 50 1,00 100
f . x x2
f . x2
471 24649 73947
984 26896 161376
2223 29241 380133
2670 31684 475260
740 34225 136900
960 36864 184320
796 39601 158404
8844 223160 1570340
. . ..
s = = 11,1 díass2
= 122,7
cálculo de la desviación estándar a partir de un conjunto de datos agrupados

Coeficiente de
variación
describe la desviación estándar relativa a la media
CV = .100%
x
s
CV = .100%
μ
σ

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
Peso de lámparas fluorescentes producidas por la empresa YY
221,2 223,5 225,0 224,3 223,3
219,1 218,5 223,4 222,1 220,2
218,0 224,1 221,7 223,7 225,4
227,5 220,9 222,6 225,8 223,5
225,6 225,7 220,8 225,9 220,0
224,5 220,2 222,1 223,3 222,7
223,5 220,6 225,8 224,7 223,2
225,1 219,3 220,4 223,3 224,1
222,3 222,8 224,8 226,6 225,4
220,1 220,2 224,7 225,5 222,3
CV = .100%
x
s
= .100%
222,99
2,30
= 1,03%
CV = .100%
x
s
= .100%
176,5
11,3
= 6,40%
comparación del coeficiente de variación de dos conjuntos de datos

Regla práctica del intervalo
• para muchos conjuntos de datos, la vasta mayoría (tanto como el 95%) de los
valores muestrales se ubican dentro de 2 desviaciones estándar (s) de la media
valor mínimo “común” ≈ x - 2 (s)
valor máximo “común” ≈ x + 2 (s)
154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
cálculo de valores mínimo y máximo común por la regla práctica del intervalo
valor mínimo “común” ≈ x - 2 (s) ≈ 176,5 - 2 (11,3) ≈ 176,5 - 22,6 ≈ 153,9 días
valor máximo “común” ≈ x + 2 (s) ≈ 176,5 + 2 (11,3) ≈ 176,5 + 22,6 ≈ 199,1 días

Regla empírica para datos con distribución normal
• aprox el 68% de todos los valores están dentro de una desviación estándas de la
media
• aprox el 95% de todos los valores están dentro de dos desviaciones estándar de la
media
• aprox el 99,7% de todos los valores están dentro de tres desviaciones estándar de la
media
Ejercicio: las puntuaciones de CI de adultos
normales tienen una distribución normal,
con una media de 100 y una desviación
estándar de 15. Qué porcentaje de adultos
tienen puntuaciones de CI entre 55 y 145?
100 - 3(15) = 55
100 + 3(15) = 145
el 99,7% de todas las puntuaciones de CI
se encuentran entre 55 y 145

Teorema de Chebyshev
• la proporción de cualquier conjunto de datos que está dentro de k
desviaciones estándar de la media es siempre al menos 1 - 1 / k2
, donde k
es cualquier número positivo mayor que 1
para k = 2
• al menos 3/4 (75%) de todos los valores están dentro de 2 desviaciones
estándar de la muestra
para k = 3
• al menos 8/9 (89%) de todos los valores están dentro de 3 desviaciones
estándar de la muestra
Ejercicio: las puntuaciones de CI de adultos normales tienen una media de 100 y una
desviación estándar de 15. Qué podemos concluir a partir del teorema de Chebyshev?
• Por lo menos 75% de todos los adultos tienen puntuaciones de CI que están entre 70 y 130
• Al menos 89% de todos los adultos tienen puntuaciones de CI que están entre 55 y 145

z =
σ
x - μ
z =
s
x - x
pueden utilizarse para comparar valores de diferentes conjuntos de datos (puntuaciones z) o para
comparar valores dentro del mismo conjunto de datos (cuantiles o fractiles)
puntuación z : número de desviaciones estándar que un valor (x) se encuentra por arriba
o por debajo de la media
MEDIDAS DE POSICIÓN RELATIVA
valores de z positivos indican que x > que la media, valores negativos indican que x < que la media
valores comunes: -2 ≤ puntuación z ≤ 2
valores infrecuentes: puntuación z < -2 o puntuación z > 2
-3 -2 -1 0 1 2 3
valores comunes valores infrecuentesvalores infrecuentes

Ejercicio:
HP lanza al mercado un nuevo modelo de computador portátil de 14 pulgadas
que pesa 1,36 kg, al mismo tiempo que SONY promociona su nuevo modelo
de 17 pulgadas de 3,08 kg.
El modelo de HP es más liviano, pero cual de los dos es relativamente mas
liviano? El peso del modelo HP entre los computadores portátiles de 14
pulgadas, es más liviano que el del modelo SONY entre los de 17 pulgadas?
Las portables de 14 pulgadas en el mercado poseen pesos con una media de
2,58 kg y una desviación estándar de 0,67 kg; mientras que los modelos de 17
pulgadas poseen pesos con una media de 4,23 kg y una desviación estándar
de 0,54 kg
14 pulgadas
μ 2,58
σ 0,67
HP 1,36
17 pulgadas
μ 4,23
σ 0,54
SONY 3,08
z =
σ
x - μ
z HP -1,82 z SONY -2,13

cuantiles o fractiles: separan los datos en grupos con casi el mismo número de valores
existen 3 cuartiles (Q1, Q2 y Q3), que dividen los valores ordenados en 4 partes iguales
• Q1 (primer cuartil): separa el 25% inferior de los valores ordenados, del 75% superior
• Q2 (segundo cuartil): separa el 50% inferior de los valores ordenados, del 50% superior
• Q3 (tercer cuartil): separa el 75% inferior de los valores ordenados, del 25% superior
existen 99 percentiles (P1, P2, …P99), que separan los datos en 100 grupos, con
aproximadamente el 1% de los valores en cada grupo
deciles…
quintiles…
percentil del valor x = . 100
número de valores menores que x
número total de valores
conversión de un valor muestral dado a su percentil correspondiente
LQ1 = ¼ (n+1), si es número decimal, redondear hacia arriba
LQ2 = Mediana = ½ (n+1), si es número decimal, promediar entre los dos valores centrales
LQ3 = ¾ (n+1), si es número decimal, redondear hacia abajo
Posición en
la lista
ordenada

154 164 184 177 175
199 168 174 179 186
191 175 168 201 168
177 175 164 190 154
163 180 196 190 180
192 165 175 170 163
176 191 168 179 174
180 172 176 182 173
166 181 154 174 174
170 174 177 187 199
percentil de 196?
Q1?
Q2?
Q3?
percentil del valor x = . 100
número de valores menores que x
número total de valores
percentil de 196 = . 100 = 92
46
50
LQ1 = ¼ (n+1) = 12,75 ≈ 13
154 154 154 163 163
164 164 165 166 168
168 168 168 170 170
172 173 174 174 174
174 174 175 175 175
175 176 176 177 177
177 179 179 180 180
180 181 182 184 186
187 190 190 191 191
192 196 199 199 201
Presentar conjunto de datos en orden ascendente
LQ2 = ½ (n+1) = 25,5
LQ3 = ¾ (n+1) = 38,25 ≈ 38
Q1 = 168
Q2 = (175 +175) / 2 = 175Q2 = (175 +175) / 2 = 175
Q3 = 182

DATOS DISTANTES o VALORES ATÍPICOS:
observación que es significativamente mas grande o más pequeña con respecto a los otros
valores en una serie de datos
pueden afectar en gran medida el valor de la media y de la desviación estándar, así como
distorsionar gravemente un histograma
• observación registrada incorrectamente
• observación proviene de diferente población
• observación correcta, pero representa un evento raro
1.- puntuación z: observaciones con puntuaciones z mayores que 2 en valor absoluto son
consideradas atípicas.
2.- diagrama de caja: gráfica de un conjunto de datos que consiste en una línea
que se extiende desde el valor mín hasta el valor máx, así como una caja con
líneas trazadas en Q1, Me y Q3
métodos para detectar valores atípicos:
Pueden deberse a:

Q1 168
Q2 175
Q3 182
IQR (Q3-Q1) 14
Vmáx 201
Vmín 154
Q1 - 1,5 (IQR) 147
Q3 + 1,5 (IQR) 203
Q1 - 3 (IQR) 126
Q3 + 3 (IQR) 224
Q1 - 1,5 (IQR)
Le Li Li Le
Q3 + 1,5 (IQR)
Q3 + 3 (IQR)Q1 - 3 (IQR)
Vmín Vmáx
Pasos a seguir en la construcción de un diagrama de caja:
• Calcular Me, Q1 y Q3, y el rango intercuartilar (IQR) de una
serie de datos (IQR = Q3 - Q1)
• Construir una caja sobre el eje X con la ubicación de Q1 y Q3.
El ancho de la caja es igual al IQR. Trazar una línea vertical
dentro de la caja en el valor de la Me
• Dibujar líneas que se extiendan hacia fuera del cuadro, hasta los
valores mín y máx
• Identificar limites interiores localizados a una distancia de 1,5
(IQR) debajo de Q1 y por encima de Q3; y límites exteriores
localizados a una distancia de 3 (IQR) debajo de Q1 y por
encima de Q3
120 130 140 150 160 170 180 190 200 210 220 230
Q1 Me Q3
(IQR)valores
altamente
sospechosos
valores
altamente
sospechosos
valores
sospechosos
valores
sospechosos

Estadistica

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Estadistica

Similar a Estadistica (20)

Último

Último (20)

Estadistica