Este documento presenta tablas y fórmulas estadísticas relacionadas con medidas de posición, medidas de variabilidad, índices de precios, muestreo aleatorio simple, análisis de regresión lineal simple, análisis de correlación lineal simple, muestreo aleatorio estratificado y muestreo por conglomerados. Incluye fórmulas para calcular el promedio, la mediana, la moda, la varianza, el coeficiente de variación, percentiles, entre otras medidas.
1. Tablas y Fórmulas Estadísticas
TABLAS Y FORMULAS
ESTADISTICAS
Carlo Magno Araya
Profesor de Estadística
Sede de Occidente
Universidad de Costa Rica
1
2. Tablas y Fórmulas Estadísticas
MEDIDAS DE POSICION
Datos sin agrupar
Datos agrupados
Promedio aritmético de muestras
k
n
∑ xi fi
∑ xi
x=
x =
i =1
∑ fi
n
i =1
Promedio ponderado
n
Mediana
∑ x i wi
x=
i=1
k
i =1
n
∑ wi
n
- F i-1
2
*c
M e = Li +
fi
i =1
Mediana para n impar
M e = X n +1
2
Moda
d1
*c
M o = Li +
d 1+ d 2
d 1 = f i − f i −1
d 2 = f i − f i +1
Mediana para n par
Percentiles
X n + X n
Me =
+1
2
2
2
m.n
- F i-1
100
*c
P m = Li +
fi
Percentiles
Pm = X
m
100 ( n + 1)
Media geométrico
n
x g = x 1 . x 2 .... x n
Media armónica
xa =
n
n
∑
i=1
1
xi
2
3. Tablas y Fórmulas Estadísticas
MEDIDAS DE VARIABILIDAD
Datos sin agrupar
Datos agrupados
Variancia de una muestra
1 k
1 n
2
2
2
∑ ( x − x )2 . f i
sx =
sx =
xi − x )
∑(
n − 1 i =1 i
n − 1 i =1
2
n
xi
n
∑
1 2 i =1
2
sx =
∑ xi −
n − 1 i =1
n
2
k
∑ xi f i
k
i=1
1
2
sx =
. ∑ x2 f
n - 1 i=1 i i
n
Variancia de la población
1 N
2
2
σ x = ∑ ( xi − µ )
N i =1
2
N
N
∑ xi
1
2
σ x = . ∑ xi2 - i=1
i=1
N
N
Coeficiente de variación de una
población
CV x =
σx
* 100
µ
σ2=
x
2
1 k
∑ xi − µ . f i
N i =1
(
)
2
k
∑ xi f i
k
i=1
1
σ 2 = . ∑ xi2 f i x
N i=1
N
Coeficiente de variación de
una muestra
sx
CV x = * 100
x
Desviación media
k
n
∑ | xi - x|. f i
∑ | xi - x|
D. M.=
i=1
D. M.=
n
i=1
k
∑ fi
i=1
Medida de variabilidad para muestras
pareadas
s2 =
d
1 n 2
. ∑ di
n -1 i=1
di = X 1i - X 2i
Variancia para variables
dicotómicas
σ 2 = PQ
$$
s 2 = pq
3
4. Tablas y Fórmulas Estadísticas
INDICE DE PRECIOS
Relativo simple de precios
p
I = n ⋅ 100
p0
Agregado simple de precios
k
∑ pn
i =1
k
I=
⋅ 100
∑ p0
i =1
Promedio de los relativos simples de precios
k p
∑ n
i =1 p 0
I =
⋅ 100
k
Laspeyres
I PL =
Laspeyres
I QL =
Índices de precios ponderados
Paasche
∑ pn q o
⋅ 100
∑ po q o
I PP =
∑ pn q n
⋅ 100
∑ po q n
Índices de cantidades ponderados
Paasche
∑ po q n
⋅ 100
∑ po q o
I QP =
∑ pn q n
⋅ 100
∑ pn q o
Indice de precio de Fischer
∑ pn q0 ∑ pn qn
⋅ 100
I PF =
∑ p0 q0 ∑ p0qn
4
5. Tablas y Fórmulas Estadísticas
MUESTREO ALEATORIO SIMPLE
Población finita
Población infinita
Variancia del promedio
N - n s2
. x
N -1 n
N - n σ2
2
=
. x
σx
N -1 n
s2 =
x
s2 =
x
σ2 =
x
s2
x
n
σ2
x
n
Variancia de una proporción
s 2$ =
p
$$
N - n pq
.
N -1 n
s2$ =
p
$$
pq
n
PQ
N - n PQ
.
σ 2$ =
p
n
N -1 n
Tamaño de muestra para la estimación
De un promedio y una proporción poblacional
σ 2$ =
p
n1
n=
n
1+ 1
N
n1
n=
n
1+ 1
N
Zα / 2 σ
donde n1 =
d
2
Z α / 2 PQ
donde n1 =
d
Z σ
n = α/2
d
2
2
Z α / 2 PQ
n=
d
2
Intervalos de confianza para el promedio cuando
la variancia de la población es conocida
σx
N -n σx
*
Li = x ± Zα /2*
N -1
n
n
Intervalos de confianza para el promedio cuando la variancia
de la población es desconocida y n≤30
≤
N - n sx
sx
*
Li = x ± t α / 2(n-1)gl *
Li = x ± t α / 2(n-1)gl *
N -1
n
n
Li = x ± Z α / 2 *
Intervalos de confianza para una proporción si np>5 y nq>5
$$
N -n
pq
$$
pq
$
*
Li = p ± Z α / 2 *
$
Li = p ± Z α / 2 *
N -1
n
n
5
6. Tablas y Fórmulas Estadísticas
ESTADISTICO PARA PRUEBA DE HIPOTESIS
Promedios
Para un promedio: variancia conocida
Proporciones
Para una proporción
x-µ
Zc =
Zc =
σ
$
p- P
PQ
n
n
Para un promedio: variancia
desconocida
x-µ
tc =
Diferencia de proporciones
$
$
p1 − p2
$ $ $ $
p1 q1 p2 q 2
+
n1
n2
Zc =
s
n
Diferencia de dos promedios: variancia Otra alternativa de cálculo:
x1 x 2
conocida
−
x1 - x 2
Zc =
2
σ1
n1
+
Zc =
σ2
2
n2
n1
1
1
p(1 − p) −
n1 n 2
p=
Diferencia de dos promedios: variancia desconocida
x1 - x 2
*k
k=
tc =
donde
2
( n1 - 1) S 1 + ( n2 - 1) S 2
2
Estadístico de prueba de independencia y de homogeneidad Ji-Cuadrada
2
r
(Oij - E ij )2
c
χ =∑ ∑
i=1 j=1
E ij =
E ij
Ni N j
N
n2
x1 + x 2
n1 + n2
n1 n2 ( n1 + n2 - 2)
n1 + n 2
Estadístico de prueba para muestras
pareadas
tc =
d
Sd / n
6
7. Tablas y Fórmulas Estadísticas
ANALISIS DE REGRESION LINEAL SIMPLE
Constante de regresión
Coeficiente regresión lineal
n
n
a = y − bx
b=
i=1
i=1
Intervalos de confianza para el
promedio de y dado un x0
(
n
i=1
)
2
(
x0 - x
1
1+ +
n
SC x
$
Li = y ± tα / 2(n-2)gl * S e
Suma de cuadrados de x
n
i=1
n
Intervalos de confianza para una
observación de y dado un x0
x0 - x
1
$
+
Li = y ± t α / 2(n-2)gl * S e
n
SC x
Error estándar de estimación
n
i=1
2
n ∑ xi2 - ∑ xi
i=1
i=1
n
i=1
2
∑ yi - a ∑ y i - b ∑ xi yi
Se =
n
n ∑ xi yi - ∑ xi ∑ yi
n
SC x = ∑ xi2 -
n
∑ xi
i=1
2
n
i=1
n-2
Inferencia sobre la constante y coeficiente de regresión
Intervalos de confianza
Estadístico de prueba de hipótesis
a
1 x2
tc =
a ± t ( n− 2 ) gl S e
+
1 x2
n SCx
+
Se
n SC x
Se
b ± t ( n−2 ) gl
tc =
SC x
b
Se /
SC x
ANALISIS DE CORRELACION LINEAL SIMPLE
Coeficiente de correlación lineal
n
n
n
i=1
i=1
i=1
n ∑ xi yi - ∑ xi ∑ y i
r=
2
n
n
n ∑ xi2 - ∑ x i
i=1
i=1
2
n
n
* n ∑ y i2 - ∑ yi
i=1
i=1
Estadístico para prueba de hipótesis sobre Coeficiente de correlación parcial
r12 − r13 r23
el coeficiente de correlación
tc =
r−ρ
2
1− r
n−2
r12.3 =
(1 − r )(1 − r )
2
13
2
23
)
2
7
8. Tablas y Fórmulas Estadísticas
MUESTREO ALEATORIO ESTRATIFICADO
Afijación de la muestra
proporcional
Afijación de la muestra
óptima o Neyman
N σ
=n⋅ L h h
nh
∑ Nhσ h
h=1
Nh
nh = n ⋅
L
∑ Nh
h=1
Promedio aritmético estratificado
y st =
Proporción estratificada
L
1 L
∑ N h yh = ∑ Wh xh
N h=1
h =1
N
Wh = h
N
Variancia del promedio estratificada
$
pst =
Variancia de la proporción estratificada
l
l
Var ( y st ) = ∑ Wh2 ⋅Var ( yh )
y =1
Tamaño de la muestra para
proporciones
Tamaño de la muestra para la
estimación de la media de la población
2
1 Wh2 sh
1
2
V = ∑
− ∑ Wh sh
n
wh
N
( )
$
$
Var ( pst ) = ∑ Wh2 ⋅Var ph
y =1
2
Wh2 sh
∑
wh
n=
1 W 2 s2
V+ ∑ h h
N
wh
L
1 L
$
$
∑ N h ph = ∑ Wh ph
N h=1
h =1
Proporcional:
n=
∑ Wh ph qh
n0
donde n0 =
n
V
1+ 0
N
Optimo supuesto:
n0
n=
1+
n0
1
∑ Wh ph qh
NV
(∑ W
=
h
ph qh
V
)
2
8
9. Tablas y Fórmulas Estadísticas
MUESTREO POR CONGLOMERADOS
Estimación del promedio
Estimación de una proporción
A
A
∑ yi
y =
∑ ai
i=1
A
i =1
A
$
p=
∑ mi
∑ mi
i=1
i =1
MODELOS DE CRECIMIENTO
Modelo aritmético
Modelo geométrico
N t = N 0 (1 + rt )
N t = N 0 (1+ r )
t
1 N - N0
r= ⋅ t
t
N0
N
r= t
No
1/ t
-1
Modelo exponencial
N t = N 0 e rt
1
r = ln N t
t N0
DISTRIBUCIONES DE PROBABILIDADES
Distribución binomial
n
f ( x ) = p x q n − x x=0, 1,..., n
x
Distribución de Poisson
x −λ
f ( x) =
Distribución hipergeométrica
D N − D
x n − x
f ( x) =
N
n
x=0, 1, 2,..., min(n,D)
f
λe
x!
x=0, 1,...
Distribución geométrica
( x ) = q x −1 p x=1, 2,...
TEOREMA DE BAYES
P( A) P( D / A)
P( A D ) =
P( A) P( D / A) + P( B) P( D / A)
TECNICAS DE CONTEO
Combinaciones
Permutaciones
n Pr =
n!
(n − x)!
nCr =
n!
r!(n − x)!
9
10. Tablas y Fórmulas Estadísticas 10
ANALISIS DE VARIANCIA A UNA VIA: DISEÑO
COMPLETAMENTE ALEATORIZADO
Media total
Suma de cuadrados total
r
r
c
SCT = ∑ ∑ ( xij − x ) 2
∑ ∑ xij
x=
c
i =1 j =1
i =1 j =1
n
Suma de cuadrados de los tratamientos
c
SCTR = ∑ rj ( x j − x )
j =1
2
Suma del cuadrado de error
r
c
SCE = ∑ ∑ ( xij − x j ) 2
i =1 j =1
Prueba para diferencias entre pares de medias
Diseños balanceados
Diseños no balanceados
Criterio de Tukey
Diferencia mínima significativa
T = qα , c , n − c
CME
R
DMS J , K =
1 1
+ (CME ) Fα , c −1,n − c
rj rk
Diferencia mínima significativa
DMS =
2( CME ) Fα ,1,n − c
r
ANALISIS DE VARIANCIA A DOS VÍAS: DISEÑO
ALEATORIZADO EN BLOQUES
Suma de cuadrados de bloques
r
SCBL = ∑ ci ( xi − x ) 2
i =1
Suma de cuadrados del error
SCE = SCT − SCTR − SCBL
11. Tablas y Fórmulas Estadísticas 11
PRUEBAS NO PARAMETRICAS
Prueba U de Mann-Whitney
n1 ( n1 + 1)
− ∑ R1
2
U1 = n1n2 +
Media y desviación estándar de la
distribución muestral para la prueba
U de Mann-Whitney
µu =
n2 ( n2 + 1)
− ∑ R2
2
U 2 = n1n2 +
n1n2 ( n1 + n2 + 1)
σu =
Valor Z para normalizar la prueba U de
Mann-Whitney
Z=
n1n2
2
12
Prueba de independencia ChiCuadrada
U i − µu
2
χ obs
σu
rc
( Oi − E i ) 2
i =1
Ei
=∑
Coeficiente de correlación de Spearman Desviación normal para la prueba de
rangos de Spearman
rs = 1 −
6∑ di2
(
Z = rs n − 1
)
n n2 − 1
Prueba de Kruskal-Wallis
12 Ri2
K=
∑
− 3( n + 1)
n( n + 1) ni
Valor crítico para la prueba de Kruskal-Wallis
Ck =
n( n + 1)
χα , k −1
12
2
1 1
+
ni n j