Este documento presenta fórmulas y conceptos básicos de estadística para analizar datos a granel y agrupados. Explica cómo calcular la media, moda, mediana, desviación estándar y otras medidas de tendencia central y dispersión. También describe diagramas de caja y fórmulas para construir clases en el análisis de datos agrupados. El objetivo es proporcionar herramientas estadísticas básicas para resumir y comparar conjuntos de datos.
1. FORMULARIO BASICO DE ESTADISTICA. Montoya.-
PARA DATOS A GRANEL:
Media:
n
xxx
X n...........21 ++
= =
n
x
n
i
i∑=1
*Para la media se verifica: ( )∑ =− 0xxi
*Media ponderada:
∑
∑=
w
wx
x ii
donde W son los factores de los cuales dependen los
datos
*Si f i datos tienen media m 1 , f 2 datos tienen media m 2 ……..f k tienen media m
k , la media de todos los datos es:
k
kk
fff
xmfxmfxmf
x
+++
+++
=
......
.....
21
2211
*Media supuesta:
n
fxd
xx s
∑+= , donde d corresponde a los desvío de cada dato
respecto a la media supuesta.
Moda: el dato que mas se repite
Mediana: si n es par valor central de los datos ordenados.
Si n es impar, promedio de los valores centrales de los datos ordenados.
Media geométrica: nxxxxn ...........** 221
Media armónica=
∑
ix
n
1
*VARIABLES NORMALIZADAS O REFERENCIAS TIPIFICADAS (para comparar
posiciones relativas)
Z=
p
pm
s
xx −
, mx :promedio de la muestra , px :promedio de la población ,s p
:desviación estándar de la población
MEDIDAS DE DISPERSION:
2. Desviación media : D:M=
n
xxi∑ −
Rango intercuartilico: Datos que se ubican entre el 25% y el 75%
Rango intercuartilico: la mitad de los datos ubicados en el rango intercuartilico.
Desviación estándar: ( )
n
xx
S
∑ −
=
2
para la poblacion.
Desviación estándar: ( )
1
2
−
−
=
∑
n
xx
S para la muestra
Varianza =S 2
Relación empírica entre las medidas de dispersión:
Desviación media=
5
4
(desviación típica)
Rango semiintercuartilico =
3
2
(desviación típica)
PARA DATOS AGRUPADOS o INTERVALARES:
n
fx
x i∑= , donde x i corresponde a la marca de clase.
n
fd
xx i
∑+= , donde x i es la marca de clase supuesta como media y d corresponde
a las desviaciones de cada marca de clase.
Mediana. Mediana=L
( )
a
f
f
n
mediana
−
+
∑ 1
1
2
, donde L 1 : límite real inferior de la clase
mediana. , n: numero de datos , ( )1∑f :suma de todas las frecuencias de las clases
inferiores a la clase mediana.
Moda.: Moda= aL
si
i
∆+∆
∆
+1 , donde los deltas expresan LOS EXCESOS DE
FRECUENCIA DE LA CLASE MODAL SOBRE LAS CLASES CONTIGUAS DE
ESTAS.
Nota: las medidas de dispersión para datos agrupados o intervalares se pueden calcular
con las formulas anteriores considerando como dado la marca de clase.
3. Otros datos relevantes: coeficiente de variación:
X
S
V = , S corresponde a la desviación estándar.
DIAGRAMAS DE CAJA:
Modelo que permite analizar datos visualmente. (Es adecuado para la media como para
la desviación estándar).
Construcciones de clases.
1.- K=1+3.3log N , N: numero de datos medidos.
2.-Unidad de medida: =numero de decimales utilizados. UM
3.- Rango de medida(R):mayor valor medido(MV) –menor valor medido.(mV)
4.-Amplitud de clase(A)=
K
R
5.- Limites de la primera clase: [ ]AUMmVUMmV +−− ........
6: Limites reales: Lim Real inferior=
2
infinfIm UMeriorLimrealeriorrealL −−
:Lim Real Superior=
2
suplimsup UMerioiterealerioLimreal ++