1. Elementos de Estadística – Estadística Analítica
1
PPRROOBBAABBIILLIIDDAADD
1) TEOREMA DE LA SUMA DE PROBABILIDADES
2) PROBABILIDAD CONDICIONAL
3) TEOREMA DEL PRODUCTO DE PROBABILIDADES
4) ESPERANZA MATEMATICA
Sea x una variable aleatoria con función de probabilidad p(x) o f(x):
5) DISTRIBUCION DE PROBABILIDAD
A) DISTRIBUCIONES DISCRETAS:
A.1) DISTRIBUCION DE BERNOULLI
donde: E(X) = p ; V(X) = p(1-p)
A.2) DISTRIBUCION BINOMIAL
donde:
cantidad de casos favorables
P(A)=
cantidad de casos posibles
P(A B)= P(A)+ P(B)- P(A B)
P(A B)
P(A/B)=
P(B)
)P(B/A).P(A=)P(A/B).P(B=B)P(A
.i i
+
-
1)E(X)= p( ) si x es v. a. discretax x
2)E(X)= x.f(x).dx si x es v. a. continua
x 1-x
(1- p para x = 0 y x = 1 ; 0 p 1p )
p(x)=
0 para otros valores de x
x n-xn
(1- p para x = 0,1,...,n ; 0 p 1p )
p(x)= x
0 para otros valores de x
0
r
x n-xn
P(X r)= Bi(r, p,n)= (1- pp )
x
E(X)= np ; V(X)= np(1- p)
2. Elementos de Estadística – Estadística Analítica
2
z
-
F(Z z)= f(Z).dZ
Nota : f(-z)= f(z) (-z)= 1- (z)
A.3) DISTRIBUCION DE POISSON
donde:
La constante es considerada la tasa media de ocurrencia de los sucesos por unidad de
tiempo o espacio.
B) DISTRIBUCIONES CONTINUAS:
B.1) DISTRIBUCION NORMAL
Condiciones:
La función de distribución de probabilidad acumulada se define como:
B.2) DISTRIBUCION NORMAL ESTANDARIZADA
Sea la variable aleatoria:
con función de densidad:
recibe el nombre de Distribución Normal Estandarizada o N(0;1), donde:
E(Z) = 0 ; V(Z) = 1
La función de distribución de probabilidad acumulada está definida por:
x-
.e para x = 0,1,...; > 0
p(x)= x!
0 para otros valores de x
0
r - x
.eP(X r)= Po(r, ,n)=
x!
E(X)= ; V(X)=
2
21
2
2
2
, , - x
x
1
f (x )= e
2
; ;
2
x (- ;+ ) (- ;+ ) > 0
E(X)= ; V(X)=
x
-
F(X)= f(y).dy
2
2
Z
(X - )
Z =
1
f(z)= para - Z +e
2
3. Elementos de Estadística – Estadística Analítica
3
B.3) DISTRIBUCION JI CUADRADO
Sea la variable aleatoria:
2
2
n n
i i
i
i ii
x
V z
con función de densidad:
1
2 2
2
1
para 0
2
2
0 para 0
x
x e x
f x
x
recibe el nombre de función de densidad Ji cuadrado. Donde la letra representa el número
de términos independientes y recibe el nombre de grados de libertad y:
E(V) = ; V(V) = 2
B.4) DISTRIBUCION t DE STUDENT
Sea la variable aleatoria:
Z
t
V
1
2 2
1
2
1
2
t
f t
recibe el nombre de función de densidad t de Student con grados de libertad, donde:
B.5) DISTRIBUCION F DE SNEDECOR
donde
1
2
~U y
2
2
~VSea la variable aleatoria:
recibe el nombre de función de densidad F de Snedecor con 1 y 2 grados de libertad, donde:
;1-t
;1- ;1-
-
E(t)=0 para >1 V(t)= para > 2
- 2
f(t).dt = 1- = F( )= P( )t t t
1
2
U
F =
V
1 2 1 2 1 2
1 22 2
2 2
2 1 22
1 2
para para
2
2
( , );1- ( , ) ( , );1-
0
F( , );1-
2 ( + - 2)
E(F)= > 2 V(F)= > 4
- 2 ( -4)( - 2)
g(F).dF =1- =G( )= P( < )F F F
1
1
1 2
/ 2
/ 2 1
1 2 1
/ 2
1 2 2
1
2
( ) / 2
para
/ 2 / 2
1
+
+ Fg(F)= . . F >0
+ F
4. Elementos de Estadística – Estadística Analítica
4
EESSTTAADDIISSTTIICCAA DDEESSCCRRIIPPTTIIVVAA
1) MEDIDAS DE POSICION
A.- MEDIA ARITMETICA ( x )
* Para n valores observados no agrupados:
* Cuando los n valores están ordenados en una tabla de frecuencias:
B.- MEDIANA (Me)
Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:
Si n es impar: Me es la observación de la posición (n+1)/2 (PosMe)
Si n es par: Me es la media aritmética de las observaciones que correspondan a los 2
valores centrales.
Cuando la variable es cuantitativa continua y los datos están agrupados en una tabla de
frecuencias:
Donde:
Li: Límite inferior del intervalo mediana.
c: Amplitud del intervalo.
F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana.
fi: Frecuencia absoluta del intervalo mediana.
C.- MODO (Md o Mo)
Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia
simple.
Cuando la variable es cuantitativa continua y los datos están agrupados en una tabla de
frecuencias:
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.
2) MEDIDAS DE DISPERSION
A.- VARIANZA (sx
2
)
Para n valores observados no agrupados:
2
2
2 i
ix
( x1 )
s = -x
n-1 n
1
1 2
1
2
Donde:
i
(ant)(Max)
(post)(Max)
Mo= +cL
+
f f
f f
(i-1)
ix
i
PosMe- F
Me = +cL
f
'i i
i i
fx
x= x h
n
ix
x =
n
5. Elementos de Estadística – Estadística Analítica
5
Cuando los n valores están ordenados en una tabla de frecuencias:
B.- DESVIO ESTANDAR (sx)
C.- COEFICIENTE DE VARIACION (C.V.)
2
x xs = s
% x
x
s
C.V. = 100
x
2
2
i2 i
ix i
( f1 )x
s = f -x
n-1 n
6. Elementos de Estadística – Estadística Analítica
6
EESSTTAADDIISSTTIICCOOSS MMAASS EEMMPPLLEEAADDOOSS
A) NORMAL ESTANDAR
1 2 1 2
1 1 2 2
1 2
ˆ ˆ ( )
(0,1)
ˆ ˆ ˆ ˆ(1 ) (1 )
p p p p
Z N
p p p p
n n
B) t DE STUDENT
~
x -
Z = N(0;1)
/ n
ˆ
ˆ ˆ
ˆ
p - p
Z = N (0;1)
p(1- p)/n
p - p
Z = N (0;1)
p(1- p)/n
~1 2 1 2
2 2
1 1 2 2
(x - x )-(μ - μ )
Z = N (0;1)
(σ /n )+(σ /n )
ˆ ˆ
ˆ ˆ
1 2 1 2
1 2
( - )-( - )p p p p
Z = N (0;1)
1 1
p(1- p) +
n n
ˆ ˆ ˆ1 2 1 2
1 2
1 2 1 2
+x x x x
p= ; = ; =p p
+n n n n
~ (n-1)
x
x -
t = t
s
n
1 2
1 2 1 2
2
1 2
~
1 1
n n
a
x x
t t
s
n n
1 2
1 2 2
2 2
x1 x22
a
(n -1) +(n -1)s s
=s
n n
1~d
i 1i 2i n
d
d -
= x - x ; t = td
s
n
2nn
ini
11 2
d i1
dd
1
d = = d -s
nn n-1
;
1 2 1 2
2 2
1 2
1 2
x x
t t
s s
n n
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 21 1
s s
n n
s s
n n
n n
7. Elementos de Estadística – Estadística Analítica
7
C) JI CUADRADO
D) F DE SNEDECOR
E) CORRECCIÓN DE TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS
N = Tamaño de la población ; n0= tamaño de muestra hallado; nf = tamaño de muestra corregido
0
0
1
f
n
n
n
N
F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS
T+
= sumando los rangos correspondientes a las diferencias Positivas:
24
)12)(1(
;
4
)1(
V(T)E(T),NT d nnnnn
N
G) PRUEBA DE MANN WHITNEY
1
; siendo los rangos de una de las muestras
n
i i
i
T r r
1 1 2 1 2 1 21 1
;
2 12
n n n n n n n
E T V T
0;1
T E T
Z N
V T
2
2
1~2 x
n2
(n-1)s
=
; donde y
2k
2 2i i
i i(k-1)
i=1 i
( - )o e
= e = n.p k = N clases
e
; donde y
2f c
ij ij2 2
(f -1)(c-1)
iji=1 j=1
( - )o e
= f = N filas c= N columnas
e
1 2
~
2 2
1 1
(n -1);(n -1)2 2
2 2
/s
F = F
/s
8. Elementos de Estadística – Estadística Analítica
8
ANALISIS DE REGRESION
a) Estimación de la ecuación de la regresión
a.1) Estimación de y
a.2) Estimación de σ2
b) Estimación por intervalo de confianza
b.1) Para
b.2) Para E(Yi)
Dados n pares de valores (xi; yi), se estiman los parámetros del modelo: Yi = + xi + ei
c) Docimasia de hipótesis
Para
d) Coeficiente de determinación (R²)
2 2
2
i i
i i
i i i i i i
2 2
i i ii
i
x y
x y -x - x y - y n. x y -( x )( y )nb= = =
( x n. x -( x) )x - x
x -
n
a= y - bx
2 2
2 2
2 2
2
2 22
2
ˆ
i i2 2
e i i
e e
bb
i i i
i
y x1
= y - - x -s b
n - 2 n n
n.s s
= s = =V
n x - x x
x -
n
2
~ (n-2)
b
b-
t = t
s
2 0
0
2
ˆˆ y
2
(n-2);(1- /2) e 2
i
i
(x - x1 )
a+bx s +t
n ( x )
x -
n
a : Estimador de ( ) b : Estimador de ( )
2
~0
0
(n-2)H
b
b-
=t t
s
2
2 2
i2 2
i22
i2
i 2 i
i
x
-b x
n(x - x )b
= =R
y y y
-y
n
ˆi iy = a+bx ecuación de regresión estimada
9. Elementos de Estadística – Estadística Analítica
9
e) Intervalo de predicción
2
12
1 2; 2
2
1
1ˆ 1 n
n n n
i
i
x x
Y t s
n
x x
f) Análisis de varianza en Regresión Lineal Simple
Fuentes de
Variación
G.L. Suma de Cuadrados Cuadrados
Medios
F
Debida a la
Regresión
1
2
2 2 i
i
x
b x
n
REGSC
GL
;~ REG RES
REG
GL GL
RES
CM
F
CM
Residual n-2
2
i iy a bx RESSC
n
TOTAL n-1
2
2 i
i
y
y
n
2 1
2
e TOTAL REGs SC SC
n
10. Elementos de Estadística – Estadística Analítica
10
AANNAALLIISSIISS DDEE VVAARRIIAANNZZAA –– DDIISSEEÑÑOO CCOOMMPPLLEETTAAMMEENNTTEE AALLEEAATTOORRIIZZAADDOO
Fuentes de
Variación
G.L. Suma de Cuadrados Cuadrados
Medios
F
Modelo o
Tratamiento
k-1
2
..
1
k
i i
i
n y y 1
TRATSC
k TRAT
ERROR
CM
CM
Error n-k
2
1
1 *
k
i i
i
n s 2 ERROR
P
SC
s
n k
TOTAL n-1
2 2
1 12
1
1 * ... 1 *
...
k k
P
k
n s n s
s
n n k
Prueba de Kruskal Wallis
H = .
1
²12
3( 1)
( 1)
I
i
i i
R
N
N N n
Donde:
N es el total de observaciones
Ri. es el rango total de la muestra i
Bajo Ho
2
1IH
11. Elementos de Estadística – Estadística Analítica
11
AANNAALLIISSIISS DDEE CCOORRRREELLAACCIIOONN
a) Estimación del coeficiente de correlación( ):
b) Docimasia de hipótesis
Para 0= :
NOTA: Para los fines prácticos el Coeficiente de Determinación (R2
) se calcula como:
c) Coeficiente de correlación de Spearman
n: número de diferencias
1 2
1 2
1 1 2 2
2 2 2 2
2 21 1 2 2 1 2
1 2
ˆ
i i
i i
i i
i i i i
i i
x x
x x -x - x x - x n= r= =
x - x x - x x x
x - x -
n n
~0 (n-2)H 2
r (n- 2)
=t t
(1- )r
2 2
=R r
2
6
1
( 1) ( 1)
i
S
d
r
n n n