Una estrategia de seguridad en la nube alineada al NIST
Formulario estadisticas
1. Estad¶³stica Descriptiva y Probabilidad
FORMULARIO
Angel Corber¶an
Francisco Montes
Departament d'Estad¶³stica i Investigaci¶o Operativa
Universitat de Valµencia
3. 3
Cap¶³tulo 1
Estad¶³stica Descriptiva
1.1. Clasi¯caci¶on de las variables
variables
8>>>>>>>>>><
>>>>>>>>>>:
cualitativas
8><
>:
ordinales
no ordinales
cuantitativas
8><
>:
discretas
continuas
1.2. Distribuciones de frecuencias
1.2.1. Frecuencias no agrupadas
La frecuencia relativa de la categor¶³a i se obtiene mediante la expresi¶on
fri = ni
n
;
donde ni es la frecuencia absoluta (n¶umero de ocurrencias) de la categor¶³a i y n es el tama~no muestral.
1.2.2. Frecuencias agrupadas
Se agrupan los valores de la variable en clases y se obtiene la distribuci¶on de frecuencias para dichas
clases. Las clases son intervalos y est¶an delimitadas por los l¶³mites de clase, y deben constituir una
partici¶on del conjunto de valores que toma la variable, es decir, las clases no se solapan y no deben
excluir ning¶un valor de la variable, lo que permite clasi¯car a cualquier valor en una y solo una de las
clases establecidas. La distancia entre los l¶³mites de la clase es la amplitud de la clase.
4. 4 Cap¶³tulo 1. Estad¶³stica Descriptiva
1.3. Estad¶³sticos descriptivos
estad¶³sticos descriptivos
8>>>>>>>>>>>>>><
>>>>>>>>>>>>>>:
de posici¶on
8>>><
>>>:
media
mediana
moda
percentiles
de dispersi¶on
8>>><
>>>:
rango
varianza
desviaci¶on t¶³pica
intervalo intercuart¶³lico
1.3.1. Medidas de Posici¶on
Media.-
x =
suma de las x's
n
=
Pn i=1 xi
n
:
Mediana.- Es aquel valor que, al ordenar las observaciones de menor a mayor, ocupa el lugar central,
dividiendo el conjunto de observaciones en partes iguales.
tama~no muestral n la mediana est¶a en la posici¶on
impar (n + 1)=2
par punto medio de n=2 y (n=2) + 1
Moda.- Es aquel valor de la variable que tiene mayor frecuencia. En el caso de frecuencias agrupadas
se toma la clase m¶as frecuente como moda.
Percentiles.- El percentil p-¶esimo es aquel valor que veri¯ca la condici¶on de que un p% de las
observaciones son menores o iguales que ¶el.
1.3.2. Medidas de Dispersi¶on
Rango.- Es la diferencia entre el m¶aximo y el m¶³nimo de las observaciones.
Varianza.-
s2 =
suma del cuadrado de las desviaciones
n ¡ 1
=
Pn i=1(xi ¡ x)2
n ¡ 1 :
Una expresi¶on alternativa que facilita su c¶alculo es
s2 =
Pn i=1 x2i
n ¡ 1
¡
Pni
=1 xi)2
n(n ¡ 1) :
(
5. 1.3 Estad¶³sticos descriptivos 5
Desviaci¶on t¶³pica.- Es la ra¶³z cuadrada de la varianza y la designamos por s.
Intervalo intercuart¶³lico.- Es el intervalo de¯nido por los cuartiles primero y tercero, [Q1;Q3], cuya
longitud se denomina rango intercuart¶³lico, IQR.
1.3.3. El coe¯ciente de variaci¶on
CV = s
x
£ 100
7. 7
Cap¶³tulo 2
Descripci¶on de la relaci¶on entre dos
variables num¶ericas
2.1. Covarianza y coe¯ciente de correlaci¶on
Covarianza.-
sxy =
Xn
i=1
(xi ¡ x)(yi ¡ y)
n ¡ 1 : (2.1)
Como ya suced¶³a con la varianza, existe una versi¶on alternativa de (2.1) que facilita el c¶alculo,
sxy =
Pn i=1 xiyi
n ¡ 1
¡
Pn i=1 xi) (
(
Pni
=1 yi)
n(n ¡ 1) : (2.2)
Propiedad de la covarianza: Si se lleva a cabo una transformaci¶on lineal de las variables X
e Y ,
U = aX + b; V = cY + d;
la covarianza de las nuevas variables sufre la siguiente transformaci¶on,
suv = acsxy:
Coe¯ciente de correlaci¶on.-
rxy = qsxy
s2
xs2y
= sxy
sxsy
Propiedades del coe¯ciente de correlaci¶on:
P1) Si U = aX + b y V = cY + d, entonces
ruv =
(
rxy; si ac > 0;
¡rxy; si ac < 0:
8. 8 Cap¶³tulo 2. Descripci¶on de la relaci¶on entre dos variables num¶ericas
P2) ¡1 · rxy · 1
P3) Si,
- rxy = 1, entre X e Y existe dependencia lineal creciente, Y = aX + b, con a > 0,
- rxy = ¡1, entre X e Y existe dependencia lineal decreciente, Y = aX + b, con a < 0.
2.2. Recta de regresi¶on de Y sobre X
Si expresamos la recta de la forma m¶as sencilla
Y = aX + b
Valores para a y b.-
a = sxy
s2
x
=
cov(x; y)
var(x)
b = y ¡ ax
Varianza de los errores.-
s2e
=
Pni
=1(ei ¡ e)2
n ¡ 1
Reducci¶on de la varianza.- Se obtiene mediante el llamado coe¯ciente de determinaci¶on y se
suele expresar en porcentaje
r2
xy = 100 £
Ã
1 ¡
s2e
s2y
!
:
9. 9
Cap¶³tulo 3
Probabilidad
3.1. Reglas de la probabilidad
Acotaci¶on.-
0 · P(A) · 1:
Suma.- Si A y B son sucesos incompatibles o mutuamente excluyentes, es decir, A B = ;, entonces
P(A o B) = P(A [ B) = P(A) + P(B):
La regla de la suma puede extenderse de manera obvia a aquellas situaciones en las que inter-
vienen m¶as de dos sucesos. En efecto,
P(A o B o C) = P(A [ [C) = P(A) + P(B) + P(C);
y as¶³ sucesivamente.
Complementaci¶on.- Si los sucesos son complementarios, es decir A [ Ac = S, entonces
P(A) + P(Ac) = 1 que implica P(A) = 1 ¡ P(Ac):
Monoton¶³a.- Si 'A est¶a incluido en B',
A ½ B; implica P(A) · P(B):
Sucesos compatibles.- Para sucesos A y B cualesquiera
P(A [ B) = P(A) + P(B) ¡ P(A B):
3.2. La f¶ormula de Laplace
Si el espacio muestral es ¯nito y equiprobable,
P(A) = m
n
=
casos favorables
casos posibles :
10. 10 Cap¶³tulo 3. Probabilidad
3.3. Probabilidad condicional e independencia
La probabilidad de A condicionada a B se obtiene mediante la f¶ormula
P(AjB) = P(A B)
P(B) ;
donde P(B) > 0.
Los sucesos A y B son independientes si
P(A B) = P(A)P(B) que implica P(BjA) = P(B) y P(AjB) = A:
Para m¶as de 2 sucesos,
P(A1 A2 ¢ ¢ ¢ An) =
Yn
i=1
P(Ai): (3.1)
3.4. Teorema de la probabilidad total
Si los sucesos Ai; i = 1; : : : ; n, constituyen una partici¶on del espacio muestral S, es decir S =
[ni
=1Ai y son todos ellos incompatibles entre s¶³, y B es cualquier suceso
P(B) =
Xn
i=1
P(BjAi)P(Ai):
3.5. Teorema de Bayes
Si los sucesos Ai; i = 1; : : : ; n, constituyen una partici¶on del espacio muestral S y B es un suceso
cualquiera,
P(AijB) = P(BjAi)P(Ai)
Pn i=1 P(BjAi)P(Ai) :
11. 11
Cap¶³tulo 4
Encuestas y proporciones
4.1. El modelo binomial
Si X una variable aleatoria que describe el n¶umero de ¶exitos en un modelo binomial, X » B(n; p),
P(X = k) =
Ã
n
k
!
pk(1 ¡ p)n¡k; k = 0; 1; : : : ; n:
Media de una B(n,p).- Si X » B(n; p) su media vale
¹ = E(X) = np:
Varianza de una B(n,p).- Si X » B(n; p) su varianza vale,
¾2 = np(1 ¡ p):
Funci¶on de probabilidad del modelo binomial
Si X » B(n; p) la funci¶on que nos proporciona las probabilidades P(X = x) para cualquier valor
de x se denomina funci¶on de probabilidad de X y est¶a de¯nida de la siguiente forma,
fX(x) =
8><
>:
¡n
x
¢
px(1 ¡ p)n¡x; si x = 0; 1; : : : ; n
0; en el resto:
4.2. Estimaci¶on de una proporci¶on
El verdadero valor de proporci¶on p, desconocida, de los elementos de una poblaci¶on que poseen
cierta propiedad com¶un, se estima a partir de una muestra de tama~no n, mediante la proporci¶on
de elementos de la muestra que poseen dicha propiedad. Si m de sus elementos poseen la propiedad
tendremos
^p = m
n
:
12. 12 Cap¶³tulo 4. Encuestas y proporciones
4.2.1. Intervalo de con¯anza para p
De¯nici¶on 1 Un Intervalo de Con¯anza al q%, 0 · q · 1, es un intervalo aleatorio de la forma
ICq =
2
4^p ¡ tn¡1;q
s
^p(1 ¡ ^p)
n
; ^p ¡ tn¡1;q
s
^p(1 ¡ ^p)
n
3
5 ;
que veri¯ca,
P(p 2 ICq) = q
100: (4.1)
4.3. Error y tama~no de la muestra en una encuesta
4.3.1. Error de la muestra para un nivel de con¯anza del q%
± = tn¡1;q
s
^p(1 ¡ ^p)
n
:
4.3.2. Tama~no de la muestra para un nivel de con¯anza del q%
n =
t2
n¡1;q
±2 ^p(1 ¡ ^p):
Como a priori se desconoce ^p, es costumbre suponer la situaci¶on m¶as desfavorable haciendo ^p = 1=2,
con lo que la expresi¶on anterior toma la forma
n =
t2
n¡1;q
4±2 : (4.2)
13. 13
Ap¶endice A
Tablas de probabilidad de la
distribuci¶on Binomial