Clase1. Naturaleza del análisis econométrico y preliminares estadísticos

1
Clase 1. Naturaleza del análisis econométrico y
preliminares estad´ısticos
Nerys Ram´ırez Mordán
Pontificia Universidad Católica Madre y Maestra
Econometr´ıa I (EC-411-T)
5 de mayo de 2018

2
Contenido
1 Naturaleza de la econometr´ıa
2 Proceso de investigación
3 Estad´ıstica descriptiva
El histograma
Medidas de posición central
Operador de sumatoria
Medidas de dispersión
Medidas de forma
Medidas de asociación
Otras medidas de posición
4 Valores at´ıpicos
5 Teor´ıa de probabilidad
Álgebra de suceso
Axiomas de probabilidad
Probabilidad condicional e
independencia
6 Variables aleatorias
Función de distribución
Variables continuas y discreta
Función de densidad
7 Momentos de una distribución
8 Vectores aleatorios
Distribución conjunta
Distribuciones condicionadas
Matriz varianza covarianza
9 Notas adicionales de inferencia
10 Referencias

3
Naturaleza de la econometr´ıa

4
Naturaleza de la econometr´ıa
En términos literales, econometr´ıa significa “medición
económica” (Gujarati y Porter, 2009, p.1), esta parte del análisis
de eventos económicos a partir de métodos estad´ısticos para
probar relaciones económicas y evaluar e implementar pol´ıticas
públicas y de negocios (Wooldridge, 2009, p.1).
La econometr´ıa busca una conjunción entre la teor´ıa económica
−que no proporciona magnitudes− y la medición real de la
econom´ıa, conectando lo aprendido en los cursos de
econom´ıa con la práctica.
Ejemplo
La teor´ıa microeconómica de la demanda establece una relación
inversa entre precios y cantidad demandada, sin embargo, no
proporciona medida numérica de la relación.

5
Ejemplos
Los propósitos de la econometr´ıa suelen ser fundamentalmente dos: (1)
medir impacto y (2) realizar pronósticos, por ejemplo:
Efecto en las ventas del gasto en publicidad.
Efecto que tiene el gasto público en las escuelas sobre el
desempeño de los estudiantes.
El efecto de la escolaridad sobre el salario.
Determinar el gasto promedio esperado dado un nivel de ingresos.
Pronóstico del nivel de demanda de una empresa o del crecimiento
de la econom´ıa.

6
Regresión, correlación y causalidad
Los datos provienen de dos fuentes: experimentales y no
experimentales u observacionales —Que no son obtenidos por
medio de experimentos controlados (Wooldridge, 2009, p.1)—.
El análisis de regresión resulta fundamental para la econometr´ıa,
los métodos de regresión estudian relación entre variables
—reflejada en su distribución condicional (Lobato, 2016)— sin que
esta necesariamente implique causalidad, dado que los datos
observados son generalmente no experimentales.

7
Tipos datos
Los economistas suelen representar sus datos en bases planas
(tablas) o relacionales (ej. bases de hogares), en forma de
matrices, donde las columnas representan variables (cuantitativas
o cualitativas) y las filas representan observaciones en el mismo
(corte transversales) o en diversos puntos temporales (series de
tiempo), o ambas (datos panel), según el tipo de datos.
i Y X K
1 y1 x1 k1
2 y2 x2 k2
... ... ... ...
n yn xn kn
Los datos pueden asumir diversas caracter´ısticas según nivel de
agregación (macro o micro-datos) o naturaleza (cuantitativas o
cualitativas).

8
Análisis econométrico
El proceso de análisis econométrico parte de una especificación
teórica (que propone sentido pero no cuantifica magnitudes), pero
no podemos exagerar el papel de la teor´ıa, dado que el economista
es solamente observador pasivo de datos no experimentales
pasados (Greene, 2006, p.2), lo anterior puede dificultar la
estimación de un efecto causal.
Ejemplo
Por ejemplo: suponga desea estimar como un programa de
capacitación a personas (grupo tratamiento, d = 1), incide sobre
su salario (y), respecto al grupo de personas comparables
(equivalencia inicial y durante) que no participa en dicha
capacitación (grupo control, d = 0):
γ = E[y|d = 1] − E[y|d = 0] (1)

9
El modelo matemático vs. Modelo econométrico
El modelo matemático postula una relación determinista entre
variables que suelen llamarse dependiente (endógena) e
independientes (exógena), cuya elección viene determinada por la
teor´ıa económica y los datos.
E[Y |Xi] = f(Xi) (2)
No obstante, dada la inexactitud entre las variables económicas, la
econometr´ıa incluye un término de perturbación o de error
(u), donde se incluyen factores no precisados en el modelo.
E[Y |Xi] = f(Xi) + u (3)

10
La interpretación de un modelo media condicional
En el modelo econométrico f(Xi) denota una función de esperanza
condicional de la variable explicativa, cuya forma funcional resulta
una pregunta emp´ırica, pero aqu´ı, como primera hipótesis se
asume lineal:
E[Y |Xi] = β0 + β1Xi (4)
Las constantes βi son los parámetros desconocidos, conocidos
como coeficientes de regresión, intersección (β0) y pendiente
(β1); Y es nuestra variable dependiente; y X es nuestra variable (o
conjunto de variables) independiente (s).
Ejemplo
Efecto de la educación en el salario.

11
El análisis econométrico intenta pronosticar el valor medio de una
variable independiente en base a valores fijos de las variables
explicativas (E[Y |X]). La unión de medias condicionales arroja la
l´ınea de regresión.
Fuente: tomado de Gujarati y Porter (2009).

12
Los parámetros (β) son desconocidos y se estiman utilizando datos
económicos y una técnica econométrica.
A partir de estas estimaciones se establecen hipótesis sobre el
parámetro poblacional, por ejemplo de que β1 = 0 en el caso de
independencia entre variables o significancia estad´ıstica.
La relación entre variables se deriva de la forma funcional, cuya
validez se verifica a partir de la teor´ıa y los datos.

13
Análisis econométrico
El modelo econométrico es un modelo media condicional
(E(y|x) = β0 + β1x1) que reconoce tres condiciones básicas:
1 La naturaleza estocástica en la relación entre variables
(existen una relación no exacta (u), por tanto, debe considerarse
como tratar otros factores).
2 Establecer la relación funcional entre variables ( y = β x si
u = 0).
3 Estar seguro de una relación ceteris paribus (E[u|x] = E[u]).
El concepto ceteris paribus tiene un papel importante en el análisis
causal, que resulta en el objetivo de los economistas.
Ejemplo
Efecto de un fertilizante en el rendimiento de un cultivo.

15
Proceso de investigación
Según Greene (2003), el estudio econométrico comienza con un
conjunto de proposiciones sobre algún aspecto de la econom´ıa.
La teor´ıa especifica un conjunto de relaciones deterministas y
precisas entre las variables.
La investigación emp´ırica proporciona estimaciones de parámetros
desconocidos en el modelo: como elasticidades o análisis de
impacto, lo que permite a los modelos ser utilizados para análisis
de pol´ıticas y pronósticos.

16
Proceso de investigación
“En un análisis emp´ırico se utilizan datos para probar teor´ıas o
estimar relaciones”, este parte de una pregunta concreta y
alcanzable.
1 Formulación concisa del problema (preguntas de interés)
2 Revisión de la literatura
3 Modelo económico
4 Modelo econométrico
5 Descripción de los datos
6 Procedimientos de estimación e inferencia
7 Resultados emp´ıricos y conclusiones
8 Posibles extensiones y limitaciones del estudio
9 Referencias

18
El histograma
La interpretación probabil´ıstica derivada del histograma es
bastante útil para seguir el objetivo de inferencia estad´ıstica, dado
que el área del rectángulo es proporcional a la proporción de datos
que caen dentro del dicho intervalo, esta se puede interpretar como
probabilidades.
No obstante, es preciso disponer de información precisa para
resumir la información contenida en la muestra. En el caso
univariado es común precisar medidas de posición, dispersión y
forma.

19
La media aritmética y operador de sumatoria
La media es la medida de posición central más utiliza, resulta de
dividir la suma de los valores de una variable entre el número total
de observaciones.
µx =
1
N
N
i=1
xi (5)
Note que 1
N es en realidad solo aplicable en caso de media
xponderadas, ya que esto es una medida de probabilidad asociada
a cada uno de los valores de las variables.
1
N x1 + 1
N x2 + ... + 1
N xN

20
Operador de sumatoria
La Σ se utiliza para representar sumatoria, operador sumamente
usado en econometr´ıa.
n
i=1 xi = x1 + x2 + ... + xn
Algunas de sus propiedades son:
n
i=1 k = nk donde k es una constante.
n
i=1 kxi = k
n
i=1 xi
n
i=1 (a + bxi) = na + b
n
i=1 xi
n
i=1 xi = n¯x
n
i=1 (xi − ¯x) =
n
i=1 xi −
n
i=1 ¯x =
n
i=1 xi − n¯x = n¯x − n¯x = 0
n
i=1 (xi − ¯x) (yi − ¯y) =
n
i=1 (xi − ¯x)yi

21
La varianza
Dado que dos series pueden tener igual media, pero desviaciones
respecto a la misma totalmente distinta, es común utilizar la
varianza como una medida de la esperanza al cuadrado de las
desviaciones de las variables de las series respecto a la media de
posición central.
σ2
x =
1
N − 1
N
i=1
xi − ¯X
2
(6)
No obstante, como la varianza se expresa como el cuadrado de la
medida original, los economistas suele usar la desviación estándar
para obtener una medida de desviación en la misma escala.
σx = σ2
x =
1
N − 1
N
i=1
xi − ¯X
2
(7)

22
La asimetr´ıa
La asimetr´ıa es una medida que permite estudiar, sin necesidad de
utilizar gráficos, el grado de simetr´ıa entre los lados de una
distribución respecto a su posición central.
El coeficiente tradicional de asimetr´ıa se entiende como el tercer
momento de una distribución y asume el valor de cero en
distribuciones simétricas.
a =
1
N
N
i=1 xi − ¯X
3
ni
1
N
N
i=1 xi − ¯X
2
ni
3
2
(8)

23
La curtosis
La curtosis (o apuntamiento) es una medida de forma que mide la
cantidad de masa que agrupa una distribuci´on alrededor del centro
o en la cola de la misma.
Como la curtosis de una normal es 3, por lo general suele
especiﬁcarse el exceso de curtosis como cuanto se aleja esta de tres:
k =
1
N
N
i=1 xi − ¯X
4
ni
1
N
N
i=1 xi − ¯X
2
ni
2 − 3 (9)

24
Covarianza
Hasta ahora hemos estado interesados en medidas de resumen
sobre una sola variable, sin embargo, generalmente interesa el caso
de más de una variable y la relación que pudiese existir entre ellas,
en tales casos obtenemos la covarianza, cuya representación
muestral es:
σyx =
1
N
N
i=1
xi − ¯X yi − ¯Y (10)

25
Coeficiente de correlación
La covarianza solo nos permite establecer la relación de la
asociación, en tal sentido, es más común representar esta
asociación lineal por medio del coeficiente de correlación.
Con el fin de mantener una medida de asociación que no depende
de la escala, se usa el coeficiente de correlación de Pearson, que va
de -1 a 1.
ρyx =
σyx
σyσx
(11)

26
Los percentiles
Los percentiles de una variable aleatoria indican, una vez
ordenados los datos de mayor a menor, el valor de la variable por
debajo del cual se encuentra un porcentaje (p %) dado de
observaciones.
Bajo tales circunstancia podemos utilizar alguna de la siguiente
medida:
px =
n + 1
100
(x) (12)

28
Series normalizadas
En muchos casos necesitamos normalizar nuestras variables x, en
una nueva variable aleatoria z ∼ N(0, 1) para normalizar o
identificar valores at´ıpicos a partir de la posición de nuestra
observación en términos relativo al número de desviaciones que se
aleja desde la media.
zi =
xi − µx
σx
(13)

29
Valores at´ıpicos
En el caso de la varianza y los valores at´ıpicos, presentaremos
especial atención, pues, pueden disfrazar los resultados de los
análisis (Walpole, 2009).
No confundir valores at´ıpicos con datos influyentes.
Ante la presencia de valores at´ıpicos es común utilizar medidas
robustas, como:
1 Mediana
2 Media recortada
3 Desviación media absoluta
4 Rango intercuart´ılico (iqr)

31
Fenómenos y experimentos aleatorios
Existen dos tipos de fenómenos:
1 Determinista: previo al experimento conocemos el resultado final.
Por tanto, pueden predecirse con certeza.
2 Aleatorio: existen varias situaciones posibles con cierta
incertidumbre asociada.
La teor´ıa de probabilidad estudia los experimentos −o
fenómenos− aleatorios.
1 Lanzar una moneda al aire Ω = {C, +}
2 Invertir en opciones de compra Ω = {ganar, perder}

32
Teor´ıa de probabilidad
En un experimento aleatorio:
1 Conocemos de antemano todos los resultados posibles (espacio
muestral Ω).
2 No es posible conocer el resultado antes de realizar el experimento.
3 La teor´ıa de probabilidad permite cuantiﬁcar la incertidumbre
asociada a cada evento.
A cada subconjunto de Ω (A ⊆ Ω) (usualmente denotado por letra
min´uscula) se les llama suceso aleatorio. Este puede ser
elemental o compuesto.
Ω es el suceso seguro y φ el suceso imposible.

33
Teor´ıa de probabilidad
Un experimento aleatorio tiene resultados inciertos, pese a que
conocemos de antemano los posibles resultados. Sobre estos
fen´omenos versa la teor´ıa de probabilidad (Garc´ıa-Donato, 2013).
Suponga realiza el experimento aleatorio de lanzar un dado al aire:
espacio muestral: Ω = {1, 2, 3, 4, 5, 6} (suceso seguro)
ω4 = {4} es un suceso elemental.
ω7 = {7} es un suceso imposible.
ωpar = {2, 4, 6} es un suceso compuesto.
ωc
par = {1, 3, 5} es el complemento de ωpar.
ωi y ωj son equiprobables si tienen igual probabilidad.
ωpar y ω1 son mutuamente excluyentes.

34
Álgebra de suceso
A los suceso aleatorio se les aplican las operaciones de conjunto:
1 Unión ∪. La unión de sucesos A ∪ B que ocurre si solo si, al menos
uno de los dos sucesos ocurre (se lee como suma de A y B; A o B; A
unido a B.).
2 Inclusión ⊂. Si a la ocurrencia de un suceso A = {6} siempre esta
unida un suceso B = {2, 4, 6}, diremos que A ⊆ B . Dos sucesos
aleatorios son iguales si A ⊆ B y B ⊆ A.
3 Intersección ∩. Producto de sucesos. Es el suceso que ocurre, solo
si ocurre tanto A como B.
4 Diferencia AB, si ocurre A pero no ocurre el evento B. Si
A = {2, 4, 6} y A = {6}, entonces AB={2, 4}.

35
Probabilidad
Def.: clásica de Laplace. La probabilidad de cualquier suceso
A, que se suele escribir como Pr(A), es el cociente entre el total
de casos favorables/casos posible (que sucede con Ω infinito?).
Def.: frecuentista o emp´ırica. Se define como el l´ımite de
frecuencias relativa del suceso (no precisa cuanta pruebas se deben
realizar, o como trabajar con sucesos que solo se repiten una vez).
Def.: Axiomática.

36
Axiomas
Dado un espacio muestral (Ω), se entiende por probabilidad a
una funci´on del conjunto de σ con dominio en σ y rango [0,1], que
satisface las siguientes condiciones:
Axioma 1: p(A) ≥ 0 ∀A ∈ σ
Axioma 2: p(Ω) = 1
Axioma 3 (teorema de adici´on): p(∪Ai) = ΣP(Ai), cuando Ai es
una secuencia de eventos mutuamente excluyentes
(Ai ∩ Aj = φ ∀i = j).

37
Espacio de probabilidad
Espacio muestral discreto ﬁnito o numerable Ω = {a1, ..., an, ...}.
Espacio muestral continuo Inﬁnito no numerable.

38
Espacio de probabilidad
Si [Ω, σ] es un espacio medible y P una medida de probabilidad
sobre σ (σ-álgebra) P : σ → [0, 1], a la terna [Ω, σ, P] se le llama
espacio de probabilidad.
Cuando una función de probabilidad cumple los axiomas de
Kolmogorov, se conoce como una función de probabilidad,
entonces para cualquier par de sucesos A y B:
Pr(φ) = 0
Pr(A) ≤ 1
Pr(Ac
) = 1 − Pr(A)
Si A ⊂ B, entonces, Pr(A) ≤ Pr(B)
Pr(B ∩ Ac
) = Pr(B) − Pr(A ∩ B)
Pr(A ∪ B) = Pr(A) + Pr(B) − Pr(A ∩ B)

39
Probabilidad condicional
Si A y B son subconjuntos de un espacio muestral, {A, B} ⊂ Ω y
Pr(B) ≥ 0, decimos la probabilidad de A condicionada al suceso
B, supone asignar nuevas probabilidades al suceso A.
Según el teorema de caracterización:
Pr(A|B) =
Pr(A ∩ B)
Pr(B)
(14)
Aqu´ı, el espacio muestral original es Ω, en tanto el espacio modificado
es Ω ∩ B.
Ejemplo tirada de un dado
Si A={1, 2, 3, 4} y B={3, 5, 6}.
P(A) = 4
6; P(B) = 3
6; P(A ∩ B) = 1
6; P(A|B) = 6
18; P(B|A) = 6
24

40
Independencia
Adicionalmente, A y B son sucesos independientes cuando la
información sobre la ocurrencia de uno, no modifica la
probabilidad de que ocurra el otro (Pr(A|B) = Pr(A)).
Pr(A ∩ B) = Pr(A)Pr(B) (15)
Si A y B son independiente, Ac y Bc también lo son.

41
Probabilidad condicional e independencia
Ejemplo tomado de Hill; Griﬃnths and Lim (2011, p.24)
y/x 1 2 3 4 f(y)
0 0 0.1 0.2 0.3 0.6
1 0.1 0.1 0.1 0.1 0.4
f(x) 0.1 0.2 0.3 0.4
Esperanza condicional E[Y |X = x0].
Probabilidades condicionales Pr(Y = y1|X = x0).
f (x = 2|y = 1) = P(X=2,Y =1)
P(Y =1) = 0,1
0,4 = 0,25
Independencia (f(x|y) = fX(x), debe cumplirse para cada par x e
y de valores posibles de la variable aleatoria). Como la condicional
P(X = 1, Y = 1) = 0,1 es distinta al producto de las marginales
P(X = 1)P(Y = 1) = 0,1 ∗ 0,4 = 0,04, concluimos no hay
independencia.

42
Independencia
El concepto de independencia visto (f(x|y) = fX(x)) es el
concepto más fuerte de independencia; en la práctica se suele
asumir:
1 Independencia en media (E(y|x) = E(y)).
2 Ausencia de autocorrelación cov(y, x) = 0. Es el concepto más débil
al considerar solo relaciones lineales.

44
Variables aleatorias
En econometr´ıa se estudian relaciones entre variables aleatorias
(v.a.), una función que asigna un número real y probabilidad a los
sub-conjuntos (elementos individuales (ω ∈ Ω)) de un conjunto
dado de un espacio muestral (Ω), caracterizada por:
1 Su dominio (valores que pueden tomar).
2 Su función de probabilidad (continua o discreta).
Es decir, que dado un experimento aleatorio, a cada suceso del
espacio de probabilidad (Ω, p) le asignamos un valor numérico,
obtenemos una variable que hereda de Ω la probabilidad p, le
llamamos variable aleatoria.

45
Variables aleatorias
En el siguiente ejemplo, se muestra una variable aleatoria que
tomas valores al contabilizar el número de caras que resultan del
experimento de lanzar una moneda dos veces al aire.
Fuente: Soto (2011). Notas Econométricas. Universidad de Chile.
La distribución de una v.a. viene determinada por sus valores
posibles y la probabilidad de ocurrencia asociada a estos.

46
Sea X una variable aleatoria definida en (Ω, σ, p), la función en el
rango [0,1], definida por:
F(xi) = Px((−´ınf, xi]) = Pr(X ≤ xi) xi ∈ X (16)
Se conoce como Función de distribución de X, y cumple las
siguientes propiedades:
F(.) es no decreciente.
Limxi→−∞F(X) = 0 Limxi→+∞F(X) = 1
F(.) es continua por la derecha.

47
[Ejercicio 1.1.] Tomado de Donato, 2013. Universidad de Valencia, M´aster en
Banca y Finanzas Cuantitativas (QF). Dada una variable aleatoria X, con rango
[0,20] y F(x):
FX (x) =



0 si x ≤ 0
x/20 si 0 ≤ x ≤ 20
1 si x > 20
1 Dibuje F(x) y argumente si esta es continua o discreta.
2 Calcula Pr(X < 10) y Pr(X > 5).

48
Tipos de variables
Dependiendo de la forma asumida por F(x), existen dos tipos de
variables aleatorias: continuas y discretas.
1 Un espacio muestral discreto es aquel formado por un número
infinito contable de puntos muestrales.
2 Mientras que el espacio continuo esta formado por un conjunto
infinito no numerable.
3 Existen además variables aleatorias mixtas.

49
Función de densidad
F(x) acumula probabilidades, pero es útil una función que asigne
probabilidades directamente. Esta función se obtiene a partir de la
derivada (siempre que exista) de la función de distribución y se
conoce como función de densidad.
Según Wackirly et al. (2008), la función de densidad de una
variable aleatoria es un modelo teórico para la distribución de
frecuencia (histograma) de una población.
f(x) =
dF(.)
dy
= F (y) (17)
Cuyas propiedades son:
1 f(x) ≥ 0 ∀y ∈ [−∞, +∞]
2
∞
−∞
f(y)dy = 1

50
Calculo de probabilidades
Ambas funciones (distribuci´on y densidad) de una variable
aleatoria, permiten calcular probabilidades.
P(a < Y ≤ b) = F(Y ≤ b)−F(Y ≤ a) = F(b)−F(a) =
b
a
f(y)dy (18)

51
[Ejercicio 1.2.] Tomado de Donato, 2013. Universidad de Valencia, QF. Una
variable aleatoria X, tiene rango [0,20] y F(x):
FX (x) =



0 si x ≤ 0
x/20 si 0 ≤ x ≤ 20
1 si x > 20
1 Obtenga la función de densidad.
2 Utilizando la función de densidad calcule Pr(X < 10) y Pr(X > 5).
3 Compare las probabilidades obtenidas con la función de densidad y con la de
distribución.

52
[Ejercicio 1.3.*] Wackerly, et al. (2010). Dada f(y) = cy2
, 0 ≤ y ≤ 2 y f(y) = 0 en
el resto de los caso.
1 Encuentre el valor de c, para el cual f(y) es una funci´on de densidad. [R.
c = 3/8]
2 Calcule Pr(y < 1,5) y Pr(y > 1).

53
Momentos de una distribuci´on

54
Esperanza matem´atica
Los momentos se utilizan para describir la distribuci´on de una
variable aleatoria (X), dependiendo del tipo de variable:
Caso discreto:
E(X) = ΣXxiPr(X) (19)
Caso continuo:
E(X) =
+∞
−∞
xf(x)dx (20)

55
Propiedades de la esperanza
E[c] = c
E(c) = +∞
−∞ cf(x)dx = c +∞
−∞ f(x)dx = c · 1
aX + b = aE[X] + b
E (aX + b) = +∞
−∞ aXf(x)dx + +∞
−∞ bf(x)dx
E (aX + b) = a +∞
−∞ Xf(x)dx + b +∞
−∞ f(x)dx
E (aX + b) = aE[X] + b

56
Varianza de una variable aleatoria
La varianza de una variable aleatoria es: E[(X − E[X])2]
Caso discreto:
V (X) = ΣX[x − E(X)]2
Pr(X) (21)
Caso continuo, aunque en ocasiones ayuda V (X) = E(X2) − E(X)2:
V (X) =
+∞
−∞
[x − E(X)]2
f(x)dx (22)

57
Propiedades de la varianza
var(k) = 0
var(axi + b) = a2var(xi)
Dado un par de variables independientes
var(y + x) = var(y) + var(x)
Dado un par de variables correlacionadas
var(y + x) = var(y) + var(x) + 2cov(x, y)

58
Momentos de una variable aleatoria discreta
[Ejercicio 1.4.] Tomado de Wackerly, et al. (2010) (ejercicio 3.12). Sea
X una variable aleatoria que asume los valores xi = {1, 2, 3, 4}, con
funci´on de probabilidad Pr(x) = {0.4, 0.3, 0.2, 0.1}, encuentre:
1 E(X)
2 E(1/X)
3 E(X2)
4 E(X2 − 1)
5 V (X), considere (V (X) = E(X2) − E(X)2)

59
Momentos de una variable aleatoria continua
[Ejercicio 1.5] Sea X una variable aleatoria con funci´on de densidad
f(x) = 1
20 con rango 0 ≤ x ≤ 20.
1 Calcule la E[X] R=10.
2 Calcule la V [X].

60
Esperanza condicional y esperanzas iteradas
La esperanza condicional E[X|Y = y] es una variable aleatoria,
porque es funci´on de x, que expresa la esperanza de una variable
condicionada a que otra variable asuma un valor determinado.
Anteriormente, vimos que si dos variables son independientes
E[X|Y = y] = E[Y ].
La ley de esperanzas iteradas es una propiedad interesante de
las esperanzas condicionales que indica que el promedio de
esperanzas condicionales es igual a la esperanza incondicional de
una variable.
E[E[Y |X]] = E[Y ] (23)

61
Esperanza condicional y esperanzas iteradas
[Ejercicio 1.6.] Datos tomado de Hill, C; Griﬃnths, W and Lim, G.
(2011, p.23). Utilice la siguiente tabla para calcular E[Y ], E[Y |Y = 3]
y demostrar que E[E[X|Y ]] = E[Y ].
y/x 1 2 3 4 f(y)
0 0 0.1 0.2 0.3 0.6
1 0.1 0.1 0.1 0.1 0.4
f(x) 0.1 0.2 0.3 0.4
E[Y ] = 0 ∗ 0,6 + 1 ∗ 0,4 =0.4
E[Y |x = 3] = 0 ∗ (0,2/0,3) + 1 ∗ (0,1/0,3) =0.333
E[X|x]= E[Y |x = 1] ∗ pr(x = 1) + E[Y |x = 2] ∗ pr(x =
2) + E[Y |x = 3] ∗ pr(x = 3) + E[Y |x = 4] ∗ pr(x = 4) =
(1*(0.1/0.1))*0.1 + (1*(0.1/0.2))*0.2 +
(1*(0.1/0.3))*0.3+(1*(0.1/0.4))*0.4 = 0.1 + 0.1 + 0.1 + 0.1 = 0.4

63
Vectores aleatorios
Dado un espacio muestral (Ω), diremos que X=(X1, X2, ..., Xk) es
un vector aleatorio de dimensión k, si cada uno de sus
componentes (X1, X2, ..., Xk) es una variable aleatoria.
La distribución de probabilidad que describe el comportamiento
simultáneo de todas las variables que componen el vector aleatorio,
se llama función de probabilidad conjunta (Casco, 2009).
F(x, ..., y) = Prob(X < x, ..., Y < y) (24)

64
Distribución conjunta
En el caso bidimensional, de una función de probabilidad conjunta
con variables aleatorias discretas:
Σ
x
Σ
y
P(X = x, Y = y) = 1 (25)
En el caso bidimensional, de una función de probabilidad conjunta
con variables aleatorias continuas:
x y
fY,X(x, y)dydx = 1 (26)

65
Marginales
La distribución marginal intenta responder a la pregunta de si
conocida la función de densidad conjunta de dos o más variables
aleatorias, podemos conocer la distribución individual de cada una
de las variables que la componen.
Sean X e Y, dos variables aleatorias con función de probabilidad
conjunta f(x, y), sus marginales vienen definidas a partir de las
siguientes ecuaciones:
En el caso discreto:
P(X) = Σ
todo y
P(x, y) y P(Y ) = Σ
todo x
P(x, y) (27)
En el caso continuo:
f(x) =
Ry
f(x, y)dy y f(y) =
Rx
f(x, y)dx (28)

66
Distribución conjunta y marginales (discretas)
Ejemplo tomado de Hill, C; Griffinths, W and Lim, G. (2011, p.23)
y/x 1 2 3 4 f(y)
0 0 0.1 0.2 0.3 0.6
1 0.1 0.1 0.1 0.1 0.4
f(x) 0.1 0.2 0.3 0.4
La distribución conjunta asigna a cada par de valores posibles
de X e Y , una probabilidad.
Las marginales están representadas en la suma (total) de filas y
columnas.
En caso de independencia la función de distribución conjunta es
el producto de las marginales (f(xy) = fxy(x)fxy(y)) −recordar el
test chi-cuadrado. χ2−.

67
Distribución conjunta y marginales (continuas)
[Ejercicio 1.7.] Tomado de Juan Francisco. Sea (X,Y), una variable bidimensional,
con función de densidad:
f(x, y) =
xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 2
0 en otros casos
(29)
1 Exprese en forma de integral la función de distribución conjunta.
2 Obtenga las marginales f(x) y f(y)
3 Calcule Pr(y < 1)
4 Calcule Pr(y < 1, x < 0,5)

68
Distribuciones condicionadas
Caso discreto. Sean X e Y dos variables aleatorias discretas, con
funci´on de probabilidad conjunta f(x, y), la funci´on de
probabilidad de Y condicionada a X = x0:
P(Y |X = x0) =
P(X = x0, Y = y)
P(X = x0)
(30)
Usando el ejemplo de la tabla anterior:
Pr(X = 2|y = 1) = Pr(X=2,Y =1)
P(Y =1) = 0,1
0,4 = 0,25

69
La covarianza es una medida de la relaci´on lineal entre dos variables:
Cov(X, Y ) = E[(X − µx) (X − µy)] (31)
La matriz varianza covarianzas viene dada por:
ΣX =
V ar[X1] Cov(X1, X2) . . . Cov(X1, Xk)
Cov(X2, X1) V ar[X2] . . . Cov(X2, Xk)
...
...
...
...
Cov(Xk, X1) Cov(Xk, X2) . . . V ar[Xk]
(32)

70
[Ejercicio 1.8.] Dado los vectores x = [1, 4, 8, 3] y y = [3, 6, 7, 5].
1 Obtenga la matriz varianzas-covarianzas.
2 Obtenga la matriz de correlaciones.

71
[Ejercicio 1.9.] Tomado de Juan Francisco. Sea (X,Y), una variable bidimensional,
con funci´on de densidad:
f(x, y) =
xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 2
0 en otros casos
(33)
1 Obtenga la matriz varianzas-covarianzas (Cov(X, Y ) = E[XY ] − E[X]E[Y ]).
2 Obtenga la matriz de correlaciones.

72
Notas adicionales de inferencia

73
Muestras aleatorias (n)
Sea X = (x1, x2, ..., xn) un vector aleatorio de longitud n, se dice
que es una muestra aleatoria (Rau, 2011; Lobato, 2016) cuando:
1 xi son mutuamente excluyentes (Pr(X = xi|X = xj) = 0).
2 Tienen distribuciones marginales id´enticas.
Usualmente se dice son variables aleatorias independientes e
id´enticamente distribuidas (i.i.d.).

74
Muestras aleatorias (n)
Cualquier función de X es un estad´ıstico (Y = T(x1, x2, ..., xn)),
cuando estos ayudan aprender sobre los parámetros
poblacionales del modelo se llaman estimadores, que deseamos:
Insesgadez E[ˆθn] = θ. La distribución del estimador ˆθn esta centrada
alrededor de θ (Error Cuadratico Medio ECM(ˆθn) = E(ˆθn − θ)
2
).
Eficiencia (varianza m´ınima).
Consistencia l´ımn→∞ P(|ˆθ − θ| > ) = 0.
Inferencia es establecer herramientas, basadas en la muestra, que
nos permitan aprender sobre los parámetros poblacionales (Lobato,
2016).

76
Referencias I
1 Cárcamo, Javier (n.d). Probabilidad y Estad´ıstica. Departamento de
Matemáticas. Universidad Autónoma de Madrid. Disponible en:
https://www.uam.es/personal_pdi/ciencias/gallardo/Tema-PREST-2.pdf
2 Casco, Ignacio (2009). Vectores aleatorios. Universidad Carlos III de Madrid.
3 Casella, G and Berger, R. (1986). Statistical Inference. 2nd Edition.
4 Converse, Jean M. y Stanley Presser (1986). Survey Questions: Handcrafting
the Standardized Questionnaire. Beverly Hills, California: Sage Publications.
5 Garc´ıa, Donato (2013). Inferencia estad´ıstica. Universidad de Valencia. Curso
de estad´ıstica otoño 2013.
6 Greene, W. (2008). Econometric Analysis, Prentice Hall, 6th. Edición.
7 Gujarati, Danomar (2008). Introducción a la Econometr´ıa. 4ta. Ed.
8 Hill, C; Griffinths, W and Lim, G. (2011). Principle of Econometric. United
States of America. Foruth edition.
9 Pugachev, S. (2010). Introducción a la teor´ıa de probabilidades. Mir Moscú.
10 Ram´ırez, F. (2009). Notas de clases del diplomado en Econometr´ıa Aplicada,
2012. Universidad Autónoma de Santo Domingo.

77
Referencias II
11 Wackerly, Dennis; Mendenhal, William and Scheaffer, Richard (2010).
Estad´ıstica matemática con aplicaciones. Cengage Learning Editores. México,
D.F.
12 Wooldridge, J. (2009). Introducción a la Econometr´ıa: un enfoque moderno.
4ta. ed. Michigan State University. Cengage Learning

Clase1. Naturaleza del análisis econométrico y preliminares estadísticos

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Clase1. Naturaleza del análisis econométrico y preliminares estadísticos

Similar a Clase1. Naturaleza del análisis econométrico y preliminares estadísticos (20)

Más de Nerys Ramírez Mordán

Más de Nerys Ramírez Mordán (14)

Último

Último (15)

Clase1. Naturaleza del análisis econométrico y preliminares estadísticos