Вы находитесь на странице: 1из 33

INTRODUCCION

1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y


TEORIA ASINTTICA
2. EL MODELO CLSICO DE REGRESIN LINEAL
SIMPLE

Notas de Clase Econometra I Introduccin

1. ALGEBRA MATRICIAL, ESTADISTICA MATEMATICA Y


TEORIA ASINTTICA
1.1 CONCEPTOS BSICOS DE ALGEBRA MATRICIAL
DEFINICIONES

Definicin 1 (Matriz)
Una matriz es un ordenamiento rectangular de nmeros en filas y columnas.
Especficamente, una matriz de dimensin

m n es un conjunto de nmeros

ordenados en m filas y n columnas. Se puede expresar una matriz como:

A mn ai , j

a11 a12
a
a22
21

am1 am2

a13
a23

am3

a1n
a2n

amn

Definicin 2 (Escalar)
Un escalar es un nmero real. En trminos de matrices un escalar es una
matriz 1 1.
Definicin 3 (Vector Columna)
Es una matriz que consta de m filas y 1 columna.
3
4
A
41
5

9

Definicin 4 (Vector Fila)


Es una matriz que consta de 1 fila y n columnas.

A 1 3 7 2

1 5

Definicin 5 (Matriz Cuadrada)

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Es una matriz que consta que posee el mismo nmero de filas y columnas m
= n.

3
A
2 2
1

2
B 0
3 3
5

4
5

4
3

6
1

Definicin 6 (Matriz Diagonal)


Es una matriz cuadrada que tiene al menos un elemento diferente de cero
sobre la diagonal principal, siendo cero los valores restantes.

2 0
A

22
0 3

5
B 0
33
0

0 0
9 0
0 4

Definicin 7 (Matriz Escalar)


Es una matriz diagonal cuyos elementos diagonales son todos iguales.
2 0
0
0

2
0
0
0
var cov(u)
0
0 2 0

0
0 2
0

Definicin 8 (Matriz Identidad)


Es una matriz diagonal cuyos

elementos

diagonales

son

todos

1.

Generalmente, la matriz identidad se denota como Imn.


1 0 0
I 0 1 0
33
0 0 1

Definicin 9 (Matriz Simtrica)


Es una matriz cuadrada cuyos elementos por encima de la diagonal son
imagen de los elementos por debajo de la diagonal.
7 3 6
A 3 1 5
33
6 5 0

Definicin 10 (Matrices y Vectores Nulos)

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Son matrices y vectores cuyos elementos son cero.


CARACTERISTICAS DE LAS MATRICES

Definicin 11 (Independencia Lineal)


Una matriz tiene independencia lineal si ninguna fila y ninguna columna
dependen de otra fila u otra columna. La afirmacin de que una matriz es
linealmente dependiente equivale a decir que una fila (columna) es una
transformacin lineal de otra fila (columna).
Definicin 12 (No Singular)
Una matriz se dice No Singular si es cuadrada, tiene independencia lineal y
su determinante es diferente de cero.
Definicin 13 (Rango)
El rango de una matriz es el orden de la submatriz cuadrada ms grande
cuyo determinante es diferente de cero.
3 6
A 0 4
33
3 2

4
B
2 2
2

La matriz A que es de orden

6
5
1

A 0

5
1

B 6

3 y cuyo determinante es cero, tiene una

submatriz B cuadrada de orden 2 con determinante -6. Por lo tanto el rango


de A es 2.
Definicin 14 (Traza)
La traza de una matriz es la suma de los elementos diagonales.
Tr (A) =

ij

i j

OPERACIONES CON MATRICES

Transposicin
Definicin 15 (La Matriz Transpuesta)

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Sea A aij una matriz m n. La transpuesta de A, denotada como A es la


matriz n m que se obtiene al intercambiar las filas y las columnas de A. Es
decir A a ji .
4
A 3
5

5
1
0

4
A
5

3 5
1 0

Suma de Matrices
Sea A aij y B bij . Si A y B son del mismo orden se define la suma de
matrices como:
A+B=C

donde C cij es del mismo orden de A y B y se obtiene como cij aij bij i, j .
Si la suma puede realizarse se dice que A y B son conformables con la suma.
2 3 4 5
A

6 7 8 9

1 0 1 3
B

2 0 1 5

Dado que A y B son del mismo orden son conformables con la suma; de ah,
que A + B = C donde C es igual a:
3 3 3 8
C

4 7 9 14

Multiplicacin por un escalar


Para multiplicar una matriz por un escalar , se multiplica cada elemento
de la matriz por .

A aij

4 5
8 10
, entonces A

8 3
16 6

Si = 2 y A

Multiplicacin de Matrices

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Sean A mn y B np . Para poder efectuar la multiplicacin el nmero de


columnas de A deben ser igual al nmero de filas de B. Entonces, el
producto AB es igual a una matriz C mp que se define como:

a b

AB C
m p

k1

ik kj

Ejemplo 1:
2 1
B 3 5
32
6 2

3 4 7
A

23
5 6 1

(3 2) (4 3) (7 6) (3 1) (4 5) (7 2)

(5 2) (6 3) (1 6) (5 1) (6 5) (1 2)

AB C

60 37

34 37

Propiedades de la Multiplicacin de Matrices:


1. La multiplicacin de Matrices no es conmutativa. AB BA
2. (A B)C (AC) (BC)
3. C(A B) (CA) (CB)
4. k(AB) (kA) B A(kB)
5. IA A IA
6. (AB)C A(BC)
7. VecF VecC
8. VecC VecF A
9. A VecC VecC
10.

VecF A VecF

Determinante de una Matriz


Para cada matriz cuadrada

A,

determinante que se denota como

existe

un

nmero

conocido

como

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Evaluacin de un Determinante para una Matriz 2 2

a11 a12
entonces el determinante se calcula como A a11a22 a12a21
a21 a22

Si A

Ejemplo 2:
5 7
A

2 1

A 5 14 9

Evaluacin de un Determinante para una Matriz 3 3


a11 a12 a13

Si A a21 a22 a23 entonces el determinante se puede calcular utilizando el


a31 a32 a33
Clculo de Laplace (Matriz de Cofactores). Para realizar este calculo, se
procede de la siguiente manera:
Para cada fila i:
A (1)i 1 ai 1 A i1 ai 2 A i 2 ai 3 A i 3

Para cada columna j:

A (1)1 j a1 j A1 j a2 j A 2 j a3 j A 3 j

Ejemplo 3:
1 2 3
5 7 4
A

Si

el determinante puede calcularse como:


2 1 3

Si se utiliza la fila 1

Si se utiliza la

columna 1
A 1(17) 2(7) 3(9)

A 1(17) 5(3) 2(13)

17 14 27

17 15 26

24

24

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Propiedades de los Determinantes


1. Si todos los elementos de una fila o una columna son cero

2. Si A A
3. El intercambio de dos filas o columnas cualquiera de una matriz A,
cambian el signo de

4. Si cada elemento de una fila o de una columna de A se multiplica


por un escalar , entonces
5. Si

dos

filas

columnas

es multiplicado por .

de

una

matriz

son

idnticas,

su

determinante es cero.
6. Si una fila o una columna de una matriz depende linealmente de
otra fila o columna
7.

=0.

AB A B

Inversa de una Matriz


Si A es cuadrada y no singular (

A 0)

su inversa A -1puede encontrarse

as:
A -1

1
(adjA)
A

Los pasos comprendidos en el clculo son:


1. Encontrar

2. Remplazar cada elemento de aij de A por su cofactor para obtener la


matriz de cofactores.
3. Transponer la matriz de cofactores para obtener la matriz adjunta de
A.
4. Dividir cada elemento de la matriz adjunta por

Ejemplo 4:
1 2 3

Para A 5 7 4 su A -1 se calcula as:


2 1 3

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

El determinante de A es:
A 24

Matriz de Cofactores:

7
1
2

1
2

4
3
3
3
3

7 4

5
2
1
2
1

4
3
3
3
3
4

1
17 7 9
2
3 3 3
1
13 11 3
2
5 7

5
2
1

2
1

Matriz Adjunta (Transpuesta de la Matriz de Cofactores):


17 - 3 - 13
AdjA - 7 - 3 11
- 9 3 3

Matriz Inversa

(AdjA/ A )

17 1
13
24 8
24
7
1
11


24
24 8
9
1
1

24
8
8

17 3 13
1
7 3 11
A 1

24
9 3 3

1.2 NOCIONES BSICAS DE ESTADSTICA MATEMTICA


VARIBALES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Definicin 1 (Variable Aleatoria)


Una variable aleatoria es aquella que toma valores numricos y que tiene un
resultado determinado por un experimento.
Al lanzar una moneda (experimento), el nmero de caras que aparecern en,
por ejemplo 10 lanzamientos, es una variable aleatoria, por que antes de

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

realizarse el experimento no se sabe cuantas caras van a salir en los 10


lanzamientos. De ahora en adelante, notaremos a las variables aleatorias
con maysculas W, X, Y y Z y los resultados que toma la variable con sus
respectivas minsculas w, x, y, y z. Las variables aleatorias pueden ser
discretas o continuas.
Definicin 2 (Variable Aleatoria Discreta)
Una variable aleatoria discreta es aquella que puede tomar un nmero de
valores finito o infinito contable. Donde infinito contable hace referencia a
que una variable puede tomar un infinito nmero de valores y es posible
hacer corresponder estos con nmeros enteros positivos.
Por ejemplo, si se define a la variable aleatoria X como la suma de los
nmeros que parecen en los dados, entonces X tomar uno de los siguientes
valores: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12.
Definicin 3 (Variable Aleatoria Continua)
Una variable aleatoria continua es aquella que puede tomar cualquier valor
dentro de un intervalo de valores.
Por ejemplo, la estatura de una persona es una variable aleatoria continua
por que para el rango comprendido entre 150.0 y 185.5 centmetros la
estatura puede tomar cualquier valor, dependiendo de la precisin de la
medicin.
Definicin 4 (Funcin de Densidad de Probabilidad de una VAD)
Sea X una variable aleatoria discreta que toma valores diferentes x1, x2, xn.
Entonces, la funcin
f (x ) P(X x i ) para
i 1, 2,...,n,...

Se denomina la funcin de densidad de probabilidad discreta (FDP) de


X. donde la P(X=xi) significa la probabilidad de que la va discreta X tome el
valor de xi.

Jhon Alexis Diaz Contreras

10

Notas de Clase Econometra I Introduccin

Ejemplo 1:
La variable aleatoria discreta X (la suma de los nmeros que aparecen en
dos dados) puede tomar uno de los siguientes resultados:
x

10

11

12

1 2 3 4 5 6 5 4 3 2 1









36 36 36 36 36 36 36 36 36 36 36

f (x )

Definicin 5 (Funcin de Densidad de Probabilidad de una VAC)


Sea X una variable aleatoria continua. Entonces, se dice que f (x ) es la FDP
de X si se satisfacen las siguientes condiciones:
f (x ) 0

f (x )dx 1

f (x )dx P(a x b)

Donde P(a x b) significa la probabilidad de que X se encuentre en el


intervalo a a b. Para una variable continua la probabilidad de que X tome un
valor especfico es cero; la probabilidad para tal variable puede medirse
solamente sobre un rango o intervalo dado, tal como (a, b).
CARACTERISTICAS DE LAS DISTRIBUCIONES DE PROBABILIDAD

Es comn describir una distribucin de probabilidad de acuerdo a algunas


de sus caractersticas. Estas, pueden clasificarse en medidas de tendencia
central, medidas de variabilidad y medidas de asociacin entre dos variables
aleatorias.
Medida de Tendencia Central: El Valor Esperado
Si X es una variable aleatoria, el valor esperado (o esperanza) de X, es un
promedio ponderado de todos los posibles valores de X. Las ponderaciones
estn determinadas por la FDP de la variable.
Entonces, sea X es una variable aleatoria discreta, el valor esperado,
denotado como E ( X ) , se define de la siguiente manera.

11

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

E(X ) x f (x )
x

Ejemplo 2:
Si se toman los datos del Ejemplo 1, el valor esperado de la suma de los
nmeros que aparecen en el lanzamiento de dos dados, se calcula como
sigue:
1
2
3
1
E(X ) 2
3
4
... 12

36
36
36
36
7

Propiedades del Valor Esperado


1. El valor esperado de una constante es la constante misma. As, s c
es una constante

E(c) c.

2. Si a y b son constantes el E(aX b) aE(X ) b. Este resultado se


puede generalizar para N variables.
3. Si {a1, a2 ,...,an} son constantes y {X 1, X 2 ,...,X n} son variables
aleatorias,

entonces

E(a1X 1 aX2 ... anX n ) a1E(X 1 ) a2E(X 2 ) ... anE(X n ) .

notacin de sumatoria E

bien,

en

a
X

ai E X i .
i
i
i 1
i 1
n

Medidas de Variabilidad (Varianza y Desviacin Estndar)


Varianza
Sea X una variable aleatoria y sea E ( X ) . La distribucin o dispersin de
los valores de X alrededor de su valor esperado puede ser medida por la
varianza, la cual se define como
var(X ) X2 E(X )2
E(X 2 ) 2
E(X 2 ) E(X ) 2

En otras palabras la varianza indica la distancia esperada de X a su valor


esperado (media), cuanto se aleja X en promedio de .

Jhon Alexis Diaz Contreras

12

Notas de Clase Econometra I Introduccin

Propiedades de la Varianza
1. La varianza de una constante es cero.
aX b) a2 var(
X ).
2. Si a y b son constantes, entonces var(

Desviacin Estndar
La desviacin estndar de una variable aleatoria, denotada por

, es la raz

cuadrada positiva de la varianza X var(X ) .


Propiedades de la Desviacin Estndar
1. La desviacin estndar de una constante es cero.
2. Si a y b son constantes, entonces (aX b) a X .
Medidas de Asociacin
Covarianza
Sea x E(X ) y x E(X )

consideremos

la

variable

aleatoria

(X x )(Y y ) . Entonces la covarianza entre dos variables aleatorias X y Y

se define como el valor esperado del producto (X x )(Y y ) :

Cov(X ,Y ) E (X x )(Y y )

La covarianza tambin se denota por XY . Si XY >0, entonces, en


promedio, cuando X est sobre su media, Y tambin lo est. Si XY <0,
entonces, en promedio cuando X est sobre su media, Y est por debajo de
la suya. Dado que la covarianza mide al grado de dependencia lineal entre
dos variables aleatorias, una covarianza positiva indica que las dos variables
van en la misma direccin, en tanto que una covarianza negativa seala que
lo hacen en direcciones contrarias. Para calcular la covarianza se puede
proceder como sigue:

Cov(X ,Y ) E(X X )(Y Y ) E(X X )Y


E X (Y Y ) E(XY ) X Y
Propiedades de la Covarianza:
1. Si X y Y son independientes, entonces la Cov(X, Y) = 0.

13

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

2. Para cualquier constantes a1, b1, a2 y b2.


3.

Cov(X ,Y ) de
(X )de
(Y )

Coeficiente de Correlacin
Al igual que la covarianza el coeficiente de correlacin mide el grado de
asociacin lineal entre dos variables. Sin embargo, a diferencia de la
covarianza, no depende de las unidades de medida.

El coeficiente de

correlacin entre X y Y se define como:


Corr

Cov(X ,Y )

XY
de(X ) de(Y ) X Y

El coeficiente de correlacin que se denota por XY siempre tiene el mismo


signo que la covarianza dado que las desviaciones estndar siempre son
positivas.
Propiedades del Coeficiente de Correlacin
(X ,Y ) 1. Si la Corr(
X ,Y ) 0 no hay una relacin lineal
1. 1 Corr
X ,Y )= 1 implica una relacin lineal
entre las variables. Si Corr(

positiva y perfecta; si la correlacin es cercana a 1 indica un fuerte


X ,Y )
grado de asociacin lineal positiva. De la misma forma si Corr(

= 1 implica una relacin lineal negativa perfecta; si la correlacin


es cercana a 1 indica un fuerte grado de asociacin lineal
negativa.
2. Para

constantes

a1,

b1 ,

a2

Corr
(a1X b1,a2Y b2 ) Corr
(X ,Y ) .

b2

con

a1
S

a2
a1 a2

>
<

0
0

Corr
(a1X b1,a2Y b2 ) Corr
(X ,Y ) .
ALGUNAS DISTRIBUCIONES DE PROBABILIDAD

La distribucin Normal y las que se derivan de ella son las ms empleadas


en estadstica y econometra. A partir de estas distribuciones es que se
realiza la inferencia estadstica en econometra.

Jhon Alexis Diaz Contreras

14

Notas de Clase Econometra I Introduccin

Distribucin Normal
Se dice que una variable aleatoria esta normalmente distribuida si su FDP
tiene la forma:
f (x )

1 (x )2
1

exp
2
2
2

Propiedades de la Distribucin Normal


1. Es simtrica alrededor de su valor medio.
2. A una desviacin estndar se encuentra el 68% de los datos, a dos
desviaciones estndar se encuentra el 95% y a tres desviaciones
estndar el 99.7% de los datos.
3. Dados los parmetros y 2 se puede encontrar la probabilidad
de que x se encuentre dentro de cierto intervalo. Para esto, la
variable x normalmente distribuida con media y 2 se convierte
en una variable Z normal estandarizada mediante:
Z

S X ~ N(, 2) entonces ahora X ~ N(0, 1).


4. S X1 ~ N( 1, 12 ) y X2 ~ N( 2 , 22 ) entonces Y aX1 bX2 se tiene que

Y ~ N (a1 b 2 ),(a2 12 b2 22

Distribucin 2 (Ji Cuadarado)


Sean Z1, Z2,, Zk variables normales estndar independientes, entonces
k

Z Zi2 sigue la distribucin 2 con k grados de libertad.


i 1

Propiedades de la Distribucin Ji- Cuadrado


1. La media de 2 es k y su varianza es 2k.

15

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

2. Si Z1 y Z2 son dos variables que se distribuyen 2 con k1 y k2


grados de libertad. Entonces Z1 + Z2 es tambin una variable 2
con k1 + k2 grados de libertad.
3. La distribucin 2 es asimtrica y el grado de asimetra depende
de los grados de libertad.
Distribucin t de Student
Si Z1 es una variable normal estandarizada y otra variable Z2 sigue la

distribucin

con k grados de libertad, entonces

Z1
Z2

Z1 k
Z2 sigue una

distribucin t de student con k grados de libertad.


Propiedades de la Distribucin t de Student
1. Es simtrica pero ms plana que la distribucin normal.
2. La media de la distribucin t es cero y su varianza es k/( k 2)
Distribucin F de Fischer
Si Z1 y Z2 son variables 2 distribuidas independientemente con k1 y k2
grados de libertad, entonces F

Z1 k1
sigue la distribucin F con k1 y k2
Z2 k2

grados de libertad.
Propiedades de la Distribucin F de Fischer
1. Esta sesgada a la derecha, a medida que k1 y k2 aumentan se
acerca a una normal.
2. La media de una distribucin F es k2 /( k2 2) y su varianza es

2k22(k1 k2 2)
k1(k2 2)2(k2 4)

Jhon Alexis Diaz Contreras

16

Notas de Clase Econometra I Introduccin

3. El cuadrado de una variable aleatoria con distribucin t con k


grados de libertad es una distribucin F con 1 y k grados de
2
libertad t k F1,k

INFERENCIA ESTADSTICA

Estimacin Puntual
Se establece un estadstico que toma un valor numrico particular llamado
estimacin. Por ejemplo, si queremos conocer la media de una poblacin,
representada por , podemos tomar una muestra aleatoria de la poblacin
y estimar el parmetro poblacional por medio de un estimador muestral
llamado X .
Estimacin por Intervalos
Se establece un rango de posibles valores dentro de los cuales se puede
encontrar el parmetro. Por ejemplo, si se supone que una variable est
distribuida normalmente la media muestral X tambin est normalmente
distribuida; as, el verdadero valor de

se encuentra dentro de un

Intervalo de Confianza de la forma

Pr X 1.96


X 1.96

n X 1.96

n 0.95

PUEBAS DE HIPTESIS

Una de las herramientas estadsticas ms utilizadas en la econometra son


las Pruebas de Hiptesis. El problema de una prueba de hiptesis puede
plantearse as:
Supngase que se tiene una variable aleatoria X con una FDP conocida
f (x ; ) , donde es el parmetro de la distribucin. Despus de obtener

una muestra aleatoria de tamao n, se obtiene el estimador puntual .


Puesto que el verdadero casi nunca se conoce, se plantea la pregunta:

17

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Es el estimador compatible con algn valor de bajo hiptesis, por


ejemplo, * , donde * es un valor numrico especfico de ? En el
lenguaje de las pruebas de hiptesis, * se denomina hiptesis nula y
generalmente se denota por H0 . Esta hiptesis nula se contrasta con una
hiptesis alternativa denotada por H1 , la cual, por ejemplo, puede
plantear que * .
Existen dos enfoques para abordar el problema de la prueba de hiptesis, el
del intervalo de confianza y el de la prueba de significancia. Se asume que el
estudiante est en capacidad de abordar y comprender por si solo el
enfoque del intervalo de confianza. Por ser el ms usado en econometra se
presentar el enfoque de la prueba de significancia.
Hay que recordar que:

Zi

X
N(0,1)
/ n

Para cualquier muestra dada se conocen los valores de

X ,n

. Si se

supone que H0 : * , entonces Zi puede ser directamente calculado y se


puede utilizar la distribucin normal para encontrar la probabilidad de
obtener el valor de Z calculado. Si esta probabilidad es baja, por ejemplo
menor que 5%, se puede rechazar la hiptesis nula.
Especficamente, la decisin de rechazar o no rechazar una hiptesis nula
depende del nivel de significancia que se plantee. Si la probabilidad del

se rechaza la hiptesis nula; por el


contrario si la probabilidad del estadstico calculado es mayor que no se
estadstico calculado es menor que
rechaza la hiptesis nula.

Jhon Alexis Diaz Contreras

18

Notas de Clase Econometra I Introduccin

1.3 INTRODUCCION A LA TEORIA ASINTOTICA


Para realizar anlisis emprico con cierto rigor, se deben tener muestras
grandes. La teora asinttica estudia el comportamiento de los estimadores
cuando la muestra es grande (tiende a infinito). De la teora asinttica solo
estudiaremos la consistencia y la normalidad asinttica.
Consistencia
Yn de tamao
Sea Wn un estimador de , basado en una muestra Y1,Y2 ,...,
n. Entonces, Wn es un estimador consistente de , si para cada 0
Pr(Wn ) 0

cuando

Cuando Wn es consistente, decimos tambin que es el lmite de la


Wn ) 0
probabilidad de Wn y se escribe como plim(

A pesar de que no todo estimador pueda ser en principio consistente se


puede llegar a este resultado si se cumple lo siguiente: Si Wn es un
estimador

insesgado

de

Var(Wn ) 0

cuando

n , entonces

plim(
Wn ) 0 . Lo que permite estos resultados de consistencia es la Ley de

los grandes nmeros.


Ley de Los Grandes Nmeros
Yn variables aleatorias independientes e idnticamente
Sea Y1,Y2 ,...,
distribuidas con media . Entonces, plim(Yn ) .
Normalidad
La consistencia y la ley de los grandes nmeros nos dicen que la
distribucin del estimador se colapsa alrededor del verdadero parmetro a
medida que aumenta el tamao de la muestra, pero no nos dice nada acerca
de la forma de tal distribucin. En econometra para que las pruebas de
hiptesis y los intervalos de confianza tengan validez necesitamos una forma
de aproximar esta distribucin.

19

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Sea {Zn : n 1,2,...}una sucesin de variables aleatorias, tal que para toda z,
Pr(Zn z ) (z ) cuando

n ; entonces

Zn tiene una distribucin normal

estndar asinttica. Este resultado es posible gracias al teorema del lmite


central.
Teorema del Lmite Central
Sea {Y1,Y2 ,...,Yn}una muestra aleatoria con media
Entonces, Zn

y varianza 2 .

Y
tiene una distribucin normal estndar asinttica. En
/ n

otras palabras la distribucin completa de Zn se acerca arbitrariamente a


la distribucin normal estndar a medida que n crece.

Jhon Alexis Diaz Contreras

20

Notas de Clase Econometra I Introduccin

2. EL MODELO CLSICO DE REGRESIN LINEAL SIMPLE


2.1 CONCEPTOS BSICOS
Anlisis de Regresin Poblacional
Es la estimacin de la media o valor promedio de la variable dependiente
con base en los valores conocidos o fijos de las variables independientes.
Para el caso de la regresin lineal simple, lo que interesa es explicar y en
trminos de x. La notacin que expresa este problema es:
E Y x i f (x i ) Funcin de Regresin Poblacional
y 1 2x i Funcin de Regresin Lineal Poblacional FRLP

La linealidad de la funcin esta dada en los parmetros y las variables. A la


variable y se le conoce como variable dependiente, explicada, de respuesta
o regresando; y la variable x se llama variable independiente, explicativa,
control o regresor.
Especificacin Estocstica de la FRLP
Sin embargo, la FRLP es una expresin determinstica y el anlisis de
regresin es esencialmente estocstico. Se considera as, ya que no es
posible, por diferentes motivos, encontrar todas las variables explicativas
que inciden directamente sobre la variable dependiente. De esta forma, la
especificacin estocstica de la FRLP es:
y 1 2x i ui

La variable ui es el trmino de error de perturbacin de la funcin y


representa todos aquellos factores que influyen sobre y aparte de x. El
trmino de error, puede ser generado por diferentes motivos:

21

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

No hay disponibilidad de la informacin: Usualmente, es caracterstico


de los modelos economtricos requerir de informacin que en muchas
ocasiones no es fcil de encontrar. Por ejemplo, a veces se definen
variables para las cuales no existe informacin disponible; otras veces,
la informacin que se requiere para el modelo no es pblica y llevar a
cabo encuestas para recolectar la informacin puede resultar costoso.

Variables centrales vs. Variables perifricas: Pueden ser numerosas


las variables explicativas que permiten determinar el comportamiento
de una variable endgena; sin embargo, por claridad en la expocisin
y explicacin del problema, se recurre a aquellas variables que son
ms relevantes.

Principio de Parsimonia: Un modelo debe conseguir el mayor grado de


explicacin haciendo uso del menor nmero de variables posible

De la misma forma el trmino ui es esencial en la interpretacin de una


FRLP. Si los factores de u se mantienen fijos tal que u 0, x tiene un efecto
lineal sobre y:
y 1x
As, el cambio en y es 1 multiplicado por el cambio en x. De aqu se obtiene
una conclusin fundamental en la economa aplicada: 1 mide la relacin
entre y y x si se mantienen fijos los otros factores medidos por u.
Ahora si suponemos que E Y x i es lineal entonces se puede escribir que:
Yi 1 2X i ui
y1 1 2x u1
y2 1 2x u2
y3 1 2x u3

yn 1 2x un

Si se toma el valor esperado de Yi E Y x i ui se obtiene que:

Jhon Alexis Diaz Contreras

22

Notas de Clase Econometra I Introduccin

E Y x i E E Y x i E ui x i
E Y x i E ui x i

E ui x i 0

El anterior resultado nos dice que el valor promedio de u no depende de x y


esto implica adems que E (u ) 0 . Estos resultados sern fundamentales a la
hora de estimar los valores muestrales de los parmetros.
2.2 ESTIMACIN POR EL MTODO DE MNIMOS CUADRADOS
ORDINARIOS
Lo ms importante en el anlisis de regresin es la estimacin de los
parmetros. Para esto se puede hacer uso del Mtodo de Mnimos
Cuadrados Ordinarios (MCO). Primero, necesitamos una muestra de la
poblacin; por lo tanto la FRLM es:
yi 1 2x i ui

Ahora utilicemos las conclusiones que se derivaron de la seccin anterior, en


trminos

de

la

poblacin

con

respecto

al

error.

El

E(u) 0y

la

Cov
(x ,u) E(xu) 0 . De esta forma podemos escribir que:

E( y 1 2x ) 0

E x( y 1 2x ) 0
En trminos muestrales, para estimar 1 y 2 las ecuaciones anteriores se
puede expresar como:
n

n1 ( yi 1 2x i ) 0
i 1

n1 x i ( yi 1 2x i ) 0
i 1

Dado que por propiedades de la sumatoria tenemos que

y n1 yi la
i 1

primera ecuacin se puede escribir como

y 1 2x . De lo anterior se

deduce que 1 y 2x .

23

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

La segunda ecuacin puede utilizarse para obtener el 2 . Si se elimina n-1 y


se incluye el resultado de 1 en esta ecuacin tenemos:
n

x ( y ( y x ) x ) 0
i

i 1

Que al reordenar da
n

x ( y y) x (x
i

i 1

De

las

x (x
i 1

propiedades
n

x ) (x i x )2 y
i 1

del

operador

x ( y y) (x
i 1

i 1

i 1

x)

sumatoria

se

tiene

que

x )( yi y) . En ltimas, se concluye

que:
n

(x
i 1

x )( yi y)

(x
i 1

x )2

Las estimaciones de los parmetros que se acaban de deducir se conocen


como estimadores de mnimos cuadrados ordinarios. Las conclusiones
anteriores se pueden obtener a partir de y i 1 2 xi . El residuo puede
expresarse como u yi y i yi 1 2 xi . Ahora si lo que se busca es elegir los
coeficientes que minimicen la suma de los residuales al cuadrado se tiene
que:
n

i 1

i 1

i2 min ( yi 1 2x i )2
min u
Las ecuaciones de las cuales se obtuvieron los estimadores son las
condiciones de primer orden del problema de minimizacin anterior y si se
realizan los clculos correctos se llegan a los mismos resultados.
Propiedades de los Estimadores de Mnimos Cuadrados Ordinarios

Jhon Alexis Diaz Contreras

24

Notas de Clase Econometra I Introduccin

1. Se dice que los estimadores MCO son lineales si provienen de una funcin
lineal de una variable aleatoria.
2. Se dice que los estimadores de MCO son insesgados si su valor promedio
o esperado E ( i ) es igual a su valor verdadero i .
3. Se dice que los estimadores MCO son eficientes si dentro de la clase de
todos los estimadores lineales insesgados son los de mnima varianza.
Teorema de Gauss Markov:
Dados los supuestos del modelo de regresin lineal, los estimadores de
mnimos cuadrados ordinarios, dentro de la clase de estimadores lineales
insesgados, tienen varianza mnima; es decir, son MELI.

2.3 VALORES ESPERADOS Y VARIANZAS DE LOS ESTIMADORES


Para comprobar las propiedades de los estimadores de MCO se plantean
unos supuestos que permiten mostrar el insesgamiento y la varianza de de
los mismos. Los supuestos son:

SRLS 1. Lineal en los Parmetros


En el modelo poblacional, la variable dependiente y se relaciona con la
variable independiente x y el error u as:
y 1 2x u

SRLS 2. Muestreo Aleatorio


Del modelo poblacional se puede tomar una muestra aleatoria de tamao n
{(x i , yi ) : i 1,2,...,n}

SRLS 3. Media Condicional Cero


E(ui x i ) 0 i 1,2,...,
n

SRLS 4. Variacin Muestral en la Variable Independiente

25

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

En la muestra, las variables independientes x i , i 1,2,...,n no son todas


iguales a una misma constante. Se requiere cierta variacin de x en la
poblacin.
Teorema Insesgamiento de los Estimadores MCO
Bajo las suposiciones RLS1 a RLS4 se tiene que E ( 0 ) 0 y E ( 1 ) 1 .
SRLS 5. Homoscedasticidad
La varianza del error es constante; es decir, Var(ux ) 2 . En otras palabras
se supone que la varianza del error no depende de las variables
independientes. Cuando la

Var (u x )

depende de x se dice que el trmino de

error presenta Heteroscedasticidad.


Teorema Varianza Muestrales de los Estimadores de MCO
Bajo los supuestos RLS1 a RLS5 se tiene que

Var(2 )

2
n

(x
i 1

x )2

Var(1 )

2n1 x i2
i 1

(x
i 1

x)

Estimacin de la Varianza del Error


Como se puede observar en las ecuaciones anteriores, las varianzas de los
estimadores dependen de la varianza del modelo; es decir de 2 . Sin
embargo, esta casi nunca se conoce y por lo tanto hay que estimarla. Antes
de pasar a la estimacin de 2 , resulta til aclarar la diferencia entre los
errores y los residuos.
La ecuacin yi 0 1x i ui muestra cmo escribir el modelo poblacional en
trminos de una observacin elegida al azar, donde ui es el error de la
Jhon Alexis Diaz Contreras

26

Notas de Clase Econometra I Introduccin

observacin i. Estos errores no son observables y aparecen solo en las


ecuaciones que contengan los parmetros poblacionales 1 y 2 . Tambin
se puede expresar yi en trminos de su valor ajustado y de su residuo,
como en la ecuacin

yi 0 1x i u
i , donde

i
u

son los residuos de la

estimacin y pueden calcularse de los datos.


Ya que se ha hecho la distincin entre los errores y el residuo ya se puede
calcular el estimador de la varianza del modelo. Esta se puede calcular
2
como

1 n 2
ui . En otras palabras el estimador de la varianza del
(n 2) i 1

modelo es la Suma de Residuales al Cuadrado sobre los grados de libertad.


Para calcular el error estndar de la regresin se procede de la forma usual;
es decir se obtiene la raz cuadrada de la varianza.

2.4 UNIDADES DE MEDIDA Y FORMA FUNCIONAL


Unidades de medida
Supongamos que se tiene la siguiente regresin:
FBKF 1 2PIB

donde la fonacin bruta de capital fijo FBKF, es una funcin lineal del PIB.
Ambas variables estn expresadas en miles de millones de pesos. Cmo
cambian los resultados de la regresin s en lugar de que las variables estn
medidas en miles de millones de pesos, se miden en millones de pesos?
Para contestar a esta pregunta, definamos entonces a:
i
yi 1 2x i u

donde yi = FBKF y xi = PIB. Ahora, definamos a yi* w1 yi y x i* w2x i donde


w1 y w2 son factores de escala. Por lo tanto se puede estimar la regresin:
i*
yi* 1* 2* x i* u

27

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Y de esta regresin los nuevos estimadores se definen como 1* w11 y


w
2* 1 2 . Los dems estimadores que se han obtenido hasta ahora se
w2

puede redefinir as:


w
2
*

2
1

w
Var(2* ) 1
w2

Var(1* ) w12 Var(1 )

Var(2 )

Ejemplo
0.17395
PIB, con las variables en miles
Para la regresin FBKF 37.0015205
de millones; expresar la regresin con FBKF en miles de millones y PIB en
millones.
Los factores de escala son w1 1 y w2 1000. Por lo tanto, utilizando los
resultados

anteriores

tenemos

que

la

nueva

regresin

es

FBKF* 37.0015205
0.00017395
PIB*

Forma Funcional
En econometra no siempre las variables se expresan en niveles y adems en
algunas ocasiones en economa aplicada son muy tiles las elasticidades.
Por esto, es muy comn emplear modelos logartmicos y combinaciones de
modelos lineales con logartmicos. Para cada forma funcional, las relaciones
entre la variable dependiente y la variable independiente, expresadas en los
coeficientes, se interpretan de manera diferente. La interpretacin de la
relacin para cada uno de los modelos es la siguiente:

Modelo
Nivel Nivel
Nivel
Log
Log

Variable

Variable

Independi

Dependient

ente

Cambio en x

Cambio en y

en:

en:

1 unidad

2 unidades

Log (x)

1%

Log (y)

1 unidad

Jhon Alexis Diaz Contreras

( 2 /100)
unidades
( 2 *100)%

28

Notas de Clase Econometra I Introduccin

Nivel
Log Log

Log (y)

Log (x)

2 %

1%

Ejemplo
u
Supongamos que se tiene un modelo de la forma yi 1x i 2 e i el cual
puede ser expresado en forma lineal como ln yi 1 2 lnx i ui donde
1 ln 1 . La importancia de modelos de este tipo en Economa

Aplicada radica en que el parmetro 2 mide la elasticidad de y con


respecto x; es decir, el cambio porcentual en y ante un cambio
porcentual en x. El siguiente modelo relaciona el consumo del caf
con su precio:
lnconscaf
0.774 0.2530
ln precaf

De este modelo se puede decir que si el precio del caf se incrementa


en 1%, el consumo de caf disminuye en 0.25%.

t
Asumamos que se tiene el siguiente modelo PIBt PIB0 1 r donde

PIBt PIB en el tiempo t; PIB0 PIB inicial;

r tasa de crecimiento del

PIB.

puede

Un

modelo

como

el

anterior

expresarse

como

lnPIBy lnPIB0 ln(1 r) t donde lnPIB0 1 y ln(1 r) 2 ; de esta forma

el modelo es lnPIBt 1 2 t ut . Se estim el modelo anterior y se


obtuvieron los siguientes resultados
lnPIBt 8.0139
0.02469
t

De este modelo se concluye que el PIB real crece a una tasa de


2.469% por ao.

Se tiene una relacin del PIB con los cambios porcentuales en la


Oferta Monetaria expresada en el siguiente modelo
PIB 1 2 lnOfertMont
. Se realizaron los clculos y se obtuvo el
siguiente modelo:
PIB 16329
2584
.8lnOfertMont

El PIB aumenta 25.848 mil millones de pesos por cada aumento del
1% en la oferta monetaria.

29

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Para relacionar la Formacin Bruta de Capital Fijo con el PIB se


plantea el siguiente modelo FBKF 1 2PIB que arroj los siguientes
resultados:

FBKF 37.0015205
0.17395
PIB
Si el PIB aumenta en 1000 millones la Formacin Bruta de Capital Fijo
se incrementa en 0.17395 miles de millones.

2.5 MEDIDA DE BONDAD DE AJUSTE: EL r2


Para encontrar una medida de que tan bien

explica

la

variable

independiente a la variable dependiente, es necesario utilizar algunas


propiedades algebraicas de los estimadores de MCO.

La suma y el promedio muestral de los residuos suman cero.


n

Matemticamente,

u 0
i 1

De esta propiedad se deduce que los

estimadores de MCO se eligen para que los residuos sumen cero.

El promedio muestral de los residuos de los MCO es cero.

x u 0
i 1

Con estas propiedades es posible escribir una regresin para cada i como
i y se nota como se puede descomponer cada i es dos partes; los
yi yi u

valores ajustados y los residuos. En funcin de lo anterior, se define a la


Suma Total de Cuadrados (STC) como:
n

STC ( yi y)2
i 1

La STC mide la variacin muestral de yi ; es decir que tan disperso esta yi


en la muestra. As mismo se define la Suma Explicada de Cuadrados (SEC)
como la variacin muestral de

yi , matemticamente se puede expresar

como:
n

SEC ( yi y)2
i 1

Jhon Alexis Diaz Contreras

30

Notas de Clase Econometra I Introduccin

Por ltimo se tiene a la Suma de Residuales al Cuadrado (SRC) que mide la


i :
variacin muestral de u
n

i 2
SRC u
i 1

De las definiciones anteriores se puede mostrar que STC = SEC + SRC. Con
este resultado se puede obtener el coeficiente de determinacin o R2. Si se
divide todo sobre la STC se obtiene que:
R2

SEC
SRC
1
STC
STC

El coeficiente de determinacin es la proporcin de la variacin explicada


en la variacin total y por lo tanto se interpreta como el porcentaje en la
variacin de y que es explicado por la variacin en x.

2.6 INTERPRETACIN E INFERENCIA ESTADSTICA EN EL MCRL


Para realizar Test de Hiptesis con el modelo de regresin lineal se debe
suponer que cada u i est normalmente distribuido. Lo anterior se puede
notar como:
i ) 0
Media
: E(u
i2 ) 0
Varianza
: E(u
Cov
(ui ,uj ) E(ui ,uj ) 0

Es decir, los errores se encuentran distribuidos como u i ~ NID(0, 2 ) . Bajo


este supuesto se puede construir intervalos de confianza y pruebas de
hiptesis.
Intervalos de Confianza
Si suponemos que u i estn normalmente distribuidos los coeficientes del
modelo 1 y 2 tambin estn normalmente distribuidos; por ejemplo:
Z

i i

i

31

Jhon Alexis Diaz Contreras

Notas de Clase Econometra I Introduccin

Pero dado que no se conoce se estima a partir de y entonces se puede


i

escribir como:
t

i i

i

En general un IC se puede construir como i t i i t y a un nivel de


i

significancia dado se lee como la probabilidad de que el verdadero beta


poblacional se encuentre entre los lmites del intervalo.
Pruebas de Hiptesis
La idea del anlisis de regresin lineal es encontrar los coeficientes que
capten la relacin entre las variables. Por esto es necesario realizar un test
de hiptesis para probar que los betas estimados no son, estadsticamente,
iguales a cero.
A un nivel de significancia () dado y con n 2 grados de libertad se calcula
un t estadstico de la forma t

i
y se concluye como sigue: Bajo la
i

hiptesis nula H0 : i 0 si el t calculado es menor (en valor absoluto) que el t


crtico No se rechaza la hiptesis y existe evidencia estadstica de que el
beta sea igual a cero. Por el contrario si el t calculado es mayor (en valor
absoluto) que el t crtico se rechaza la hiptesis y existe evidencia
estadstica de que el beta sea igual no es igual cero.
Una manera muy sencilla de realizar una evaluar una hiptesis es utilizando
el valor p del estadstico calculado. A un nivel de significancia dado si p
se rechaza la hiptesis nula; y si p no se rechaza la hiptesis nula.

Anlisis de Varianza

Jhon Alexis Diaz Contreras

32

Notas de Clase Econometra I Introduccin

El anlisis de varianza es til cuando se quiere establecer si los betas de


manera conjunta son estadsticamente iguales a cero o no. Para el caso del
anlisis de regresin lineal, esta prueba no es de mucha importancia ya que
existe solo un coeficiente para evaluar (el que acompaa la x); sin embargo
cuando se tiene ms de una variable explicativa esta prueba arroja
resultados robustos.
Bajo la hiptesis nula de H0 : 2 3 ... k 0 se utiliza la informacin del
anlisis de varianza para realizar un test de Fischer.
Fuente de Variacin

Grados de Libertad

Estadstico

F
SEC

SRC

n2

STC

n1

SEC/SRC

El estadstico F se compara con un Fcritico con nivel de significancia y 1 y n


2 grados de libertad en el numerados y en el denominador
respectivamente. S el estadstico F es mayor que Fcritico se rechaza la
hiptesis nula; de lo contrario no se rechaza.

33

Jhon Alexis Diaz Contreras

Вам также может понравиться