Вы находитесь на странице: 1из 46

CAPITULO I

CONCEPTOS BSICOS

1.1. CONCEPTOS DE LGEBRA

1.1.1. SUMATORIAS

Propiedades de las sumatorias// TOMADO DE CUADERNO GEOESTADISTICA


2
n
n n n n 1 n

i j i 2 i j
2
i

i 1 i 1 j 1 i 1 i 1 j 1

COMPLETAR

1.1.2. MATRICES//TOMADO DE GROSSMAN Y DE RAMON GIRALDO

Definicin: Una matriz A de tamao (m x n) es un arreglo rectangular de m filas con n


columnas.

a11 a12 . . . a1n



a21 a22 . . . a2 n
. . . .
A
. . . .
. . . .

a am 2 . . . amn
m1

Suma y Producto de Matrices

Si A y B son dos matrices de orden 3x2, entonces su suma se define como:

a11 a12 b11 b12 a11 b11 a12 b12



A B a21 a22 b21 b22 a21 b21 a22 b22
a a32 b32 b23 a31 b31 a32 b32
31

En el caso de la multiplicacin se debe cumplir que el nmero de columnas de la


primera matriz sea igual al nmero de filas de la segunda.
a11 a12 a11b11 a12b21 a11b12 a12b22 a11b13 a12b23
b b12 b13
AB a21 a22 11 a21b11 a22b21 a21b12 a22b22 a21b13 a22b23
a b21 b22 b23
31 a32 a31b11 a32b21 a31b12 a32b22 a31b13 a32b23

Inversa y Determinante de una Matriz.

Si A es una matriz cuadrada (nmero de filas igual al nmero de columnas) su inversa se


denotara como A1 , donde AA1 = A1 A = I, con I igual a la matriz identidad (matriz
de unos en la diagonal principal y cero por fuera de ella). En ocasiones cuando se haga
referencia a que una matriz es no singular se entender como que dicha matriz tiene
inversa.

Un ejemplo puede ser:

2 3
1 5 3


4 5 2 2
2 1

Esto puede comprobarse si se cumple A-1A = I:

5 3 3
2 1 0
2
2
1 4 5 0 1
2

a12 a11
El determinante de una matriz A se define como det A a11a22 - a12 a21
a22 a21
Ahora se tiene que A es invertible si y solo si det A 0 y si det A 0 se establece la
siguiente relacin entre la inversa y el determinante de una matriz.

1 a22 a12
A -1
det A a21 a11

Transpuesta de una matriz

Si A es una matriz de m x n, entonces su transpuesta se denotar como AT y se


obtendr al intercambiar los renglones y columnas de A.

a11 a12 . . . a1n a11 a21 . . . am1



a21 a22 . . . a2 n a12 a22 . . . am 2
. . . . . . . .
A entonces A T
. . . . . . . .
. . . . . . . .

a am 2 . . . amn a a2 n . . . amn
m1 1n
Algunas propiedades

Sean A, B, C matrices de tamao m x n, m x n, n x p respectivamente, entonces se tienen


las siguientes propiedades:

( A B) C ( AC BC )
( AT )T A
( AC )T C T AT
( A B )T AT BT
( A T ) 1 ( A1 )T

1.1.3. FUNCIONES Y MATRICES DEFINIDAS POSITIVAS

Valores y Vectores Propios.//TOMADO DE RAMON Y EJERCICIO PROPIO

Dada una matriz A de tamao (n x n), si existe un vector x de tamao (n x 1) y un


nmero tal que

Ax x o A I x 0 (****)

donde I es una matriz identidad de tamao (n x n) y 0 es un vector de tamao (n x 1),


entonces y x, son denominados respectivamente, valor y vector propio de la matriz A.

Pueden encontrarse hasta n valores propios y hay tantos vectores propios como valores
propios se encuentren. Los valores de deben satisfacer que el determinante de A I
sea 0. Los vectores propios se calculan despus de reemplazar los valores propios
encontrados en la expresin Ax x .

Ejemplo:

2 3
Sea A , el clculo de los vectores y valores propios se desarrolla como
4 5
sigue:

Se calcula a partir de la condicin A I 0

2 3 1 0
0
4 5 0 1

2 3 0
0
4 5 0

2 3
0
4 5
2 5 12 0
2 7 2 0

Al resolver la ecuacin se tienen dos valores para :

1 7,2749
2 -0,2749

Como ya se menciono para cada valor propio existe un vector propio, el cual se obtiene
reemplazando el valor propio correspondiente en la expresin (****) y usando la
condicin de que los respectivos vectores propios estn normalizados.

x1
Un vector x se dice que est normalizado si satisface que x12 x 22 1 .
x2
Teniendo en cuenta lo anterior se calculan los vectores propios de la siguiente forma:

A I x 0
2 3 x1 0

4 5 x2 0

2 x1 3x2 0

4 x1 5 x2 0

2 x1 3x2 0
4 x1 5 x2 0

Restando las dos ecuaciones anteriores y factorizando, obtenemos:

x1 2 4 x2 5 3 0
x1 6 x2 8 0

x2 8
x1
6

Cuando 1 se tiene x1 0,56873 x2

Considerando la restriccin de que los vectores estn normalizados se obtiene:

x12 0,56873 1 x12


2

2
Despejando x1
0,56873
2

x2

1 0,56873 2
1

x1 0, 49437

Ahora calculando x2 se tiene:

x1 0, 49437
x2 0,86925
0,56873 0,56873

Con esto se construye el vector propio asociado a 1 de la siguiente forma:

x1 0, 49437

x2 0,86925

Realizando el mismo procedimiento para 2 se obtiene que el vector propio asociado:

x1 0, 79681

x2 0, 60423

En resumen dada la matriz del ejemplo entonces se puede comprobar que para el primer
valor y vector propio se tiene:

2 3 7, 2749 0
0, 49437 0

4 5 0 0,86925
7, 2749 0

y para el segundo valor y vector propio:

2 3 0, 2749 0 0, 79681
0

4 5 0 0, 2749
0, 60423
0

Ecuacin cuadrtica y forma cuadrtica// GROSSMAN..OPTIMIZACION NO


LINEAL Y DINAMICA. HECTOR MANUEL MORA ESCOBAR. FACULTAD DE
CIENCIAS. DEPARTAMENTO DE MATEMTICAS. UNIVERSIDAD NACIONAL
DE BOGOTA. 2001.

Una ecuacin cuadrtica en dos variables con trminos no lineales es una ecuacin de la
forma ax 2 bxy cy 2 d . Una forma cuadrtica en dos variables es una expresin de la
forma F ( x, y ) ax 2 bxy cy 2 , donde a b c 0 .
x
Considrese la forma cuadrtica F ( x, y ) x 2 4 xy 3 y 2 . Sea v y
y
1 2
A . Entonces
2 3
1 2 x x x 2y x
Av v
2 3 y y 2x 3y y

( x 2 2 xy ) (2 xy 3 y 2 ) x 2 4 xy 3 y 2 F ( x, y )

De esta manera hemos representado la forma cuadrtica F ( x, y ) , por la matriz


simtrica A . As que una ecuacin o forma cuadrtica puede ser expresada como:

Av v d o Av v F ( x, y )

Definicin: Se dice que una forma cuadrtica F ( x) F ( x1 , x2 , ; xn ) es definida


positiva si F ( x) 0 para todo x n y F ( x) 0 si y solo si x 0 .
F es definida positiva si y solo si la matriz simtrica A tiene valores caractersticos
propios.

Definicin: Se dice que una forma cuadrtica F (x ) es semidefinida positiva si


F ( x ) 0 para todo x n . F es semidefinida positiva si y solo si los valores
caractersticos de la matriz simtrica asociada con F son todos no negativos.

Matrices definidas positivas

Definicin: Una matriz A real, simtrica (obviamente cuadrada) es definida positiva (o


positivamente definida) si:
xT Ax 0 para todo x 0

En trminos de sumatorias se tiene que para una matriz simtrica A

n n 1 n
xT Ax aii xi2 2 a xx ij i j
i 1 i 1 j i 1

Definicin: Una submatriz principal de A es la obtenida al quitar de A algunas (o


ninguna) filas y exactamente esas columnas correspondientes. Una submatriz
estrictamente principal Ak es la obtenida al quitar de A las filas y columnas
k 1, k 2,K , n con 1 k n , es decir, las n submatrices estrictamente principales de a
son:
a11 a12 a13
a11 a12
A1 a11 A2 A3 a21 a22 a23 K , An A
a
21 a 22 a
31 a32 a33

Definicin: El determinante de una submatriz principal se llama un subdetermianante


principal; el determinante de una submatriz estrictamente principal se llama un
subdeterminante estrictamente principal. Los n subdetermianantes estrictamente
principales son:
a11 a12
1 det a11 a11 , 2 det ,K , n det A
a21 a22

En ejemplos pequeos, es relativamente fcil aplicar directamente la definicin para


saber si una matriz simtrica es definida positiva. Para ejemplos grandes, no solo se
vuelve difcil, sino casi imposible. La siguiente proposicin da condiciones necesarias y
suficientes para la caracterizacin de matrices definidas positivas.

Proposicin: (Condiciones necesarias y suficientes)Dada una matriz A simtrica las


siguientes siete afirmaciones son equivalentes:

1. A es definida positiva;
2. todos los i , valores propios de A (reales por ser simtrica), son positivos;
3. todos los i , subdeterminanates estrictamente principales, son positivos;
k
4. todos los pivotes akk , en el mtodo de eliminacin de Gauss sin permutacin son
positivos;
5. existe una matriz U triangular superior invertible tal que A U T U (esta es la
factorizacin de Cholesky);
6. existe una matriz W invertible tal que A W T W ;
7. todos los subdetermianates positivos son positivos.

Proposicin: (Condiciones necesarias) Si A es una matriz simtrica definida positiva


entonces:

1. aii 0 para todo i;


2. aij aii a jj para todo i j ;
2

3. max aii max aij , es decir, max aij es un elemento diagonal;


i i, j i, j

4. 2 aij aii a jj para todo i j .

Definicin: Una matriz es de diagonal estrictamente dominante por filas si:


i j 1
aij aii para todo i

Una matriz es de diagonal estrictamente dominante por columnas si:


i j 1
aij a jj para todo j

Una matriz es de diagonal estrictamente dominante si es de diagonal estrictamente


dominante por columnas y de diagonal estrictamente dominante por filas.
Es obvio que para matrices simtricas las tres definiciones anteriores coinciden.

Proposicin: (Condiciones suficientes)Si A es una matriz simtrica, de diagonal


estrictamente dominante y positiva, entonces es definida positiva.
Matrices semidefinidas positivas

Definicin: Una matriz A real, simtrica (obviamente cuadrada) es semidefinida


positiva o definida no negativa si:

xT Ax 0 para todo x

Es evidente que toda matriz definida positiva es semidefinida positiva.


Algunas veces, se agrega a la definicin de matrices semidefinidas positivas la
existencia de un x no nulo tal que xT Ax 0 . Segn esta otra definicin una matriz
definida positiva no sera semidefinida positiva.

Proposicin: Dada una matriz A simtrica las siguientes siete afirmaciones son
equivalentes:

1. A es semidefinida positiva;
2. todos los i , valores propios de A son no negativos;
3. i 0 para todo i y para cualquier reordenamiento simtrico de filas y de
columnas, es decir, para cualquier permutacin de las filas y de las columnas
correspondientes;
k
4. los pivotes akk , en el mtodo de eliminacin de Gauss posiblemente con
permutaciones simtricas, son todos no negativos;
5. existe una matriz U triangular superior, posiblemente no invertible, tal que
A U TU ;
6. existe una matriz W , posiblemente no invertible, tal que A W T W ;
7. todos los subdetermianates principales son no negativos.

Observacin: El sptimo criterio es un caso particular del tercer criterio pero ms fcil
de aplicar.

Es claro que las caracterizaciones para las matrices definidas positivas son ms fuertes
que las caracterizaciones para las matrices semidefinidas positivas.

Proposicin: (Condiciones necesarias) Si A es una matriz simtrica semidefinida


positiva entonces:

1. aii 0 para todo i;


2. aij aii a jj para todo i, j ;
2

3. max aii max aij , es decir, max aij es un elemento diagonal;


4. 2 aij aii a jj para todo i, j .
5. aii 0 Ai 0, Ai 0 ;
6. i 0 para todo i.

Definicin: Una matriz A simtrica es definida negativa si A es definida positiva. Una


matriz A simtrica es semidefinida negativa si A es semidefinida positiva. Una matriz
A simtrica es indefinida sino es ni semidefinida positiva ni semidefinida negativa, o lo
que es lo mismo, si existen x, y tales que x Ax y Ay 0 , o tambin, si tiene por lo
T T

menos un valor propio positivo y por lo menos un valor propio negativo.

Los conceptos de matrices y funciones definidas positivas y semidefinidas positiva


sern de gran utilidad cuando se estudie el capitulo xxxx (formas permitidas del
semivariograma) y el capitulo xxxx (Cokriging).

1.2. CONCEPTOS DE ESTADSTICA//TOMADO DE NOTASCLASTS

1.2.1. ESTADSTICA DESCRIPTIVA

Considere que se toma una muestra de los robos registrados en un periodo de tiempo
determinado, para 50 municipios y los resultados obtenidos se encuentran relacionados
en la tabla xx.

Municipios Robos Municipios Robos Municipios Robos Municipios Robos Municipios Robos
registrados registrados registrados registrados registrados
1 1881,9 11 3920,4 21 2311,3 31 3008,6 41 1704,4
2 3369,8 12 2599,6 22 3159 32 2782 42 1776,5
3 4467,4 13 2828,5 23 2559,3 33 2037,8 43 2988,7
4 1862,1 14 2498,7 24 1239,9 34 1843 44 3004,6
5 3499,8 15 2685,1 25 2424,2 35 2696,8 45 2201
6 3903,2 16 2739,3 26 2773,2 36 2228,1 46 2521,2
7 2620,7 17 1662,1 27 2316,1 37 3506,1 47 3386,9
8 3678,4 18 2469,9 28 4212,6 38 1624,1 48 1341,7
9 3840,5 19 2350,7 29 2343,9 39 2844,1 49 2614,2
10 2170,2 20 3177,7 30 2774,5 40 2342,4 50 2772,2

Tabla xx. Robos registrados en 50 municipios.

La descripcin que se realiza a continuacin abarca la definicin de algunas medidas y


herramientas bsicas de la estadstica descriptiva, as como una aplicacin dada en
funcin de los datos de la tabla xx.

MEDIDAS DE POSICION Y DE VARIABILIDAD

Medidas de posicin o medidas de tendencia central

Definicin: La media aritmtica representa el centro fsico del conjunto de datos y se


define como la suma de los valores observados, dividido por el total de observaciones.

Si X 1 , X 2 ,K , X n son n observaciones numricas, entonces la media aritmtica de estas


n observaciones, se define como:
n

X1 X 2 L X n
Xi
X i 1

n n
La media de los robos registrados en la tabla xx estara dada por:

1881,9 3369,8 4467, 4 L 2772, 2


X Robos 2671, 288
50

Definicin: La mediana de un conjunto de observaciones es el valor para el cual,


cuando todas las observaciones se ordenan de manera creciente, la mitad de stas es
menor que este valor y la otra mitad mayor.

Sea X 1 , X 2 ,K , X n una muestra aleatoria de n observaciones, la mediana de estos datos


se denota y se define de la siguiente manera:

X n 1
si n es u nmero impar

2


X% X X
n n
2



2
1

si n es un nmero par
2

En el caso de los robos, despus de ordenar la muestra ascendentemente y observar que


el nmero de datos que constituye la muestra es par , se tiene que la mediana esta dada
por:

X X

50

50
1 X 25 X 26 2614,2 2620,7
X% 2 2
2617, 45
2 2 2

Definicin: La moda de un conjunto de observaciones se define como el valor que se da


.
con mayor frecuencia. La moda se denota por X

En el caso de la tabla xx la muestra no tiene moda, pues el nmero de robos ocurridos


en los 50 municipios es diferente para cada una de ellas.

Medidas de posicin relativa

Definicin: Los cuartiles de un conjunto de observaciones ordenadas son aquellos


nmeros que dividen a stas en cuatro partes porcentualmente iguales.

Hay tres cuartiles, Q1, Q2, Q3. El segundo cuartil Q2, es precisamente la mediana. El
primer cuartil Q1, es el valor en el cual o por debajo del cual queda un cuarto (25%) de
todos los valores de la sucesin (ordenada); el tercer cuartil Q3 es el valor por debajo del
cual quedan las tres cuartas partes (75%) de los datos.

Definicin: Los valores que dividen los datos en diez partes iguales se llaman decles y
se representan por D1 , D2 , , D9 . Los valores que dividen los datos en cien partes
iguales se llaman percentiles y se representan por P1 , P2 , , P99 . El quinto decil y
el quincuagsimo percentil se corresponden con la mediana. Los percentiles P25 y
P75 se corresponden con el primer y tercer cuartil. En general todas estas medidas
reciben el nombre de cuantiles.

MEDIDAS DE DISPERSION O VARIABILIDAD

Definicin: La Varianza es la distancia o diferencia exacta, en promedio y al cuadrado


entre los valores de la variable y su respectivo promedio aritmtico.

Su formula matemtica para el caso de datos referentes a una muestra es:

(x
i 1
i X) 2
2
n

para series simples o sin frecuencias.

Definicin: La Desviacin Estndar se define como la raz cuadrada de la varianza,


esto es,

(X i X) 2
i 1

Definicin El Rango Intercuatilico, es la distancia entre los cuartiles superior e inferior


y se define como:

f s Q 13 Q 3 Q 1

MEDIDAS QUE INCLUYEN LA MEDIA Y LA DESVIACION ESTANDAR

Definicin El Coeficiente de Variacin se denota y se define como:

S
CV 100%
X

El coeficiente de variacin es una medida que se emplea fundamentalmente para:

Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas


de unidades de medida. Por ejemplo, kilogramos y centmetros.
Comparar la variabilidad entre dos grupos de datos obtenidos por dos o ms
personas distintas.
Comparar dos grupos de datos que tienen distinta media.
Determinar si cierta media es consistente con cierta varianza.

MEDIDAS DE FORMA

Definicin El Coeficiente de Sesgo es un nmero que mediante su signo podemos


determinar si los datos (la curva) tienen distribucin simtrica o sesgada.
El coeficiente de sesgo para datos agrupados, se define como:

f (X i i X) 3
C.S i 1

nS 3

El coeficiente de sesgo se interpreta como:

Si C.S = 0, entonces los datos (la curva) se comportan de manera simtrica.


Si C.S > 0, entonces los datos (la curva) son sesgados a la derecha.
Si C.S < 0, entonces los datos (la curva) son sesgados a la izquierda.

Definicin El Coeficiente de Curtosis es un nmero cuya magnitud nos indica si los


datos se distribuyen simtricamente de forma normal (curva mesocrtica), ms
empinados que la curva normal (curva leptocrtica) o ms aplanados que la curva
normal (curva plasticrtica).

El coeficiente de curtosis para datos agrupados se define como:

f (X i i X) 4
C.C i 1

nS 4

El coeficiente de curtosis se interpreta de la siguiente manera:

Si C.C = 3, entonces los datos (la curva) presentan forma de una normal
estandarizada.
Si C.C > 3, entonces los datos se presentan ms empinados que los de una
normal estandarizada.
Si C.C < 3, entonces los datos se presentan ms aplanados que los de la normal.

1.2.2. GRAFICOS EXPLORATORIOS: REPRESENTACIN DE LA


DISTRIBUCIN DE UNA VARIABLE.// TOMADO DE ESTADSTICA PARA
QUMICA. MARTA GARCIA BEN CD ECONOMETRIA 2006

Histograma

Es una representacin grfica de una tabla de distribucin de frecuencias, en otras


palabras muestra la distribucin de una variable numrica.

En el histograma el rea de cada rectngulo representa el nmero, o el porcentaje, de


datos en cada intervalo. Por ello si los intervalos son de diferente longitud, no es la
altura sino el rea la que tiene que representar el nmero, o el porcentaje de casos. Si se
hace que la altura represente el nmero de casos, el grfico dara una impresin
engaosa.
En un histograma siempre se deben examinar con detalle algunos aspectos dentro de los
que se encuentran:

1. Los valores mximos y mnimos


2. El intervalo o intervalos ms frecuentes
3. Simetra o asimetra.
4. Si la muestra tiene el rendimiento de una distribucin (aproximadamente)
simtrica.

Grfico xx. Histograma de robos. Salida Statgraphics.

Diagramas de tallo y hojas

Girando el diagrama esta representacin tiene la misma forma que el histograma, pero
adems estn todos los datos originales.

Para construir este diagrama se seleccionan los primeros (uno, dos o ms ) dgitos y esos
dgitos se llaman tallos. Los dgitos de la derecha se llaman hojas. En cada fila del
diagrama se pone un tallo y a su lado todas las hojas. Para decidir si tomar como
tallos uno, dos o ms dgitos, se puede tener en cuenta, al igual que para el histograma,
en general se recomienda tomar entre 5 y 20 tallos. Este diagrama es un competidor
del histograma. Para muestras grandes es un poco confuso, el histograma es ms simple.

Los nmeros que estn a la izquierda del grfico se llaman profundidad y van
contando el nmero de datos desde el principio y desde el final y se anota el menor de
esos dos nmeros. En la lnea del centro se anota la cantidad de datos de esa lnea
entre parntesis. Esto es til para calcular a mano la mediana y los cuartiles.
Grfico xx. Diagrama de Tallo y Hoja de robos. Salida JMP 5.1.

Diagramas de caja y bigotes o Box plot

Es otro grfico propuesto por uno de los estadsticos ms prestigiosos del siglo XX:
John Tukey en su libro Exploratory Data Analysis, 1977. Es una representacin grfica
de cinco nmeros: mnimo, primer cuartil, mediana, tercer cuartil y mximo. Adems se
representan como puntos separados los datos atpicos (outliers).

Grfico xx. Grfico de Caja y Bigotes. Salida Statgraphics.

Estos box plots se usan poco. El histograma da ms informacin que este grfico sobre
la distribucin de una variable numrica en dos o ms poblaciones.

Grficos de dispersin (Scatter Plot)

Para estudiar la relacin entre dos variables numricas se usa el grfico de dispersin
que es simplemente representar el valor de una de las dos variables en el eje de las
abcisas y el de la otra en el eje de las ordenadas.

1.2.3. INFERENCIA ESTADSTICA


Lo que se llama inferencia estadisticaes un razonamiento que consiste en inducir
propiedades de la poblacin (formas distribucionales, valor de parmetros, verdad o no
de hiptesis) a partir de ciertas informaciones de tal forma que la verdad de tales
propiedades venga dad con un cierto grado de confianza.

1.3. CONCEPTOS DE PROBABILIDAD//CUADERNO DE PROBABILIDAD

1.3.1. VARIABLE ALEATORIA

Definicin: Sea S un espacio muestral sobre el que se encuentra definida una funcin de
probabilidad, sea X una funcin de valor real definida sobre S de manera que
transforme los resultados de S en puntos sobre la recta de los reales, se dice entonces
que X es una variable aleatoria, porque involucra todos los puntos del espacio muestral.

S : X ( )

Ejemplo: Experimento Lanzamiento de una moneda 1 vez

S cara, sello

X (cara) 0
X ( sello) 1

X = Nmero de sellos obtenidos en el lanzamiento de la moneda.

Definicin: Se dice que X es una variable aleatoria discreta si el nmero de valores que
puede tomar es contable, adems si estos pueden arreglarse en una secuencia que puede
asociarse con los enteros positivos. Se dice que X es una variable aleatoria continua si
sus valores consisten en uno o ms intervalos de la recta de los .

Definicin: La funcin de distribucin acumulativa de la variable aleatoria X es la


probabilidad de que X sea menor o igual a un valor especfico de x y va a estar dado
por:

FX ( x) P( X x) P( x )
xi x
i

Definicin: Sea X 1 , X 2 ,K , X n variables aleatorias n- dimensionales, la funcin de


densidad conjunta de las variables aleatorias, se define como:

f X 1 , X 2 ,K , X n P X 1 x1 , X 2 x2 ,K , X n xn x1 , x2 ,K , xn de X 1 , X 2 , K , X n
x1 , x2 ,K , xn
0 en otro caso

para variables aleatorias discretas, y


F ( X1 , X 2 ,K , X n )
x1 , x2 ,K , xn P X 1 x1 , X 2 x2 ,K , X n xn
x1 x2 xn

K dt1 dt2 K dtn X 1 , X 2 , K , X n


f ( t1 , t 2 , K , t n ) n
X1 , X 2 ,K , X n
- - -

para variables continuas, donde f es una funcin integrable y se cumple que


f : n R 0, .

VALOR ESPERADO, VARIANZA, COVARIANZA Y CORRELACION DE UNA


VARIABLE ALEATORIA

Definicin: Si X es una variable aleatoria, el valor esperado de la variable aleatoria X,


est dado por:


xf x X discreta
E X
x

xf x dx X continua

Definicin: Si X es una variable aleatoria, la varianza de la variable aleatoria X est


definida como:


x 2 f x X discreta
V( X ) 2
E X 2
x

x f x dx
2
X continua

En general la varianza suele expresarse como sigue:

V ( X ) E ( X E ( X )) 2
E ( X 2 2 XE ( X ) ( E ( X )) 2 )
E ( X 2 ) 2 E ( X )( E ( X )) ( E ( X )) 2

E ( E ( X ))

E ( X ) 2( E ( X )) 2 ( E ( X )) 2
2

E ( X 2 ) ( E ( X )) 2

La raz cuadrada de la varianza se denomina desviacin estndar y se denota por .

Definicin: Si X y Y son variables aleatorias, la covarianza entre X y Y, denotada por


Cov ( X , Y ) , se define como:

E X X Y Y E XY XY Y X X Y E XY E X E Y

donde X y Y representan los valores esperados de X y Y respectivamente.

Nota:
Se dice que X y Y son independientes si Cov ( X , Y ) 0 , pero que Cov ( X , Y ) 0 no
implica que haya independencia entre variables.

Para las variables X y Y se tiene que Cov ( X , Y ) Cov(Y , X ) .


La covarianza puede tomar valores negativos, pero la varianza siempre deber ser
positiva.

Definicin: Si la covarianza de X y Y se divide por el producto de las desviaciones


estndar de X y Y, el resultado es una cantidad sin dimensiones que recibe el nombre de
coeficiente de correlacin y se denota por X ,Y .

Cov X ,Y
X ,Y
XY

Sean X y Y variables aleatorias entonces X y Y se dicen no correlacionadas si:

E ( XY ) E ( X ) E (Y )

Propiedades del valor esperado

Sean X y Y dos variables aleatorias, a y b constantes reales y f y h dos funciones reales,


entonces se tienen las siguientes propiedades para el valor esperado:

Si P ( x 0) 1 y E ( X ) existe entonces E ( X ) 0 .
E (a ) a
E ( af ( x ) bh ( x )) aE ( f ( x )) bE ( h( x ))
Si f ( x ) h( x) entonces E ( f ( x)) E ( h( x))
E ( X Y ) E ( X ) E (Y )
E (aX ) aE ( X )
E (aX b) aE ( X ) b

Definicin y propiedades del valor esperado de una Matriz Estocstica (aleatoria).

Dada A aij con i 1, 2,K , n y j 1, 2,K , m una matriz estocstica, se define la


funcin esperanza de A como:

E A E aij
Sean A y B matrices estocsticas, , y matrices constantes y sea un escalar, todo
definido de tal forma que las siguientes operaciones se puedan realizar.

E A B E A E B
E A E A

Propiedades de la varianza
Si X y Y son variables aleatorias reales con varianza finita se tienen las siguientes
propiedades para la varianza:

Si E X E Y , entonces
1
2
2 1
2
1
E X Y V X V Y Cov X , Y .
2
V (a ) 0

Demostracin: V (a) E (a E (a))2 0


a
V (aX ) a 2V ( X )
Demostracin: V (aX ) E (aX E (aX )) 2
E ( aX aE ( X ))2
E ( a ( X E ( X )))2
E ( a 2 ( X E ( X ))2 )
a 2 E ( X E ( X )) 2
a 2V ( X )

V ( a bX ) b 2V ( X )
V (a bX ) E a bX E (a bX )
2
Demostracin:
E a bX a bE ( X )
2

E b( X E ( X ))
2

b 2 E ( X E ( X )) 2
b 2V ( X )
V ( X b) V ( X )
V ( X ) Cov ( X , X )
Si V ( X Y ) entonces V ( X Y ) V ( X ) V (Y ) Cov( X , Y ) , esto dado
que las variables no son independientes.
V aX bY a 2V X b 2V Y 2Cov X , Y


1
1 1

Si E X E Y , entonces E X Y V X V Y Cov X , Y .
2
2

2 2

En general con n-variables aleatorias:

Sean X 1 , X 2 , , X n n-variables aleatorias, entonces:


n

V ( X 1 X 2 X n ) V ( X 1 ) V ( X 2 ) V ( X n ) 2 Cov ( X i , X j )
i j 1
n n
V ( X ) 2 Cov( X , X
i 1
i
i j 1
i j )

n n
Cov( X , X
i j 1
i j ) 2 Cov ( X i , X j )
i j 1

n
V ( a1 X 1 a1 X 2 a1 X n ) V (a1 X 1 ) V (a2 X 2 ) V (an X n ) 2 Cov (ai X i , a j X j )
i j 1
n n
V (a X ) 2 Cov(a X , a
i 1
i i
i j 1
i i j X j)

n n

ai V ( X i ) 2 ai a j Cov( X i , X j )
2

i 1 i j 1
n n

ai Cov( X i , X j ) 2 ai a jCov( X i , X j )
2

i j 1 i j 1

Si X 1 , X 2 , , X n son independientes entonces:


n
V ( X1 X 2 X n ) V ( X i )
i 1

n
n n
V

a X
i 1
i i ai a j Cov ( X i , X j )
i 1 j 1

Propiedades de la covarianza

Cov ( aX b), Y aCov X , Y

Definicin y propiedades de la matriz de Covarianza de un Vector Estocstico


(aleatorio)

Dado un vector aleatorio Y y1 , y2 ,K , yn con media 1 , 2 ,K , n , se define


T T

la matriz de varianza covarianza de la siguiente forma:


Var Y E Y Y
T

Como propiedades se tienen:

V A V A T
V A 2V A

Propiedades de la correlacin

Sean X y Y dos variables aleatorias, a , b, c y d constantes reales, entonces se tienen las


siguientes propiedades para la correlacin:

1 1
( X , Y ) (Y , X )
( X , X ) 1, ( X , X ) 1
( aX b, cY d ) ( X , Y )

1.3.2. FUNCION GENERADORA DE MOMENTOS (F. G. M.)


Definicin: Sea X una variable regionalizada el r-esimo momento de x es denotado
por r ' EX r

Definicin: Sea X una variable regionalizada el r-simo momento central de x


alrededor de EX se define como r E ( X EX ) r siempre y cuando la variable
aleatoria exista. Entonces:

0 1

1 E ( X EX )) EX EX 0

2 E ( X EX ) 2 2 V ( X )

La F. G. M. denotada por M X (t ) E (etX )

Si la funcin generadora de momentos de la variable aleatoria existe y es diferenciable


en alguna vecindad del origen, se tiene que para todo r se satisface:

d r ( M X (t ))
dt r
EX r Momento de orden r
t 0

y por la definicin dada de valor esperado se tendr entonces que:


x P( X x )
r
k k X discreta
EX r k

x r f X x dx X continua

Ejemplo: Lanzar un dado y registrar el resultado.

S 1,2,3,4,5,6

Se define una variable aleatoria como X =Resultado obtenido.

X 1 2 3 4 5 6
Funcin de densidad f X (x ) P( X x ) 1/6 1/6 1/6 1/6 1/6 1/6
Funcin de distribucin FX (x ) P ( X x ) 1/6 2/6 3/6 4/6 5/6 1

Cuando se calcula el valor esperado para la variable aleatoria se tiene:

1 1 1 1 1 1
EX 1 2 3 4 5 6
6 6 6 6 6 6

1 2 3 4 5 6 21

6 6
Ahora cuando se calcula el momento de orden 1 a partir de la F. G. M. se obtiene el
siguiente resultado, dado que la variable aleatoria es discreta:


x P( X k xk ) X discreta
EX k

xf X x dx X continua

M X (t ) E (etX ) etX k P( X xk )
k

d ( M X (t )) 1 1 1 1 1 1
e1t e 2t e3t e 4t e5t e6t
dt t 0 6 6 6 6 6 6

1 1t
( e e 2 t e 3t e 4 t e 5 t e 6 t )
6 t 0

1 21
(1 2 3 4 5 6)
6 6

Estos resultados permiten comprobar que el primer momento de una variable aleatoria
coincide con su valor esperado, as como el segundo momento coincide con la varianza
de la variable aleatoria.

1.4. CONCEPTOS DE ECONOMETRA

Modelo lineal

El modelo lineal se puede expresar de la forma:

y t 0 1 x t et t=1,2,...,n (1)

donde t es nmero de observaciones en el modelo.

Partes del modelo de regresin:

Las partes del modelo planteado en la ecuacin (1) son:

Yt: Variable dependiente o explicada.


Xt: Variables independiente o explicativa.
0, 1: Parmetros
et: Error del modelo, perturbacin, este trmino lleva todo aquello que no podemos
explicar de Y usando X.

Supuestos del modelo:

Todos los supuestos son acerca de los errores et.


E(et)=0
E(et2)=2. (2)
E(etes)=0.
et Normal (los errores tienen distribucin normal).

El ltimo supuesto se hace con el propsito de realizar inferencia.

El anlisis de regresin simple es una herramienta para la descripcin y evaluacin de la


relacin entre una variable dependiente o explicada (Y) y una variable independiente (X)
(explicativa), cuando se usa este modelo, se esta pensando en que se puede tener el
valor de X y con este se puede estimar el valor de Y, usando el modelo lineal de
regresin.

En el siguiente grfico, veamos que es lo que estamos ajustando. El ajuste que estamos
realizando lo muestra el siguiente grfico

Y
y t o 1 xt et

Observaciones

Diferencia:
Errores (et)
y t o 1 xt

Grafico xx.

De acuerdo a los supuestos y observando este grfico lo que se desea es que la


diferencia (el error), entre el modelo de regresin lineal (la recta) y las observaciones
sea cero, se tenga varianza constante, que los errores sean independientes y que estos
errores giren alrededor de cero de acuerdo a una distribucin normal.
Modelo visto en Forma Matricial.

Escribindolo el modelo de la expresin (1) en forma matricial cada una de la


observaciones, se llega a la siguiente expresin:

y1 0 1 x1 e1

y 2 0 1 x 2 e2
(3)

y x e
n 0 1 n n

Lo anterior es equivalente:

y1 1 x1 e1

y2 1 x2 0 e
2 (4)
1

y 1 x n e
n n

y finalmente (4) se puede expresar como:

Y X e

Donde, Y y e son vectores de tamao nx1 y X es una matriz de tamao nx 2 .

Los supuestos dados en el modelo (2), observacin por observacin, se convierten, para
el modelo en forma matricial, en:

E(e)=0 nx1
E(ee)=2I. (5)
e Multinormal (el vector de errores tienen distribucin multinormal).

Donde I es la matriz identidad de tamao nxn .

Nota: E(ee) = 2I es la matriz de varianza de los errores.

As se tiene el modelo lineal de regresin:

Y = X + e con e MN(0nx1, 2I) (6)

Estimacin de los Parmetros.

La estimacin de parmetros se puede realiza convencionalmente por dos mtodos uno


de ellos mnimos cuadrados ordinarios y el otro el mtodo de mxima verosimilitud. A
continuacin se ilustra el desarrollo por el primer mtodo.

Mtodo de Mnimos Cuadrados


La filosofa de los MCO, es hallar un estimador de , tal que el tamao de los errores
sea mnimo, es decir, minimizar los residuales.

Trabajo con Matrices

El criterio de desea et 1 0, lo cual se logra si se hace et2 0, y para minimizar todos


n
los errores al mismo tiempo basta minimizar e
i 1
i
2
(al minimizar la suma estamos
minimizando cada una de sus componentes, que es el objetivo).

Ahora,
e1

n
e2
e i
2
e1 e2 en et e (7)
i 1

e
n

De (6) se tiene que e Y X , as

e t e ( Y X )t ( Y X )

Dados Y y X fijos, hallar , bajo la filosofa de MCO se convierte en:

Minimizar e t e Minimizar f() Minimizar ( Y X ) ( Y X ) .


t

Este un problema de clculo diferencial vectorial.

e t e ( Y t Y t X t Y Y t X t X t X )


( 2 X Y t X t X )
t t

=

= 2 X Y 2 X X
t t

Si suponemos que existe , tal que es punto crtico de f(), entonces:

e t e
2 X t Y 2 X t X 0 (8)

2et e
De aqu ( X t X ) 1 X t Y . Pero Cmo saber que es un mnimo?. 2 2 X X que
t


2
es una matriz definida positiva, por lo tanto se ha hallado un mnimo .

Conclusin: El estimador de MCO para el vector esta dado por:


( X t X )1 X t Y . (9)

1
Lase cercano a cero
2
Bibliografa: Matrix Differential Calculus with Applications in Statistical Econometrics; Magnus, J.
John Wiley, New York, 1988.
Trabajo con Sumas (observacin por observacin)

De la ecuacin (8) se llega a las ecuaciones normales (E.N.).

X tY
X t X (10)

Con

1 x1 y1
1


1 x2 y2
X , Y , .

2

1 xn yn

Reemplazando en (10), se obtiene:

n n
n 0 1 x i y i
i1 i1
n n 2 n
0xi 1xi iyx i
i1 i1 i1
son tal que cumplen con las ecuaciones normales:
Es decir, 0 y 1

n n
n 0 1 xi y i (11a)
i 1 i 1
n n n
0 xi 1 xi2 xi yi (11b)
i 1 i 1 i 1
n
Lo que se har a continuacin es hallar 0 y
que minimizan
1 ei2 usando
i 1
derivadas parciales, y mostrar que cumplen con las ecuaciones normales (11a) y (11b), y
por lo tanto son los mismos. Este trabajo, adems aporta el entender lo que nos estn
diciendo los estimadores 0 y
.
1

n n
ei2 ( yi 0 xi 1 )2 f ( 0 , 1 )
i 1 i 1

Hallemos el mnimo para f(0,1).

n
( y i 0 xi 1 ) 2 n
i 1
2( y i 0 xi 1 )
0 i 1

Igualando a cero se obtiene

n n
n 0 1 xi y i
i 1 i 1

De igual forma derivando con respecto a 1, e igualando a cero se llega a (11b), lo cual
se deja como ejercicio al lector.

De las ecuaciones (11a) y (11b), se tiene que los estimadores en forma de sumas son:

Despejando 0 de (11a), 0 y 1 x , reemplazando en (11b) y despejando 1 se


obtiene.
n n
xi y i n y x ( xi x )( yi y ) S xy
1 i 1
n
i 1
n

S xx
xi2 n x ( xi x ) 2
2

i 1 i 1

En la ecuacin (9), se supone que XtX es no singular.

Propiedades de los Estimadores

Insesgados: Qu es insesgamiento?....

Veamos si los estimadores de 0, y 1 son insesgados, pero antes debe entenderse que el
insesgamento de los estimadores de 0 y 1 implica que su valor esperado es el
parmetro poblacional.

es insesgado se debe cumplir que E 1 1


Si 1

E 1 E
x y n x y
i i

x n x i
2 2

1 n yi

x n x 2 2 E
i 1
xi yi n x
n

i
1 n
nx

x n x 2 2
xi E yi
n
E yi
i i 1
1 n
x 2 n x 2
xi 0 1 xi x 0 1 xi
i i 1
1 n n n

x 2 n x 2 0 1 i 1 xi
xi x 2
xn 0 x
i i 1 i 1 i 1

1 n 2

x n x
2 2 1
i 1
xi nx 2

i

n

1

x nx
i 1
i
2 2


x n x i
2 2

Para 0 :

E ( 0 ) 0
E y 1 x
n

E( y ) i
i 1
xE ( 1 )
n
n
1 xi
n
0 i 1
1 x
n n
0

Consistencia.

Una segunda propiedad de inters acerca de cualquier estimador de un parmetro es la


consistencia, propiedad que es: a medida que aumenta el tamao de la muestra la
distribucin del estimador tiende a concentrarse alrededor del verdadero parmetro
poblacional.

Definicin: considrese un problema en donde se selecciona una muestra aleatoria de


una distribucin con parmetro . Se dice que es consistente si
converge en
probabilidad a . Grficamente:

Grafico xx.

Volviendo al modelo de regresin, los estimadores 0 y son estimadores


1

consistentes, lo cual significa que a medida que aumenta el tamao de la muestra, su


varianza sea hace menor.

Mnima varianza

Los estimadores 0 y son los estimadores de mnima varianza dentro de los


1

estimadores lineales insesgados, lo cual es bueno porque mejora la calidad de las


predicciones.

Prediccin

Si se necesita realizar prediccin (o estimacin) usando el modelo de regresin lineal


simple, basta conocer xp, aplicar la ecuacin

y p 0 1 x p

Para obtener una prediccin o estimacin de yp, p indica el perodo para el cual se desea
calcular el valor.

Normalidad de los datos

En el caso particular de la econometra la no normalidad en especial en los residuos trae


consecuencias como el que las inferencias no son vlidas ya que las funciones para
estimar los parmetros del modelo y para realizar prediccin, a las cuales se llegan para
establecer intervalos de confianza y realizar prueba de hiptesis, se basan en el supuesto
de normalidad en los errores.

En geoestadstica no ser de mayor preocupacin el hecho de que los residuos no se


distribuyan normalmente, sin embargo en la etapa de anlisis exploratorio de datos es
importante establecer si los datos siguen una distribucin normal y de no ser as se
deber solucionar este inconveniente, de ah que se dedique un espacio en este capitulo
para recordar las formas de deteccin y las soluciones que se dan al problema de no
normalidad.

Formas de deteccin de no normalidad

Para detectar no - normalidad, en general se usan contrastes de hiptesis, donde la


hiptesis nula es que se tiene normalidad, y la alterna es que este supuesto no se cumple.

Aqu se presentarn dos contrastes de hiptesis para probar el supuesto de normalidad,


los contrastes de Jarque Bera y de Kolmogorov Smirnov.

Contraste de Jarque Bera.

El contraste de Jarque - Bera utiliza las dos principales caractersticas de la distribucin


normal, como es la simetra y el apuntamiento, usando estas dos caractersticas se
determinara si se esta en presencia de una distribucin normal de los datos o no.

Planteamiento de hiptesis:

Para esto sea Fn(w) la distribucin de los datos, w1,...,wt, a los cuales se les quiere aplicar
esta prueba, en el caso del modelo de regresin lineal (modelos economtricos
especficamente) son los residuales, en el caso geoestadstico sern los datos
muestreados.

Ho: Fn(w) = N(0,02).


Ha: Fn(w) N(0,02).

Estadstica de Prueba:

n ( k 1) 2 1 2
S K 3
6 4

Donde n: nmero de observaciones, (k+1): nmero de parmetros del modelo, S y K:


son los coeficientes de asimetra y de apuntamiento (kurtosis) de Fn(x) estimados.
Bajo la hiptesis nula ~ ( 2 ) , esta se rechaza si ( 2 ,1 ) .
2 2

Coeficiente de Apuntamiento K (kurtosis): Mide el grado de apuntamiento de una


distribucin, tericamente es el cuarto momento de una distribucin alrededor de la
media.
4
1 n wi w
K
n i 1

El valor de la kurtosis para una distribucin normal es 3.

Coeficiente de Asimetra S: Mide la simetra de una distribucin alrededor de la media.


Es el tercer momento de una distribucin alrededor de la media.
3
1 n w w
S i
n i 1

El coeficiente de asimetra para una distribucin simtrica, como es el caso de la


normal, es cero.

Si se vuelve a la primera ecuacin, se puede observar que el contraste de J-B, mide las
distancias entre los coeficientes de simetra y kurtosis de la distribucin de los datos y
los de la distribucin normal. Si la distribucin es cercana a la normal estas diferencias
van a ser pequeas, de lo contrario el valor de tau ser grande. As se rechaza para
valores grandes del estadstico de prueba.

Contraste de Kolmorov Smirnov (K-S).

El contraste de K-S, es una prueba no paramtrica, sirve para contrastar la hiptesis:

Ho: Fn(w) = F(w).


Ha: Fn(w) F(w).

Donde Fn(w) es la distribucin muestral, w1,...,wn son los valores observados, a los
cuales se les quiere aplicar esta prueba y F(w) es cualquier distribucin terica con la
cual se desea contrastar la distribucin muestral.
La metodologa para usar esta prueba es la siguiente:

Ordene los valores observados w1,...,wn, sea w(1),...,w(n) la muestra ordenada.


Sea Fn(w(i))=i/n, es decir la funcin de distribucin muestral en w(i), es igual al nmero
de valores observados menores o iguales a w(i). Fn(.) asigna a cada observacin una
probabilidad igual a 1/n.
Usando la funcin de distribucin terica calcule F(w(1)),F(w(2)),..., F(w(n)).
Calcule la distancia ms grande en la funcin muestral y la terica:

Dn Max1i n | Fn ( w(i ) ) F ( w( i ) ) |

Por la ley de los grandes nmeros, Lim n Fn ( x) F ( x) , as si la muestra proviene de


una poblacin con distribucin F(.), es decir bajo H0, Dn 0, o su valor tender a crecer
cuanto ms lejana este la distribucin de los datos de la terica.

El estadstico de prueba esta dado por:

H(t)=n1/2Dn.

La distribucin de esta funcin se puede ver encontrar en los libros de estadstica bsica.

Ejemplo. Los datos observados son:

-0.055, 0.268, 0.645, 1.445, -1.115, -0.914, 0.974, 0.771, 0.093, -1.935

La hiptesis que se plantea es


Ho: Fn(w) = N(0;1,11).
Ha: Fn(w) N(0;1,11).
Se tiene:

Datos Ord. -1.935 -1.115 -0.914 -0.055 0.093 0.268 0.645 0.771 0.974 1.445
Fn(.) 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 1
F(.) 0.033 0.114 0.192 0.479 0.535 0.601 0.730 0.768 0.823 0.915
| Fn(.)-F(.)| 0.067 0.056 0.108 0.079 0.035 0.001 0.030 0.032 0.077 0.085

Otras pruebas para contrastar normalidad: Shapiro Wild, y los grficos P-P
(Probability Plot).

Existen pruebas para contrastar independencia y normalidad a la vez como es la prueba


de Mcleod Li.

Soluciones al problema de no normalidad

Escalera de transformacin de Tukey

Cuando se construye un histograma con los datos que no siguen una distribucin
normal, se aprecia ya sea una asimetra a izquierda (sesgo a derecha) (Ver figura 0.a) o
una simetra a derecha (sesgo a izquierda) (Ver figura 0.b).
Cuando se tiene claridad sobre la existencia de alguno de estos dos casos se puede
emplear la escalera de transformacin de Tukey

2.0
1.5
1.0
0.5
0
-0.5
-1.0
-1.5
-2.0

Grafica. Xx. Escalera de transformacin de Tukey

Debe ser claro que los datos de la muestra se encuentran elevados a la potencia 1, es
decir 1 es el punto de asiento, as que lo que busca esta transformacin es encontrar una
potencia diferente a 1 para ser aplicada a la muestra y as corregir la no normalidad.

Grfica xx. Sesgos


El criterio para realizar la transformacin consiste en bajar escalera cuando se tenga
una asimetra a izquierda, lo que implica que se debe realizar la transformacin con
potencias menores a 1 siendo 0.5, -0.5, -1.0, -1.5 y -2 las potencias sugeridas por el
mtodo, cuando se tenga una asimetra de derecha se debe subir escalera, es decir, se
transformara con potencias mayores a 1 (Ver figura ant). La seleccin de la potencia se
realiza mediante prueba y error y cuando se tenga una vez se seleccione, se le aplica a
cada uno de los datos de la muestra inicial.

Transformacin de Box Cox.

El objetivo de esta transformacin es homogeneizar la varianza, en la mayora de casos


al cumplirse este objetivo se esta corrigiendo de una vez el problema de no normalidad.

Esta transformacin tiene como supuesto que la varianza es una funcin de la media,
t2=f(t), por lo tanto la metodologa tiene como objetivo es buscar un valor para tal
que t/t1-=constante.

La transformacin se har sobre la variable dependiente en el caso de un modelo


economtrico y en geoestadstica se realizar sobre los datos obtenidos del muestreo,
con la forma:

Y si 0
T ( )
ln Y si 0

Metodologa:

Se dividen las n observaciones en H grupos, cada uno con igual nmero observaciones
contiguas. Ejemplo: si se tiene 125 observaciones y se quiere 7 grupos cada uno tendr
17 observaciones (125/7=17) y se dejan por fuera las 6 ltimas o primeras
observaciones.
Cada grupo tendr (n - h)/H observaciones, donde h el nmero de observaciones que se
dejan por fuera.
En cada grupo se calcula la media y la desviacin estndar. As se tiene:
{ s1 , y1 },{ s 2 , y 2 },...,{ s H , y H }

Calculo para cada


Potencia () .

Grupo 1 0 .5 0 0.5 1
1 s1 / y12 s1 / y11.5 s1 / y1 s1 / y10.5 s1
2 s1 / y 22 s1 / y 21.5 s1 / y 2 s1 / y10.5 s2
. . . . . .
. . . . . .
. . . . . .
H s1 / y H2 s1 / y 1H.5 s1 / y H s1 / y H0.5 sH
_______________________________________________________
Coeficiente CV(-1) CV(-0.5) CV(0) CV(0.5) CV(1)
CV(.) = Coeficiente de Variacin = D.S ()/().

1
i 1 ( S i / yi1 )
H
()=
H

Si / y ( )
H
2
D .S ( ) 1
i /( H 1 ) .
i 1

El 0 que se escoge para realizar la transformacin, es aquel con menor coeficiente de


variacin.

1.5. CONCEPTOS SERIES DE TIEMPO

Los procesos estocsticos y las series de tiempo

Definicin: Un proceso estocstico es una familia de variables aleatorias {Xt, tT},


definidas en un espacio de probabilidad (,F,P). T es el conjunto de ndices.
Cuando se habla de {Xt, tT} se esta pensando que {Xt(w), tT}, donde w pertenece a
un espacio muestral. Ahora para todo t fijo Xt(w) es una variable aleatoria, y para w
dado, Xt(w) es una funcin del tiempo llamada realizacin o funcin muestral.

Definicin: Una Serie en el Tiempo es una sucesin de observaciones de un fenmeno


en el tiempo. Se asocia a un proceso estocstico.

Componentes de un modelo de Descomposicin Clsica.

Considrese una serie constituida dela siguiente forma:

Yt Tt C t S t Z t

Donde: Yt: es la variable de inters, Tt es la Tendencia, Ct es el Ciclo, St es la


Estacionalidad y Zt es el Componente Estocstica.

1. Estacionalidad: Es el efecto producido por cada uno de los meses, trimestres o


semestres en el proceso, esta concepcin parte de observar que en ciertos meses
del ao la serie a analizar presenta cadas (o subidas), producidas por el hecho
que en este mes(es), es necesario un gran abastecimiento. Ejemplo de lo anterior
son las ventas de juguetes que en el mes de diciembre presenta crecimientos
importantes. Es importante notar que si se tiene una serie observada anualmente
pensar en la componente estacional es NO vlido.

2. Ciclos: Son los efectos producidos por la coyuntura econmica, son


crecimientos inesperados por cambios en la economa imprevistos. La diferencia
entre estacionalidad y ciclo se centra en el hecho de que la estacionalidad es
regular, se puede predecir cuando va a suceder pues ocurre a intervalos de
tiempo fijo, mientras que los ciclos son totalmente impredecibles.

3. Tendencia: Es la componente que nos indica para donde va el proceso a largo


plazo. Para algunos autores la tendencia a largo plazo incluye los ciclos.

4. Componente Estocstica: Son aquellos cambios no explicados, es aquello que


no es explicado por las dems componentes, es una variacin aleatoria. Es
importante notar que en el modelo puede no presentarse la Tendencia, el ciclo, o
la componente estacional, pero siempre se tiene la componente estocstica.

ESTACIONARIEDAD

Una serie de tiempo es estacionaria si sus propiedades estadsticas y/o probabilsticas no


cambian con respecto al tiempo.

Si la funcin de distribucin conjunta de una serie de datos F ( x1 , x2 , , xn ) es igual a


la funcin de distribucin conjunta de los mismos datos F ( x1 , x2 , , xn ) , donde
es un rezago asociado al tiempo, se dice que la serie es estacionaria.
Se dice que hay estacionariedad de orden M si para cualquier N y rezago todos los
momentos conjuntos hasta de orden M de la serie x1 , x2 , , xn existen y son iguales
hasta los momentos conjuntos de orden M x1 , x2 , , xn .

Estacionariedad dbil y fuerte

Definicin: Se dice que un proceso es estacionario dbilmente si sus propiedades


estadsticas hasta de orden 2 son constantes a lo largo del tiempo o son independientes
del tiempo.

Definicin: Se dice que un proceso es estacionario fuertemente si esta definido como un


proceso gaussiano o se da una normalidad implcita y dicho proceso es estacionario
dbilmente.
40

30

20

10

0
0 5 10 15 20 25 30

-10

Grfica xx. Series de tiempo

Una serie que presente un comportamiento como el descrito en la grfica ** por la lnea
azul se dice que es una serie estacionaria en media. As mismo se dice que una serie
como la descrita por la lnea amarilla es no estacionaria pues la varianza no es
constante a lo largo del tiempo.

Si se quiere que una serie se vuelva estacionaria se debe tener en cuenta cual es el
momento que la esta convirtiendo en no estacionaria. Cuando se quiera volver
estacionaria en media se debe realizar una diferenciacin ( xt xt xt 1 ) y si el
problema se presenta con la varianza lo ms conveniente ser realizar una
transformacin Box Cox.

1.6. LOS SISTEMAS DE INFORMACIN GEOGRFICA

Naturaleza y propiedades de los datos geogrficos

Un dato geogrfico o espacial puede definirse como la observacin de una variable


asociada a una localizacin del espacio geogrfico3.

Los datos geogrficos tienen asociada una serie de caractersticas o propiedades que los
diferencian de los datos no espaciales.

1. Posicin absoluta: Es la ubicacin del elemento con respecto a un sistema de


referencia, lo que permite conocer coordenadas exactas e invariantes del
elemento.
2. Posicin relativa: Hace referencia a la ubicacin del elemento con respecto a
otros elementos espaciales. En esta propiedad se enmarcan relaciones espaciales
entre los objetos como la adyacencia, contenencia, conectividad, etc.
3. Forma y geometra: Es la forma en que se representa el elemento espacial,
dicha representacin acostumbra realizarse por medio de puntos, lneas y
polgonos. Estas formas suelen llamarse primitivas geomtricas. Los puntos se
encuentran determinados por las coordenadas terrestres de latitud y longitud,
pudiendo corresponderse con individuos, empresas, ciudades, delitos cometidos
o accidentes acontecidos. Las lneas son objetos abiertos que cubren una
distancia dada y comunican varios puntos o nodos (dada la naturaleza esfrica de
la Tierra, las lneas son en realidad arcos). ste sera el caso de las lneas de
3
Anselin, 2001, MapInfo, 1995
transmisin telefnica, infraestructuras viarias, calles de una ciudad, etc.
Finalmente los polgonos son figuras planas conectadas por distintas lneas u
objetos cerrados que cubren un rea determinada, como es el caso de pases,
departamentos, secciones censales o reas comerciales.
4. Atributos: Informacin temtica asociada al elemento u objeto que permite
diferenciarlo de otros y describe al elemento.

Figura xx. Representacin de Objetos espaciales.

Los proceso de abstraccin del espacio son ms sencillos cuando se trata de objetos con
localizacin o fronteras claramente identificadas (edificios, carreteras o departamentos),
a diferencia de otros fenmenos que varan de forma continua, como la elevacin del
terreno, la temperatura del suelo o la densidad de la vegetacin. En estos casos, la
continuidad del fenmeno puede aproximarse mediante una muestra de puntos
situados en lugares representativos de la superficie que se desea registrar. En el caso de
fronteras identificables la representacin del objeto espacial puede variar de acuerdo a la
escala en la que se este realizando el estudio4. Por ejemplo si se desea realizar un trabajo
a nivel regional o nacional sobre la cobertura de infraestructura educativa sera
conveniente representar las escuelas y colegios de la zona como objetos puntuales,
mientras que si el estudio es con fines catastrales y se desea conocer el rea y linderos
de los predios pertenecientes a un municipio, las escuelas y colegios, as como los
dems inmuebles, sern representados con una geometra poligonal.

Los datos espaciales se caracterizan por su naturaleza georreferenciada, multidireccional


y multidimensional5.

La georreferenciacin pone de manifiesto que la posicin relativa (posicin de un objeto


espacial con respecto a otros objetos) o absoluta (posicin de un objeto espacial con
respecto a un marco de referencia) de cualquier elemento sobre el espacio contiene una
informacin valiosa, pues la localizacin debe considerarse explcitamente en cualquier
anlisis de datos espaciales.
La multidireccionalidad aflora en situaciones de dependencia o interaccin espacial, as
como en otros fenmenos como externalidades, efecto contagio, desbordamiento o
rplica. La primera ley de la geografa de Tobler (1979) indica que todo tiene que ver
con todo, pero las cosas cercanas estn ms relacionadas entre s que las cosas lejanas.

4
Coro Chasco..............
5
Coro Chasco Irigoyen. Aplicacin.................
La multidimensionalidad de las reas geogrficas significa que, en ellas, no es posible
distinguir entre pasado, presente, futuro, sino que todo es presente, todo es pasado y
todo es futuro.

Sistemas de Informacin Geogrfica (SIG)

En general un Sistema de Informacin Geogrfica se puede definir como un conjunto de


mtodos, herramientas y datos que estn diseados para actuar coordinada y
lgicamente en la captura, almacenamiento, anlisis, transformacin y presentacin de
toda la informacin geogrfica y de sus atributos con el fin de satisfacer mltiples
propsitos. Los SIG son una tecnologa que permite gestionar y analizar la informacin
espacial, que surgen como resultado de la necesidad de disponer rpidamente de
informacin para resolver problemas y contestar a preguntas de modo inmediato.

Los SIG hacen posible la visualizacin, exploracin, almacenamiento eficaz,


recuperacin rpida y visualizacin interactiva de las formas correspondientes a
conjuntos de datos geogrficos.

En la elaboracin de un SIG, se emplean dos mecanismos para representar la realidad a


travs de procesos de abstraccin: El modelo de datos vector y el modelo de datos
raster.

Modelo de datos vector

El modelo de datos vectoriales se caracteriza principalmente porque representa la


realidad a travs de puntos, lneas y polgonos permitiendo la asociacin de informacin
temtica a los elementos geogrficos. En general, la informacin se incorpora por medio
de coordenadas geogrficas (x,y) en un sistema plano o rectangular de coordenadas, de
forma que las formas o figuras de puntos se registran como localizaciones simples del
tipo (x,y), mientras que las formas lineales, incluyendo los contornos de los polgonos,
se recogen como series ordenadas de coordenadas (x,y). Este tipo de datos vectoriales
son muy apropiados para registrar la ubicacin de formas geogrficas discretas, con
localizaciones precisas, como calles, ros, permetros de un predio, postes telefnicos,
etc. Los datos vectoriales son altamente dependientes de la estructura de coordenadas
(x,y), por lo que la representacin grfica de los vectores tiene forma de segmentos de
lneas rectas, que pueden ser visualizados realizando una aproximacin sobre este tipo
de formas.

Modelo de datos raster

El modelo de datos raster, registra la informacin geogrfica en una posicin fila


columna dentro de una retcula regular o matriz organizada en filas y columnas, de
forma que cada celda contiene un nmero que representa una forma geogrfica
determinada. Este modelo se emplea con frecuencia para almacenar informacin sobre
formas geogrficas que varan de forma continua sobre una superficie. Los datos
procedentes de imgenes son un modo de datos raster en los que cada celda o pixel,
que es en las imgenes la unidad mnima de informacin, almacena un valor temtico
conocido como nivel digital y aparte tiene asociado otro tipo de informacin temtica.
Los datos raster dependen de la resolucin con la que se realizo la captura del
enmallado regular, as que al ser fijo el tamao de las celdas del enmallado, si se realiza
una aproximacin sobre los datos, se perdern detalles y lo que se observar finalmente
ser la forma de las celdas.

Figura xx. Ejemplo de datos raster y vectoriales

La utilizacin de un SIG, junto con el anlisis de datos y modelos espaciales, es cada


vez ms comn en los campos de la economa aplicada, poltica econmica, economa
urbana y medioambiental, y economa del desarrollo. La aplicacin de las herramientas
de anlisis espacial y SIG hace posible la obtencin y tratamiento estadstico-
economtrico de una gran variedad de datos geogrficos de diferentes escalas o mbitos
territoriales6 .

Subsistemas de un SIG

Subsistema de captura de datos


Subsistema de almacenamiento de datos
Subsistema de anlisis y modelamiento de datos
Subsistema de salida

Software para desarrollo de SIG

1.7. INTRODUCCIN AL MDULO DE GEOESTADSTICA EN ARCGIS

ArcGIS posee una extensin para realizar anlisis Geoestadstico que permite modelar
superficies a partir, tanto de mtodos determinsticos como mtodos del geoestadsticos.
//Completar para que sirve

Conocimientos previos

Generacin de base de datos desde Excel .

Cree en Excel una tabla que contenga la informacin sobre la cual realizar el trabajo y
gurdela cerciorndose de que la extensin de dicho archivo sea DBF 4 (Dbase 4).

6
Anselin, 1999.
Luego cierre el archivo que acabo de guardar e inicie una sesin de ArcCatalogo y
direccione la tabla que creo anteriormente.

Ahora inicie una sesin de ArcMap sin cerrar el ArcCatalogo. Seleccione la tabla en el
ArcCatalogo y arrstrela hasta la tabla de contenido (TOC View) de ArcMap
Paso seguido se adicionara la tabla y usted podr verificar que los datos se encuentran
en la tabla haciendo click derecho sobre la tabla y seleccionando la opcin open

Para desplegar la informacin como mapa de puntos puede seleccionar en el mismo


men la opcin Display XY Data; el resultado de esta operacin se indica en la
siguiente grfica.
Generacin de base de datos desde ArcCatalogo

Otro opcin para adicionar los datos consiste en generar la tabla desde el mismo
ArcCatalogo y llenarla desde ArcMap. Para esto, en ArcCatalogo, ubiquese en donde
desea generar la nueva tabla, en el men que aparece al hacer clic derecho sobre el
espacio seleccionado, escoja la opcin New y luego la opcin dBASE Table.

Con esto generara una nueva tabla que usted puede renombrar. A continuacin se
debern generar los campos que contendr la tabla; para esto haga un click derecho
sobre la nueva tabla y seleccione la opcin de properties.
En ese momento se desplegar el siguiente cuadro de dialogo en el que podr crear los
campos de la tabla accediendo a la pestaa Fields.

En Fields Name deber colocar el nombre del nuevo campo que desea crear y en Data
Type seleccionar el tipo de datos que contendr la columna. Luego debe clic en aplicar y
aceptar. Al revisar la pestaa de Preview encontrara que el programa ha generaron las
columnas que le indico.
Luego arrastre la tabla del ArcCatalogo a ArcMap.

Como se pudo apreciar en la vista de ArcCatalogo el programa creo las columnas pero
aun se encuentran sin informacin. As que para subir los datos debe activar el Editor de
ArcMap.
Una vez el programa se encuentre en modo de edicin, abra la tabla que subio de
ArcCatalogo y proceda a llenarla dato a dato.

Cuando trmine de realizar esta operacin vuelva al men de Editor para salvar los
cambios y detener el modo de edicin. Cuando verifique nuevamente la tabla,
encontrar todos los datos que ingreso.

Trabajando en el modulo de geoestadistica

Para trabajar en el modulo de anlisis Geoestadstico de ArcGIS debe iniciar una sesin
en ArcMap, paso seguido haga clic derecho sobre la zona libre o gris de la barra de
herramientas estndar y active la toolbar Geostatistical Analyst.
Figura xx.

Cuando despliegue el men de esta barra, encontrara que solo esta activo el anlisis
exploratorio de datos, para hacer uso de las dems funciones siga la ruta: Tools
Extensions, en la ventana que se desplegar seleccione nuevamente la opcin
Geostatistical Analyst.

Con esto tendr totalmente activas las herramientas de ArcGIS para anlisis
Geoestadstico.

Figura xx.

El modulo le permite al usuario realizar no solo la interpolacin de superficies a partir


de los resultados obtenidos con mtodos determinsticos y geoestadsticos sino que le
proporciona herramientas para realizar el anlisis exploratorio de datos espaciales.

El Explore Data le permite al usuario realizar anlisis de normalidad (Histogram,


Normal Q-Q Plot) y de tendencia(Trend Anlisis, Voronoi Map) de las variables con las
que se realizar el trabajo, aunque se recomienda realizar un anlisis ms detallado
empleando otros software estadsticos que generen diagramas de caja y bigotes para
detectar datos atpicos, o grficos de tallo y hoja, entre otros.
Por otro lado el Geoestatistical Wizard representa la aplicacin directa a la
determinacin de la estructura de correlacin espacial entre los datos y de los mtodos
de interpolacin, estos temas se trataran en detalle en captulos posteriores, sin embargo
en una primera aproximacin a la herramienta es importante que el lector identifique
algunos aspectos bsicos.

Figura xx.

La figura xx muestra la presentacin inicial del Geoestatistical Wizard. En principio el


software le pedir que seleccione el layer que contiene la informacin que desea
analizar, en el caso de la figura xx se selecciono una capa llamada ca_ozone_pts, que
viene en el ArcTutor del programa, adicional a esto se le pide que escoja el atributo
sobre el que realizar todo el proceso de interpolacin, en este caso se selecciono
OZONE, sobre esto se debe ser cuidadoso pues de no seleccionar el atributo correcto se
puede realizar el proceso sobre un atributo como el identificador de cada punto
muestreado o el tipo de dato, lo que no tendra sentido. En la parte inferior se muestran
los mtodos de interpolacin que maneja el software, as como una pequea descripcin
de cada uno; las cuatro primeras opciones son mtodos determinsticos y las dos ltimas
son probabilsticos o geoestadsticos.

EXPLICAR LO DE VALIDACIN Surface la prediccin y valoracin de resultados

Los detalles que se manejan en los siguientes cuadros de dialogo paso requiere antes la
exposicin de temas concernientes al desarrollo de este libro, por lo que en la medida en
que se trabaje cada tema se dedicar una seccin para realizar la descripcin del proceso
en el software.

Вам также может понравиться