Untitled

Tema 1: Inferencia Estadstica Introduccin Generalmente las poblaciones son demasiado grandes como para poder ser estudiada
s en su totalidad. Por lo tanto es necesario tomar de la misma, una muestra lo ms representativa posible de forma tal que pueda ser utilizada para sacar conclusi ones acerca de dicha poblacin. La Inferencia Estadstica es el proceso de anlisis que consiste en inferir (derivar , inducir) las propiedades de una poblacin en base a la caracterizacin de la muest ra. Este proceso constituye el objetivo primordial de la Estadstica. Dos de los objetivos ms importantes en Inferencia Estadstica son la estimacin por i ntervalos y la prueba de hiptesis. Conceptos Bsicos o Universo Estadstico. Conjunto de individuos o elementos (Personas, Fbricas , Familias, etc) se le denomina Universo Estadstico. o Poblacin. Coleccin de todas las posibles mediciones que se pueden hacer de una caracterstica de inters, se le denomina Poblacin Estadstica. Una poblacin entonc es esta constituida por datos o valores. o Parmetro. Medida descriptiva de una Poblacin. Es un valor fijo que caracte riza a una poblacin. o Estadstico. Funcin que describe las caractersticas de una muestra.
o Estimador Puntual. Funcin de la muestra aleatoria (estadstico) utilizada p ara aproximar el parmetro. Estadstico que cumple con ciertas propiedades que lo ca lifican como funcin apropiada para estimar el parmetro. o Distribucin muestral. Distribucin de Probabilidad de todos los valores pos ibles que puede tomar un estadstico. Lista de todos los posibles valores de un e stadstico y la probabilidad asociada con cada valor. o Error estndar de estimacin. Desviacin estndar de la distribucin muestral de u n estadstico. Raz cuadrada de la varianza en la distribucin del estadstico o Estimacin. Valor que toma un estadstico par una muestra en particular. Va lor numrico especfico del estimador. o Teorema Central del Limite. Si representa la media de una muestra de t amao n tomada de una poblacin con media y varianza , su valor esperado ser igual a la media poblacional y su varianza igual a . Al incrementarse el tamao de la muestra, la distribucin muestral de se aproxima a la distribucin normal, sin importar la forma de la distribucin de la poblacin. Esto es, si el tamao muestral e s lo suficientemente grande se cumple que
Distribuciones de Probabilidad Enunciaremos aqu un conjunto de distribuciones de probabilidad tiles en Inferenci a Estadstica.
o Distribucin Normal. Una variable aleatoria X sigue una distribucin normal si su funcin de probabilidad est dada por
Es la distribucin de probabilidad ms importante en estadstica, fundamentalmente por que muchas variables aleatorias siguen dicha distribucin. Caractersticas de la Distribucin Normal. o o o o Es de tipo continuo. Es simtrica. Su rango es el intervalo . Tiene dos parmetros, y .
o Distribucin Normal Estndar. Una variable aleatoria Z sigue una distribucin normal estndar si su funcin de probabilidad est dada por
Caractersticas de la Distribucin Normal Estndar. o o o o Es Es Su Su de tipo continuo. simtrica. rango es el intervalo . media es cero y su varianza 1.
o Distribucin Chi Cuadrado. Si son n variables aleatorias independientes e idnticamente distribuidas segn la normal estndar, entonces la variable aleatoria , sigue una distribucin Chi Cuadrado con n grados de libertad, lo que se denota
Caractersticas de la Distribucin Chi Cuadrado. o o o o o o o . Es de tipo continuo. Es asimtrica positiva. Su rango es el intervalo . Tiene un solo parmetro, sus grados de libertad. Su media es n y su varianza 2n. Para cada valor de n hay una distribucin Chi Cuadrado diferente. A medida que n crece, la distribucin Chi Cuadrado se aproxima a la normal
Aplicaciones de la Distribucin Chi Cuadrado. La distribucin Chi Cuadrado ser utilizada en esta oportunidad para hacer inferenci a acerca de la varianza poblacional y en la prueba de independencia. o Distribucin t de Student. Sean y , variables aleatorias independient es. La variable aleatoria sigue una distribucin t de Student con n grados de li bertad, lo que se denota
Caractersticas de la Distribucin t de Student. o o o Es de tipo continuo. Es simtrica. Su rango es el intervalo .
o o o o
Tiene un solo parmetro, sus grados de libertad. Su media es cero y su varianza . Para cada valor de n hay una distribucin t diferente. A medida que n crece, la distribucin t se aproxima a la normal.
Aplicaciones de la Distribucin t. En este curso la distribucin t ser utilizada para hacer inferencia estadstica acerc a de una y dos medias poblacionales. o Distribucin F de Snedecor. Sean y , variables aleatorias independien tes. La variable aleatoria sigue una distribucin F de Snedecor con n y m grado s de libertad, lo que se denota
Caractersticas de la Distribucin F de Snedecor. o o o o o o o Es de tipo continuo. Es asimtrica positiva. Su rango es el intervalo . Tiene dos parmetros, n y m. Su media es y su varianza . Para cada par de valores de n y m, hay una distribucin F diferente. A medida que n y m aumentan, la distribucin F se aproxima a la normal.
Aplicaciones de la Distribucin F. En este curso usaremos la distribucin F para hacer inferencia estadstica acerca de la diferencia entre varianzas poblacionales, la tcnica de anlisis de varianza e i nferencia estadstica en el modelo de regresin. Estimacin por Intervalos Esta forma de Inferencia Estadstica produce un intervalo de valores que tiene una probabilidad conocida de incluir el verdadero pero desconocido valor del parmetr o. El intervalo es conocido como intervalo confidencial o de confianza. Cualquie r intervalo confidencial esta asociado con un coeficiente confidencial, el cual da la probabilidad de que el intervalo contenga el parmetro. La estimacin por intervalos es una funcin del estimador puntual y de la distribucin de probabilidad asociada con el mismo. o Estimacin por intervalos para . Para obtener estimaciones por intervalo para la media poblacional debemos considerar los siguientes aspectos: Distribucin Poblacional (Normal, Otra) Conocimiento acerca de la varianza poblacional (Conocida, Desconocida) Tamao muestral ( ) Si la poblacin es normal y la varianza poblacional es conocida, el estadstico
sigue una distribucin normal con media 0 y varianza 1. Este estadstico da origen a la siguiente expresin
la cual constituye un intervalo de confianza del (1- )% para . Si el tamao muestral es mayor o igual que 30 y la varianza poblacional es descono cida, se tiene el mismo caso anterior, simplemente sustituyendo a por , su es timador puntual y cuya expresin esta dada por
Si la poblacin es normal, el tamao muestral es menor que 30 y la varianza poblacio nal es desconocida, la expresin
sigue una distribucin t con n-1 grados de libertad. Bajo estas condiciones, una estimacin por intervalos del (1- )% para , esta dada p or
Existen dos interpretaciones generalmente utilizadas de un intervalo de confianz a. 1. Se tiene un (1- )% de confianza de que el verdadero valor del parmetro este el intervalo obtenido. 2. Si se construyen todos los intervalos de confianza, el (1- )% de ellos c ontendrn el verdadero valor del parmetro. o Estimacin por intervalos para . Para obtener estimaciones por intervalo para la diferencia entre medias poblacionales debemos considerar los siguientes aspectos: Tipos de Muestras (Dependientes, Independientes) Distribuciones Poblacionales (Normales, Otras) Conocimiento acerca de la varianzas poblacionales (Conocidas, Desconocidas) Tamao muestral ( ) Si las poblaciones son normales, las varianzas poblacionales son conocidas y las muestras son independientes, el estadstico
sigue una distribucin normal con media 0 y varianza 1. Este estadstico da origen a la siguiente expresin
la cual constituye un intervalo de confianza del (1- )% para or
y donde
est dada p
Si los tamaos muestrales son mayores o iguales que 30, las varianzas poblacionale s son desconocidas y las muestras son independientes, se tiene el mismo caso ant erior, simplemente sustituyendo a por , su estimador puntual y cuya expresin e sta dada por
Ahora bien, si las poblaciones son normales, los tamaos muestrales menores que 30 y las varianzas poblacionales desconocidas, la expresin sigue una distribucin t con grados de libertad, donde las expresiones de y d ependern de la suposicin que se haga respecto de las varianzas. De esta forma se t iene que: o Bajo el supuesto de varianzas iguales, , se tiene que
o Bajo el supuesto de varianzas diferentes, , las expresiones de tn dadas por
es
En el caso de muestras dependientes o apareadas, el procedimiento consiste en c onstruir una nueva variable, la cual mide la diferencia entre los elementos de l as dos muestras, es decir, , donde y representan las observaciones correspo ndientes a las muestras 1 y 2 respectivamente. A se le considera una muestra d e tamao n tomada de una poblacin normal con media y varianza desconocida . De e sta forma se tiene que los estimadores puntuales de y estn dados por
Luego la variable aleatoria
sigue una distribucin t con n-1 grados de libertad. De aqu que la expresin
constituye un intervalo de confianza del Prueba de Hiptesis Estadstica
para .
Es la norma que permite probar una suposicin acerca del valor de un parmetro. La p rueba de hiptesis es una herramienta efectiva para obtener la informacin necesari a para reducir el nivel de incertidumbre en el proceso de toma de decisiones. Su propsito es determinar si el valor supuesto para un parmetro, debe considerarse valido en base a las evidencias mustrales. La suposicin hecha sobre el parmetro se denomina hiptesis nula (H0) y esta es proba da contra otra hiptesis, la cual establece lo contrario y recibe el nombre de hipt esis alternativa (H1). La hiptesis nula debe darse siempre en trminos de igualdad ya que la distribucin de l estadstico de prueba depende de esto. La hiptesis alternativa se adapta de acuer do a los objetivos del problema. En base a los datos mustrales, la hiptesis nula es RECHAZADA o NO RECHAZADA. NUNCA
SE PUEDE ACEPTAR LA HIPTESIS NULA COMO VERDADERA. No rechazar H0 quiere decir qu e no hay suficientes evidencias desde el punto de vista estadstico, para rechazar la. Al hacer una prueba de hiptesis, se supone que la hiptesis nula es verdadera, hasta que la evidencia muestral indique lo contrario. Pasos bsicos de una prueba de hiptesis 1. Formular la hiptesis nula y la hiptesis alternativa. 2. Especificar el nivel de significacin ( ). Probabilidad de rechazar H0 sien do verdadera. Debe fijarse antes de comenzar la prueba. 3. Establecer el estadstico de prueba. Funcin del estimador puntual, cuya dis tribucin es conocida. 4. Establecer la regin critica. Conjunto de valores del estadstico de prueba que permiten rechazar H0. Se debe establecer el valor o valores crticos. 5. Clculos. Evaluacin del estadstico de prueba en base a los resultados mustral es. 6. Toma de decisin y conclusiones. La toma de decisin es el procedimiento med iante el cual se rechaza o no, la hiptesis nula y las conclusiones son la descrip cin de la decisin tomada en trminos del problema. Tipos de error en las pruebas de hiptesis Cuando realizamos una prueba de hiptesis podemos cometer los siguientes tipos de errores: o Error tipo I. Es el error que se comete al rechazar H0 cuando es verdade ra. La probabilidad de cometer este tipo de error es , el nivel de significacin. o Error tipo II. Es el error en el que se incurre cuando no rechazamos H0 siendo falsa. Su probabilidad se simboliza como . 1- indica que tan bien trabaja e l test y se le conoce como la potencia del test. Tanto como deben ser pequeos
Es importante determinar los valores del nivel de significacin y del tamao de la m uestra mediante un anlisis cuidadoso del problema. o Prueba de hiptesis para . Igual que en el caso de la estimacin por interv alos, al realizar una prueba de hiptesis para la media poblacional, debemos consi derar la distribucin de la poblacin, el tamao muestral y el conocimiento o no de la varianza poblacional. De esta forma y siguiendo el procedimiento establecido a rriba, podemos establecer el mecanismo de prueba de una hiptesis sobre la media p oblacional. 1.
2. Fijar el nivel de significacin. Para fijar el nivel de significacin se deb e hacer un anlisis cuidadoso del problema. El nivel de significacin debe ser fijad o antes de realizar los clculos. 3. Estadstico de prueba. Existen dos posibles formas para el estadstico de pr ueba, dependiendo de aspectos arriba sealados y que deben ser considerados a la h ora de establecer el estadstico de prueba. Las dos posibilidades son:
; 4. Regin critica. La regin critica esta definida por la hiptesis alternativa . De esta forma se tienen tres tipos de test.
Test de dos colas Test de cola izquierda Test de cola derecha 5. ; La distribucin del estadstico de prueba se mantiene bajo la hiptesis nula cierta. 6. Toma de decisin y conclusiones. La toma de decisin depende del tipo de tes t que se tenga. Test de dos colas. Rechazo H0 si y solo si o ; o Test de cola derecha. Rechazo H0 si y solo si ; Test de cola izquierda. Rechazo H0 si y solo si ; o Prueba de hiptesis para . Caso: Muestras Independientes. Al realizar una estimacin por intervalos para la diferencia entre medias poblacionales, es neces ario caracterizar el problema. De la misma forma, al realizar una prueba de hipte sis para la diferencia entre medias poblacionales, debemos considerar las distri buciones de las poblaciones, los tamaos muestrales y el conocimiento o no de las varianzas poblacionales 1. Clculos.
2.
Fijar el nivel de significacin.
3. Estadstico de prueba. Existen las siguientes dos posibles formas para el estadstico de prueba: ; 4. Regin critica. La regin critica esta definida por la hiptesis alternativa . De esta forma se tienen tres tipos de test.
Test de dos colas
Test de cola izquierda Test de cola derecha 5. ; 6. Toma de decisin y conclusiones. La toma de decisin depende del tipo de tes t que se tenga. Test de dos colas. Rechazo H0 si y solo si o ; o Test de cola derecha. Rechazo H0 si y solo si ; Test de cola izquierda. Rechazo H0 si y solo si ; o Prueba de hiptesis para . Caso: Muestras Dependientes. Si se tiene el ca so de muestras dependientes, entonces el procedimientos es el siguiente: 1. Clculos.
2. 3.
Fijar el nivel de significacin. Estadstico de prueba.
4. Regin critica. La regin critica esta definida por la hiptesis alternativa . De esta forma se tienen tres tipos de test.
Test de dos colas Test de cola izquierda Test de cola derecha 5. Clculos.
6. Toma de decisin y conclusiones. La toma de decisin depende del tipo de tes t que se tenga. Test de dos colas. Rechazo H0 si y solo si o Test de cola derecha. Rechazo H0 si y solo si Test de cola izquierda. Rechazo H0 si y solo si
TEMA 2: Anlisis de Varianza 2.1. INTRODUCCIN Denominado tambin diseo de una forma o va de clasificacin. Es un diseo til para descri bir un experimento en el que se desean comparar k tratamientos (niveles de un fa ctor), donde las unidades experimentales son homogneas y los tratamientos son as ignados en forma completamente aleatoria a estas unidades experimentales. Supngase que tenemos N unidades experimentales homogneas y k tratamientos. Sean la s N unidades experimentales particionadas aleatoriamente (con igual probabilida d) en k conjuntos de tamao . Sean los k tratamientos asignados a los k conjunt os de forma tal que el j-simo tratamiento es aplicado a cada una de las unida des experimentales en el j-simo conjunto. Este procedimiento define un diseo com pletamente aleatorizado. Dentro de las ventajas del diseo completamente aleatorizado se encuentran: 1. Es completamente flexible. Puede usarse con cualquier nmero de tratamien tos y de rplicas. El nmero de replicaciones puede variar de tratamiento a tratamie nto, aunque esto no se debe hacer sin una buena razn, ya que si el diseo es balanc eado (el mismo nmero de rplicas por tratamiento), la prueba estadstica es relativ
amente insensible a pequeas violaciones del supuesto de igualdad de varianzas y por otro lado, la potencia del test esta maximizado si las muestras son de ig ual tamao. 2. El anlisis estadstico es fcil de llevar a cabo an si el diseo no es balancead o, si el error difiere de tratamiento a tratamiento y si los diversos tratamient os poseen varianzas distintas, lo cual se conoce como falta de homogeneidad (het erogeneidad) del error experimental. Bajo estas condiciones, las pruebas de hipt esis y la construccin del intervalo de confianza deben conducirse con un cuidado especial cuando hay heterogeneidad de la varianza. 3. La sencillez del anlisis no se pierde si algunas unidades experimentales o tratamientos enteros faltan o se descartan. En este tipo de diseo, la informac in que se pierde debido a observaciones faltantes es mnima con relacin a la sufrida por otros diseos. El nmero de grados de libertad para estimar el error experiment al es mximo, lo que incide en un aumento en la precisin del experimento. Esto res ulta significativamente importante en experimentos pequeos, es decir, en aquellos en los que se cuenta con pocos grados de libertad para el error experimental. Como la aleatorizacin no tiene restricciones, el error experimental incluye toda la variacin entre las unidades experimentales excepto, la debida a los tratamien tos. Esto representa la principal desventaja del diseo completamente aleatorizado , lo cual se traduce en ineficiencia. En muchas situaciones es posible agrupar l as unidades experimentales de modo que la variacin entre las unidades de un mi smo grupo sea menor que la variacin entre las unidades de diferentes grupos. Cie rtos diseos sacan ventaja de tal agrupamiento, ya que excluyen la variacin del e rror experimental entre grupos y aumentan la precisin del experimento. A pesar de lo expuesto anteriormente, la aleatorizacin completa resulta ser el pr ocedimiento obvio en muchos tipos de experimentos de laboratorio, en los que un a cantidad de material est completamente mezclada y luego se divide en porcione s pequeas para formar las unidades experimentales a los cuales se asignan los tr atamientos en forma aleatoria o, en experimentos con animales y plantas con con diciones ambientales muy parecidas. Ejemplo Supongamos que deseamos analizar el tiempo de coagulacin para muestras de sangre tomadas de animales sometidos a cuatro diferentes drogas A, B, C y D. Las drogas fueron aplicadas aleatoriamente a los animales. Queremos entonces, medir el efe cto de las drogas sobre el tiempo de coagulacin. 2.2. EL MODELO La respuesta observada para cada tratamiento es una variable aleatoria y puede ser expresada como la suma de tres componentes, a saber: Un componente comn Un componente que mide el efecto de tratamientos (efecto de tratamiento) Un componente que representa al error aleatorio (trmino de error aleatorio) El elemento comn es un valor constante presente en todas las observaciones. Todas las observaciones tienen una cantidad que puede ser diferente de tratamiento a tratamiento, el efecto de tratamiento. El error es una cantidad aleatoria que no puede predecirse con anticipacin, pero cuyo valor esperado es igual a cero. El modelo matemtico apropiado para describir las observaciones, est dada por: ; i = 1,2,...,nj , j = 1,2,...,k (1)
donde: : es la i-sima observacin bajo el j-simo tratamiento : es el componente comn denominado media general : es el efecto debido al j-simo tratamientos : es el error aleatorio en la i-sima observacin bajo el tratamiento j El principal objetivo es el de probar la hiptesis de que todos los tratamientos t ienen igual media. El procedimiento estadstico que debe conducirse para probar es ta hiptesis es el anlisis de varianza de una va. Este mtodo requiere de los siguient es supuestos: 1. 2. ante Los errores son estadsticamente independientes. Los errores estn normalmente distribuidos con media cero y varianza const 2
El modelo estadstico propuesto en (1), describe dos situaciones diferentes con r especto al efecto de los tratamientos. Los k tratamientos pueden ser escogidos a criterio o conveniencia del invest igador. En esta situacin, se desea probar hiptesis sobre las medias de los trata mientos, y las conclusiones solamente pueden ser aplicadas a los niveles del fac tor (tratamientos) considerados en el anlisis. Este modelo es llamado modelo de e fectos fijos. Si los k tratamientos constituyen una muestra aleatoria de la poblacin de trata mientos, las conclusiones pueden extenderse a la poblacin de tratamientos. Aqu lo s j son consideradas variables aleatorias. En este caso, las hiptesis sern acerca de la variabilidad de los j. Este modelo es llamado modelo de efectos aleatori os o modelo de componentes de varianza. El modelo matemtico para el caso de efectos aleatorios tiene la misma forma que e l modelo de efectos fijos dado en (1) con los supuestos: 1. Los errores son estadsticamente independientes. 2. Los errores estn normalmente distribuidos con media cero y varianza const ante 2 3. Los efectos de tratamientos j son variables aleatorias distribuidas norma lmente con media cero y varianza . 4. Los errores y los efectos de tratamientos son independientes. En la tabla 1, se comparan los modelos de efectos fijos y el de efectos aleatori os. TABLA 1 MODELOS DE EFECTOS FIJOS Y EFECTOS ALEATORIOS EFECTOS FIJOS EFECTOS ALEATORIOS es una constante fija es una variable aleatoria N Ho : = 0 j=1,2,...,k Ho : = 0
Tpicamente los datos en el diseo completamente aleatorizado, se presentan de la si guiente manera: TABLA 2 TRATAMIENTOS j=1 Y1,1 . Yn1,1 Y1,2 . Yn2,2 Y1,3 . Yn3,3 ... ... ... Y1j . Ynj,j ... ... ... Y1,k-1 . Yn(k-1),k-1 . Ynk,k Total Y.,1 Tamao muestral Media muestral
j=2
j=3
...
...
j=k-1
j=k
Y1,k Y.,2 n1 Y.,3 n2 ... n3 Y.,j ... nj Y.,k-1 Y.,k nk-1
nk
2.2.1. MODELO DE EFECTOS FIJOS Consideremos una distribucin normal con media igual a y varianza igual a 2. Adems , supongamos que esta poblacin puede ser dividida en k grupos o tratamientos. El j-simo tratamiento corresponde a una poblacin con distribucin normal con media .j y varianza 2. Supongamos que existe un factor para el cual se consideran tres tra tamientos en la cual Yi1, Yi2, Yi3 son las i-simas observaciones de los tratam ientos poblacionales j = 1, 2, 3. Esto hace posible expresar Yij como la suma de una constante ms una variable. Esto es: (2) donde ij es el error contenido en Yij Si comparamos las ecuaciones (1) y (2), podemos observar que el efecto del j-sim o tratamiento est definido como: (3) De esta manera, no habr efecto de tratamiento cuando Nuestro inters entonces, es probar H0: .1= .2=...= .1 - = .2 - = .3 - = 0.
H1: .i Por otra parte,
.j s
para al menos un par (i , j) i j n1=...=nk=n
Luego, sustituyendo la ecuacin (3) en la ecuacin (2) y suponiendo que n1=...=nk=n, es posible reformular el modelo de Anlisis de Varianzas (ANDEVA) de efectos fijo s como se indica a continuacin: i=1,2,...,nj , j=1,2,...,k (4)
La ecuacin (3) permite plantear la hiptesis en trminos de los efectos de tratamient os j de la siguiente manera: H0: H1: 1= 2=...= k=0 j 0 para al menos un j
En el desarrollo analtico del ANDEVA se necesita calcular: a. b. c. d. e. El El El La La gran total total para el tratamiento j nmero de observaciones gran media media del tratamiento j
De la ecuacin (4) se sabe que: luego (5) pero de la ecuacin (2) se tiene que: (6) y de la ecuacin (3) se sabe que:
Sustituyendo en (5) las expresiones obtenidas en (3) y (6), se tiene que la des viacin total quedara descompuesta de la siguiente manera: (7) Estas expresiones deben establecerse en funciones basadas en los datos aportados por la Tabla 2 (datos mustrales). De esta forma:
Luego elevando ambos lados al cuadrado y sumando en i y en j:
De aqu que:
Lo que representa,
Esta ltima ecuacin es la ecuacin fundamental del Anlisis de Varianza. SCT : se puede usar como una medida de la variabilidad total de los datos; si se divide la SCT por el nmero apropiado de grados de libertad (en este caso, N-1), se tendra la varianza muestral de los ys. La varianza muestral es, por supuesto, u na medida estndar de variabilidad. SCTr: mide en cuanto difieren las medias de los tratamientos unas a otras. SCE: mide la variacin dentro de cada uno de los tratamientos. En base a estos estadsticos, se obtienen dos estadsticos adicionales, usualmente l lamados Medias Cuadrticas o Cuadrados Medios y resultan de dividir cada suma de cuadrados por su correspondiente grados de libertad. Cuadrado medio de tratamientos y, Cuadrado medio de error Los valores esperados de estos cuadrados medios estn dados por:
Observemos que s H0: j = 0 j, es verdadera, E(CMTr)= 2. Esto es, en este caso se ti enen dos estimadores insesgados e independientes de 2, el CMTr y el CME. Ahora bien, sabemos que . Adems, puede demostrarse que 2(N-1) (8)
Si H0 es verdadera, y de acuerdo al teorema de Cochran es posible definir dos estadsticos chi-cuadrados independientes 2(k-1) 2(N-k) Por lo tanto, (9) (10)
(11) sigue una distribucin F con (K-1) y (N-k) grados de libertad. Estos resultados pueden ser resumidos bajo el formato general de la tabla de ANLI SIS DE VARIANZA, como se muestra en la tabla 3. Las frmulas de clculo estn dadas por: (12)
(13) y por definicin: SCE =SCT SCTr (14) TABLA 3 Tabla de Anlisis de Varianza Diseo Completamente Aleatorizado Fuente de Variacin g.l. Sumas de Cuadrados F Entre Tratamientos k-1 SCTr CMTr Dentro de Tratamientos N-k Variacin Total N-1 SCT Rechazamos s y solo s: , o El p-value es la probabilidad de los valores de la distribucin F superiores a F 0. 2.3. ESTIMACIN DE LOS PARMETROS EN EL MODELO DE EFECTOS FIJOS De acuerdo al modelo (1), debemos estimar a y a . Bajo este modelo, (caso n o balanceado), o , (caso balanceado). El mtodo de mnimos cuadrados ser utilizado para obtener los estimadores arriba menc ionados. Este mtodo no requiere de ningn supuesto distribucional. Para encontrar los estimadores mnimos cuadrados de y j, formamos la suma de cuadrados del error: (22) Usando la ecuacin (1) se tiene que: SCE CME
Cuadrados Medios
luego (23) Debemos obtener valores de y j , digamos y que minimizan a Q. Los valores apropiados son la solucin de las k+1 ecuaciones simultneas: (24) j = 1, 2, ...,k De (25) se tiene que: (25)
. . .
(26)
+ Obsrvese que la primera ecuacin de (26) puede expresarse como la suma de las otras k ecuaciones. Esto implica que no hay una solucin nica para , 1, 2,..., k. Existen varios mtodos que permiten superar esta dificultad. Si hacemos uso de la restriccin , se obtienen soluciones nicas para y (j =1...,k). y 7) La restriccin implica que los efectos de los tratamientos son estimados en for ma nica como desviaciones de su media. Cualquier funcin de los parmetros del modelo que sea una combinacin lineal del lad o izquierdo de las ecuaciones normales (Ec. 26) es una funcin estimable. La media del j-simo tratamiento es: j=1,2,...,k (2
Un estimador puntual de
podra ser:
Bajo el supuesto de que los errores estn normalmente distribuidos en forma indepe ndiente, se cumple que cada NID( j, 2/n), y usando el CME como un estimador de 2, u n intervalo de confianza del 100(1- )% sobre el promedio del j-simo tratamiento, .j , esta dado por: o si (28)
De la misma forma, un intervalo del 100(1- )% de confianza para la diferencia pr omedio de dos tratamientos, digamos , sera: o 2.4. si (29)
COMPARACIN DE MEDIAS DE TRATAMIENTO INDIVIDUALES
En algunas investigaciones, sus objetivos o la naturaleza propia del problema in dican que debe someterse a prueba la significacin de determinados tratamientos o de una combinacin de los mismos. Esto es, existen situaciones en las que los tra tamiento bajo investigacin tienen alguna relacin lo cual incide en que unas compar aciones son de ms inters que otras. A esto nos referimos como comparaciones a prio ri o, preplaneadas. Ahora bien, si una vez realizado el experimento y analizada la informacin, rechaz amos la hiptesis nula, significa que por lo menos una de las medias de los trata mientos es diferente del resto o, que al menos un efecto de tratamiento difiere significativamente de cero. Sin embargo, el rechazar la hiptesis nula no ofrece
ninguna informacin que permita dar respuesta a la siguiente interrogante; uales medias difieren?
Cul o c
En esta seccin se van a desarrollar procedimientos que permiten en ambas situacio nes, probar la significacin de algunas comparaciones entre los efectos de tratam ientos. Estos procedimientos son: a. Contrastes Ortogonales: permiten probar si un conjunto de combinaciones lineales independientes de medias difieren significativamente de cero. Procedim iento apropiado para probar la significacin de comparaciones a priori. b. Mtodo de Scheffe: permite comparar cualquiera y todos los posibles contra stes entre medias de tratamientos. c. Diferencia Mnima Significativa (DMS), Test de Rango de Tuckey, Test de R ango Mltiples de Duncan y Test de Rangos Studentizados de Newman-Keuls, permiten comparar todos los pares de medias de tratamientos. d. Mtodo de Dunnetts: permite comparar tratamientos contra un control.
a. CONTRASTES ORTOGONALES Un contraste es simplemente una combinacin lineal de medias poblacionales, la forma .j, de
tal que
y donde cj son nmeros reales.
C puede ser expresado tambin en trminos de efectos de tratamientos. Esto es,
Los contrastes pueden ser clasificados en contrastes a priori y contrastes a pos teriori. Si los contrastes es establecen de acuerdo a los objetivos de la invest igacin y a la estructura de los tratamientos, entonces se denomina contrastes a priori. Muchas hiptesis de inters son contrastes y en particular, las hiptesis de comparaci ones de efectos de tratamientos o medias de tratamientos lo son. Si deseamos po r ejemplo, probar la hiptesis para , es claro que la misma puede expresarse en forma equivalente como Obsrvese que en esta ltima expresin estamos probando la s ignificacin estadstica del contraste
donde ,
y vs.
Por lo tanto, probar la hiptesis arriba planteada es equivalente a probar . Obsrvese que un estimador para C est dado:
donde las medias poblacionales son reemplazadas por las medias mustrales. Asumiendo que las medias mustrales de tratamientos son estadsticamente independie ntes y normalmente distribuidas con medias .j y varianzas 2/nj j=1,2,...,k; ent
onces
sigue una distribucin normal con parmetros: y
Por otro lado, la variable aleatoria , dada por
sigue una distribucin normal con media igual a cero y varianza igual a 1 Bajo la hiptesis N(0;1) Por lo tanto, se tiene que,
De esta forma, la expresin
constituye un intervalo de confianza del para C. Si el intervalo contiene el cero, se concluye que C es estadsticamente igual a ce ro. Podemos indicar que rechazamos cuando Por otro lado, podemos establecer que
sigue una distribucin F con 1 y N-k grados de libertad. Usando esta ecuacin, recha zamos cuando De aqu podemos indicar que: (32) La cantidad representa la suma de cuadrados asociada con el contraste , lo cual se denota po r . En la prctica es comn contar con ms de un contraste de inters. Si cada contraste res ponde a una interrogante diferente, decimos que los mismos son ortogonales y el procedimiento anterior puede ser utilizado para probar la significacin estadstica de los mismos. Dos contrastes, digamos y se dice que son ortogonales (estadsticamente independientes) si: (33) Si se tienen k tratamientos, entonces se puede construir una infinidad de conjun tos de k-1 contrastes mutuamente ortogonales. Puede demostrarse adems que bajo l a hiptesis nula j,: y , definidas como:
Lo que implica que: (34) El l-simo trmino de la sumatoria de la ecuacin (34) representa la suma de cuadrados asociados al contraste ci. Su valor esperado est dado por (35) Bajo cierta se tiene que:
Suponga que despus de calcular el estadstico F la hiptesis nula es rechazada. Se pu ede ahora, usando los resultados obtenidos arriba, probar si el rechazo de H0 es debido a un contraste en particular. Esto es, podemos ahora verificar la hipte sis:
calculando el estadstico F como: F(1;N-k) donde . Lo anteriormente expuesto puede ser incorporado en la tabla de anlisis de varianz a como se muestra en la tabla 5. Tabla 5. Tabla de Anlisis de varianza para el Diseo Completamente aleatorizado incorporando la prueba de los Contrastes Ortogonales. Fuente de Variacin g.l. Suma de Cuadrados F Entre tratamientos k-1
Cuadrados Medios
Error
N-k
Total
N-1
b. METODO DE SCHEFFE Es uno de los mtodos de comparaciones mltiples ms general, permite probar todos los posibles contrastes entre medias de tratamientos. Es esencialmente til en aquell os casos en que la definicin de los contrastes se da despus de probar la significa cin del estadstico F asociado con Ho: j =0 j , porque no permite incrementar la pro babilidad de cometer error de tipo I. Consiste en construir intervalos confidenciales simultneos del para , . Si el intervalo no contiene al cero, decimos que es estadsticamente significativo. Recordemos que un estimador de y varianza es , cuya distribucin es normal con parmetros
La varianza estimada est dada por
De acuerdo a lo expuesto anteriormente, podemos concluir que los intervalos conf idenciales simultneos del para , , tienen la forma:
Podemos igualmente, usar la siguiente regla para rechazar : Rechazamos olo si
si y s
TEMA 3. Anlisis de Regresin y Correlacin Lineal Simple Introduccin. En una poblacin multivariante surge el problema de descubrir y medir la posible asociacin entre variables. Para enfrentar el mencionado problema, surgen dos procedimientos; ANLISIS DE REGR ESIN Y ANLISIS DE CORRELACIN. Uno de los principales objetivos del Anlisis de Regresin, adems de identificar y ex plicar el comportamiento de un fenmeno bajo estudio, es el de hacer predicciones acerca del comportamiento de las variables internas en la poblacin. En Economa el Anlisis de Regresin es usado para estimar relaciones funcionales cuan titativas entre variables dependientes y una o ms variables independientes, cuand o esta relacin es estadstica. Relaciones entre variables.
Anlisis de Regresin.
El anlisis de regresin estudia la dependencia de una variable, llamada variable de pendiente o explicada, en una o ms variables, llamada(s) variable(s) independient e(s) o explicatoria(s). Tiene como objeto estimar el valor promedio de la variab le dependiente basada en los valores conocidos y fijos de las variables independ ientes. El anlisis de regresin involucra la identificacin de la relacin entre la variable de pendiente y las independientes. Un modelo de la relacin es propuesto y estimacion es de los parmetros del mismo son usadas para desarrollar una ecuacin de regresin e stimada. Varias pruebas son hechas para determinar la idoneidad del modelo. Si e l modelo es estimado en forma satisfactoria, entonces la ecuacin de regresin estim ada puede ser usada para hacer predicciones de la variable dependiente dados los valores de las variables independientes. Los modelos de regresin se pueden clasificar de acuerdo al nmero de variables inde pendientes y de acuerdo a la forma de la relacin entre las variables. Si hay una sola variable independiente y la misma tiene una relacin lineal con Y, entonces se tiene un modelo de regresin lineal simple. Si la relacin es no lineal , entonces tenemos un modelo de regresin no lineal simple (ver grfico 1). Si hay ms de una variable independiente y la relacin de las mismas con Y, es linea l, decimos que el modelo de regresin es lineal mltiple. Si relacin es no lineal, en tonces se tiene un modelo de regresin no lineal mltiple (ver grfico 2).
Estudiar Relaciones Entre
Puede ser
Puede ser
Grfico 1
Estudiar Relaciones Entre
Puede ser
Puede ser
Grfico 2 Regresin Lineal Simple. Supongamos que tenemos una poblacin constituida por N elementos. Supongamos adems que deseamos estudiar la relacin entre la variable independiente (X) y la variabl e dependiente (Y). Supongamos adems que los N datos, correspondientes a las variables Y y X se pres entan como en la tabla 1.
\ ..... .....
..... .....
..... .....
..... .....
..... ..... Tabla 1 Donde N = A+B+..........+Z De acuerdo a la tabla 1, para el valor de , toma A valores y as, para el val or de , toma Z valores. De esta manera, esta tabla nos muestra la distribu cin de lo0s valores de para cada nivel fijo de . Esto es, la tabla 1 muestra l a distribucin condicional de dados los valores de . Al contar con la poblacin, podemos fcilmente calcular las probabilidades condicion ales de dado . Esto es,
(1) Con esto se obtiene la tabla 2.
..... ..... 1/A 1/A ..... ..... 1/A 1/B ..... 1/J ..... 1/P Tabla 2 De esta forma podemos calcular la esperanza condicional de dado , es decir, . Podemos decir que es una funcin de , lo que podemos denotar (2) A la ecuacin (2) se le conoce como la ecuacin de regresin poblacional de dos variab les. Es nuestra tarea ahora, investigar y determinar la forma de . Supongamos que la relacin entre s que y es lineal (ver grfico 3). Esto es, supongamo (3) 1/B 1/B ..... ..... 1/J 1/J ..... ..... 1/P 1/P
Resume la relacin Entre dos Es representada Por Son combinadas en
Permite la estimacin de
Son desconocidos y Estimados a travs
Tiene travs Ahora P
Es evaluado a En
Puede ser usada
Grfico3 Grfico 3 Donde y son parmetros desconocidos, llamados coeficientes de regresin.
Vamos a graficar ahora, los datos de la tabla 1 y la ecuacin (3).
Grfico 3 Podemos observar en el grfico (3) que los valores de rededor de el valor promedio de para . Llamemos a la desviacin del valor para un dado se ubican al
alrededor de su valor esperado . Esto es, (4)
De aqu que, (5) es una variable aleatoria no observable que podemos definir como trmino de erro r estadstico. Existen cuatro razones que justifican la presencia de este trmino. o Mala especificacin. La forma funcional de la relacin puede haber sido espe cificada incorrectamente. o Errores de medida u observacin. o Variables independientes no incluidas. La variable dependiente puede ser afectada significativamente por variables que no son consideradas en el modelo. o Naturaleza aleatoria propia del fenmeno. Ahora bien, si en la ecuacin (5) tomamos el valor esperado en ambos lados, se tie ne que; (6) De la ecuacin (6) se puede deducir que
Estimacin de los Parmetros. En la prctica, por lo general no contamos con la poblacin, sino con muestras. Por lo tanto la ecuacin de regresin poblacional es desconocida y, nuestro siguiente pa so ser estimarla en base a una muestra . Estimar la ecuacin de regresin poblacional, consiste en estimar los parmetros (coef icientes de regresin) de la misma. De esta forma, podemos escribir la ecuacin de r egresin muestral como (7) El mtodo usual de estimacin para el modelo de regresin es el mtodo de mnimos cuadrado s ordinarios (MCO). Este procedimiento puede ser usado para anlisis de datos como
una tcnica puramente descriptiva. Sin embrago si se consideran algunos supuestos el procedimiento tiene una fuerte justificacin terica que le permite producir est imadores que poseen propiedades estadsticas interesantes. Esto hace que el mencio nado mtodo sea el apropiado para obtener los mejores estimadores de y . Vamos a recordar inicialmente la ecuacin de regresin poblacional
Los supuestos a los que hicimos referencia arriba son los siguientes: o o o o Ahora bien, en trminos de la ecuacin (7) el valor observado o (8) Donde es el valor estimado de puede expresarse com
De esta forma, los no son otra cosa que las diferencias entre los valores obse rvados y los estimados de . El mtodo de mnimos cuadrados exige el ajuste de una lnea recta al conjunto de dato s tal que la suma de los cuadrados de la distancia de los puntos a la lnea ajusta da es minimizada. Supongamos que se han obtenido n pares de observaciones , , , , y que querem os obtener la funcin de regresin muestral. De acuerdo al principio de mnimos cuadrados, la mejor lnea recta ajustada a este c onjunto de datos es la lnea , tal que: (9) Los valores de (10) (11) Como podemos observar, estos estimadores son funcin de la muestra. Si adems se cum plen los supuestos arriba mencionados, son estimadores insesgados y tendrn varian zas mnimas. La lnea ajustada usando estos estimadores tiene las siguientes propiedades: o o o o o Pasa por El valor El valor Los no Los no el punto . medio de es igual al valor medio de . medio de los es cero. estn correlacionados con los . estn correlacionados con los . y . y que minimizan la ecuacin (9) son:
Inferencia Estadstica acerca de
Para construir intervalos de confianza y hacer pruebas de hiptesis acerca de un p
armetro, es necesario contar con un estimador puntual del mismo, as como conocer l a distribucin del mencionado estimador. Es necesario por lo tanto, conocer la distribucin de y de , para poder entonce s obtener estimaciones puntuales y realizar pruebas de hiptesis sobre y . Se puede demostrar que los estimadores mnimos cuadrados son funciones lineales de los . Este trmino es una variable aleatoria. Esto implica que las distribucione s mustrales de y de , dependern de los supuestos que se hagan sobre la distrib ucin de los . Supuesto de Normalidad: Este supuesto significa que cada sigue una distribucin normal con o o o Existen algunas razones que justifican el supuesto de normalidad. Estas son: o Como dijimos anteriormente, los entre otras cosas, representan la infl uencia sobre la variable dependiente de variables independientes que no son incl uidas en el modelo. El Teorema Central del Limite dice que si existen una gran c antidad de variables aleatorias independientes e idnticamente distribuidas , por lo general, la distribucin de suma es asintticamente normal. Una variante del Teor ema Central del Limite, indica que aunque el nmero de variables no sea muy grande o si no son estrictamente independientes, su suma se puede distribuir segn una n ormal. o Bajo el supuesto de normalidad, el fcil obtener las distribuciones de los estimadores. Esto debido a que la combinacin lineal de variables aleatorias norm ales es normal. De acuerdo a esto y siguen una distribucin normal. Esto es,
Donde: (12) (13) Sean las variables ( 14)
variables aleatorias con distribucin normal estndar. Estas expresiones son validas si es conocida. Rara vez esto sucede. Por lo tanto debe ser estimada por y ; De aqu se tiene que las ecuaciones (13) y (14) se transforman en (15)
(16) las cuales son variables aleatorias con distribucin t-student con n-2 grados de l ibertad. Por lo tanto usando las ecuaciones (15) y (16), y la distribucin t-student, podem os hacer inferencia acerca de los coeficientes de regresin. As, (17) De aqu que la expresin (18) constituye un intervalo de confianza del para . para
De la misma forma podemos obtener un intervalo de confianza del (19) TEMA 4: Series de Tiempo Introduccin
Todo tipo de organizacin tiene que hacer planes para el futuro que le permitan so brevivir y progresar. Esto es, requieren conocer el comportamiento futuro de ci ertos fenmenos con el propsito de planificar, prever o prevenir. La planificacin exige prever los sucesos que probablemente ocurran en el futuro. La previsin, a su vez, se basa fundamentalmente en lo que ha ocurrido en el pasa do. Surge as un nuevo tipo de inferencia estadstica, la que se hace acerca del f uturo de alguna variable o conjunto de variables basndose en sucesos pasados. La tcnica ms importante para hacer inferencias sobre el futuro en base a lo ocurrido en el pasado, es el anlisis de series de tiempo. Esta tcnica puede ser aplicada e n distintas reas del conocimientos, tales como, economa, demografa, marketing, etc. Uno de los problemas fundamentales que intenta resolver las series de tiempo es el de prediccin. Esto es, dado una serie , nuestros objetivos de inters son desc ribir el comportamiento de la serie, investigar el mecanismo generador de la ser ie temporal, buscar posibles patrones temporales que permitan predecir apropiada mente su futuro. Lo anteriormente expuesto implica entonces, construir un modelo para explicar la estructura y prever la evolucin de una variable que observamos a lo largo del ti empo. La variables de inters puede ser macroeconmica, microeconmica, fsica o socia l. Algunos ejemplos de series de tiempo se muestran en la tabla 1. Tabla 1. Ejemplos de Series de Tiempo Series De Tiempo Ejemplos 1. Series econmicas: - Tasas de desempleo - Tasa de inflacin - ndice de precios, etc.
2. Series Fsicas: - Meteorologa - Cantidad de agua cada - Temperatura mxima diaria - Velocidad del viento (energa elica) 3. Geofsica: - Series sismologas 4. Series demogrficas: - Tasas de crecimiento de la poblacin - Tasa de natalidad, mortalidad - Resultados de censos poblacionales 5. Series de marketing: - Series de demanda, gastos, ofertas 6. Series de telecomunicacin: - Anlisis de seales 7. Series de transporte: - Series de trfico Definicin de Series de Tiempo En muchas reas del conocimiento las observaciones de inters son obtenidas en insta ntes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales , trimestrales, semestrales o bien en forma continua. Llamamos Serie de Tiempo a un conjunto de mediciones de cierto fenmeno o experime nto registradas secuencialmente en el tiempo. Estas observaciones sern denotadas por , donde representa el valor de la variable en el instante , . Si s e dice que la serie de tiempo es discreta y si se dice que la serie de tiempo e s continua. Cuando las observaciones se hacen en un periodo de tiempo constante para todo i = 1,...,n, se dice que la serie es equiespaciada, en caso contrar io se denomina no equiespaciada. Aqu trataremos series de tiempo discretas, equie spaciadas. Anlisis de una Serie de Tiempo Procedimiento que permite la identificacin y separacin de los diversos factores o componentes relacionados con el tiempo y que influyen sobre la variable . A est os factores se les denomina componentes de la serie. El Anlisis de series de tiempo se fundamenta en el supuesto es que los componente s que han influido en el periodo bajo estudio, se mantendrn en forma similar en e l futuro. Objetivos en el Anlisis de una Serie de Tiempo Sus principales objetivos son: Identificar y aislar los componentes de la serie Hacer predicciones del comportamiento futuro de la serie en base a las estimacio nes de sus componentes. Pasos en el Anlisis de una Serie de Tiempo 1. Graficar la serie. Esto nos permite detectar las componentes esenciales de la serie as como la presencia de datos atpicos. Esto es, el grfico de la serie permitir: Detectar Outlier: se refiere a puntos atpicos de la serie. Un outliers es una obs ervacin de la serie que corresponde a un comportamiento anormal del fenmeno (sin i ncidencias futuras) o a un error de medicin.
Si se concluye que un valor determinado es un outlier, el mismo debe ser omitido o reemplazado por otro valor antes de analizar la serie. Por ejemplo, en un estudio de la produccin diaria en una fabrica se present la sit uacin mostrada en la figura 1: Figura 1 Los dos puntos sealados en los crculos parecen representar un comportamiento anorm al de la serie. Al investigar estos puntos se determino que correspondan a dos das de paro, lo que naturalmente afect la produccin en esos das. El problema fue solu cionado eliminando estos valores e interpolando. Permite detectar tendencia: Movimiento regular de la serie a largo plazo. La ten dencia representa el comportamiento predominante de la serie. Esta puede ser de finida como el cambio de la media a lo largo de un periodo (ver figura 2). Permite detectar variacin estacional: Movimiento de la serie que se repite ao tras ao en los mismos trimestres, meses, semanas, das o cualquier otro subperodo del ao. La variacin estacional representa un movimiento peridico de la serie de tiempo (v er figura 3). Matemticamente, podemos decir que la serie representa variacin estacional si exist e un nmero s tal que . Las principales fuerzas que causan una variacin estacional son las condiciones de l tiempo. Permite detectar variaciones irregulares (componente aleatoria): Movimientos qu e no presentan ninguna regularidad, provocados por eventos especiales o por la a leatoriedad. Los movimientos irregulares (al azar) representan todos los tipos d e movimientos de una serie de tiempo distintos a la tendencia, variaciones estac inales y fluctuaciones cclicas.
Permite detectar variacin cclica: Movimientos repetitivos de la serie que varan en longitud. Su duracin por lo general es de 2 a 10 aos. Figura 2 Figura 3 Modelos de Series de Tiempo Un modelo clsico para una serie de tiempo, supone que una serie puede ser expre sada como la suma o el producto de cuatro componentes o factores: La tendencia (T) Las variaciones estacinales (E) Las variaciones cclicas (C) y Las variaciones irregulares o trmino de error aleatorio (I) Existen tres modelos de series de tiempos, que generalmente se aceptan como buen as aproximaciones a las verdaderas relaciones, entre los componentes de los dato s observados. Estos son: 1. Aditivo:
2. Multiplicativo: 3. Mixto: Un supuesto usual es que I es una componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo (1), es adecuado, por ejemplo, cuando la estacionalidad no dep ende de otras componentes, como T. S el caso es lo contrario, la estacionalidad v ara con la tendencia, el modelo ms adecuado es un modelo multiplicativo (2). Es c laro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos. El problema que se presenta, es modelar adecuadamente las componentes de la serie. La figura 4 muestra patrones que podra seguir una serie representada por los mode los (1), (2) y (3).
Figura 4 El modelo multiplicativo es el ms empleado y a l hacemos referencia en este docume nto. Estimacin de la Tendencia Para obtener y estimar la tendencia existen varios mtodos, los ms usuales son: Mtodo Grfico Mtodo de las Medias Mviles Mtodo de Alisado Exponencial Mtodo Analtico. De los mtodos mencionados anteriormente el ms usado es el analtico. Este mtodo consi ste en construir una funcin matemtica que se ajuste lo mejor posible a los valores de la variable dependiente. Se supone que entre los valores de y el tiempo ex iste una relacin de dependencia causal unilateral que puede ser expresada como
donde es la parte exacta o sistemtica de la variable dada por una funcin matemtic a y un trmino de error aleatorio. Esa funcin matemtica se selecciona de forma tal que describa de la mejor manera la tendencia de la serie. Una vez seleccionada la funcin matemtica a ser usada, empleamos el mtodo de mnimos c uadrados para estimar los parmetros involucrados en la misma. Supongamos que la funcin seleccionada es la de la lnea recta
Debemos estimar entonces A y B. Estos estimadores se obtienen al resolver las ec uaciones
La variable independiente X en este caso se refiere a periodos de tiempo, y esto produce problemas a la hora de realizar los clculos. Se debe por lo tanto, hacer
un cambio apropiado que permita resolver esta dificultad. Si se tiene un nmero i mpar de datos se asigna al periodo central el valor (periodo origen) y se nume ran los restantes as . La unidad temporal a considerar es el periodo completo (ao , semestre, mes, etc). Si se tiene un nmero par de datos se asignan los valores 1 y 1 a los dos periodos centrales y se numeran los restantes as . La unidad tempo ral a considerar es la mitad del periodo (ao (semestre), semestre (trimestre), mes (15 das), etc). El periodo origen en este caso es, o bien la primera mitad de l periodo al cual se le asigno el valor 1 o, la segunda mitad del periodo al cua l se le asigno el valor 1. Obsrvese que en los dos casos se cumple que De esta forma, los estimadores de A y B estn dados por
Ejemplo 1: En la tabla 1 se presentan los datos trimestrales de unidades habitac ionales iniciadas en los Estados Unidos desde el tercer trimestre de 1964 hasta el segundo trimestre de 1972. Tabla 1: Nuevas unidades habitacionales comenzadas en los Estados Unidos del 3 tr imestre de 1964 al 2 trimestre de 1972 (en miles de unidades). Ao I II III IV Total Anual 1964 398 352 1965 283 454 392 345 1,474 1966 274 392 290 210 1,166 1967 218 382 382 340 1,322 1968 298 452 423 372 1,545 1969 336 468 387 309 1,500 1970 264 399 408 396 1,467 1971 389 604 579 513 2,085 1972 510 661 Fuente: U.S. Department of Comerse, Survey of Current Bussiness. Tabla 2: Clculo de la tendencia de las viviendas comenzadas en los Estados Unidos del 3 trimestre de 1964 al 2 trimestre de 1972 Ao trimestre X Y Tendencia 1964: 3 -31 398 291,668 4 -29 352 298,012 1965: 1 -27 283 304,356 2 -25 454 310,7 3 -23 392 317,044 4 -21 345 323,388 1966: 1 -19 274 329,732 2 -17 392 336,076 3 -15 290 342,42 4 -13 210 348,764 1967: 1 -11 218 355,108 2 -9 382 361,452 3 -7 382 367,796 4 -5 340 374,14 1968: 1 -3 298 380,484 2 -1 452 386,828 3 1 423 393,172 4 3 372 399,516 1969: 1 5 336 405,86 2 7 468 412,204 3 9 387 418,548 4 11 309 424,892 1970: 1 13 264 431,236
2 3 4 1971: 2 3 4 1972: 2
15 17 19 23 25 27 31
399 408 396 604 579 513 661
437,58 443,924 450,268 1 21 462,956 469,3 475,644 1 29 488,332
389
456,612
510
481,988
Los resultados parciales estn dados por ; ; ; Luego las estimaciones de A y B estn dadas por
Entonces, la recta de tendencia estimada es A partir de la tabla 1 y aplicando la formula anterior, se obtienen las cifras m ostradas en la ltima columna de la tabla 2, lo cual representa la tendencia estim ada para los periodos de tiempo bajo estudio. La figura 5 muestra grficamente la recta de tendencia ajustada a los datos trime strales de la tabla 2. Figura 5 Como en el Anlisis de Regresin, a y b deben ser interpretados. El valor a represen ta el valor medio de para el periodo origen. El valor b representa el cambio e n el valor medio de por unidad de tiempo. , representa el nmero medio de viviendas iniciadas para el periodo origen ( prim er mes y medio del tercer trimestre del ao 1968) , indica el incremento que se da cada mes y medio en el nmero medio de viviendas iniciadas. Estimacin de las Variaciones Estacinales La estimacin de la estacionalidad no slo se realiza con el fin de incorporarla al modelo para obtener predicciones, sino tambin con el fin de eliminarla de la seri e para visualizar otras componentes como tendencia y componente irregular que se pueden confundir en las variaciones estacinales. El procedimiento que se usa con mayor frecuencia para estimar esta componente es el mtodo de la razn al promedio mvil. Un promedio mvil de periodo adecuado, capta l as componentes tendencia y variaciones cclicas, . Para calcular las variaciones estacinales debemos proceder de la siguiente manera : 1. Obtener un promedio mvil de m periodos (PM). El nmero de periodos m, a ser utilizados en el clculo de estos promedios es el nmero de periodos en que se divi de el ao. Esto es, si se cuenta con observaciones mensuales, debemos obtener prom edios mviles de orden 12. Si se tienen datos trimestrales, los promedios mviles a utilizar deben ser de orden 4.
2. Obtener el cociente . Al suponer que la serie es el producto de los cua tro componentes y como se dijo anteriormente, los PM es una estimacin de , este cociente produce una estimacin de los componentes estacinales e irregulares, es de cir
A E*I se le denomina variaciones estacinales especificas. 3. Eliminar las variaciones irregulares. Debemos luego eliminar de las vari aciones estacinales especificas hasta donde sea posible las variaciones irregular es. Si promediamos para cada periodo las variaciones estacinales especificas y si la suma de estos promedios es igual a m, entonces ellos representan las estimac iones de las variaciones estacinales. En caso contrario estos promedios deben ser ajustados de la siguiente manera
Para su interpretacin, las variaciones estacinales se expresan en porcentaje y rec iben el nombre de ndices estacinales. Si este ndice esta por encima de 100 se dice que hay un incremento en . En caso contrario, se dice que hay una disminucin. Ejemplo 2: Para los datos del ejemplo 1, estimar las variaciones estacinales, obt ener e interpretar los ndices estacinales. En la tabla 3, el promedio mvil de cuatro trimestres para el primer trimestre de 1965 se obtiene sumando los valores del tercer y cuarto trimestres de 1964 y el primero y segundo trimestres de 1965 y dividiendo luego la suma por 4. El prome dio para el segundo trimestre de 1965 se obtiene sumando los valores del cuarto trimestre de 1964 con los del primero, segundo y tercer trimestres de 1965 y lue go dividiendo la suma por 4. As pues, para cada promedio sucesivo, se resta el t rimestre que viene primero y se suma el ltimo siguiente. La columna 4 de la tabla 3 muestra los promedios mviles de cuatro trimestres obte nidos. El promedio mvil no elimina las fluctuaciones muy acentuadas de la serie, pero reduce sustancialmente la amplitud de las variaciones de los datos origina les.
Si en el clculo de los promedios mviles participa un nmero impar de perodos, el proc eso ser sencillo, dado que el nmero de perodos antes y despus del perodo para el cual se calcula el promedio son iguales. Si el nmero de periodos es par, como en el e jemplo, no se puede utilizar el mismo nmero de perodos antes y despus de un periodo especificado. Por tanto, el promedio mvil ha de quedar a mitad de camino entre los valores de dos perodos consecutivos y no se relaciona con ningn perodo. Tabla 3: Clculo del Promedio Mvil centrado de cuatro trimestres para los datos del ejemplo 1 Ao por trimestre Datos Originales Y Total Mvil en cuatro trimestres Prome Mvil de cuatro trimestres Promedio Mvil Centrado de cuatro trimestres (T*C) (1) (2) (3) (4) (5) 1964: 3 398 4 352 1965: 1 283 1.487 371,75 371 2 454 1.481 370,25 369,375 3 392 1.474 368,5 367,375 4 345 1.465 366,25 358,5 1966: 1 274 1.403 350,75 338 2 392 1.301 325,25 308,375 3 290 1.166 291,5 284,5 4 210 1.110 277,5 276,25 1967: 1 218 1.100 275 286,5 2 382 1.192 298 314,25
3 4 1968: 2 3 4 1969: 2 3 4 1970: 2 3 4 1971: 2 3 4 1972: 2
382 340 452 423 372 468 387 309 399 408 396 604 579 513 661
1.322 1.402 1 1.513 1.545 1.583 1 1.563 1.500 1.428 1 1.380 1.467 1.592 1 1.968 2.085 2.206 1
330,5 350,5 298 378,25 386,25 395,75 336 390,75 375 357 264 345 366,75 398 389 492 521,25 551,5 510
340,5 359,25 1.472 382,25 391 397,75 1.599 382,875 366 348,375 1.359 355,875 382,375 423,625 1.797 506,625 536,375 558,625 2.263
368
373,125
399,75 395,25
339,75 342,375
449,25 470,625
565,75
Este problema se puede resolver calculando un promedio mvil centrado en la serie, lo cual se logra obteniendo primero un promedio mvil centrado de dos trimestres de los promedios mviles ya obtenidos. El primer promedio mvil centrado es la medi a de los dos primeros promedios mviles de cuatro trimestres, el segundo promedio mvil centrado es la media del segundo y tercer promedio mvil de cuatro trimestres, y as sucesivamente. De esta manera, habr un nmero igual de perodos despus y antes d el periodo especificado para el cual se est calculando el promedio mvil centrado. Los promedios mviles centrados se ven en la columna 5 de la tabla 3. Tabla 4: Variaciones e ndices Trim. 1964 1965 1966 Promedios Var. Est. I _ 0,76 0,81 0,8 0,801 80,1 II _ 1,23 1,27 1,2 1,210 121 III _ 1,07 1,02 1,07 1,077 108 IV _ 0,96 0,76 0,91 0,912 91,2 Estacinales para los datos del ejemplo 1 1967 1968 1969 1970 1971 1972 I. Est. 0,76 0,8 0,85 0,77 0,83 _ 1,22 1,12 0,95 1,18 1,08 0,94 1,22 1,06 0,89 1,12 1,07 0,93 1,19 1,08 0,92 _ _ _
Dado que la suma de los promedios dio menor que , se ajustaron de la manera ind icada arriba, obtenindose as las variaciones estacinales. Por ejemplo, la variacin e stacional asociada con el primer trimestre es 0.801. Los ndices estacinales se obt ienen al multiplicar las variaciones por 100. De esta forma el ndice estacional a sociado con el segundo trimestre es por ejemplo, 121. Los ndices para el primer y cuarto trimestre muestran una disminucin en , mientra s que en el segundo y tercer trimestre muestran un incremento. Para el primer tr imestre el nmero de casas iniciadas estn por debajo de lo que se espera para ese t rimestre en un 19.9% y para el cuarto trimestre en un 8.8%. Para el segundo seme stre, el nmero de casa iniciadas estn por encima de lo esperado en un 21% y en el tercero en un 8%. La Estacionalidad pueden ser usada para hacer pronsticos a corto plazo y para des estacionalizar una serie. Una serie se desestacionaliza dividiendo cada dato de la serie original entre su correspondiente valor de la variacin estacional. La c
olumna 5 de la tabla 5 muestra la serie desestacionalizada, es decir, una serie sin efecto estacional. En la siguiente seccin ilustraremos como usar la variacin e stacional para obtener pronsticos. Tabla 5: Estimacin de trimestre Y Y* E (1) (2) (3) 1964: 3 4 352 298,01 1965: 1 2 454 310,7 3 392 317,04 4 345 323,39 1966: 1 2 392 336,08 3 290 342,42 4 210 348,76 1967: 1 2 382 361,45 3 382 367,8 4 340 374,14 1968: 1 2 452 386,83 3 423 393,17 4 372 399,52 1969: 1 2 468 412,2 3 387 418,55 4 309 424,89 1970: 1 2 399 437,58 3 408 443,92 4 396 450,27 1971: 1 2 604 462,96 3 579 469,3 4 513 475,64 1972: 1 2 661 488,33 Predicciones Predecir no es ms que estimar el futuro utilizando informacin del presente y del p asado. El conocimiento del futuro nos capacita para planificar, prever o preven ir. Nuestra idea aqu es estimar en un instante n + k posterior al ltimo dato obser vado en i =n, k = 1,2,3,4,... (aos, trimestre, mes, etc.). Una vez estimada la tendencia y la estacionalidad, pueden realizarse dos tipos de predicciones; una usando la tendencia y otra usando la tendencia y la estacionalidad. Si se quieren hacer pronsticos haciendo uso de la lnea de tendencia estimada, solo hay que reemplazar el valor codificado de X para el periodo en estudio. Por eje mplo, si en el ejemplo 1 deseamos pronosticar el numero medio de casas iniciadas para el segundo trimestre del ao 1973, el valor codificado de X es 39. este valo r es reemplazado en la ecuacin , obtenindose el siguiente resultado los componentes de la serie del ejemplo 1 Ydes (4) 398 0,912 283 1,210 1,077 0,912 274 1,210 1,077 0,912 218 1,210 1,077 0,912 298 1,210 1,077 0,912 336 1,210 1,077 0,912 264 1,210 1,077 0,912 389 1,210 1,077 0,912 510 1,210 C*I (5) 291,67 385,965 304,36 375,207 363,974 378,289 329,73 323,967 269,266 230,263 355,11 315,702 354,689 372,807 380,48 373,554 392,758 407,895 405,86 386,777 359,331 338,816 431,24 329,752 378,830 434,211 456,61 499,174 537,604 562,500 481,99 546,281 C (6) 1,077 1,295 0,801 1,208 1,148 1,170 0,801 0,964 0,786 0,660 0,801 0,873 0,964 0,996 0,801 0,966 0,999 1,021 0,801 0,938 0,859 0,797 0,801 0,754 0,853 0,964 0,801 1,078 1,146 1,183 0,801 1,119 I (7) 369,545 1,241 353,308 1,172 1,175 1,118 342,072 0,929 0,804 0,738 272,160 0,868 0,945 0,980 372,035 0,981 0,995 1,018 419,476 0,943 0,865 0,807 329,588 0,790 0,857 0,960 485,643 1,096 1,135 1,216 636,704 (8) 1,267 1,044 1,161 1,030 0,977 1,046 1,037 1,037 0,979 0,895 0,766 1,006 1,021 1,017 0,978 0,985 1,004 1,003 1,034 0,995 0,993 0,988 0,764 0,953 0,996 1,004 1,064 0,984 1,009 0,972 1,321
1,221
0,951
1,057
0,981
0,767
1,000
0,980
0,998
0,998
1,036
0,772
0,990
1,035
1,027
1,207
1,094
El pronostico para el nmero de casas iniciadas para el segundo trimestre del ao 19 73 tiende a 513.708 millones. Si usamos la tendencia y la estacionalidad, podemos obtener pronsticos a corto pl azo. Se evala la ecuacin de tendencia estimada y luego el resultado se multiplica por su variacin estacional. En el caso planteado anteriormente el nmero estimado d e casas iniciadas para el segundo trimestre del ao 1973 considerando la estaciona lidad es
Estimacin de las Variaciones Cclicas Entre los mtodos utilizados para estimar la componente cclica en una serie de tiem po, el ms habitual es el mtodo de los residuos. Su principal uso es el de aislar s u efecto de la serie. El procedimiento es el siguiente: Si la unidad de tiempo usada es inferior a un ao, el primer paso consiste en dese stacionalizar la serie, es decir, se debe obtener una nueva serie sin variacione s estacinales. Esto se logra dividiendo la serie original entre los valores estim ados de las variaciones estacinales (columna 5 de la tabla 5). Se estima la tendencia de la serie y posteriormente se elimina de la serie deses tacionalizada obtenindose as, una nueva serie (columna 6 de la tabla 5), denomin ada relativas cclicas irregulares. Se procede ahora a eliminar el componente irregular. Para ello suele tomarse un promedio mvil de orden 3 o 5, obtenindose una nueva serie que se considera una est imacin de las variaciones cclicas y que se ha obtenido como residuo luego de elimi nados las dems componentes (columna 7 de la tabla 5). Estimacin de la Variaciones Irregulares Estas variaciones en el modelo clsico, se consideran producto del azar. Por lo ta nto, no se pretende conocer las causas que las producen. Interesa solo demostrar que constituyen una componente aleatoria. Su estimacin se obtiene simplemente dividiendo los datos correspondientes a las r elativas cclicas irregulares entre los correspondientes a las variaciones cclicas. En la columna 8 de la tabla 5 se presenta esta estimacin para los datos del ejem plo 1. Es necesario probar que estos valores son aleatorios, se distribuyen normal y qu e no estn autocorrelacionados. Podemos ahora obtener los valores originales multiplicando las estimaciones obte nidas para cada componente. Esto es,
Por ejemplo,
EJERCICIOS PROPUESTOS 1. Dada la siguiente informacin referente a los contratos de construccin resi dencial en miles de millones de bolvares para los meses de Enero a Septiembre de
1992: Ener. 2,7 Feb. 2,7 Mar. 3,6 Abr. 4,0 May. 4,4 Jun. 4,4 Jul. 3,9 Agos. 4,7 Sep. 4,1
Calcular los promedios mviles de orden 3 Calcular los promedios mviles de orden 4 2. La produccin de cemento gris en el quinquenio 1978-1982 ( en miles de ton eladas) fue la siguiente: Ao 1978 1979 1980 1981 1982 ientes Estimar la tendencia para el periodo 1978-1982 Predecir la produccin de cemento gris para el ao 1985. 3. El dueo de una compaa procesadora de alimentos, est interesado en analizar l os datos referentes a las ventas trimestrales ( en millones de bolvares). En la s iguiente tabla se presenta la informacin para los aos 1991-1994. Aos 1991 1992 1993 1994 Trimestres I II 9 10 7 14 13 16 14 20 III 21 25 26 27 IV 23 28 31 33 Produccin 4.153 4.257 4.351 4.470 4.721 Estimar la tendencia, suponiendo que la relacin es lineal. Interpretar los coefic
Calcular la recta de tendencia mediante el mtodo de mnimo cuadrados. Interprete los coeficientes . Obtenga los valores de la tendencia. Obtenga la prediccin de los ingresos para el segundo trimestre de 1995 en base a la tendencia. 4. La ecuacin de tendencia mensual de la produccin de cerveza en millones de barriles de la compaa X, viene dada por: Los ndices estacinales asociados con la ecuacin de tendencia, son los siguientes: Mes ndice Enero 63.94 Febrero 78.18 Marzo 86.06 Abril 95.62 Mayo 101.74 Junio 114.07 Julio 124.74 Agosto 135.47 Septiembre Octubre 110.59 Noviembre Diciembre Estacional
123.24 99.05 150.00
Interprete los coeficientes de la lnea de tendencia. Interprete el ndice estacional de los meses de Enero, Agosto y Diciembre.
Estime el valor de Y para el mes de Febrero de 1992, usando la tendencia y varia cin estacional. 5. Los siguientes datos representan el valor del trigo exportado (en millon es de bolvares), por trimestre, en Argentina, durante los aos 1990-1994: Aos 1990 1991 1992 1993 1994 Trimestres I II 1 2 2 3 3 4 4 5 5 7 III 5 6 7 8 10 IV 3 4 5 7 8
Estimar la lnea de tendencia. Interpretar los coeficientes de la tendencia estimada. Calcular las variaciones y los ndices estacinales. Interpretar los ndices estacinales correspondientes al tercer y cuarto trimestre. 6. Dados los siguientes datos sobre produccin de hierro (en toneladas ) tr imestralmente, de una planta siderrgica durante los aos: 1986-1990 (Origen: en el primer mes y medio del III Trimestre de 1998 y unidades de X: en trimestre) ndices Estacinales Tpicos Trimestrales I II III IV 106,14 114,30 95,88 83,68
Cul fue el aumento promedio de la produccin en toneladas de esa planta siderrgica cada mes y medio? Determine el valor de la tendencia para los 4 trimestres de 1991. En base a los datos, estime la produccin de hierro en toneladas para los 4 trimes tres del ao 1991, haciendo uso del comportamiento de la serie a largo plazo y de las variaciones estacinales. 7. Dados los siguientes valores originales de los ndices de ausentismo del p ersonal de una compaa durante los 4 trimestres del ao 1993 y las medianas de los ndi ces estacinales especficos: Trimestres I II III IV Valor Originales 5,3 6,6 Medias 91,72 113,53 104,45 87,37
6,1
5,4
Obtenga los ndices estacinales ajustados de modo que la suma sea igual a 400. Interprete los valores ajustados de los ndices estacinales para el I y II trimest re.
Con base a los ndices estacinales ajustados, elimine la variacin estacional para l s 4 trimestres del ao 1993 e interprete los valores para el I y II trimestre. 8. Si el volumen de ventas de cierta empresa puede ser descrito mediante el modelo multiplicativo: Y = T*X*C*I y adems, en el primer trimestre del ao pasado, la tendencia estimada de las ventas originales fueron de 69.000 unidades, el ndi ce estacional fue de 96 y el ndice cclico de 120. Qu ndice irregular se debera asociar dicho componente? 9. En la elaboracin de un ndice estacional de las ventas mensuales de gasolin a de una importante refinera, por el mtodo de la razn al promedio mvil , se obtuvie
ron las siguientes medias: Mes E N 69,0 92,8 F D 67,1 82,6 M 73,9 A 46,7 M 36,4 J 26,4 J 19,1 A 124,2 S 339,2 O 181,5
Obtener los ndices estacinales. Interpretar los ndices internacionales para los meses de Septiembre y Diciembre. 10. Dada la siguiente informacin en relacin a los ingresos de una empresa y el valor de la tendencia (ambos en millones de bolvares) para el perodo 1985-1991. Ao 1985 1986 1987 1988 1989 1990 1991 Ingresos 8 8.45 9 10.45 11 12.45 13 14.45 15 16.45 18 18.45 20 20.45 Valor de la Tendencia
Obtener la lnea de tendencia. Estimar el valor de la tendencia para los aos 1995 y 1996. 11. El nmero de clientes que, durante 10 das laborales consecutivos solicitar on asistencia tcnica en un servicio de reparacin de electrodomsticos fue: 25,34,23, 20,25,17,19,31,15,11. Obtener los promedios mviles de orden tres. Estimar la lnea de tendencia. Interpretar los coeficientes. 12. La siguiente tabla presenta las cifras de parados ( en miles) para el pe rodo 1990-1994. Los datos se han organizado por trimestres. Calcular la serie desestacionalizada. Trimestres 1990 I 2.941,30 II 2.899,00 III 2.805,10 IV 2.701,20 1991 1992 2.698,00 2.555,10 2.468,40 2.521,80 1993 1994 2.510,40 2.438,20 2.391,70 2.424,30 2.421,10 2.391,30 2.480,00 2.566,20 2.632,10 2.686,00 2.788,90 3.047,10
13. La tendencia lineal de la serie de ventas anuales totales, en miles de dl ares, de una empresa exportadora de aceite de oliva, viene dada por la ecuacin: , donde la unidad temporal es un ao, el origen temporal 1989, y los ndices general es de variacin estacional de dicha serie sobre ventas son los de la tabla siguien te. Con esta informacin estime, las ventas trimestrales de la empresa en el ao 199 9. Trimestres ndices Primer Trimestre Segundo Trimestre Tercer Trimestre Cuarto Trimestre Total Anual 400 120 130 80 70
14. Dada la estructura porcentual de la deuda pblica del estado de un pas en l a tabla adjunta: Aos 1987 1988 1989 1990 1991 1992 1993 1994 1995
Deuda en % del PIB 43 45
40
39
35
34
34
35
37
Estimar la tendencia. Interpretar los coeficientes. Realizar un pronstico acerca de la deuda pblica para el ao 2000, haciendo uso de l s tendencias y las variaciones estacinales. 15. Dada la serie de participantes en los juegos Olmpicos de la Era Moderna, determinar la tendencia lineal. Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Ciudad Ao Atenas 1986 Pars 1900 San Luis Londres 1908 Estocolmo Suspendidos Amberes 1920 Pars 1924 msterdam Los ngeles Berln 1936 Suspendidos Suspendidos Londres 1948 Helsinki Melbourne Roma 1960 Tokio 1964 Mxico 1968 Munich 1968 Montreal Mosc 1980 Los ngeles Sel 1988 Barcelona Totales 280 1.006 1904 1.999 1912 1916 2.668 3.070 1928 1932 3.956 1940 1944 4.064 1952 1956 5.348 5.081 5.423 5.423 1976 5.217 1984 8.465 1992
681 2.490 0 2.694 1.328 0 0 4.879 3.258
6.026 6.797 9.368
Estimar todos los componentes de la serie. Obtener los ndices estacinales. Estimar el nmero de participantes para los juegos del 2004. TEMA 5: Nmeros ndices Introduccin. El nmero ndice es un recurso estadstico para medir diferencias entre grupos de dato s. Los nmeros ndices son muy utilizados en la actualidad. En Economa se emplean por ej emplo, para determinar o mejor, analizar el crecimiento econmico, la estabilidad de precios, entre otras cosas. Definicin. Son indicadores diseados para mostrar los cambios en el tiempo o el espacio de un a o varias variables. Se definen como porcentajes que expresan variacin para un d
eterminado periodo o punto en el espacio, en relacin a otro tomado como referenci a. En Economa disponemos de: o o o ndice de Precios ndice de Cantidades ndice de Valor
ndice de Precios. Indicadores que reflejan la variacin en el precio o los precios de un artculo o un conjunto de artculos entre dos momentos en el tiempo o dos punt os en el espacio. ndice de Cantidades. Es un indicador que refleja las variaciones en la cantidad o las cantidades de un artculo o conjunto de artculos entre dos momentos en el tiem po o dos puntos en el espacio. ndice de Valor. Indicadores que reflejan las variaciones en el valor total de un artculo o un conjunto de artculos entre dos momentos en el tiempo o dos puntos en el espacio. Generalmente no interesan las comparaciones de precios, cantidades o valores de bienes o artculos individuales, sino de grupos de bienes o artculos. Los nmeros ndices construidos para un solo elemento se denominan precios, cantidad es y valores relativos. Periodo Base. Al periodo de referencia o de comparacin se le denomina periodo base y su nmero ndi ce es 100. Por lo general se denota con el subndice cero (0). Para la seleccin del periodo base deben considerarse algunos elementos. Entre otr as cosas, el periodo base (1) debe ser un periodo con gran estabilidad (sin fenme nos de expansin y recesin) y (2) tan reciente como sea posible. Etapas en la construccin de nmeros ndices. 1. Seleccin del nmero de elementos a considerar. Se deben tomar aquellos que se consideren de mayor importancia. 2. Eleccin del periodo base. Se debe seleccionar aquel en que las condicione s del fenmeno estudiado sean en lo posible normales. 3. Determinacin del tipo de ndice. Este depende del conocimiento y experienci a. 4. Problema de la Ponderacin. Debe seleccionarse un factor conveniente que d efina claramente la importancia de cada bien en el clculo del ndice. Clasificacin de los Nmeros ndices. Adems de la clasificacin natural de los nmeros ndices, los mismos pueden clasificars e de acuerdo a ciertos criterios: o Nmeros de bienes involucrados o Ponderacin utilizada o Tipo de base Nmeros de bienes involucrados o Simples (Un solo bien) o Compuestos (Ms de un bien) Ponderacin utilizada (Compuestos) o No ponderados (Igual peso)
o Ponderados (Diferente peso) Tipo de base o Base fija (Un nico periodo de Comparacin) o Base mvil (Periodo de comparacin, periodo inmediatamente anterior) ndices Ponderados. Cuando el clculo de un nmero ndice se refiere a un grupo de bienes y cada bien pose e un factor de ponderacin que establece su importancia dentro del conjunto de bie nes, nos referimos entonces, a un ndice ponderado compuesto. Los ndices ponderados ms importantes son los de Laspeyres y los de Paasche. ndice de Laspeyres. ndice de Precios. Usa como ponderacin las cantidades para el periodo base (0).
Interpretacin. (I-100). Indica que los precios de los artculos en estudio, sufrieron un cambio ( incremento o disminucin) del (I-100)% para el periodo t con respecto al periodo 0, usando como ponderacin las cantidades del periodo 0. ndice de Cantidades. Usa como ponderacin los precios para el periodo base (0). Interpretacin. (I-100). Indica que las cantidades de los artculos en estudio, sufrieron un cambi o (incremento o disminucin) del (I-100)% para el periodo t con respecto al perio do 0, usando como ponderacin los precios del periodo 0. ndice de Paasche. ndice de Precios. Usa como ponderacin las cantidades para el periodo en estudio (t ).
Interpretacin. (I-100). Indica que los precios de los artculos en estudio, sufrieron un cambio ( incremento o disminucin) del (I-100)% para el periodo t con respecto al periodo 0, usando como ponderacin las cantidades del periodo en estudio (t). ndice de Cantidades. Usa como ponderacin los precios para el periodo en estudio (t ).
Interpretacin. (I-100). Indica que las cantidades de los artculos en estudio, sufrieron un cambi o (incremento o disminucin) del (I-100)% para el periodo t con respecto al perio do 0, usando como ponderacin los precios del periodo en estudio (t). Cambio del Periodo base en ndices de base fija. Si se desconocen los datos originales, pero existen los ndices referidos a un det erminado periodo base, y se quiere cambiar, simplemente se divide cada ndice entr e el que le haba correspondido al nuevo periodo base multiplicando luego por 100.
Relaciones entre los ndices de base fija y los ndices de base mvil. Los ndices de base fija pueden ser determinados en base a ndices de base mvil o vic eversa. Base fija a Base variable Base variable a Base fija
Periodos anteriores al Periodo base Periodos posteriores al Periodo base
ndice de Precios al Consumidor. Como hemos visto hasta ahora, los ndices de precios nos indican los cambios en lo s precios en un determinado momento con respecto a los precios en el periodo bas e. El ndice de precios al consumidor, IPC, es un indicador estadstico que mide el cam bio promedio en un determinado momento, en los precios a nivel del consumidor, d e una lista de bienes y servicios seleccionados como los representantes del cons umo familiar con respecto al nivel de precios vigentes en un momento seleccionad o como base. A esa lista de bienes y servicios es lo que se denomina Cesta Familiar. Este ndice permite entre otras cosas: 1. Captacin de procesos inflacionarios. 2. Impacto de variaciones de precios sobre el nivel de ingreso y el consumo familiar. 3. Nos permite obtener informacin para el clculo de la tasa de inters real. 4. Nos permite construir patrones referenciales para evaluar aumentos salria les. La informacin utilizada en su construccin es obtenida mediante una encuesta la cua l recibe el nombre de Encuesta de Presupuesto Familiar. Los productos que integran la cesta familiar se clasifican en: o o o o Alimento, Bebida y Tabaco. Vestido y Calzado Gastos del Hogar Gastos Diversos
Se usa como metodologa de clculo el ndice de Laspeyres Encadenado. Clculo del poder adquisitivo.
Interpretacin. Para el periodo en estudio (t), la moneda equivale a periodo base.
unidades de la moneda del
IPC como deflactor. Deflactacin. Metodologa que permite transformar valores expresados en precios corr ientes en valores a precios constantes. Es razonable usar como deflactor el IPC.
Interpretacin. Salario Real para el periodo en estudio en unidades monetarias del periodo base. Interpretacin. Salario Nominal que permite mantener para el periodo t el mismo nivel del period o t-1.

Untitled

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Untitled

Загружено:

Авторское право:

Доступные форматы

Tema 1: Inferencia Estadstica Introduccin Generalmente las poblaciones son demasiado grandes como para poder ser estudiada

Caractersticas de la Distribucin t de Student. o o o Es de tipo continuo. Es simtrica. Su rango es el intervalo .

la cual constituye un intervalo de confianza del (1- )% para or

o Bajo el supuesto de varianzas diferentes, , las expresiones de tn dadas por

Luego la variable aleatoria

constituye un intervalo de confianza del Prueba de Hiptesis Estadstica

Fijar el nivel de significacin.

Test de dos colas

Fijar el nivel de significacin. Estadstico de prueba.

Y1,k Y.,2 n1 Y.,3 n2 ... n3 Y.,j ... nj Y.,k-1 Y.,k nk-1

H1: .i Por otra parte,

para al menos un par (i , j) i j n1=...=nk=n

Luego elevando ambos lados al cuadrado y sumando en i y en j:

COMPARACIN DE MEDIAS DE TRATAMIENTO INDIVIDUALES

y donde cj son nmeros reales.

C puede ser expresado tambin en trminos de efectos de tratamientos. Esto es,

sigue una distribucin normal con parmetros: y

Por otro lado, la variable aleatoria , dada por

De esta forma, la expresin

La varianza estimada est dada por

Podemos igualmente, usar la siguiente regla para rechazar : Rechazamos olo si

Estudiar Relaciones Entre

Estudiar Relaciones Entre

(1) Con esto se obtiene la tabla 2.

Resume la relacin Entre dos Es representada Por Son combinadas en

Son desconocidos y Estimados a travs

Tiene travs Ahora P

Puede ser usada

Grfico3 Grfico 3 Donde y son parmetros desconocidos, llamados coeficientes de regresin.

Vamos a graficar ahora, los datos de la tabla 1 y la ecuacin (3).

alrededor de su valor esperado . Esto es, (4)

Inferencia Estadstica acerca de

Para construir intervalos de confianza y hacer pruebas de hiptesis acerca de un p

Donde: (12) (13) Sean las variables ( 14)

Debemos estimar entonces A y B. Estos estimadores se obtienen al resolver las ec uaciones

399 408 396 604 579 513 661

437,58 443,924 450,268 1 21 462,956 469,3 475,644 1 29 488,332

3 4 1968: 2 3 4 1969: 2 3 4 1970: 2 3 4 1971: 2 3 4 1972: 2

123.24 99.05 150.00

Deuda en % del PIB 43 45

681 2.490 0 2.694 1.328 0 0 4.879 3.258

6.026 6.797 9.368

Periodos anteriores al Periodo base Periodos posteriores al Periodo base

Interpretacin. Para el periodo en estudio (t), la moneda equivale a periodo base.

unidades de la moneda del

Вам также может понравиться