Академический Документы
Профессиональный Документы
Культура Документы
Curso 3
1
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Elaborado por
Revisado por
II. DESARROLLO
LECCION 1: Consideraciones Generales de la Estadstica
Punto 1: Clasificacin de la Estadstica
Punto 2: Etapas o pasos mnimos necesarios para realizar un anlisis Estadstico
Punto 3: Tipos de Variables
LECCION 2: Tabulacin y Grficos
Punto 1: Tabulacin de la Informacin
Punto 2: Grficos
LECCION 3: Medidas de Posicin Centrales y no Centrales
Punto 1: Medidas de Posicin Central
Ejercicios propuestos de media aritmtica
Punto 2. Medidas de Dispersin
Punto 3: Medidas de Posicin no Centrales: Cuartiles, Quintiles, Deciles y Percentiles
LECCION 4: Anlisis de Regresin
Punto 1: Regresin Lineal Simple
Ejercicios propuestos
APENDICE 1: Fuentes de bsqueda de informacin
APENDICE 2: Mtodo de Prediccin
2
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
ASPECTOS GENERALES
I.
Objetivo general
Requisitos
Manual del participante (el alumno debe haber recibido y ledo con anticipacin el
contenido del manual)
Presentacin en Power Point a cargo del instructor
Manual del instructor el curso
Proyector Multimedia, Pizarra acrlica, Plumones
II.
DESARROLLO
Objetivos de la Leccin
3
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
1.2
Definiciones clave
Concepto de Estadstica
Clasificacin de la Estadstica
Tipos de variables estadsticas
Punto 1: Clasificacin de la Estadstica
La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos,
ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algn fenmeno o estudio aplicado. Sin embargo, la estadstica es ms que
eso, en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con
la investigacin cientfica.
La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos
relativos a un conjunto de objetos, personas, procesos, etc. A travs de la
cuantificacin y el ordenamiento de los datos intenta explicar los fenmenos
observados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones.
Bajo este contexto, la Estadstica se divide en dos reas: Estadstica Descriptiva y
Estadstica Inferencial.
Estadstica Descriptiva: permite organizar y presentar un conjunto de datos de manera
que describan en forma precisa las variables analizadas facilitando su lectura e
interpretacin. Obviamente, la materia prima de la Estadstica Descriptiva la constituyen
los datos.
Ejemplo: Se realiza una encuesta en el departamento de San Salvador para para deducir
las preferencias de votos para la prximas elecciones presidenciales, y se concluye que el
30% votara por el partido XXF, el 45% por el partido XXK y el resto equivalente al 25% por
el XXL.
Sin embargo, cuando existen limitantes (econmicas, tiempo, recurso humano, entre
otras) en las cuales es imposible obtener informacin de toda la poblacin, se toma una
parte de ella a la que se le llama Muestra el cual es definido como un subconjunto
representativo de una poblacin.
La Estadstica Inferencial: permite generalizar los resultados (datos estadsticos) de una
muestra a la poblacin total, es decir se realizan conclusiones o inferencias, basndose en
4
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
los datos simplificados y analizados en una muestra.
Ejemplo: En lnea con el ejemplo anterior la intencin de voto de los habitantes del
departamento de San Salvador se pudiese obtener a partir de una muestra representativa
tomada de los habitantes de los diferentes municipios del depto. y a partir de dichos
resultado se infieren las intenciones de voto de la poblacin, en este caso los habitantes
del dpto. de San Salvador.
Punto 2: Etapas o pasos mnimos necesarios para realizar un anlisis Estadstico
La estadstica suministra valores que ayudan a descubrir interrelaciones entre mltiples
parmetros, as como tambin es una herramienta til para realizar predicciones de
valores futuros.
Un anlisis estadstico es un proceso sistemtico en el cual se requiere realizar una serie
de etapas con el mayor grado de acuciosidad posible, estas se describen a continuacin:
1. Definicin del problema de estudio y objetivos del mismo.
2. Seleccin de la informacin necesaria para realizar el estudio.
3. Recogida de la informacin que va a depender del presupuesto con el que
contemos y de la calidad de los datos exigida.
4. Ordenacin y clasificacin de la informacin en tablas y grficos.
5. Resumen de los datos mediante medidas de posicin, dispersin, entre otras que se
consideren convenientes.
6. Anlisis estadstico formal obteniendo hiptesis y predicciones.
7. Interpretacin de resultados y extraccin de conclusiones.
Punto 3: Tipos de Variables
Las variables estadsticas son caractersticas que poseen todas las unidades de la
poblacin o muestra a estudiar.
Las variables que se observan y analizan pueden ser de dos tipos:
a) Variables cualitativas o atributos: no se pueden medir numricamente,
representan caractersticas o atributos de las variables (por ejemplo:
nacionalidad, sexo, religin).
a.1 Nominal: Caracterstica o cualidad cuyas categoras no tienen un orden
preestablecido. Ejemplos: Sexo, Deporte Favorito, etc.
a.2
Ordinal: Caracterstica o cualidad cuyas categoras tienen un orden
preestablecido.
Ejemplos: primero, segundo, tercero; Grado de Inters por un tema, etc.
5
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
b) Variables cuantitativas: toman valores numricos (edad, altura, precio de
producto, ingresos anual es).
un
Ministerio de Hacienda
Direccin General del Presupuesto
2.
3.
4.
5.
V___ F___
Establecer las diferencias entre variables cualitativas y cuantitativas.
Establecer las diferencias entre variables discretas y continuas.
Definir al menos dos ejemplos de variables discretas y de variables continuas.
De qu tipo de escala son las siguientes variables, respectivamente?
a. Nios, Jvenes, Adultos.
b. Ingeniera Elctrica, Mecnica, Qumica, de Sistemas.
Bibliografa
1. Gildaberto Bonilla, Estadstica I, Elementos de Estadstica Descriptiva y
Probabilidad.
2. Anderson Sweeney Williams, Estadistica para Administracin y Economia
3. http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
4. http://www.vitutor.com/estadistica/descriptiva/a_1.html
7
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
LECCION 2: Tabulacin y Grficos
Resumen de la leccin: Entre los principales elementos que contempla esta leccin se
encuentra la adopcin de herramientas que contribuyan a presentar los datos de una
manera ms ordenada y que facilite la comprensin del lector ya sea a travs de tablas de
frecuencias o de forma grfica.
Tiempo total: 1 horas
2.1
Objetivos de la Leccin 2
Al finalizar esta leccin los participantes sern capaces de:
a. Obtener criterios para presentar de una forma ms ordena la informacin utilizando
tablas de frecuencias.
b. Conocer la aplicabilidad de las tablas de frecuencias simples y tablas de frecuencias
para datos agrupados.
c. Adquirir elementos para utilizar la representacin grfica de la manera ms apropiada
considerando entre otros aspectos, el tipo de variable, escala de medicin, entre otras.
2.2
Definiciones clave
Tabla de frecuencia simple, frecuencia absoluta, relativa y acumulada, rango, tabla de
frecuencia con datos agrupados en clases, intervalo de clases, ancho de clase, marca de
clase o punto medio, principales tipos de grficos.
Punto 1: Tabulacin de la Informacin
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla
de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Para
entender cmo funcionan las tablas de frecuencia, analicemos el siguiente ejemplo:
Ejemplo 1.: Suponga que se ha preguntado a 37 familias sobre el nmero de hijos. La
forma de simplificar los datos, equivale a contar cuantas familias tienen el mismo nmero
de hijos. A esta operacin la conoceremos como frecuencia absoluta.
N. de Hijos
0
1
2
3
4
5 o ms
Total
N. de Familias
4
7
8
5
10
3
37
8
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Se observa que 7 familias tienen solamente un hijo. Tambin, se puede tener inters en
conocer el porcentaje de familias que tienen 3 menos, para ello se requiere sumar el
nmero de familias que tienen: 0, 1, 2 o 3 hijos y dividirlo entre el total de familias, esto
es, ((4+7+8+5)/37)*100 = 64.86%, este valor se interpreta que aproximadamente el 65%
de las familias tienen 3 menos hijos.
Frecuencia Absoluta (fi): Nmero de veces que se repite un valor dentro de
un conjunto de datos.
Podemos identificar dos tipos de tablas de frecuencias, las cuales denotaremos como
tablas de frecuencia simple y tablas de frecuencias con datos agrupados.
1.1 Tabla de frecuencia simple
Se caracterizan por manejar un conjunto pequeo de posibles resultados de una variable
dentro de la muestra o poblacin. Por lo general, su uso tiende al manejo de datos
cualitativos o variables cuantitativas discretas.
Ejemplo 2. El gobierno est interesado en medir el grado de aceptacin que tendra si se
construyera una carretera cerca de cierta comunidad, para ello, se selecciona una muestra
de 10 personas del sector en que habitan. Para tal fin, se les pide que valoren dicho
proyecto empleando una escala del 1 al 5, su opinin sobre dicho proyecto (1 = Muy
Malo, 2= Malo, 3 = Regular, 4 = Bueno y 5 = Excelente). Las respuestas tabuladas de las
10 personas son:
Persona
Respuesta
(Grado de aceptacin)
10
SOLUCIN
Como se puede observar, el nmero de resultados que puede alcanzar la variable grado
de aceptacin son relativamente pocos (solo cinco posibilidades), lo cual sirve como
parmetro para catalogar la tabla de frecuencia resultante como tabla de frecuencia
simple.
9
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Otra forma de catalogar los datos es conociendo la distancia o variacin que hay entre el
valor menor (Xmin) y el valor mayor (Xmax), diferencia que se conoce como Rango.
Rango (R): Diferencia existente entre el valor Mximo (Xmax) y el valor Mnimo
(Xmin) de un conjunto de datos. La frmula empleada es: R= Xmax -Xmin
En el ejemplo R sera igual a 4 puesto que:
R= 5 -1 = 4
Si el rango manejado es pequeo, bastara representar los datos con una tabla de
frecuencia simple. Para crear esta tabla deberemos seguir los siguientes pasos:
PASO 1: Contar las veces que se repite cada valor dentro de la muestra.
PASO 2: Ubicar estas frecuencias en una tabla ordenada.
Grado de Aceptacin
1
2
3
4
5
Total
Frecuencia (fi)
0
1
2
3
4
10
Ninguna de las personas valor el proyecto de construccin de carretera como muy malo
(grado de aceptacin igual a 1), mientras que la mayora de las respuestas se centraron en
Excelente y Bueno (grado de aceptacin iguales a 5 y 4 respectivamente).
Observando los datos resumidos, podemos concluir que la mayora de las personas
encuestadas tienen una visin favorable del proyecto de construccin de la carretera. En
este ejemplo se visualiza, como la tabla de frecuencia agiliza el anlisis de los datos.
La estadstica considera otros tipos de frecuencias auxiliares que complementan el anlisis
de las tablas de frecuencia.
Frecuencia Absoluta Acumulada (Fa): Presenta un saldo acumulado de las frecuencias
de los intervalos. Esta frecuencia se calcula sumando el acumulado de las frecuencias
de los intervalos anteriores ms la frecuencia absoluta del intervalo actual. La ltima
frecuencia absoluta acumulada deber ser igual a N.
FA= Fa-1 +fi
La Frecuencia Absoluta Acumulada del ltimo intervalo es igual al tamao de la muestra (o
poblacin). Siguiendo con el ejemplo, tenemos:
Grado de aceptacin 1: Fa1 = 0
Grado de aceptacin 2: Fa2 = 0 + 1 = 1
Grado de aceptacin 3: Fa3 = 1 + 2 = 3
Grado de aceptacin 4: Fa4 = 3 + 3 = 6
Grado de aceptacin 5: Fa5= 6 + 4 = 10
10
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Esta frecuencia nos proporciona de inmediato el nmero de casos que queda por debajo
de cada clase. La Fa4, por ejemplo, nos dice que seis personas opinaron que la ejecucin
del proyecto de construccin de carretera se encontraba entre muy malo y bueno.
Frecuencia Relativa (h): Equivale a la razn de las frecuencias de cada intervalo
sobre la totalidad de los datos.
Matemticamente se expresa: hi = fi / n
h2
1
0.1 10%
10
Grado de aceptacin 3:
h3
2
0.2 20%
10
Grado de aceptacin 4:
h4
3
0.3 30%
10
Grado de aceptacin 5:
h5
4
0.4 40%
10
La sumatoria de las frecuencias relativas debe ser igual a 1 (si se trabaja estos valores
como porcentaje, equivaldra al 100% de los datos). El 40% de las personas encuestadas
(h5), opinaron que al realizar el proyecto de construccin sera excelente.
Frecuencia Relativa Acumulada (Hi): Presenta un saldo acumulado de las frecuencias
relativas de cada intervalo de clase. Su clculo resulta de la suma del acumulado de las
frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo
actual. Hi = Hi-1 + hi
fi
0
1
Fa
0
1
hi
0,0
0,1
Hi
0,0
0,1
0,2
0,3
0,3
0,6
10
0,4
1,0
TOTAL
10
1,0
11
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Caractersticas de las Tabla de frecuencia simple
El nmero de posibles valores que toma la variable debe ser reducido (Rango
pequeo).
Suele ser utilizada en la cuantificacin de las variables cualitativas y cuantitativas
discretas.
Su construccin es sencilla y equivale a especificar la frecuencia de cada resultado.
Ejercicio Propuesto
Por ejemplo, se quiere saber la cantidad de Poblacin Econmicamente Activa (PEA) en 50
familias de la zona rural, con el propsito de terminar que familias sern las beneficiarias de un
programa de ayuda social, se ha estimado que cada persona econmicamente activa aporta a
la familia un promedio de $125.
Como analista del programa ser necesario saber:
* Cul es el rango de PEA en los 50 hogares?
* Cul es la frecuencia de PEA en las 50 familias?
* Cul es la frecuencia relativa de la PEA en los 50 familias?
* Cul es el porcentaje de familias con 3 o ms personas econmicamente activas?
* Realizar el anlisis correspondiente de acuerdo a las respuestas de las interrogantes antes
sealadas.
Nmero de PEA en 50 hogares
2
Ministerio de Hacienda
Direccin General del Presupuesto
Intervalo de clase: Intervalos empleados en las Tablas de Frecuencias Estadsticas, capaz de
contener diversas medidas de una variable. Consta de un lmite inferior (Lm) y un lmite superior
(Ls).
Otro punto importante que el estadista debe definir, es la cantidad de intervalos de clase
que emplear en la tabla de frecuencia. Esta cantidad de intervalos no debera ser grande,
debido a que no se cumplira el objetivo de resumir la informacin, y no tan pocos
intervalos, ya que se perdera mucha informacin.
No existe una frmula, ni unos principios nicos para establecer el nmero de intervalos.
Para nuestro propsito, optaremos por manejar un nmero de intervalos convenientes
entre 5 y 15.
Algunos autores han propuestos frmulas que permiten ayudar en la tarea de conseguir el
nmero ideal de intervalos.
Numero de intervalos (Nc): Cantidad de intervalos con los cuales se compone una tabla de
frecuencia.
Cuando se trabajan con muestras mayores a 225, con la frmula se obtiene un Nc superior
a 15, por tanto, recomendaremos para estos casos la siguiente frmula: 1 + 3,22 log n
Si en ambas frmulas obtenemos un Nc mayor a 15, simplemente tomaremos 15
intervalos. El estadista podr omitir los resultados de las frmulas y conseguir
seleccionar el nmero de intervalos que crea que son los ms adecuados, de acuerdo al
objeto de estudio o las caractersticas que desea mostrar de la variable.
Cada intervalo posee un nmero mximo de resultados que puede agrupar. A este valor
lo conoceremos como el Ancho del Intervalo de Clase (A).
Ancho del intervalo de Clase (A): Equivale a la diferencia entre el Lmite superior (Ls) y el Lmite inferior (Lm)
de cada intervalo. Matemticamente se expresa:
A = Ls Lm
Su clculo resulta de la divisin del Rango (R) entre el Nmero de Intervalos (Nc)
A = R / Nc
13
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplo con Datos de ingresos de 24 familias.
Variable: Ingresos semanales en US$ por familia, n = 24 datos.
1,450
1,480
1,425
1,304
1,443
1,355
1,360
1,260
1,536
1,350
1,430
1,328
1,394
1,430
1,450
1,304
1,623
1,520
1,680
1,360
1,650
1,550
1,540
1,600
Antes de elaborar la tabla de frecuencia, debemos definir cul de los dos tipos propuestos
es el que mejor se adapta (tabla de frecuencia simple o tabla de frecuencia con datos
agrupados en clases)
Si resumimos los datos en una tabla de frecuencia simple, tendramos una tabla muy
extensa, en la cual algunas frecuencias de los ingresos de las familias serian 0. Esto se
debe a que el rango manejado es muy amplio (R =$1,680 $1,260 = 420).
Ingresos
1,260
1,304
1,328
1,350
1,355
1,360
1,394
1,425
Frecuencia (fi)
1
2
1
1
1
2
1
1
1,430
,,,,,
1,680
TOTAL
1
24
14
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Se debe siempre aproximar el nmero de intervalos al entero ms prximo, recordando
que este valor no ser menor a 5, ni un valor mayor a 15. Nuestra tabla estar constituida
por cinco intervalos.
Paso 2: Determinar el ancho de cada intervalo
Antes de hallar el ancho de los intervalos de clase, se debe calcular el rango (R) como
primera medida. En nuestro ejemplo el rango fue calculado anteriormente cuyo resultado
fue igual a $420.
Con el Rango y el nmero de intervalos, podremos hallar el ancho:
A = R / Nc
A = 420/5 = 84
Paso 3: Determinar los intervalos de clases
Con el valor mnimo de la serie como punto de partida y el ancho de clase, se procede a
construir los intervalos de clase. El primer intervalo parte del valor mnimo equivalente al
lmite inferior del primer intervalo, al cual le agregamos el ancho del intervalo de clase con
lo cual obtenemos el lmite superior; el segundo intervalo se construye a partir del valor
siguiente al lmite superior calculado en el primer intervalo, constituyndose de esta
forma en el lmite inferior, a dicho valor se le suma el ancho de clase con lo cual se obtiene
el lmite superior, y as sucesivamente se van construyendo el resto de intervalos.
Continuando con nuestro ejemplo en el cual se determin que el nmero de intervalos
(Nc) es igual a 5, y que el ancho de clase igual a 84, se procede a construir los intervalos
correspondientes:
INTERVALO
LIMITE INFERIOR
LIMITE SUPERIOR
1
2
3
4
5
1,260
1,345
1,430
1,515
1,600
1,344
1,429
1,514
1,599
1,684
Como se puede observar en los intervalos construidos, el ltimo lmite superior ($1,684)
cubre al valor mximo ($1,680) de la serie de datos de ingresos de las 24 familias, por
consiguiente se determina la valides del lmite superior del intervalo construido, puesto
que contempla el valor mximo de la serie de datos.
15
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Paso 4: Determinar las frecuencias absolutas, frecuencias relativas y marcas de clases
Un valor representativo de los intervalos en las tablas de frecuencia son las Marcas de
Clase.
Marcas de Clase (Mc): Se define como el punto medio de un intervalo de clase y se obtiene sumando los
lmites inferior y superior de la clase y dividiendo por 2.
Mc = Ls + Lm
2
LIMITE
INFERIOR
1,260
1,345
1,430
1,515
1,600
Total
LIMITE
SUPERIOR
1,344
1,429
1,514
1,599
1,684
fi
4
6
6
4
4
24
Fa
4
10
16
20
24
hi
0.167
0.250
0.250
0.167
0.166
1.000
Hi
0.167
0.417
0.667
0.833
1.000
Mc
1,302
1,387
1,472
1,557
1,642
Punto 2: Grficos
Los grficos son considerados como el mtodo de presentacin de la informacin ms
simple para el lector porque puede captar el panorama general o la tendencia de los datos
en una sola mirada. Es mucho ms fcil de comprender que una tabla o un texto. La
sencillez de lneas, una atractiva manera de presentacin, la posibilidad de usar las tres
dimensiones (3D), junto con colores, hacen de los grficos una de las herramientas ms
poderosas para transmitir ideas en forma rpida y simple al lector. Su desventaja ms
notoria es la prdida de precisin y exactitud, si se le compara con una tabla.
Componentes de un grfico:
Un grfico para que sea de fcil comprensin para el lector deber estar compuesto de
las partes siguientes:
a.- Ttulo del grfico, hace referencia que situaciones se quiere representar.
b.- Cuerpo del grfico o grfico propiamente dicho (incluye leyenda en el eje de las x y
eje de las y de ser necesarias).
c.- Fuente de informacin (se coloca como pie del grfico la fuente de informacin de la
que se recopilo la informacin para hacer el grfico).
16
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
A continuacin se describirn de forma breve los grficos ms utilizados:
Diagramas de barras:
Se llama as porque las frecuencias de cada categora de la distribucin se hacen figurar
por trazos o columnas de longitud proporcional (verticales u horizontales), separados unos
de otros. Se usa fundamentalmente para representar distribuciones de frecuencias de una
variable cualitativa o cuantitativa discreta, y ocasionalmente en la representacin de
series cronolgicas o histricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean
absolutas o relativas (%), y el otro para la escala de clasificacin utilizada.
Existen tres principales clases de grficos de barras:
Barra simple: se emplean para graficar hechos nicos.
Representacin variables cualitativas
Ejemplo:
3,300,000
3,250,000
3,200,000
3,150,000
3,100,000
3,050,000
3,000,000
2,950,000
2,900,000
2,850,000
2,800,000
Total de Hombres
Total de Mujeres
Barras mltiples: es muy recomendable para comparar una serie estadstica con otra,
para ello emplea barras simples de distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra.
Ejemplos:
Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplo:
45.0
40.0
35.0
30.0
25.0
20.0
15.0
10.0
5.0
0.0
22.8
12.3
2005
21.2
23.8
25.8
25.3
12.0
11.2
12.2
2009
2010
2011
9.6
10.8
12.4
2006
2007
2008
Pobreza Relativa
28.3
27.6
Pobreza Extrema
Zona Central ,
13.3%
Pictogramas
Es un grfico con dibujos alusivos al carcter que se est estudiando y cuyo tamao es
proporcional a la frecuencia que representan, dicha frecuencia se suele indicar.
Algunas caractersticas de este tipo de grfico son:
Su formato es libre.
Emplean una secuencia de smbolos para representar frecuencias.
Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.
18
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplos de Pictograma: Plantacin de rboles por mes y nacimientos por departamentos.
Numero de nacimientos
Nacimientos 2009
30,000
25,000
20,000
15,000
10,000
5,000
0
Departamento
Grafico Lineal: Consiste en un conjunto de lneas o segmentos de recta que muestran los
cambios que experimenta una determinada variable cuantitativa, generalmente, en
funcin del tiempo. En el eje horizontal se describe el tiempo y en el eje vertical la
frecuencia con que aparece la unidad de tiempo.
Ejemplo: Ingresos Anuales de remesas familiares.
Ministerio de Hacienda
Direccin General del Presupuesto
1
2
3
4
5
Total
LIMITE
INFERIOR
1,260
1,345
1,430
1,515
1,600
LIMITE
SUPERIOR
1,344
1,429
1,514
1,599
1,684
fi
4
6
6
4
4
24
Mc
1,302
1,387
1,472
1,557
1,642
INTERVALO
6
5
1,557
1,642
4
3
2
1
0
1,302
1,387
1,472
Marca de Clase
Grficos que Representan Dos tipos de Escalas (utilizacin de eje principal y eje
secundario): este tipo de grficos es muy utilizado cuando se quiere presentar
informacin que utiliza dos tipos de escala de medicin diferentes por ejemplo cantidades
porcentajes y nmeros enteros.
Ejemplo: Remesas en El Salvador y PIB nominal.
4,000
20.0
18.0
16.0
14.0
12.0
10.0
8.0
6.0
4.0
2.0
0.0
Millones de US$
3,500
3,000
2,500
2,000
1,500
1,000
500
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
2.3
Ministerio de Hacienda
Direccin General del Presupuesto
3. Dentro de los grficos ms utilizados para representar variables cualitativas se
encuentran los grficos de barras, de sectores y pictogramas, sin embargo los grficos de
barras tambin son utilizados para la representacin de variables cuantitativas, as como
los grficos de lneas que se utilizan principalmente para representacin de series
cronolgicas.
Es importante mencionar que si se desea representar dos tipos de escalas en un grfico,
puede ser til la utilizacin de dos ejes uno principal y uno secundario, en el que en cada
eje se especifique la escala de medicin que se utilice, lo cual facilitar la comprensin del
lector.
2.4 Bibliografa
1. Gildaberto Bonilla, Estadstica I, Elementos de Estadstica Descriptiva y
Probabilidad.
2. Jhonson, R y Kuby, P. (1999). Estadstica Elemental, lo Esencial. Mxico: Thomson.
3. Martnez Bencardino, Ciro. (2006). Estadstica Bsica Aplicada. Colombia: ECOE
EDICIONES, 3 ED.
4. Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica.
McGrawHill.
5. Juan Carlos Vergara Schmalbach y Vctor Manuel Quesada Ibarguen, Estadstica
Bsica con Aplicaciones en Excel.
Objetivos de la Leccin 3
Proporcionar conocimientos sobre la utilidad prctica que tienen las medidas de posicin
central y no centrales, en el diseo de programas puesto, que estos pueden simplificar un
conjunto de datos por medio de un solo nmero e indicar donde se concentran los
valores de estudio e identificar de una mejor manera la poblacin objetivo beneficiaria de
una intervencin.
21
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
3.2
Definiciones clave
Media aritmtica y geomtrica, mediana, moda, cuartil, quintil, decil, percentil.
Ministerio de Hacienda
Direccin General del Presupuesto
recomendable usar la media como medida central en las distribuciones muy asimtricas
ya que podra no ser una medida muy representativa; ejemplos: el nmero de hijos
promedio de las familias de cierto pas puede no ser un valor muy representativo, ya
que si sale elevado puede ser ocasionado porque en algunas rea del pas la poblacin
tiene un nmero elevado de hijos y dicho dato no se puede inferir a la poblacin total
ya que no sera representativo, as tambin el PIB per cpita, considerado como el
promedio de ingresos al ao que reciben las personas de determinado pas puede no
ser una variable muy representativa, por lo que ciertos analistas utilizan para
determinar el promedio de ingresos por persona el llamado salario modal es decir el
salario que ms se repite.
Media aritmtica ponderada
Cuando el nmero de observaciones es grande, las operaciones para calcular la media
se simplifican si agrupamos los datos en una tabla de frecuencias. La frmula
matemtica est dada por:
k
x f
i 1
i i
n
Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el
punto medio de cada clase en vez de x (marca de clase).
Por otra parte, la media aritmtica de una muestra dividida en submuestras, es igual, a
la media ponderada de las submuestras, tomando como ponderacin los tamaos de
las submuestras. Esto es,
m
x n
i
i 1
donde n n1 n2 ... nm
23
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Media ponderada
3. La siguiente tabla muestra el porcentaje de desempleo de la PEA y el nmero de
personas de la PEA de algunos municipios seleccionados de cierta regin.
Municipio % de desempleo
PEA
X
4.5
74520
Y
7.6
126310
Z
8.3
98760
Cul es el promedio de desempleo para la regin.
4. Suponga que en junio un inversionista compr 300 acciones del Banco Agrcola a un
precio de $ 20 por accin, en agosto compr 400 acciones ms a $ 25 cada una, y en
noviembre 400 a $ 23 por accin. Cul es el precio medio ponderado por accin.
Solucin
24
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
25
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Solucin:
Primero ordenar los datos de menor a mayor: 218, 234, 239, 243, 254, 261, 267, 287,
310, 311, 320. La posicin donde se encuentra la mediana: (11+1)/2=6, la mediana se
encuentra en la sexta posicin y corresponde al valor de: Md=261.
b) Cuando los datos son pares: La mediana ser el trmino medio de los dos valores
centrales.
Ejemplo: Consideremos los salarios en dlares para 12 vendedores; los cuales se han
presentado ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311,
320 y 322: Calcular la mediana.
Solucin:
Para obtener la posicin central se aplica la siguiente frmula: (N+1)/2
(12+1)/2
= 6.5, entonces la mediana corresponde al promedio de los dos valores sombreados,
esto es: Md=(261+267)/2=264.
Punto 2. Medidas de Dispersin
Las medidas de dispersin estudian la separacin existente entre los diversos valores
que toma la variable. Se dividen en medidas de dispersin absoluta y relativa. Las
absolutas suelen hacer referencia a un promedio, y permiten estudiar su
representatividad. En este tipo de medidas depende de las unidades, lo que es un
inconveniente para realizar comparaciones entre poblaciones. En este sentido, las
medidas de dispersin relativas no dependen de las unidades y permiten comparar
variabilidad entre poblaciones.
VARIANZA
La varianza es una medida de dispersin que sirve para estudiar la representatividad de
la media. Viene definida como la media de las diferencias cuadrticas de las
puntuaciones respecto a su media aritmtica. Normalmente a partir de la varianza se
obtiene la desviacin tpica o estndar y se define como la raz cuadrada positiva de la
varianza, a continuacin se presentan dichas frmulas:
26
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
COEFICIENTE DE VARIACIN
En ocasiones puede interesar comparar la dispersin de dos muestras y la desviacin
tpica no es vlida, si las dos muestras tienen unidades diferentes. Para evitar este
inconveniente se define el coeficiente de variacin CV como:
Utilidad del coeficiente de variacin
GRADO EN QUE LA MEDIA
REPRESENTA AL CONJUNTO DE
VALOR DEL C.V.
DATOS
0-<10%
Media altamente representativa
10% - < 20%
Media bastante representativa
20% - < 30%
Media tiene representatividad
30%- < 40%
Media con representatividad dudosa
40% o ms
Media carente de representatividad
1
57
80
2
55
40
3
54
62
4
52
72
5
62
46
6
55
80
7
59
35
Solucin.
Podemos notar que B ha tenido mayores notas que A en algunas pruebas, pero
tambin ha tenido menores notas que A. El rendimiento de A de alguna manera fue
constante. Analicemos la media y la desviacin para cada uno.
Candidato A:
27
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Candidato B:
Cuartil 1
25 %
Cuartil 2
50 %
Cuartil 3
75 %
Cuartil 4
100%
Frmula General:
Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la frmula:
Qk = k (N/4)
28
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Donde:
Qk = Cuartil nmero 1, 2, 3 4
N = total de datos de la distribucin.
Para cada cuartil, su ecuacin se establece as:
Q1 = 1 (N / 4)
Q2 = 2 (N / 4)
Q3 = 3 (N / 4)
Q4 = 4 (N / 4)
Ministerio de Hacienda
Direccin General del Presupuesto
Es el decil i-simo, donde la i toma valores del 1 al 9. El (i*10) % de la muestra
son valores menores que l y el 100-(i*10) % restante son mayores.
Ejemplo de medidas de posicin:
Una empresa prestigiosa asegura que sus empleados tienen salarios superiores al
salario mnimo. Se toma una muestre de 15 personas y sus salarios fueron: 300, 275,
180, 325, 200, 250, 350, 260, 280, 310, 400, 380, 260, 290, 370. Calcular Q1, Q2 y Q3, del
salario en dlares, deciles 1 y 7 y percentil 50 y 70.
Solucin:
Recordemos que: Q1 = 1 (N / 4)
Q2 = 2 (N / 4)
Q3 = 3 (N / 4)
Para encontrar los cuartiles necesitamos tener los datos ordenados de menor a mayor,
esto es:
180, 200, 250, 260, 260, 275, 280, 290, 300, 310, 325, 350, 370, 380, 400.
Luego hacemos los respectivos clculos:
1(15)
3.75 , ste valor es el que se encuentra en la posicin 4, luego: Q1 260
4
2(15)
Q2
7.5 , ste valor es el que se encuentra en la posicin 8, luego Q2 290
4
3(15)
Q3
11.25 , ste valor es el que se encuentra en la posicin 12, luego Q3 350
4
Q1
30
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Percentiles:
Encontrar los percentiles P50 y P70 del salario de los 15 trabajadores anteriores.
Pi = i (N /100)
50(15)
P50
7.5 , ste valor es el que se encuentra en la posicin 8, as: P50 290
100
Que coincide con el valor de Q2 .
70(15)
P70
10.5 , ste valor es el que se encuentra en la posicin 11, as: P70 325
100
Que coincide con el valor de D7 .
De aqu se puede observar que el 50% de los trabajadores gana menos de $290.
3.3. Conclusiones/Ideas fuerza a tener presente
1. Las medidas de tendencia central simplifican la informacin de un conjunto de
datos y que brindan informacin sobre donde se encuentran ms concentrados.
2. Cuando existe mucha disparidad en los datos la media puede no ser una medida
muy representativa, ya que sesgara la informacin; para estos casos pueden
considerarse otras medidas de tendencia central como la moda o la mediana.
3. Las medidas de posicin no centrales son muy tiles principalmente en el anlisis
de informacin econmica, puesto que ayudan a determinar por ejemplo en que
segmentos de la poblacin se concentran ms los ingresos.
3.4 Bibliografa
1. Introduccin a la Probabilidad y Estadstica Inferencial, Dr. Nerys Funes
2. http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
3. http://www.vitutor.com/estadistica/descriptiva/a_1.html
Ministerio de Hacienda
Direccin General del Presupuesto
4.1
Objetivos de la Leccin 4
- comprender la utilidad de la regresin lineal
- identificar los diferentes tipos de correlacin lineal
- interpretar la confiablidad del modelo a travs de parmetros estadsticos.
4.2
Definiciones clave
Regresin lineal
Diagrama de dispersin
Coeficiente de determinacin,
Coeficiente de correlacin.
Punto 1: Regresin Lineal Simple
El anlisis de regresin: es una tcnica estadstica para investigar la relacin
funcional entre dos o ms variables, ajustando algn modelo matemtico. La
regresin lineal tiene una finalidad muy importante que es la de estimar los
valores de una variable con base a los conocidos de la otra.
Cuando es utilizado este modelo para predicciones, es importante que solo se
considere lo relevante de la variable independiente. Los valores de la variable
dependiente se predicen cuando es conocida la variable independiente.
Diagrama de Dispersin:
El diagrama de dispersin es la grfica donde se encuentran todos los puntos de
las observaciones, tanto de la variable dependiente (Y), como de la variable
independiente (X). El diagrama de dispersin puede revelarnos dos tipos de
informacin:
1) Relacin de las variables
2) Tipo de lnea o ecuacin de estimacin
El anlisis de un diagrama de dispersin puede mostrar varios tipos de
correlaciones entre las variables con un intervalo de confianza determinado. La
correlacin puede ser positiva (Y aumenta con X), negativa (Y disminuye con X), o
nula (las variables no estn correlacionadas).
El diagrama de dispersin es una de las herramientas bsicas de gestin de la
calidad, muy til al analizar las causas de un problema y para Identificar
oportunidades de mejora continua.
32
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Correlacin directa
Correlacin inversa
Correlacin nula
En este caso se dice que las variables son no correlacionadas y la nube de puntos
tiene una forma redondeada.
Y
Ministerio de Hacienda
Direccin General del Presupuesto
Si r > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Ejemplo: ingesta de nutrientes en nios y rendimiento escolar: los nios que
ingieren ms nutrientes tendrn mayor rendimiento escolar.
Si r < 0, la correlacin lineal es negativa (si sube el valor de una variable
disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms
se aproxime a -1.
Ejemplo: dispositivos de seguridad en la carretera y nmero de accidentes en
carreteras: mientras ms dispositivos de seguridad se implementen en carretera
ocurrirn menos accidentes de trnsito.
Si r = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (parablica, exponencial, etc.)
Ejemplo: nmero de cigarrillos diarios y estatura de fumadores.
Coeficiente de determinacin (r2): una vez ajustada la recta de regresin a la
nube de observaciones es importante disponer de una medida que indique la
bondad del ajuste (discrepancia entre los valores observados y los valores
esperados en el modelo de estudio, mientras menor sea esa diferencia mejor es
la bondad de ajuste del modelo) realizado y que permita decidir si el ajuste lineal
es suficiente o se deben buscar modelos alternativos.
El coeficiente de determinacin se encuentra entre los valores 0 y 1, pero sin
olvidar que un r2 cercano a 1 indica una fuerte correlacin entre X y Y,
mientras que un r2
cercano a 0 significa que las variables tienen poca
correlacin. El coeficiente de determinacin resulta al elevar al cuadrado el
coeficiente de correlacin (r).
Parmetros para determinar la significancia del coeficiente de determinacin
Valor
Significado
Correlacin nula
Correlacin moderada
Correlacin perfecta
34
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Clculo de los coeficientes de la recta de regresin.
Los coeficientes y
siguientes frmulas:
de la recta de regresin
, donde
y :
( xi x )( yi y )
i 1
(x
i 1
x ) 2 ( yi y ) 2
i 1
Solucin
Estudiante
1
2
3
4
5
6
7
8
9
10
Total ()
En este caso
Puntuacin del
examen de
aprovechamiento
39
43
21
64
57
47
28
75
34
52
460
Calificacin
final
65
78
52
82
92
89
73
98
56
75
760
1521
1849
441
4096
3249
2209
784
5625
1156
2704
23634
2535
3354
1092
5248
5244
4183
2044
7350
1904
3900
36854
4225
6084
2704
6724
8464
7921
5329
9604
3136
5625
59816
35
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
( xi x )( yi y )
r 2 n i 1
n
( xi x ) 2 ( yi y ) 2
i 1
i 1
36
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
La importancia que han tenido las remesas en la economa salvadorea es muy
relevantes estas representan en el periodo de 2000-2011 aproximadamente un
16% del PIB a precios corrientes.
Con la informacin proporcionada, se puede generar la recta de regresin
utilizando una hoja de clculo de Excel lo que facilitara la obtencin de
informacin, dicho modelo estadstico podemos decir lo siguiente:
1. El diagrama de regresin nos dice que existe una correlacin directa entre
las variables (x) y (y) es decir a mayor flujo de remesas mayor PIB a precios
corrientes.
2. El coeficiente de determinacin es 0.8993 es decir que existe una
correlacin intensa entre las variables.
3. Segn la recta de mnimos cuadrados, al incrementarse en un milln de
dlares las remesas familiares el PIB corriente aumentara en 4.1616
millones, y cuando no se perciba ningn flujo de remesas el PIB sera
positivo pero disminuir drsticamente.
Ejercicios propuestos
1. Para los hogares salvadoreos, disponemos del promedio mensual
redondeados sobre los gastos en productos alimenticios ($Y) e ingresos
promedio del hogar ($X), tomados de una muestra de hogares, para el
perodo 2005- 2012.
Ao
Yt
Xt
2005
258
381
2006
273
402
2007
289
426
2008
308
454
2009
331
486
2010
355
520
2011
377
553
2012
400
590
Considerando que los gastos se puede expresar como funcin lineal de los
ingresos (Yt=a+bXt), determine:
a) Los estimadores de los parmetros a y b de la recta de regresin.
b) El coeficiente de determinacin de dicha regresin.
d) La prediccin del valor que tomar el gasto para un hogar que tiene
ingresos de $650.
2. Se supone que se puede establecer cierta relacin lineal entre las
exportaciones de un pas y la produccin interna de dicho pas. Por
ejemplo, tenemos los datos anuales (expresados en miles de quintales de
maz) para tales variables correspondientes al quinquenio 2008-2012 en la
siguiente tabla:
37
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Ao
2008
2009
2010
2011
2012
Produccin
52654
53972
57383
61829
65381
Exportaciones
10420
11841
14443
16732
18760
Ministerio de Hacienda
Direccin General del Presupuesto
o Grado de asociacin de las variables de estudio: dicho anlisis puede
determinarse a travs del coeficiente de correlacin, sin embargo en la prctica
se utiliza ms el coeficiente de determinacin puesto que es una medida de
bondad de ajuste, es decir puede ayudarnos a decidir si el ajuste lineal es
suficiente o se deben buscar modelos alternativos.
o Determinar la tendencia: los grficos de dispersin nos indican la tendencia
que tienen las variables en estudio y si existe grficamente algn tipo de
relacin entre ellas.
o Para prediccin y estimacin.
Algunos casos de esta utilidad del anlisis de regresin son:
a) La respuesta de un cultivo al variar la cantidad de los fertilizantes; el
objetivo puede ser establecer la forma de la relacin, o predecir la
combinacin optima de fertilizantes.
b) La relacin entre varias medidas meteorolgicas y la produccin del cultivo;
el ms obvio objetivo podra ser tratar de entender los efectos
meteorolgicos sobre el crecimiento del cultivo.
4.4 Bibliografa
1.
2.
3.
4.
39
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
ser trabajo, educacin y capacitacin, salud, relaciones interpersonales, empleo del
tiempo libre, etctera.
Cuando los datos se obtengan de manera directa, ser necesario apoyarse en el
muestreo, disear el instrumento de recoleccin, coordinar la recopilacin de datos y su
procesamiento, para finalmente hacer en anlisis de la informacin y efectuar el informe
o informes finales en que se basar la toma de decisiones.
Ministerio de
Hacienda
Direccin de electrnica
Pgina Oficial:
http://www.bcr.gob.sv
Pgina Oficial:
http://www.mh.gob.sv
Base de datos:
http://www.transparenciafiscal.gob.sv/portal/page/portal/PT
F/estadisticas
40
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Direccin Generalde Estadsticas y
Censos de El
Salvador
-
Pgina Oficial:
- Estadsticas Sociales (pobreza,
empleo, vivienda, poblacionales,
educativas, salud y acceso a
servicios bsicos).
-
Ministerio de
Agricultura y
Ganadera
http://www.digestyc.gob.sv
Base de datos:
informacin de la EHPM:
http://www.digestyc.gob.sv/index.php/temas/des/ehpm/res
ultados-encuesta.html
Estadsticas econmicas:
http://www.digestyc.gob.sv/index.php/temas/ee.html
Censo de Poblacin y vivienda 2007 (redatan):
http://www.digestyc.gob.sv/servers/redatam/htdocs/CPV200
7P/index.html
Pgina Oficial:
http://www.mag.gob.sv
Estadsticas Agropecuarias
Base de datos:
http://www.mag.gob.sv/index.php?option=com_phocadownl
oad&view=section&id=9:estadisticas-de-produccionagropecuaria&Itemid=221
Pgina Oficial:
http://www.fiscalia.gob.sv
Base de datos:
http://www.fiscalia.gob.sv/index.php/estadisticas-2/
Fiscala General de
la Repblica
Estadsticas de Seguridad Pblica
Polica Nacional
Civil
Pgina Oficial:
http://www.seguridad.gob.sv
Base de datos:
http://www.pnc.gob.sv/core/index.php/oir/estadisticas
Pgina Oficial:
http://www.salud.gob.sv
Ministerio de Salud
Estadsticas de Salud
Base de datos:
http://www.salud.gob.sv/index.php/oir/estadisticas
Pgina Oficial:
www.isss.gob.sv
Instituto
Salvadoreo del
Seguro Social
Ministerio de
Turismo
Estadsticas de Turismo
Base de datos:
http://www.isss.gob.sv/index.php?option=com_docestandar
&view=docestandar&categoria=44&showview=0&Itemid=234
Pgina Oficial:
http://www.mitur.gob.sv
Base de datos:
http://www.mitur.gob.sv/uaip/estadisticas.html
41
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Y= a + bX
FORMULA:
Y= 665.35 + 88.41 X
Y=
Y=
Y=
Y=
donde:
665.35
665.35
665.35
665.35
+
+
+
+
88.41
88.41
88.41
88.41
X=
Y=
n=
NUMERO DE PERIODOS
a =
Y - bX
n
b =
(14) = 1,903.09
(15)= 1,991.5
(16)= 2,079.91
(17)= 2,168.32
nXY - XY
nX 2 - ( x ) 2
TABLA DE DATOS:
AO
X (PERIODO)
Y (DATOS)
XY
X2
2000
2001
2002
2003
2004
2005
2006
2007
799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7
799.8
1,732.6
2,711.7
3,841.2
5,131.0
7,019.4
9,537.5
12,054.4
14,536.8
12,562.0
17,221.1
21,618.0
24,189.1
1.0
4.0
9.0
16.0
25.0
36.0
49.0
64.0
81.0
100.0
121.0
144.0
169.0
16,694.9
132,954.6
819.0
2008
2009
10
2010
11
2011
12
2012
13
2013
2014
2015
2016
91
14
15
16
17
1,903.1
1,991.5
2,079.9
2,168.3
b =
209,177.80
2366
b =
88.41
LOS DATOS DE ESTUDIO QUE SE REQUIEREN OBTENER SE OBTIENEN SUSTITUYENDO LOS VALORES OBTEN
LOS COEFICIENTES "a" Y "b", y "X=14,15,16 Y 17" , EN ECUACION Y=A+BX
a =
Y - bX
n
a =
8649.55
13
a =
665.35
42
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
REGRESIN LINEAL CONSIDERANDO AL PIB COMO VARIABLE INDEPENDIENTE
Con los datos del ejemplo:
Y= a + bX
FORMULA:
Y= -455.05 + 0.095 X
Y= -455.05+0.095 (26,163.4)= 2,030.5
Y= -455.05+0.095 (28,016.3)= 2,206.5
Y= -455.05+0.095 (29,942.4)= 2,389.5
Y= -455.05+0.095 (32,068.5)= 2,591.5
donde:
X=
Y=
n=
NUMERO DE PERIODOS
a =
Y - bX
n
b =
nXY - XY
nX2 - ( x ) 2
TABLA DE DATOS:
X (PIB a Precios
Corrientes)
Y (DATOS)
XY
X2
2012
13,134.1
13,812.7
14,306.7
15,046.7
15,798.3
17,093.8
18,550.7
20,104.9
21,431.0
20,661.0
21,427.9
23,054.1
24,304.0
799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7
10,504,653.2
11,965,942.0
12,931,826.1
14,449,346.0
16,212,215.5
19,998,036.6
25,275,328.8
30,294,063.3
34,615,351.2
25,954,348.2
33,546,448.8
41,531,961.2
45,222,452.8
172,504,582.8
190,790,681.3
204,681,664.9
226,403,180.9
249,586,282.9
292,197,998.4
344,128,470.5
404,207,004.0
459,287,761.0
426,876,921.0
459,154,898.4
531,491,526.8
590,684,416.0
2013
2014
2015
2016
238725.9
26,163.4
28,016.3
29,942.4
32,068.5
16,694.9
322,501,973.7
4,551,995,388.9
AO
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
b =
b =
2,030.5
2,206.5
2,389.5
2,591.5
207,032,566.16
2185884725
0.095
LOS DATOS DE ESTUDIO QUE SE REQUIEREN OBTENER SE OBTIENEN SUSTITUYENDO LOS VALORES OBTENIDOS PARA
LOS COEFICIENTES "a" Y "b", y "X=14,15,16 Y 17" , EN ECUACION Y=A+BX
a =
Y - bX
n
a =
-5915.690764
13
a =
-455.05
Mtodo de Tendencias: Este mtodo se fundamenta en gran medida en la tendencia histrica de los datos,
con nfasis en el primero y el ltimo dato de la serie histrica, sobre el clculo de una tasa de variacin (de
carcter compuesto), llamada Tasa Promedio de Crecimiento (Tpc). Una vez obtenida esa Tasa, es posible
estimar el dato para el siguiente periodo. El dato obtenido en esta forma, es producto de la tendencia de la
serie histrica, por lo cual ser alcista si la serie ha sido creciente, y decrementalista si la serie es decreciente.
Como en todos los mtodos, sus resultados se debern tomar con cautela, y compararse con los obtenidos
por otros mtodos, con las condiciones macroeconmicas previstas por el BCR, y con variaciones previstas los
precios, cobros por servicios, tarifas, aranceles, etc.
43
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
Y (n+1) =
Yt + Tpc (Yt)
= [ ( Yt / Yo )
1/n
- 1.0 ] X 100
donde:
Y (n+1) =
Yt
Yo
n
Tpc
ao 2014 =
ao 2015 =
ao 2016 =
DATOS
REALES
2000
2001
2002
2003
799.8
866.3
903.9
960.3
2004
1,026.2
= [ ( 1,860.7
Tpc = [ ( 2.32 )
ao 2013 =
Tabla de Datos:
n
AO
1/13
- 1.0 ] X 100
2005
1,169.9
2006
1,362.5
2007
2008
2009
10
2010
11
2011
12
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
2012
13
Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)
= Yt + Tpc (Yt)
= 1,860.7+ 0.067105*(1860.7)
= 1,985.6
= 1,985.6+ 0.0671053*(1,985.6)
= 2,118.8
Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)
= 2,118.8+ 0.067105*(2,118.8)
= 2,260.9
= 2,260.9+ 0.067105*(2,260.9)
= 2,412.6
1,860.7
2013
14
1,985.6
2014
15
2,118.8
2015
16
2,260.9
2016
17
2,412.6
44
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal
Ministerio de Hacienda
Direccin General del Presupuesto
X (PERIODO)
Y (DATOS)
2000
2001
2002
2003
2004
2005
2006
2007
799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7
2008
2009
10
2010
11
2011
12
2012
13
2013
14
2014
15
2015
16
2016
17
Clculo
ao base
2001=2000
0.4*(866.3)+(1-0.4)*(799.8)
0.4*(903.9)+(1-0.4)*(826.4)
0.4*(960.3)+(1-0.4)*(857.4)
0.4*(1026.2)+(1-0.4)*(898.6)
0.4*(1169.9)+(1-0.4)*(1037.7)
0.4*(1362.5)+(1-0.4)*(1090.6)
0.4*(1506.8)+(1-0.4)*(1199.4)
0.4*(1615.2)+(1-0.4)*(1322.4)
0.4*(1256.2)+(1-0.4)*(1439.5)
0.4*(1565.6)+(1-0.4)*(1366.2)
0.4*(1801.5)+(1-0.4)*(1446)
Valores Estimados
1,985.6
0.4*(1860.7)+(1-0.4)*(1588.2)
2,118.8
0.4*(1985.6)+(1-0.4)*(1697.2)
2,260.9
0.4*(2118.8)+(1-0.4)*(1812.6)
0.4*(2,260.9)+(1-0.4)*(1935.1)
Pronosticos
799.8
826.4
857.4
898.6
1,037.7
1,090.6
1,199.4
1,322.4
1,439.5
1,366.2
1,446.0
1,588.2
1,697.2
1,812.6
1,935.1
2,065.4
45
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal