Вы находитесь на странице: 1из 45

Ministerio de Hacienda

Direccin General del Presupuesto

PLAN DE CAPACITACIN Y ASISTENCIA TCNICA PARA LA REFORMA


PRESUPUESTARIA
Mdulo III
ACTUALIZACIN DE CONOCIMIENTOS GENERALES

Curso 3

Conceptos y Mtodos Bsicos de Estadstica


MANUAL DEL PARTICIPANTE
[Edicin 9 de abril 2013]

1
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Elaborado por

Revisado por

: Rebeca Elizabeth Ramos


: Dr. Jos Nerys Funes Torres

Integrantes del Equipo de Instruccin:


DR. JOS NERYS FUNES TORRES
INGRID CAROLINA MARTNEZ
JOS DAVID ESCOBAR MUOZ
HCTOR DOUGLAS MOLINA GUEVARA
DANIEL ALEJANDRO RIVAS RIVAS
REBECA ELIZABETH RAMOS
Direccin y Supervisin del Plan de Capacitacin y Asistencia Tcnica: Roger DAZ,
Consultor GIZ.
Contenido
I. ASPECTOS GENERALES

II. DESARROLLO
LECCION 1: Consideraciones Generales de la Estadstica
Punto 1: Clasificacin de la Estadstica
Punto 2: Etapas o pasos mnimos necesarios para realizar un anlisis Estadstico
Punto 3: Tipos de Variables
LECCION 2: Tabulacin y Grficos
Punto 1: Tabulacin de la Informacin
Punto 2: Grficos
LECCION 3: Medidas de Posicin Centrales y no Centrales
Punto 1: Medidas de Posicin Central
Ejercicios propuestos de media aritmtica
Punto 2. Medidas de Dispersin
Punto 3: Medidas de Posicin no Centrales: Cuartiles, Quintiles, Deciles y Percentiles
LECCION 4: Anlisis de Regresin
Punto 1: Regresin Lineal Simple
Ejercicios propuestos
APENDICE 1: Fuentes de bsqueda de informacin
APENDICE 2: Mtodo de Prediccin

2
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
ASPECTOS GENERALES

I.

El curso desarrolla los mtodos bsicos de la estadstica descriptiva y la estadstica


inferencial para calcular medidas de tendencia central y dispersin e interpretarlas
comparativamente, y establecer criterios para realizar una prueba de hiptesis de
diferentes parmetros. El curso tambin orienta sobre las principales fuentes de datos
oficiales, tales como censos, encuestas, bases de datos especializadas, as como sobre las
principales herramientas de bsqueda de informacin en la web.
1.1

Objetivo general

Proveer a los participantes de las herramientas bsicas de anlisis tanto al momento de


elaborar diagnsticos de la problemtica como punto de partida para disear programas
presupuestarios, as como durante la ejecucin, seguimiento y evaluacin de programas.
1.2

Requisitos

Manual del participante (el alumno debe haber recibido y ledo con anticipacin el
contenido del manual)
Presentacin en Power Point a cargo del instructor
Manual del instructor el curso
Proyector Multimedia, Pizarra acrlica, Plumones
II.

DESARROLLO

LECCION 1: Consideraciones Generales de la Estadstica


Resumen de la leccin: Este curso desarrolla los conceptos generales de la estadstica
como: la estadstica descriptiva e inferencial, criterios generales que se deben tener en
cuenta para realizar un anlisis estadstico, as como la utilizacin de los diversos tipos de
variables a utilizar.
Tiempo total: 30 minutos
1.1

Objetivos de la Leccin

Al finalizar esta leccin los participantes sern capaces de:


a.
b.
c.

Diferenciar el alcance de la estadstica Descriptiva e Inferencial


Conocer los criterios bsicos para realizar anlisis estadstico
Diferenciar los diversos tipos de variables que se utilizan para el anlisis de datos

3
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

1.2

Desarrollo del contenido de la Leccin

Definiciones clave
Concepto de Estadstica
Clasificacin de la Estadstica
Tipos de variables estadsticas
Punto 1: Clasificacin de la Estadstica
La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos,
ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algn fenmeno o estudio aplicado. Sin embargo, la estadstica es ms que
eso, en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con
la investigacin cientfica.
La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos
relativos a un conjunto de objetos, personas, procesos, etc. A travs de la
cuantificacin y el ordenamiento de los datos intenta explicar los fenmenos
observados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones.
Bajo este contexto, la Estadstica se divide en dos reas: Estadstica Descriptiva y
Estadstica Inferencial.
Estadstica Descriptiva: permite organizar y presentar un conjunto de datos de manera
que describan en forma precisa las variables analizadas facilitando su lectura e
interpretacin. Obviamente, la materia prima de la Estadstica Descriptiva la constituyen
los datos.
Ejemplo: Se realiza una encuesta en el departamento de San Salvador para para deducir
las preferencias de votos para la prximas elecciones presidenciales, y se concluye que el
30% votara por el partido XXF, el 45% por el partido XXK y el resto equivalente al 25% por
el XXL.
Sin embargo, cuando existen limitantes (econmicas, tiempo, recurso humano, entre
otras) en las cuales es imposible obtener informacin de toda la poblacin, se toma una
parte de ella a la que se le llama Muestra el cual es definido como un subconjunto
representativo de una poblacin.
La Estadstica Inferencial: permite generalizar los resultados (datos estadsticos) de una
muestra a la poblacin total, es decir se realizan conclusiones o inferencias, basndose en
4
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
los datos simplificados y analizados en una muestra.
Ejemplo: En lnea con el ejemplo anterior la intencin de voto de los habitantes del
departamento de San Salvador se pudiese obtener a partir de una muestra representativa
tomada de los habitantes de los diferentes municipios del depto. y a partir de dichos
resultado se infieren las intenciones de voto de la poblacin, en este caso los habitantes
del dpto. de San Salvador.
Punto 2: Etapas o pasos mnimos necesarios para realizar un anlisis Estadstico
La estadstica suministra valores que ayudan a descubrir interrelaciones entre mltiples
parmetros, as como tambin es una herramienta til para realizar predicciones de
valores futuros.
Un anlisis estadstico es un proceso sistemtico en el cual se requiere realizar una serie
de etapas con el mayor grado de acuciosidad posible, estas se describen a continuacin:
1. Definicin del problema de estudio y objetivos del mismo.
2. Seleccin de la informacin necesaria para realizar el estudio.
3. Recogida de la informacin que va a depender del presupuesto con el que
contemos y de la calidad de los datos exigida.
4. Ordenacin y clasificacin de la informacin en tablas y grficos.
5. Resumen de los datos mediante medidas de posicin, dispersin, entre otras que se
consideren convenientes.
6. Anlisis estadstico formal obteniendo hiptesis y predicciones.
7. Interpretacin de resultados y extraccin de conclusiones.
Punto 3: Tipos de Variables
Las variables estadsticas son caractersticas que poseen todas las unidades de la
poblacin o muestra a estudiar.
Las variables que se observan y analizan pueden ser de dos tipos:
a) Variables cualitativas o atributos: no se pueden medir numricamente,
representan caractersticas o atributos de las variables (por ejemplo:
nacionalidad, sexo, religin).
a.1 Nominal: Caracterstica o cualidad cuyas categoras no tienen un orden
preestablecido. Ejemplos: Sexo, Deporte Favorito, etc.
a.2
Ordinal: Caracterstica o cualidad cuyas categoras tienen un orden
preestablecido.
Ejemplos: primero, segundo, tercero; Grado de Inters por un tema, etc.

5
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
b) Variables cuantitativas: toman valores numricos (edad, altura, precio de
producto, ingresos anual es).

un

Por su parte, las variables cuantitativas se pueden clasificar atendiendo a los


valores que pueden tomar en discretas y continuas:
b.1) Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
nmero de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca
podr ser 3.45).
b.2) Continuas: Son las variables que pueden adquirir cualquier valor dentro de
un intervalo especificado de valores. Por ejemplo la masa (2.3 kg, 2.4 kg, 2.5
kg,...) o la altura (1.64 m, 1.65 m, 1.66 m,...), o el salario. Solamente se est
limitado por la precisin del aparato medidor, en teora permiten que siempre
exista un valor entre dos valores numricos.

Discusin de los contenidos: Leccin 1.


1. Contestar verdadero o falso y comentar su respuestas segn sea el caso:
a) La Estadstica es una ciencia que estudia y describe las caractersticas de un
conjunto de casos. V___ F___
b) La estadstica inferencial generaliza los resultados de una muestra a los de la
poblacin total. V___ F___
c) Durante los ltimos dos das se ha informado de un total de cinco homicidios
diarios en San Salvador, este es un ejemplo de estadstica inferencial.
6
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
2.
3.
4.
5.

V___ F___
Establecer las diferencias entre variables cualitativas y cuantitativas.
Establecer las diferencias entre variables discretas y continuas.
Definir al menos dos ejemplos de variables discretas y de variables continuas.
De qu tipo de escala son las siguientes variables, respectivamente?
a. Nios, Jvenes, Adultos.
b. Ingeniera Elctrica, Mecnica, Qumica, de Sistemas.

De las cuatro alternativas siguientes, subraye la respuesta correcta:


A. Cualitativa y ordinal.
B. Ordinal y nominal.
C. Ambas cualitativas.
D. Ambas ordinales.
6. De las siguientes variables indica cules son discretas, continuas o cualitativas.
a) Tiempo de duracin de un automvil.
b) Nmero de hijos de 50 familias.
c) Nmero de empleados en la procuradura.
d) Nmero de goles marcados por tu equipo favorito en la ltima temporada.
e) Nmero de mdicos por ley de salario en el Hospital Rosales.
1.4

Conclusiones/Ideas fuerza a tener presente

1. La estadstica es la ciencia que facilita, el anlisis, presentacin e interpretacin de


datos.
2. La diferencia entre la estadstica descriptiva y la inferencial, es ms que nada el universo
de accin, la estadstica descriptiva trabaja con datos poblacionales la inferencia con una
muestra de esa poblacin y a travs de esa informacin infiere los datos poblacionales.
3. Las diferencias entre las variables cualitativas y cuantitativas es que las primeras se
refieren a atributos y las segundas reflejan un valor numrico.
4. Las variables cuantitativas a su vez pueden ser de dos tipos: discretas, cuando toman un
nmero entero y continuas cuando su valor puede oscilar entre dos nmeros.
1.5

Bibliografa
1. Gildaberto Bonilla, Estadstica I, Elementos de Estadstica Descriptiva y
Probabilidad.
2. Anderson Sweeney Williams, Estadistica para Administracin y Economia
3. http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
4. http://www.vitutor.com/estadistica/descriptiva/a_1.html

7
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
LECCION 2: Tabulacin y Grficos
Resumen de la leccin: Entre los principales elementos que contempla esta leccin se
encuentra la adopcin de herramientas que contribuyan a presentar los datos de una
manera ms ordenada y que facilite la comprensin del lector ya sea a travs de tablas de
frecuencias o de forma grfica.
Tiempo total: 1 horas
2.1
Objetivos de la Leccin 2
Al finalizar esta leccin los participantes sern capaces de:
a. Obtener criterios para presentar de una forma ms ordena la informacin utilizando
tablas de frecuencias.
b. Conocer la aplicabilidad de las tablas de frecuencias simples y tablas de frecuencias
para datos agrupados.
c. Adquirir elementos para utilizar la representacin grfica de la manera ms apropiada
considerando entre otros aspectos, el tipo de variable, escala de medicin, entre otras.
2.2

Desarrollo del contenido de la Leccin 2

Definiciones clave
Tabla de frecuencia simple, frecuencia absoluta, relativa y acumulada, rango, tabla de
frecuencia con datos agrupados en clases, intervalo de clases, ancho de clase, marca de
clase o punto medio, principales tipos de grficos.
Punto 1: Tabulacin de la Informacin
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla
de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Para
entender cmo funcionan las tablas de frecuencia, analicemos el siguiente ejemplo:
Ejemplo 1.: Suponga que se ha preguntado a 37 familias sobre el nmero de hijos. La
forma de simplificar los datos, equivale a contar cuantas familias tienen el mismo nmero
de hijos. A esta operacin la conoceremos como frecuencia absoluta.
N. de Hijos
0
1
2
3
4
5 o ms
Total

N. de Familias
4
7
8
5
10
3
37

8
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Se observa que 7 familias tienen solamente un hijo. Tambin, se puede tener inters en
conocer el porcentaje de familias que tienen 3 menos, para ello se requiere sumar el
nmero de familias que tienen: 0, 1, 2 o 3 hijos y dividirlo entre el total de familias, esto
es, ((4+7+8+5)/37)*100 = 64.86%, este valor se interpreta que aproximadamente el 65%
de las familias tienen 3 menos hijos.
Frecuencia Absoluta (fi): Nmero de veces que se repite un valor dentro de
un conjunto de datos.
Podemos identificar dos tipos de tablas de frecuencias, las cuales denotaremos como
tablas de frecuencia simple y tablas de frecuencias con datos agrupados.
1.1 Tabla de frecuencia simple
Se caracterizan por manejar un conjunto pequeo de posibles resultados de una variable
dentro de la muestra o poblacin. Por lo general, su uso tiende al manejo de datos
cualitativos o variables cuantitativas discretas.
Ejemplo 2. El gobierno est interesado en medir el grado de aceptacin que tendra si se
construyera una carretera cerca de cierta comunidad, para ello, se selecciona una muestra
de 10 personas del sector en que habitan. Para tal fin, se les pide que valoren dicho
proyecto empleando una escala del 1 al 5, su opinin sobre dicho proyecto (1 = Muy
Malo, 2= Malo, 3 = Regular, 4 = Bueno y 5 = Excelente). Las respuestas tabuladas de las
10 personas son:

Persona

Respuesta
(Grado de aceptacin)

10

SOLUCIN
Como se puede observar, el nmero de resultados que puede alcanzar la variable grado
de aceptacin son relativamente pocos (solo cinco posibilidades), lo cual sirve como
parmetro para catalogar la tabla de frecuencia resultante como tabla de frecuencia
simple.

9
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Otra forma de catalogar los datos es conociendo la distancia o variacin que hay entre el
valor menor (Xmin) y el valor mayor (Xmax), diferencia que se conoce como Rango.
Rango (R): Diferencia existente entre el valor Mximo (Xmax) y el valor Mnimo
(Xmin) de un conjunto de datos. La frmula empleada es: R= Xmax -Xmin
En el ejemplo R sera igual a 4 puesto que:
R= 5 -1 = 4
Si el rango manejado es pequeo, bastara representar los datos con una tabla de
frecuencia simple. Para crear esta tabla deberemos seguir los siguientes pasos:
PASO 1: Contar las veces que se repite cada valor dentro de la muestra.
PASO 2: Ubicar estas frecuencias en una tabla ordenada.
Grado de Aceptacin
1
2
3
4
5
Total

Frecuencia (fi)
0
1
2
3
4
10

Ninguna de las personas valor el proyecto de construccin de carretera como muy malo
(grado de aceptacin igual a 1), mientras que la mayora de las respuestas se centraron en
Excelente y Bueno (grado de aceptacin iguales a 5 y 4 respectivamente).
Observando los datos resumidos, podemos concluir que la mayora de las personas
encuestadas tienen una visin favorable del proyecto de construccin de la carretera. En
este ejemplo se visualiza, como la tabla de frecuencia agiliza el anlisis de los datos.
La estadstica considera otros tipos de frecuencias auxiliares que complementan el anlisis
de las tablas de frecuencia.
Frecuencia Absoluta Acumulada (Fa): Presenta un saldo acumulado de las frecuencias
de los intervalos. Esta frecuencia se calcula sumando el acumulado de las frecuencias
de los intervalos anteriores ms la frecuencia absoluta del intervalo actual. La ltima
frecuencia absoluta acumulada deber ser igual a N.
FA= Fa-1 +fi
La Frecuencia Absoluta Acumulada del ltimo intervalo es igual al tamao de la muestra (o
poblacin). Siguiendo con el ejemplo, tenemos:
Grado de aceptacin 1: Fa1 = 0
Grado de aceptacin 2: Fa2 = 0 + 1 = 1
Grado de aceptacin 3: Fa3 = 1 + 2 = 3
Grado de aceptacin 4: Fa4 = 3 + 3 = 6
Grado de aceptacin 5: Fa5= 6 + 4 = 10
10
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Esta frecuencia nos proporciona de inmediato el nmero de casos que queda por debajo
de cada clase. La Fa4, por ejemplo, nos dice que seis personas opinaron que la ejecucin
del proyecto de construccin de carretera se encontraba entre muy malo y bueno.
Frecuencia Relativa (h): Equivale a la razn de las frecuencias de cada intervalo
sobre la totalidad de los datos.
Matemticamente se expresa: hi = fi / n

Para el ejemplo, las frecuencias relativas son:


0
Grado de aceptacin 1: h1 0
10
Grado de aceptacin 2:

h2

1
0.1 10%
10

Grado de aceptacin 3:

h3

2
0.2 20%
10

Grado de aceptacin 4:

h4

3
0.3 30%
10

Grado de aceptacin 5:

h5

4
0.4 40%
10

La sumatoria de las frecuencias relativas debe ser igual a 1 (si se trabaja estos valores
como porcentaje, equivaldra al 100% de los datos). El 40% de las personas encuestadas
(h5), opinaron que al realizar el proyecto de construccin sera excelente.
Frecuencia Relativa Acumulada (Hi): Presenta un saldo acumulado de las frecuencias
relativas de cada intervalo de clase. Su clculo resulta de la suma del acumulado de las
frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo
actual. Hi = Hi-1 + hi

La ltima de las Frecuencias Relativas Acumuladas equivale a 1. Las tablas de frecuencias


suelen mostrar tanto las frecuencias absolutas, como relativas.
Grado de Aceptacin (Clase)
1
2

fi
0
1

Fa
0
1

hi
0,0
0,1

Hi
0,0
0,1

0,2

0,3

0,3

0,6

10

0,4

1,0

TOTAL

10

1,0

11
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Caractersticas de las Tabla de frecuencia simple
El nmero de posibles valores que toma la variable debe ser reducido (Rango
pequeo).
Suele ser utilizada en la cuantificacin de las variables cualitativas y cuantitativas
discretas.
Su construccin es sencilla y equivale a especificar la frecuencia de cada resultado.
Ejercicio Propuesto
Por ejemplo, se quiere saber la cantidad de Poblacin Econmicamente Activa (PEA) en 50
familias de la zona rural, con el propsito de terminar que familias sern las beneficiarias de un
programa de ayuda social, se ha estimado que cada persona econmicamente activa aporta a
la familia un promedio de $125.
Como analista del programa ser necesario saber:
* Cul es el rango de PEA en los 50 hogares?
* Cul es la frecuencia de PEA en las 50 familias?
* Cul es la frecuencia relativa de la PEA en los 50 familias?
* Cul es el porcentaje de familias con 3 o ms personas econmicamente activas?
* Realizar el anlisis correspondiente de acuerdo a las respuestas de las interrogantes antes
sealadas.
Nmero de PEA en 50 hogares
2

1.2 Tabla de Frecuencia con Datos Agrupados en Clases


Cuando el tamao de la poblacin y/o muestra y el rango de la variable son grandes, ser
necesario agrupar dichos valores en Intervalos de Clases.
Por ejemplo, en el caso de contar con una valoracin del 1 al 100 (un rango equivalente a
99), la tabla de frecuencia simple se encargara de buscar cuantas veces se repite cada
uno de los 99 posibles resultados en un conjunto de datos, teniendo una funcin contraria
a la de resumir los datos.
Agrupar los valores de la variable en intervalos podra simplificar estas fuentes de datos.
Por ejemplo, podramos hablar de las frecuencias para los valores comprendidos entre 020, 20-40, 40-60, 60-80 y 80-100.
En el intervalo 0-20 (que de ahora en adelante le llamaremos intervalo de clase), se
sumaran las frecuencias de los datos cuyos resultados estn entre 0 y 20.
12
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Intervalo de clase: Intervalos empleados en las Tablas de Frecuencias Estadsticas, capaz de
contener diversas medidas de una variable. Consta de un lmite inferior (Lm) y un lmite superior
(Ls).

Otro punto importante que el estadista debe definir, es la cantidad de intervalos de clase
que emplear en la tabla de frecuencia. Esta cantidad de intervalos no debera ser grande,
debido a que no se cumplira el objetivo de resumir la informacin, y no tan pocos
intervalos, ya que se perdera mucha informacin.
No existe una frmula, ni unos principios nicos para establecer el nmero de intervalos.
Para nuestro propsito, optaremos por manejar un nmero de intervalos convenientes
entre 5 y 15.
Algunos autores han propuestos frmulas que permiten ayudar en la tarea de conseguir el
nmero ideal de intervalos.
Numero de intervalos (Nc): Cantidad de intervalos con los cuales se compone una tabla de
frecuencia.

La primera, la ms conocida, establece el nmero de intervalos al obtener la raz cuadrada


del total de elementos considerados en el estudio.
Nc =

Cuando se trabajan con muestras mayores a 225, con la frmula se obtiene un Nc superior
a 15, por tanto, recomendaremos para estos casos la siguiente frmula: 1 + 3,22 log n
Si en ambas frmulas obtenemos un Nc mayor a 15, simplemente tomaremos 15
intervalos. El estadista podr omitir los resultados de las frmulas y conseguir
seleccionar el nmero de intervalos que crea que son los ms adecuados, de acuerdo al
objeto de estudio o las caractersticas que desea mostrar de la variable.
Cada intervalo posee un nmero mximo de resultados que puede agrupar. A este valor
lo conoceremos como el Ancho del Intervalo de Clase (A).
Ancho del intervalo de Clase (A): Equivale a la diferencia entre el Lmite superior (Ls) y el Lmite inferior (Lm)
de cada intervalo. Matemticamente se expresa:
A = Ls Lm
Su clculo resulta de la divisin del Rango (R) entre el Nmero de Intervalos (Nc)
A = R / Nc

13
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplo con Datos de ingresos de 24 familias.
Variable: Ingresos semanales en US$ por familia, n = 24 datos.

1,450
1,480
1,425
1,304

1,443
1,355
1,360
1,260

1,536
1,350
1,430
1,328

1,394
1,430
1,450
1,304

1,623
1,520
1,680
1,360

1,650
1,550
1,540
1,600

Antes de elaborar la tabla de frecuencia, debemos definir cul de los dos tipos propuestos
es el que mejor se adapta (tabla de frecuencia simple o tabla de frecuencia con datos
agrupados en clases)
Si resumimos los datos en una tabla de frecuencia simple, tendramos una tabla muy
extensa, en la cual algunas frecuencias de los ingresos de las familias serian 0. Esto se
debe a que el rango manejado es muy amplio (R =$1,680 $1,260 = 420).
Ingresos
1,260
1,304
1,328
1,350
1,355
1,360
1,394
1,425

Frecuencia (fi)
1
2
1
1
1
2
1
1

1,430

,,,,,

1,680
TOTAL

1
24

En el caso que queramos agrupar an ms estos datos, trabajaramos con el concepto de


intervalos de clase (tabla de frecuencia con datos agrupados en clases).

Paso 1: Determinar el nmero de intervalos (Nc)


Optaremos por utilizar la primera frmula expuesta: Nc n
Nc = 24 = 4.898 5

14
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Se debe siempre aproximar el nmero de intervalos al entero ms prximo, recordando
que este valor no ser menor a 5, ni un valor mayor a 15. Nuestra tabla estar constituida
por cinco intervalos.
Paso 2: Determinar el ancho de cada intervalo
Antes de hallar el ancho de los intervalos de clase, se debe calcular el rango (R) como
primera medida. En nuestro ejemplo el rango fue calculado anteriormente cuyo resultado
fue igual a $420.
Con el Rango y el nmero de intervalos, podremos hallar el ancho:

A = R / Nc
A = 420/5 = 84
Paso 3: Determinar los intervalos de clases
Con el valor mnimo de la serie como punto de partida y el ancho de clase, se procede a
construir los intervalos de clase. El primer intervalo parte del valor mnimo equivalente al
lmite inferior del primer intervalo, al cual le agregamos el ancho del intervalo de clase con
lo cual obtenemos el lmite superior; el segundo intervalo se construye a partir del valor
siguiente al lmite superior calculado en el primer intervalo, constituyndose de esta
forma en el lmite inferior, a dicho valor se le suma el ancho de clase con lo cual se obtiene
el lmite superior, y as sucesivamente se van construyendo el resto de intervalos.
Continuando con nuestro ejemplo en el cual se determin que el nmero de intervalos
(Nc) es igual a 5, y que el ancho de clase igual a 84, se procede a construir los intervalos
correspondientes:
INTERVALO

LIMITE INFERIOR

LIMITE SUPERIOR

1
2
3
4
5

1,260
1,345
1,430
1,515
1,600

1,344
1,429
1,514
1,599
1,684

Como se puede observar en los intervalos construidos, el ltimo lmite superior ($1,684)
cubre al valor mximo ($1,680) de la serie de datos de ingresos de las 24 familias, por
consiguiente se determina la valides del lmite superior del intervalo construido, puesto
que contempla el valor mximo de la serie de datos.

15
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Paso 4: Determinar las frecuencias absolutas, frecuencias relativas y marcas de clases
Un valor representativo de los intervalos en las tablas de frecuencia son las Marcas de
Clase.
Marcas de Clase (Mc): Se define como el punto medio de un intervalo de clase y se obtiene sumando los
lmites inferior y superior de la clase y dividiendo por 2.

Mc = Ls + Lm
2

Continuando con el ejemplo anterior se construye la tabla siguiente:


INTERVALO
1
2
3
4
5

LIMITE
INFERIOR
1,260
1,345
1,430
1,515
1,600
Total

LIMITE
SUPERIOR
1,344
1,429
1,514
1,599
1,684

fi
4
6
6
4
4
24

Fa
4
10
16
20
24

hi
0.167
0.250
0.250
0.167
0.166
1.000

Hi
0.167
0.417
0.667
0.833
1.000

Mc
1,302
1,387
1,472
1,557
1,642

Punto 2: Grficos
Los grficos son considerados como el mtodo de presentacin de la informacin ms
simple para el lector porque puede captar el panorama general o la tendencia de los datos
en una sola mirada. Es mucho ms fcil de comprender que una tabla o un texto. La
sencillez de lneas, una atractiva manera de presentacin, la posibilidad de usar las tres
dimensiones (3D), junto con colores, hacen de los grficos una de las herramientas ms
poderosas para transmitir ideas en forma rpida y simple al lector. Su desventaja ms
notoria es la prdida de precisin y exactitud, si se le compara con una tabla.
Componentes de un grfico:
Un grfico para que sea de fcil comprensin para el lector deber estar compuesto de
las partes siguientes:
a.- Ttulo del grfico, hace referencia que situaciones se quiere representar.
b.- Cuerpo del grfico o grfico propiamente dicho (incluye leyenda en el eje de las x y
eje de las y de ser necesarias).
c.- Fuente de informacin (se coloca como pie del grfico la fuente de informacin de la
que se recopilo la informacin para hacer el grfico).

16
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
A continuacin se describirn de forma breve los grficos ms utilizados:
Diagramas de barras:
Se llama as porque las frecuencias de cada categora de la distribucin se hacen figurar
por trazos o columnas de longitud proporcional (verticales u horizontales), separados unos
de otros. Se usa fundamentalmente para representar distribuciones de frecuencias de una
variable cualitativa o cuantitativa discreta, y ocasionalmente en la representacin de
series cronolgicas o histricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean
absolutas o relativas (%), y el otro para la escala de clasificacin utilizada.
Existen tres principales clases de grficos de barras:
Barra simple: se emplean para graficar hechos nicos.
Representacin variables cualitativas

Ejemplo:
3,300,000

Distribucin de la Poblacin de El Salvador por Sexo


Ao 2011

3,250,000
3,200,000
3,150,000
3,100,000
3,050,000

3,000,000
2,950,000
2,900,000
2,850,000
2,800,000
Total de Hombres

Total de Mujeres

Fuente: Direccin General de Estadisticas y Censos (DIGESTYC), Ministerio de Econmia de El Salvador

Barras mltiples: es muy recomendable para comparar una serie estadstica con otra,
para ello emplea barras simples de distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra.
Ejemplos:

Fuente: Direccin General de Estadisticas y Censos (DIGESTYC), Ministerio de Econmia de El Salvador

Fuente: Direccin General de Estadisticas y Censos (DIGESTYC), Ministerio de Econmia de El Salvador

Barras compuestas: en este mtodo de graficacin las barras de la segunda serie se


colocan encima de las barras de la primera serie en forma respectiva.
17
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplo:
45.0
40.0
35.0
30.0
25.0
20.0
15.0
10.0
5.0
0.0

Tasa de la pobreza en El Salvador


Distribucin en Relativa y Extrema

22.8

12.3
2005

21.2

23.8

25.8

25.3

12.0

11.2

12.2

2009

2010

2011

9.6

10.8

12.4

2006

2007

2008

Pobreza Relativa

28.3

27.6

Pobreza Extrema

Fuente: Direccin General de Estadisticas y Censos (DIGESTYC), Ministerio de Econmia de El Salvador

Diagramas de sectores (tambin llamados grficos circulares)


Se divide un crculo en tantas porciones como clases existan, de modo que a cada clase le
corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa (figura 3).
Se muestra el diagrama en dos y tres dimensiones; para una mejor ilustracin se le
pueden agregar colores.
Caractersticas de los grficos de sectores
- No muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cualitativos o cuasicuantitativas.
- La mayor rea (o porcin de la figura) representa la mayor frecuencia.
- Son muy fciles de elaborar.
- La figura completa equivale al 100% de los datos (360).
Ejemplo de Grficos de Sectores:
Tasa de Analfabetismo en El Salvador por
Zonas Geograficas, Ao 2011
Zona
Occi dental ,
13.9%
Zona Ori ental ,
21.2%

Zona Central ,
13.3%

Fue nte : Mi ni s te ri o de Economi a de El Sa l va dor, Di re cci n Ge ne ra l de Es ta di s ti ca s y


Ce ns os , Encue s ta de Hoga re s y Propos i tos Mul ti pl e s 2011.

Pictogramas
Es un grfico con dibujos alusivos al carcter que se est estudiando y cuyo tamao es
proporcional a la frecuencia que representan, dicha frecuencia se suele indicar.
Algunas caractersticas de este tipo de grfico son:
Su formato es libre.
Emplean una secuencia de smbolos para representar frecuencias.
Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.
18
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Ejemplos de Pictograma: Plantacin de rboles por mes y nacimientos por departamentos.
Numero de nacimientos

Nacimientos 2009
30,000
25,000
20,000

15,000
10,000
5,000
0

Departamento

Grafico Lineal: Consiste en un conjunto de lneas o segmentos de recta que muestran los
cambios que experimenta una determinada variable cuantitativa, generalmente, en
funcin del tiempo. En el eje horizontal se describe el tiempo y en el eje vertical la
frecuencia con que aparece la unidad de tiempo.
Ejemplo: Ingresos Anuales de remesas familiares.

Histograma: Se puede considerar como un grfico de columnas especial. Se realiza sobre


el primer cuadrante del plano cartesiano. La diferencia radica en que el histograma se
utiliza ms a menudo para representar Tabla de Frecuencia con Datos Agrupados en
Clases, donde el ancho de la columna equivale al ancho del intervalo de clase.
Las frecuencias absolutas se colocan en el eje vertical y tambin pueden emplearse las
frecuencias relativas y en el eje horizontal las marcas de clases. Otra diferencia importante
es que no existe espacio entre las barras.
Se estima que por el tipo de informacin brindada y por la manera en que sta es
dispuesta, los histogramas son de especial utilidad y eficacia para las ciencias sociales ya
que permiten comparar datos sociales como los resultados de un censo, la cantidad de
mujeres y/o hombres en una comunidad, el nivel de analfabetismo o mortandad infantil,
etc.
Ejemplo de histograma con la informacin siguiente: Ingresos semanales en US$ de 24
familias.
19
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

1
2
3
4
5
Total

LIMITE
INFERIOR
1,260
1,345
1,430
1,515
1,600

LIMITE
SUPERIOR
1,344
1,429
1,514
1,599
1,684

fi
4
6
6
4
4
24

Mc
1,302
1,387
1,472
1,557
1,642

Histograma "Ingresos de familias"


7
Frecuencia Absoluta

INTERVALO

6
5

1,557

1,642

4
3

2
1
0
1,302

1,387

1,472

Marca de Clase

Grficos que Representan Dos tipos de Escalas (utilizacin de eje principal y eje
secundario): este tipo de grficos es muy utilizado cuando se quiere presentar
informacin que utiliza dos tipos de escala de medicin diferentes por ejemplo cantidades
porcentajes y nmeros enteros.
Ejemplo: Remesas en El Salvador y PIB nominal.
4,000

20.0
18.0
16.0
14.0
12.0
10.0
8.0
6.0
4.0
2.0
0.0

Millones de US$

3,500
3,000
2,500

2,000
1,500
1,000

500
0

% del PIB Nominal

Evolucin de las Remesas en El Salvador y su Participacion


en el PIB Nominal

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Fuente: Base Estadstica del Banco Central de Reserva de El Salvador

2.3

Conclusiones/Ideas fuerza a tener presente

1. La tabla de frecuencia simple se caracteriza por manejar un conjunto pequeo de


posibles resultados de una variable dentro de la muestra o poblacin. Por lo general, su
uso tiende al manejo de datos cualitativos o variables cuantitativas discretas, sin embargo
cuando el tamao de la poblacin y/o muestra y el rango de la variable es grande, ser
necesario agrupar dichos valores en Intervalos de Clases por lo que se hace necesario
utilizar una tabla de frecuencia para datos agrupados.
2. Los grficos son considerados como el mtodo de presentacin de la informacin ms
simple para el lector porque pueden captar el panorama general o la tendencia de los
datos en una sola mirada ya que son mucho ms fcil de comprender que una tabla o un
texto, sin embargo su principal desventaja radica en la prdida de precisin y exactitud
que podran tener si se compara con una tabla.
20
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
3. Dentro de los grficos ms utilizados para representar variables cualitativas se
encuentran los grficos de barras, de sectores y pictogramas, sin embargo los grficos de
barras tambin son utilizados para la representacin de variables cuantitativas, as como
los grficos de lneas que se utilizan principalmente para representacin de series
cronolgicas.
Es importante mencionar que si se desea representar dos tipos de escalas en un grfico,
puede ser til la utilizacin de dos ejes uno principal y uno secundario, en el que en cada
eje se especifique la escala de medicin que se utilice, lo cual facilitar la comprensin del
lector.
2.4 Bibliografa
1. Gildaberto Bonilla, Estadstica I, Elementos de Estadstica Descriptiva y
Probabilidad.
2. Jhonson, R y Kuby, P. (1999). Estadstica Elemental, lo Esencial. Mxico: Thomson.
3. Martnez Bencardino, Ciro. (2006). Estadstica Bsica Aplicada. Colombia: ECOE
EDICIONES, 3 ED.
4. Montgomery, Douglas C. y Runger, George C. (1996). Probabilidad y Estadstica.
McGrawHill.
5. Juan Carlos Vergara Schmalbach y Vctor Manuel Quesada Ibarguen, Estadstica
Bsica con Aplicaciones en Excel.

LECCION 3: Medidas de Posicin Centrales y no Centrales


Resumen de la leccin: Esta leccin pretende brindar conocimientos generales, sobre el
clculo y utilidad de las medidas de tendencia central, dentro de las cuales se consideran
para efectos de estudio la media aritmtica y geomtrica, mediana y moda.
Tiempo total: 1:30 horas
3.1

Objetivos de la Leccin 3

Proporcionar conocimientos sobre la utilidad prctica que tienen las medidas de posicin
central y no centrales, en el diseo de programas puesto, que estos pueden simplificar un
conjunto de datos por medio de un solo nmero e indicar donde se concentran los
valores de estudio e identificar de una mejor manera la poblacin objetivo beneficiaria de
una intervencin.

21
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
3.2

Desarrollo del contenido de la Leccin 3

Definiciones clave
Media aritmtica y geomtrica, mediana, moda, cuartil, quintil, decil, percentil.

Punto 1: Medidas de Posicin Central


Los promedios o medidas de posicin proporcionan valores tpicos o representativos de
la variable en estudio. Dentro de las medidas de posicin centrales ms conocidas se
encuentran: la media (aritmtica y geomtrica), la mediana y la moda. Las cual a
continuacin se describe un breve resumen del mismo.
Media aritmtica
Es la medida ms conocida, la ms fcil de calcular y con la que siempre estamos ms
familiarizados, ya que siempre hemos calculado el promedio de calificaciones obtenidas
en cada periodo escolar (Ciclo, ao, etc.) A veces se le denomina simplemente media o
promedio, y es utilizada con tanta frecuencia, que en algunas ocasiones nos conduce a
resultados que no revelan lo que se pretende presentar, ya que la distribucin de los
datos puede requerir de la aplicacin de un promedio diferente a la media, ya sea,
media geomtrica o media armnica.
Media Aritmtica simple: se define como el cociente que se obtiene al dividir la suma
de los valores de la variable por el nmero total de observaciones. Su frmula est dada
por:

La media aritmtica es un promedio estndar que a menudo se denomina "promedio".

Ejemplo. Supongamos que un almacn tiene empleados a 12 vendedores, y sus ingresos


mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $
469 y $ 547. Se pide determinar la media de los ingresos de los 12 vendedores.
X =1/12 (7,117) = $593.08 Promedio de Ingreso de los vendedores
La media aritmtica es muy sensible a los valores extremos de la variable, ya que todas
las observaciones intervienen en el clculo de la media, la aparicin de una observacin
extrema, har que la media se desplace en esa direccin. En consecuencia, no es
22
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
recomendable usar la media como medida central en las distribuciones muy asimtricas
ya que podra no ser una medida muy representativa; ejemplos: el nmero de hijos
promedio de las familias de cierto pas puede no ser un valor muy representativo, ya
que si sale elevado puede ser ocasionado porque en algunas rea del pas la poblacin
tiene un nmero elevado de hijos y dicho dato no se puede inferir a la poblacin total
ya que no sera representativo, as tambin el PIB per cpita, considerado como el
promedio de ingresos al ao que reciben las personas de determinado pas puede no
ser una variable muy representativa, por lo que ciertos analistas utilizan para
determinar el promedio de ingresos por persona el llamado salario modal es decir el
salario que ms se repite.
Media aritmtica ponderada
Cuando el nmero de observaciones es grande, las operaciones para calcular la media
se simplifican si agrupamos los datos en una tabla de frecuencias. La frmula
matemtica est dada por:
k

x f
i 1

i i

n
Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el
punto medio de cada clase en vez de x (marca de clase).
Por otra parte, la media aritmtica de una muestra dividida en submuestras, es igual, a
la media ponderada de las submuestras, tomando como ponderacin los tamaos de
las submuestras. Esto es,
m

x n
i

i 1

donde n n1 n2 ... nm

Ejercicios propuestos de media aritmtica


Media Simple
1. El jefe de una delegacin policial inici un estudio acerca de las horas de tiempo
extra de los policas. Se seleccionaron al azar 15 de ellos y durante el mes de junio se
anotaron las siguientes horas extras laboradas. 13 , 13, 12, 15, 7, 15, 5, 12, 6, 7,
12, 10, 9, 13, 12. Calcule la media aritmtica.
2. El banco B analiza el nmero de veces que se utiliza por da un cajero automtico
ubicado en el Superselectos. A continuacin se indican las veces que dicho aparato
se utiliz en cada uno de los ltimos 30 das: 83, 63, 96, 64, 80, 36, 84, 84, 78, 76,
73, 61, 84, 68, 59, 54, 52, 84, 75, 65, 95, 59, 90, 47, 70, 52, 87, 61, 77, 60,
Determine la media del nmero de veces que la mquina fue utilizada por da.

23
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Media ponderada
3. La siguiente tabla muestra el porcentaje de desempleo de la PEA y el nmero de
personas de la PEA de algunos municipios seleccionados de cierta regin.
Municipio % de desempleo
PEA
X
4.5
74520
Y
7.6
126310
Z
8.3
98760
Cul es el promedio de desempleo para la regin.
4. Suponga que en junio un inversionista compr 300 acciones del Banco Agrcola a un
precio de $ 20 por accin, en agosto compr 400 acciones ms a $ 25 cada una, y en
noviembre 400 a $ 23 por accin. Cul es el precio medio ponderado por accin.
Solucin

5. En un supermercado trabajan 35 mujeres, con un salario promedio mensual de


$650 dlares y 15 hombres, en promedio ganan un 12% ms que las mujeres Cul
es el salario promedio de los empleados del supermercado?
La Media Geomtrica (MG)
La media geomtrica (Mg), de un conjunto de n nmeros positivos se define como la
raz n - sima de la multiplicacin de los n valores de la variable. Por tanto, la frmula
para la media geomtrica es dada por:
MG n X1 X 2 ... X n
Existen dos usos principales de la media geomtrica:
1. Para promediar porcentajes, ndices y cifras relativas y
2. Para determinar el incremento porcentual promedio en ventas, produccin u
otras actividades o series econmicas de un periodo a otro.
Ejemplo
Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6%, respectivamente. Cul es la media geomtrica de las
ganancias?
En este ejemplo la media geomtrica es determinada por:

24
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

Y as la media geomtrica de las utilidades es el 3.46%. La media aritmtica de los


valores anteriores es 3.75%. Aunque el valor 6% no es muy grande, hace que la media
aritmtica se incline hacia valores elevados. La media geomtrica no se ve tan afectada
por valores extremos.
Ejercicio 1. El 1 de mayo de 2006 se ahorraron $ 50,000 en un banco al 7.6% de inters
anual, capitalizados semestralmente. Obtener la cantidad media depositada en la
cuenta, entre el 1 de mayo de 2002 y el 31 de octubre de 2012, suponga que no se
hicieron retiros durante el periodo.
La Moda:
Es una medida de posicin, menos importante que los promedios y su uso es bastante
limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una
frecuencia demasiado grande con respecto a las dems.
La moda se define como aquel valor de la variable o del atributo que presenta la mayor
densidad, es decir, la mayor frecuencia.
Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es
unimodal. Si hay dos valores en la variable con la misma frecuencia mxima, la
distribucin es bimodal. Si hay ms de dos, la distribucin es multimodal. Cuando
ninguno de los valores que toma la variable se repite, no existe moda.
La Mediana:
La mediana de una distribucin de frecuencia corresponde al valor, supuesto los datos
ordenados de menor a mayor, que deja a ambos lados el mismo nmero de
observaciones. Cuando calculamos la mediana en datos no agrupados, ordenamos las
observaciones de menor a mayor o viceversa. En su clculo se presentan dos casos:
a) Cuando el nmero de datos es impar: En este caso la mediana coincide con el dato
central.
Ejemplo: Consideremos los salarios en dlares para 11 vendedores: 243, 320, 311, 254,
234, 261, 239, 310, 218, 267, 287.
Calcular la mediana.

25
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Solucin:
Primero ordenar los datos de menor a mayor: 218, 234, 239, 243, 254, 261, 267, 287,
310, 311, 320. La posicin donde se encuentra la mediana: (11+1)/2=6, la mediana se
encuentra en la sexta posicin y corresponde al valor de: Md=261.
b) Cuando los datos son pares: La mediana ser el trmino medio de los dos valores
centrales.
Ejemplo: Consideremos los salarios en dlares para 12 vendedores; los cuales se han
presentado ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311,
320 y 322: Calcular la mediana.
Solucin:
Para obtener la posicin central se aplica la siguiente frmula: (N+1)/2
(12+1)/2
= 6.5, entonces la mediana corresponde al promedio de los dos valores sombreados,
esto es: Md=(261+267)/2=264.
Punto 2. Medidas de Dispersin
Las medidas de dispersin estudian la separacin existente entre los diversos valores
que toma la variable. Se dividen en medidas de dispersin absoluta y relativa. Las
absolutas suelen hacer referencia a un promedio, y permiten estudiar su
representatividad. En este tipo de medidas depende de las unidades, lo que es un
inconveniente para realizar comparaciones entre poblaciones. En este sentido, las
medidas de dispersin relativas no dependen de las unidades y permiten comparar
variabilidad entre poblaciones.
VARIANZA
La varianza es una medida de dispersin que sirve para estudiar la representatividad de
la media. Viene definida como la media de las diferencias cuadrticas de las
puntuaciones respecto a su media aritmtica. Normalmente a partir de la varianza se
obtiene la desviacin tpica o estndar y se define como la raz cuadrada positiva de la
varianza, a continuacin se presentan dichas frmulas:

Una varianza grande es indicativa de que la media no es representativa, mientras que


una varianza pequea indica que la media es un buen representante de los datos.

26
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
COEFICIENTE DE VARIACIN
En ocasiones puede interesar comparar la dispersin de dos muestras y la desviacin
tpica no es vlida, si las dos muestras tienen unidades diferentes. Para evitar este
inconveniente se define el coeficiente de variacin CV como:
Utilidad del coeficiente de variacin
GRADO EN QUE LA MEDIA
REPRESENTA AL CONJUNTO DE
VALOR DEL C.V.
DATOS
0-<10%
Media altamente representativa
10% - < 20%
Media bastante representativa
20% - < 30%
Media tiene representatividad
30%- < 40%
Media con representatividad dudosa
40% o ms
Media carente de representatividad

Ejemplo. Una compaa requiere los servicios de un tcnico especializado. De los


expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los
requisitos mnimos requeridos. Para decidir cul de los 2 se va a contratar, los
miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos. Los resultados se
dan a continuacin:
Pruebas
Puntaje obtenido por A
Puntaje obtenido por B
Estadsticamente
respuesta.

1
57
80

2
55
40

3
54
62

4
52
72

5
62
46

6
55
80

7
59
35

Cul de los candidatos debe ser contratado? Fundamente su

Solucin.
Podemos notar que B ha tenido mayores notas que A en algunas pruebas, pero
tambin ha tenido menores notas que A. El rendimiento de A de alguna manera fue
constante. Analicemos la media y la desviacin para cada uno.
Candidato A:

27
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Candidato B:

Podemos tambin analizar el coeficiente de variacin (C.V).


0.05=5% la media de A es altamente representativa.
0.32=32% la media de B tiene representatividad dudosa.
Aunque B tuvo mejor promedio que A, B presenta mayor variabilidad en sus notas, por
lo que sera mejor contratar al candidato A.
Ejercicio propuesto: Durante un cierto mes el precio de los frijoles por libra tuvo
y
. Mientras que en ese mismo mes el precio del barril de petrleo
tuvo una media de
. Dnde hubo mayor variabilidad en los precios?
Punto 3: Medidas de Posicin no Centrales: Cuartiles, Quintiles, Deciles y Percentiles
Cuartiles
Son medidas de posicin que dividen en cuatro partes porcentuales iguales a una
distribucin ordenada de datos.
Cuando la distribucin de datos contiene un nmero determinado de datos y se
requiere obtener un porcentaje o una parte de la distribucin de datos, se puede dividir
la distribucin en cuatro partes iguales, cada parte tiene la misma cantidad de datos y
cada una de las partes representa un 25% de la totalidad de datos. Es decir:

Cuartil 1
25 %

Cuartil 2
50 %

Cuartil 3
75 %

Cuartil 4
100%

Frmula General:
Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la frmula:
Qk = k (N/4)
28
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Donde:
Qk = Cuartil nmero 1, 2, 3 4
N = total de datos de la distribucin.
Para cada cuartil, su ecuacin se establece as:
Q1 = 1 (N / 4)

Q2 = 2 (N / 4)

Q3 = 3 (N / 4)

Q4 = 4 (N / 4)

Cada cuartil tiene un significado estadstico particular o representa de la distribucin de


datos un porcentaje establecido; por ejemplo:
a) Q1 = 1 (N/4)
El valor obtenido al realizar el clculo en una serie de datos nos proporciona el valor
que representa el 25 % de esa serie de datos. Tambin, nos indica que el 25% de la
serie de datos est bajo l y sobre l, se encuentra el 75% de los datos de la serie.
b) Q2 = 2 (N/4)
Para el cuartil 2, se tiene como caso especial, primero porque su valor representa la
mitad de la serie de datos, igual que la mediana. Segundo, bajo est valor se encuentra
el 50% de la serie de datos y tercero, sobre ese valor calculado se encuentra el otro 50%
de la serie de datos.
c) Q3 = 3 (N/4)
El cuartil 3, nos indica que el valor obtenido representa bajo s el 75 % de la distribucin
de los datos y sobre s, se encuentra el 25 % de la distribucin de datos.
d) Q4 = 4 (N/4)
El cuartil 4, nos indica que el valor obtenido tiene bajo s el 100% de la distribucin de
datos. Por lo general no se calcula, ya que es un hecho que el ltimo valor de la
distribucin l lo representa.
Quintiles
Se representan con la letra K. Su frmula aproximada es i*n/5.
El primer quintil. Separa a la muestra dejando al 20 % de los datos a su izquierda.
El segundo quintil. Es el valor que indica que el 40 % de los datos son menores.
El tercer quintil. Indica que el 60 % de los datos son menores que l.
El cuarto quintil. Separa al 80 % de los datos inferiores del otro 20 %.
Deciles
Se representan con la letra D. Son 9 valores que distribuyen la serie de datos,
ordenada de forma creciente o decreciente, en diez tramos iguales, en los que
cada uno de ellos concentra el 10% de los resultados. Su frmula aproximada es
i*n/10.
29
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Es el decil i-simo, donde la i toma valores del 1 al 9. El (i*10) % de la muestra
son valores menores que l y el 100-(i*10) % restante son mayores.
Ejemplo de medidas de posicin:
Una empresa prestigiosa asegura que sus empleados tienen salarios superiores al
salario mnimo. Se toma una muestre de 15 personas y sus salarios fueron: 300, 275,
180, 325, 200, 250, 350, 260, 280, 310, 400, 380, 260, 290, 370. Calcular Q1, Q2 y Q3, del
salario en dlares, deciles 1 y 7 y percentil 50 y 70.
Solucin:
Recordemos que: Q1 = 1 (N / 4)

Q2 = 2 (N / 4)

Q3 = 3 (N / 4)

Para encontrar los cuartiles necesitamos tener los datos ordenados de menor a mayor,
esto es:
180, 200, 250, 260, 260, 275, 280, 290, 300, 310, 325, 350, 370, 380, 400.
Luego hacemos los respectivos clculos:
1(15)
3.75 , ste valor es el que se encuentra en la posicin 4, luego: Q1 260
4
2(15)
Q2
7.5 , ste valor es el que se encuentra en la posicin 8, luego Q2 290
4
3(15)
Q3
11.25 , ste valor es el que se encuentra en la posicin 12, luego Q3 350
4

Q1

Se tiene que el 75% de los trabajadores gana menos de $350.00


Deciles:
Calcular D1 y D7 del salario de los 15 trabajadores anteriores.
Di = i (N /10)
As:
1(15)
1.5 , ste valor es el que se encuentra en la posicin 2, entonces: D1 200
10
7(15)
D7
10.5 , ste valor es el que se encuentra en la posicin 11, entonces:
10
D7 325
Podemos decir que el 10% de los empleados gana menos de $200 y el 25% ganan ms
de $325.
D1

30
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Percentiles:
Encontrar los percentiles P50 y P70 del salario de los 15 trabajadores anteriores.
Pi = i (N /100)
50(15)
P50
7.5 , ste valor es el que se encuentra en la posicin 8, as: P50 290
100
Que coincide con el valor de Q2 .
70(15)
P70
10.5 , ste valor es el que se encuentra en la posicin 11, as: P70 325
100
Que coincide con el valor de D7 .
De aqu se puede observar que el 50% de los trabajadores gana menos de $290.
3.3. Conclusiones/Ideas fuerza a tener presente
1. Las medidas de tendencia central simplifican la informacin de un conjunto de
datos y que brindan informacin sobre donde se encuentran ms concentrados.
2. Cuando existe mucha disparidad en los datos la media puede no ser una medida
muy representativa, ya que sesgara la informacin; para estos casos pueden
considerarse otras medidas de tendencia central como la moda o la mediana.
3. Las medidas de posicin no centrales son muy tiles principalmente en el anlisis
de informacin econmica, puesto que ayudan a determinar por ejemplo en que
segmentos de la poblacin se concentran ms los ingresos.
3.4 Bibliografa
1. Introduccin a la Probabilidad y Estadstica Inferencial, Dr. Nerys Funes
2. http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
3. http://www.vitutor.com/estadistica/descriptiva/a_1.html

LECCION 4: Anlisis de Regresin


Resumen de la leccin: Esta leccin tiene como propsito conocer la utilidad de la
regresin lineal en la gestin de programas presupuestarios, puesto que ayudara a
identificar si existe o no relacin entre variables, tambin se exponen parmetros
estadsticos que ayudaran a identificar ese grado de relacin.
Tiempo total: 1 horas
31
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
4.1
Objetivos de la Leccin 4
- comprender la utilidad de la regresin lineal
- identificar los diferentes tipos de correlacin lineal
- interpretar la confiablidad del modelo a travs de parmetros estadsticos.
4.2

Desarrollo del contenido de la Leccin 4

Definiciones clave
Regresin lineal
Diagrama de dispersin
Coeficiente de determinacin,
Coeficiente de correlacin.
Punto 1: Regresin Lineal Simple
El anlisis de regresin: es una tcnica estadstica para investigar la relacin
funcional entre dos o ms variables, ajustando algn modelo matemtico. La
regresin lineal tiene una finalidad muy importante que es la de estimar los
valores de una variable con base a los conocidos de la otra.
Cuando es utilizado este modelo para predicciones, es importante que solo se
considere lo relevante de la variable independiente. Los valores de la variable
dependiente se predicen cuando es conocida la variable independiente.
Diagrama de Dispersin:
El diagrama de dispersin es la grfica donde se encuentran todos los puntos de
las observaciones, tanto de la variable dependiente (Y), como de la variable
independiente (X). El diagrama de dispersin puede revelarnos dos tipos de
informacin:
1) Relacin de las variables
2) Tipo de lnea o ecuacin de estimacin
El anlisis de un diagrama de dispersin puede mostrar varios tipos de
correlaciones entre las variables con un intervalo de confianza determinado. La
correlacin puede ser positiva (Y aumenta con X), negativa (Y disminuye con X), o
nula (las variables no estn correlacionadas).
El diagrama de dispersin es una de las herramientas bsicas de gestin de la
calidad, muy til al analizar las causas de un problema y para Identificar
oportunidades de mejora continua.

32
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Correlacin directa

Correlacin inversa

La recta correspondiente a la nube de


puntos de la distribucin es una recta
creciente.
Y

La recta correspondiente a la nube de


puntos de la distribucin es una recta
decreciente.
Y

Correlacin nula

En este caso se dice que las variables son no correlacionadas y la nube de puntos
tiene una forma redondeada.
Y

Clculo de la Recta de Regresin


Uno de los mtodos ms utilizados para calcular la recta de regresin es el de
Mnimos Cuadrados es una tcnica de anlisis numrico en la que, dados un
conjunto de pares ordenados: variable independiente (X), variable dependiente
(Y), y una familia de funciones intenta encontrar la ecuacin que mejor se
aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo
error cuadrtico.
Y = a + bx.
Y = Estimaciones de Y a partir de X.
b = Aumento de Y por unidad de aumento de X.
a = valor de Y cuando X vale cero (ordenada al origen).
El coeficiente de correlacin lineal (r): frecuentemente denominado correlacin.
Una medida estadstica ampliamente utilizada que mide el grado de intensidad
de la relacin lineal entre dos variables aleatorias.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
33
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Si r > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Ejemplo: ingesta de nutrientes en nios y rendimiento escolar: los nios que
ingieren ms nutrientes tendrn mayor rendimiento escolar.
Si r < 0, la correlacin lineal es negativa (si sube el valor de una variable
disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms
se aproxime a -1.
Ejemplo: dispositivos de seguridad en la carretera y nmero de accidentes en
carreteras: mientras ms dispositivos de seguridad se implementen en carretera
ocurrirn menos accidentes de trnsito.
Si r = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (parablica, exponencial, etc.)
Ejemplo: nmero de cigarrillos diarios y estatura de fumadores.
Coeficiente de determinacin (r2): una vez ajustada la recta de regresin a la
nube de observaciones es importante disponer de una medida que indique la
bondad del ajuste (discrepancia entre los valores observados y los valores
esperados en el modelo de estudio, mientras menor sea esa diferencia mejor es
la bondad de ajuste del modelo) realizado y que permita decidir si el ajuste lineal
es suficiente o se deben buscar modelos alternativos.
El coeficiente de determinacin se encuentra entre los valores 0 y 1, pero sin
olvidar que un r2 cercano a 1 indica una fuerte correlacin entre X y Y,
mientras que un r2
cercano a 0 significa que las variables tienen poca
correlacin. El coeficiente de determinacin resulta al elevar al cuadrado el
coeficiente de correlacin (r).
Parmetros para determinar la significancia del coeficiente de determinacin
Valor

Significado

Correlacin nula

0.25 - 0.49 Correlacin dbil


0.5 - 0.74

Correlacin moderada

0.75 - 0.99 Correlacin intensa


1

Correlacin perfecta

34
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Clculo de los coeficientes de la recta de regresin.
Los coeficientes y
siguientes frmulas:

de la recta de regresin

, donde

, se calculan con las

Se observa que es necesario calcular cinco cantidades para determinar

y :

Para calcular el coeficiente de determinacin se utiliza la siguiente frmula:


r2

( xi x )( yi y )
i 1

(x
i 1

x ) 2 ( yi y ) 2
i 1

Ejemplo: Obtener la recta de regresin para las puntuaciones de una prueba de


aprovechamiento en matemticas (X) y las calificaciones finales (Y) para
estudiantes universitarios de primer ao. Calcular tambin, su coeficiente de
determinacin.

Solucin
Estudiante
1
2
3
4
5
6
7
8
9
10
Total ()

En este caso

Puntuacin del
examen de
aprovechamiento
39
43
21
64
57
47
28
75
34
52
460

Calificacin
final
65
78
52
82
92
89
73
98
56
75
760

1521
1849
441
4096
3249
2209
784
5625
1156
2704
23634

2535
3354
1092
5248
5244
4183
2044
7350
1904
3900
36854

4225
6084
2704
6724
8464
7921
5329
9604
3136
5625
59816

, y los coeficientes de la recta de regresin son:

35
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

Por lo tanto, la recta de regresin es:

El coeficiente de determinacin ser:


2

( xi x )( yi y )

r 2 n i 1
n
( xi x ) 2 ( yi y ) 2
i 1

i 1

Ejemplo prctico de Regresin Lineal: PIB a precios corrientes y Flujo anual de


remesas familiares

36
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
La importancia que han tenido las remesas en la economa salvadorea es muy
relevantes estas representan en el periodo de 2000-2011 aproximadamente un
16% del PIB a precios corrientes.
Con la informacin proporcionada, se puede generar la recta de regresin
utilizando una hoja de clculo de Excel lo que facilitara la obtencin de
informacin, dicho modelo estadstico podemos decir lo siguiente:
1. El diagrama de regresin nos dice que existe una correlacin directa entre
las variables (x) y (y) es decir a mayor flujo de remesas mayor PIB a precios
corrientes.
2. El coeficiente de determinacin es 0.8993 es decir que existe una
correlacin intensa entre las variables.
3. Segn la recta de mnimos cuadrados, al incrementarse en un milln de
dlares las remesas familiares el PIB corriente aumentara en 4.1616
millones, y cuando no se perciba ningn flujo de remesas el PIB sera
positivo pero disminuir drsticamente.
Ejercicios propuestos
1. Para los hogares salvadoreos, disponemos del promedio mensual
redondeados sobre los gastos en productos alimenticios ($Y) e ingresos
promedio del hogar ($X), tomados de una muestra de hogares, para el
perodo 2005- 2012.
Ao
Yt
Xt

2005
258
381

2006
273
402

2007
289
426

2008
308
454

2009
331
486

2010
355
520

2011
377
553

2012
400
590

Considerando que los gastos se puede expresar como funcin lineal de los
ingresos (Yt=a+bXt), determine:
a) Los estimadores de los parmetros a y b de la recta de regresin.
b) El coeficiente de determinacin de dicha regresin.
d) La prediccin del valor que tomar el gasto para un hogar que tiene
ingresos de $650.
2. Se supone que se puede establecer cierta relacin lineal entre las
exportaciones de un pas y la produccin interna de dicho pas. Por
ejemplo, tenemos los datos anuales (expresados en miles de quintales de
maz) para tales variables correspondientes al quinquenio 2008-2012 en la
siguiente tabla:

37
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Ao
2008
2009
2010
2011
2012

Produccin
52654
53972
57383
61829
65381

Exportaciones
10420
11841
14443
16732
18760

A partir de tal informacin, y considerando como vlida dicha relacin lineal, se


pide:
a) Los estimadores de los parmetros a y b de la recta de regresin.
b) Si la produccin de maz para el ao 2013 fuera de 70,000 quintales, cul
sera la prediccin de las exportaciones para dicho ao?
3. En un estudio se registran los salarios iniciales Y (en miles de dlares) y los
aos de estudio X de 10 empleados:
Salario inicial (Y)
35
46
48
50
40
65
28
37
49
55
a)
b)
c)
d)
e)

Aos de estudio (X)


12
16
16
15
13
19
10
12
17
14

Dibujar el diagrama de dispersin correspondiente a estos datos.


Encontrar la recta de regresin.
Determinar el coeficiente de determinacin.
Existe un buen grado de correlacin entre las variables?
Si un empleado tuviera 20 aos de estudio, cunto se espera que gane?

4.3 Conclusiones/Ideas fuerza a tener presente


1. El anlisis de regresin es una tcnica estadstica para determinar si existe relacin
entre dos o ms variables. Aplicaciones de regresin son numerosas y ocurren en casi
todos los campos, incluyendo ingeniera, la fsica, ciencias econmicas, ciencias
biolgicas y de la salud, como tambin ciencias sociales.
2. El anlisis de regresin nos arroja informacin importante como por ejemplo:
38
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
o Grado de asociacin de las variables de estudio: dicho anlisis puede
determinarse a travs del coeficiente de correlacin, sin embargo en la prctica
se utiliza ms el coeficiente de determinacin puesto que es una medida de
bondad de ajuste, es decir puede ayudarnos a decidir si el ajuste lineal es
suficiente o se deben buscar modelos alternativos.
o Determinar la tendencia: los grficos de dispersin nos indican la tendencia
que tienen las variables en estudio y si existe grficamente algn tipo de
relacin entre ellas.
o Para prediccin y estimacin.
Algunos casos de esta utilidad del anlisis de regresin son:
a) La respuesta de un cultivo al variar la cantidad de los fertilizantes; el
objetivo puede ser establecer la forma de la relacin, o predecir la
combinacin optima de fertilizantes.
b) La relacin entre varias medidas meteorolgicas y la produccin del cultivo;
el ms obvio objetivo podra ser tratar de entender los efectos
meteorolgicos sobre el crecimiento del cultivo.
4.4 Bibliografa
1.
2.
3.
4.

Gildaberto Bonilla, Estadstica I, Elementos de Estadstica Descriptiva y Probabilidad.


http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
http://www.vitutor.com/estadistica/descriptiva/a_1.html
Domar Guajarati, Econometra.

APENDICE 1: FUENTES DE BUSQUEDA DE INFORMACIN


Tiempo Total: 30 minutos (Material de consulta)
Fuentes y recoleccin de datos
La base para el anlisis estadstico y formacin de indicadores son los datos, los cuales se
pueden obtener de manera indirecta, por ejemplo al utilizar la informacin de los censos
nacionales o de algn tipo de organizacin o institucin, o de manera directa, llenando
fichas, cdulas de observacin o aplicando cuestionarios, entre otros.
En muchas ocasiones en la investigacin cientfica es necesario recurrir a la obtencin
directa de datos, ya sea al emplear fichas o cdulas de observacin en las que se registran
caractersticas de inters, o bien al disear un cuestionario cuyas respuestas nos
permitan conocer las caractersticas de quien responde, su opinin, las condiciones
reales en las cuales se encuentra en relacin con algn aspecto especfico, como podra

39
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
ser trabajo, educacin y capacitacin, salud, relaciones interpersonales, empleo del
tiempo libre, etctera.
Cuando los datos se obtengan de manera directa, ser necesario apoyarse en el
muestreo, disear el instrumento de recoleccin, coordinar la recopilacin de datos y su
procesamiento, para finalmente hacer en anlisis de la informacin y efectuar el informe
o informes finales en que se basar la toma de decisiones.

Tipos de Fuentes de Recoleccin de datos


Las fuentes de recoleccin de datos de una investigacin estadstica son:
1. Fuentes Primarias: Es cuando la persona o institucin ha recolectado los datos.
2. Fuentes Secundarias: Si la persona o institucin que ha publicado los datos, no es
la que ha efectuado la investigacin. Se utilizan cuando la oficina que las pblica
tenga suficiente solvencia tcnica.
3. Fuentes Oficiales: Es cuando los datos son provistos por cualquier dependencia
gubernamental.
4. Fuentes Privadas: Es cuando son provistos por agencias, personas, organizaciones,
etc., no gubernamentales.
A continuacin se presentan un conjunto de Fuentes Oficiales que brindan informacin de
utilidad para estudios estadsticos y realizacin de indicadores de desempeo.
Nombre de la Informacin
Institucin
Proporcionada
Banco Central de
Reserva
de
El
Salvador
-

Ministerio de
Hacienda

Direccin de electrnica
Pgina Oficial:

Estadsticas econmicas (PIB


nominal, PIB constante, PIB
percpita,
exportaciones,
importaciones,
remesas,
indicadores econmicos, entre
otras).
- Estadsticas Monetarias y
Financieras.

http://www.bcr.gob.sv

- Estadsticas Fiscales (ingresos y


gasto pblico, dficit fiscal, carga
tributaria, balance primario, entre
otras estadsticas de carcter
fiscal)

Pgina Oficial:
http://www.mh.gob.sv
Base de datos:
http://www.transparenciafiscal.gob.sv/portal/page/portal/PT
F/estadisticas

Base de datos econmica:


http://www.bcr.gob.sv/bcrsite/?cat=1000&lang=es

40
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
Direccin Generalde Estadsticas y
Censos de El
Salvador
-

Pgina Oficial:
- Estadsticas Sociales (pobreza,
empleo, vivienda, poblacionales,
educativas, salud y acceso a
servicios bsicos).
-

Ministerio de
Agricultura y
Ganadera

http://www.digestyc.gob.sv

-Estadsticas Econmicas (ndice de


Precios al consumidor, canasta
bsica, actividad econmica por
rea geogrfica)

Base de datos:
informacin de la EHPM:
http://www.digestyc.gob.sv/index.php/temas/des/ehpm/res
ultados-encuesta.html
Estadsticas econmicas:
http://www.digestyc.gob.sv/index.php/temas/ee.html
Censo de Poblacin y vivienda 2007 (redatan):
http://www.digestyc.gob.sv/servers/redatam/htdocs/CPV200
7P/index.html
Pgina Oficial:
http://www.mag.gob.sv

Estadsticas Agropecuarias

Base de datos:
http://www.mag.gob.sv/index.php?option=com_phocadownl
oad&view=section&id=9:estadisticas-de-produccionagropecuaria&Itemid=221
Pgina Oficial:
http://www.fiscalia.gob.sv
Base de datos:
http://www.fiscalia.gob.sv/index.php/estadisticas-2/

Fiscala General de
la Repblica
Estadsticas de Seguridad Pblica
Polica Nacional
Civil

Pgina Oficial:
http://www.seguridad.gob.sv
Base de datos:
http://www.pnc.gob.sv/core/index.php/oir/estadisticas
Pgina Oficial:
http://www.salud.gob.sv

Ministerio de Salud

Estadsticas de Salud

Base de datos:
http://www.salud.gob.sv/index.php/oir/estadisticas
Pgina Oficial:
www.isss.gob.sv

Instituto
Salvadoreo del
Seguro Social

Ministerio de
Turismo

Estadsticas de Seguridad Social

Estadsticas de Turismo

Base de datos:
http://www.isss.gob.sv/index.php?option=com_docestandar
&view=docestandar&categoria=44&showview=0&Itemid=234
Pgina Oficial:
http://www.mitur.gob.sv
Base de datos:
http://www.mitur.gob.sv/uaip/estadisticas.html

41
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

APENDICE 2: Mtodo de Prediccin


Mtodo de Regresin Lineal: La regresin lineal es una alternativa bastante sencilla, que
permite realizar estimaciones, a partir de una lnea recta o ecuacin matemtica, que
describe la relacin entre dos variables. En este mtodo, se procede a analizar una serie
cronolgica, es decir un conjunto de datos u observaciones, ordenados en trminos de
tiempo o en otra variable que influya en la variable que se requiere analizar. En nuestro
caso, puede tratarse de una serie de datos sobre gastos o ingresos presupuestarios.
REGRESIN EN FUNCIN DEL TIEMPO

Con los datos del ejemplo:

Y= a + bX

FORMULA:

Y= 665.35 + 88.41 X
Y=
Y=
Y=
Y=

donde:

665.35
665.35
665.35
665.35

+
+
+
+

88.41
88.41
88.41
88.41

X=

DATOS DEL PERIODO EN ESTUDIO (VARIABLE INDEPENDIENTE)

Y=

DATOS DE ESTUDIO (VARIABLE DEPENDIENTE)

n=

NUMERO DE PERIODOS

a =

Y - bX
n

b =

(14) = 1,903.09
(15)= 1,991.5
(16)= 2,079.91
(17)= 2,168.32

nXY - XY
nX 2 - ( x ) 2

TABLA DE DATOS:
AO

X (PERIODO)

Y (DATOS)

XY

X2

2000

2001

2002

2003

2004

2005

2006

2007

799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7

799.8
1,732.6
2,711.7
3,841.2
5,131.0
7,019.4
9,537.5
12,054.4
14,536.8
12,562.0
17,221.1
21,618.0
24,189.1

1.0
4.0
9.0
16.0
25.0
36.0
49.0
64.0
81.0
100.0
121.0
144.0
169.0

16,694.9

132,954.6

819.0

2008

2009

10

2010

11

2011

12

2012

13

2013
2014
2015
2016

91
14
15
16
17

1,903.1
1,991.5
2,079.9
2,168.3

b =

209,177.80
2366

b =

88.41

LOS DATOS DE ESTUDIO QUE SE REQUIEREN OBTENER SE OBTIENEN SUSTITUYENDO LOS VALORES OBTEN
LOS COEFICIENTES "a" Y "b", y "X=14,15,16 Y 17" , EN ECUACION Y=A+BX

a =

Y - bX
n

a =

8649.55
13

a =

665.35

42
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto
REGRESIN LINEAL CONSIDERANDO AL PIB COMO VARIABLE INDEPENDIENTE
Con los datos del ejemplo:

Y= a + bX

FORMULA:

Y= -455.05 + 0.095 X
Y= -455.05+0.095 (26,163.4)= 2,030.5
Y= -455.05+0.095 (28,016.3)= 2,206.5
Y= -455.05+0.095 (29,942.4)= 2,389.5
Y= -455.05+0.095 (32,068.5)= 2,591.5

donde:

X=

DATOS DEL PIB A PRECIOS CORRIENTE (VARIABLE INDEPENDIENTE)

Y=

DATOS DE ESTUDIO (VARIABLE DEPENDIENTE)

n=

NUMERO DE PERIODOS

a =

Y - bX
n

b =

nXY - XY
nX2 - ( x ) 2

TABLA DE DATOS:
X (PIB a Precios
Corrientes)

Y (DATOS)

XY

X2

2012

13,134.1
13,812.7
14,306.7
15,046.7
15,798.3
17,093.8
18,550.7
20,104.9
21,431.0
20,661.0
21,427.9
23,054.1
24,304.0

799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7

10,504,653.2
11,965,942.0
12,931,826.1
14,449,346.0
16,212,215.5
19,998,036.6
25,275,328.8
30,294,063.3
34,615,351.2
25,954,348.2
33,546,448.8
41,531,961.2
45,222,452.8

172,504,582.8
190,790,681.3
204,681,664.9
226,403,180.9
249,586,282.9
292,197,998.4
344,128,470.5
404,207,004.0
459,287,761.0
426,876,921.0
459,154,898.4
531,491,526.8
590,684,416.0

2013
2014
2015
2016

238725.9
26,163.4
28,016.3
29,942.4
32,068.5

16,694.9

322,501,973.7

4,551,995,388.9

AO
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011

b =
b =

2,030.5
2,206.5
2,389.5
2,591.5

207,032,566.16
2185884725
0.095

LOS DATOS DE ESTUDIO QUE SE REQUIEREN OBTENER SE OBTIENEN SUSTITUYENDO LOS VALORES OBTENIDOS PARA
LOS COEFICIENTES "a" Y "b", y "X=14,15,16 Y 17" , EN ECUACION Y=A+BX

a =

Y - bX
n

a =

-5915.690764
13

a =

-455.05

Mtodo de Tendencias: Este mtodo se fundamenta en gran medida en la tendencia histrica de los datos,
con nfasis en el primero y el ltimo dato de la serie histrica, sobre el clculo de una tasa de variacin (de
carcter compuesto), llamada Tasa Promedio de Crecimiento (Tpc). Una vez obtenida esa Tasa, es posible
estimar el dato para el siguiente periodo. El dato obtenido en esta forma, es producto de la tendencia de la
serie histrica, por lo cual ser alcista si la serie ha sido creciente, y decrementalista si la serie es decreciente.
Como en todos los mtodos, sus resultados se debern tomar con cautela, y compararse con los obtenidos
por otros mtodos, con las condiciones macroeconmicas previstas por el BCR, y con variaciones previstas los
precios, cobros por servicios, tarifas, aranceles, etc.

43
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

Y (n+1) =

Yt + Tpc (Yt)

Tpc: Tasa Promedio de Crecimiento


Formula para obtener la Tpc:
Tpc

= [ ( Yt / Yo )

1/n

- 1.0 ] X 100

donde:

Y (n+1) =
Yt
Yo
n

Tpc

= Dato estimado por Tendencia

ao 2014 =
ao 2015 =
ao 2016 =

DATOS
REALES

= Dato real del ultimo periodo


= Dato real del primer periodo

2000

= Numero de periodos en analisis

2001

2002

2003

799.8
866.3
903.9
960.3

2004

1,026.2

= [ ( 1,860.7

Tpc = [ ( 2.32 )

ao 2013 =

Tabla de Datos:
n
AO

/ 799.8 ) 1/13 - 1.0 ] X 100

1/13

- 1.0 ] X 100

2005

1,169.9

Tpc = [ 1.067105 - 1.0 ] X 100

2006

1,362.5

Tpc = [ 0.067105 ] X 100


Tpc = 6.71053 %

2007

2008

2009

10

2010

11

2011

12

1,506.8
1,615.2
1,256.2
1,565.6
1,801.5

2012

13

Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)

= Yt + Tpc (Yt)
= 1,860.7+ 0.067105*(1860.7)
= 1,985.6
= 1,985.6+ 0.0671053*(1,985.6)
= 2,118.8

Y (n+1)
Y (n+1)
Y (n+1)
Y (n+1)

= 2,118.8+ 0.067105*(2,118.8)
= 2,260.9
= 2,260.9+ 0.067105*(2,260.9)
= 2,412.6

1,860.7

2013

14

1,985.6

2014

15

2,118.8

2015

16

2,260.9

2016

17

2,412.6

Suavizado Exponencial: Este mtodo contiene un mecanismo de autocorreccin que ajusta


los pronsticos en direccin opuesta a los errores pasados. Es un caso particular de
promedios mviles ponderados de los valores actuales y anteriores en el cual las
ponderaciones disminuyen exponencialmente. Se emplea tanto para suavizar como para
realizar pronsticos.

44
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Ministerio de Hacienda
Direccin General del Presupuesto

En este caso se tomara un =0.4


AO

X (PERIODO)

Y (DATOS)

2000

2001

2002

2003

2004

2005

2006

2007

799.8
866.3
903.9
960.3
1,026.2
1,169.9
1,362.5
1,506.8
1,615.2
1,256.2
1,565.6
1,801.5
1,860.7

2008

2009

10

2010

11

2011

12

2012

13

2013

14

2014

15

2015

16

2016

17

Clculo

ao base
2001=2000
0.4*(866.3)+(1-0.4)*(799.8)
0.4*(903.9)+(1-0.4)*(826.4)
0.4*(960.3)+(1-0.4)*(857.4)
0.4*(1026.2)+(1-0.4)*(898.6)
0.4*(1169.9)+(1-0.4)*(1037.7)
0.4*(1362.5)+(1-0.4)*(1090.6)
0.4*(1506.8)+(1-0.4)*(1199.4)
0.4*(1615.2)+(1-0.4)*(1322.4)
0.4*(1256.2)+(1-0.4)*(1439.5)
0.4*(1565.6)+(1-0.4)*(1366.2)
0.4*(1801.5)+(1-0.4)*(1446)
Valores Estimados
1,985.6
0.4*(1860.7)+(1-0.4)*(1588.2)
2,118.8
0.4*(1985.6)+(1-0.4)*(1697.2)
2,260.9
0.4*(2118.8)+(1-0.4)*(1812.6)
0.4*(2,260.9)+(1-0.4)*(1935.1)

Pronosticos

799.8
826.4
857.4
898.6
1,037.7
1,090.6
1,199.4
1,322.4
1,439.5
1,366.2
1,446.0
1,588.2
1,697.2
1,812.6
1,935.1
2,065.4

Pronsticos realizados por


suavizado exponencial

Para estimar los pronosticos por


este metodo se tomaron de base
para los aos 2013-2015 los
realizados por el metodo de
tendencia

45
Ms y mejores servicios pblicos con equilibrio y sostenibilidad fiscal

Вам также может понравиться