Академический Документы
Профессиональный Документы
Культура Документы
HISTORIA DE LA ESTADÍSTICA
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones
lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la
riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y
población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo
Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos
obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab,
general del ejército hacer un censo de Israel con la finalidad de conocer el número de la
población.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron
censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de
recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos
para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear
los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus
funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin
olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la
población bajo la autoridad del imperio….
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la mente imágenes
de números apilados en grandes arreglos y tablas, de volúmenes de cifras relativas a
nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y así
sucesivamente. Huntsberger tiene razón pues al instante de escuchar esta palabra estas son
las imágenes que llegan a nuestra cabeza.
La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es una ciencia con
tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias. Los
1
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
mercados, la medicina, la ingeniería, los gobiernos, etc. Se nombran entre los más destacados
clientes de ésta. La ausencia de ésta conllevaría a un caos generalizado, dejando a los
administradores y ejecutivos sin información vital a la hora de tomar decisiones en tiempos
de incertidumbre.
La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos
matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la cual se
adhirió a la Estadística a las ciencias formales.
En este breve material se expone los conceptos, la historia, la división así como algunos errores
básicos cometidos al momento de analizar datos Estadísticos.
DEFINICION DE LA ESTADISTICA
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a
individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos
significados precisos o unas previsiones para el futuro.
Otros autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no
tan semejantes. Para Chacón esta se define como “la ciencia que tiene por objeto el estudio
cuantitativo de los colectivos”; otros la definen como la expresión cuantitativa del conocimiento
dispuesta en forma adecuada para el escrutinio y análisis. La más aceptada, sin embargo, es la de
Minguez, que define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la
cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su
predicción próxima”.
Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una
confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra
estadística, en primer término se usa para referirse a la información estadística; también se
2
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la
información estadística; y el término estadístico, en singular y en masculino, se refiere a una
medida derivada de una muestra.
DIVISION DE LA ESTADISTICA
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística
Descriptiva y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y
gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir
nada que vaya más allá de los datos, como tales.
3
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística
Inferencial investiga o analiza una población partiendo de una muestra tomada.
METODO ESTADISTICO
El conjunto de los métodos que se utilizan para medir las características de la información, para
resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de
información, es lo que se llama métodos estadísticos. Los métodos de análisis para la
información cuantitativa se pueden dividir en los siguientes seis pasos:
4
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos
matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la
cual se adhirió a la Estadística a las ciencias formales.
En este breve material se expone los conceptos, la historia, la división así como algunos
errores básicos cometidos al momento de analizar datos Estadísticos.
UTILIDAD E IMPORTANCIA
Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
descriptivas.
5
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
ESTADISTICA Y EDUCACION
La estadística en la educación es de suma importancia, en lo referente al análisis del grado
académico, social, económico y calidad de vida de los educandos, facilitadores y autoridades.
En el ámbito general nos permite diagnosticar un evento con el fin de retroalimentar y tomar
decisiones para mejorar.
6
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
EL PROCESO ESTADISTICO
7
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
ENTEROS
(Variable Discreta)
CUANTITATIVAS Nº de hermanos: 5
O VARIABLES FRACCIONADOS
(Adoptan Valores) (Variable Continua)
(X - Y - Z) Estatura: 1.65
CLASIFICACION DE LA ESTADISTICA
DESCRIPTIVA
INFERENCIAL
8
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
POBLACION:
ESTADISTICA DESCRIPTIVA
XI = Primer Dato
Xn = Ultimo dato
Resultados: Parámetros
ESTADISTICA INFERENCIAL
9
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
INFERIR
ESTIMAR
Resultados: Estadígrafos
MEDICION
Se denomína medición al proceso de diferenciación y clasificación de los
elementos de una muestra o población, en función de ciertas características
siguiendo determinadas normas.
OBJETIVO DE LA MEDICION
La medición busca como objetivo proporcionar una base exacta y comunicable
que nos permita describir, diferenciar y clasificar las características de los
elementos investigados.
10
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
LAS y ordenarlas alfabéticamente. Por ejemplo el Estado Civil puede clasificarse en cinco
modalidades o categorías: Casados, divorciados, solteros, unión libre. Viudos y así poder
determinar el número de elementos (personas) que corresponden a cada categoría o
modalidad. En otros casos las características cualitativas pueden además de clasificarse
sus modalidades, es posible JERARQUIZARLAS en un orden creciente o decreciente. Por
ejemplo el estatus socio-económico podemos clasificar los en: Clase alta, media y baja
existiendo una diferenciación jerárquica entre ellas.
Por lijltimo, las características cuantitativas pueden ser medidas en un sentido estricto. Por
ejemplo Coeficiente de inteligencia, sueldos.
De lo expuesto podemos señalar que los datos obtenidos en una investigación pueden ser
objeto de: clasificación, jerarquización y medición, para lo cual existen cuatro tipos de
medidas: NOMINAL. ORDINAL, INTERVALOS Y RAZON.
TIPOS DE MEDIDAS
1.- Nominal 2.- Ordinal 3.- Intervalos 4.- Razón
MEDICION NOMINAL
Clasifica la característica cualitativa en modalidades o categorías
mutuamente excluyentes y sin ningún orden. Los números que se
emplean son simbólicos sin propiedades cuantitativas. Las reacciones
matemáticas son de igualdad ( = ) y desigualdad ( -F )
Ejemplo:
11
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
ESTADO CIVIL
1.- Casados 2.- Divorciados 3.- Solteros 4.- Unión libre 5.- Viudos
MEDICION ORDINAL .
Clasifica la característica cualitativa en modalidades o categorías
jerárquicas o de orden. Los números empleados solo indican posición.
Las relaciones matemáticas son de: mayor que ( > ) y menor que ( < ).
Ejemplo
STATUS SOCIO-ECONOMICO
12
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
Por no existir el cero absoluto es improcedente considerar que una persona que tenga un Cl. de
100 sea el doble de inteligente de otra persona que tenga un C.l. de 50.
MEDICION DE RAZON
Clasifica y ordena la característica cuantitativa en clases o intervalos. Con la
particularidad de que el valor del cero es absoluto que representa nulidades o
inexistencia de las características analizada. Los números poseen todas las
propiedades aritméticas. La distancia entre intervalos es conocida cuantitativa mente.
Ejemplo
S U E L D O S' Empleados
(miles de dólares)
Li Ls fi
220 224 4
225 229 5
230 234 2
235 239 1
240 244 1
245 249 2
250 254 l
Para existir el cero absoluto es procedente señalar que una persona que gana quinientos mil
dólares ($. 500.000,00) gana el doble de otra que gana doscientos cincuenta mil dólares.
250.000,00).
13
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
ANALlSIS ESTADlSTICO. Además de las señaladas para medición por intervalos tenemos la
Media Geométrica y el Coeficiente de Variación.
14
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
CARACTERISTICAS DE LA INVESTIGACION
Cuando se realiza una investigación las características básicas que deben tener la misma
son:
-- VALIDEZ
-- CONFIABILIDAD –
--PRECISION
Validez: Esto es, que sea demostrable
Confiabilidad: Es decir que pernita ser aplicable con iguales o parecidos resultados
Precisión: Que su exactitud sea satisfactoria en concordancia con el objetivo de la
investigación.
El conocimiento claro del fenómeno que queremos investigar nos permite la ventaja de
conocer que a lo mejor ya existe suficiente información sobre dicho fenómeno, de tal,
manera que podíamos optar por utilizar la misma, o si dicha información adolece de
limitaciones trataremos de superarlas con el previo conocimiento de cuáles fueron los
factores que incidieron en dichas limitaciones.
15
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
FENOMENO ESTADISTICO
PROCESO ESTADISTICO
"Todo proceso requiere de un PLANEAMIENTO que nos permita señalar con claridad
las clases de actividades necesarias para llevar a cabo una investigación.
En cuanto a las fases o actividades que requieren un proceso estadístico seguiremos los
lineamientos fundamentales que sobre el tema presenta el prestigioso estadístico Stephen
P. Shao en su obra: "Estadística para Economistas y Administradores de Empresas".
El mencionado autor señala cuatro fases fundamentales que deben implementarse sistemá-
ticamente:
16
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y TRANSFORMA,
SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
Esta primera fase del proceso estadístico tiene como objetivo recopilar u obtener la
información que se requiere en la investigación estadística.
Fuente Interna
RECOPILACION DE LOS DATOS
Datos Publicados
Directa
Fuente Externa
Encuesta
Indirecta
Observación directa
FUENTE INTERNA
Cuando los datos que se requieren se los recopila dentro de la Organización o
Institución que realiza o auspicia la Investigación.
17
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y
TRANSFORMA, SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
FUENTE EXTERNA
Cuando los datos se recopilan de otras fuentes ajenas a la organización se
considera de fuente externa.
DATOS PUBLICADOS
En nuestro medio existen innumerables organismos tanto públicos como
privados, que realizan actividades en el orden económico, comercial, educativo,
político, social, cultural, etc. y regularmente publican sus investigaciones en
diarios, revistas, folletos, textos, constituyendo estos medios en fuente de datos
publicados. .
ENCUESTA
Constituye el mejor mecanismo para obtener o recopilar datos cuando las otras
fuentes no satisfacen nuestros requerimientos. La encuesta es una recopilación a
base de muestreo (muestras) y de utilización ocasional y constituye la base
fundamental de la estadística inferencial.
ENCUESTA INDIRECTA
Cuando se obtiene o recopila los datos por medios como el teléfono o el correo.
18
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y
TRANSFORMA, SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
19
ING. JUAN R. GUERRERO JIRÓN - EL VERDADERO EDUCADOR INVESTIGA, SE ACTUALIZA Y
TRANSFORMA, SOLO ASI SEREMOS LIBRES DE LA IGNORANCIA
OBSERVACION DIRECTA
Es la última modalidad para obtener datos de fuente externa que consiste en
obtener la información mediante la visualización del fenómeno que se
investiga sin la utilización de ningún tipo de cuestionario.
Los datos obtenidos o recopilados de cualquier fuente deben ser organizados. Los de
fuente interna y los de fuente externa mediante datos publicados deben ser reelaborados.
Mientras los obtenidos mediante encuesta deben ser organizados mediante un proceso
que abarca tres actividades:
CORRECCION DE DATOS
20
ING. JUAN GUERRERO ESTADISTICA
SERIE CRONOLOGICA
SERIE GEOGRAFICA SERIE
CUANTITATIVA SERIE
CUALITATIVA
Dentro de la función descriptiva las tablas y las gráficas constituyen un valioso y eficaz
instrumento para describir los datos de un fenómeno estadístico. Sin embargo siempre se
espera que podamos hacer comparaciones cuantitativas entre distribuciones de un mismo
fenómeno, y las medidas o estadígrafos de tendencia central nos permiten lograr este
objetivo.
21
ING. JUAN GUERRERO ESTADISTICA
Las medidas de tendencia central sirven para darnos a conocer el VALOR CENTRAL en
torno al cual se distribuyen los valores de la variable.
Las medidas de tendencia central se denominan también promedio, aunque esta categoría
suele designarse para la Media Aritmética. Son valores que no podrían ser ni el más grande
(XM), ni el más pequeño (Xm), sino un valor intermedio ubicado por el centro de la
distribución, de ahí el término de medidas de tendencia central.
Usualmente a través de los medios de comunicación. Folletos, revistas, textos solemos leer
o escuchar enunciados como: Ventas promedio, sueldos promedio, inflación promedio etc.
y son precisamente valores o medidas a través las cuales pos permite hacer comparaciones
sobre un determinado fenómeno. Por ejemplo: Las ventas semanales del Comisariato "A"
son de un promedio de 80 millones. Mientras que las del Comisariato "B" son de 40
millones. Con ello estaríamos estimando que el Comisariato "A" está vendiendo semanal-
mente el doble que el Comisariato "B".
Además de las medidas de tendencia central tenemos otras medidas también posiciónales
22
ING. JUAN GUERRERO ESTADISTICA
X
Xi
n
Es el promedio, medida o estadígrafo de mayor utilidad en el análisis estadístico tanto
descriptivo como inferencial
LA MEDIA ARITMETICA EN UNA SERIE SIMPLE
Se denomina Serie simple a la Serie cuantitativa conformada por pocos valores, de caso
poco frecuente en estadística y empleada más con fines didácticos.
PRECIO
Xi
A S/. 20
B 25
C 30 N=4
D 36
20 25 30 36
X
4
111
X
4
23
ING. JUAN GUERRERO ESTADISTICA
X 27.75
-El precio promedio del artículo investigado es de S/. 27.75
X
Xi. fi
n
X
Xi. fi X
234
X 3.34
n 70
24
ING. JUAN GUERRERO ESTADISTICA
Veamos otro ejemplo: Se hizo una encuesta sobre el número de veces que semanalmente
concurren los clientes de un Comisariato a hacer compras.
Concurrencia Clientes
Semanal
Xi fi Xi.fi
1 32 32
2 11 22
3 15 45
4 7 28
6 5 30
------ ------
N=70 157
X
Xi. fi X
157
X 2.24
n 70
Los clientes del Comisariato en promedio 2.24 concurren hasta dos veces
semanales
TAREA
1.- Tomando como referencia los siguientes datos. Calcular los siguientes promedios.
EMPAQUES REALIZADOS
25
ING. JUAN GUERRERO ESTADISTICA
a.) Cuánto es el Promedio de Empaques que en ese determinado día realizan los
trabajadores de la empresa.
b.) Cuánto es el Promedio de días de faltas anuales que tienen los empleados.
Cuando los datos han sido agrupados en intervalos de clase de igualo desigual anchura el
promedio aritmético se lo calcula con la misma fórmula anterior con la particularidad de
que el valor de la variable Xi corresponde al valor de la Marca de clase de cada intervalo.
Marca de
Minutos de Atrasos Trabajadores
Clase
Li Ls Xi f Xi fi
30 34 32 2 64
35 39 37 8 296
40 44 42 11 462
45 49 47 23 1.081
50 54 52 13 676
55 59 57 8 456
60 64 62 4 248
65 69 67 5 335
70 74 72 0 0
75 79 77 1 77
----- ----
N=75 3.695
26
ING. JUAN GUERRERO ESTADISTICA
Xi. f 3.695
X X X 49.27
n 75
Los trabajadores se atrasan un promedio de 49 minutos trimestral
X Ot
xi. fi c
n
Donde:
Ot = Origen de Trabajo, que es el valor de la Marca de Clase escogida
arbitrariamente que bien puede ser la ubicada centralmente o la de mayor
frecuencia, y al que se considera como desviación (xi) cero.
xi = Son las desviaciones consideradas unitariamente y a partir de la desviación
cero (Ot) hacia arriba son negativas, y hacia abajo son positivas.
frecuencia.
Dependiendo si el resultado es positivo o negativo se sumará o restará del
Origen del Trabajo.
n= Total de datos de la distribución.
c= Anchura del agrupamiento.
27
ING. JUAN GUERRERO ESTADISTICA
X
xi. fi
n
1'060.827.600
X 9.829,03
107.928
28
ING. JUAN GUERRERO ESTADISTICA
METODO ABREVIADO
Ot= Marca de clase ubicada centralmente.
Xi xi fi Xi.fi
X Ot
xi. fi c
n
X 10.450
67.020
1.000
107.928
X 10.450 620,97
X 9.829,03
TAREA:
Se ha realizado una investigación sobre la edad de los trabajadores que laboran en el
Área de Comercio de cierta región del país. Calcular el promedio aritmético de la edad
mediante el Método directo y el Método abreviado utilizando como Origen de Trabajo
las Marca, de clase de Mayor y Menor frecuencias.
29
ING. JUAN GUERRERO ESTADISTICA
Xp
xi. pi
pi
Es necesario señalar que las ponderaciones no constituyen frecuencias, sino que expresan el
PESO, GRADO o IMPORTANCIA menor o mayor que dentro de la Serie tienen los
valores de la variable.
¿Cuánto es el promedio porcentual .de utilidad que en ese mes tuvo el Comisariato?
30
ING. JUAN GUERRERO ESTADISTICA
X
xi X
30 25 40
X
95
X 31.67%
n 3 3
% Utilidad Ventas
Xi.pi
Xi pi
30 2.300.000 69.000.000
25 1.500.000 37.500.000
40 800.000 32.000.000
4.600.000 138.500.000
Xp
xi. pi
pi
138.500.000
Xp
4.600.000
X p 30,11%
31
ING. JUAN GUERRERO ESTADISTICA
COMPROBACIÓN:
31,11x4.600.000
U .T .
100
U .T . 1.385.000
Veamos el caso en que las Ventas (Ponderaciones) sean iguales. Es decir tengan el mismo
peso o grado. Y en este caso la media aritmética simple constituye el promedio correcto.
SECCIONES VENTAS % UTILIDAD UTILIDAD
Prod. 1a.Necesidad 1'000.000 30 300.000
Electrodomésticos 1'000.000 25 250.000
Ropa y Otros 1'000.000 40 400.000
3'000.000 950.000
X
xi X
30 25 40
31,67%
n 3
31,67 x3'000.000
U .T .
100
U .T . 950.000
TAREA:
Una empresa Industrial tiene Secciones Productivas donde se elaboran ciertas, piezas
ensamble: ¿Cuánto es el promedio de producción diaria que tiene la empresa?
Producción
Diaria Producción
Sección Obreros Por Obrero Total
A 50 300 15.000
B 45 280
C 38 260
32
ING. JUAN GUERRERO ESTADISTICA
33
ING. JUAN GUERRERO J. ESTADISTICA
TENDENCIA LINEAL
AJUSTE DE LA TENDENCIA POR MINIMO CUADRADO
CODIFICACION DEL TIEMPO
EXTRAPOLACION E INTRAPOLACION
METODOS ABREVIADOS PARA CALCULAR LA TENDENCIA LINEAL
SELECCIÓN DE NUMEROS PAR E IMPAR DE PERIODOS
TENDENCIA NO LINEAL
.OBJETIVOS
34
ING. JUAN GUERRERO J. ESTADISTICA
INTRODUCCIÓN.
Una serie Cronológica es un conjunto de datos sobre las variaciones de un fenómeno
(variable tales como: Ventas, Producción, Ingresos, Precios, Importaciones, Exportaciones
etc., consideradas en épocas (días, meses, años) diferentes.
Para clarificar lo expuesto en el párrafo anterior reproduciremos lo que sobre el tema nos
indica el estadístico español Alfonso Barbancho:
"Como el tiempo es una variable que implica un orden natural las observaciones se escriben
siguiendo previamente ese orden, de aquí la denominación de "Serie"", que supone una
"sucesión" de términos en un cierto orden. Por otra parte el mantenimiento de este orden es
fundamental para poder analizar la evolución temporal de un fenómeno dado. Este
análisis permite describir la evolución pasada de una variable y, por otro, formular
predicciones sobre un futuro más o menos cercano".
La mayor utilidad del análisis de las series cronológicas es que nos permiten describir el
comportamiento de una variable y su desarrollo en el tiempo. Estos patrones de compor-
tamiento nos facilita proyectar y estimar con ello su comportamiento en el futuro, lo que nos-
provee de una eficaz herramienta que nos ayuda a sortear la incertidumbre ante el porvenir.
Los valores que toma la variable Y (Ventas, Producción, etc.) consideradas en el tiempo, son
fruto de la conjunción de múltiples factores o fuerzas que actúan sobre la variable objeto de
análisis. Estos factores podemos clasificarlas en cuatro componentes:
Estos cuatro componentes nos señalan las variaciones de los movimientos de una serie de
Tiempo y por ello su análisis es más complejo que el estudiado en la regresión. Además es
necesario puntualizar que el tiempo solo constituye el marco donde se desenvuelve la
variable y que la variación de la misma (Ventas, Producción, Ingreso, etc.) no son debidas al
tiempo sino a los factores arriba señalados.
Señala la dirección del movimiento de la serie dentro de un periodo largo de tiempo. Este
movimiento puede crecer o decrecer en una línea recta o una curva en forma gradual
conforme se desenvuelve en el tiempo, Gráficamente la tendencia se la representa por una
línea recta o una curva suave.
La mayoría de autores señalan que el periodo analizado no debe ser menor a cinco de ellos,
que bien pueden ser décadas, años, meses, que no permitiría establecer la línea de tendencia
(recta, curva) que sea lo suficientemente representativa de la variable analizada.
36
ING. JUAN GUERRERO J. ESTADISTICA
Son movimientos más o menos regulares que se presentan en periodos de doce meses (1 año)
y que reciben la influencia de las estaciones como Invierno o Verano en nuestro país. Dentro
de la variación estacional también es posible encontrar movimientos de tipo cíclicos de corta
duración (diarios, semanal, mensual). Por ejemplo existen variaciones en el consumo de
energía eléctrica durante el día, la asistencia a lugares de recreación son más frecuentes los
fines de semana.
Todos estos componentes juegan un papel importantísimo para efecto de análisis de series de
tiempo, por lo que es oportuno transcribir lo que sobre al respecto expone Ernesto Casa Aruta
en su obra: 200 Problemas de Estadística Descriptiva:
"Estos cuatro componentes o fuerzas, por consiguiente son los que conjuntamente, dan lugar
a que el fenómeno observado se presente con mayor o menor intensidad en cada instante de
tiempo. Ahora bien, lo que no puede saberse con certeza es como se conjuntan, o de que
forma unen sus fuerzas cada uno de los componentes con la de los demás para dar como
resultado un determinado valor de la variable en un instante observado"
Por la falta de certeza arriba señalada se han implementado dos modelos que tratan de
explicar la conformación de una Serie Cronológica:
MODELO MULTIPLICATIVO: Tx C x E x I
MODELO ADITIVO: T+ C + E + I
38
ING. JUAN GUERRERO J. ESTADISTICA
TENDENCIA SECULAR
Cuando se analiza una Serie Cronológica debemos primeramente graficar el fenómeno con el
objeto de tener una apreciación visual de la tendencia, pues mediante la gráfica podemos
determinar la forma de la tendencia que puede ser rectilínea, parabólica o exponencial, y para
ello el proceso empleado es el mismo que empleamos en el tema de la regresión, con la
particularidad de que los puntos reales los unimos mediante segmentos reales.
Para el caso de la serie cronológica la variable independiente (X) que vendrá a ser el Tiempo,
se lo registra en el eje horizontal, mientras que la variable dependiente (Y) que es el
fenómeno investigado (Ventas, Producción, etc.) se lo representa en el eje vertical. La razón
39
ING. JUAN GUERRERO J. ESTADISTICA
por la que tanto el tiempo como el fenómeno ligado a éste se lo denominan variable, es
porque ambos varían en sus magnitudes.
Sin embargo debemos puntualizar que el tiempo solo es el marco o espacio en que se
desenvuelven el fenómeno sin pretender considerar al tiempo como la causa del desenvol-
vimiento del fenómeno.
TENDENCIA LINEAL
Veamos una serie cronológica en la que analizaremos el comportamiento de la variable
Ventas.
40
ING. JUAN GUERRERO J. ESTADISTICA
Y= a + bx
Los conceptos de a y b son exactamente los mismos que en el Tema de la regresión. Algunos
autores reemplazan el término de la variable X por el término T que hace referencia al
Tiempo. Nosotros utilizaremos el modelo conocido (Y=a + bx) por estar familiarizados con
el mismo.
En la regresión recuérdese que analizamos la relación entre dos variables determinando dicha
relación a través con la línea de regresión. El mismo proceso haremos con las series
Cronológicas en donde el tiempo se representa con la variable X y el fenómeno analizado
con la variable Y.
ECUACIÓN DE LA RECTA
La Ecuación de la recta.
41
ING. JUAN GUERRERO J. ESTADISTICA
a = La intersección en Y cuando X es cero
b = La pendiente que indica el cambio de Y debido al incremento de cada unidad de X
CODIFICACIÓN DEL TIEMPO
La variable independiente TIEMPO, se mide en términos como décadas, años, meses, días, y
para simplificar el cálculo de a y b, podemos Convertir el tiempo en códigos, numerando
cada medida de tiempo (años) según el orden de los mismos:
Años X
1989 1
90 2
91 3
92 4
93 5
94 6
95 7
VENTAS ANUALES DEL COMISARIATO AMAZONAS
AÑOS X Y XY X2
1989 1 120 120 1
1990 2 180 360 4
1991 3 310 930 9
1992 4 280 1.120 16
1993 5 350 1.750 25
1994 6 350 2.100 36
1995 7 400 2.800 49
∑ X ∑ X ∑ XY ∑ X2
X = ∑ X Y= ∑ X
n n
X = 28 Y = 1.900
7 7
X = 4 Y = 284,29
Para calcular b
b = 43,57
Para calcular a
Obtenida la ecuación procedamos a determinar dos puntos extremos para señalar la línea
ideal.
X=0
Y = 110 + 43,57(0)
Y = 110 + 0
Y = 110
X=7
Y = 110 + 43,57(7)
Y = 110 + 304,99
Y = 415
PUNTOS LA LINEA IDEAL
(X,Y) (X,Y)
(0, 110) (7,415)
Entonces la línea ideal y que fuera representada en el gráfico, es aquella que cuando X = 0, Y
nos da 110 en un punto, y en el otro punto cuando X = 7, Y nos da 415.
Si resolvemos la ecuación para cada uno de los valores de X, obtendríamos los valore
pronosticados o teóricos de Y, los que en su sumatoria deben darnos un valor igual a '
sumatoria de los valores reales Y (1.990)
43
ING. JUAN GUERRERO J. ESTADISTICA
Y = a + bX
153,57 = 110 + 43,57(1)
197,14 = 110 + 43,57(2)
240,71 = 110 + 43,57(3)
284,28 = 110 + 43,57(4)
327,85 = 110 + 43,57(5)
371,42 = 110 + 43,57(6)
414,99 = 110 + 43,57(7)
1.989,96 = 1.990
EXTRAPOLACIÓN E INTRAPOLACION
44
ING. JUAN GUERRERO J. ESTADISTICA
Podríamos señalar en forma estimativa que para el año de 1996 el comisariato tendría unas
ventas de 458 millones.
Y97 = a + b(X)
Y97 = 110 + 43,57(9)
Y97 = 110 + 392,13
Y97 = 502,13
Este proceso de estimar o proyectar la magnitud del fenómeno para el futuro se conoce como
EXTRAPOLACIÓN PREVISORA.
Así mismo se puede estimar valores para años anteriores sustituyéndose el valor de X con
valores codificados inferiores al del primer año de la serie. Esto nos permitirá estimar la
magnitud que tuvo el fenómeno en el pasado y de lo cual se carece de información.
ANOS X
1986 -2
1987 -1
1988 0
1989 1
Etc.
¿Aproximadamente que Montos de Ventas habría tenido el Comisariato eh 1988?
AÑOS EXPORTACIONES
1988 505
1989 537
1990 588
1991 614
1992 640
1993 682
1994 690
1995 717
AÑOS X Y XY X2
1988 1 505 505 1
1989 2 537 1.074 4
1990 3 588 1.764 9
1991 4 614 2.456 16
1992 5 640 3.200 25
1993 6 682 4.092 36
1994 7 690 4.830 49
1995 8 717 7.736 64
36 4.973
X ' Y'
8 8
X’=4.5 Y’=621.63
Cálculo De b Cálculo de a
46
ING. JUAN GUERRERO J. ESTADISTICA
b
XY n XY
a Y bX
X 2 nX
2
23.657 8(4,50)(621.63)
b a 621,63 30,44(4,50)
204 8(4,50) 2
23.657 22.378,68
b a 621,63 136,98
204 162
1.278,32
b a 484,65
42
1.278,32
b
42
b 30,44
Y a bX
Y 484,65 30,44( X )
Obtenida la ecuación determinemos la línea ideal con los puntos cuando X=1, X=8.
X 1
Y 484,65 30,44(1)
Y 484,65 30,44
Y 515,09
X 8
Y 484,65 30,44(8)
Y 484,65 243,52
Y 728,17
PUNTOS DE LA LINEA IDEAL.
(X, Y) (X, Y)
(1.515,09) (8.728,17)
Y = a + b(X)
515,09 = 484,65 + 30,44(1)
545,53 = 484,65 + 30,44(2)
575,97 = 484,65 + 30,44(3)
606,41 = 484,65 + 30,44(4)
636,85 = 484,65 + 30,44(5)
667,24 = 484,65 + 30,44(6)
697,24 = 484,65 + 30,44(7)
728,17 = 484,65 + 30,44(8)
---------
4.973,04
Y 4.973Y 4.973
Y = A + b(X)
47
ING. JUAN GUERRERO J. ESTADISTICA
515.09 = 484.65 + 30.44(1)
545.53 = 484.65 + 30.44(2)
575.97 = 484.65 + 30.44(3)
606.41 = 484.65 + 30.44(4)
636.85 = 484.65 + 30.44(5)
667.24 = 484.65 + 30.44(6)
697.73 = 484.65 + 30.44(7)
728.17 = 484.65 + 30.44(8)
4973.04
800
700
600
500
400
300
1988 1989 1990 1991 1992 1993 1994 1995
EXTRAPOLACION PREVISORA
Y’ = a + b(X)
Y’ = 484.65 + 30.44(9)
Y’ = 484.65 + 273.96
Y’ = 758.61
EXTRAPOLACION RETROSPECTIVA
Y = a + b(X)
Y = 484.65 + 30.44(9)
Y = 484.65 + 0
Y = 484.65
En 1987 aproximadamente la empresa exporto 485 mil toneladas métricas de banano.
AÑOS X Y XY X2
1988 1 505 505 1
1989 2 537 1.074 4
1991 4 614 2.456 16
1992 5 640 3.200 25
1994 7 690 4.830 49
1995 8 717 5.736 64
27 3.703
X ' Y'
6 6
X’=4.5 Y’=621.63
49
ING. JUAN GUERRERO J. ESTADISTICA
Cálculo de b Cálculo de a
XY n XY a Y bX
b
X nX
2 2
a= 617.17 – 30.33(4.50)
17.801 6(4.50)(617.17)
b a= 617.17 – 136.49
159 6(4.50) 2
a= 480.68
17.801 16.663.59
b
159 121.50 ECUACION DE LA RECTA
1.137,41 Y= a + Bx
b
37.50 Y= 480.68 + 30.33(X)
B= 30.33
Para 1990 X = 3
-------------------------
Y90= 480.68 +30.33(3)
Y90=480.68 +181.98
Y90=662.66
Para encontrar la ecuación de la recta los valores de a y b se los calcula mediante las
siguientes:
a
Y b
XY
n X 2
En la serie de las ventas del comisariato amazonas tenemos un número impar de periodos
(n=7), en el año mediano vendría a ser el periodo o año central de la serie que vendría a ser el
periodo o año central de la serie que vendría a ser 1992, al cual codificamos con cero y en su
orden unitariamente tal como hacíamos con el método abreviado de la media aritmética,
hacia arriba codificamos: -1, -2, -3, etc; y hacia abajo 1, 2, 3, etc.
AÑOS X Y XY X2
1989 -3 120 -360 9
1990 -2 180 -360 4
1991 -1 310 -310 1
1992 0 280 0 0
1993 1 350 350 1
1994 2 350 700 4
1995 3 400 1.200 9
n=7 0 1.990 1.220 28
X Y XY X2
Calculo de a Calculo de b
a
Y a
XY
n X2
1.990
a b
1.220
7 28
a = 248.29 b = 43.57
ECUACION DE LA RECTA
y = a + bx
153.58 = 284.29+46.57(-3)
(284.29-130.71)
197.15 = 284.29+43.57(-2)
(284.29-43.27)
240.72 = 284.29+43.57(-1)
(284.29-43.27)
284.29 = 284.29+43.57(0)
(284.29)
327.86 = 284.29+43.57(1)
(284.29+43.27)
371.43 = 284.29+43.57(2)
51
ING. JUAN GUERRERO J. ESTADISTICA
y = 284,29 + (284.29+87.14) 43,57(X)
y = a + bx
Si la serie tiene un número par de periodos y se usa el método abreviado del año mediano,
necesariamente el valor central se encuentra en medio de los dos años centrales, para lo cual
se utiliza dos métodos:
a. El primer método consiste en distribuir el valor codificado de una unidad (1) entre los dos
años centrales correspondiéndoles promediamente a cada uno de ellos 0.50 positiva y
negativamente; y a partir de esos valores codificamos en su orden hacia arriba
unitariamente con signo negativo (-) 1.50, (-) 2.50, (-) 3.50, etc. y hacia abajo con signo
positivo: 1.50, 2.50, 3.50, debiendo la sumatoria de X’ ser igual a cero (0).
Con respecto a los método expuestos muchos autores prefieren el primero evitando
considerar las unidades de X de Medio Año que utiliza el segundo método. Pero por otro
lado otros autores
prefieren el segundo método para evitar manipular con números fraccionarios o decimales
que es como se codifican los periodos en el primer método.
Veamos por los dos métodos la serie con un número par de periodos correspondientes a las
exportaciones de Banano de la CIA. FRUTAEXPORT.
PRIMER METODO
52
ING. JUAN GUERRERO J. ESTADISTICA
AÑOS X Y XY X2
1988 (-) 3,50 505 (-) 1.767,50 12,25
1989 (-) 2,50 537 (-) 1.342,50 6,25
1990 (-) 1,50 588 (-) 882,00 2,25
1991 (-) 0,50 614 (-) 307,00 0,25
1992 0,50 640 320.00 0,25
1993 1,50 682 1.023,00 2,25
1994 2,50 690 1.725,00 6,25
1995 3,50 717 2.509,50 12,25
n=8 0 4.973 1.278,50 42
X Y XY X2
Calculo de a Calculo de b
a
Y a
XY
n X2
4,973
a b
1.278,50
8 42
a = 621,63 b = 30,44
y a bX
y 621,63 30,40 X
OBSERVACIONES:
SEGUNDO METODO
AÑOS X Y XY X2
1988 (-) 7 505 (-) 3.535 49
1989 (-) 5 537 (-) 2.685 25
1990 (-) 3 588 (-) 1.764 9
1991 (-) 1 614 (-) 614 1
1992 1 640 640 1
1993 3 682 2.046 9
1994 5 690 3.450 25
1995 7 717 5.019 49
n=8 0 4.973 2.557 168
X Y XY X2
53
ING. JUAN GUERRERO J. ESTADISTICA
Calculo de a Calculo de b
a
Y a
XY
n X2
4,973
a b
2.557
8 168
a = 621,63 b = 15,22
y a bX
y 621,63 15,22 X
Obsérvese que en este segundo método el valor de (b) es precisamente la mitad del
valor de (b) del primer método (30,44/2=15,22). Esto se explica porque (b) se expresa en
6 meses o medio periodo en el segundo método. Así mismo si queremos extrapolar para
1996X= (-) 9 y para 1987 (-) 9EW
Para realizar la comprobación de Y Y , nos dará los mismos resultados que e n el
primer método, ya que el parámetro (a) es igual en los dos métodos y al multiplicarse
(b) por el valor duplicado de X, obtendremos los mismos valores.
y = a + bx
y = 621.63 + 15.22(-7)
y = 621.63 - 106.54
y = 515.09
54
ING. JUAN GUERRERO J. ESTADISTICA
CUESTIONARIO
(n =20)
55
ING. JUAN GUERRERO J. ESTADISTICA
BIBLIOGRAFIA
AUTOR
56