Вы находитесь на странице: 1из 102

Los hombres dudan muchas veces antes de dar el primer

paso, porque piensan que no podrn alcanzar la meta


que se han propuesto. Esta actitud es el principal
obstculo que se opone a su progreso, y que cada uno
de nosotros con un pequeo esfuerzo de voluntad puede
vencer.
Mahatma Gandhi
Manual del Alumno

ESTADISTICA I

ndice General

Pag N
1. Estadstica General ............................................................ 5

2. Estadstica Descriptiva....................................................... 7

3. Las Variables Estadsticas..................................................10

4. La Organizacin de los Datos.....................................11

5. Prctica Calificada..........................................................

6. Presentacin de los Datos...................................................24

7. Estadgrafos de Tendencia Central.................................... 25

8. Estadgrafos de Tendencia Central .................................. 29

9. Estadgrafos de Tendencia No Central...35

11 Estadgrafos de Dispersin.........41

12. Distribucin Bidimensional ............................................. .34

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

14. Regresin Lineal.................................................45

15. Regresin Lineal - Anlisis de Correlacin ...............49

16. Anlisis de Regresin Lineal .............................................65

17. Nmeros Indices ................................................................75

Problemas resueltos..... ...................................83

10. Problemas propuestos....90

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION #1

CAPITULO I ESTADISTICA GENERAL

DEFINICION Y CLASIFICACION DE LA ESTADISITICA

ESTADISTICA: Es una ciencia aplicada a cualquier tema del


saber humano y se encarga de recopilar, ordenar, clasificar y presentar
una informacin llamada Muestra, con el fin de inferir acerca del
comportamiento de una poblacin.

La Estadstica se clasifica en:

1. Estadstica Descriptiva; es la que se encarga de recopilar, ordenar,


clasificar y presenta una informacin, llamada muestra aleatoria.
2. Estadstica Inferencial; es la parte de la Estadstica que se encarga
de inferir sobre el comportamiento de una poblacin a partir de
una muestra, bajo un margen de error o incertidumbre que es
cuantificado por la teora de probabilidades.

CONCEPTOS FUNDAMENTALES EN ESTADISTICA

POBLACION: Es un conjunto de observaciones que tienen una


caracterstica en comn la cual se desea estudiar, la poblacin
representa la totalidad de elementos de un determinado estudio y
puede ser finita o infinita.

Ejemplos:

1. Habitantes de Lima (aptos para el sufragio). Poblacin


Infinita
2. Alumnos de WIENER (altura en mts.) Poblacin Finita

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Una poblacin si es infinita no se puede estudiar en forma completa;


an si es finita es muy engorroso estudiarla en forma completa por que
involucra prdida de tiempo, dinero, etc., por esta razn nos basamos
en una muestra aleatoria.

MUESTRA
Es un subconjunto de la poblacin y para que la muestra sea
representativa debe ser aleatoria o no sesgada.
Una muestra es aleatoria cuando cada elemento de la poblacin tiene la
misma posibilidad de ser seleccionado en la muestra.
La demostraremos por: n= tamao de la muestra nmero total de
observaciones en la muestra.

Ejemplos:

1. Encuesta a 900 personas de Lima aptos para el sufragio.


n = 900
2. Altura (mts) de 45 alumnos de WIENER
n = 45.

PARAMETRO
Nmero que representa a la poblacin. Este valor generalmente es
estimado a partir de una muestra, porque para que sea calculado
exactamente se requiere de la informacin completa de una poblacin lo
cual es muy difcil (los procesos de estimacin de parmetros ser tema de
estudio en Estadstica Inferencial).

ESTADIGRAFO
Llamado tambin estadstico o estimador. Nmero que representa a la
muestra y que puede ser calculado teniendo la informacin de una muestra.
Los Estadgrafos se dividen en:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1. Estadgrafos de Posicin o Tendencia Central: Son aquellos


nmeros que tienden al centro de las observaciones.
2. Es tadgrafos de Dispersin: Son aquellos nmeros que
cuantifican la variabilidad de las observaciones de una muestra.

DATO:
Es la recopilacin o anotacin de cada caracterstica de las observaciones
de una muestra.

Ejemplo:
Altura (mts) de n=5 alumnos de WIENER: 1.65, 1.59, 1.68, 1.63, 1.69.

SESION # 2

CAPITULO II ESTADISTICA DESCRIPTIVA

La Estadstica Descriptiva, se encarga de recopilar la informacin de


una muestra aleatoria, esta informacin tiene que ser ordenada para
una buena presentacin; Esta ordenacin se basa en las llamadas
Tablas de Frecuencias y tambin en los Grficos Estadsticos.

RECOPILACION DE DATOS
Es el momento en el cual el investigador se pone en contacto con los
objetos o elementos sometidos a estudio, con el propsito de obtener
datos o respuestas de las variables consideradas; a partir de estos datos
o respuestas se calculan los Estadgrafos o indicadores estadsticos.

FUENTES DE DATOS

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

La fuente de datos, es el lugar, la institucin, las personas o elementos


donde estn o que poseen los datos que se necesitan para cada uno de
las variables o aspectos de la investigacin o estudio.

En general, se puede disponer de cinco tipos de fuentes de datos:

1. Las Oficinas de Estadstica.- Como instituciones responsables


de recopilar, procesar y publicar las estadsticas sociales o
nacionales.

2. Archivos o Registros Administrativos.- Como el Registro Civil,


Electoral, Escalafn o Personal, Padrn de Contribuyentes, etc..
Estos registros no tienen fines Estadsticos, su funcin es de tipo
legal y administrativo, sin embargo pueden utilizarse como
fuentes de datos estadsticos.

3. Documentos.- Boletines, e informes estadsticos que son las


publicaciones o estudios que preparan los organismos
especializados.

4. Encuestas y Censos.- Son fuentes directas y especiales, que se


construyen en un momento determinado, recopilando datos de
una parte o de la totalidad de una poblacin.

5. Los Elementos o Sujetos.- Son aquellos que estn sometidos a un


estudio, pueden ser personas, instituciones, animales u objetos.

TECNICAS DE RECOPILACION O RECOLECCION DE


DATOS
Es el conjunto de mtodos y procedimientos que se llevan a cabo para
recolectar los datos.
Las ms frecuentes tcnicas utilizadas son:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1. La Observacin.- Es la accin de mirar de mirar en forma


sistemtica y profunda, con el inters de descubrir la importancia
de aquello que se observa.

2. La Tcnica Documental.- Es aquella que busca datos a travs de


documentos, fuentes escritas o grficas de todo tipo. Ejm.: Libros,
Informes, Autobiografas, fotografas, planos, videos, etc.

3. La Entrevista.- Es la interrelacin o dilogo entre personas, donde


una de ellas se llama Entrevistador o Encuestador quien solicita a
otra persona llamada Entrevistado o Encuestado le proporcione
algunos datos o informacin.

4. El Cuestionario.- Es un instrumento constituido por un conjunto


de preguntas sistemticamente elaboradas, que se formulan al
Entrevistado o Encuestado, con el propsito de obtener los datos
de las variables consideradas en el estudio. El Cuestionario se
desarrolla en el Formulario o Cdula, en donde las preguntas estn
debidamente organizadas.
5. La Encuesta.- Es la tcnica por la cual se obtiene la informacin
tal como se necesita, preparada exprofesamente y con objetivo
estadstico. Permite observar y registrar caractersticas en las
unidades de anlisis de una determinada poblacin o muestra,
delimitada en el tiempo y en el espacio. El Entrevistado da
respuesta a las preguntas en el formulario o Cdula..

SESION # 3

CAPITULO III LAS VARIABLES ESTADISTICAS

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

LA VARIABLE:
Es la representacin simblica de los datos.

Ejemplo:
Sea X: altura de 5 alumnos de WIENER Donde: Xi, i= 1 a 5
X1= 1.65 mts., X4 = 1.63 mts.

Las variables se clasifican en:

I. Variable Cualitativa: Es aquella variable que representa a


datos que indican cualidades, caractersticas, propiedades, etc.,
no son numricas (no medibles).

Ejemplos:

X= Control de calidad de productos de una industria. Bueno,


Malo, Regular, Muy Bueno.

Y= Estado Civil de una muestra de 200 personas. Soltero, Casado,


Viudo, Divorciado.

II. Variable Cuantitativa: Es aquella variable que representa a


datos que indican valores numricos (son medibles), y se
clasifican en:

Variable Discreta: Es aquella que representa a datos


numricos que no se pueden fraccionar, sirven para contar o
enumerar (pertenecen a los reales).

Variable Continua: Es aquella variable que representa a datos


que pueden ser fraccionados (pertenecen a los reales).

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ejemplo: El Peso (Kg.) de 6 personas.


65, 56, 59, 70, 63.
La variable continua es la que ms utilizamos, especialmente para los
estudios correspondientes en Ingeniera (Volumen, Temperatura,
Pesos, Mediciones, etc.).

SESION # 4

CAPITULO IV LA ORGANIZACIN DE LOS DATOS

Distribucin o Tablas de Frecuencias: Es la condensacin,


simplificacin, ordenacin, del conjunto de observaciones que
forman la muestra; la caracterstica principal es no perder ningn dato
de la muestra.
Tambin se puede decir que la Distribucin de Frecuencia es la
representacin estructurada, en forma de tabla, de toda la
informacin que se ha recogido sobre la variable que se estudia.

Categoras o Clases.- Son los datos que estn agrupados por sus
caractersticas comunes.

Frecuencia de Clases.- Es el nmero o cantidad de datos que


componen una Categora o Clase. Las Frecuencias se clasifican en :
1. Frecuencia Absoluta (Simple).- Representa a la cantidad de datos
de cada Clase.
2. Frecuencia Absoluta Acumulada.- Representa a la suma en forma
acumulativa de Clase en Clase de sus respectivas Frecuencias
Absolutas.
3. Frecuencia Relativa (Simple) .- Es el % que representa a la
cantidad de datos de una Clase con respecto al total de datos.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

4. Frecuencia Relativa Acumulada.- Representa a la suma en forma


acumulativa de Clase en Clase de sus respectivas Frecuencias
Relativas.

Veamos un ejemplo (4.1) :


Medimos la altura de los nios de una clase y obtenemos los
siguientes resultados (cm):
Alumno Estatura Alumno Estatura Alumno Estatura
x x X x x x
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
Si presentamos esta informacin estructurada obtendramos la
siguiente Tabla de Frecuencias:
Variable Frecuencias Absolutas Frecuencias Relativas
(Valor) Simple Acumulada Simple Acumulada
X X X X x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1,25 2 14 6,6% 46,6%


1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de
ellos se repite muy pocas veces, entonces conviene agruparlos por
intervalos, ya que de otra manera obtendramos una tabla de
frecuencia muy extensa que aportara muy poco valor a efectos de
sntesis.

Segn los tipos de variables y formas de la tabla de frecuencias,


tendremos las siguientes Tablas de frecuencias

1ER. CASO: Tablas de Frecuencias para la variable Cualitativa:

En este caso como la variable cualitativa indica cualidades, propiedades,


etc., y no son medibles; entonces se agrupa de acuerdo a cada categora
que se diferencia en la variable cualitativa. (Sin un orden establecido).

Ejemplo: (4.2).

Se tiene la siguiente informacin que representa el Estado Civil de 50


personas encuestadas (edad; 20-30 aos).

Estado Civil No. de personas %


Soltero 25 50%
Casado 10 20%

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Viudo 1 2%
Divorciado 6 12%
Conviviente 8 16%

Los grficos que se presentan en este caso son los siguientes:

1). Diagrama de barra:

30
N DE PERSONAS

25
20
15
10
5
0
Divorciado
Soltero

Conviviente
Viudo
Casado

ESTADO CIVIL

2. Grfico por Sectores Circulares.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

PORCENTAJES

Soltero

Conviviente

Divorciado
Viudo Casado

2DO. CASO: Tabla de frecuencia para la variable discreta y n < 30 :


En este caso la variable es discreta y la muestra pequea, adems hay que
considerar que no haya muchos datos diferentes. La Tabla de frecuencias
es por CLASES, donde cada clase representa el valor numrico de la
variable.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

La tdf es de la sgte. forma general:

Clase Xi Fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
. . . . .
. . . . .
. . . . .
Xm Fm Fm=n hm .Hm=1

Donde:

n = numero de clases o intervalos de clase.

fi = frecuencia absoluta: es el nmero de observaciones que hay en


cada clase o intervalo de clase. Adems:

fi+f2+f3+. ...+ fm =n

m
fi = n
i=1

Fi = frecuencia absoluta acumulada: es el numero de observaciones


acumuladas hasta la clase i, es decir:

F1=f1
F2=f1+f2
.
.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Fm=f1+f2+f3...+fm =

hi = frecuencia relativa: representa la relacin que existe entre la


frecuencia absoluta y el nmero total de observaciones:

fi
hi
n

Generalmente la frecuencia relativa se expresa en forma porcentual:


hi % = 100%.

Hi = frecuencia relativa acumulada: frecuencias relativas acumuladas


hasta la clase i.

Hi=h1
H2=h1+h2
.
.
Hm=h1+h2+....hm=1

Tambin :
Fi
Hi
n

Se expresa en forma porcentual. Hi x 100%

Ejemplo:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Los siguientes datos representan el numero de defectos en 15


diskettes: 5, 10, 5, 11,6,6,3,3,3,5,5,5,10,6,3.
Agrupar en tabla de frecuencias:

Solucin:

Como la muestra es pequea y la variable representa a datos discretos,


entonces agrupamos en clases:

No de No. diskettes Fi hi% Hi%


Defectos fi
Xi
3 4 4 26.7 23.7
5 5 9 33.3 60.0
6 3 12 20.0 80.0
10 2 14 13.3 93.3
11 1 15 6.7 100.0

Los grficos que se presentan en este 2do. Caso son:

1. Histograma de frecuencias: En el sistema de coordenadas


rectangulares comparamos Xi vs. fi (o hi%).

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

HISTOGRAMA

6
N DE DISKETTES

5
4
3
2
1
0
3 5 6 10 11

DEFECTOS

3ER. CASO: Tabla de frecuencias por intervalos de clase:


En este caso generalmente la variable es continua, tambin puede ser
usado para la variable discreta siendo la muestra grande
(generalmente n >= 30).

La tdf tiene la siguiente forma:

Intervalos Xi Fi Fi hi Hi
(Li - Ls)
[Xo - X1> X1 f1 F1 h1 H1
[X1 - X2> X2 f2 F2 h2 H2
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
[Xm-1- Xm] Xm Fm Fm hm Hm

Donde:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

X i= marca de clase o punto medio de cada intervalo de clase, se


obtiene mediante la semisuma de los limites de cada intervalo.

X i = Ls + Li
2

fi , Fi, hi, Hi ; representan las frecuencias definidas en el caso anterior.

Procedimiento para construir una tdf por intervalos de clase:

1er. Paso:

Calcular el nmero de intervalos de clase (K):

Para calcular el valor de K, tenemos dos criterios:

a) Criterio personal; de acuerdo a la experiencia del investigador se


puede asumir un valor de m para un tamao de muestra determinado.

b) Mediante la Regla de Sturges:

K =1 +3.3 log. n

2do. Paso:

Calcular la amplitud o tamao del intervalo de clase:(A)

Para calcular la amplitud del intervalo (A) nos basaremos en la siguiente


expresin:

A = Rango de la muestra

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

donde: Rango de la muestra = Valor Mayor Valor Menor

Con este procedimiento calculamos una amplitud que ser constante


para cada intervalo, y lo mismo ocurrir entre cada marca de clase.

Los intervalos sern de la forma: [Li Ls], pudiendo ser considerado


cerrado en el ltimo intervalo.

La amplitud A es preferible que sea redondeada considerando la


misma cantidad de decimales que tengan los dato de la muestra.

3er. Paso: Tabulaciones

Tabular y presentar los datos agrupados en la tdf.,

Ejemplos: (2.3)

Los siguientes datos representan el peso (gr.) de 35 sobrecitos de unas


sustancias: 68, 73, 61, 46, 49, 96, 68, 90, 97, 53, 75, 93, 72, 60, 71,
75, 74, 75, 71, 77, 83, 68, 85, 76, 88, 59, 78, 62, 55, 48, 43, 47, 60, 84,
80. Agrupar en tdf.

Solucin:

1) Calculamos K = 1 +3,3 Log 35 = 6.095 = 6


2) Calcula la amplitud del intervalo A:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

97 43
A 9
6

A
3) Tabular en tdf:

Peso (grs) Xi
= fi Fi hi% Hi%

9
[43 52> 47.5 5 5 14.3 14.3
[52 61> 56.5 5 10 14.3 28.6
[61 70> 65.5 5 15 14.3 42.9
[70 79> 74.5 11 26 31.4 74.3
[79 88> 83.5 4 30 11.4 85.7
[88 97] 92.5 5 35 14.3 100.0

Se observa por ejemplo que: 11 sobrecitos tienen un peso


comprendido en el intervalo [70-79> grs. y representan el 31.4% del
total.
Tambin vemos que 15 sobrecitos pesan menos de 70 grs. y
representan el 42.9% del total.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION # 5

PRIMERA PRACTICA CALIFICADA

SESION # 6

PRESENTACION DE DATOS

LOS GRAFICOS
Los grficos son representaciones en forma de figuras geomtricas,
de superficie o volumen con el objeto de ilustrar los cambios o
dimensin de una variable, para comparar visualmente dos o ms
variables similares o relacionadas. Para una rpida comprensin de
situaciones o variaciones en cantidades, es muy til traducir los
nmeros en grficos o imgenes. Por su naturaleza, un grfico no toma
en cuenta los detalles y no tiene la misma precisin que una tabla
estadstica.
Veamos algunos tipos de Grficos :

1. Histograma de frecuencias: Representa un conjunto de


rectngulos levantados desde cada intervalo de clase hasta la
frecuencia correspondiente (absoluta relativa).

2. Polgono de frecuencias: Consiste en unir los puntos medios


marcas de clase levantadas hasta cada frecuencia correspondientes,
generalmente para su construccin nos podemos basar del Histograma
de frecuencias.
Propiedad: Area del Histograma = Area del Polgono de
frecuencia.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

3. Ojiva: Se construye basndose en un diagrama escalonado, es


decir considerando las frecuencias acumuladas (absoluta relativa), y
uniendo los lmites de cada intervalo.

HISTOGRAMA Y POLIGONO DE FRECUENCIAS

HISTOGRAMA DE FRECUENCIAS

15.00

10.00
fi
5.00

0.00
.47.5 .56.5 .65.5 .74.5 .83.5 .92.5

Xi

SESION # 7

LOS ESTADIGRAFOS DE TENDENCIA CENTRAL

Se llaman as, porque tienden a ubicar el centro de las observaciones; Estos


estadgrafos de posicin son: media, mediana, moda, media geomtrica,
media armnica, etc. Estudiaremos los ms importantes:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1. La Media Aritmtica X
Llamada tambin promedio, es el estadigrafo de posicin ms
simple y fcil de calcular, por eso es el ms comn.
Se calcula teniendo en cuenta los siguientes casos:

1er. Caso: Datos no agrupados en tablas de frecuencias:

Sean X1, X2............, Xn variables que representan los n datos de una


muestra, la media aritmtica se calcula:

n
Xi
X
i 1 n

2do. Caso: Datos Agrupados en tabla de frecuencias:

En este caso se calcula mediante la siguiente frmula:

X
Xi * fi fi = frec. Absoluta
n hi = frec. Relativa

O tambin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

X Xi * hi hi = frec. Relativa

PROPIEDADES DE LA MEDIA ARITMETICA

1. La media de los datos todos iguales a una misma constante es


igual a la constante:

Sea K = cte. y cada Xi = k ----------------- X X (K ) K

2. Si a cada dato e le suma o resta una constante k, la media queda


sumada o restada por dicha constante:

Si Xi = Xi + K -------------------- X(Y) = X(X+k) = X (X) + k

3. Si a cada dato se le multiplica o divide por una constante k, la


media queda multiplicada o dividida por dicha constante.

4. S Yi = Xi* k ------------------------- X(Y) = X(X* k) = X (X) * k

NOTA. Todas las propiedades cumplen para datos agrupados y


no agrupados

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Datos no agrupados
( Xi X ) 0

( Xi X ) * fi 0
Datos agrupados

5. La suma de las desviaciones respecto a la media es igual a cero.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION # 8

ESTADIGRAFOS DE TENDENCIA CENTRAL

2. Media Geomtrica: se eleva cada valor al nmero de veces que se


ha repetido. Se multiplican todo estos resultados y al producto final
se le calcula la raz "n" (siendo "n" el total de datos de la muestra).

Segn el tipo de datos que se analice ser ms apropiado utilizar la


media aritmtica o la media geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos
de inters anuales, inflacin, etc., donde el valor de cada ao tiene un
efecto multiplicador sobre el de los aos anteriores. En todo caso, la
media aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los
valores de la serie, por lo que no se pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso
de la media aritmtica como geomtrica) se puede ver muy influido
por valores extremos, que se aparten en exceso del resto de la serie.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Estos valores anmalos podran condicionar en gran medida el valor


de la media, perdiendo sta representatividad.

3. La Mediana (Me) :

Es aquel estadgrafo de posicin que divide en dos partes


iguales al conjunto de observaciones; es decir la mediana
representa el valor central de una distribucin de datos
ordenados en forma creciente o decreciente.

1er. Caso: Datos No agrupados en TDF:


Primero se ordena los datos en forma creciente o decreciente
y luego se tiene en cuenta s:

a) n es impar. La mediana es el valor central.

n 1 Es el elemento que ocupa la


Me X posicin (n+1) /2
2

Ejemplo: Calcular la Me de los siguientes valores:


32, 34, 31, 42, 36, 41, 32, 45, 37, n=9

Ordenando: 31, 32, 32, 34, 34, 36, 37, 41, 42, 45.
Observamos el valor central:

Me=36 (representa el 5to. dato)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

b) n es par.La mediana es igual al promedio o la


semisuma de los valores centrales.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ejemplo: la Me de 12,21,16,18,20,19,16,15,16,17.

Ordenando: 12,15,16,16,16,17,18,19,20,21,

16 17
Me 16.5
2

2do. Caso: Datos Agrupados en TD:

En este caso la Se me calcula mediante la siguiente frmula:

Me Li

Ame * n Fme1
2

f me

Donde:

Li = limite inferior de la clase mediana.


Ame := tamao del intervalo de la clase mediana.
Fme-1 = Frec. Abs. Acumulada anterior a la clase
mediana.
fme = Frecuencia absoluta de la clase mediana.

Clase Mediana: Es aquel intervalo que contiene el valor que


ocupa la posicin media, es decir contiene a la mediana. Se
calcula mediante:

El primer valor Fi mayor o igual que n/2

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

4. LA MODA (Mo)

Representa al valor que ms se repite en un conjunto de


observaciones:

- Si la distribucin de frecuencias tiene un solo valor


mximo, entonces: UNIMODAL.
- Si la distribucin presenta ms de un valor mximo: ,
entonces: POLIMODAL.
- Si no hay algn valor que se repita con ms
frecuencia: DISTRIBUCION UNIFORME

1er. Caso: Datos no agrupadas

Sealar el valor que ms se repite.


Ej. 4,5,6,7,4,5,4,6,5,5,4,5,5 Mo = 5
UNIMODAL

Ej. 7,7,6,8,8,6,8,7,7,9,12,11,10,8 Mo = 8 BIMODAL

2do. Caso: Datos Agrupados en Tablas de Frecuencias_

D1
M o Li Amo *
D1 D 2

Donde:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Li = limite inferior de la clase modal.


Amo = Amplitud de la clase modal.
D1 = Diferencia ente la Frec. Absoluta de la clase
modal menos la frecuencia absoluta anterior.
D2 = Diferencia ente la Frec. Absoluta de
la clase modal menos la siguiente.

Clase Modal: Representa el intervalo con la mayor


frecuencia absoluta.

Ejemplos. (3.1)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Calcular la Media Aritmtica, Mediana y Moda de la Tabla de


frecuencias del ejemplo (2.3).

47.5 * 5 56.5 * 5 .... 92.5 * 5 gramos


X 70.336
35

Para calcular la mediana, la clase mediana es el 4to. intervalo:

35 15
Me 70 9 * 2 72.05 gramos
11

Para calcular la Moda, la clase modal es el 4to. intervalo, por


que presenta la mayor frecuencia absoluta.
D1=11 - 5 = 6
D2=11 4 =7

6 Gramos
M o 70 9 * 74.15
67

Nota: La media =mediana = moda, si la distribucin es


simtrica.

SESION # 9

ESTADIGRAFOS DE TENDENCIA NO CENTRAL

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Las medidas de Posicin o de Tendencia no centrales


permiten conocer otros puntos caractersticos de la
distribucin que no son los valores centrales. Entre otros
indicadores, se suelen utilizar una serie de valores que
dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la
serie de datos, ordenada de forma creciente
o decreciente, en cuatro tramos iguales, en
los que cada uno de ellos concentra el 25%
de los resultados.
Deciles: son 9 valores que distribuyen la
serie de datos, ordenada de forma creciente
o decreciente, en diez tramos iguales, en los
que cada uno de ellos concentra el 10% de
los resultados.
Percentiles: son 99 valores que distribuyen
la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos
iguales, en los que cada uno de ellos
concentra el 1% de los resultados.
Ejemplo: Vamos a calcular los cuartiles de la serie de
datos referidos a la estatura de un grupo de alumnos).
Los deciles y percentiles se calculan de igual manera,
aunque hara falta distribuciones con mayor nmero de
datos.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

X x x x X
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

1 cuartil: es el valor 1,22 cm, ya que por


debajo suya se situa el 25% de la frecuencia
(tal como se puede ver en la columna de la
frecuencia relativa acumulada).
2 cuartil: es el valor 1,26 cm, ya que entre
este valor y el 1 cuartil se situa otro 25% de
la frecuencia.
3 cuartil: es el valor 1,28 cm, ya que entre
este valor y el 2 cuartil se sita otro 25% de
la frecuencia. Adems, por encima suya
queda el restante 25% de la frecuencia.
Atencin: cuando un cuartil recae en un valor que se ha
repetido ms de una vez (como ocurre en el ejemplo en
los tres cuartiles) la medida de posicin no central sera
realmente una de las repeticiones

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Frmulas para calcular los Cuartiles

Para calcular el Primer Cuartil

n
F1i
Q1 Li
4
F2

Para calcular el Segundo Cuartil

n
F1i
Q 2 Li
2
F2

Para calcular el Tercer Cuartil

3n
F1i
Q3 Li
4
F2
DONDE:
Q1 = Primer Cuartil
Q2 = Segundo Cuartil
Q3 = Tercer Cuartil
Li = Lmite Real inferior de la Clase que contiene el Cuartil
n = Nmero de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ejemplo: Calcular el Primer Cuartil de la siguiente


distribucin de frecuencias, referente al consumo de
energa elctrica de un grupo de usuarios

Consumo Nmero de Frecuencia Lmites Reales


Kw Hora Consumidor Acumulada
05 - 24 4 4 4.5 - 24.5
25 - 44 6 10 24.5 - 44.5
45 - 64 14 24 44.5 - 64.5
65 - 84 22 46 64.5 - 84.5
85 - 104 14 60 84.5 - 104.5
105 - 124 5 65 104.5 - 124.5
125 - 144 7 72 124.5 - 144.5
145 - 164 3 75 144.5 - 164.5
75

75
10 20
Q1 44.5
4
57 KwHora
14

Como cada Cuartil representa el 25%, entonces el Primer Percerntil


ser el 25%.
Respuesta.- El 25% de los usuarios consume 57 KW Hora.

Frmula para calcular los Deciles

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

D = El Decil
Li = Lmite Real inferior de la Clase que contiene el Decil
D # = El nmero de Decil que se quiere hallar
n = Nmero de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase

Utilizando el ejemplo: Calcular el Cuarto Decil de la


distribucin de frecuencias, referente al consumo de
energa elctrica del grupo de usuarios

Como cada Decil representa el 10%, entonces el Cuarto Decil ser


el 40%..
Respuesta.- El 40% de los usuarios consume 69.95 KW Hora.

Frmula para calcular los Percentiles

P = El Percentil
Li = Lmite Real inferior de la Clase que contiene el Percentil
P # = El nmero de Percentil que se quiere hallar

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

n = Nmero de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Percentil
F2 = Frecuencia absoluta de la Clase del Percentil
i = Intervalo de Clase

Utilizando el ejemplo: Calcular el Percentil 79 de la


distribucin de frecuencias, referente al consumo de
energa elctrica del grupo de usuarios

Como cada Percentil representa el 1%, entonces el Percerntil 79


ser el 79%..
Respuesta.- El 79% de los usuarios consume 103.43 KW Hora.
SESION # 10

EXAMEN PARCIAL

SESION # 11

ESTADIGRAFOS DE DISPERSION O VARIABILIDAD

Son aquellos nmeros que miden o cuantifican la variabilidad de las


observaciones, con respecto a un estadgrafo posicin (generalmente
la media aritmtica). Los principales estadgrafos de dispersin son los
siguientes:

1. LA VARIANZA: V (X)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Se define como el promedio del cuadrado de las desviaciones con


respecto a la media.
Cuando la varianza es muestral, entonces V(x) se puede denotar como
y si la varianza es poblacional, entonces V(x) se denota como
.En este captulo estudiaremos la varianza muestral.

La varianza se calcula, teniendo en cuenta los siguientes casos:

1er. Caso: Datos no agrupados en tablas de frecuencia:

Desarrollando esta sumatoria, obtenemos una forma ms simple


para calcular la varianza:

2do. Caso: Datos agrupados en tablas de frecuencias:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

O tambin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Desarrollando esta sumatoria, obtenemos:

O tambin:

Donde:

Xi = marca de clases.
fi = frecuencia absoluta
hi = frecuencia relativa

Propiedades de la Varianza:

1. V(X) >= 0 (siempre la varianza es positiva


igual a cero).
2, V(K) = 0 Esto es si cada Xi = k (constante).
3. V(X+/- K) = V(X) si a cada Xi se le suma (o resta),
una constante K entonces la varianza no varia.

4. si a cada dato se multiplica (o por


una constante K, entonces la
constante sale elevada cuadrado).

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

5. Siendo a y b constantes, X e
Y variables independientes

2. DESVIACION STANDART O TIPICA : S(X)


Se define como la raz cuadrada positiva de la varianza, y como la
varianza esta expresada en unidades cuadradas, la desviacin
standart (que esta expresada en las mismas unidades de los datos),
representa mejor la variabilidad de las observaciones.

3. COEFICIENTE DE VARIACION: C.V.

Representa la relacin que existe entre la desviacin standart y el


promedio de un conjunto de observaciones. El C.V. como no tiene
unidades se debe expresar en porcentaje y sirve como medios de
comparacin con otras distribuciones de cualquier tipo de unidad.

Se calcula:

Donde:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

S(x) = desviacin tpica


X = promedio aritmtico

Ejemplos:

1. Los siguiente datos son temperaturas en grados Fahrenheit

415,500,480,490,476,500,432,479,489,497,496,478,453.

Sin ordenar en tablas de frecuencias:


a) Calcular la varianza.
b) Si a cada dato se le divide entre 5 y luego se suma 10. Hallar la
nueva varianza.

Solucin:

a) Primero tenemos que calcular el promedio para datos no


agrupados:

Entonces, calculamos la varianza:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

b) Es decir:

Esto se resuelve usando propiedades:

2. Dada la siguiente tabla de frecuencias, que representa el peso


(grs), de 34 sobres de cartas:

Intervalos Xi fi Fi
[ 7 8> 7.5 1 1
[ 8 9> 8.5 2 3
[ 9 10> 9.5 8 11
[10 11> 10.5 11 22
[11 12> 11.5 6 28
[12 13] 12.5 6 34

a) Calcular el peso promedio y la mediana.


b) Calcular el Coeficiente de Variacin (C.V.)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Solucin:
a) Calculando el promedio:

Gramos

Calculando la mediana:

Gramos

b) Para calcular el C.V. debemos primero calcular la


varianza

Calculamos la desviacin standart: S(X)=-1.2708 grs. Entonces:

3. Se tiene dos muestras:

En qu muestra cree Ud. Que halla menos variabilidad?

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Solucin:

Primero hay que tener en cuenta que no se puede comparar las


desviaciones standares de cada nuestra, porque estn expresadas
en diferente unidades, pero si podemos compararlas con sus C.V.
respectivos:

Entonces, comprando ambos coeficientes nos damos cuenta que


existe menor dispersin en los datos de la primera muestra.

NOTA: Un C.V. ideal debe estar:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION # 12

CAPITULO V: DISTRIBUCION BIDIMENSIONAL

ANALISIS DE REGRESION Y CORRELACION LINEAL


SIMPLE

Los mtodos estadsticos presentados lo hemos referido hasta


Ahora a una sola variable, muchos de los problemas de trabajo
estadstico, sin embargo involucran 2 ms variables. En algunos
casos las variables se estudian Simultneamente, para ver la forma
en que se encuentran interrelacionadas, tambin si se desea
estudiar una variable de inters particular. Estos dos casos de
problemas se conocen por lo general con los nombres de
correlacin y regresin.

Antes de definir estos casos hablaremos sobre aspectos


importantes que involucran 2 variables: Distribucin Bidimensional.

5.1. Clculo de la Covarianza: S (XY)

La varianza, es la medida que estudia la dispersin de dos


variables, se calcula teniendo en cuenta:

1er. Caso: Datos no agrupados en tablas de frecuencia: En este


caso, las variables X Y se toman en forma simultnea; es decir se
considera no agrupados porque se toman los valores como puntos
cartesianos (pares de valores). (X1,Y2), (X2,Y2)..........(Xm,Ym).
Esto es:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

X X1 X2 X3 .......... XN
Y Y1 Y2 Y3 .......... YN

N: nmero de observaciones total de pares de valores.


De cada observacin se analiza dos variables Simultneamente.

Las Covarianza; S (XY) se define:

............................. ( I )

desarrollando la sumatoria y simplificando:

.........................( II)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Para calcular la covarianza S(XY), es preferible utilizar la ec. (II).


Los promedios de X y de Y, as como las desviaciones standares
S(X) Y S(Y), se calculan como en los captulos 3 y 4.

2do. Caso: Datos Agrupados en tablas de frecuencias:

En este caso cada variable X e Y, estn agrupados en tablas de


frecuencias presentndose lo que se llama: Distribucin
Bidimensional o Tabla de Doble Entrada.

En forma tabular:

X : agrupado en K intervalos (y = 1... k)


Y : agrupado en m intervalos (j = 1.. m).

Donde:

Xi : marca de clase (variable X)


Yj : marca de clase (variable Y)
fij : frecuencia absoluta conjunta, corresponde al
nmero de observaciones que existe en el I-simo
intervalo de X con el j-simo intervalo de Y.

Observaciones:

(1) Segn la definicin de la covarianza (tanto para datos


agrupados como no agrupados), la covarianza puede ser
negativa.
(2) La covarianza presenta unidades de cada una de las
variables involucradas.
(3) La covarianza S(XY), tambin se denota: Cov (X,Y)

Ejemplos:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

(5.1) Dada la siguiente tabla, que representa la medida (X) en cm.


De 8 barretas de metal y el peso (Y) en libras de cada una de
ellas, calcular:

a) S(X) b) S(Y) c) S(XY)


X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9

Solucin:

Este ejemplo, corresponde a datos no agrupados en tabla de


frecuencias.

a) S2 S (X) = 4.06
(X)
cm.
=

b) S2
(Y) S (Y) = 2.65
lbs

S (XY) = 10.5 cm. lbs

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

(5.2) Dada la siguiente tabla en el cual se estudia las alturas (pulg) y


los pesos (libras) de 300 estudiantes hombres en una
Universidad:

X : altura (pulgadas).
Y : peso (libras).

58-62 62-66 66-70 70-74 74-78 Total


Y fy
X

90-110 2 1 3
100-120 7 8 4 2 21
130-140 5 15 22 7 1 50
50-160 2 12 63 19 5 101
170-180 7 28 32 12 79
190-200 2 10 20 7 39
210-220 1 4 2 7
Total
Fx 16 45 128 84 27 300

Calcular:

S (X) , S(Y) , S (XY)

Solucin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Como la tabla es Bidimensional, podemos formar tablas de


frecuencias para cada una de las variables por separado, a este
proceso se le conoce como TABLAS MARGINALES.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Tabla marginal para x::


Intervalos Xi Fi
58 62 60 16
62 66 64 45
66 70 68 128
70 74 72 84
74 78 76 27
300

Tabla Marginal para Yi:


Intervalos Yj f.j.
90 110 100 3
110 130 120 21
130 150 140 50
150 170 160 101
170 190 180 79
190 210 200 39
210 230 220 7
300

La variable X presenta 5 intervalos ( i = 1 .....5)


La variable Y presenta 7 intervalos ( j = 1 .....7)

Calculando:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

S (X) = 3.929 pulgadas

S (Y) = 24.202 Lbs.

Calculando la Covarianza:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

S(XY) =51.370 pulg/lib.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION # 14

REGRESION LINEAL
5.2. Diagrama de Puntos y Curvas de Ajuste:
Representan los puntos (X1, Y1), (X2, Y2)..... (XN, YN) en un
sistema de coordenadas rectangulares, donde al sistema de puntos
resultantes lo llamaremos Diagrama de Dispersin o Diagrama de
Puntos: Con el diagrama de dispersin es posible representar una
curva que se aproxime a los datos: Curva de Aproximacin.

Entonces, encontrar ecuaciones de curvas de aproximaciones que


se ajusten a los datos, es buscar una: Curva de Ajuste.
Tenemos:

a) Conjunto de puntos que se ajustan a una lnea recta (ajuste


lineal o relacin lineal).

*
* *

* *
* *
* *

Observamos que el diagrama de puntos gira alrededor de una recta: Y = a+


bX

b) Conjunto de puntos o diagrama de puntos cuya relacin no es lineal.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

***
***
***
***
***

Algunas de las ecuaciones de curvas de aproximacin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Relacin lineal

Parbola o curva cadratica


Curva Polinomial

Hiprbola

O log Y= log(a) + X* log(b)


Curva Exponencial
Entonces, lo que se desea es encontrar una curva de aproximacin que se
ajuste mejor a los datos, y as mostrar la ecuacin de la curva respectiva.
El tipo ms sencillo de una curva de aproximacin es la lnea recta cuya
ecuacin puede escribirse: Y = a +b*X

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

5.3 Mtodo de mnimos Cuadrados:


De todas las curvas de aproximacin a una serie de datos puntuales, la
curva tiene la propiedad de que:
sea mnimo
Se conoce como la mejor curva de ajuste por el mtodo de mnimos
cuadrados.
Di= desviacin de cada punto con respecto ala lnea recta.
Este mtodo consiste en minimizar la suma de los cuadrados de las
desviaciones Di.
Entonces para ajustar un diagrama de dispersin a la lnea recta,
utilizaremos este mtodo de los MINIMOS CUADRADOS. Es decir una
recta de aproximacin de mnimos cuadrados del conjunto de puntos (x1,
y1), (x2,y2),......,(xn,yn), tiene la ecuacin: Y = a+b*X , donde a y b se
determinan mediante el sistema de ecuaciones normales, son las
siguientes:

Donde al desarrollar y despejar a y b se obtienen:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Otras ecuaciones ms practicas para calcular los valores de a y b de la


ecuacin aproximada Y = a +b*X son las siguientes:

Ejemplo:
Sean los valores:
x 3 1 4 6 8 9 11 14
y 2 1 4 4 5 7 8 9

a) Construye el diagrama de puntos


b) Encuentra las ecuaciones normales
c) Encuentra la ecuacin de la curva de ajuste.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Solucin:
a) Llevando los puntos al sistemas de coordenadas rectangulares.

DISPERSION
108
Y6
4
2
0
0 2 4 6 8 10 12 14
X
b) Al observar el diagrama de puntos, notamos que se aproxima o ajusta
a una lnea recta, cuya ecuacin es: Y = a+b*X
c) Para encontrar las ecuaciones normales:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Entonces las ecuaciones normales son:


40 = 8*a +b* 56
364 = 56*a +b*524
Resolviendo el sistema (Mtodo de Mnimos Cuadrados)

a= 6/11 = 0.545 b=7/11=0.636

d) La ecuacin resultante ser : Y = 0.545 + 0.636X

nota : Si la ecuacin es Y = a +b*X entonces b mide la pendiente de la


lnea recta.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION # 15

SEGUNDA PRACTICA CALIFICADA

SESION # 16

5.4 Anlisis de correlacin lineal simple:


Definicin: Estudia el grado de asociacin que existe entre las variables
en estudio, el coeficiente que mide la mutua asociacin se denomina:
Coeficiente de Correlacin (r).

Las asociaciones que se pueden presentar son:

1) Correlacin o asociacin Positiva (+), es decir a medidas altas de


una variable, le corresponden medidas altas de otra variable, cambios
en el mismo sentido (Relacin Directamente Proporcional)

X entonces Y

X entonces Y

Ejemplo :
altura y peso

2) Correlacin o Asociacin Negativa (-), En este caso, a valores altos


de una variable, corresponden valores bajos de la otra variable y
viceversa. (Relacin inversamente proporcional).

3) Medidas no Correlacinales; No existe ninguna asociacin entre las


variables.

Caractersticas de Coeficiente de Correlacin Lineal Simple

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1) r se calcula mediante la siguiente frmula:

S (XY) : covarianza de X e Y
S (X) : desviacin standart de X
S (Y) : desviacin standart de Y

2) r es un nmero abstracto (sin unidades) y oscila entre 1 y 1, es decir:

3) - Si r es positivo (Correlacin Positiva), entonces las dos


caractersticas tienden a variar en el mismo sentido.

- Si r es negativo (Correlacin Negativa), las dos caractersticas tienden


a variar en sentido contrario.

4) Si r=+1 r=-1, entonces la asociacin es perfecta.

5) Si r = 0, no existe asociacin entre las variables:

6) La asociacin, tiende a ser ms estrecha, cuando r:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ejemplo:

(5.4) Calcula el coeficiente de correlacin, del ejemplo (5.1); donde: S(X)


=4.06;
S(Y) =2.65; S(XY)=10.5

Interpretacin.- Existe una alta asociacin entre las variables estudiadas.

(5.5) del ejemplo (5.2), donde: S(X)=3.929 pulgadas S(Y)=24.202 libras,


S(XY)=51.370 pulg/lbs

Interpretacin.- Existe asociacin entre las alturas y pesos de los


estudiantes de la Universidad dada, esta asociacin es directamente
proporcional.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

5.4 Anlisis de Regresin Lineal Simple:

En las relaciones entre las variables se pueden presentar los siguientes


casos:

i) X influye en Y : X Y

X : variable independiente
Y : variable dependiente

Ejemplo:
Edad agilidad mental

ii) Y influye en X Y X X = f(Y)


Y: variable independiente
X: Variable dependiente

III) Las dos estn influenciadas entre si:

X Y
X Y
Ejemplo : precio y produccin de un articulo.

Definicin: La regresin permite estudiar la dependencia de una


caracterstica respecto a la otra, para establecer como vara el promedio de
la primera caracterstica al variar la segunda en una unidad de su medida.
Se dice regresin lineal, porque las variaciones de la variable
independiente, pueden provocar variaciones proporcionales en las variables
dependientes (ajuste a la lnea recta).
Se dice que la regresin es simple, si una variable independiente influye
sobre otra variable dependiente.

Ejemplo:
Protena de harina volumen de pan

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ecuacin de Regresin Lineal Simple.


Es una ecuacin para estimar una variable dependiente a partir de la
variable independiente.

Si X : Variable independiente
Y : Variable dependiente

Donde : Y = variable dependiente estimada


: b = coeficiente de R.L.S.

Caractersticas del Coeficiente de R.L.S. (b)

1) b : indica el nmero de unidades en que vara la variable


dependiente al variar la independiente en una unidad de su medida.

2) Si b es positivo los cambios son directamente proporcionales.


Si b es negativo entonces los cambios son inversamente proporcional

3) b : mide la pendiente de la lnea de regresin.

4) b, esta dado en unidades de la variable dependiente.

5) b y r siempre tienen el mismo signo.

6) b se calcula:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

S Y = f(X), entonces:

Y el valor de la constante a:

Si X= f (Y) (se realiza cambio de X por Y y viceversa)

Lnea de Regresin.- consiste en el trazo o grfica de la ecuacin de


regresin lineal simple, es decir el grfico de los puntos
si la ecuacin es:
Regresin de Y sobre X; o el grfico de los puntos (X,Y) si la ecuacin es
X= a+ bY : Regresin de X sobre Y.

Ejemplo:
selecciona al azar cuatro meses de un ao y se registra tanto los ingresos
como los gastos, en miles de dlares, de cierta empresa:

Ingreso (miles de dlares) 10 11 12 13


Egresos (miles de dlares) 4 5 9 10

I. Efectuar un estudio de Regresin Lineal Simple, asumiendo que los


egresos estn en funcin de los Ingresos:
1) Calculando el coeficiente de Regresin b e interpretndolo
2) Calculando el coeficiente de interseccin a
3) Encontrando la ecuacin de Regresin Lineal Simple y trazar
la lnea de Regresin.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

II. Realiza un anlisis de Correlacin Lineal Simple, e interprete el


valor de r.

Solucin:
I. Como el egreso est en funcin de los ingresos:

Egresos: variable dependiente: Y


Ingresos: variable independiente: X

1) Calculando b

Primero calculamos:

Entonces:

Mil
Interpretacin.- Por cada mil dlares adicional en el Ingreso de dicha
empresa, habr un aumento en el Egreso de 2.2 miles de dlares en

es
promedio.

CURSO: ESTADISTICA I

de
CICLO III
Manual del Alumno

2) Para calcular a :

3) Ecuacin de Regresin Lineal Simple:


Como Y es variable dependiente, entonces:

Para el trazo en el sistema de ejes cartesianos se tendr que reemplazar


en la ecuacin de Regresin, los diferentes valores de X:

Y=-18.30 +2.2. (10) = 3.7


Y=-18.30 +2.2 (11) = 5.9
Y=-18.30 +2.2 (12) = 8.1
Y=-18.30 +2.2 (13) =10.30

Tambin se puede estimar nuevos valores de los Egresos (Yi) a partir de un


valor Xi.

Ejemplo:
Para un ingreso de 15mil dlares, se espera tener en promedio un Egreso
de:

Y =-18.30 + (2.2) (15) = 14.7 miles de dlares

La lnea de Regresin: unin de puntos (Xi,Yi)

II. Anlisis de Correlacin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Interpretacin.- Existe una alta asociacin entre los ingresos y los egresos,
siendo los cambios directamente proporcionales.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

SESION #17

CAPITULO VI: NUMEROS INDICES

Definicin.- Un nmero ndice es una medida estadstica diseada para


mostrar los cambios en una variable (o en un grupo de variables) con
respecto al tiempo, situacin geogrfica, renta, profesin, etc.

Aplicaciones:
1. Comparar el costo de alimentos en otros costos de vida durante un ao
o perodo con respecto al ao o perodo anterior.
2. En negocios y Economa.

Tipos de Indice:

(6.1) Indices Simples: Cambios en un solo bien determinado


1) Indices de Precios Relativos.- uno de los ejemplos ms
sencillos de nmero ndice es un precio relativo, que representa
la razn del precio de un bien determinado en un perodo con
respecto a otro perodo llamado base.

Indice de Precio Relativo: IPR

Po : precio de un bien en perodo base


Pn : precio de un bien en perodo dado

S Pa: precio de un bien en el perodo a


Pb : precio de un bien en el perodo b

Ejemplo:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

(6.1) Supngase que los precios de consumo de 1 tarro de leche en junio


de 1990 es de 22,000 intis y en junio de 1989 fue de 5,000 intis,
tomando 89 como base.

El IPR Simple:

Es decir: en 1990 el precio de leche fue el 440% del que tena en el


ao 89, es decir se increment en un 340%

Observacin: IPR Simple es un bien en un perodo a (Pa), con


respecto al mismo perodo a (Pa) =1

2) Indices de Cantidades (o volumen) Relativos.- En lugar de


comparar precios de un bien, se puede tambin comparar
cantidades de un bien (cantidad de produccin, consumo,
exportacin, etc.) calculemos la cantidad o volumen relativo
(suponiendo que las cantidades dentro de cualquier otro
perodo son constantes).

Indice de Cantidad Relativo: IQR

qn : cantidad de un bien en el perodo n


qo : cantidad de un bien en el perodo base

3) Valor Relativo.- Si p es precio de un bien durante un perodo


y la cantidad o volumen producido, vendido, etc., durante ese
perodo.
Valor total = p * q

Ejemplo:
Si se han vendido 1000 tarros de leche a $0.75 c/u
Valor total = 0.75 * 1000 = $ 750

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Si Po Y qo denotan precio y cantidad de un bien durante un perodo


base y pn y qn denotan el precio correspondiente durante un
perodo dado, los valores totales durante estos perodos son Vo y
Vn respectivamente y el valor relativo (VR) se define:

(6.2) Indices Compuestos:

En la prctica, no se esta tan interesada en comparaciones de


precios, cantidades etc., de bienes individualmente considerados,
como en comparaciones de grandes grupos de tales bienes, es
decir es preferible considerar un grupo de bienes para medir los
cambios respectivos.

Los principales Indices compuestos se calculan teniendo en cuenta


los siguientes mtodos:

1) Mtodo de Agregacin Simple.- Este mtodo de clculo de un


ndice de precio (o cantidad), expresa el total de los precios (o
cantidades) de bienes en el perodo dado, como porcentaje del
total de los precios (o cantidades de bienes en el perodo base.

Tenemos:

Indice de Precios de Agregacin Simple: IPAS

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Donde:

Pn = suma total de precios de bienes empleados en el periodo dado.


Po = suma total de precios de bienes empleados en el ao base.

Desventaja: No tiene en cuenta la importancia relativa de las cantidades de


los diferentes bienes.

2) mtodo de Media de Relativo Simple. En este mtodo existen varias


posibilidades dependiendo del procedimiento empleado para promediar
los precios relativos (o cantidades relativas), tal como la media
aritmtica, media geomtrica, Mediana, etc.

Tenemos :
Indice de precios de Media de Relativo Simple: IPMRS (Promedio de los
precios relativos de cada uno de los bienes empleados):

Donde:
(Pn/Po) = suma de los precios relativos de bienes.
N = nmero total de bienes empleados.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Mtodo de Agregacin Ponderada. Para salvar algn inconveniente del


mtodo de agregacin simple, se da un peso al precio de cada bien
mediante un factor adecuado, tomando a menudo una cantidad o volumen
del bien determinado durante el periodo dado, o algn periodo tpico (que
puede ser una media de varios aos). Tales pesos indican la importancia
de cada bien particular.

Aparecen as, los tres siguientes ndices para precios:

(I). Indice de Precios de Laspeyres (o mtodo del ao base):


IPL
Pondera los precios considerando como factor de
ponderacin a las cantidades en el periodo base.

Cuando los bienes empleados corresponden a la canasta


familiar, el IPL se denomina ndice de Precios del
Consumidor o Indice del Costo de Vida, y se utiliza para
medir el nivel de inflacin.

(II) Indice de Precios de Paasche (o mtodo del ao dado):


IPP
Pondera los precios de cada bien, considerando como
factor de ponderacin a las cantidades del periodo dado.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

(III). Indice Ideal de Fisher


Representa la media geomtrica de los ndices de
Laspeyres y Paasche (promedio de los ndices
ponderados).

Ejemplo:
(6.3) La tabla muestra los precios y cantidades consumidas de cierto pas
de distintos productos frreos en los aos 79, 86 y 87.

Precios ($/Lbs)
Ao 1979 1986 1987
Plata 17.00 26.01 27.52
Cobre 19.36 41.88 29.99
Plomo 15.18 15.81 14.46
Stao 99.32 101.26 96.17
Zinc 12.15 13.49 11.40

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Cantidad (Mills de bls)


Ao 1979 1986 1987
Plata 1357 3707 3698
Cobre 2144 2734 2478
Plomo 1916 2420 2276
Stao 161 202 186
Zinc 1872 2018 1424

a) Calcular Indice de Precios de Agregacin Simple para el ao 86,


considerando como ao base 1979
b) Calcular el IPL para el ao 87, con base en el ao 79
c) Calcular el IPP para el ao 87, con ao 86

Solucin

Esto significa, que los precios del conjunto de productos frreos, en el ao


86, representa el 121.7% de los precios que tenan en el ao 79, es decir
se incrementaron en 21%.

Nota:
Las frmulas descritas anteriormente para obtener nmeros ndice de
precios se modifican fcilmente para obtener nmeros ndices de cantidad
o volumen, con el simple intercambio de p y q.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Ejemplo : Indice de cantidad de Agregacin Simple: IQAS

(6.4) Deflacin
Aunque los ingresos de las personas pueden elevarse tericamente
en un perodo de dos aos, su ingreso real puede netamente ser
inferior, debido al incremento del costo de vida y por consiguiente
su poder de adquisicin.

Ejemplo (5.3)
Si el ingreso de una persona en 1990 es el 150% de su ingreso
en 1989 (es decir a aumentado en 50%) mientras que el ICV es
el 500% del ao 89, el salario real de la persona ser en 1990

Salario Real

El salario real de la persona en 1990 es el 30% del que tena en


1989, es decir el poder adquisitivo de esta persona ha disminuido
en 70%.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

ANEXOS
PROBLEMAS RESUELTOS

a) tablas de frecuencia y Estadigrafos de posicin:

1) La siguiente distribucin muestra el peso en gramos de 30 paquetes


de un determinado producto:

Gramos [10 14.5> [14.5 19.5> [19.5 24.5> [24.5 29.5>


hi M/2 0.17 2M M

Se pide completar la tabla:

Solucin
Si la sumatoria de las hi = 1
Sabemos que : M/2 + 0.17 +2M +M +0.13 = 1

M/2 +3M = 1-0.30

M/2 +3M = 0.7

7M = 1.4

fi
M = 0.2 sabemos que hi
n
Por lo tanto fi = hi * n

Remplazando valores de hi

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

hi hi
M/2 0.10
0.17 0.17
2M 0.40
M 0.20
0.13 0.13

Completando el cuadro:
Intervalos Xi fi Fi hi Hi
[10.5 14.5> 12.25 3 3 0.10 0.10
[14.5 19.5> 17 5 5 0.17 0.17
[19.5 24.5> 22 12 12 0.40 0.67
[24.5 29.5> 27 6 6 0.20 0.87
[29.5 35> 32.25 4 4 0.13 1.00
30 1.00

2)Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un


examen de Estadstica I:

33, 35, 35, 39, 41, 41, 42, 45, 47, 48,
50, 52, 53, 54, 55, 55, 57, 59, 60, 60,
61, 64, 65, 65, 65, 66, 66, 66, 67, 68,
69, 71, 73, 73, 74, 74, 76, 77, 77, 78,
80, 81, 84, 85, 85, 88, 89, 91, 94, 97.

Clasificar estos datos convenientemente en intervalos de clase de igual


amplitud y construir los grficos respectivos.

Solucin
I) Rango = 97-33 = 64
II) K = 1+3.32 * log (10) = 1+ 3.22 (1.699) = 6.47

Redondeando al entero inmediato superior K = 7 (siete


intervalos)

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

III) La amplitud de Clase A = 64 / 7 = 9.14, aproximando al entero mayor


(recuerda que la amplitud debe tener la caracterstica de los datos)
A = 10

Para facilitar el conteo de las frecuencias, tomaremos como lmite inferior


de la primera clase 30.

clases xi fi Fi hI HI
[30, 40> 35 4 4 0.08 0.08
[40, 50> 45 6 10 0.12 0.20
[50, 60> 55 8 18 0.16 0.36
[60, 70 > 65 13 31 0.26 0.62
[70, 80> 75 9 40 0.18 0.80
[80, 90> 85 7 47 0.14 0.94
[90, 100> 95 3 50 0.06 1.00
TOTAL 50 1.00

Ntese que en el ultimo intervalo el lmite superior puede ser abierto ya que
sobrepasa al valor ms alto de los datos.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

GRAFICOS

HISTOGRAMA Y
POLIGONO DE
20
FRECUENCIA

FRECUENCIAS

0
35 45 55 65 75 85 95
MARCAS DE CLASE

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

LA OJIVA
50
Fi
0
35455565758595
MARCAS DE CLASE

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

2) El supervisor de una planta de produccin desea comprobar si los


pesos netos de las latas de conserva de durazno tienen el peso
reglamentario (18 onzas) para lo cual registra el peso de 36 latas
obteniendo los siguientes datos:

17.0, 17.5, 18.5, 18.1, 17.5, 18.0, 17.5, 17.3, 18.0, 18.0, 18.0,
17.6, 18.2, 17.6, 18.4, 17.7, 17.7, 17.9, 18.3, 17.1, 17.8, 17.3,
18.1, 17.6, 17.7, 18.2, 18.4, 18.0, 18.2, 17.1, 18.6, 18.1, 18.5,
18.4, 17.9, 18.2.

Se pide :

a) Presentar los datos en una tabla de frecuencia.


b) Determine el peso promedio.
c) Determine el peso central (la mediana).
d) Determine el peso Modal.

Solucin

i) Rango = 18.6 17.0 =1.6

ii) K = 1+ 3.32 * log (36) = 6.17 redondeamos a 6 intervalos

iii) A = 1.6 / 6 = 0.266 lo aproximamos a 0.3 (recuerden


siempre se redondea A hacia el mayor respetando la
caracterstica de los datos, en este caso con un digito
decimal). A = 0.3

a) La tabla queda:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Clases Xi fi Fi hi Hi Xi*fi
[17.0, 17.3> 17.15 3 3 0.08 0.08 51
[17.3, 17.6> 17.45 5 8 0.14 0.22 87
[17.6, 17.9> 17.75 7 15 0.19 0.42 124
[17.9, 18.2> 18.05 11 26 0.31 0.72 199
[18.2, 18.5> 18.35 8 34 0.22 0.94 147
[18.5, 18.8> 18.65 2 36 0.06 1.00 37
TOTAL 36 1.00 645.6

Clase modal
Clase mediana
b)

onzas

c) Para la mediana buscar en Fi aquel que sea igual o mayor que


n/2, es decir

Fi>= 36/2 =18.

Onzas

d) Para calcular la moda usamos el intervalo de mayor fi

Onzas

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

PROBLEMAS PROPUESTOS:

1) La siguiente tabla muestra las frecuencias relativas de 200 alumnos.

EDADES 16 19 22 25 28 31
Hi% 10 15 37 75 85 100
a) Muestra los lmites de cada intervalo de clase.
b) Que tanto por ciento de los estudiantes tienen edades entre 12 y 26
aos.

2) Los siguientes datos son las velocidades en Km./h. De 30 carros que


pasaron por un punto de control de velocidades.

60, 30, 38, 60, 45, 20, 35, 20, 40, 54, 38, 35, 40, 10, 45, 60, 49,
49, 30, 55, 46, 105, 29, 38, 80, 40, 28, 15, 82, 72.
a) Calcular la media de los datos sin clasificar.
b) Agrupa estos datos convenientemente.
c) Calcule la media, mediana y moda.

3)Un grupo de 50 empleados de sistemas de una gran compaa recibe un


curso intensivo de Programacin de Ordenadores. De los varios
ejercicios distribuidos durante el curso, se muestra el nmero de
ejercicios completados satisfactoriamente por los miembros del grupo:
13, 9, 8, 14, 16, 15, 6, 15, 11, 5, 3, 11, 11, 9, 18, 18,
5, 1,15, 12, 16, 12, 14, 9, 6, 10, 5, 12, 17, 11, 12, 13,
8, 19, 12, 11, 18, 15, 13, 9, 10, 9, 10, 7, 21, 16, 12, 9,
2, 13.
a) Agrupar estas cifras en una tabla de distribucin de frecuencias,
usando el mtodo de Sturges.
b) Calcula la media, mediana y moda.
c) Estima la desviacin tpica para datos no agrupados.

4) Sean los siguientes datos: f1=3, F2=8, F3=18, f5=2, x4=3, K=6,
H4=0.875, A=2, n=24. Completa la tabla de distribucin de frecuencias
y calcular la Varianza.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

5)

y dada la siguiente tdf:

intervalos hi%
[0.5 2.5> 2%
[2.5 4.5> 10%
[4.5 6.5> h3%
[6.5 8.5> 16%
[8.5 10.5> h5%
[10.5 12.5> 10%
[12.5 14.5> 2%
a)Calcula h3% y h5%
b)Calcula la Varianza.

7) Se tiene una distribucin simtrica de frecuencias con 7 intervalos de


igual amplitud A =20 y considerando los siguientes datos:
X3*f3 = 1260, f2 + f5 = 62, H6% = 96%, f1 = 8, h3% = 21%.
a) Calcula la media, mediana y moda
b) Calcula el C.V.

8) Se conocen los siguientes datos del peso de un grupo de estudiantes:

fi Hi
fi = 50
si se sabe que:
h1=h3 y
h2=h4

Intervalos
[20 30>
[30 40>
[40 50>
[50 60> 5 0.96
[60 70>

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Determina:
a) La media, mediana y desviacin tpica.
b) Presenta los datos en un Histograma y polgono de frecuencias.

9) Sabiendo que la tabla de frecuencias, es simtrica, completarla con


los datos, dados, si adems se sabe que la mediana es igual a 27.5.
Luego calcula la media, la moda y la desviacin estndar.

Intervalo Xi fi Fi hi Hi
L0 L1
L1 L2
L2 L3 0.20
L3 L4 0.65
L4 L5
L5 50 0.95
50 L7

fi = 60

10) Una fabrica tiene dos departamentos uno de produccin y otro de


ventas. Las siguientes tablas de frecuencias presentan los haberes
percibidos hasta fines de abril en cada uno de los departamentos.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Haberes semanales en Nde trabajadores dpto.


dlares de produccin
[10 15> 15
[15 20> 25
[20 25> 30
[25 30> 20
[30 35> 5
[35 40 5
[40 45 0
Total 100

Haberes mensuales en N de trabajadores


dlares Dpto. de Ventas
[20 60> 0
[60 80> 5
[80 100> 5
[100 120> 15
[120 140> 20
[140 160> 5
total 50
Calcule:
a) El haber promedio mensual y la desviacin tpica correspondiente a
cada departamento.
b) El haber promedio mensual y la desviacin tpica del conjunto de
trabajadores de ambos departamentos.

11) Se ha recibido una muestra compuesta de 100 probetas de concreto


con el objetivo de analizarlas. Una de las pruebas consisti en
determinar la carga de rotura de dichas probetas, encontrndose los
siguientes resultados:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Intervalo de rotura N de probetas


[120 125> 10
[125 130> 20
[130 135> 38
[135 140> 25
[140 145> 7
Determine :
a) La carga media de rotura.
b) La carga mediana de rotura.

Regresin lineal

1) La tabla muestra alturas con aproximacin de pulgadas y los pesos con


aproximacin de libras de una muestra seleccionada al azar:

altura 70 63 72 60 66 70 74 65 62 67 65 68

peso 155 150 180 135 156 168 178 160 132 145 139 152

a) Hallar la ecuacin de la recta de ajuste usando mnimos cuadrados.


b) Estimar el peso de un estudiante cuya altura es de 61 pulgadas.
c) Estimar la altura de un estudiante cuyo peso es de 170 libras.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Solucin:

X Y X*Y
70 155 4900 10850
63 150 3969 9450
72 180 5184 12960
60 135 3600 8100
66 156 4356 10296
70 168 4900 11760
74 178 5476 13172
65 160 4225 10400
62 132 3844 8184
67 145 4489 9715
65 139 4225 9035
68 152 4624 10336
X = 802 Y=1850 = 53792 X*Y =
124258

Calculando a y b:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

a = -60.75

b = 3.22
a)

Y = -60.75 + 3.22 X

b)Y = -60.75 + 3.22(61) = 135.67 libras. Redondeando Y =136 libras.

c) 170 = -60.75 + 3.22 X

Pulgadas, redondeando X = 72 pulgadas

2) La produccin de acero en Estados Unidos en millones de toneladas


cortas (una tonelada corta = 2000 libras), durante los aos 1946 1956
aparecen en la siguiente tabla:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Aos Produccin en
Ton. cortas
1946 66.6
1947 84.9
1948 88.6
1949 78.0
1950 96.8
1951 105.2
1952 93.2
1953 111.6
1954 88.3
1955 117.0
1956 115.2

a) Halla la ecuacin de ajuste (recta de mnimos cuadrados).


b) Estima la produccin de acero durante los aos 1957 y 1958.
c) Estima la produccin de acero durante los aos 1945 y 1944.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Solucin:
Para poder trabajar con los aos se debe colocar una escala paralela que
inicie en cero (pues las fechas no sirven para estos clculos).

Aos X Y X*Y

1946 0 66.6 0 0
1947 1 84.9 1 84.9
1948 2 88.6 4 177.2
1949 3 78.0 9 234.0
1950 4 96.8 16 387.2
1951 5 105.2 25 526.0
1952 6 93.2 36 559.2
1953 7 111.6 49 781.2
1954 8 88.3 64 706.4
1955 9 117.0 81 1053
1956 10 115.2 100 1152
TOTALES 55 1045.4 385 5661.1

a) Hallando la recta de ajuste

a = 75.30

b = 3.95

Y = 75.30 + 3.95 X

b y c) Estimando la produccin:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

Aos X Produccin
1944 -2 67.40
1945 -1 71.35
1957 11 118.75
1958 12 122.70

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

PROBLEMAS PROPUESTOS

1) Construir una lnea recta que aproxime los datos de la tabla:

a) estimar los
X 2 3 5 7 9 10 valores de
Y 1 3 7 11 15 17 y para:
x= 11, x= 15,
x=4, x= 6

b) estimar los
valores de
x
para:

y= 2, y=5,
y= 18, y=
2)La produccin de acero en Estados Unidos en millones de 15
toneladas cortas(1 tonelada corta = 2000 libras) durante los aos
1986 1996 aparece en la tabla:

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

a) Realiza el diagrama de
dispersin.
Ao Produccin de acero en b) Determina la ecuacin
EE.UU.(millones de
toneladas cortas)
de la recta de ajuste.
1986 66.6 c) Estima la produccin
1987 84.9 de acero durante los
1988 88.6 aos: 1997 y 1998.
1989 78.0 d) Estima la produccin
1990 96.2 de acero durante los
1991 105.2 aos: 1985 y1984
1992 93.2 e) Halla r e interpreta.
1993 111.6
1994 88.3
1995 117.0
1996 115.2

3)Se desea encontrar una ecuacin que estime los ingresos anuales en
funcin de los salarios mensuales,con este fin se ha recopilado los salarios
mensuales e ingresos anuales de 8 trabajadores de una empresa.

Salarios 100 150 200 275 300 325 350 375


mensuales
Ingresos anuales 1200 1800 2400 3300 3600 3900 4200 4500

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

a) Crea el diagrama de dispersin respectivo.


b) Determina la recta de mnimos cuadrados.
c) Estima los salarios mensuales para aquellos
trabajadores cuyo ingreso anual es de 5700.
d) Calcula el coeficiente de Correlacin (interpretar).

4)La produccin de cigarrillos en Per durante los aos 1985 1992 fue:

Ao 1985 1986 1987 1988 1989 1990 1991 1992


Ncigarrillos 98.2 92.3 80.0 89.1 83.5 68.9 69.2 7.1
(millones)

a) Representa el diagrama de dispersin con recta de aproximacin.


b) Halla la ecuacin de mnimos cuadrados.
c) Determina e interpretar el coeficiente de Correlacin
d) Estima la produccin de cigarrillos para los aos 1995 y 1998.

Nmeros ndices

Problemas propuestos:
1) La siguiente tabla muestra los precio y cantidades de alguno cereales
en los aos 1989 y 1998.

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

1989

producto Precio Cantidad


Cebada 1.39 237
Maz 1.24 3238
Avena 0.72 1220
Arroz 0.086 4077
Centeno 1.42 18.1
Trigo 2.24 1098

1998

producto Precio Cantidad


Cebada 1.24 470
Maz 1.15 3800
Avena 0.65 1422
Arroz 0.097 4702
Centeno 1.27 32.5
Trigo 2.23 1462

A) Tomando como base a 1989 hallar el ndice de Laspeyres,


El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1998.

B) Tomando como base a 1989 hallar el ndice de Laspeyres,


El ndice de Paashe, el ndice ideal de Fisher. Para el ao 1989.
C) Determine el ndice de agregacin simple para los aos 1989 y 1998.

2) La tabla muestra los precios al por menor y producciones medias de


antracita y gasolina en EE.UU. durante los aos 1949 y 1958.

precios
producto 1949 1958
antracita $20.13 por tonelada corta 28.20 por tonelada corta

CURSO: ESTADISTICA I
CICLO III
Manual del Alumno

gasolina 20.3 cent. Por tonelada 21.4 cent. Por tonelada


corta. corta

cantidades
producto 1949 1958
antracita 3559 millones de toneladas 1821 millones de toneladas
cortas cortas
gasolina 80.2 millones de barriles * 118.6 millones de barriles *
Cada barril contiene 42 galones.

a) Determina el ndice de agregacin simple para 1958 con base en 1949.


b) Determina el ndice de agregacin simple para 1949 con base en 1958.
c) Halla el ndice de Laspeyres, Paashe, Fisher para el ao 1958 con
respecto a 1949. Interpretar.

CURSO: ESTADISTICA I
CICLO III

Вам также может понравиться