Академический Документы
Профессиональный Документы
Культура Документы
ESTADSTICA
APLICADA
Manual Autoformativo
Estadstica Aplicada
Pgina 2
ndice de Contenidos
ndice de Contenidos
1.1. Introduccin
1.2. Estimacin
1.4. Intervalo de confianza para dos parmetros: Intervalo de confianza para la diferencia de medias
18
23
23
24
27
29
2.5. Uso del valor sig proporcionado por el SPSS en sus pruebas
31
34
36
43
48
52
Otras pruebas
57
Estadstica Aplicada
Pgina 3
58
58
60
67
71
91
5.1.
91
5.1.1
91
5.1.2
107
5.2
Regresin no lineal
116
TEMA 6.
140
TEMA 7.
SERIES DE TIEMPO
167
169
172
172
174
199
8.1
TIPOS DE PRONSTICOS:
199
8.2.
199
8.3
200
8.4.
Seal de rastreo
200
Estadstica Aplicada
Pgina 4
INTRODUCCIN
Todos los conceptos y aplicaciones vertidos en el curso anterior de Estadstica I tales
como tablas de frecuencia, grficos, clculo de medidas descriptivas se pueden resumir
dentro de un trmino general que vendra a ser ESTADSTICA DESCRIPTIVA, debido que a
travs de ellos podemos describir, presentar y resumir esencialmente el comportamiento de
una serie de datos que han sido recolectados con algn procedimiento adecuado.
Si embargo a travs de la ESTADSTICA DESCRIPTIVA no se puede aclarar
interrogantes acerca de una poblacin cuando no se dispone de ella y solo se tiene parte de
ella, o sea de una muestra. Por ejemplo si sabemos que el rendimiento promedio de una
muestra de automviles de cierto modelo y marca es de 55 km. por galn, qu podremos
concluir acerca de todos los automviles producidos de dicha marca y modelo?
Para poder dar una conclusin acerca de la poblacin, la Estadstica dispone de una
serie de procedimientos y mtodos que se resumen en un trmino general que es el de
ESTADSTICA INFERENCIAL, la cual determina especficamente la probabilidad de que una
conclusin obtenida a partir de una muestra sea vlida para toda la poblacin de la cual
proviene, basados todos ellos en la Estimacin y Prueba de Hiptesis que sern motivo de
estudio en las pginas siguientes.
Es importante manejar adecuadamente los procedimientos y mtodos que utiliza la
estadstica inferencial pues no debemos olvidar que sus resultados sern utilizados por
diferentes entidades y personas quienes se basarn en ellos para poder tomar decisiones y
nosotros tenemos la obligacin moral de entregar la informacin lo ms clara y entendible
posible sin necesidad de tergiversarla ni modificarla.
El presente Manual Autoformativo de ESTADSTICA APLICADA est diseado para
que el lector pueda adquirir los conocimientos necesarios para poder ejecutar los procesos
relacionados con la estimacin y prueba de hiptesis estructurados en cuatro unidades. En
la primera unidad aprenderemos a realizar los distintos mtodos de muestreo que validen
nuestro trabajo y el clculo de intervalos de confianza a travs de las estimaciones, en la
segunda unidad aplicaremos las pruebas de hiptesis a travs de los mtodos paramtricos,
en la tercera unidad continuaremos con las pruebas de hiptesis pero utilizando mtodos no
paramtricos y finalizaremos la cuarta unidad desarrollando el anlisis de correlacin y
regresin el cual nos permitir realizar algunos pronsticos sobre el comportamiento de
alguna variable.
Agradecemos a quienes de antemano tuvieron paciencia y comprensin en la
elaboracin del presente manual, a nuestros amigos de la UPC cuyo texto lo tomamos como
referencia y a aquellos alumnos con quienes pudimos optimizar el uso de la informacin
presente en esta EDICIN.
El Autor
Estadstica Aplicada
Pgina 5
Errores en la inferencia
En todo caso el proceso de inferencia est sujeto a errores. No existe magia alguna que haga
que el valor de la muestra coincida con el de la poblacin.
La diferencia entre los valores de la muestra y los de la poblacin crea incertidumbre acerca
de los valores muestrales. Se necesita una manera de establecer las limitaciones del proceso
de inferencia.
Los procedimientos estadsticos no eliminan los errores en la inferencia. Lo que hacen es que
los valores de los errores sean cuantificables mediante afirmaciones de probabilidad. Se dice
que los procedimientos estadsticos son medibles porque es posible medir (en trminos de
probabilidad) la magnitud del error que cometen.
En el ejemplo de los clientes del establecimiento, si obtuvimos una muestra estadstica,
podemos decir no slo cul es el porcentaje de clientes que opinan que el servicio es malo
(por ejemplo 45%, valor en la muestra) sino, adems, con cierta probabilidad (confianza)
podemos afirmar que el porcentaje real se encuentre entre dos valores (entre 43% y 47%, por
Estadstica Aplicada
Pgina 6
ejemplo), o que con cierta probabilidad (error) la proporcin real de personas que opinan que
el servicio es malo supera al 40%.
Afirmaciones como las anteriores se basan en el hecho de que por haber seleccionado al azar,
hay un mecanismo objetivo de generacin de la incertidumbre y mediante deducciones
matemticas es posible encontrar las probabilidades mencionadas. Si la seleccin se hubiese
hecho a juicio, dependera del buen juicio y no de las matemticas el tamao del error en la
inferencia. La medicin de la incertidumbre sera muy complicada y nada confiable.
En la mayora de las veces que hacemos inferencia, las probabilidades las calculamos con el
modelo normal. En algunos casos este modelo normal es el modelo exacto para la inferencia,
pero muy frecuentemente es slo un modelo aproximado.
Podemos por lo tanto concluir que en la estadstica hay dos formas principales de inferir:
Estimacin , y
Prueba de hiptesis
A continuacin presentaremos cada una de estas dos herramientas.
1.2. Estimacin
Para estimar partimos de un modelo probabilstico de cmo se distribuye la caracterstica en
la poblacin o de cmo se realiz el muestreo. Este modelo incluye cantidades que
desconocemos y que llamamos parmetros.
Por ejemplo, en la encuesta para saber la opinin de los clientes, la proporcin de clientes
que opinan que el servicio es Malo es un parmetro (que desconocemos). En el caso de las
ventas del establecimiento, el Monto promedio de las ventas durante una campaa es el
parmetro (que desconocemos).
De la muestra estimamos los valores de los parmetros en la poblacin y esto lo hacemos:
Mediante un valor fijo y entonces decimos que tenemos un estimador puntual o
Mediante un intervalo de posibles valores y le llamamos estimacin por intervalo o
intervalo de confianza.
Como no se puede esperar que un estimador puntual suministre el valor exacto del parmetro
que se desea estimar, se suele calcular una estimacin de dicho parmetro por intervalo.
La proporcin en la muestra
Estadstica Aplicada
Pgina 7
<<
) = 1-
En esta unidad, se muestra cmo obtener una estimacin por intervalo para la media
poblacional , varianza poblacional 2 y para la proporcin poblacional p.
La frmula general para obtener una estimacin por intervalo para la media poblacional es
IC x
margen de error x
e x e; x e
La frmula general para obtener una estimacin por intervalo para la proporcin poblacional
es
IC p p margen de error p e p e; p e
Estadstica Aplicada
Pgina 8
Ejemplo 1.
Pgina 9
Luego, si una variable X tiene distribucin N(,2) , entonces el 95% de las veces se cumple:
Esto es
El resultado es un intervalo
es una variable aleatoria entonces los lmites del intervalo de confianza l1 y l2 sern
tambin variables aleatorias mientras no se reemplacen los valores obtenidos en una muestra.
El grfico ilustra la interpretacin del nivel de confianza para el intervalo de confianza para la
media de una distribucin normal con varianza conocida. Para los distintos posibles valores
de la media, representados mediante su distribucin muestral, obtenemos distintos intervalos
de confianza. La mayor parte incluye al valor del parmetro, pero el resto no. Concretamente
el 95% lo incluye y el 5% no, si el nivel de confianza es del 95%.
En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nico
intervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayora que contiene al valor objetivo aunque no tenemos la
seguridad de que sea as, tenemos concretamente un riesgo del 5% de equivocarnos.
Estadstica Aplicada
Pgina 10
La cual es una buena aproximacin para el intervalo de confianza de 95% para con 2
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea grande
(n30).
Cuando el tamao muestral es pequeo (n<30), el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en
vez de la distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los lmites
del intervalo ya no sern construidos usando el valor 1,96).
Estadstica Aplicada
Pgina 11
Margen de error
Si la desviacin estndar o la varianza poblacional son conocidas, el margen de error
ez
1 ,
2
,n1
s
n
N n
.
N 1
Distribucin t-Student
Se dice que la variable aleatoria t sigue una distribucin t con k grados de libertad.
Para un valor de la variable aleatoria t,k es tal que el rea a su derecha bajo la curva de la
P(T t ,k )
distribucin t con k grados de libertad es igual a .
Caractersticas
La funcin de densidad es simtrica y forma de campana
El rango es toda la recta real, esto es, de - a +
La grfica de la distribucin t es parecida a la distribucin normal, con media cero pero la
varianza es 2
k
k 2
Estadstica Aplicada
Pgina 12
Ejemplo 2.
Una empresa fabrica focos que tiene una duracin aproximadamente normal. Si una muestra
de 25 focos tiene una duracin promedio de 780 horas con una desviacin estndar de 28,8
horas.
Estime e interprete, con una confianza del 98%, la duracin media de los focos que produce
esta empresa.
Solucin
Como es desconocida y asumiendo que la poblacin es infinita se usar el margen de error
e t
2
,n1
s
n
Se tiene que la media muestral es x 780 y que el tamao de la muestra es n = 25. El nivel de
confianza requerido es 1- = 0,98, luego = 0,02 y /2=0,01. As el
La desviacin estndar muestral es S= 28,8.
Interpretacin
Con un nivel de confianza del 98% y a partir de la informacin muestral se afirma que el
intervalo [765,6452; 794,3548] horas contiene a la duracin promedio de todos los focos
producidos por la empresa.
Ejercicio 1.
Se desea estimar mediante un intervalo de confianza al 95%, el gasto promedio diario en
alimentacin de los estudiantes de Administracin. Para ello, se tom una muestra aleatoria de
9 alumnos y se les pregunt por su gasto en alimentacin durante el da anterior a la encuesta,
encontrndose los siguientes resultados. Calcule e interprete el intervalo de confianza del
gasto promedio diario.
11,5
10
Estadstica Aplicada
16,5
18,0
7,5
7,5
9,5
14,5
13
Pgina 13
0,40
0,30
0,20
0,15
0,10
0,05
0,04
0,03
0,025
0,020
0,015
0,010
1 0,32492 0,72654 1,37638 1,96261 3,07768 6,31375 7,91582 10,57889 12,70620 15,89454 21,20495 31,82052
2 0,28868 0,61721 1,06066 1,38621 1,88562 2,91999 3,31976 3,89643 4,30265 4,84873 5,64278 6,96456
3 0,27667 0,58439 0,97847 1,24978 1,63774 2,35336 2,60543 2,95051
3,18245
3,48191
3,89605
4,54070
2,77645
2,99853
3,29763
3,74695
2,57058
2,75651
3,00287
3,36493
2,44691
2,61224
2,82893
3,14267
2,36462
2,51675
2,71457
2,99795
2,30600
2,44898
2,63381
2,89646
Pgina 14
Ejercicio 2.
En una empresa se desea conocer el tiempo promedio que sus empleados tardan en usar los
servicios higinicos al da. Se estima que la desviacin estndar de dicho tiempo es de 10
minutos. Calcule el tamao de muestra si se desea tener un nivel de confianza del 90% y un
margen de error de 2 minutos.
O bien:
Estadstica Aplicada
Pgina 15
Ejemplo 3.
A una muestra aleatoria de 400 personas mayores de 28 aos de una ciudad determinada se
les pregunta si estn a favor de un nuevo impuesto adicional del 4% en el precio de la
gasolina para obtener fondos necesarios que se destinaran a un programa de asistencia social.
Si en la muestra elegida se encontr que 245 estaban a favor del impuesto adicional, estime e
interprete, mediante un intervalo de confianza del 95%, la proporcin de personas a favor del
nuevo impuesto en la ciudad.
Solucin
Primero, calculemos la proporcin muestral p
El intervalo es
245
0,6125
400
p 1 p
0, 6125 1 0 , 6125
IC p p z
0, 6125 1, 96
0, 6125 0, 0244
1
n
400
2
Estadstica Aplicada
Pgina 16
Ejercicio 3.
Una encuesta realizada a 1230 adolescentes de Lima sobre su opinin acerca del principal
problema de la juventud, se obtuvieron los siguientes resultados: el 28% opin que era el uso
y abuso de las drogas, el 20% que se deba a la falta de comunicacin con los padres, el 6%
por el uso y abuso del alcohol, el 6% por el desempleo y el resto a otros problemas. Estime e
inteprete, con una confianza del 99%, la proporcin de adolescentes en Lima que consideran
el uso y abuso de las drogas como el principal problema.
Ejercicio 4.
Empresa S.A realiz un estudio a sus trabajadores sobre acuerdos de incentivos, para ello
eligi al azar a 156 trabajadores y obtuvo que 65 trabajadores no estaban de acuerdo con la
poltica de incentivos de la empresa. Estime e interprete, con una confianza del 95%, la
proporcin de trabajadores en la empresa que estn de acuerdo con la poltica de incentivos.
Estadstica Aplicada
Pgina 17
Ejercicio 5.
Empresa S.A desea estimar la proporcin de sus trabajadores que estn a favor de que se
corrija el programa de aseguramiento de la calidad con un margen de error del 2,8% y un
nivel de confianza del 95%. A cuntos trabajadores se debe encuestar?
Estadstica Aplicada
Pgina 18
Ejercicio 6.
En la facultad de una universidad el decano desea estimar la proporcin de alumnos que va al
gimnasio por lo menos una vez a la semana. Cada encuesta costar dos nuevos soles y,
adems, existe un costo fijo de mil nuevos soles. Calcule el costo de la encuesta, si se desea
tener un nivel de confianza del 99% con una amplitud del intervalo de confianza que sea
como mximo del 5%.
Estadstica Aplicada
Pgina 19
Para probar que dos muestras provienen de dos poblaciones con varianzas homogneas, se
observara la prueba de Levene que nos otorga el SPSS.
Con el valor de sig que da el reporte del SPSS, se compara con el valor del nivel de
significacin (Alfa).
Regla de decisin:
Si sig < Alfa, entonces la varianzas no son homogneas.
Si sig alfa, entonces la varianzas son homogneas.
Con mayor detalle esto se ver en la siguiente unidad de prueba de hiptesis.
Estadstica Aplicada
Pgina 20
Ejercicio 7.
Un fumador empedernido desea comparar el contenido promedio de alquitrn de dos marcas
de cigarrillo que usualmente fuma A y B para elegir la marca que menos dao le proporcione.
Por lo tanto selecciona una muestra de cigarrillos de ambas marcas y determina el contenido
de alquitrn (miligramos) que se muestran a continuacin:
Marca A
12
13
11
14
10
Marca B
10
10
12
13
11
El fumador supone que las varianzas del contenido de alquitrn de ambas marcas de
cigarrillos son homogneas y estima, con una confianza del 95%, la diferencia del contenido
promedio de alquitrn de los cigarros de marca A y marca B. Cul es la estimacin realizada
por el fumador y qu marca de cigarrillo decidir elegir?
Estadstica Aplicada
Pgina 21
Ejercicio 8.
Estime, con una confianza del 92%, la diferencia de los sueldos promedios de los trabajadores
del sector minero y sector industrial en base a los siguientes resultados de dos grupos de
trabajadores que se han seleccionado al azar de cada uno de estos sectores:
Sector
Media
Desviacin estndar
Minero
14
2100
110
Industrial
11
1850
354
Suponga que las varianzas de los sueldos de los trabajadores de ambos sectores no son
homogneas. Qu sector tiene un mejor sueldo?
Estadstica Aplicada
Pgina 22
Ejercicios propuestos 1.
1. El tiempo de conexin a Internet que usan los alumnos de la UPC sigue una distribucin
normal. Se selecciona al azar a 200 alumnos de la UPC y se obtiene que el tiempo
promedio que tienen acceso a internet es de 75 minutos con una desviacin estndar de
15 minutos.
a) Estime e interprete, con una confianza del 94%, el tiempo promedio de conexin de
todos los estudiantes de la UPC.
b) Para un nuevo estudio, a cuntas alumnos como mnimo sera necesario entrevistar?
para garantizar un error de estimacin de la media poblacional no superior a 0.25 con
un nivel de confianza de 95%.
2. Suponga que los impuestos prediales mensuales es una variable que se distribuye
normalmente, se eligi al azar a 10 personas que pagan sus impuestos prediales
mensuales en el distrito de La Molina y se registr la siguiente informacin:
45.2
32.6
45.3
52.5
48.3
50.2
44.6
47.5
35.6
55.2
Estime e interprete el impuesto predial promedio mensual de las personas que viven en
La Molina con una confianza del 92%.
3. En una editorial se desea evaluar el tiempo promedio de distribucin de su ltima revista
de modas Fashion distribuida al mercado, Para este estudio se desea tener un error de
estimacin de 5 minutos con un nivel de confianza del 92%, si se conoce que la
desviacin estndar del tiempo de distribucin es de 20 minutos. Qu tamao de muestra
debe de emplearse para el estudio?
4. El director de la editorial Peridicos S.A desea estimar la proporcin de personas que
leen el diario Per 20. Para tal fin, selecciona al azar 2100 personas del distrito de San
Borja y se encuentra que 630 leen el diario Per 20. En base a esta muestra estime e
interprete, con una confianza del 90%, la proporcin de personas que leen el diario Per
20.
5. Apoyo S.A realiz un estudio sobre el principal problema de los accidentes
automovilsticos en Lima Metropolitana, para tal fin, eligi al azar a 1200 personas
mayores de edad encontrndose que 1050 consideran que el principal problema de los
accidentes automovilsticos es por estado de ebriedad de los conductores. Estime e
interprete, con una confianza de 99%, la proporcin de personas mayores de edad de
Lima Metropolitana que consideran que el principal problema es el estado de ebriedad en
los conductores.
6. El Ministerio de Educacin y Cultura desea conocer el inters de los padres por la
introduccin de la primera Lengua Extranjera en la educacin primaria. Se seleccion al
azar a 1024 padres, encontrndose 860 a favor de la medida.
a) En base a esta muestra, estime e interprete el porcentaje de padres que estn a favor de
esta medida, con un nivel de confianza del 99%.
Estadstica Aplicada
Pgina 23
c) Para un nuevo estudio, a cuntas padres como mnimo sera necesario entrevistar?
para garantizar un error inferior a 2.5 con un nivel de confianza de 94%.
7. El gerente de operaciones de BANK, est interesado en saber cul de los turnos de
trabajo es ms eficiente. Para ello registr aleatoriamente los tiempos que utilizaron los
empleados para atender a los clientes en dos turnos maana y noche. Los tiempos, en
minutos, son los siguientes:
Turnos de trabajo
Turno maana
Turno tarde
Muestra
14
17
Tiempo de atencin
promedio (minutos)
87,9
92,1
Desviacin
Estndar
3,1
6,4
Asuma que las varianzas de los tiempos de atencin son heterogneas. Asuma normalidad
en la variable en estudio.
Estime, con una confianza del 95%, la diferencia de los tiempos promedios de atencin al
cliente de ambos turnos. Cul de los turnos es ms eficiente?
.
8. El gerente de un banco comercial de Lima quiere evaluar el desempeo de dos sucursales
ubicadas en el distrito de Surco y San Isidro determinado el monto de operacin.
Decide elegir dos muestras aleatorias del total de operaciones realizadas la ltima
semana: 71 en Miraflores y 41 en San Isidro donde se registr, entre otras variables, el
monto de operacin (en dlares). Los resultados se muestran a continuacin:
Sucursal
Surco
San Isidro
Tamao de
muestra
71
41
Monto promedio
por operacin
800
1200
Asuma que las varianzas de los montos por operacin son homogneas. Asuma
normalidad en la variable en estudio.
Estime, con una confianza del 99%, la diferencia de los montos de operacin en las
sucursales de Surco y San Isidro. Qu sucursal ha tenido un mejor desempeo?
Estadstica Aplicada
Pgina 24
La
realidad
No rechazar H0
Rechazar H0
H0 es cierta
No hay error
Error tipo I
H0 es falsa
Error tipo II
No hay error
Estadstica Aplicada
Pgina 25
El valor (nivel de significacin) es fijado por la persona que realiza la investigacin. Por lo
general vara entre 1% y 10%.
La probabilidad de cometer Error tipo II es denotado por , esto es:
P(error II) = P(no rechazar Ho / Ho es falsa) =
Estadstica Aplicada
Pgina 26
Solucin
Sea X: Puntuacin en la prueba de aptitud
X~ N( , 2)
1. Planteo de hiptesis:
La puntuacin promedio en la prueba de aptitudes no es mayor a 90
H 0 : 90
H1 : 90
2. Nivel de significacin:
La probabilidad de decidir errneamente que la puntuacin promedio
0.05
3. Estadstico de prueba:
_
x 0
x9 0
T
~t
s/ n s/ n
4. Supuestos:
6.
Clculos:
tc
92 9 0
7 / 20
Criterios
Si
tc 1.73
No se rechaza Ho
Si
tc > 1,73,
Se rechaza H0
Conclusin:
Con un nivel de significacin del 5%, la informacin muestral (media de 92) no fue
suficiente para concluir que la puntuacin promedio en la prueba de aptitudes sobrepase
Estadstica Aplicada
Pgina 27
Ejercicio 9.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Colocar 5 mesas adicionales si el consumo promedio por mesa es superior a 100 soles.
Para tomar la decisin selecciona al azar una muestra de 10 mesas y anota la cantidad
consumida (en soles)
Mesas
10
Consumo (S/.) 115 120 105 100 117 110 95 121 98 106
Cul es la decisin del administrador con respecto a las mesas adicionales? Suponga que el
consumo por mesa sigue una distribucin normal.
Estadstica Aplicada
Pgina 28
Solucin:
Sea X: Resistencia al rompimiento de cierto tipo de cable (lb)
2 =
X ~ N( , 2402)
produccin.
1.
Planteo de hiptesis:
No aument la variabilidad de la resistencia al rompimiento de
los cables despus de modificar el proceso de produccin.
H 0 : 2 240 2
H : 2 240 2
1
2.
Nivel de significacin:
0,05
3.
Estadstica de prueba:
2
4.
(n 1)s 2
2
o
7 s2
2
~ (7)
2402
Supuestos:
a. Poblacin normal.
5.
2
(7)
Criterios de decisin:
Si c2 14,07 No se rechaza H0
Si c2 14,07 Se rechaza H0
6.
Clculos:
c2
(8 1)300
10,938
2402
Estadstica Inferencial
Conclusin:
No se ha podido probar, con un nivel de significancia del 5%, que la variacin de la
resistencia al rompimiento ha aumentado despus de modificar el proceso de
produccin. Tambin se dice que la informacin muestral (s=300 lb) no fue
significativo, no es lo suficientemente grande para concluir que en verdad > 240 lb.
Ejercicio 10.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Capacitar a su personal si la desviacin estndar del tiempo que demora en ser atendido
un cliente es mayor a 5 min. Para tomar la decisin selecciona 15 clientes al azar y encuentra
que la desviacin estndar de los tiempos que demoran en ser atendidos estos 15 clientes es
7.8 min. Suponiendo que estos tiempo provienen de una distribucin normal. Deber
capacitar al personal?
Estadstica Aplicada
Pgina 28
Solucin:
Sea p: proporcin de propietarios de computadoras caseras de la ciudad que compraron en
RRS.
1.
Planteo de hiptesis:
Anuncio de RRS
H 0 : p 0, 21
H1 : p 0, 21
Sospecha de SSR
2.
3.
Estadstica de prueba:
4.
Supuestos:
a.
5.
0.05
6.
Clculos:
7.
Conclusin:
p0.21
~ N (0, 1)
(0.21) (0.79)
700
0.95
-1.64
pp0
p0 (1 p0 )
n
120
p
0.1714
700
Zc
120
0.21
700
2.505
0.21(1 0.21)
700
Hay evidencia estadstica, al nivel de significacin del 5%, para afirmar que RRS sobre
estim el porcentaje de ventas de 21%. Por lo que estamos a favor de la sospecha del
gerente de SSR.
Estadstica Aplicada
Pgina 29
Ejercicio 12.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Lanzar la promocin Coman 4 y Paguen 3 si la proporcin de mesas ocupadas con ms
de 3 personas es menor de 0.3. Se toma al azar 80 mesas y se encuentra que hay 22 mesas
ocupadas con ms de 3 personas. Se lanzar la promocin?
Estadstica Aplicada
Pgina 30
2.5. Uso del valor sig proporcionado por el SPSS en sus pruebas
El SPSS nos proporciona el sig (bilateral) que se obtiene con la informacin que nos
proporciona la muestra. Este valor es una probabilidad que sirve para comparar con el
nivel de significacin elegido por el investigador.
La forma correcta de usarlo para las pruebas de hiptesis de la media es la siguiente:
PRUEBA UNILATERAL DERECHA (Valor crtico Tcrtico positivo)
Valor de la estadstica de prueba
Tcal negativo
Comparacin con
No tomar en cuenta el valor de sig
Decisin
NRHo
Tcal positivo
(sig/2) <
RHo
Tcal positivo
(sig/2)
NRHo
Distribution Plot
T, df=19
0.05
0
1.73
Tcrtico
Comparacin con
No tomar en cuenta el valor de sig
Decisin
NRHo
Tcal negativo
(sig/2) <
RHo
Tcal negativo
(sig/2)
NRHo
Decisin
sig <
RHo
sig
NRHo
Estadstica Aplicada
Pgina 31
Ejercicios propuestos 2.
9. Bantam Books, una editorial muy famosa, decidir publicar un nuevo libro de cocina, si
logra probar, con un nivel de significacin del 2%, de que el precio promedio que estaran
dispuestos a pagar los clientes por libro es ms de US$ 35,00. Suponga que el precio de
los libros de cocina se distribuyen normalmente, esta afirmacin se sustenta si una
muestra de 25 libros de cocina tiene una media de US$ 37,97 y una desviacin estndar
de US$ 12,87? Asuma normalidad.
Rpta:
Tc=1.15. DE: No rechazar Ho.
10. La cantidad media de ingresos por familia en Lima es de S/. 2 900 soles. Luis Montes
planea abrir un concesionario de automviles y quiere verificar esa cifra para una Zona
especfica de Lima, ya que en el caso que el ingreso promedio familiar sea menor a S/.2
900 soles, Luis no abrira un concesionario en esa zona. Luis encuentra resultados de una
encuesta reciente de 25 familias que viven en la zona de estudio donde se indica que la
media es de S/. 2 100 soles con una desviacin estndar de S/. 823. Al nivel de
significacin del 5%, cul ser la decisin de Luis Montes?
11. Una escuela de negocios local afirma que sus estudiantes graduados obtienen en su
primer trabajo, un salario promedio diario tan igual como el salario nacional, el cual es de
20 soles la hora. Como usted no da crdito y piensa que el valor es exagerado, selecciona
una muestra aleatoria de 10 alumnos graduados del ltimo ao de la mencionada escuela
y encontr los siguientes salarios por hora en su primer trabajo:
16,50 ; 19,00 ; 22,00 ; 21,50 ; 21,00 ; 16,50 ; 17,00 ; 21,00 ; 21,50 ; 22,00
Al nivel de significacin del 5%, estos datos apoyan su creencia sobre la afirmacin de
que hace la escuela de negocios.
Rpta:
Tcal=-0,272
12. El fabricante de la motocicleta Ososki anuncia en una propaganda de televisin que su
vehculo rendir en promedio 87 millas por galn en viajes largos. Los millajes (recorrido
en millas) en ocho viajes prolongados fueron: 88, 82, 81, 87, 80, 78, 79, 89. Al nivel de
significacin del 5% el millaje medio es menor que el anunciado? Rpta: Tcal= -2,605
13. Un dentista lanzar su campaa de dientes sanos si el nmero promedio de pacientes
que atiende diariamente es menor que 22. Usando una muestra de nueve das
seleccionados aleatoriamente de los ltimos meses, se ha tenido las siguientes cantidades
de pacientes: 22, 25, 20, 18, 15, 22, 24, 19 y 26. Si la cantidad de pacientes atendidos por
da tiene una distribucin normal,
a) Decidir el dentista lanzar su campaa? Use un nivel de significacin del 5%.
Rpta:
Tcal=-0,655
b) Con estos datos, se estara a favor de que la varianza de la cantidad de pacientes
atendidos por da en los ltimos meses es superior a 10? Use un nivel de significacin
del 10%. Interprete el resultado.
Rpta: c 2=10.16, DE: No se rechazar Ho
14. En cierta universidad se estima que el 25% de los estudiantes van en bicicleta a la
universidad. Es posible refutar esta estimacin, si en una muestra aleatoria de 90
estudiantes universitarios, se encuentra que 32 van en bicicleta a la universidad? Utilice
un nivel de significancia de 0,06.
Rpta:
Zc=2.31, DE: Rechazar Ho
15. En una encuesta aleatoria de 1000 hogares realizada en Lima, se encontr que 9% de los
hogares tena al menos un miembro con educacin superior. Este resultado valida la
aseveracin que en los hogares de Lima es menos de 12%?. Use un nivel de 0,05 de
significacin.
Rpta:
Zc= - 2.92, DE: Rechazar Ho
Estadstica Aplicada
Pgina 32
Cantidad de empleados
36
25
14
75
Pgina 33
Solucin:
21
2
2
1
H
:
2
0 1
22
2
H : 2 2 1 1
1
1
2
22
2.
3.
Estadstica de prueba:
S 2 2 S 2
F 12 22 12 ~
S 2 1 S2
f (15,
12)
4.
Supuestos:
5.
a.
Poblaciones normales.
b.
Muestras independientes y extradas al azar
Regiones crticas y criterios de decisin:
Criterios
Si 0,338 Fc 3,18
No se rechaza H0
Se rechaza H0
reas
6.
Clculos:
Fc
(3, 2) 2
(2, 7) 2
1, 405
Estadstica Aplicada
Pgina 34
Ejercicio 13.
Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer modelo y
siete del segundo modelo son sometidos a una colisin controlada obteniendo los siguientes
gastos, en dlares, por daos sufridos:
Colisin
Modelo 1
Modelo 2
1
345
340
2
310
325
3
305
345
4
345
310
5
355
315
6
375
280
7
320
290
8
310
9
305
Con un nivel de significacin del 5%, se puede afirmar que la variabilidad de los gastos
ocasionados por la colisin con el modelo 1 es similar a generados por el modelo 2? Suponga
que los gastos por daos en ambos modelos de automviles siguen una distribucin normal.
Estadstica Aplicada
Pgina 35
Solucin:
Planteo de hiptesis.
H 0 : 1 2 1 2 0
H1 : 1 2 1 2 0
2.
Nivel de significacin.
3.
Estadstica de prueba:
Suponiendo que Ho es verdadera
t
( x1 x2 ) ( 1 2 )
1
2 1
S p
n1 n2
( x1 x2 )
0,05
1
1
S p2
n1 n2
t~
( n1 n2 2)
2
2
donde: S2p (n1 1)s1 (n 2 1)s2
n1 n 2 2
4.
a.
5.
Supuestos:
Poblaciones normales. b. Muestras independientes y tomadas al azar.
Regiones crticas y criterios de decisin:
reas
Criterios
Si -2,048 tc 2,048 No se rechaza H0
Si tc < -2,048 o tc > 2,048 se rechaza H0
6.
tc
7.
Clculos:
0,815
1 1
8,976
17 13
Conclusiones:
Con 5% de nivel de significacin la diferencia encontrada en las muestras no es
significativa, luego no hay diferencia en los contenidos promedio de las latas de las dos
marcas de gaseosas.
Estadstica Aplicada
Pgina 36
Ejercicio 14.
Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer modelo y
siete del segundo modelo son sometidos a una colisin controlada obteniendo los siguientes
gastos, en dlares, por daos sufridos:
Colisin
Modelo 1
Modelo 2
1
345
340
2
310
325
3
305
345
4
345
310
5
355
315
6
375
280
7
320
290
8
310
9
305
Si se supone que los gastos por daos en ambos modelos de automviles siguen una
distribucin normal, a un nivel de significacin del 5%, existe alguna diferencia en el gasto
medio ocasionado por las colisiones de cada modelo de auto?
Estadstica Aplicada
Pgina 37
Solucin.
2. Nivel de significacin:
0,05
3. Estadstica de prueba:
2
4.
a.
5.
Supuestos:
Poblaciones normales. b. Muestras independientes y tomadas al azar.
Regiones crticas y criterios de decisin:
Criterios
Si 0,338 Fc 3,18
No se rechaza H0
Se rechaza H0
reas
6.
Clculos:
Fc
7.
(3, 2) 2
8, 46
(1,1) 2
Conclusiones:
Con 5% de nivel de significacin la informacin muestral nos estara indicando que las
varianzas no son HOMOGNEAS, o que las varianzas son HETEROGNEAS.
Estadstica Aplicada
Pgina 38
Planteo de hiptesis:
H 0 : 1 2 1 2 0
H1 : 1 2 1 2 0
2.
3.
Estadstica de prueba:
4.
Supuestos:
2 2
2
3,2 1,1
17
13
v
20,66 21
3,2 2
17
1,1 2
13
17 1 13 1
reas
Criterios
Si -2,08 tc 2,08,
No se rechaza H0
6.
Clculos
tc
7.
13
17
1,079
Conclusiones.
Con 5% de nivel de significacin no encontramos diferencias en los contenidos
promedios que tienen las latas de las dos marcas de gaseosas.
Estadstica Aplicada
Pgina 39
Ejercicio 15.
Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguro mdico
realizados por las empresas comerciales de dos ciudades. Para ello, se tom una muestra
aleatoria de 16 empresas en cada ciudad encontrndose los siguientes resultados en relacin al
gasto en seguro (en cientos de dlares):
Ciudad A
Ciudad B
Asumiendo que el gasto mensual en seguro tiene distribucin
normal. Se puede concluir que los gastos en seguro que n
16
16
realizan las empresas comerciales de la ciudad A superan a las
Media
86,875 83,3688
de la ciudad B en ms de 50 dlares? Utilice un nivel de
significacin del 10%.
S
324,1553 61,5250
Estadstica Aplicada
Pgina 40
219
235
16
203
200
-3
226
240
14
198
210
12
209
223
14
216
217
1
Solucin:
Sean X1: Produccin diaria por empleado cuando trabaja sin msica.
X2: Produccin diaria por empleado cuando trabaja con msica.
d = X2 - X1
1. Planteo de hiptesis:
H 0 : 2 1 2
H1 : 2 1 2
H 0 : D 2
H1 : D 2
Distribution Plot
T, df=5
0.4
0.3
0.2
(16 3 14 12 14 1)
9
6
(16 9) 2 (3 9) 2 ... (1 9) 2
7.9498
5
7. Conclusiones.
Como el valor de tc cae en la regin de Rechazo
de la Ho, se RHo. Con 5% de nivel de
significacin la informacin recogida nos
proporciona evidencia estadstica suficiente para
concluir que la msica ambiental logr aumentar
la produccin promedio diaria en ms de 2
unidades.
Sd
0.1
0.05
0.0
6. Clculos:
tc
Se rechaza H0
9 2
7.9498/
Estadstica Aplicada
2.16
2.02
Pgina 41
Ejercicio 16.
Una empresa desea implementar la meditacin trascendental MT siempre que pruebe que sta
logra un aumento significativo en la escala compuesta sobre comportamientos de liderazgo en
los empleados de su empresa la cual toma valores de 0 a 20 donde 20 significa un alto grado
de liderazgo. Para realizar el estudio selecciona al azar a 10 empleados y registra los valores
obtenidos antes de entrar al programa de MT y despus de cuatro meses de MT. Los
resultados se muestra en la siguiente tabla.
Empleado
1
2
3
4
5
6
7
8
9
10
Despus de MT
17
14
16
13
8
18
8
16
12
11
Antes de MT
14
13
14
8
9
12
10
13
10
9
Si consideramos que el valor que registran en la escala los empleados de la empresa sigue una
distribucin normal, los resultados de este estudio proporcionan a la empresa suficiente
evidencia para tomar la decisin de que debe implementar la meditacin trascendental como
poltica puesto que aumentar la escala compuesta sobre comportamiento de liderazgo en sus
empleados? Use un nivel de significancia del 5%
Estadstica Aplicada
Pgina 42
Personas que lo
vieron
150
63
200
60
Solucin.
Sea p1: Proporcin de personas que recordaron el mensaje principal del comercial A.
Sea p2: Proporcin de personas que recordaron el mensaje principal del comercial B.
1. Planteo de hiptesis.
H 0 : p1 p 2
H1 : p1 p 2
2. Nivel de significacin.
0.05
3. Estadstica de prueba.
Z
p 1 p 2
1 1
p(1 p)
n1 n2
p 1
~ N (0, 1)
x1
;
n1
p 2
x2
n2
x x
n p n p
~
p 1 2 1 1 2 2
n1 n2
n1 n2
4. Supuestos.
b) Muestra tomada al azar. b. Muestras grandes.
5. Regiones crticas. Criterios de decisin.
La hiptesis alternante define la(s) zona(s) de rechazo.
reas
Criterios
Si -1,96 Zc 1,96 No se rechaza H0
Si Zc < -1,96 o Zc > 1,96 Se rechaza H0
Zcal=2,328
Estadstica Aplicada
Pgina 43
6. Clculos
63 6 0
~
p
0.351
150 200
Zc
63
60
150 200
2,328
1
1
(0.351)(0.649 )
150 200
7. Conclusin:
Con 5% de nivel de significacin y a partir de la informacin muestral, hay diferencias
significativas en las proporciones que recuerdan los dos comerciales.
Ejercicio 17.
En una encuesta se pregunt a 1 035 adultos sobre su percepcin respecto a la participacin
de las compaas estadounidenses en la economa global. 704 de los encuestados
respondieron bien o excelente. En una encuesta similar, realizada cuatro aos despus, 782
de 1 004 adultos encuestados respondieron a la misma pregunta como bien o excelente. Con
los resultados muestrales,
a) se puede concluir que la proporcin de adultos que respondieron bien o excelente se
increment en los ltimos cuatro aos? Use un nivel de significacin del 1%.
Estadstica Aplicada
Pgina 44
Ejercicios propuestos 3.
20. Un investigador desea verificar si existe evidencia de una diferencia en la resistencia
media entre dos tipos de material para embalaje. La descripcin de las lecturas en pielibra de la resistencia al impacto de los dos tipos de embalaje se muestra en la tabla:
Caractersticas
Embalaje A Embalaje B
Media
1,2367
0,9778
Varianza
0,0042
0,0024
Observaciones
9
9
a) Cul es la hiptesis planteada?, es una hiptesis unilateral o bilateral?
b) A partir de los datos obtenidos compruebe la hiptesis y concluya con 2% de nivel de
significacin. Asuma poblaciones normales.
Rpta:
Para la prueba de homogeneidad
Fc=1.75.
DE: Hay homogeneidad de varianzas.
Para la prueba de diferencia de medias
Tc= 9.56 GL:16.
DE: Rechazar Ho.
21. Dos encuestas independientes sobre salarios, realizados en dos reas metropolitanas muy
distintas entre s, revelaron la siguiente informacin con respecto a los sueldos promedios
de los operadores de equipo pesado.
rea
A
B
Media
$6,50 / h.
$7,00 / h.
Desviacin Estndar
$4,50 /h.
$ 2,00 / h.
Tamao de la muestra
16
13
Suponga que los datos provienen de poblaciones normales. Se puede concluir que los
sueldos promedios son diferentes con un =0.05
22. La compaa distribuidora Allen tiene la hiptesis de que una llamada telefnica es ms
efectiva que una carta para acelerar el pago de cuentas atrasadas. Se contactaron dos
grupos de cuentahabientes atrasados, cada uno con uno de los dos mtodos, y se registr
el lapso entre l envi de la carta o la llamada y el momento en que se registr el pago.
Mtodo utilizado
Das hasta el pago
Carta
10
Llamada telefnica 7
11
11
14
10
Estadstica Aplicada
Pgina 45
puede llegar a la conclusin de que los miembros del club del libro del mes pasan ms
tiempo, en promedio, viendo televisin que leyendo? Asuma Normalidad.
Encuestado 1 2 3 4 5 6 7 8 9 10 11 12
Televisin 11 19 8 5 16 8 4 12 10 14 15 18
Leyendo
6 10 3 10 5 8 7 14 14 8 10 10
25. Se realiza un estudio en la North Central University para medir el efecto del cambio
ambiental en estudiantes extranjeros. Uno de los aspectos del estudio es una comparacin
del peso de los alumnos al ingresar a esa universidad, con su peso un ao ms tarde. Se
sospecha que el tipo de alimento provoca un aumento de peso. Se tom una muestra de
estudiantes y los datos se dan a continuacin.
Nombre
Nassar
OToole
Oble
Silverman
Kim
Gross
Peso al llegar
124
157
98
190
103
135
Peso un ao despus
142
157
96
212
116
134
Portada
Sencilla
Paracaidista
Nmero
enviado
207
213
Nmero
devuelto
104
109
Pgina 46
10
11
12
10
31
21
35
27
37
26
23
40
36
28
21
14
36
22
36
32
39
29
29
42
42
35
29
Rpta:
Trabajadores
sede Lima
Trabajadores sede
Provincias
Muestra
1000
600
Banco A
600
330
Zcal= 0.66
30. Mantener el peso ideal es una preocupacin, que las empresas han identificado como una
interesante oportunidad de negocio. Fine es una empresa dedicada a ayudar a alcanzar el
peso ideal; garantiza que en 23 sesiones sus clientes pierden ms de 5 kilogramos. Para
comprobar lo ofrecido en su garanta, Indecopi selecciona una muestra aleatoria de 16
pacientes y obtuvo los siguientes resultados (en kilos):
79 71 83 86 78 79 88 89 85 76 70 78 69 89 75 90
Inicio
23
sesiones
despus
71
64
75
80
70
72
85
81
72
70
71
70
63
83
68
82
Estadstica Aplicada
Pgina 47
Variable
X
Variable Y
Columna 2
...
Columna c
Total
Fila 1
O11
O12
O1c
O1
Fila 2
O21
O22
O2 c
O2
.
.
.
Fila r
.
.
.
.
.
.
.
.
.
.
.
.
Or1
Or 2
...
Orc
Or
O1
O 2
...
O c
Total
Esta prueba es especialmente til cuando se trata de analizar la independencia entre dos
variables en escala nominal. Cuando las variables estn en escala ordinal, intervalo o
Estadstica Aplicada
Pgina 48
razn, existen otros procedimientos ms adecuados, como por ejemplo mediante el clculo
de coeficientes de correlacin (en un captulo posterior se ver el caso del coeficiente de
correlacin de Pearson, til para analizar asociacin lineal entre dos variables
cuantitativas).
La frecuencia esperada correspondiente en cada una de las rc celdas est dada por la
expresin:
Frecuencia esperada = eij
OiO j
n
2
cal
i1
(oi ei ) 2
~ 2 con (r 1)(c 1) grados de libertad
ei
5) Clculos previos
ei
e1
e2
i1
k
2
cal
(ok ek ) 2
ek
6) Conclusin
Se derivan de la decisin estadstica y de las variables especificas concerniente al
problema que se encuentra en evaluacin.
Estadstica Aplicada
Pgina 49
Ejemplo 11.
Para determinar si existe una relacin entre la calificacin de un empleado en el programa de
capacitacin y su rendimiento real en el trabajo, se tom una muestra de 400 casos de los
archivos y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de
contingencia 33.
Rendimiento real en
el trabajo
(calificacin del
empleador)
Calificacin en el programa de
capacitacin
Total
Debajo del
promedio
Promedio
Sobre el
promedio
Deficiente
23
60
29
112
Promedio
28
79
60
167
49
63
121
60
188
152
400
Muy bueno
Total
Con el nivel de significacin 0,01, La calificacin del rendimiento del trabajador est
asociada con la calificacin en el programa de capacitacin?
Solucin
Las variables que se muestran en la tabla son:
Variable 1: Calificacin del rendimiento real en el trabajo, con tres categoras: Deficiente,
promedio y muy bueno.
Variable 2: Calificacin en el programa de entrenamiento, con tres categoras: Debajo del
promedio, promedio o sobre el promedio.
La prueba de independencia compara las frecuencias observadas frente a las frecuencias
esperadas bajo el supuesto de que ambas variables sean independientes.
La siguiente tabla muestra tanto las frecuencias observadas como las esperadas (entre
parntesis)
Rendimiento real en
el trabajo
(calificacin del
empleador)
Deficiente
Calificacin en el programa de
capacitacin
Debajo del
Sobre el
Promedio
promedio
promedio
23 (16,80) 60 (52,64) 29 (42,56)
Promedio
28 (25,05)
79 (78,49)
60 (63,46)
167
Muy bueno
9 (18,15)
49 (56,87)
63 (45,98)
121
60
188
152
400
Total
Estadstica Aplicada
Total
112
Pgina 50
2)
3)
Criterio:
2
Si cal
> 13,277 se rechaza H0,
2
13,277 no se rechaza H0.
Si Cal
4)
Clculos previos
(23 16,80) 2 (28 2 5,05)2
(63 4 5,98)2
2
...
20,18
Cal
25,05
45,98
16,80
5)
Conclusin: Con nivel de significacin 0,01 se rechaza la hiptesis nula. Por lo tanto
hay evidencia estadstica suficiente para aceptar que la calificacin del rendimiento
real de un empleado en el trabajo est relacionado con la calificacin en el programa
de entrenamiento.
Salida SPSS:
Pruebas de chi-cuadra do
Rec uento
Aprovechamiento
Debajo del
Promedio
Rendimiento Deficient e
23
Muy Bueno
9
Promedio
28
Tot al
60
Estadstica Aplicada
Promedio
60
49
79
188
Sobre el
Promedio
29
63
60
152
Tot al
112
121
167
400
Chi-cuadrado de Pearson
Razn de verosimili tudes
N de cas os vlidos
Valor
20. 179a
20. 892
400
gl
4
4
Sig. asinttica
(bil ateral )
.000
.000
Pgina 51
Ejercicio 18.
El consejo de administracin de Comunicatel desea conocer si la opinin, Y, de sus
accionistas respecto a una posible fusin es independiente del nmero de acciones, X, que
poseen. Una muestra de 500 accionistas proporciona la siguiente tabla:
Total
64
222
214
500
Pgina 52
Ejemplo 12.
En un estudio reciente, al personal de ventas de una compaa de computacin se le
pregunt si sus ventas se veran acrecentadas por una reduccin en el precio de las
computadoras o por una mejora en la calidad del servicio que se ofrece a los usuarios. Se
tomaron muestras al azar de vendedores de cada uno de los tres territorios de ventas, con
los siguientes resultados:
Norte
Sur
Este
Total
Menor precio
41
27
22
90
Mejor servicio
79
53
78
210
Total
120
80
100
300
Use un nivel de significacin de 0,05 para probar si hay homogeneidad en las tres reas
geogrficas con respecto a la opinin de los vendedores sobre los motivos del crecimiento
de sus ventas.
Pasos para realizar la prueba de homogeneidad de proporciones
1.
H0: Hay homogeneidad en las tres reas geogrficas con respecto a la opinin de los
vendedores sobre los motivos del crecimiento de sus ventas.
H1: No hay homogeneidad en las tres reas geogrficas con respecto a la opinin de los
vendedores sobre los motivos del crecimiento de sus ventas.
Fijacin del nivel de significacin: 0,05.
2
k
3.
Estadstico
de
prueba:
5.
Clculos previos
Desintegrados
Permanecieron intactos
Total
2
Cal
Material A
41 (36)
Material B
27 (24)
Material C
22 (30)
Total
90
79 (84)
120
53 (56)
80
78 (70)
100
210
300
(79 8 4) 2
(78 7 0) 2
(413 6) 2
...
4,575
36
84
70
Con nivel de significacin de 0,05 no se rechaza la hiptesis nula; los datos son
insuficientes para rechazar que hay homogeneidad en las tres reas geogrficas con
respecto a la opinin de los vendedores sobre los motivos del crecimiento de sus ventas.
Estadstica Aplicada
Pgina 53
Ejercicio 19.
Actualmente existen organismos reguladores y supervisores de los diversos servicios que se
brindan a la comunidad. Tambin tenemos entidades que velan por el bienestar y los
derechos del consumidor. Es as que las propias empresas estn cada vez ms preocupadas
por brindar servicios de calidad.
La gerencia Sur de la empresa de Agua y Alcantarillado desea investigar si existe relacin
entre el distrito donde vive el usuario y la percepcin de calidad del servicio brindado.
Considere un Nivel de Significacin del 5%.
Con esta finalidad se extrae una muestra aleatoria de 500 usuarios y se obtuvo lo siguiente:
Percepcion
de Calidad
del Servicio
Bueno
Regular
Malo
Total
Miraflores
48
24
13
85
Distrito de Residencia
Surco
SJM
VM
42
35
12
38
33
40
18
32
33
98
100
85
VEL
25
61
46
132
Total
162
196
142
500
Solucin
Definicin de las Variables en estudio:
Variable 1:
Niveles:
Variable 2:
Niveles:
La siguiente tabla muestra tanto las frecuencias observadas como las esperadas (entre
parntesis)
1)
2)
Estadstica Aplicada
Pgina 54
3)
Estadstico de prueba:
4)
5)
2
>
Si Cal
se rechaza H0;
2
Si Cal
no se rechaza H0.
Clculos previos
2
2
6)
Conclusin:
Ejercicio 20.
La empresa que brinda servicios de Agua y Alcantarillado en la zona Sur de Lima desea
conocer si la calidad de servicio es percibida de manera similar (homognea) por los usuarios
que residen en los distintos distritos a los cuales se les brinda el servicio. Con esta finalidad
se extraen muestras aleatorias en los 5 distritos (de cada distrito una muestra) que atiende
la gerencia Sur: Miraflores, Surco, SJM, VMT y VS) y se obtienen los siguientes resultados:
Percepcion
de Calidad
del Servicio
Bueno
Regular
Malo
Total
Miraflores
46
22
22
90
Distrito de Residencia
Surco
SJM
VM
42
35
12
38
33
43
20
32
35
100
100
90
VEL
20
44
56
120
Total
155
180
165
500
Usar un nivel de significacin de 0,05 para probar si la calidad de servicio que perciben los
usuarios es similar en los tres distritos.
Estadstica Aplicada
Pgina 55
1.
H1:
2.
3.
4.
k
(o e ) 2
Estadstico de prueba: c2 i i ~ 2 con
ei
i 1
(r 1)(c 1) g. l.
reas y criterios de decisin:
_______________ g. l.
2
>
Si Cal
se rechaza H0,
Si Cal
no se rechaza H0
5. Clculos previos
7)
Conclusin:
Estadstica Aplicada
Pgina 56
Otras pruebas
Muchas tcnicas estadsticas necesitan que las variables (poblaciones) sigan una distribucin
normal. Las pruebas que realizan este tipo de anlisis son:
En esta seccin se revisar la prueba de Kolmogorov-Smirnov con la ayuda del SPSS para
realizar los clculos.
Ejemplo 13.
Pruebe si la siguiente muestra proviene de una distribucin normal. Use 0,01.
12
15
16
18
19
14
10
15
16
14
a,b
Media
Desviacin tpica
Diferencias ms
extremas
Absoluta
10
14.90
2.644
.167
Positiva
.139
Negativa
-.167
.527
.944
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.
Comosig=0.944<=0,01entoncesNoRechazamosHo.
Conclusin: Al nivel de significacin del 1% se puede concluir que la distribucin normal
brinda un buen ajuste a estos datos.
Estadstica Aplicada
Pgina 57
Pgina 58
Factor: Es una variable independiente o de entrada que puede afectar los resultados del
experimento. Los factores se pueden clasificar en controlables y no controlables.
Factor en estudio: Un factor en estudio es aquel cuyos valores son controlados y cuyo
efecto ser evaluado en los resultados del experimento. El inters principal del
experimentador es evaluar el efecto de estos factores. En el ejemplo anterior, la
promocin es el factor en estudio. A los distintos valores de los factores en estudio que
son evaluados se les llama niveles del factor. En el ejemplo, el factor promocin tiene
tres niveles.
Un experimento diseado puede tener dos o ms factores en estudio, por ejemplo,
podramos estar interesados en evaluar no slo las promociones sino adems las zonas y
el inters radicara en saber si las promociones tienen un efecto distinto en las zonas donde
se aplican (hay interaccin entre la promocin y las zonas?). En este caso los factores
son: Promocin y Zona.
Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinacin
de los niveles de dos o ms factores en estudio y cuyo efecto se mide y compara con los
de otros tratamientos.
Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se
mide el efecto de un tratamiento. En el ejemplo, la unidad experimental podra ser un
empaque de alimento.
Variable respuesta: Es la variable en la cual se evaluarn los efectos de los tratamientos.
En el ejemplo, la variable respuesta puede ser el tiempo de duracin observado de cada
empaque.
Error experimental: Es la variabilidad existente entre los resultados de unidades
experimentales tratadas en forma similar. Cualquier factor no controlable contribuye al
error experimental. El error experimental proviene de dos fuentes principales:
variabilidad inherente al material experimental y variabilidad resultante de cualquier
falta de uniformidad en la realizacin fsica del experimento
En el ejemplo, a pesar que se aplic la promocin 1 a las cuatro tiendas, sus ventas son
distintas.
Estadstica Aplicada
Pgina 59
Tratamiento
Muestra
Tratamiento 1
Tratamiento 2
...
Tratamiento k
y11
y21
...
yk1
Y12
y22
...
yk2
y13
y23
...
yk3
...
...
...
ni
y 1n1
y 1n2
...
y 1nk
y1.
y2.
...
yk.
Totales yi.
Estadstica Aplicada
Pgina 60
Modelo:
Cada observacin yij se descompone en :
yij i ij para i 1, 2, ..., k ; j 1, 2, ..., ni
Donde:
yij
Media general.
ij
Hiptesis:
La hiptesis nula plantea que no hay efecto de los tratamientos, luego no hay diferencia en
las medias poblacionales; por lo tanto expresamos las hiptesis de la siguiente manera:
H0:
1 = 2 = = k
H1:
a la variable respuesta.
medias poblacionales
la variable respuesta.
Anlisis de Varianza
Consiste en analizar los cocientes de las varianzas para probar la hiptesis de igualdad o
desigualdad entre las medias debidas a los tratamientos. Para lo cual se separa la variacin
total en las partes con que contribuye cada fuente de variacin. En el caso l DCA las fuentes
de variacin son: Variacin entre grupos (debida a los tratamientos) y Variacin dentro del
grupo (debida al error experimental).
Con estas fuentes de variacin se obtienen los cuadrados de las sumatorias de las
desviaciones, tanto del tratamiento como del error y se construye una tabla de ANOVA que
nos servir para probar las hiptesis de este estudio.
Estadstica Aplicada
Pgina 61
de
variacin
Grados de
Suma de
libertad
cuadrados
Fcal
Tratamientos
k1
SC(Tr)
i 1
Error
Cuadrado
yi2 y2
ni
n
n. k
n. 1
k
n
y2
SCT y ij2
n
i 1 j 1
Total
medio
CM(Tr)
CME
SC(Tr)
k 1
SCE
n k
CM (Tr )
CME
Ejemplo 14.
El vicepresidente de mercadeo de un banco importante planea poner en marcha cierto tipo de
promociones para atraer nuevos clientes en cuatro sucursales del banco. l est convencido de
que diferentes tipos de promociones atraern a personas de diferentes grupos de ingreso, por
lo que, de haber diferencias entre los ingresos promedio de los clientes de cada sucursal, se
optar por un programa de promociones distinto para cada una. Considere a los montos de los
depsitos como una medida representativa de los ingresos de los clientes. En la siguiente tabla
se presentan datos para una muestra aleatoria de siete depsitos desde cada sucursal (en miles
de soles) Debe el vicepresidente optar por un programa de promociones distinto para cada
sucursal? Evale esta posibilidad con un nivel de significacin del 5%.
Depsito
Sucursal 1
Sucursal 2
Sucursal 3
Sucursal 4
5,3
3,3
3,6
4,3
2,6
4,6
2,8
2,5
3,6
2,1
4,5
1,8
3,8
3,5
3,8
3,0
2,7
5,0
1,9
3,9
5,1
2,8
4,1
3,5
4,2
2,5
5,1
4,1
Total Yi.
27,3
23,8
25,8
23,1
Estadstica Aplicada
Y.. = 100
Pgina 62
Solucin.
H0: No hay diferencia entre los montos promedios de los depsitos en las cuatro sucursales.
H1: Hay diferencia entre los montos promedios de los depsitos en las cuatro sucursales.
Los totales para las cuatro muestras son, respectivamente, 27,3; 23,8; 25,8 y 23,1, el gran total
es 100, y los clculos con que se obtienen las sumas de cuadrados necesarias son los
siguientes:
4 7
yij
2
i 1 j 1 (100) 357,1429
n.
28
2
Suma de
Cuadrado
libertad
cuadrados
medio
41=3
1,5686
0,5229
Error
28 4 = 24
25,4486
1,0604
Total
28 1 = 27
27,0171
Fuente de variacin
Tratamientos
Fc
Fcrt
0,4931 3,01
F(3,24)
0.4931
A continuacin se presenta la salida del SPSS para el anlisis de varianza para una va de
este ejemplo, junto con las pruebas para la verificacin de los supuestos.
Estadstica Aplicada
Pgina 63
Supuestos
Verificacin del supuesto de homogeneidad de varianzas
H0: 12 22 32 42 (la varianza es la misma en las cuatro sucursales)
H1: Al menos una varianza es diferente.
Prueba de igualdad de Levene de varianzas
de error
Variable dependiente: Depositos
F
df1
,037
df2
3
Sig.
24
,990
Con un valor de probabilidad de 0,99, el resultado de esta prueba indica que no hay
suficiente evidencia estadstica para rechazar que las varianzas de las poblaciones de las
cuales se han extrado las muestras son similares.
Verificacin del supuesto de normalidad de los errores
H0: La distribucin de los errores en el modelo es normal.
H1: La distribucin de los errores en el modelo no es normal.
Con un valor de probabilidad > 0.200 (mayor que alfa), el resultado de esta prueba indica
que no hay suficiente evidencia estadstica para rechazar el supuesto de normalidad. La
distribucin de los errores en el modelo tiene distribucin normal
Anlisis de Varianza
Con un valor de probabilidad de 0,690 (mayor que alfa), no se rechaza la hiptesis nula lo
que indica que las medias de las cuatro sucursales son iguales.
Estadstica Aplicada
Pgina 64
Ejemplo 15.
La revista Money public los rendimientos de las acciones de los fondos de bonos. Los datos
siguientes son los rendimientos (%) de siete acciones de cuatro tipos de bonos: mid-cap,
small-cap, Irbid y Specialty (Money, dic del 2011)
a.
Specialty (D)(%)
1,2
1,1
1,0
1,2
1,3
1,8
1,4
9
2,0
1,2
1,7
1,8
1,5
2,3
1,9
12,4
2,0
2,7
1,8
1,5
2,5
1,0
0,9
12,4
1,6
2,7
2,6
2,5
1,9
1,5
1,6
14,4
48.2
Estadstica Aplicada
Pgina 65
b.
Los datos muestrales indican que los cuatro bonos tiene promedios distintos
rendimientos? Use = 0,05.
ANOVA
Fuentes de variacin
Suma de cuadrados
gl
Media cuadrtica
Sig.
Bonos
Error
Total
Estadstica Aplicada
Pgina 66
Ejemplo 16.
En el ejemplo anterior, del rendimiento de los bonos,
(i)
(ii)
D:Specialty
Lmite
superior
-,4857
,2604
,074
-1,023
,052
C:Irbid
-,4857
,2604
,074
-1,023
,052
D:Specialty
-,7714
,2604
,007
-1,309
-,234
A:Mid-cap
,4857
,2604
,074
-,052
1,023
C:Irbid
,0000
,2604
1,000
-,537
,537
D:Specialty
-,2857
,2604
,283
-,823
,252
A:Mid-cap
,4857
,2604
,074
-,052
1,023
B:Small-cap
,0000
,2604
1,000
-,537
,537
D:Specialty
-,2857
,2604
,283
-,823
,252
A:Mid-cap
,7714
,2604
,007
,234
1,309
B:Small-cap
,2857
,2604
,283
-,252
,823
C:Irbid
,2857
,2604
,283
-,252
,823
B:Small-cap
C: Irbid
Lmite
inferior
B:Small-cap
A:Mid-cap
DMS
Intervalo de confianza
al 95%
A-D= 0
A-D< 0
Estadstica Aplicada
Pgina 67
Intervalo
Conclusin
AyB
( - ; +)
A-B =0
A=B
AyC
( - ; +)
A-C=0
A=C
AyD
( - ; -)
A-D<0
A<D
ByC
( - ; +)
B-C=0
B=C
ByD
( - ; +)
B-D=0
B=D
CyD
( - ; +)
C-D=0
C=D
Duncan
Tipos_de_fondos
Mid-cap (A)
1,286
Small-cap (B)
1,771
1,771
Irbid (C)
1,771
1,771
Specialty (D)
Sig.
2,057
,089
,311
Pgina 68
Ejercicio 21.
Una agencia gubernamental para la proteccin del medio ambiente ha establecido
reglamentos muy estrictos para el control de los deshechos de las fbricas. Una empresa
tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno
pero quisiera determinar cul es la situacin de las otras 3. Para el efecto se toman 5
muestras de los lquidos residuales de cada una de las plantas y se determina la cantidad de
contaminantes. Los resultados del experimento aparecen en la tabla.
Planta
Cantidad de contaminante
1,65 1,72
1,50
1,37 1,6
1,70 1,85
1,46
2,05 1,8
1,40 1,75
1,38
1,65 1,55
2,10 1,95
1,65
1,88 2,00
Proporcionan los datos anteriores evidencia suficiente que indique que existe una diferencia
en la cantidad media de contaminantes para las cuatro plantas?
58,776
20
,942
19
Total corregida
F
5,200
1940,738
5,200
Sig.
,011
,000
,011
Cantidad de contaminante
Subconjunto
Duncana,b
Planta
C
1
1,5460
1,5680
B
D
5
5
1,7720
1,7720
1,9160
,066
,206
Sig.
Estadstica Aplicada
Pgina 69
Estadstica Aplicada
Pgina 70
Replica
1
2
3
b1
a1
Factor B
b2
b3
b1
a2
Factor B
b2
b3
Modelo:
yijk i j ( )ij ijk
donde:
i 1, 2,..., a
j 1, 2,..., b
k 1, 2,..., n
En este modelo es el efecto de la media general, i es el efecto del nivel i-simo del factor
A, j es el efecto del nivel j-simo del factor B, ( )ij es el efecto de la interaccin entre
ambos factores, y ijk es un componente de error aleatorio. Se supone que los errores tienen
distribucin normal con media cero y varianza constante.
Estadstica Aplicada
Pgina 71
Cuadrados Medios
(CM)
Fcal
Factor A
a1
SC(A)
SC( A)
gl( A)
CM( A)
CM(Error)
Factor B
b1
SC(B)
SC(B)
gl(B)
CM( B)
CM(Error)
(a1)(b-1)
SC(AxB)
SC( AB)
gl( AB)
CM( AB)
CM(Error)
ab( n 1)
SC(Error)
SC(Error)
gl(Error)
abn 1
SC(Total)
Fuentes de variacin
Interaccin AxB
Error Experimental
Total
Paso 2:
Si en el paso 1 no se rechaza la hiptesis nula (NRHo), entonces, no hay interaccin y
se debe analizar cada factor por separado, como en un Diseo Completamente al Azar
(DCA).
Ho: El factor A no afecta a la variable Ho: El factor B no afecta a la variable
respuesta
respuesta
H1: El factor A afecta a la variable respuesta H1: El factor B afecta a la variable respuesta
Para la prueba que se rechace (para el factor que si afecte) y siempre y cuando los
niveles del factor sean tres o ms se debe realizar la prueba de Duncan.
Si en el paso 1 se rechaza la hiptesis nula (RHo), entonces, hay interaccin se debe
realizar un anlisis de DMS fijando un nivel y comparando los niveles del otro factor.
Estadstica Aplicada
Pgina 72
Ejercicio 22.
Una empresa de pedidos por correo dise un experimento factorial para investigar el efecto
que tiene el diseo del anuncio y el tamao del anuncio en revistas, sobre la cantidad de
pedidos recibidos (en miles). Se consideraron tres diseos de anuncios y dos tamaos de
anuncios. Los datos que se obtuvieron corresponden a la cantidad de pedidos en miles y
aparecen en la tabla siguiente.
Tamao del anuncio
Pequeo
Grande
8
12
14
22
14
20
10
18
15
12
8
16
26
30
30
18
14
17
Diseo
N
Parmetros normalesa,b
Mximas diferencias
extremas
Media
Desviacin estndar
Absoluta
Positivo
Negativo
Estadstico de prueba
Sig. asinttica (bilateral)
a. La distribucin de prueba es normal.
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.
Estadstica Aplicada
Residuo para
Valores
18
.0000
2.84226
.204
.127
-.204
.204
.046c
df1
df2
Sig.
12
.798
Pgina 73
de cuadrados
Cuadrtico
gl
promedio
Sig.
Modelo corregido
610.444a
122.089
10.668
.000
Interceptacin Fila
5134.222
5134.222
448.621
.000
(Diseo) Columna
453.778
226.889
19.825
.000
(Tamao) Fila *
80.222
80.222
7.010
.021
Columna
76.444
38.222
3.340
.070
Error
137.333
12
11.444
Total
5882.000
18
747.778
17
Total corregido
DMS
(I) Fila
1.00
(J) Fila
2.00
3.00
Diferencia de
medias (I-J)
-12.0000*
Error
estndar
1.95316
Sig.
.000
-3.6667
1.95316
12.0000*
1.95316
1.00
*
8.3333
1.95316
3.00
3.6667
1.95316
3.00
1.00
*
-8.3333
1.95316
2.00
Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 11.444.
*. La diferencia de medias es significativa en el nivel .05.
.085
.000
.001
.085
.001
2.00
Intervalo de confianza al
95%
Lmite
Lmite
inferior
superior
-16.2556
-7.7444
-7.9222
7.7444
4.0778
-.5889
-12.5889
.5889
16.2556
12.5889
7.9222
-4.0778
Valores
Duncana,b
Fila
1.00
3.00
2.00
Sig.
N
6
6
6
Subconjunto
1
2
11.6667
15.3333
.085
23.6667
1.000
Estadstica Aplicada
Pgina 74
Estadstica Aplicada
Pgina 75
Ejemplo 17.
El administrador de una empresa de confecciones de pantalones para dama, desea hacer un
estudio del tiempo de fabricacin (min) que demora cada una de las actividades principales
(corte, confeccin y acabado) involucradas en el proceso de fabricacin de pantalones y
piensa, que stas interaccionan con el tipo de tela que usa en la fabricacin de las prendas
(material 1, material 2 y material 3). Se realizaran cuatro repeticiones en cada actividad por
cada tipo de tela, y las 36 pruebas se realizan de manera aleatoria.
La tabla siguiente muestra los tiempos en minutos para cada actividad segn el tipo de tela
usada en la fabricacin de la prenda:
Tiempo de fabricacin (min)
Actividad (B)
Tipo de tela
(A)
M1
M2
M3
Corte
130
74
150
159
138
168
Confeccin
155
180
188
126
110
160
34
80
136
106
174
150
Acabado
40
75
122
115
120
139
20
82
25
58
96
82
70
58
70
45
104
60
Suponiendo que se cumplen los supuestos del modelo, realice el anlisis correspondiente.
A continuacin se presenta el reporte del SPSS ver.22 del anlisis de varianza.
Pruebas de los efectos inter-sujetos
Variable dependiente:Tiempo
Origen
Modelo corregido
gl
Media cuadrtica
Sig.
Interseccin
59416,222
400900,028
8
1
7427,028
400900,028
11,000
593,739
,000
,000
Actividad
39118,722
19559,361
28,968
,000
Tipo_tela
10683,722
5341,861
7,911
,002
Actividad * Tipo_tela
9613,778
2403,444
3,560
,019
Error
18230,750
27
675,213
Total
478547,000
36
Total corregida
77646,972
a. R cuadrado = .765 (R cuadrado corregida = .696)
35
Estadstica Aplicada
Pgina 76
Actividad
Corte
(I)Tipo_tela
M1
M2
M3
Confeccin
M1
M2
M3
Acabado
M1
Diferencia de
medias (I-J)
-21,000
-9,250
Error tp.
18,374
18,374
21,000
11,750
M2
M2
M3
M1
M3
M1
M2
M2
M3
(J)Tipo_tela
M2
M3
M1
M3
M1
Sig.
,263
,619
Lmite inferior
-58,700
-46,950
Lmite superior
16,700
28,450
18,374
18,374
,263
,528
-16,700
-25,950
58,700
49,450
9,250
-11,750
-62,500*
-88,500*
62,500*
-26,000
88,500*
26,000
8,000
18,374
18,374
18,374
18,374
18,374
18,374
18,374
18,374
18,374
,619
,528
,002
,000
,002
,168
,000
,168
,667
-28,450
-49,450
-100,200
-126,200
24,800
-63,700
50,800
-11,700
-29,700
46,950
25,950
-24,800
-50,800
100,200
11,700
126,200
63,700
45,700
-28,000
18,374
,139
-65,700
9,700
-45,700
-73,700
29,700
1,700
-9,700
-1,700
65,700
73,700
-8,000
18,374
,667
M1
-36,000
18,374
,060
M3
28,000
18,374
,139
M3
M1
36,000
18,374
,060
M2
Basadas en las medias marginales estimadas.
a. Ajuste para comparaciones mltiples: Diferencia menos significativa (equivalente a la ausencia de ajuste).
*. La diferencia de medias es significativa al nivel ,05.
M2
Se analizar fijando los niveles de un factor y comparando entre todos los niveles del otro
factor.
Fijemos: Corte:
Comparaciones
Intervalo de confianza
Conclusin
M1 y M2
( - ; +)
1=2
M1 y M3
( - ; +)
1=3
M2 y M3
( - ; +)
2=3
1 = 2 = 3
Conclusin: Al nivel de significacin del 5%, en la actividad de Corte no se ha probado que
algn tipo de tela tiene demore ms que otro.
Fijemos: Confeccin
Comparaciones
Intervalo de confianza
Conclusin
M1 y M2
( - ; -)
1<2
M1 y M3
( - ; -)
1<3
M2 y M3
( - ; +)
2=3
1 < 2 = 3
Pgina 77
Fijemos: Acabado
Comparaciones
Intervalo de confianza
Conclusin
M1 y M2
( - ; +)
1=2
M1 y M3
( - ; +)
1=3
M2 y M3
( - ; +)
2=3
1 = 2 = 3
Conclusin: Al nivel de significacin del 5%, en la actividad: Acabado no se prob que
algn tipo de tela demanda ms que otra.
Ejercicio 23.
El administrador de una tienda de ropas para mujer desea lanzar tres lneas de ropa: L1, L2 y
L3, y considera que el grupo de edad es un factor importante a considerar, por lo que clasifica
a sus clientes en grupo 1=G1 (menores de 20 aos), grupo 2=G2 (entre 20 y 30 aos) y
grupo 3=G3 (mayores de 30 aos). Enva cartas de invitacin a 9 clientes del grupo 1, a 9 del
grupo 2 y a 9 del grupo 3. Cuando llegan a la tienda, las 9 clientes del grupo 1 se elige
aleatoriamente a 3 y se les enva al sector de la L1, a otras 3 al sector de la lnea 2 y las 3
restantes al sector de la lnea 3. Lo mismo se hace cuando llegan las clientes de los otros dos
grupos de edades. Luego se les pide que den una puntuacin entre 1 y 10, donde 1 nunca lo
usaran y 10 estaran encantadas de usarlo. A continuacin se presentan los reportes del SPSS
del anlisis factorial. Concluya con un =0.01.
Grupo de
edad
G1
G2
G3
Estadstica Aplicada
Lneas de ropa
L1
7
L2
6
L3
5
Pgina 78
Ejemplo 18.
Error
11.333
18
Total
1018.000
27
46.000
26
Total corregido
F
6.882
1543.765
.706
2.294
Sig.
.000
.000
.507
.130
12.265
.000
.630
Estadstica Aplicada
Pgina 79
1. Factor_A * Factor_B
Grupos de edad * Lneas de ropa
Factor_A
G1
(I) Factor_B
L1
L2
L3
G2
L1
L2
L3
G3
L1
L2
L3
(J) Factor_B
L2
L3
L1
L3
L1
L2
L2
L3
L1
L3
L1
L2
L2
L3
L1
L3
L1
L2
Diferencia de
medias (I-J)
1.333
2.000
-1.333
.667
-2.000
-.667
.333
-1.667
-.333
-2.000
1.667
2.000
-2.333
1.333
2.333
3.667
-1.333
-3.667
Error
estndar
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
Sig.b
.054
.006
.054
.317
.006
.317
.613
.019
.613
.006
.019
.006
.002
.054
.002
.000
.054
.000
Estadstica Aplicada
Pgina 80
2. Factor_A * Factor_B
Grupos de edad * Lneas de ropa
Factor_B
L1
(I) Factor_A
G1
G2
G3
L2
G1
G2
G3
L3
G1
G2
G3
(J) Factor_A
G2
G3
G1
G3
G1
G2
G2
G3
G1
G3
G1
G2
G2
G3
G1
G3
G1
G2
Diferencia de
medias (I-J)
2.000
1.667
-2.000
-.333
-1.667
.333
1.000
-2.000
-1.000
-3.000
2.000
3.000
-1.667
1.000
1.667
2.667
-1.000
-2.667
Error
estndar
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
Sig.b
.006
.019
.006
.613
.019
.613
.140
.006
.140
.000
.006
.000
.019
.140
.019
.001
.140
.001
Estadstica Aplicada
Pgina 81
b) Existe interaccin entre las lneas de ropa y el grupo de edad? Esto es, alguna lnea de
ropa es preferible por algn grupo de edad ms que otro? Use un =0,01
Estadstica Aplicada
Pgina 82
Ejercicios propuestos 4.
31. En un experimento se compararon tres mtodos de ensear un idioma extranjero para
evaluar la efectividad (cantidad de palabras correctas), se administr una prueba de
vocabulario de 50 palabras a los 15 estudiantes que participaron en el estudio, en grupos
de cinco por cada mtodo y se registraron el nmero de palabras que escriban
correctamente.
Mtodos de ensear
Met 1
Met 2
Met 3
48
40
50
45
39
48
49
41
49
47
31
44
45
34
48
Comparaciones mltiples
Variable dependiente:Cantidad
DMS
(I)Metodo
M1
M2
M3
(J)Metodo
M2
M3
M1
M3
M1
M2
Diferencia de
medias (I-J)
9,80*
-1,00
*
-9,80
*
-10,80
1,00
10,80*
Sig.
,000
,607
,000
Lmite inferior
5,67
-5,13
-13,93
Lmite superior
13,93
3,13
-5,67
1,894
1,894
1,894
,000
,607
,000
-14,93
-3,13
6,67
-6,67
5,13
14,93
Estadstica Aplicada
28
26
23
58
54
28
46
42
45
29
30
38
Pgina 83
Rpta: NO
33. Para determinar la mejor disposicin de los instrumentos sobre el tablero de control de
un aeroplano, se prueban tres distintas disposiciones simulando una situacin de
emergencia y se observa el tiempo de reaccin requerido para corregir la avera. Los
tiempos de reaccin (en dcimas de segundo) de 28 pilotos son los siguientes:
Disposicin 1
14
13
15
11
13
14
10
12
Disposicin 2
10
12
11
12
10
Disposicin 3
11
10
Estadstica Aplicada
Pgina 84
34. Qu tipos de comerciales de televisin captan mejor la atencin de los nios? Para dar
respuesta a esta pregunta, se observ la actitud de 15 nios; 5 nios fueron observados
mientras vean comerciales de juguetes y juegos, 5 mientras vean comerciales sobre
comida y goma de mascar y 5 vean comerciales relacionados con ropa para nios.
Todos los comerciales tenan 60 segundos de duracin. En la siguiente tabla aparecen
los tiempos de atencin a los comerciales para los 15 nios.
TComercial
Juguetes, juegos
Comida, goma de mascar
Ropa
Estadstica Aplicada
Pgina 85
Comparaciones mltiples
Variable dependiente:Tiempo de atencin
DMS
(I)Comercial
Juguetes
(J)Comercial
Comida
Ropa
Juguetes
Ropa
Juguetes
Comida
Comida
Ropa
Diferencia de
medias (I-J)
-8,00
-3,00
8,00
5,00
3,00
-5,00
Sig.
,217
,634
,217
,431
,634
,431
Lmite inferior
-21,37
-16,37
-5,37
-8,37
-10,37
-18,37
Lmite superior
5,37
10,37
21,37
18,37
16,37
8,37
Grande
Nivel bajo
55
60
62
80
98
84
Ubicacin en la estantera
Nivel de las manos
A nivel de la vista
67
76
83
83
74
80
85
92
97
103
90
98
Identifique el modelo y sus componentes, los factores, los niveles del factor y la variable
respuesta. Realice el anlisis de variancia y de ser necesarias las pruebas de comparaciones.
Concluya con un nivel de significacin del 5%.
Estadstica Aplicada
Pgina 86
12
.446
Media
Desviacin
estndar
18
.0000
5.37605
.121
.121
-.077
.121
.200c,d
3298.500
F
13.712
2920.066
47.448
8.951
Sig.
.000
.000
.000
.004
1.605
.241
17
(I)Ubicacin_Estantera (J)Ubicacin_Estantera
Diferencia de
medias (I-J)
-9.5000*
Nivel de las manos
A nivel de la vista
-15.5000*
Nivel de las manos
9.5000*
Nivel bajo
A nivel de la vista
-6.0000
A nivel de la vista
15.5000*
Nivel bajo
Nivel de las manos
6.0000
Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 40.944.
*. La diferencia de medias es significativa en el nivel .05.
DMS
Nivel bajo
Estadstica Aplicada
Error
estndar
3.69434
3.69434
3.69434
3.69434
3.69434
3.69434
Sig.
.024
.001
.024
.130
.001
.130
Intervalo de
confianza al 95%
Lmite
Lmite
inferior
superior
-17.5493 -1.4507
-23.5493 -7.4507
1.4507 17.5493
-14.0493
2.0493
7.4507 23.5493
-2.0493 14.0493
Pgina 87
Ventas
Duncana,b
Ubicacin_Estantera
Nivel bajo
N
6
Subconjunto
1
2
73.1667
82.6667
A nivel de la vista
88.6667
Sig.
1.000
.130
Ejemplo 19.
36. Se ha determinado la vida til de 3 marcas de pilas A 1, A2, A3, clasificadas segn sus
costos 1,6; 2,2 y 2,7. La duracin en horas se muestra en la siguiente tabla:
Costo
(soles)
1,6
2,2
2,7
A1
110
100
95
90
70
85
130
140
120
Marcas de pilas
A2
150
140
160
120
110
125
130
120
140
A3
90
80
95
80
70
95
100
90
105
Identifique el modelo y sus componentes, los factores, los niveles de los factores y la
variable respuesta. Cantidad de tratamientos. Verifique si se cumplen los supuestos del
diseo. Realice el anlisis de variancia y de ser necesarias las pruebas de comparaciones.
Utilice en el anlisis, un nivel de significacin del 5%.
Las salidas asociadas al diseo se muestran a continuacin:
Prueba de igualdad de Levene de varianzas de
errora
Variable dependiente: Y
F
df1
df2
Sig.
.216
8
18
.984
Prueba la hiptesis nula que la varianza de error
de la variable dependiente es igual entre grupos.
a. Diseo : Interceptacin + Factor_A + Factor_B +
Factor_A * Factor_B
Estadstica Aplicada
Pgina 88
16974.074
F
22.931
3864.275
22.429
50.681
9.308
Sig.
.000
.000
.000
.000
.000
26
1. Factor_A * Factor_B
Costo (Soles) * Marca de Pila
Factor_B
A1
A2
A3
Estadstica Aplicada
Diferencia de
medias (I-J)
20.000
-36.667
-20.000
-56.667
36.667
56.667
31.667
20.000
-31.667
-11.667
-20.000
11.667
6.667
-10.000
-6.667
-16.667
10.000
16.667
Error
estndar
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
Sig.b
.016
.000
.016
.000
.000
.000
.001
.016
.001
.137
.016
.137
.385
.199
.385
.039
.199
.039
Pgina 89
Factor_A * Factor_B
Costo (Soles) * Marca de Pila
Estadstica Aplicada
Pgina 90
El anlisis de regresin lineal simple, utiliza la ecuacin de una lnea recta para describir la
relacin funcional entre dos variables cuantitativas (regresin de Y sobre X). La ecuacin de
regresin estimada puede usarse para predecir valores de la variable Y, cuando se conocen
valores de la variable X. El modelo de regresin lineal simple se expresa por:
yi 0 1 xi ei
i 1,2,..., n
Aqu:
yi :
Variable dependiente.
xi :
Por ejemplo, si se desea estudiar la relacin funcional entre los gastos semanales en
publicidad (en $) y las ventas semanales registradas (en $).
Dnde:
Y: Venta semanal (en $)
X: Gasto semanal en publicidad (en $)
yi 0 1 xi ei
La ecuacin de regresin estimada, podra responder las siguientes preguntas:
1. Cul ser el valor de las ventas, por cada dlar que se gaste en la semana en publicidad?
Estadstica Aplicada
Pgina 91
Los errores o residuos tienen distribucin normal. Para realizar la verificacin de este
supuesto se hace uso de la prueba de bondad de ajuste de Kolmogorov Smirnov.
Los errores o residuos tienen media igual a cero y varianza igual a 2. Se obtiene la
grfica del histograma de frecuencias de los residuos en el que se muestra el valor de la
media de los residuos y su varianza.
El diagrama de dispersin
El primer paso en un anlisis de regresin, es construir una grfica de los datos muestrales en
un plano bidimensional y se denomina diagrama de dispersin.
El diagrama de dispersin, permite visualizar el tipo de tendencia (relacin) de la variable Y
con respecto a la variable X. Esta tendencia puede ser lineal o no lineal. En el primer caso, se
ajustar una ecuacin de una lnea recta y en el segundo caso, una curva (exponencial,
potencia, polinmica, logartmica, etc.).
Estadstica Aplicada
Pgina 92
ei2
es:
i 1
( y
yi ) 2
i 1
Los valores de 0 y 1 que minimizan la suma de los cuadrados de las desviaciones, son las
soluciones de las llamadas ecuaciones normales de la recta de mnimos cuadrados:
n
n 0 1 xi
i 1
i 1
n
n
n 2
x
y
i i
0 i
1 xi
i 1
i 1
i 1
yi
Estadstica Aplicada
Pgina 93
(yi y)
se
manera: (yi y) (y i y) (yi y i )
La
distancia
puede
descomponer
de
la
siguiente
i1
( yi y) 2
i1
i y) 2
(y
(y
i )2
y
i1
Estadstica Aplicada
Pgina 94
Sumas de Cuadrados:
Total
Regresin
Error o residual
Grados de
libertad
Regresin
SCR
Residual
SCE
n2
Total
SCT
n1
Estadstica de prueba:
Decisin estadstica:
FC
Cuadrado medio
CMR=SCR
F calculado
Fc = CMR/CME
CME=SCE/(n-2)
CMR
CME
Estadstica Aplicada
Pgina 95
r2
SCR
SCT
siendo: 0 r 2 1;
(1 r 2 ) 1
SCR
SCT
SCE
CME
n2
Se
H 0 : 1 k
H 0 : 1 k
H1 : 1 k
H1 : 1 k
H1 : 1 k
1 1
~ t ( n2)
S b1
y 0 t (
/ 2,
n2) Se
1 x x
y 0 t ( / 2, n2) Se 1 0
n
S xx
Dnde:
0 0 1 x 0 ;
y
S xx
SCR
2
1
Estadstica Aplicada
Pgina 96
Ejemplo 20.
Un comerciante al menudeo, lleva a cabo un estudio para determinar una ecuacin que estime
sus ventas semanales en funcin de los gastos semanales de publicidad con el propsito de
predecir sus ventas para algn gasto en particular. Selecciona al azar 12 semanas y registran
los siguientes datos:
Gastos de publicidad ($)
Ventas ($)
40
500
20
400
25
395
20
365
30
475
50
510
40
490
20
420
50
560
40
525
25
420
50
525
Ajuste el conjunto de datos a un modelo (ecuacin) de regresin lineal simple
X:
Gasto semanal en publicidad (en $)
Y:
Venta semanal (en $)
1. Interprete el diagrama de dispersin.
Se puede observar que podra existir una relacin
lineal entre gasto en publicidad y ventas.
Pgina 97
En la grfica se puede
observar que la nube de
puntos se aproxima a la
recta diagonal, por lo tanto
se puede afirmar que los
residuos tienen distribucin
normal
1,961
Estadstica Aplicada
Pgina 98
H1 : 1 0
Como Fc 64,83 F0,05;1, 10 4,96
Se Rechaza Ho.
Se rechaza Ho.
Conclusin. Con un nivel de significacin de 0,05, se puede afirmar que existe relacin
lineal entre el gasto semanal en publicidad y las ventas. Modelo Lineal Vlido.
Tambin se puede usar la prueba T para validar el modelo
Prueba T
Formulacin de hiptesis:
H 0 : 1 0
H1 : 1 0
Prueba estadstica.
t c
T 0,025; 10 = - 2,228
1 1 4,784 0
8,051
S b1
0,594
Estadstica Aplicada
Pgina 99
La conclusin es la misma.
y i 4,784 301,954xi
1 301,954: Por cada dlar adicional que se asigne al gasto semanal en publicidad, la
venta se incrementa en $ 4,78.
4.
5. Se puede asegurar a un nivel de significacin del 5%, que para cada incremento de un
dlar del gasto semanal en publicidad, las ventas semanales se incrementan en ms de
$4,0.
Ho: 1 < 4
H1: 1 > 4
= 0,05
1
t 1
~ t ( n2) ;
S b1
t c
4,784
4
Estadstica Aplicada
Pgina 100
Conclusin. NO se puede asegurar, a un nivel de significacin del 5%, que para cada
incremento de un dlar del gasto semanal en publicidad las ventas se incrementan en ms
de $4,0.
6. Estime las Ventas semanales con un nivel de confianza del 95%, en una semana cuyo
gasto fue de 40 dlares.
1 x0 x
n
S xx
y 0 t (
/ 2,
1
n2 ) * Se *
donde:
y 0 301,954 4,78440 493,314
S xx
SCR 37576,407
1641,84785
4,7842
12
493,314 2,228x24,076 1
493,314 + 56,3632 ; luego:
1 40 34,1667
12
1641,84785
Interpretacin. Con un nivel de confianza del 95%, se puede decir que las Ventas en una
semana en la que se destina un gasto en publicidad de 40 dlares, se encuentra entre
$436,95 y $549,68.
7. Estime las Ventas promedio con un nivel de confianza del 95%, en ciertas semanas cuyo
gasto semanal fue de 40 dlares.
1 x0 x
Se usar: y 0 t ( / 2, n2) Se
n
S xx
37576,407
4,7842
1641,84785
12
1641,84785
493,314 + 17,30366,
Interpretacin. Con un nivel de confianza del 95%, se puede decir que las Ventas promedio
en ciertas semanas en la que se destina un gasto en publicidad de 40 dlares, se encuentra
entre $476,01 y $510,62.
Estadstica Aplicada
Pgina 101
Ejercicio 24.
Una entidad estatal que se encarga de evaluar proyectos de construccin de carreteras, desea
construir un modelo lineal simple que estime el costo de la oferta ganadora de un proyecto de
carretera en funcin del nmero de licitaciones. La entidad est interesada predecir, con el
modelo hallado, el costo que podra tener la oferta ganadora si se presenta una cantidad
determinada de postores a la licitacin. Para el estudio se extrae una muestra de 15 proyectos,
cuyos datos se presentan en el siguiente cuadro.
Proyectos
Nmero
licitaciones
de
10
11
12
13
14
15
10
10
11
8,0
9,7
7,8
7,7
5,5
8,3
5,5
10,3
8,0
8,8
9,4
8,6
8,1
7,8
Oferta ganadora
5,1
(millones $)
Suponiendo que se cumplen los supuestos, ajuste el conjunto de datos a una regresin lineal
simple. A continuacin se presenta las salidas del SPSS.
X:
Y:
Nmero de licitaciones
Oferta ganadora (millones $)
Estadstica Aplicada
Pgina 102
1.
2.
3.
Estadstica Aplicada
Pgina 103
4.
5.
Ejercicio 25.
La empresa Grupo-XYZ, produce partes para camin que utilizan en los remolques. La
gerencia de produccin desea desarrollar un modelo de regresin que le permita predecir los
costos de produccin (miles de dlares) en funcin de las unidades producidas (en cientos).
Los datos se muestran en la siguiente tabla.
Estadstica Aplicada
Unidades producidas
(cientos)
Costos
(miles $)
12,3
6,2
8,3
5,3
Pgina 104
6,5
4,1
4,8
4,4
6,6
5,2
4,6
4,8
9,6
5,9
6,5
4,2
Estadstica Aplicada
Pgina 105
y i
Estadstica Aplicada
Pgina 106
6. Se puede asegurar a un nivel de significacin del 5%, que por cada incremento de un
ciento de unidades producidas, el costo de produccin se incrementa en ms de $ 213.
Pgina 107
dentro del intervalo de -1 y 1. Esta medida no es afectada por las unidades de medicin de las
variables.
Si 0 entonces indicar que no existe correlacin o asociacin entre las variables, mientras
que cuando se acerca a 1 o a -1 indicar que existe una asociacin positiva o negativa fuerte, y
cuando es exactamente 1 -1 la asociacin entre las variables es perfecta.
H1 : 0
r n2
1 r2
~ t ( n 2)
hiptesis ms generales:
H1 : 0
Estadstica Aplicada
(1 r)(1 0 )
n 3
ln
~ N(0,1)
2
(1 r)(1 0 )
Pgina 108
Ejemplo 21.
Utilizando los datos de las ventas semanales y el gasto en publicidad.
1. Halle e interprete el coeficiente de correlacin simple.
r 0,866 0,931
Interpretacin. Existe una correlacin positiva entre el gasto semanal en publicidad y las
ventas semanales.
2. Con un nivel de significacin del 5%, se puede afirmar que el gasto semanal en publicidad
y las ventas estn correlacionadas.
H0 : 0
H1 : 0
El estadstico de prueba es: t
r n 2
1 r2
t c
0,931 12 2
1 0,9312
8,066
n 3 (1 r )(1 0 )
Z
ln
~ N (0,1)
2
(1 r)(1 0 )
12 3 (1 0,931)(1 0,98)
ln
Zc
1,8951
2
(1 0,931)(1 0,98)
Rechazamos Ho.
Pgina 109
Ejercicio 26.
Una empresa en consultora contable, desea desarrollar un modelo que le permita predecir
el costo de la auditora en funcin de la cantidad de documentos revisados. Para este fin
extrae una muestra de 12 auditoras, registrando el costo de la auditora (miles $) y el
nmero de documentos revisados (miles documentos).
Cantidad de
documentos (miles )
28
17
32
48
14
19
24
34
22
20
46
Costo de la auditora
(miles $)
50
35
65
98
12
24
38
45
65
45
36
85
A continuacin se muestra las salidas del anlisis de regresin lineal simple con el SPSS.
Estadstica Aplicada
Pgina 110
b) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre el nmero de
documentos revisados y el costo.
c) Se puede afirmar con un nivel de confianza del 2%, que por cada mil documentos que
se revisen el costo de la auditora aumenta en ms de 1700 dlares.
d) Estime con un nivel de confianza del 95%, el costo promedio de la auditora cuando se
revisen 25,000 documentos.
Estadstica Aplicada
Pgina 111
Ejercicios propuestos 5.
37. Las materias primas empleadas en la produccin de una fibra sinttica son almacenadas
en un lugar donde no se tiene control sobre la humedad. Las mediciones de la humedad
relativa en el lugar de almacenamiento (X) y la humedad de una muestra de las materias
primas (Y) (ambas en porcentaje) para 12 das se presenta en la siguiente tabla.
Humedad en el
almacenamiento (%)
42
35
50
43
48
62
31
36
44
39
55
48
Humedad en la materia
prima (%)
12
14
11
16
12
10
13
11
A continuacin se muestra las salidas del anlisis de regresin lineal simple con el SPSS.
Estadstica Aplicada
Pgina 112
Activo
total
(millones $)
Rentabilidad
(%)
22
18
14
26
10
16
19
20
29,3
17,6
16,0
9,5
22,6
12,4
18,5
21,4
18,2
12,5
Estadstica Aplicada
Pgina 113
Pgina 114
Ingreso (miles de $)
6,9
11,3
12,8
14,4
14,5
19,5
19,2
16,9
24,5
Ahorro (ciento de $)
3,4
12,1
9,6
15,6
17,8
12,3
13,4
17,8
a.
b.
c.
d.
e.
Pgina 115
Modelo
cuadrtico:
X Y y 0 1 x 2 x 2
X Y y 0e
1 x
X Y y 0 x
Modelo
exponencial:
Modelo
potencia:
Funcin exponencial
Si un conjunto de datos apareados consiste en n puntos (x i, yi) se endereza cuando se grfica
lnyi versus xi, esto indica que la media de la distribucin de y est dado por 0 e1 x . Si se toma
logaritmos a la ecuacin y 0 e1 x se convierte en:
ln y ln 0 1 x y * 0* 1 x
Las transformaciones pueden mejorar el ajuste y la capacidad de prediccin de la ecuacin de
regresin. En el siguiente cuadro se muestran las transformaciones para linealizar los modelos
no lineales.
Exponencial
y 0 e1 x
Transformacin
apropiada
y* Ln y
Potencia
y 0 x 1
y* Ln y
x* Ln x
Modelos no lineales
Cuadrtico
Funcin
linealizada
y* ln 0 1x
y* Ln 0 1 x *
X Y y 0 1 x 2 x 2
Estadstica Aplicada
Pgina 116
Validacin de los modelos. Para validar los no lineales se deben probar la significacin del
correspondiente coeficiente de regresin, se tiene el siguiente cuadro:
Modelo
Ecuacin Estimada
Cuadrtico
y 0 1 x 2 x2
Modelo Linealizado
Hiptesis Formuladas
H 0 : 0
H1: 0
2
y 0 e 1 x
Exponencial
y 0 x 1
Potencia
LnY Ln 0 1 x
LnY Ln 0 1 Lnx
H 0 :
H1:
H 0 :
H 1:
0
0
0
0
donde:
S e CME
S xx
CM Re g
b12
Luego el intervalo de confianza para el valor medio y valor individual tanto para el modelo
exponencial o potencial es:
Valor medio:
Valor individual:
Ejemplo 22.
Los siguientes datos se refieren al porcentaje de neumticos radiales de alto rendimiento
hechos por cierto fabricante que son usables (y) despus de haber sido empleados el nmero
de millas (x).
Millas conducidas (en miles) x
1
2
5
Estadstica Aplicada
Porcentaje usable y
85,0
91,7
81,3
Lny
4,587
4,519
4,398
Pgina 117
10
20
30
40
50,0
36,4
28,0
15,0
4,159
3,595
3,484
2,839
Coeficientes no estandarizados
B
Error estndar
-,441
,089
117,891
25,874
Coeficientes
estandarizados
Beta
-,911
t
-4,955
4,556
Sig.
,004
,006
1.
Exponencial-Cuadrtico-Lineal-Potencia
Paso 2: Validar el modelo con prioridad uno, se debe rechazar la hiptesis nula en la prueba
para que el modelo sea vlido, si no se rechaza la hiptesis nula, el modelo no es vlido y se
validar el siguiente modelo y as sucesivamente.
Usando = 0,05, en nuestro caso validar el modelo exponencial por tener el valor de R
cuadrado ms alto:
Estadstica Aplicada
Pgina 118
11
0,044
14,667
0,003
S b1
2. Determine la ecuacin muestral del modelo de regresin que nos permita realizar la
estimacin de la variable dependiente.
0,044 x
Ecuacin muestral del Modelo: y 92,44 e
X 0 10
Y0 92,44 e 0, 044(10) 59,53473 ln(59,53473) 4,08656
t0.025;5 2,57058;
Sxx
Se 0,014 0,11832;
2,671
1379,64876
0,0442
IC (
Y .X
) 4,08656
IC ( Y . X ) 4,08656
X 15,4286
1 (10 15,4286)2
2,57058 0,11832
7
1379,64876
0,12326
52,63097 Y . X 67,34407
Ejemplo 23.
Se desea determinar una ecuacin de regresin lineal que estime el volumen de ventas de
medicamentos elaborados con receta en funcin del porcentaje de ingredientes utilizados para
su elaboracin. Se tiene datos de una muestra de 12 farmacias mostrados en el siguiente
cuadro:
Volumen de ventas
(miles $)
% de ingredientes
32
30
800
36
900
40
100
50
300
600
200
400
12
10
26
14
26
16
20
18
23
25
22
24
Estadstica Aplicada
Pgina 119
X:
Y:
% de ingredientes;
Estimaciones de parmetro
R cuadrado
df1
df2
Sig.
Constante
b1
,693
22,536
10
,001
-635,455
47,091
Cuadrtico
,941
71,383
,000
1442,818
-199,102
Potencia
,837
51,228
10
,000
,002
3,797
Exponencial
,916
109,658
10
,000
1,609
,228
b2
6,651
R
,970
Error estndar de
la estimacin
85,269
Regresin
Residuo
Total
Suma de
cuadrados
1038037,034
gl
2
Media
cuadrtica
519018,517
65437,632
7270,848
1103474,667
11
F
71,383
Sig.
,000
Porcentaje de ingredientes
Porcentaje de ingredientes ** 2
(Constante)
Coeficientes no estandarizados
B
Error estndar
-199,102
40,387
6,651
1,084
1442,818
351,421
1. Interprete el diagrama de
dispersin.
Coeficientes
estandarizados
Beta
-3,519
4,379
t
-4,930
6,136
4,106
Sig.
,001
,000
,003
1000
800
600
400
200
6,136
Sb 2
1,084
Sig= 0,000 < = 0,05. Entonces se Rechaza
Estadstica Inferencial
10
15
20
25
30
Porcentaje de ingredientes
Pgina 120
Poblacin (miles
de habitantes)
3,3
2,0
3,5
3,5
2,9
2,3
3,4
2,5
1,8
3,6
3,3
X: Poblacin (miles),
Y:
A continuacin se muestra la salida con el SPSS
Estimaciones de parmetro
Ecuacin
R cuadrado
df1
df2
Sig.
Constante
b1
b2
Lineal
,795
35,009
,000
-194,813
89,957
Cuadrtico
,965
111,010
,000
513,562
-458,337
Potencia
,999
6940,895
,000
,001
9,530
Exponencial
,994
1378,150
,000
,001
3,582
100,093
ANOVA
Regresin
Residuo
Total
Suma de cuadrados
gl
Media cuadrtica
Sig.
55,682
55,682
6940,895
,000
,072
,008
55,754
10
Coeficientes no estandarizados
Estadstica Aplicada
Coeficientes
estandarizados
Sig.
Pgina 121
B
ln(Poblacin (miles de habitantes)
Error estndar
9,530
,114
,001
,000
(Constante)
Beta
,999
83,312
,000
8,161
,000
y 0 x 1
Lny 0 1Lnx
y 0 1x
H 0 : 1 0
H1 : 1 0
tc
11
Sb1
9,530
83,596
0,114
Estadstica Aplicada
Pgina 122
3. Con un nivel de confianza del 95% construya un intervalo para el valor del impuesto a
recaudar para una poblacin de tres mil habitantes.
X0 3
ln(3) 1,09861
9)
2,26216;
ln(35,23429) 3,56209
Se 0,008 0,08944;
55,682
0,61309
9,5302
IC (Y ) 3,56209
ln X 1,04481
2,26216 0,08944 1
1
(1,09861 1,04481) 2
11
0,61309
e 2,51537 Y e 4,60881
12,37119 Y 100,36464
Existe un 95% de confianza de que el intervalo [12,37119; 100,36464] contenga el valor del
impuesto a recaudar en una poblacin de tres mil habitantes.
Ejercicio 27.
El gerente de una distribuidora de gaseosas desea mejorar su sistema de reparto a un sector de
minoristas, El gerente est interesado en predecir el tiempo que demora un reparto en funcin del
nmero de cajas a repartir, Para tal efecto selecciona una muestra de 10 pedidos, mostrando los
datos en el siguiente cuadro.
Nmero de
cajas (decenas)
5
8
10
15
16
12
4
24
14
20
Tiempo de reparto
(minutos)
12
16
20
22
35
28
10
55
30
50
Estimaciones de parmetro
R cuadrado
df1
df2
Sig.
Constante
b1
Lineal
,919
90,751
,000
-1,616
2,298
Cuadrtico
,935
50,600
,000
5,396
1,001
Potencia
,926
99,696
,000
2,486
,942
Exponencial
,931
108,095
,000
8,033
b2
,048
,086
Estadstica Aplicada
Pgina 123
Lineal
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,959
,919
,909
4,600
gl
Media cuadrtica
Sig.
Regresin
1920,317
1920,317
90,751
,000
Residuo
169,283
21,160
Total
2089,600
Coeficientes
Coeficientes
Coeficientes no estandarizados
estandarizados
Error estndar
Beta
Sig.
2,298
,241
,959
9,526
,000
(Constante)
-1,616
3,413
-,473
,649
Cuadrtico
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,967
,935
,917
4,395
Media
cuadrados
gl
cuadrtica
Sig.
Regresin
1954,413
977,206
50,600
,000
Residuo
135,187
19,312
Total
2089,600
Coeficientes
estandarizados
estandarizados
Error estndar
Beta
Sig.
1,001
1,003
,417
,997
,352
,048
,036
,556
1,329
,226
(Constante)
5,396
6,204
,870
,413
Estadstica Aplicada
Pgina 124
2015-2
Potencia
Resumen del modelo
R cuadrado
,962
R cuadrado
Error estndar
ajustado
de la estimacin
,926
,916
,164
Media
cuadrados
Regresin
cuadrtica
2,679
2,679
,215
,027
2,894
Residuo
Total
gl
Sig.
99,696
,000
estandarizados
Error estndar
Beta
Sig.
ln(Nmero de cajas
,942
,094
2,486
,581
,962
9,985
,000
4,280
,003
(decenas)
(Constante)
Exponencial
Resumen del modelo
R cuadrado
Error estndar de la
R cuadrado
ajustado
estimacin
,965
,931
,922
,158
gl
Media cuadrtica
Sig.
Regresin
2,694
2,694
108,095
,000
Residuo
,199
,025
Total
2,894
Error estndar
,086
,008
8,033
,941
estandarizados
Beta
t
,965
Sig.
10,397
,000
8,536
,000
Estadstica Aplicada
Pgina 125
2015-2
1. Apoye al gerente a decidir cul sera el mejor modelo de regresin que se ajusta a los
datos, valide el mejor modelo y presente la ecuacin de regresin del modelo vlido,
Use un = 0,05.
promedio que demora un reparto cuando el pedido tiene 120 cajas (usar cuatro
decimales).
Estadstica Aplicada
Pgina 126
2015-2
Ejercicio 28.
El gerente de una empresa especializada en ofrecer consultora en sistemas contables, desea
desarrollar un modelo que le permita predecir el costo de la auditora en funcin del nmero
de documentos revisados. Para este fin extrae una muestra de ocho auditoras, registrando
el costo de la auditora (miles de nuevos soles) y el nmero de documentos revisados (miles
de documentos), Los datos se presentan en el siguiente cuadro.
Nmero de documentos
(miles de documentos)
Costo de la auditora (miles
de nuevos soles)
12
13
28
25
10
18
22
30
24
Estimaciones de parmetro
R cuadrado
df1
df2
Sig.
Constante
b1
Lineal
,899
53,468
,000
5,046
,884
Cuadrtico
,937
36,888
,001
,551
1,799
Potencia
,927
76,195
,000
2,855
,703
Exponencial
,825
28,244
,002
6,822
,057
b2
-,029
Lineal
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,948
,899
,882
3,038
gl
Media cuadrtica
Sig.
Regresin
493,497
493,497
53,468
,000
Residuo
55,378
9,230
Total
548,875
Coeficientes
Coeficientes no estandarizados
B
Nmero de documentos (miles)
(Constante)
Estadstica Aplicada
Error estndar
,884
,121
5,046
1,829
Coeficientes estandarizados
Beta
,948
Sig.
7,312
,000
2,758
,033
Pgina 127
2015-2
Cuadrtico
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,968
,937
,911
2,640
gl
Media cuadrtica
Sig.
Regresin
514,037
257,019
36,888
,001
Residuo
34,838
6,968
Total
548,875
estandarizados
Error estndar
Beta
Sig.
1,799
,543
1,930
3,312
,021
-,029
,017
-1,000
-1,717
,147
(Constante)
,551
3,063
,180
,864
Potencia
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,963
,927
,915
,173
gl
Media cuadrtica
Sig.
Regresin
2,294
2,294
76,195
,000
Residuo
,181
,030
Total
2,474
Coeficientes
Coeficientes
Coeficientes no estandarizados
estandarizados
Error estndar
Beta
Sig.
,703
,081
,963
8,729
,000
(Constante)
2,855
,542
5,270
,002
Estadstica Aplicada
Pgina 128
Exponencial
Resumen del modelo
R
,908
R cuadrado
R cuadrado ajustado
,825
,796
,269
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
2,041
2,041
28,244
,002
Residuo
,434
,072
Total
2,474
Coeficientes
Coeficientes
Coeficientes no estandarizados
estandarizados
Error estndar
Beta
Sig.
,057
,011
,908
5,315
,002
(Constante)
6,822
1,104
6,178
,001
1. Apoye al gerente a decidir cul sera el mejor modelo de regresin que se ajusta a los
datos. Valide el mejor modelo y presente la ecuacin de regresin del modelo vlido,
Use un = 0,05.
Estadstica Aplicada
Pgina 129
Estadstica Aplicada
Pgina 130
Ejercicios propuestos 6.
40. Un economista del Departamento de Recursos Humanos del Estado de Florida est preparando
un estudio sobre el comportamiento del consumidor. l recolect los datos que aparecen en
miles de dlares para construir una ecuacin que modele el consumo en funcin del ingreso del
consumidor.
Consumidor
Ingreso
Consumo
1
24,3
16,2
2
12,5
8,5
3
31,2
15,0
4
28,0
17,0
5
35,1
24,2
6
10,5
11,2
7
23,2
15,0
8
10,0
7,1
9
8,5
3,5
10
15,9
11,5
11
14,7
10,7
12
15,0
9,2
Estimaciones de parmetro
R cuadrado
df1
df2
Sig.
Constante
b1
Lineal
,845
54,408
10
,000
1,778
,558
Cuadrtico
,845
24,484
,000
1,815
,554
Potencia
,789
37,494
10
,000
,789
,933
Exponencial
,721
25,904
10
,000
4,548
,047
b2
9,928E-5
Lineal
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,919
,845
,829
2,251
Estadstica Aplicada
Pgina 131
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
275,590
275,590
54,408
,000
Residuo
50,652
10
5,065
Total
326,242
11
estandarizados
Error estndar
Beta
Sig.
Ingreso
,558
,076
,919
7,376
,000
(Constante)
1,778
1,583
1,123
,288
Cuadrtico
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,919
,845
,810
2,372
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
275,591
137,795
24,484
,000
Residuo
50,652
5,628
Total
326,242
11
estandarizados
Error estndar
Beta
Sig.
,554
,505
,912
1,097
,301
Ingreso ** 2
9,928E-5
,012
,007
,008
,993
(Constante)
1,815
4,677
,388
,707
Ingreso
Potencia
Resumen del modelo
Error estndar de la
R
R cuadrado
R cuadrado ajustado
estimacin
,889
,789
,768
,241
Estadstica Aplicada
Pgina 132
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
2,173
2,173
37,494
,000
Residuo
,580
10
,058
Total
2,753
11
estandarizados
Error estndar
Beta
Sig.
ln(Ingreso)
,933
,152
,889
6,123
,000
(Constante)
,789
,347
2,277
,046
Exponencial
Resumen del modelo
R
,849
R cuadrado
R cuadrado ajustado
,721
,694
,277
gl
Media cuadrtica
Sig.
Regresin
1,986
1,986
25,904
,000
Residuo
,767
10
,077
Total
2,753
11
estandarizados
Error estndar
,047
,009
4,548
,886
Beta
t
,849
Sig.
5,090
,000
5,135
,000
41. El nmero de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los
primeros seis meses del ao fueron los siguientes:
Nmero de vendedores
Ingreso por ventas
Estadstica Aplicada
14
17,5
22
18,5
19
18,0
35
26,0
30
25,0
44
29,5
Pgina 133
a. Halle la ecuacin de regresin de mnimos cuadrados para pronosticar los ingresos, Use un
nivel de significacin del 2,5%.
b. Estime, con un nivel de confianza del 95%, el ingreso por ventas si el nmero de
vendedores es de 25.
Resumen de modelo y estimaciones de parmetro
Variable dependiente: Ingreso por ventas
Resumen del modelo
Ecuacin
Estimaciones de parmetro
R cuadrado
df1
df2
Sig.
Constante
b1
Lineal
,953
81,684
,001
10,251
,445
Cuadrtico
,953
30,657
,010
10,480
,427
Potencia
,920
45,694
,002
4,206
,511
Exponencial
,944
67,041
,001
12,833
,020
b2
,000
Lineal
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,976
,953
,942
1,226
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
122,700
122,700
81,684
,001
Residuo
6,008
1,502
Total
128,708
Error estndar
Nmero de vendedores
(Constante)
estandarizados
,445
,049
10,251
1,436
Beta
t
,976
Sig.
9,038
,001
7,138
,002
Cuadrtico
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,976
,953
,922
1,415
gl
Media cuadrtica
Sig.
Regresin
122,705
61,352
30,657
,010
Residuo
6,004
2,001
Total
128,708
Estadstica Aplicada
Pgina 134
Coeficientes
Coeficientes
Coeficientes no estandarizados
estandarizados
Error estndar
Beta
Sig.
Nmero de vendedores
,427
,380
,937
1,124
,343
Nmero de vendedores ** 2
,000
,006
,040
,048
,965
10,480
5,032
2,083
,129
Sig.
(Constante)
Potencia
Resumen del modelo
R cuadrado
R
R cuadrado
,959
,920
,899
,071
Media cuadrtica
Sig.
45,694
,002
cuadrados
Regresin
,233
,233
Residuo
,020
,005
,253
Total
estandarizados
Error estndar
,511
,076
4,206
1,035
Beta
,959
6,760
,002
4,063
,015
Exponencial
Resumen del modelo
R
R cuadrado
R cuadrado ajustado
,971
,944
,930
,060
ANOVA
Suma de cuadrados
gl
Media cuadrtica
Sig.
Regresin
,239
,239
67,041
,001
Residuo
,014
,004
Total
,253
Estadstica Aplicada
Pgina 135
Coeficientes
Coeficientes
Coeficientes no estandarizados
Nmero de vendedores
(Constante)
estandarizados
Error estndar
Beta
,020
,002
,971
12,833
,897
Sig.
8,188
,001
14,303
,000
42. En la siguiente tabla se muestra las ganancias que obtuvo la empresa DIGESI en los ltimos
11 meses as como la respectiva inversin en publicidad. El gerente de Marketing contrata a un
estudiante de la UPC para que determine el mejor modelo de regresin no lineal entre
publicidad y ganancia.
Mes
10
11
12,00
10,00
8,00
7,00
11,00
7,50
10,50
11,20
9,00
9,50
8,90
100,00
78,88
47,00
37,48
96,20
36,00
88,15
100,35
63,52
70,00
64,07
Ecuacin
gl1
Sig.
Constante
b1
Lineal
,955
345,274
,000
-68,896
14,718
Cuadrtico
,978
174,373
,000
-118,074
25,406
Potencia
,966
258,662
,000
,565
2,133
Exponencial
,947
159,279
,000
7,672
,228
b2
-,565
Lineal
Resumen del modelo
Error tpico de la
R
R cuadrado
,977
estimacin
R cuadrado corregida
,955
,952
4,019
ANOVA
Regresin
Residual
Total
Suma de
cuadrados
5577,814
145,393
5723,207
Gl
1
9
10
Media
cuadrtica
5577,814
16,155
F
345,274
Sig,
,000
Coeficientes
publicidad
(Constante)
Coeficientes no estandarizados
B
Error tpico
14,718
,792
-68,896
7,629
Estadstica Aplicada
Coeficientes estandarizados
Beta
,987
t
18,582
-9,031
Sig,
,000
,000
Pgina 136
Cuadrtico
R
,989
Regresin
Residual
Total
Gl
2
8
10
Media
cuadrtica
2797,432
16,043
F
174,373
Sig,
,000
Coeficientes
publicidad
publicidad ** 2
(Constante)
Coeficientes
Coeficientes no estandarizados estandarizados
B
Error tpico
Beta
25,406
10,397
1,704
-,565
,548
-,719
-118,074
48,305
t
2,444
-1,031
-2,444
Sig,
,040
,333
,040
Potencia
R
,983
Error tpico de
la estimacin
,073
ANOVA
Suma de
cuadrados
1,365
,047
1,412
Regresin
Residual
Total
Gl
1
9
10
Media
cuadrtica
1,365
,005
F
258,662
Sig,
,000
Coeficientes
ln(publicidad)
(Constante)
Coeficientes
Coeficientes no estandarizados
estandarizados
Beta
B
Error tpico
2,133
,133
,983
,565
,168
t
16,083
3,359
Sig,
,000
,008
Exponencial
R
,973
Error tpico de
la estimacin
,092
ANOVA
Suma de
Media
cuadrados
gl
cuadrtica
Regresin
1,337
1
1,337
Residual
,076
9
,008
Total
1,412
10
La variable independiente es publicidad,
Estadstica Aplicada
F
159,279
Sig,
,000
Pgina 137
Coeficientes
Coeficientes
estandarizados
Coeficientes no estandarizados
Publicidad
(Constante)
B
,228
7,672
Error tpico
,018
1,334
t
12,621
5,751
Beta
,973
Sig,
,000
,000
a. Realice los pasos adecuados para validar y establecer el modelo adecuado. Escriba el modelo
elegido y valdelo. Asuma que los supuestos del modelo se cumplen y use un = 5%.
b. Estime con un nivel de confianza del 95% la ganancia promedio si el prximo mes se quiere
invertir en publicidad 11 500 soles.
43. El Sr, Contreras es el responsable de la calidad de los productos elaborados por Juice Light
motivo por el cual desea establecer la relacin que existe entre la ventas de promociones de
Juice Light y el nmero de ofertas.
El Sr. Contreras recoge los siguientes datos y se le pide que analice lo siguiente:
Lote
1
2
3
4
5
6
7
R cuadrado
,930
F
66,237
Cuadrtico
,976
Potencia
Exponencial
gl1
Sig,
,000
Constante
42,862
b1
-,906
81,790
,001
57,338
-2,221
,847
27,781
,003
5339,117
-1,992
,939
76,382
,000
104,652
-,084
b2
,022
Lineal
Estadstica Aplicada
Pgina 138
Cuadrtico
Potencia
Exponencial
a.
Encuentre el mejor modelo vlido que estime el nmero de ofertas en funcin de las
ventas realizadas por las promociones. Use un nivel de confianza del 4%, Justifique su
respuesta mostrando todo el procedimiento.
b. Con el modelo validado, calcule un intervalo de confianza del 90% para el pronstico del
nmero de ofertas promedio con una venta de 40 mil dlares.
Estadstica Aplicada
Pgina 139
Y 0 1 x1 2 x2 3 x3 ... k xk
Aqu:
Y: variable respuesta que se quiere predecir
0, 1,..., k : son las constantes (parmetros poblacionales)
x1, x2, ... , xk: son variables predictoras independientes que se miden sin error.
: es un error aleatorio para cualquier conjunto dado de valores de x1, x2,... , xk.
Coeficiente de regresin.
Los valores 0 , 1 , 2 ,..., k se conocen como coeficientes de regresin estimados.
Un coeficiente de regresin estimado especfico mide el cambio promedio en la variable
dependiente debido a un incremento de una unidad en la variable predictora relevante,
manteniendo constantes las otras variables de prediccin.
SCE
CME
n p
Estadstica Aplicada
Pgina 140
Un valor de r2 cercano a uno significa que la ecuacin es muy exacta porque explica una
gran porcin de la variabilidad de y. Se define como: r 2 SSR
SST
n p
Anlisis de la Multicolinealidad
Multicolinealidad
Cuando existe multicolinealidad es difcil distinguir que cantidad del efecto observado se
debe a una variable de prediccin individual. En otras palabras, si dos variables estn
altamente correlacionadas, proporcionan casi la misma informacin en el pronstico.
Cuando dos variables tienen una alta correlacin, los coeficientes 0 , 1 , 2 ,..., k estimadores
de 0 , 1 , 2 ,... k no son confiables. La estimacin k de k puede no ser siquiera cercana al
valor de su correspondiente parmetro y en casos extremos puede incluso ser negativo cuando
debiera ser positivo.
Regla prctica para seleccionar las variables predictoras en regresin mltiple
La correlacin en valor absoluto entre dos variables predictoras debe ser menor
a la
correlacin en valor absoluto de la variable dependiente con cada una estas variables
predictoras.
Esto es,
rX Y
i
Si : rX i X j
No existe multicolinealidad entre X i y X j
rX jY
Estadstica Aplicada
Pgina 141
Para cualquier otro caso hay multicolinealidad entre las dos variables predictoras.
Cuando existe multicolinealidad entre dos variables estas no deben ir juntas en el modelo
Paso 2: Enumerar los posibles modelos donde no exista multicolinealidad y darle un ranking
de prioridad segn el R2 corregido ms alto.
Paso 3: Validar el modelo con prioridad uno. Si este no es vlido pasar al siguiente modelo
con la segunda prioridad, y as sucesivamente.
Para que el modelo sea vlido se debe platear las pruebas individuales para cada coeficiente y
deben rechazarse en todas.
H0 : i 0
H1 : i 0
Paso 4: Escribir el modelo y realizar el pronstico
Ejemplo 25.
Estadstica Aplicada
Pgina 142
Los directores del Banco Enigma S.A. han estado buscando los factores que influyen en la
deuda mensual en tarjetas de crdito (en decenas de dlares) que tienen sus clientes (Y). La
administracin sospecha que los siguientes son los factores principales: el sueldo mensual
(cientos de dlares), el pago por concepto de arbitrios (en decenas de dlares), y el nmero
promedio de cuotas con las que financiaron sus compras el ao pasado. Se ha recogido los
siguientes datos correspondientes a siete clientes:
X1: Sueldo
mensual (cientos
de dlares)
5,40
4,70
5,00
3,00
4,30
5,50
7,00
X3: Nmero
promedio de
cuotas
6,30
4,90
5,80
6,90
6,60
5,90
6,00
2,90
5,30
4,00
4,80
4,20
2,90
2,90
Modelo
1
(Constante)
X1
X2
Y
1,000
-,802
,227
,777
de Y
X1
X2
X3
X1
-,802
1,000
-,735
-,383
Coeficientesa
Coeficientes no
estandarizados
B
Error tp.
8,717
,813
-,632
-,447
,089
,110
X2
,227
-,735
1,000
-,197
Coeficientes
tipificados
Beta
-1,383
-,790
X3
,777
-,383
-,197
1,000
t
10,723
Sig.
,000
-7,095
-4,051
,002
,015
Solucin
Paso 1: Anlisis de Multicolinealidad
Estadstica Aplicada
Pgina 143
Variables
Correlaciones
Parciales entre las
Variables
Independientes
X1 Vs. X2
rX 1, X 2 0, 735
X1 Vs. X3
rX 1, X 3 0, 383
X2 Vs. X3
rX 2, X 3 0,197
Correlaciones Parciales
con la Variable
Dependiente
rY , X 1 0, 802
rY , X 2 0, 227
rY , X 1 0, 802
rY , X 3 0, 777
rY , X 2 0, 227
rY , X 3 0, 777
Anlisis
Si existe
multicolinealidad
No existe
multicolinealidad
No existe
multicolinealidad
Conclusin: Como |rYX2| < | r X1 X2| existe multicolinealidad entre las variables X1 y X2 y
esto significa que las variables X1 y X2 no pueden estar juntas en el modelo. Entonces los
posibles modelos son los que se presentan a continuacin:
Estadstica Aplicada
Pgina 144
Modelo
R2 Corregido
Y Vs. X1,X3
0,854
Y Vs. X2, X3
0,632
Y Vs. X1
0,572
Y Vs. X3
0.525
Y Vs. X2
-0.138
Ho : 3 0
H1 : 1 0
H1 : 3 0
= 0,05
= 0,05
Se Rechaza H0.
Se Rechaza H0.
Conclusin: Con un nivel de significacin del 5% se puede afirmar que ambas variables
contribuyen significativamente en el modelo, por lo tanto el modelo de regresin estimado
queda expresado como:
Paso 4: La ecuacin de regresin lineal mltiple es:
Residual
(y - y )
3,90
3,8514
0,0486
3,30
3,3712
-0,0712
3,70
3,7204
-0,0204
4,90
4,7862
0,1138
4,00
4,2918
-0,2918
3,90
3,6332
0,2668
3,20
3,2760
-0,0760
Cliente
Estadstica Aplicada
Pgina 145
Ejemplo 26.
Una empresa que vende por correo suministros para computadoras personales, software y
hardware posee un almacn central para la distribucin de los productos ordenados.
Actualmente, la administracin se encuentra examinando el proceso de distribucin desde el
almacn y est interesada en estudiar los factores que afectan los costos de distribucin del
almacn.
Actualmente, un pequeo cargo por manejo se agrega a pedido, independiente de la cantidad
por la que se hizo. Se han recolectado datos correspondientes a los 24 meses anteriores y
respecto a los costos de distribucin del almacn, las ventas y el nmero de pedidos recibidos.
Pearson Correlation
X2
,800
Sig. (2-tailed)
X2
Pearson Correlation
Sig. (2-tailed)
Pearson Correlation
Sig. (2-tailed)
,800
**
Y
**
,000
,000
,917**
,000
,843
**
,000
,843**
,000
,917
**
,000
Estadstica Aplicada
Pgina 146
Model
R
dimension0
1
,935a
a. Predictors: (Constant), x2, x1
ANOVAb
Model
Sum of
Squares
1
Regression 3404,380
Residual
488,825
Total
3893,205
a. Predictors: (Constant), x2, x1
b. Dependent Variable: Y
Model
(Constant)
x1
x2
df
Adjusted R
Square
,862
R Square
,874
Mean
Square
2 1702,190
21
23,277
23
Coefficientsa
Unstandardized
Coefficients
B
Std. Error
-3,297
6,233
,049
,021
,012
,002
F
Sig.
73,126 ,000a
Standardized
Coefficients
Beta
t
-,529
,304 2,360
,674 5,223
Sig.
,602
,028
,000
a. Dependent Variable: Y
Model Summary
Model
R
R Square Adjusted R Square Std. Error of the Estimate
dimension0 1 ,843a
,711
,698
7,14740
a. Predictors: (Constant), x1
Model Summary
Model
R
R Square Adjusted R Square Std. Error of the Estimate
dimension0 1 ,917a
,841
,834
5,30228
a. Predictors: (Constant), x2
Solucin a)
Variables
Correlaciones Parciales
entre las Variables
Independientes
Correlaciones Parciales
con la Variable
Dependiente
X1 Vs. X2
rx1x2=0,800
rx1y= 0,843
rx2y= 0,917
Conclusin
No existe
multicolinealidad
Solucin b)
Prioridad
1
3
2
Modelo
Y Vs. X1,X2
Y Vs. X1
Y Vs. X2
R2 Corregido
0,862
0,698
0.834
Analizando YX1X2
Estadstica Aplicada
Pgina 147
Ho : 2 0
H1 : 1 0
H1 : 2 0
= 0,05
= 0,05
Se Rechaza H0.
Se Rechaza H0.
80
75
84
62
92
75
63
x1
50
51
42
42
59
45
48
x2
72
74
79
71
85
73
75
x3
18
19
22
17
25
17
16
y
69
68
87
92
82
74
80
62
x1
39
40
55
48
45
45
61
59
x2
73
71
80
83
80
75
75
70
x3
19
20
30
33
20
18
20
15
Pgina 148
Modelo
1
R
.892a
R cuadrado
.796
R cuadrado
corregida
.740
Error tp. de la
estimacin
5.176
DurbinW atson
1.841
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
1148.581
294.752
1443.333
gl
3
11
14
Media
cuadrtica
382.860
26.796
F
14.288
Sig.
.000a
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
(Constante)
X1
X2
X3
B
-39.590
Error tp.
30.353
.144
1.252
.683
.201
.494
.440
Beta
.101
.568
.342
t
-1.304
Sig.
.219
.719
2.533
1.552
.487
.028
.149
a. Variable dependiente: Y
Regresin: Y; X1; X2
Re sume n de l mode lob
Modelo
1
R
.867a
R cuadrado
.751
R cuadrado
corregida
.710
Error tp. de la
estimacin
5.472
DurbinWatson
1.874
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
1084.067
359.266
1443.333
gl
2
12
14
Media
cuadrtica
542.034
29.939
F
18.105
Sig.
.000a
Estadstica Aplicada
Pgina 149
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
B
-70.121
.132
1.849
(Constante)
X1
X2
Error tp.
24.429
.212
.328
Beta
.092
.839
t
-2.870
.621
5.638
Sig.
.014
.546
.000
a. Variable dependiente: Y
Regresin: Y; X1; X3
Resumen del modelob
Modelo
1
R
.823a
R cuadrado
.677
R cuadrado
corregida
.623
Error tp. de la
estimacin
6.236
DurbinWatson
1.849
ANOVAb
Modelo
1
Suma de
cuadrados
976.654
Regresin
Residual
Total
Media
cuadrtica
488.327
466.679
12
38.890
1443.333
14
gl
F
12.557
Sig.
.001a
Coeficientesa
Modelo
1
(Constante)
X1
X3
Coeficientes no
estandarizados
B
Error tp.
32.691
12.464
.240
.237
1.551
.333
Coeficientes
estandarizad
os
Beta
.169
.776
t
2.623
1.013
4.659
Sig.
.022
.331
.001
a. Variable dependiente: Y
Regresin: Y; X2; X3
Resumen del modelob
Modelo
1
R
.887a
R cuadrado
.786
R cuadrado
corregida
.751
Error tp. de la
estimacin
5.071
DurbinWatson
1.702
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
X2
X3
B
-37.409
1.320
.670
Coeficientes
estandarizad
os
Error tp.
29.587
.476
.431
Beta
.599
.335
t
-1.264
2.775
1.555
Sig.
.230
.017
.146
a. Variable dependiente: Y
Regresin: Y; X1
Resumen del modelob
Modelo
1
R
.303a
R cuadrado
.092
R cuadrado
corregida
.022
Error tp. de la
estimacin
10.042
DurbinWatson
1.713
Estadstica Aplicada
Pgina 150
ANOVAb
Modelo
1
Regresin
Suma de
cuadrados
132.447
Media
cuadrtica
132.447
100.837
gl
Residual
1310.887
13
Total
1443.333
14
F
1.313
Sig.
.272a
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
(Constante)
X1
B
55.366
.431
Error tp.
18.478
.376
t
2.996
1.146
Beta
.303
Sig.
.010
.272
a. Variable dependiente: Y
Regresin: Y; X2
Resumen del modelob
Modelo
1
R
.862a
R cuadrado
.743
R cuadrado
corregida
.723
Error tp. de la
estimacin
5.341
DurbinWatson
1.768
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
1072.537
370.796
1443.333
gl
1
13
14
Media
cuadrtica
1072.537
28.523
F
37.603
Sig.
.000a
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
(Constante)
X2
B
-67.601
1.901
Error tp.
23.513
.310
t
-2.875
6.132
Beta
.862
Sig.
.013
.000
a. Variable dependiente: Y
Regresin: Y; X3
Resumen del modelob
Modelo
1
R
.806a
R cuadrado
.649
R cuadrado
corregida
.622
Error tp. de la
estimacin
6.243
DurbinWatson
1.855
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
936.737
Media
cuadrtica
936.737
506.597
13
38.969
1443.333
14
gl
F
24.038
Sig.
.000a
Estadstica Aplicada
Pgina 151
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
X3
B
43.177
1.610
Error tp.
6.952
.328
Coeficientes
estandarizad
os
Beta
.806
t
6.211
4.903
Sig.
.000
.000
a. Variable dependiente: Y
Anlisis de la Multicolinealidad
Estadstica Aplicada
R2 Corregido
Prioridad
Pgina 152
Ejercicio 30.
Se desea establecer un modelo que permita evaluar la ganancia bruta (miles de dlares) en la
industria qumica, sobre la base del nmero de empleados, nmero de dividendos de acciones
comunes consecutivas pagados y el valor total del inventario al principio del ao actual (miles de
dlares). Los siguientes resultados son proporcionados por el software SPSS del anlisis de una
muestra de 16 empresas.
Correlaciones
anancmero ivid endo
ventar
Bru ta
mp lead nsecuti vInicial
C orrelaci n Gan an cia B1 ,0 0 0
,7 9 3
,6 6 7
,833
N mero de
,7 9 3 1 ,0 0 0
,6 4 5
,699
Dividendos
,6 6 7
,6 4 5
1 ,0 0 0
,620
In ven tario In ,833
,699
,620 1,000
Sig . (unilat Gan an cia B
.
,000
,002
,000
N mero de
,000
.
,003
,001
Dividendos
,002
,003
.
,005
In ven tario In ,000
,001
,005
.
N
Gan an cia B
16
16
16
16
N mero de
16
16
16
16
Dividendos
16
16
16
16
In ven tario In
16
16
16
16
Estadstica Aplicada
Pgina 153
Regresin: Y X1 X2 X3
ANOVAb
Suma de
cuadrados
45510101
Modelo
1
R
,888a
R cuadrado
,788
R cuadrado
corregida
,735
Modelo
1
Error tp. de la
estimacin
1008,95542
Regresin
Media
cuadrtica
15170034
1017991,0
gl
Residual
12215892
12
Total
57725994
15
F
14,902
Sig.
,000a
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
B
965,281
(Constante)
Error tp.
499,750
Beta
t
1,932
Sig.
,077
Nmero de Empleados
2,865
1,583
,363
1,810
,095
Dividendos Consecutivos
6,754
10,279
,120
,657
,524
,287
,111
,505
2,586
,024
Inventario Inicial
a. Variable dependiente: Ganancia Bruta
Regresin: Y X1 X2
ANOVAb
R
,819a
R cuadrado
,670
R cuadrado
corregida
,620
Modelo
1
Error tp. de la
estimacin
1209,73686
Suma de
cuadrados
38700971
19025023
57725994
Regresin
Residual
Total
gl
2
13
15
Media
cuadrtica
19350486
1463463,3
F
13,222
Sig.
,001a
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
B
771,842
4,905
14,995
(Constante)
Nmero de Empleados
Dividendos Consecutivos
Error tp.
592,451
1,645
11,717
Beta
,621
,267
t
1,303
2,981
1,280
Sig.
,215
,011
,223
Regresin: Y X1 X3
Resumen del modelo
Modelo
1
R
,884a
R cuadrado
corregida
,747
R cuadrado
,781
Error tp. de la
estimacin
986,65543
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
45070638
12655356
57725994
Media
cuadrtica
22535319
973488,940
gl
2
13
15
F
23,149
Sig.
,000a
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
Nmero de Empleados
Inventario Inicial
B
1134,761
Error tp.
418,574
3,258
1,434
,310
,103
Coeficientes
estandarizad
os
t
2,711
Sig.
,018
,412
2,272
,041
,545
3,001
,010
Beta
Estadstica Aplicada
Pgina 154
Regresin: Y X2 X3
ANOVAb
Suma de
cuadrados
42174166
15551828
57725994
Modelo
1
R
,855a
R cuadrado
,731
R cuadrado
corregida
,689
Modelo
1
Error tp. de la
estimacin
1093,75247
Regresin
Residual
Total
gl
2
13
15
Media
cuadrtica
21087083
1196294,5
F
17,627
Sig.
,000a
Coeficientesa
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Modelo
1
(Constante)
Dividendos Consecutivos
Inventario Inicial
B
1197,552
13,771
,387
Error tp.
523,591
10,320
,104
t
2,287
1,334
3,711
Beta
,245
,681
Sig.
,040
,205
,003
Regresin: Y X1
ANOVAb
Resumen del modelo
Modelo
1
R
,793a
R cuadrado
,629
R cuadrado
corregida
,602
Modelo
1
Error tp. de la
estimacin
1236,98328
Suma de
cuadrados
36304207
21421787
Regresin
Residual
Total
gl
1
14
57725994
Media
cuadrtica
36304207
1530127,6
F
23,726
Sig.
,000a
F
11,231
Sig.
,005a
15
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
B
1150,725
Error tp.
524,730
6,263
1,286
Nmero de Empleados
Coeficientes
estandarizad
os
Beta
,793
t
2,193
Sig.
,046
4,871
,000
Regresin: Y X2
ANOVAb
Resumen del modelo
Modelo
1
R
,667a
R cuadrado
,445
R cuadrado
corregida
,405
Modelo
1
Error tp. de la
estimacin
1512,57913
Suma de
cuadrados
25695455
32030539
57725994
Regresin
Residual
Total
gl
1
14
15
Media
cuadrtica
25695455
2287895,6
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
Dividendos Consecutivos
B
1147,159
37,523
Coeficientes
estandarizad
os
Error tp.
723,845
11,197
Beta
,667
t
1,585
3,351
Sig.
,135
,005
Regresin: Y X3
Resumen del modelo
Modelo
1
R
,833a
R cuadrado
,694
R cuadrado
corregida
,672
Error tp. de la
estimacin
1123,83378
Estadstica Aplicada
Pgina 155
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
40043961
17682033
57725994
gl
1
14
15
Media
cuadrtica
40043961
1263002,4
F
31,705
Sig.
,000a
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
Inventario Inicial
B
1676,020
,474
Coeficientes
estandarizad
os
Error tp.
392,047
,084
Beta
,833
t
4,275
5,631
Sig.
,001
,000
Estadstica Aplicada
R2 Corregido
Prioridad
Pgina 156
Estadstica Aplicada
Pgina 159
Ejercicios propuestos 7.
44. En la Facultad de Negocios Internacionales de la Universidad Particular UPS se
quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de
Estadstica Experimental, para lo cual se escoge al azar una muestra de 15 alumnos y ellos
registran notas promedios en las asignaturas de Matemtica Bsica, Nivelacin de
Matemticas y Estadstica Aplicada a los Negocios como se muestran en el siguiente cuadro:
Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Estadstica
Experimental
13
13
13
15
16
15
12
13
13
13
11
14
15
15
15
Matemtica
Bsica
15
14
16
20
18
16
13
16
15
14
12
16
17
19
13
Nivelacin de
Matemticas
15
13
13
14
18
17
15
14
14
13
12
11
16
14
15
Estadstica aplicada
a los Negocios
13
12
14
16
17
15
11
15
13
10
10
14
15
16
14
Estadstica Aplicada
Pgina 158
45. El director de la universidad particular UPS le interesa determinar que efecto pueden tener el
promedio de calificaciones de un egresado, el nmero de capacitaciones adicionales y
el salario inicial (miles de soles), sobre el salario final (miles de soles) despus de dos aos
de egresado. Recopil esta informacin para una muestra aleatoria de 10 egresados, los
resultados fueron los siguientes:
Graduado Sueldo Promedio de Nmero
de Sueldo
final
calificaciones capacitaciones Inicial
1
41,00
3,20
2
37,00
2
48,00
3,60
5
46,00
3
39,00
2,80
3
38,00
4
39,00
2,40
4
39,00
5
38,00
2,50
2
36,00
6
39,50
2,10
3
38,00
7
43,00
2,70
3
42,00
8
37,00
2,60
2
37,00
9
47,00
3,00
4
46,50
10
42,50
2,90
3
41,00
Estadstica Aplicada
Pgina 159
7. Series de Tiempo
Introduccin:
En el proceso de toma de decisiones a nivel individual, de empresas e instituciones pblicas,
existiendo factores o variables que afectan el resultado de la decisin, pero que estn fuera del
control del decisor. La prediccin del comportamiento futuro de estas variables se torna una
actividad crucial para la formulacin de estrategias apropiadas.
As, por ejemplo, la decisin de un individuo de seguir o no estudios de postgrado se basa
implcita o explcitamente en sus predicciones sobre oportunidades futuras en el mercado
laboral. Asimismo, una empresa tiene la necesidad de predecir sus ventas y costos futuros
para poder decidir sus niveles de produccin, inventarios, compra de materias primas,
contratacin de personal, etc. De igual manera, las instituciones pblicas basan sus polticas
en estimaciones del futuro. La poltica monetaria del Banco Central de Reserva depender de
las predicciones relacionadas con el crecimiento de la economa y futuros niveles de inflacin.
Definicin: Una serie de tiempo, tambin llamada serie cronolgica, se define como un
conjunto de valores de una variable especfica, registrados en perodos sucesivos. El patrn de
comportamiento de los datos de una serie de tiempo est determinado por la combinacin de
varios componentes. En algunas series de tiempo se puede identificar hasta cuatro diferentes
componentes: tendencia, cclica, estacional e irregularidad.
El propsito fundamental del estudio de las series de tiempo es el anlisis de los datos
histricos de una variable en un perodo determinado, para poder predecir valores futuros de
esta variable.
Componente Tendencia
La tendencia secular de una serie de tiempo es la componente a largo plazo que representa el
crecimiento o disminucin de la serie durante un perodo largo.
Las fuerzas bsicas responsables de la tendencia de una serie son poblacin, crecimiento,
inflacin de precios, cambios tecnolgicos e incrementos de la productividad.
Estadstica Aplicada
Pgina 160
Componente Cclica
Son llamados tambin ciclos econmicos y muestran las variaciones en perodos de mediano
plazo.
Para estudiar los ciclos se requiere informacin de por lo menos 15 a 20 aos.
El estudio de los ciclos ha sido descartado por ciertos autores que consideran que dicho
componente puede ser asimilado por el componente de tendencia.
Componente estacional
Son fluctuaciones de una serie de tiempo en perodos relativamente cortos que se repiten de
manera casi irregular. Por lo general estn asociados a los diferentes meses del ao.
El estudio de la variacin estacional permite encontrar ndices mediante los cuales se puede
desestacionalizar la serie.
Componente irregular
Son variaciones aleatorias que ocurren en una serie por acontecimientos inesperados, por
ejemplo a causa de: huelgas, corte de energa elctrica, desastres naturales, terrorismo, etc.
Pero tambin con la misma naturaleza aleatoria de la variable.
Estadstica Aplicada
Pgina 161
ei Yt Y
DAM
i 1
i1Yi Y
EMC
n
Porcentaje de Error Medio Absoluto (PEMA)
El PEMA se usa para comparar mtodos diferentes de pronstico. Indica que tan grande
son los errores del pronstico. Contrasta con los valores reales de la serie.
PEMA
Estadstica Aplicada
Yi Y
i 1
Yt
n
Pgina 162
n i
Yt
PME i 1
n
Ejercicio 31.
El registro mensual de la venta de cacahuates (miles de toneladas) de una cierta empresa
se presenta en la tabla siguiente:
Meses
Ventas (Y)
Enero
88
Febrero
80
Marzo
84
Abril
80
Mayo
89
Para realizar el pronstico para el mes de Junio, se han llevado a cabo tres mtodos, pero
el gerente de la empresa no sabe que mtodo elegir de tal manera que pueda obtener
pronsticos confiables.
Los resultados se presentan en los siguientes cuadros:
Mtodo A
Meses
Enero
Febrero
Marzo
Abril
Mayo
Ventas
88
80
84
80
89
Suma
Error
81
82
84
91
-1
Error
e /Y
-2
Mtodo B
Meses
Enero
Febrero
Marzo
Abril
Mayo
Estadstica Aplicada
Ventas
88
80
84
80
89
Suma
e /Y
83
84
79
90
Pgina 163
Mtodo C
Meses
Ventas
Enero
Febrero
Marzo
Abril
Mayo
Error
88
80
84
80
89
Suma
79
84
81
91
Mtodos de pronstico
e /Y
1
0
-2
PEMA
A
B
C
Por lo tanto el mejor mtodo de pronstico es? Por qu?
Modelo Multiplicativo
El modelo que ms se usa para la descomposicin de las series de tiempo es el modelo
multiplicativo, en el que se analiza la serie como el producto de sus componentes:
Yt Tt C t E t I t
Dnde:
Yt : Valor real de la variable de inters.
Tt : Tendencia secular
Ct : Componente cclica
Et : Componente estacional
I t : Componente irregular
valores mayores que 1, indicando que el efecto cclico est por encima de la tendencia,
que el efecto estacional est por encima del nivel normal o promedio, o el efecto
irregular est por encima de la combinacin de los componentes tendencia, cclico y
estacional. Valores por debajo de 1 para
indican niveles por debajo de los
promedios del respectivo componente.
Estadstica Aplicada
Pgina 164
a.
b.
Ao
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
Ventas(Y)
2592
2748
2360
2576
2963
3395
3200
3082
3396
3781
10
2592
2748
2360
2576
2963
3395
3200
3082
3396
3781
b) Presente la ecuacin que estime la tendencia. (Para validar los modelos utilizar
Pgina 165
R cuadrado
Estimaciones de parmetro
df1
df2
Sig.
Constante
b1
Lineal
,758
25,005
,001
2304,267
128,188
Cuadrtico
,780
12,444
,005
2497,933
31,355
Potencia
,594
11,727
,009
2353,186
,156
Exponencial
,748
23,720
,001
2359,426
,042
b2
8,803
Modelo Cuadrtico
Resumen del modelo
R
R cuadrado
,883
R cuadrado
Error estndar de
ajustado
la estimacin
,780
,718
236,887
Coeficientes
estandarizados
estandarizados
B
Tiempo (aos)
Beta
Sig.
31,355
116,361
,213
,269
,795
8,803
10,309
,675
,854
,421
2497,933
278,615
8,966
,000
Tiempo (aos) ** 2
(Constante)
Error estndar
Modelo Lineal
Resumen del modelo
R
R cuadrado
,870
R cuadrado
Error estndar
ajustado
de la estimacin
,758
,727
232,842
Estadstica Aplicada
Error estndar
128,188
25,635
2304,267
159,061
estandarizados
Beta
t
,870
Sig.
5,000
,001
14,487
,000
Pgina 166
Tiempo (t)
Yt
2015
Estadstica Aplicada
Pgina 167
Datos estacionales
Los datos de series de tiempo mensual o trimestral son de uso comn en los negocios, porque
generalmente usan tcnicas contables basados en meses o trimestres. Las proyecciones a
futuro de series de tiempo mensual y/o trimestral son actividades comunes en las
organizaciones.
La descomposicin de una serie de tiempo mensual o trimestral puede revelar la componente
estacional e irregular, adems de las componentes de tendencia y cclica. Al examinar cada
una de estas cuatro componentes por separado se puede descubrir informacin interesante y
til que permita al analista combinar estos elementos para realizar un buen pronstico.
Ejemplos de series estacionales:
1.
2.
3.
4.
Los pronsticos que usan series de tiempo mensual o trimestral se hacen por lo general para 1
a 12 meses o para 1 a 4 trimestres futuros.
El analista debe tener de 4 a 7 aos de datos mensuales o trimestrales para realizar
clculos necesarios para la estacionalidad.
Ejemplo 1
El directorio de una compaa de aire acondicionado y de calefaccin est examinado los
datos correspondientes a los ingresos trimestrales (miles de dlares). Los datos son los
siguientes:
Ao
2010
2011
2012
2013
2014
Estadstica Aplicada
Trimestre
II
III
34
36
40
42
45
46
47
49
53
51
53
55
IV
27
33
34
35
34
Pgina 168
a.
b.
c.
d.
e.
Estime el ingreso de la compaa para los tres primeros trimestres del ao 2015.
Solucin:
a.
Trimestres
Estadstica Aplicada
Promedio Mvil
Pgina 169
(4 trimestres)
2010
2011
2012
2013
2014
IV
27
34
II
45
III
53
=(27+34+45+53)/4 = 39,75000
IV
33
=(34+45+53)+33/4 = 41,25000
36
=(45+53+33+36)/4 = 41,75000
II
46
42,00000
III
51
41,50000
IV
34
10
40
II
11
47
III
12
53
IV
13
35
43,75000
14
42
44,25000
II
15
49
44,75000
III
16
55
45,25000
IV
17
34
45,00000
Promedio Mvil
Centrado
AOS
Trimestres
2010
IV
27
34
II
45
39,75000
(39,75000+41,25000)/2=
40,50000
III
53
41,25000
(41,25000+41,75000)/2=
41,50000
2011
Estadstica Aplicada
Pgina 170
IV
33
41,75000
41,87500
36
42,00000
41,75000
II
46
III
51
IV
34
10
40
43,25000
II
11
47
43,62500
III
12
53
44,00000
IV
13
35
44,25000
44,50000
14
42
44,75000
45,00000
II
15
49
45,25000
45,12500
III
16
55
45,00000
IV
17
34
2012
2013
2014
Calcule el cociente del valor real con respecto al valor del promedio mvil centrado
para cada trimestre de la serie temporal.
AOS Trimestres
2010
Promedio
Mvil
(4 trimestres)
Promedio
Mvil
Centrado
(P.M.C)
(Y/P.M.C)
IV
27
34
II
45
39,75000
40,50000
(45/40,50)=1,11111
III
53
41,25000
41,50000
(53/41,50)=1,27711
IV
33
41,75000
41,87500
0,78806
36
42,00000
41,75000
0,86228
II
46
41,50000
41,62500
1,10511
III
51
41,75000
42,25000
1,20710
IV
34
42,75000
42,87500
0,79300
10
40
43,00000
43,25000
0,92486
II
11
47
43,50000
43,62500
III
12
53
43,75000
44,00000
IV
13
35
44,25000
44,50000
14
42
44,75000
45,00000
II
15
49
45,25000
45,12500
III
16
55
45,00000
2011
2012
2013
2014
Estadstica Aplicada
1,08587
Pgina 171
IV
17
34
Reunir los valores reales con respecto a los valores de promedio mvil centrado que
se encuentran en la ltima columna de la tabla anterior.
Observe que el nmero 1,11111 est a la altura del II TRIMESTRE del
ao 2011, es por esa razn que el llenado del cuadro se inicia desde all y
termina en el II TRIMESTRE del ao 2014.
Ao
Trimestre
I
II
III
IV
2011
2012
1,11111 1,27711
0,86228 1,10511
2013
1,20455
2014
0,93333
Promedio
0,90682
0,78806
0,79300
=4,02046
1,22958
han sido
recolectados
trimestralmente.
Reemplazando:
Constante de Ajuste
4
0, 99491
4, 02046
Promedio X cte. De
ajuste
I
II
III
0,99491
1,09486 0,99491
0,99491
0,78919 0,99491
IV
Estadstica Aplicada
ndice estacional
(ajustado)
0.90221
1.22333
4
1
Pgina 172
Los ndices de estacionalidad nos brindan informacin numrica sobre la influencia de las
fluctuaciones estacionales, en nuestro ejemplo de los ingresos de la compaa.
Interpretacin de los ndices estacionales (Ajustados):
ndice estacional ajustado del tercer trimestre
IEaj(III)=1,22333
Indica que los ingresos de la compaa para este trimestre estn en un 0,22333 o 22,333% por
encima del promedio trimestral.
IEaj(I)=0,90221
Indica que los ingresos de la compaa para este trimestre estn en un 0,09779 o 9,779% por
debajo del promedio trimestral.
En conclusin:
El trimestre de menores ingresos es el cuarto trimestre, con un ndice 0,78517, lo que indica
que los ingresos para este trimestre estn en un 0,21483 o 21,483% por debajo del promedio
trimestral y el trimestre de mayores ingresos es el tercer trimestre, con un ndice 1,22333, lo
que indica que los ingresos para este trimestre estn en un 0,22333 o 22,333% por encima del
promedio trimestral.
c.
Para estimar la tendencia debemos tener los valores de la serie sin estacionalidad. Entonces, la
serie de tiempo sin la componente de estacionalidad queda de la siguiente manera.
AOS
Trimestres
2010
IV
I
II
1
2
3
27
34
45
2011
Estadstica Aplicada
ndice
Serie
estacional
desestacionalizada
ajustado
(Y/IE)
(IE)
0,78518
34,38717
0,90221
37,68540
1,08929
41,31128
Pgina 173
2012
2013
2014
III
IV
I
II
III
IV
I
II
III
IV
I
4
5
6
7
8
9
10
11
12
13
14
53
33
36
46
51
34
40
47
53
35
42
II
III
IV
15
16
17
49
55
34
1,22333
0,78518
0,90221
1,08929
1,22333
0,78518
0,90221
1,08929
1,22333
0,78518
0,90221
1,08929
1,22333
43,32448
39,90219
42,22931
43,30237
44,33577
43,32448
44,57597
44,98340
44,95937
0,78518
Se puede observar que la serie desestacionalizada presenta una tendencia positiva, entonces
esta serie la procesamos en el SPSS, para determinar qu tipo de comportamiento presenta
(Lineal, Cuadrtico, Potencia y Exponencial), con la observacin de sus valores R2 y la
validacin de sus coeficientes respectivos, se determinar cul es el modelo que mejor se
ajusta a la serie desestacionalizada que hemos obtenido.
d.
Seleccionamos el modelo que presenta mayor R2, en este caso es el modelo Potencia
(R2:0.793)
Estadstica Aplicada
Pgina 174
1. Planteamiento de hiptesis:
H0:
H1:
2. Nivel de significancia: 0,05
Estadstica Aplicada
Pgina 175
Reemplazando los coeficientes del modelo potencia (cuadro de coeficientes SPSS) es:
e.
Estime el ingreso de la compaa para los tres ltimos trimestres del ao 2015.
Se espera que el ingreso para el segundo trimestre del ao 2015 sea de 49,89236 mil dlares.
Ejercicio 32.
La empresa Work Gloves, revisa las ganancias trimestrales de la venta de aluminio, desde el
cuarto trimestre del ao 2011 hasta el cuarto trimestre del ao 2014, la cual se indica a
continuacin (en millones de dlares):
Trimestre
Ao
I
II
III
IV
22
2012
30
20
40
24
2013
35
26
43
28
2014
40
30
46
35
2011
Estadstica Aplicada
Pgina 176
Solucin
a. Calcule los ndices estacionales usando un promedio mvil de 3 trimestres.
Calcule el promedio mvil de 3 trimestres.
IMPORTANTE: Cuando el periodo es IMPAR (por ejemplo 3 trimestres), el promedio
mvil queda centrado y lo ubicamos en la posicin 2.
AOS
Trimestres
2011
IV
22
30
(22+30+20)/3=24,00
II
20
(30+20+40)/3=30.00
III
40
28,00
IV
24
33,00
35
28,33
II
26
III
43
IV
28
10
40
II
11
30
38,67
III
12
46
37,00
IV
13
35
2012
2013
2014
PMC3T
Calcule el cociente del valor real con respecto al valor del promedio mvil centrado
para cada trimestre de la serie temporal.
AOS Trimestres
2011
PMC3T
Y/PMC
IV
22
30
24,00
(20/24) = 1,25000
II
20
30,00
0,66667
III
40
28,00
1,42857
IV
24
33,00
0,72727
35
28,33
1,23529
II
26
III
43
2012
2013
Estadstica Aplicada
Pgina 177
IV
28
10
40
II
11
30
III
12
46
IV
13
35
2014
37,00
1,24324
Reunir todos los cocientes de los valores reales con respecto a los valores de
promedio mvil centrado) que se encuentran en la ltima columna de la tabla
anterior.
Observe que el nmero 1,25000 est a la altura del I TRIMESTRE del ao 2012, es por esa
razn que el llenado del cuadro se inicia desde all y termina en el III TRIMESTRE del ao
2014.
Trimestre
Ao
I
II
III
IV
2012
1,25000
0,66667
1,42857
0,72727
2013
1,23529
0,75000
1,32990
0,75676
2014
1,22449
0,77586
1,24324
= 4,04336
Promedio
Ahora para ajustar los ndices se necesita la constante de ajuste y sta se obtiene de
la siguiente manera:
En nuestro ejemplo, las observaciones son por trimestre.
Reemplazando:
Estadstica Aplicada
(Promedio x Constante
ndice estacional
de Ajuste)
(Ajustado)
0,23659 *
1,22333
Pgina 178
II
0,73084 *
0,72301
III
1,33390 *
1,31960
IV
0,74201 *
0,73406
b. Serie desestacionalizada
La serie de tiempo sin la componente de estacionalidad queda de la siguiente
manera.
t
Indice
estacional
ajustado (IE)
IV
22
0,73406
(22/0,73406) = 29,97037
30
1,22333
24,52313
II
20
0,72301
27,66228
III
40
1,31960
30,31220
IV
24
0,73406
32,69495
35
1,22333
28,61032
II
26
0,72301
AOS Trimestres
2011
2012
2013
Estadstica Aplicada
Serie desestacionalizada
(Y/IE)
Pgina 179
2014
III
43
1,31960
IV
28
0,73406
10
40
1,22333
II
11
30
0,72301
III
12
46
1,31960
IV
13
35
0,73406
Lineal
Cuadrtico
Estadstica Aplicada
Pgina 180
Potencia
Exponencial
Estadstica Aplicada
Pgina 181
d. Estime el ingreso de la compaa para los tres primeros trimestres del ao 2015.
Aos
Trimestre
t
(tiempo)
Estimacin de la
tendencia (pronstico
sin estacionalidad
2015
Y t)
ndice
Estacional
Ajustado
(IE)
Pronstico
Y t IE
I
II
III
Estadstica Aplicada
Pgina 182
mil
Ejercicios propuestos
46. Cars-R-Us ha reportado ventas (en US$ 1,000s) durante los aos 2009 y 2015:
Trimestre
2009
2010
2011
2012
2013
2014
2015
15,33
18,10
16,30
16,32
16,73
21,00
21,50
II
17,14
19,20
17,30
18,79
20,11
22,58
III
19,70
20,30
18,50
21,20
22,00
25,00
IV
20,20
21,50
20,30
25,14
24,81
27,20
Respuesta: Se aprecia una tendencia con pendiente positiva (al pasar los aos las
ventas aumentan) y tambin se ve el componente estacional.
Estadstica Aplicada
Pgina 183
Cte. Ajuste
Trimestre
I.E (Ajustado)
II
III
Estadstica Aplicada
IV
Pgina 184
Cuadrtico
Potencia
Estadstica Aplicada
Pgina 185
Exponencial
2012
2013
2014
2015
120,2
170,0
230,0
310,0
II
270,0
360,0
455,5
III
171,0
250,0
310,5
IV
216,3
355,5
400,7
Estadstica Aplicada
Pgina 186
1.44334
0.78047
1.16436
2013
0.68337
1.38462
0.77680
1.27648
2014
0.66282
1.37199
0.79841
1.17714
0.78522
1.20600
Promedio
Cte. Ajuste
I,E (Ajustado)
b. Presente el modelo que estime la tendencia. (Para validar los modelos utilizar
Lineal
Estadstica Aplicada
Pgina 187
Cuadrtico
Potencia
Exponencial
Estadstica Aplicada
Pgina 188
Trimestre
2015
II
Tiempo
Estimacin de la
tendencia (Pronstico
ndice
Estacional
Pronstico
Aos
II
III
IV
2011
182
255
315
294
2012
160
250
280
297
2013
210
310
365
335
2014
225
325
384
360
2015
245
a. Mediante un promedio mvil de cuatro perodos, determine los ndices estacionales para
los trimestres y utilizando estos desestacionalice la serie de tiempo original.
b. Estime la mejor ecuacin de tendencia y pronostique el nmero de visitantes para los
tres ltimos trimestres del ao 2015.
Estadstica Aplicada
Pgina 189
Lineal
Cuadrtico
Potencia
Estadstica Aplicada
Pgina 190
Exponencial
Estadstica Aplicada
Pgina 191
Estadstica Aplicada
Pgina 192
3.
4.
Yt 1 Yt 1 Yt
donde:
t+1 : Nuevo valor atenuado o valor de pronstico para el siguiente periodo,
Seal de Rastreo: comprende alguna medicin del error a travs del tiempo y
establece lmites, de modo que cuando el error rebase dichos lmites, se alerte
al pronosticador,
Estadstica Aplicada
Pgina 193
donde:
CEF = Suma de los errores (valor observado menos valor pronosticado)
DAM = Es el promedio de los errores absolutos
Grfico de lmites de seal de rastreo
Ejemplo 28.
Un fabricante que se especializa en partes de reemplazos no cuenta con un sistema de
pronstico y programa la cantidad de manufactura de productos con base a las ventas (miles
de dlares), de los ltimos meses, desde junio del ao 2013 hasta Mayo del ao 2014:
Ao
Mes
ventas
Junio
350
Julio
400
Agosto
458
2013 Septiembre
2014
462
Octubre
463
Noviembre
431
Diciembre
350
Enero
380
Febrero
400
Marzo
450
Abril
480
Mayo
350
Estadstica Aplicada
Pgina 194
Constante de suavizacin:
, para:
t = 1,
Estadstica Aplicada
Pgina 195
t = 2,
t = 3,
t = 4,
t = 12,
Clculo de la medicin del error en el pronstico:
DAM
PEMA
t 1
t 1
Yt
n
1,48370
Constante de suavizacin:
Mes
Ventas
(y)
VALOR
ATENUADO
( )
Error
e= y -
(Alfa=0,9)
Junio
350
350
Julio
400
350
50
50
0,12500
Agosto
458
395
63
63
0,13755
Septiembre 4
462
451,7
10,3
10,3
0,02229
463
460,97
2,03
2,03
0,00438
Octubre
Estadstica Aplicada
Pgina 196
Noviembre 6
431
462,797
-31,797
31,797
0,07377
Diciembre
350
434,17970
-84,17970
84,17970
0,24051
Enero
380
358,41797
21,58203
21,58203
0,05679
Febrero
400
377,84180
22,15820
22,15820
0,05540
Marzo
10
450
397,78418
52,21582
52,21582
0,11604
Abril
11
480
444,77842
35,22158
35,22158
0,07338
Mayo
12
350
476,47784
-126,47784
126,47784
0,36137
PRONSTICO
362,64778
, para:
t = 1,
t = 2,
t = 3,
t = 4,
t = 12,
DAM
PEMA
Estadstica Aplicada
t 1
t 1
Yt
n
Pgina 197
Cuadro Resumen
Alfa
Pronstico
CEF
DAM
PEMA
0,6
0,9
393,55512
362,64778
72,59187
14,05309
48,92615
45,3602
0,12125
0,11514
SEAL DE
RASTREO
1,48370
0,30981
Los dos pronsticos estn bajo control, debido a que la seal de rastreo para las
constantes de suavizacin (=0,6 y 0,9) estn dentro de los lmites [-1,5 1,5].
Ahora hay que escoger la mejor constante de suavizacin, para ello utilizamos el que
presenta menor PEMA. Por lo tanto la mejor constante es 0,9 con un PEMA de
0,10790.
Pronostique las ventas para el mes de junio del ao 2014.
El pronstico de ventas para el mes de junio del ao 2014 es de 362,64778
Ejercicio 33.
La empresa San Roque, dedicada a venta de dulces a nivel nacional e internacional, tiene
como dulce tradicional y de mayor venta al King Kong San Roque. Por tal motivo el
gerente de produccin de la empresa San Roque desea elaborar el pronstico de ventas de este
producto para tomar decisiones internas en la empresa (contratar ms personal, compra de
materia prima e insumos, elaborar un presupuesto de ventas, etc.). Para llevar a cabo el
estudio, el rea de administracin recolect las ventas en miles de dlares desde enero del ao
2013 hasta mayo del ao 2014.
Aos
Meses
Ventas
2013
Enero
88
Febrero
80
Marzo
84
Abril
80
Mayo
89
Junio
80
Julio
83
Agosto
80
Septiembre
78
Octubre
88
Estadstica Aplicada
Pgina 198
Noviembre
87
Diciembre
88
Enero
86
Febrero
84
Marzo
84
Abril
85
Mayo
84
2014
Solucin:
a) Complete en el cuadro los espacios en blanco para hallar el mejor pronstico,
utilice un modelo de atenuacin exponencial simple con tres coeficientes = 0,5;
0,8 y 0,9.
Constante de suavizacin:
Meses
Ventas
(y)
VALOR
ATENUADO
( )
Error
e= y -
(Alfa=0,5)
Enero
88
88
Febrero
80
88
-8
0,1
Marzo
84
84
Abril
80
84
-4
Mayo
89
0,07865
Junio
80
85,5
5,5
0,06875
Julio
83
82,75
0,25
0,25
0,00301
Agosto
80
-2,875
2,875
Septiembre
78
81,43750
-3,43750
Octubre
10
88
79,71875
8,28125
8,28125
0,09411
Noviembre
11
87
3,14063
3,14063
0,03610
Estadstica Aplicada
0,04407
Pgina 199
2,57031
0,02921
-0,71484
0,71484
0,00831
-2,35742
2,35742
0,02806
85,17871
-1,17871
1,17871
85
84,58936
0,41064
0,41064
0,00483
84
84,79468
-0,79468
0,79468
0,00946
-8
0,1
2,4
2,4
0,02857
Diciembre
12
88
85,42969
Enero
13
86
86,71484
Febrero
14
84
Marzo
15
84
Abril
16
Mayo
17
Pronstico
Constante de suavizacin:
Meses
Ventas
(y)
VALOR
ATENUADO
( )
Error
e= y -
(Alfa=0,8)
Enero
88
88
Febrero
80
88
Marzo
84
Abril
80
83,52
-3,52
3,52
0,044
Mayo
89
80,704
8,296
8,296
0,09321
Junio
80
87,3408
-7,3408
7,3408
0,09176
Julio
83
1,53184
1,53184
0,01846
Agosto
80
82,69363
-2,69363
2,69363
0,03367
Septiembre
78
80,53873
-2,53873
2,53873
0,03255
Octubre
10
88
78,50775
9,49225
9,49225
0,10787
Noviembre
11
87
86,10155
0,89845
0,89845
0,01033
Diciembre
12
88
86,82031
1,17969
1,17969
0,01341
Enero
13
86
-1,76406
1,76406
0,02051
Febrero
14
84
86,35281
-2,35281
2,35281
0,02801
Marzo
15
84
84,47056
-0,47056
0,47056
0,00560
Estadstica Aplicada
Pgina 200
Abril
16
85
Mayo
17
84
84,81882
0,90589
0,90589
0,01066
-0,81882
0,81882
0,00975
Pronstico
Constante de suavizacin:
Meses
Ventas
(y)
VALOR
ATENUADO
( )
Error
e= y -
(Alfa=0,9)
Enero
88
Febrero
80
88
-8
0,1
Marzo
84
80,8
3,2
3,2
0,0381
Abril
80
83,68
-3,68
3,68
0,046
Mayo
89
80,368
8,632
8,632
0,09699
Junio
80
-8,13680
8,13680
0,10171
Julio
83
80,81368
2,18632
2,18632
Agosto
80
82,78137
-2,78137
2,78137
0,03477
Septiembre
78
80,27814
-2,27814
2,27814
0,02921
Octubre
10
88
78,22781
9,77219
9,77219
0,11105
Noviembre
11
87
87,02278
-0,02278
0,02278
0,00026
Diciembre
12
88
87,00228
0,99772
0,99772
0,01134
Enero
13
86
-1,90023
1,90023
0,02210
Febrero
14
84
86,19002
-2,19002
2,19002
0,02607
Marzo
15
84
84,21900
-0,21900
0,21900
0,00261
Abril
16
85
0,97810
0,97810
0,01151
Estadstica Aplicada
Pgina 201
Mayo
17
84
84,90219
-0,90219
0,01074
0,90219
Pronstico
84,39734
0.8
3,15694
0,03778
-4,79529
0.9
3,49230
c) Con la mejor constante de suavizacin pronostique las ventas para el mes de Junio
del ao 2014.
Ejercicios propuestos 8.
49. Un distribuidor de acero, corta hojas de acero de bobinas suministradas por grandes
fabricantes, un pronstico exacto de utilizacin de bobinas podra ser muy til para
controlar los inventarios de materia prima, del precio de ventas, 80% es el costo de los
materiales adquiridos, aunque la determinacin de las cantidades de adquisicin implica
muchas consideraciones, se ha establecido que un modelo de atenuacin exponencial
sera de mucha utilidad para establecer un pronstico para el siguiente mes. Las tasas
actuales (de los ltimos 16 meses) de utilizacin de bobinas en libras se proporcionan a
continuacin:
Mes
Mes
Marzo
206807
Noviembre
658850
Abril
131075
Diciembre
179739
Mayo
124357
Enero
251969
Junio
149454
Febrero
205806
Julio
169799
Marzo
304580
Agosto
216843
Abril
293434
Septiembre
288965
Mayo
273725
Octubre
219018
Junio
Utilizando un modelo de atenuacin exponencial simple con = 0,1; 0,3; 0,5; 0,7 y
completando los siguientes cuadros:
Cuadro N 01
Estadstica Aplicada
Pgina 202
= 0,1
= 0,5
Tiempo
Meses
14
Abril
293434
15
Mayo
273725
16
Junio
Pronstico
Tiempo
Meses
244338,4518
249248,00066
14
Abrl
293434
274207,91504
15
Mayo
273725
283820,95752
16
Junio
Pronstico
= 0,3
= 0,7
Tiempo
Mes
es
14
Abril
293434
273623,9545
15
May
o
273725
16
Junio
Pronstico
Tiempo
Meses
14
Abril
293434
279995,90257
15
Mayo
273725
289402,57077
16
Junio
Pronstico
279566,96819
Cuadro N 02
Alfa
Pronstico
CEF
DAM
PEMA
0.1
448887,00595
76768,27729
0,37032
0.3
236691,25912
81098,93293
0,36103
0.5
143931,95752
88812,01712
0,36228
0.7
102316,10176
93663,95735
0,36422
Seal de
Rastreo
Resp
Determine la mejor constante de suavizacin: 0,7
Pronostique la utilizacin de acero (Lbs), para el mes de junio del presente ao:
278428,27123 libras de acero.
Pgina 203
Meses
Ventas
Agosto
145
Septiembre
130
Octubre
135
Noviembre
135
Diciembre
140
Enero
120
Febrero
145
Marzo
150
Abril
130
Mayo
150
Utilizando un modelo de atenuacin exponencial simple con = 0,1; 0,3; 0,7 y a partir de
los siguientes cuadros:
= 0,1
Error
Meses
Tiempo
Ventas
Agosto
145
145,00000
Septiembre
130
145,00000
-15,00000
15,00000
0,11538
Octubre
135
143,50000
-8,50000
8,50000
0,06296
Noviembre
135
142,65000
-7,65000
7,65000
0,05667
Diciembre
140
141,88500
-1,88500
1,88500
0,01346
Enero
120
141,69650
-21,69650
21,69650
0,18080
Febrero
145
139,52685
5,47315
5,47315
0,03775
Marzo
150
140,07417
9,92583
9,92583
0,06617
Abril
130
141,06675
-11,06675
11,06675
0,08513
Mayo
10
150
139,96007
10,03993
10,03993
0,06693
e= y -
Pronstico
= 0,3
Estadstica Aplicada
Pgina 204
Error
e= y -
Meses
Tiempo
Ventas
Agosto
145
145,00000
Septiembre
130
145,00000
-15,00000
15,00000
0,11538
Octubre
135
140,50000
-5,50000
5,50000
0,04074
Noviembre
135
138,85000
-3,85000
3,85000
0,02852
Diciembre
140
137,69500
2,30500
2,30500
0,01646
Enero
120
138,38650
-18,38650
18,38650
0,15322
Febrero
145
132,87055
12,12945
12,12945
0,08365
Marzo
150
136,50939
13,49062
13,49062
0,08994
Abril
130
140,55657
-10,55657
10,55657
0,08120
Mayo
10
150
137,38960
12,61040
12,61040
0,08407
Pronstico
= 0,7
Error
Meses
Tiempo
Ventas
Agosto
145
145,00000
Septiembre
130
145,00000
-15,00000
15,00000
0,11538
Octubre
135
134,50000
0,50000
0,50000
0,00370
Noviembre
135
134,85000
0,15000
0,15000
0,00111
Diciembre
140
134,95500
5,04500
5,04500
0,03604
Enero
120
138,48650
-18,48650
18,48650
0,15405
Febrero
145
125,54595
19,45405
19,45405
0,13417
Marzo
150
139,16379
10,83622
10,83622
0,07224
Abril
130
146,74914
-16,74914
16,74914
0,12884
Mayo
10
150
135,02474
14,97526
14,97526
0,09984
e= y -
Pronstico
Pgina 205
51. Un grupo musical vende discos compactos de sus presentaciones, en la tabla siguiente
se presentan la demanda (en cientos) de los ltimos 12 meses, el administrador del
grupo desea contar con un mtodo para pronosticar la demanda futura. Emplee el
suavizamiento exponencial con = 0,4, 0,6 y 0,8 , Con cul de estos valores de se
obtiene mejores pronsticos?
Mes
Demanda
Mes
Demanda
Junio
15
Diciembre
18
Julio
19
Enero
21
Agosto
15
Febrero
15
Septiembre
20
Marzo
17
Octubre
26
Abril
22
Noviembre
17
Mayo
17
MISCELNEA
52. Una Ca. dedicada a la venta de computadoras, est analizando las ventas efectuadas por
sus vendedores durante la ltima semana. De esta poblacin se tom una muestra
aleatoria de 100 ventas, encontrndose lo siguiente: El promedio de ventas es de $8000
con una desviacin estndar de $400.
a) Calcular el error estndar de estimacin de la media.
b) Cul es el error mximo que podra cometer a un nivel de confianza del 80%?
c) Encuentre e interprete un intervalo de confianza del 95% para estimar el monto
promedio de todas las ventas
53. Durante el verano del ao 2000 se visit a 30 restaurantes de comida rpida como
Wendys, McDonalds y Burger King (The Cincinnati Enquirer, 9 de Julio de 2000).
Durante cada visita, el cliente se dirigi al pasaje para automviles y ordeno una comida
bsica como combo o un sndwich, papas y una malteada. Se registr el tiempo (en
minutos) entre pedir y recibir la orden. Los siguientes datos son los tiempos para 30
visitas. Suponga que el tiempo sigue una distribucin normalidad.
0,9
1,0
1,2
2,2
1,9
3,6
2,8
5,2
1,8
2,1
6,8
1,3
3,0
4,5
2,8
2,3
2,7
5,7
4,8
3,5
2,6
3,3
5,0
4,0
7,2
9,1
2,8
3,6
7,3
9,0
Estadstica Aplicada
Pgina 206
c)
d)
Cul debe ser el tamao de muestra a tomar si se desea estimar la media con un
error no mayor a 0,1 horas y con un nivel de confianza del 85%?
55. Para estimar la proporcin de televidentes que ve un programa, se seleccion al azar y sin
reposicin una muestra aleatoria de 400 personas, encontrndose que 120 de ellos ven
dicho programa.
a)
b)
E
stime la proporcin poblacional de los consumidores de la cerveza XYZ mediante un
intervalo de confianza del 90%.
d)
Pgina 207
226 228 232 230 229 219 234 222 232 224
Suponga que los montos aportados por los afiliados tienen una distribucin normal,
construya un intervalo de confianza del 98% para la varianza de los montos aportados. El
gerente decidir capacitar a los vendedores para que instruyan a los afiliados sobre los
beneficios de los aportes regulares si la varianza supera los 10 dlares 2, cul ser la
decisin del gerente?
58. El administrador de una empresa financiera realiza un estudio estadstico de los ingresos
de sus clientes del sector Privado que cuentan con un crdito estudiantil. Para lo cual
selecciona una muestra aleatoria de 8 clientes con crdito estudiantil y registrndose los
ingresos en la siguiente tabla:
2312,21 2918,26 3944,24 3150,00 2852,46 2978,21 3187,66 3204,22
Construya un intervalo de confianza del 95% para la varianza de los ingresos de los
clientes con crdito estudiantil. Es posible afirmar que la variabilidad de los ingresos de
los clientes con crdito estudiantil es inferior a 500 soles?
59. La cantidad media de ingresos per cpita disponibles en Colorado es de $ 13 901 dlares
(basado en datos de la Oficina de Anlisis Econmicos de Estados unidos). Tom Phelps
planea abrir un concesionario de automviles Cadillac y quiere verificar esa cifra para
una regin especfica de Colorado, ya que en el caso que el ingreso promedio per cpita
es menor a $ 13 901 Phelps no abrira un concesionario. Phelps encuentra resultados de
una encuesta reciente de 25 personas, con una media de $ 13 447 dlares y una
desviacin estndar de $ 4 883. Al nivel de significacin del 5%, usted que le aconseja a
Tom Phelps? Tendra razn Phelps para preocuparse respecto al nivel de ingresos en
esta regin?
60. La Comisin de Defensa del Consumidor - CDC, realiza peridicamente estudios
estadsticos con el fin de comprobar las afirmaciones de los fabricantes acerca de sus
productos. Por ejemplo, la etiqueta de la lata grande de Enigma Coffee dice que contiene
800 gramos de caf. La CDC sabe que el proceso de Enigma Coffe no permite llenar las
latas exactamente con 800 gramos de caf por lata. Sin embargo, mientras la media
poblacional del peso de llenado sea por lo menos 800 gramos, los derechos del
consumidor estarn protegidos. Por esta razn, la CDC interpreta que la informacin de la
etiqueta de la lata grande tiene una media poblacional de por lo menos 800 gramos de
caf. De un lote de 2000 latas grandes de Enigma Coffee, un equipo de CDC selecciona
una muestra de 36 latas y registra el peso de caf que contiene cada una de ellas,
obteniendo un peso promedio es de 793 gramos y una desviacin estndar de 24 gramos.
Utilizando un nivel de significancia del 5%, indique si para el lote indicado, los derechos
de los consumidores de Enigma Coffee estn protegidos.
61. Despus de muchos aos de estar en funcionamiento, la Aseguradora de Fondo de
Pensiones NEPTUNO tiene actualmente muchos afiliados y el gerente debe tomar
varias decisiones sobre la base de las aportaciones promedios de las mismas. Por lo tanto
se toma una muestra aleatoria de 10 afiliados y se registran los montos que aportaron el
ltimo mes (en dlares):
Estadstica Aplicada
Pgina 208
226
228
232
230
229
219
234
222
232
224
Suponga que los montos de aportes que realizan los afiliados tienen una distribucin
normal, Usando un nivel de significacin de 2%, El gerente decidir contratar ms
vendedores, si hay evidencia que el monto promedio mensual de todos sus afiliados es
menor de 230 dlares. Cul ser la decisin del gerente?
62. Se instala una mquina Corkill para llenar botellas pequeas con 9,0 gramos de
medicamento. Se desea saber, a un nivel de significacin del 5%, si la mquina est
cumpliendo con las especificaciones respecto al contenido de cada botella y para ello se
seleccion una muestra aleatoria de 8 botellas, que proporcion los siguientes pesos en
gramos:
9,2
8,7
8,9
8,6
8,8
8,5
8,7
9,0
Si se sabe que los pesos en cada botella se distribuyen normalmente, con los resultados
que proporciona la muestra seleccionada, a qu conclusin llegara?
63. Una empresa comercializa una bebida refrescante, en un envase en cuya etiqueta se puede
leer: "Contenido 250 cc". El Departamento de defensa del consumidor toma
aleatoriamente 36 envases, y estudia el contenido medio, obteniendo una media de 234
cc. Si se sabe que la desviacin tpica poblacional es 18 cc, puede afirmarse con un 1%
de significacin que se est estafando al pblico? (Consideraremos estafa cuando el
contenido sea menor al expresado en la etiqueta).
64. Cuando funciona correctamente, un proceso produce frascos de champ cuyo contenido
pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de un lote present los
siguientes pesos (en gramos) para el contenido:
214
197
206
208
201
197
203
209
197
Asumiendo que la distribucin de la poblacin es normal, estara usted en condiciones de
afirmar que el proceso est funcionando correctamente? Use = 5%.
65. El nuevo administrador de GYM PLUS desea comparar sus servicios con el de las
grandes cadenas de gimnasios. Un rea diferencial que suele formar cuello de botella es
el servicio de Sauna. Se extrae una muestra aleatoria de 36 clientes, del local de San
Borja, usuarios del servicio de sauna y se registra el tiempo de espera para ser atendidos.
Se obtiene un promedio de 9,24 minutos y desviacin estndar de 3 minutos. Para
sustentar las siguientes afirmaciones use Alfa=0,05.
a) El administrador de GYM PLUS afirma que el tiempo promedio de espera para ser
atendido en el Sauna es menor que 10 minutos, Esta afirmacin. Es correcta?
b) El administrador de GYM PLUS afirmar que la variabilidad del tiempo de espera para
ser atendido en el Sauna aun es alta y supera los 2 minutos, Esta afirmacin. Es
correcta?
66. El seor Standard Deviation gana un premio de lotera y decide invertir en acciones de la
empresa Enigma Comunicaciones S.A. Sin embargo, est preocupado ante el riesgo que
Estadstica Aplicada
Pgina 209
presentan estas acciones medido a travs de la varianza de su cotizacin. Sabe que las
ltimas cotizaciones diarias por accin (en nuevos soles) han sido las siguientes:
5,93
15,48
12,4
17,62
15,64
14,85
13,85
17,78
16,99
12,19
18,23
16,66
15,10
13,46
18,78
El Sr. Deviation considera aceptable una desviacin estndar de 3 nuevos soles o menor.
Suponiendo normalidad en las cotizaciones diarias y utilizando un nivel de significancia
del 10%, debera invertir el Sr. Deviation en acciones de la empresa Enigma
Comunicaciones S.A?
67. El director comercial de cierta editora de libros de educacin superior que realiza ventas
por Internet, desea precisar con mucho cuidado su poltica de crdito. El director decide
obtener una muestra aleatoria de 15 clientes, registrando las siguientes ventas al crdito
(nuevos soles). Asuma que las ventas sigue una distribucin Normal.
250 340 500 280 620 560 520 380 210 690 800 720 450 600 700
a. El Director comercial decidir promocionar las ventas al contado, si comprueba que las
ventas en promedio al crdito han superado los 450 nuevos soles. Usando un nivel de
significacin del 5%, cul ser la decisin que tomar el Director comercial?
b. El director comercial identifica que la variabilidad de las ventas al crdito puede
influenciar su poltica de crdito. El Director comercial, decidir enviar una alerta a sus
clientes, si la variabilidad de las ventas al crdito son mayores a 150 nuevos soles.
Usando un nivel de significacin del 5%, cul ser la decisin que tomar el Director
comercial?
68. Un centro de estudios de estudiantes altamente calificados, realiz un estudio para
analizar el monto en dlares, que este tipo de alumnos, haban recibido como ayuda
financiera en el transcurso de un ao. Una muestra aleatoria de 51 alumnos altamente
calificados, mostr que este monto era en promedio de $2 637,00 en un ao, con una
desviacin estndar de $617,50. Al nivel de significacin del 5%:
a. Se puede afirmar que el monto promedio de apoyo financiero que recibe este tipo de
alumno es superior a $2 500,00?
b.
69. Las compaas de seguros automovilsticos estn comenzando a pensar en aumentar las
tarifas para las personas que usan telfonos mientras conducen. El Nacional Consumers
Group asegura que el problema no es realmente grave porque slo el 10% de los
conductores usa telfonos. La industria de seguros realiza un estudio y encuentra que, de
500 conductores seleccionados al azar, 90 usan telfonos (basados en datos de la revista
Prevention). En el nivel de significacin del 5%, pruebe la aseveracin del grupo de
consumidores.
70. Un fabricante de papel higinico DELUXE considera que tiene asegurado ms del 20%
del mercado. Para probar esta aseveracin, la fbrica de la competencia toma una muestra
de 200 clientes potenciales a quienes les pregunta por la marca papel higinico de su
preferencia. De los 200 entrevistados, 60 prefieren el papel DELUXE. Con un nivel de
significacin del 5%, a qu conclusin se llegara respecto a la afirmacin del fabricante
de DELUXE?.
Estadstica Aplicada
Pgina 210
71. Dado el auge del ecoturismo en nuestro pas, Enigma Outfitter, tienda especializada en
materiales para excursiones (ropa, calzado y complementos) ha tenido un crecimiento
importante en los ltimos aos. Sin embargo, han surgido nuevas empresas competidoras
y Enigma Outfitter no quiere perder la iniciativa ni su posicin en el mercado. Por esta
razn, la administracin de la empresa planea una promocin con envo de cupones de
descuento para sus clientes registrados en su base de datos. La promocin ser un xito si
ms de 10% de los que reciban el cupn lo utilizan. Antes de realizar la promocin a
nivel nacional, se realiza una prueba piloto, enviando los cupones a los integrantes de una
muestra de 250 clientes, 34 de ellos utilizaron el cupn. Basndose en los resultados
obtenidos de la muestra y con un nivel de significancia del 5%, indique si, de decidir
lanzar la promocin, sta ser exitosa.
72. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa
que pueden reconocer la marca de un producto de limpieza con base a la forma y color
del recipiente. De las 1 400 amas de casa, 420 fueron capaces de identificar la marca del
producto. Se puede afirmar, a un nivel de significacin del 5%, que la proporcin de
amas de casa que reconocen la marca del producto, es superior al 35%?
73. Una nueva serie de TV debe demostrar que capta ms del 25% de la audiencia despus de
su periodo inicial de 10 semanas, para decir que tuvo xito. Suponga que en una muestra
de 400 familias 112 estaban viendo la serie. A un nivel de significacin de 0,10; puede
decirse que la serie tuvo xito, con base en la informacin de la muestra?
74. Tradicionalmente el 35% de todos los prstamos otorgados a los trabajadores de una
empresa que tiene 500 empleados, han sido otorgados para capacitacin. Durante el ao
pasado la empresa ha realizado esfuerzos por incrementar esta proporcin. De una
muestra de 150 prstamos actualmente en curso, 65 han sido otorgados al personal para
capacitacin. La empresa ha tenido xito en sus esfuerzos por incrementar la proporcin
de prstamos para capacitacin? Pruebe la afirmacin usando un nivel de significacin de
4%.
75. El gerente de marketing de la empresa Cleaner Up SA propone cambiar de estrategia
publicitaria con el fin de captar ms clientes. Ha diseado un nuevo spot publicitario y ha
evaluado el impacto de ste en 360 empresas, de un total de 800 empresas del sector, de
las cuales 105 afirmaron que contrataran el servicio. La propuesta del gerente de
marketing se expondr a la junta general de accionistas si el nuevo spot publicitario
tiene un impacto mayor del 24%. Se aceptar la propuesta del gerente de marketing?.
Use un =0.02.
76. Una gran empresa de corretaje de acciones quiere determinar la eficiencia de sus nuevos
ejecutivos de cuenta en la obtencin de clientes. Luego de terminar su capacitacin, los
nuevos ejecutivos dedican varias semanas a visitar a posibles clientes para que abran
cuentas en la empresa. Los datos adjuntos contienen los nmeros de nuevas cuentas
abiertas en sus dos primeras semanas por 10 ejecutivas de cuenta seleccionadas al azar de
un total de 80 y 8 ejecutivos tambin seleccionados aleatoriamente de un total de 90.
Ejecutivas
Estadstica Aplicada
12
11
14
13
13
14
13
12
14
12
Pgina 211
Ejecutivos
13 10 11 12 13
Utilizando un nivel de significacin del 5%:
12
10
12
Parece ser que las mujeres son ms eficaces en la creacin de nuevas cuentas que
los hombres?
77. Se lleva a cabo un anlisis sobre los montos de los contratos de sus clientes. Si hay
evidencia estadstica al nivel de significacin del 5% de que los montos promedios de los
contratos sufrieron una disminucin en los ltimos meses, decidir ampliar su mercado
a otros rubros. Selecciona aleatoriamente 10 contratos del ao pasado (2009)
y 10
contratos de este ao (2010) y registra los montos (miles de soles) de los contratos. En
base a estos resultados, cul ser la decisin del gerente general?
Monto
2009
6,97
4,65
12,45 10,58
7,66
Monto
2010
7,62
7,12
8,29
7,1
8,14
6,23
9,08
7,84
5,78
7,29
7,98
9,47
10,28 8,65
Monto
2010
8,95
6,18
9,14
9,67
8,87 8,37
8,37
6,87 6,48
8,07
79. En un estudio sobre la eficacia de ciertos ejercicios para reducir peso, un grupo de 14
personas hicieron estos ejercicios durante un mes mostraron los siguientes resultados:
Persona
10
11
12
13
14
Peso antes
92
82
78
93
83
88
73
83
84
76
92
82 110 68
Peso despus
90
79
79
91
82
87
74
83
83
75
91
80 107 67
a.
b.
80. Con la finalidad de promover los Aerbicos Domingueros se realiza una vez al mes la
promocin 2 x 1 que puede usarse entre dos amigos en la misma fecha o puede ser usado
por la misma persona dos fechas consecutivas. Se muestra un cuadro con el nmero de
ventas realizada en 10 semanas. El registro se realiz Sin Promocin (1) y Con
Promocin (2).
Semana
1
2
3
4
5
6
7
8
9
10
Estadstica Aplicada
Pgina 212
30
28
30
22
24
26
28
30
30
28
40
36
32
28
33
30
30
32
28
34
El rea comercial afirma que el plan Aerbicos Domingueros incrementa las ventas
promedio en ms de 6 clientes. Asuma normalidad, use Alfa=0,01. Tienen razn en su
afirmacin?
81. Con fines de recaudacin la Sunat ha estado aplicando dos mtodos para registrar las
declaraciones juradas de sus contribuyentes. El primero exige al contribuyente
presentarse personalmente ante un encargado de la Sunat; el segundo le permite enviar
por correo su declaracin jurada. Los directivos de la recaudacin de impuestos piensan
que el primer mtodo ocasiona menos errores que el segundo. Por ello, autoriza un
examen aleatorio de 50 listados de la presentacin personal ante el encargado y 75
listados del registro por correo. Un 10 % de las presentaciones personales contienen
errores y 13,3% de los formularios enviados por correo tambin los contienen. A un nivel
de significacin del 5%, se puede afirmar que los directivos de la Sunat tienen razn?
82. En una encuesta se pregunt a 1035 adultos sobre su percepcin respecto a la
participacin de las compaas estadounidenses en la economa global. 704 de los
encuestados respondieron bien o excelente. En una encuesta similar, realizada cuatro aos
despus, 582 de 1 004 adultos encuestados respondieron a la misma pregunta como bien
o excelente. Con los resultados muestrales, se puede concluir que la proporcin de
adultos que respondieron bien o excelente se increment en los ltimos cuatro aos? Use
un nivel de significacin del 10%.
83. Se desea comparar la proporcin de morosos del sector salud y del sector educacin de la
empresa financiera. Para lo cual se seleccion dos muestras aleatorias y los resultados se
muestran en la tabla:
Al da
Salud
Educacin
30
40
Morosos
25
50
A un nivel de significancia del 3%, se puede afirmar que la proporcin de clientes
morosos del sector salud es menor en 0,15 a la proporcin de clientes morosos del sector
educacin?
84. Una Universidad cuenta con un total de 5 000 estudiantes, de los cuales 2 400 proceden
de la regin donde se ubica la universidad y el resto procede de otras regiones. Una
muestra aleatoria de 250 estudiantes de la regin, indica que el 48% prefiri acampar en
la playa el pasado fin de semana largo. As mismo de 250 estudiantes procedentes de
otras regiones, el 40% tambin prefiri acampar en una playa. A un nivel de significancia
del 5% pruebe si se puede considerar que existe diferencia en la proporcin de
estudiantes que prefirieron acampar en la playa.
Estadstica Aplicada
Pgina 213
85. Se desea saber si hay diferencia significativa entre el rendimiento en las ventas del
personal que recibe un curso de entrenamiento y aquellos a los que no se les imparte. Se
tom una muestra aleatoria de 60 vendedores adiestrados obtenindose un ndice de
rendimiento promedio de 7,35 y una desviacin estndar de 1,2. Por otra parte, se
seleccionaron 80 vendedores no capacitados resultando un ndice de rendimiento
promedio de 6,85 y una desviacin estndar de 1,5. Realice la prueba correspondiente y
concluya en trminos del problema. Asumiendo distribucin normal y para un = 0.10.
86. El gerente de operaciones de UNIBANK, est interesado en saber si existe diferencia
significativa entre los tiempos de atencin al cliente de los empleados que trabajan en los
dos turnos: maana y tarde. Al respecto, ayer personalmente registr los tiempos que
utilizaron los empleados para atender a los clientes en ambos turnos y en forma aleatoria.
Los tiempos en minutos que registr fueron los siguientes:
Maana
2.10
4.10
4.70
3.70
6.00
3.90
Tarde
4.00
4.50
3.70
4.00
4.10
3.45
Usando un nivel de significacin de 5%, a qu conclusin llegar el gerente de
operaciones?
87. En un estudio de mercado, se desea evaluar la oferta promocional de un producto. Con
este fin, se seleccionan al azar 12 tiendas y se registra la venta mensual del producto antes
y despus de la oferta promocional. Con un nivel de significacin de 5%, se puede
afirmar que la oferta promocional increment las ventas del producto. Los datos se
presentan en el siguiente cuadro.
Tienda
9 10 11 12
Antes
42 57 38 49 63 36 48 58 47 51 83 27
Despus
40 60 38 47 65 39 49 50 47 52 72 33
88. La gerencia de una compaa de seguros desea evaluar la nueva escala de pagos en sus
dos clases de seguros (A y B). De una muestra aleatoria de 1050 asegurados del plan A,
780 estn de acuerdo con la nueva escala. Mientras que en una muestra de 950 de los
asegurados del plan B, 660 estn de acuerdo. Probar la hiptesis de que la proporcin de
los asegurados que estn de acuerdo con la nueva escala de pagos del Plan A es similar a
los asegurados del Plan B. Usar un =0.05.
89. Una operacin de ensamblaje en una planta manufacturera requiere de un perodo de
entrenamiento de aproximadamente un mes para que un nuevo operario alcance la
mxima eficiencia. Se sugiri un nuevo mtodo de entrenamiento y se realiz una prueba
para comparar el nuevo mtodo con el procedimiento estndar. Se entren a dos grupos,
de diez y nueve obreros nuevos cada uno, durante tres semanas; un grupo utiliz el nuevo
mtodo y el otro el procedimiento de entrenamiento estndar. Se registr el tiempo, en
minutos, que tard cada trabajador en montar el dispositivo al final del perodo de tres
semanas. Estas mediciones aparecen en la siguiente tabla:
Procedimiento estndar 32 37 35 28 41 44 35 31 34 42
Procedimiento nuevo
35
31
29
25
34
40
27
32
31
Pgina 214
a. Se puede afirmar con un nivel de significacin del 5%, que la variabilidad de los
tiempos de ensamble de cada procedimiento son iguales?
b. A un nivel de significacin del 5%, dira usted que el procedimiento nuevo ofrece un
tiempo medio de ensamble menor que el procedimiento estndar?
90. Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer
modelo y siete del segundo modelo son sometidos a una colisin controlada obteniendo
los siguientes gastos, en dlares, por daos sufridos:
Modelo 1
345 310 305 345 355 375 320 310 305
Modelo 2
340 325 345 310 315 280 290
Si se supone que los gastos por daos en ambos modelos de automviles siguen una
distribucin normal, a un nivel de significacin del 5%:
a. Se puede afirmar que la variabilidad de los gastos por daos para cada modelo de
auto son iguales?
b. Parece haber alguna diferencia en el gasto medio ocasionado por las colisiones de
cada modelo de auto?
91. Para una futura campaa de captacin de clientes, uno de los factores que debe tomarse
en cuenta es la edad de los clientes. Por datos histricos se sabe que la edad de los
clientes del Fondo A es mayor que los del Fondo C y de acuerdo a los especialistas, slo
tiene sentido diferenciar una campaa entre estos grupos si es que en promedio la
diferencia de edades de los clientes es ms de 5 aos. Se seleccion una muestra de 25
clientes del Fondo A y 35 del Fondo C y se us el SPSS para analizar la informacin. A
continuacin se muestra parte de los reportes que nos brinda este software.
F
Edad
Se han asumido
42,794
Sig.
,000
gl
Sig. (bilateral)
Diferencia de
Error tp. de la
medias
diferencia
58
7,869
,769
29,136
7,869
,873
varianzas iguales
No se han asumido
varianzas iguales
Pgina 215
Mtodo Aplicado
Carta
Llamada telefnica
10
7
9
3
Se sabe que el tiempo para la recepcin el pago, luego de haber sido contactado el cliente
moroso, sigue una distribucin normal. A un nivel de significacin del 10%:
a. Existe evidencia significativa para afirmar que la variabilidad en el tiempo para la
recepcin del pago es similar tanto para clientes contactados por carta como por
telfono?
b.
Puede la compaa afirmar que los clientes morosos contactados por telfono
responden ms rpidamente que los contactados por cartas?
30. Una entidad financiera, est evaluando los montos correspondientes a prstamos
financieros otorgados por dos entidades bancarias En ti confo y Presto al toque,
durante el primer trimestre del presente ao. Se sabe ambas entidades bancarias realizaron
durante este perodo de estudio un total de 130 prstamos financieros. Posteriormente, se
seleccion una muestra aleatoria de cada entidad bancaria encontrndose los siguientes
montos en miles de dlares otorgados en calidad de prstamo:
En ti confi
75
88
65
100
100
95
82
57
42
100
Presto al toque
95
80
72
63
100
45
81
92
50
72
72
49
100
85
90
93. Una muestra de las calificaciones en un examen presentado en un curso de Estadstica es:
GRUPO 1
GRUPO 2
72
69
98
66
85
76
79
81
67
90
78
81
80
76
80
77
Estadstica Aplicada
Pgina 216
b.
95. Una empresa de investigacin de mercados obtuvo una muestra de personas para evaluar
el potencial de compras de cierto producto, antes y despus que esas personas vieran un
nuevo comercial en televisin sobre el producto. Las calificaciones de potencial de
compra se basaron en una escala de 0 a 10, donde los valores mayores indicaban un
mayor potencial de compra. Los datos se presentan en la siguiente tabla, al nivel de
significacin del 5%, se podra decir que el comercial ha tenido efecto en las compras?
Calificacin de la compra
Antes
Despus
5
6
4
6
7
7
3
4
5
3
8
9
5
7
6
6
Individuo
1
2
3
4
5
6
7
8
96. El administrador de GYM PLUS afirma que la proporcin de mujeres que pagan el
gimnasio en efectivo es mayor que proporcin de hombres que pagan el gimnasio en
efectivo. Se tom una muestra de 150 pagos realizados por mujeres de un total 1800 y se
encontr 50 pagos en efectivo. Se tom otra muestra de 300 hombres y se encontr 40
pagos en efectivo.
Tienen razn el administrador al afirmar que la proporcin de mujeres que pagan en
efectivo es mayor en ms del 10% que la proporcin de hombres que pagan en efectivo?
Use Alfa=0,025
97. Debido a los acontecimientos en la economa mundial de los ltimos aos, los clientes del
banco en general consideran que las tasas de variacin de los fondos del 2010 respecto al
2009 han disminuido en promedio si se comparan con las tasas de variacin del 2009
respecto al 2008. Para corroborar si la percepcin de los clientes se ajusta a la realidad, se
toma una muestra de nueve clientes y se registran las tasas de variacin de sus fondos en
ambos perodos (2010/2009 y 2009/2008), tal como se muestra en la siguiente tabla:
Cliente
Tasa de variacin
2010/2009 (%)
Tasa de variacin
2009/2008 (%)
porcentual
porcentual
3,3
1,8
1,2
0,05
3,4
2,7
4,1
2,3
4,9
4,8
0,9
1,5
0,07
4,8
3,1
6,4
4,8
Con un nivel de significancia del 4%, indique si la percepcin de los clientes concuerda
con la realidad.
98. Una de las principales preocupaciones del banco BSP es la atencin personalizada a sus
clientes, en particular, a los clientes de fondos de inversin. Dados los acontecimientos
Estadstica Aplicada
Pgina 217
Clientes satisfechos
37.5%
34.0%
32.8%
35%
30%
25%
20%
15%
10%
5%
0%
Fondo A
Fondo B
Fondo C
A un nivel de significacin del 5%, se puede considerar que no hay diferencia entre la
proporcin de clientes del fondo A y C satisfechos por la informacin oportuna?
99. Publicidad Pacifico, investiga la relacin entre el tipo favorito de mensaje comercial y el
nivel de ingresos para una muestra de consumidores. Los datos son:
Comercial favorito
Ingreso
Bajo
25
40
70
Medio
30
30
30
Alto
45
20
10
Nivel A
Nivel B
Nivel C
Estadstica Aplicada
101.Se est considerando cuatro marcas de lmparas elctricas para su uso en una gran planta
manufacturera. El director de compras pidi muestras de 100 a cada fabricante. Las
cantidades de productos aceptables e inaceptables de cada uno se indican a continuacin.
Al nivel de significacin del 5%, existe alguna diferencia en la calidad de las bombillas?
Fabricante
Producto
Aceptable
12
11
Inaceptable
88
92
95
89
102.Se clasific una muestra de agencias inmobiliarias segn el tamao (medido como el
nmero de empleados) y segn si tena o no un plan de marketing. Con los datos que se
presentan en la siguiente tabla, contrastar con un nivel de significacin del 1% la
hiptesis de no asociacin entre el tamao de las agencias inmobiliarias y el tener o no un
plan de marketing.
Plan de marketing
N de empleado
Si
No
Menos de 100
13
10
Entre 100 y 500
18
12
Ms de 500
32
40
103.El jefe de una planta industrial desea determinar si existe relacin entre el rendimiento en
el trabajo y turno laboral del empleado. Se tom una muestra aleatoria de 400 empleados
y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de
contingencia:
Turno Laboral
Rendimiento en el trabajo
Maana
Tarde
Noche
Total
Deficiente
23
60
29
112
Promedio
28
79
60
167
Muy bueno
49
63
121
Total
60
188
152
400
Con el nivel de significacin del 1%, la calificacin del rendimiento del trabajador est
asociada con el turno en el que labora el empleado?
104.El Gerente de una empresa publicitaria desea evaluar la publicidad por televisin de un
nuevo producto. Los anuncios se exhibieron por separado a grupos de consumidores en
un auditorio; donde cada consumidor slo mira uno de los tres anuncios y despus emite
una opinin acerca del producto que vara desde 1 (muy favorable) hasta 5 (muy
desfavorable). Los resultados se muestran en la siguiente tabla.
Anuncio
1
A
Estadstica Aplicada
32
2
87
Opinin
3
4
91
46
5
44
Pgina 219
53
41
B
C
141
93
76
67
20
36
10
63
Hay evidencias estadsticas para afirmar que la opinin omitida por los consumidores es
igual para los distintos anuncios?. Usar un =0.05.
105.Por la temporada de verano se ha realizado un estudio respecto a la opinin que tienen los
visitantes de la playa que visita. Se seleccionaron aleatoriamente cuatro playas y los
resultados se muestran en la tabla.
Pucusana
San Bartolo
Totoritas
Puerto Azul
Favorable
39
30
35
40
Desfavorable
18
12
16
14
A un nivel de significacin del 10%, se puede afirmar que la opinin favorable se
presenta en proporcin similar en las diferentes playas?
106.El departamento de Recursos Humanos de Enigma Enterprise desea determinar si el
ausentismo de sus empleados se relaciona con la edad. Para tal fin se toma una muestra
de 200 empleados al azar y se clasifica segn la edad y la causa del ausentismo. Los
resultados son los siguientes:
Causa
Menos de 30
aos
De 30 a 50 aos
Ms de 50 aos
Enfermedad
40
28
52
Otra
20
36
24
Se encuentra la edad de los empleados relacionada con las causas del ausentismo?
Considere un nivel de significacin del 10%.
107.Un estudio de la relacin entre las condiciones de las instalaciones en gasolineras y la
agresividad en el precio de la gasolina, reporta los siguientes datos basados en una
muestra de 441 gasolineras. Al nivel de significacin del 1%, sugiere la informacin que
las condiciones de las instalaciones y la poltica de precios son independientes entre s?
Poltica de precios
Condicin de la instalacin
Agresiva
Neutral
No agresiva
Anticuada
24
15
17
Condicin estndar
52
73
80
Moderna
58
86
36
108.Una sociloga desea saber si existe alguna relacin entre el nivel de instruccin y las
actividades sociales de una persona. Decidi manejar tres niveles de instruccin: Asisti
o termin la instruccin universitaria, asisti o termin la preparatoria y asisti o termin
la primaria. Cada persona llev un registro de sus actividades sociales, practicar deporte
en grupo, asistir a bailes o ceremonias. La sociloga los dividi en frecuencia superior al
Estadstica Aplicada
Pgina 220
18
12
10
Preparatoria
17
15
13
Primaria
22
53
39
Pgina 221
y Desarrollo de los Recursos. Al nivel de significacin del 2%, cul ser la decisin
del gerente?
A
B
Zonas
C
D
Total
MS
30
Total
50
23,3
23
50,0
50
50,0
50
50,0
50
50,0
200
200,0
28
12
23,3
93
93,0
113.El gerente del BSP observa que los menos satisfechos de su informacin oportuna son los
clientes del fondo A, que es el grupo ms grande de sus clientes, y tiene la sospecha que
guarda relacin con el nivel de inversin, por lo tanto busca en su base de datos el nivel
de inversin de los clientes que respondieron a las encuesta y obtiene la siguiente tabla.
Satisfaccin
Nivel de inversin
Total
Satisfechos
No satisfechos
Menor de 10000
10
80
90
30
60
90
Mayor de 20000
42
28
70
Total
82
168
250
Estadstica Aplicada
Pgina 222
Contenedor 2
Contenedor 3
Pgina 223
12,4
13,7
11,5
10,3
11,9
9,3
12,1
10,6
15,3
12,4
13,9
14,2
Basado en los datos presentados, los resultados obtenidos en SPSS son los siguientes:
Origen
Suma de
cuadrados
Contenedor
18.335
gl
F critico
Media
cuadrtica Fcalculado ( = 5%)
Error
Total
33.8799
Pgina 224
semejantes sobre principios de administracin; con esta finalidad toma muestras de cada
grupo y les aplica una prueba. Los resultados fueron:
Manufactura
56
39
48
38
73
50
62
Finanzas
103
87
51
95
68
42
Comercio
42
38
89
75
35
61
107
89
Con un nivel de significacin de 5%, de sus conclusiones para apoyar al coordinador del
seminario.
119.El gerente de personal de una compaa que fabrica computadoras quiere capacitar a los
empleados que trabajan en operaciones de ensamblado mediante uno de los 4 diferentes
programas de motivacin (Alfa, Beta, Gamma y Sigma) que se ofrecen en el mercado.
Como no se decide por uno de ellos, realiza un experimento que consiste en distribuir
aleatoriamente a 20 empleados en los 4 programas de motivacin para posteriormente
evaluar su tiempo de ensamblado (en minutos). Los resultados luego de la capacitacin
fueron los siguientes:
Repeticin
Programa
Alfa
Beta
Gamma
Sigma
64
59
65
58
67
58
68
60
62
61
63
59
64
59
64
62
66
58
65
60
Total
323
295
325
299
Promedio
64.6
59.0
65.0
59.8
Pgina 225
Pucusana
San Bartolo
Totoritas
Puerto Azul
Lun Mie
48
46
49
51
40
38
45
48
Jue Vie
46
48
51
50
38
35
44
46
Sb - Dom
48
48
37
48
51
53
35
48
122.Suponga que usted y su equipo de investigacin, con respecto al caso de la pregunta
anterior, tienen la sospecha que el tiempo de espera para ser atendido en los servicios de
fotocopias estara afectado adems por el turno en el que nos presentamos al servicio.
Para realizar este anlisis se obtuvo la informacin que se muestra en la tabla. Con un
nivel de significacin del 2% se puede afirmar que algn lugar de atencin o algn turno
de atencin o una combinacin de ambos determina un tiempo de espera conveniente
para el alumno?
Centro de
Losa
Cafetn
Informacin
deportiva
Maana
Tarde
Noche
1,5
4,2
3,8
4,7
7,3
6,8
4,1
6,6
7,2
3,6
5,9
6,5
4,8
7,3
7,2
3,8
6,1
6,7
3,4
5,6
6,2
4,4
6,8
7,4
3,1
5,3
6,2
Programa
Administracin Ingeniera
Ciencias
Repaso de 3
horas
500
540
480
580
460
400
Programa de
un da
460
560
420
540
620
480
Curso de 10
560
600
480
Estadstica Aplicada
Pgina 226
600
semanas
580
410
Sucursales
Alfa
Beta
Gamma
21
32
24
15
20
17
17
30
20
22
26
12
24
15
21
TABLA ANOVA
VENTA
Entre
tratamientos
Dentro de
tratamientos
Total
Suma de
cuadrado
s
Cuadrado
medio
gl
214.150
107.075
218.783
12
18.232
432.933
14
Sig.
5.873
.017
(I) SUCURSAL
Alpha
(J) SUCURSAL
Betha
Gamma
Betha
Gamma
Dif erencia de
medias (I-J)
-7.6500*
Sig.
.020
Lmite superior
-1.4092
.5833
2.7562
.836
-5.4219
6.5886
Alpha
7.6500*
2.8643
.020
1.4092
13.8908
Gamma
8.2333*
2.5855
.008
2.5999
13.8668
Alpha
-.5833
2.7562
.836
-6.5886
5.4219
Betha
-8.2333*
2.5855
.008
-13.8668
-2.5999
Estadstica Aplicada
Pgina 227
a. Al nivel de significacin del 5%, se puede concluir que existe una diferencia en el
nmero promedio de hornos de microondas que se venden en cada sucursal?
b.
Determine la o las sucursales que logran mayores niveles de ventas de este tipo de
artculo domstico. Argumente.
125.Un parque de diversiones ha estudiado mtodos para disminuir el tiempo de espera (en
minutos) para los juegos, haciendo que las personas entren a ellos y salgan en una forma
ms eficiente. Se han propuesto tres mtodos alternos de entrada y salida a los juegos.
Para tener en cuenta diferencias potenciales debidas al tipo de juego y a la interaccin
posible entre el mtodo de entrada y salida y el tipo de juego, se dise un experimento
factorial. Con los siguientes datos, pruebe si hay algn efecto importante debido al
mtodo de entrar y salir, al tipo de juego y a la interaccin. La salida del anlisis factorial
utilizando el paquete SPSS en su opcin Modelo lineal general se muestran a
continuacin.
Juego
Rueda de la
Casa del
Canal de
fortuna
terror
lanchas
41
52
50
40
50
50
43
44
46
49
50
48
48
45
46
51
46
44
47
43
51
48
42
50
50
46
49
Mtodo 1
Mtodo 2
Mtodo 3
45
48
50
57
55
56
60
63
69
80
65
70
71
73
82
48
50
53
60
60
Pgina 228
a.
78
80
57
65
70
75
82
71
72
80
80
73
Grande
78
82
89
75
Pruebe todas las hiptesis relevantes a un nivel de significacin del 5%.
b.
N
Parmetros normales
a,b
Diferencias ms
extremas
Residuo
para Ventas
36
.0000
Media
Desviacin tpica
3.20416
Absoluta
Positiva
Negativa
.095
.095
-.095
.569
.902
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.
gl1
gl2
11
Significacin
.286
24
Fuente
Modelo corregido
Interseccin
Ubicacin
Tamao
Ubicacin * Tamao
Error
Total
Total corregida
Suma de
cuadrados
tipo III
4609.889a
162946.778
1844.556
2572.056
193.278
359.333
167916.000
4969.222
gl
11
1
3
2
6
24
36
35
Media
cuadrtica
419.081
162946.778
614.852
1286.028
32.213
14.972
F
27.991
10883.273
41.066
85.894
2.152
Significacin
.000
.000
.000
.000
.084
Estadstica Aplicada
Pgina 229
Tamao de tienda
Pequea
Mediana
Grande
Pequea
Mediana
Grande
Pequea
Mediana
Grande
Pequea
Mediana
Grande
Media
47.667
59.000
73.333
59.667
75.667
79.000
68.667
Error tp.
2.234
2.234
2.234
2.234
2.234
2.234
2.234
Lmite inferior
43.056
54.389
68.723
55.056
71.056
74.389
64.056
Lmite
superior
52.277
63.611
77.944
64.277
80.277
83.611
73.277
78.333
83.667
50.333
59.000
73.000
2.234
2.234
2.234
2.234
2.234
73.723
79.056
45.723
54.389
68.389
82.944
88.277
54.944
63.611
77.611
a,b
Subconjunto
Ubicacin del estante
A
N
9
1
60.00
60.78
Significacin
71.44
76.89
.674
1.000
1.000
a,b
Subconjunto
Tamao de tienda
Pequea
Mediana
Grande
Significacin
N
12
12
12
1
56.58
68.00
1.000
1.000
77.25
1.000
127.El Gerente del Banco Enigma S.A quiere determinar si el monto mensual adeudado por
parte de sus clientes est influenciado por el distrito de residencia y el tipo de tarjeta de
crdito que poseen. Para ello se registraron los montos adeudados durante el mes anterior
de 36 clientes como se muestra en la siguiente tabla.
Tarjeta
Clsica
Oro
Plata
Distrito de residencia
San Borja
La Molina
930
810
950
780
900
810
890
850
860
850
880
860
800
870
780
920
920
900
Estadstica Aplicada
Miraflores
890
860
880
800
780
790
760
710
800
Ate
840
800
850
850
840
900
950
960
940
Pgina 230
a.
Variable Dependiente
Unidad Experimental
Factor (es)
Tratamiento (s)
b.
c.
gl1
gl2
Sig.
11
24
,165
Suma de cuadrados
tipo III
gl
tarjeta
1672.222
distrito
37111.111
tarjeta * distrito
95305.556
144955.556
35
Media
cuadrtica
Error
Total corregida
d.
Estadstica Aplicada
Pgina 231
sustentar sus resultados utilice solamente las salidas del SPSS que sean necesarias y se
muestran a continuacin.
128.Una compaa que vende regalos por correo cuenta con los siguientes datos muestrales
para las ventas, en dlares, realizadas. Clasificados por la forma como se efectu el pago
y el distrito de residencia del cliente. Pruebe a un nivel de significacin del 5%, si hay
algn efecto importante en las ventas debido al distrito de residencia del cliente, a la
forma de pago y a la interaccin.
Distrito de residencia
Forma de pago
San Isidro La Molina Miraflores
Surco
Tarjeta de crdito
Cheque
Efectivo
93
81
89
84
90
80
87
90
81
88
85
89
85
80
85
89
85
78
88
86
79
90
80
87
76
95
77
90
72
96
78
92
71
96
Pgina 232
(aos)
859
682
471
708
1094
11
224
320
651
1049
12
.938a
R cuadrado
.879
111.610
DurbinWatson
2.560
ANOVA
233
Modelo
Suma de
cuadrados
Regresin
634819.735
634819.735
Residual
87197.154
12456.736
722016.889
Total
Media
cuadrtica
gl
Sig.
.000a
50.962
Coeficientes
Coeficientes no
estandarizados
Modelo
Constante
Tiempo de operacin (aos)
Error tp.
208.203
70.918
75.002
9.934
Coeficientes
tipificados
Sig.
2.776
7.139
.027
.000
Beta
.938
10,5
04,5
E. Experimental 13,0
05,0
E. Aplicada
10
12 9 14 6 10 8 10 10 5
7 10 5
8 10 4
Model
1
R
.904a
Adjusted
R Square
.794
R Square
.817
Std. Error of
the Estimate
.91
ANOVAb
Model
1
Sum of
Squares
29.733
6.667
36.400
Regression
Residual
Total
df
1
8
9
Mean Square
29.733
.833
F
35.680
Sig.
.000a
Coefficientsa
Standardi
zed
Coefficien
ts
Unstandardized
Coefficients
Model
1
B
1.333
.667
(Constant)
Nmero de habitaciones
Std. Error
1.056
.112
Beta
.904
t
1.263
5.973
Sig.
.242
.000
133. La gerencia de Marketing de una empresa de aerolnea ha realizado una campaa publicitaria para
mejorar su demanda de vuelos. Con esta finalidad desea evaluar el impacto de la campaa
publicitaria, por lo cual la gerencia considera que se debe analizar la relacin del nmero de
pasajeros y los gastos en publicidad. Para este estudio se obtienen datos de 15 meses, los cuales se
muestra en el sgte. cuadro.
10 11 12 13 14 15 Total
10 12 8
17 10 15 10 14 19 10 11 13 16 10 12 187
15 17 13 23 16 21 14 20 24 17 16 18 23 15 16 268
X:
Y:
Tiempo de uso
gl1
Sig.
Constante
b1
Lineal
,861
49,475
,000
11,159
-,871
Cuadrtico
,896
30,126
,000
13,094
-1,627
Potencia
,851
45,822
,000
21,189
-,873
Exponencial
,938
120,069
,000
14,519
-,173
b2
,057
Coeficientes
Coeficientes no
estandarizados
B
Tiempo de posesin(X)
(Constante)
Coeficientes
estandarizados
Error tpico
-,173
,016
14,519
1,655
Beta
t
-,968
Sig.
-10,958
,000
8,771
,000
a)
Basado en los
datos presentados determine y valide el modelo de regresin. Justifique su respuesta.
Considere = 0,10.
b) Estime con una confianza del 90% el tiempo promedio de uso del equipo si este se tiene en
posesin desde hace tres meses.
236
135.El Sr. Standard Deviation es el responsable de la calidad de los productos elaborados por
Enigma S.A. El Sr. Deviation desea establecer la relacin que existe entre el tamao del
lote y el nmero de unidades defectuosas de tal manera que pueda seleccionar el mejor
tamao del lote. El Sr. Deviation recoge los siguientes dato sobre el tamao del lote
promedio y se le pide que analice:
Lote
Nmero de unidades
defectuosas
1
2
5
10
20
30
40
1
2
3
4
5
6
7
R cuadrado
gl1
gl2
Sig.
Constante
b1
b2
Lineal
.930
66.237
.000
42.862
-.906
Cuadrtico
.976
81.790
.001
57.338
-2.221
Potencia
.847
27.781
.003
5339.117
-1.992
Exponencial
.939
76.382
.000
104.652
-.084
.022
Cuadrtico
Resumen del modelo
R
R cuadrado
.988
R cuadrado corregida
.976
2.853
ANOVA
Suma de cuadrados
Regresin
Residual
Total
gl
Media cuadrtica
1331.164
665.582
32.551
8.138
1363.714
Sig.
81.790
.001
Coeficientes
Coeficientes no estandarizados
B
Tamao del lote
Tamao del lote ** 2
Coeficientes estandarizados
Error tpico
Beta
Sig.
-2.221
.477
-2.364
-4.651
.010
.022
.008
1.416
2.786
.050
237
Coeficientes
Coeficientes no estandarizados
B
Coeficientes estandarizados
Error tpico
Sig.
-2.221
.477
-2.364
-4.651
.010
.022
.008
1.416
2.786
.050
57.338
5.744
9.983
.001
Beta
Exponencial
Resumen del modelo
R
R cuadrado
R cuadrado corregida
.969
.939
.926
.379
ANOVA
Suma de cuadrados
Regresin
Residual
Total
Gl
Media cuadrtica
10.973
10.973
.718
.144
11.691
Sig.
76.382
.000
Coeficientes
Coeficientes no estandarizados
B
Tamao del lote
(Constante)
Coeficientes estandarizados
Error tpico
Beta
-.084
.010
104.652
34.037
-.969
Sig.
-8.740
.000
3.075
.028
c. Encuentre el mejor modelo vlido que estime el nmero de unidades defectuosas en funcin
del tamao del lote. Use un nivel de confianza del 4%. Justifique su respuesta mostrando todo
el procedimiento.
d. Con el modelo validado, calcule un intervalo de confianza del 90% para el pronstico del
nmero de unidades defectuosas promedio para los lotes con 40 unidades.
1,42
1,65
3,96
4,2
238
c. Estime con una confianza del 95% las ventas promedio de la empresa para el ao
2003.
Resumen del modelo y estimaciones de los parmetros
Variable dependiente: Ventas en millones de dlares
Resumen del modelo
Ecuacin
Lineal
Cuadrtico
Potencia
Exponencial
R cuadrado
.883
.901
.876
.931
F
22.556
9.115
21.203
40.782
gl1
gl2
3
2
3
3
Sig.
.018
.099
.019
.008
Regresin
Residual
Total
Suma de
cuadrados
8.281
1.101
9.382
1
2
1
1
Constante
-.300
.480
.800
.605
b1
.910
.241
.980
.406
b2
.111
Lineal
ANOVA
Resumen del modelo
R
.939
R cuadrado
.883
R cuadrado
corregida
.843
Error tpico de
la estimacin
.606
Media
cuadrtica
8.281
.367
gl
1
3
4
F
22.556
Sig.
.018
Coeficientes
Coeficientes
estandarizad
os
Coeficientes no
estandarizados
Ao
(Constante)
B
.910
-.300
Error tpico
.192
.635
Beta
.939
t
4.749
-.472
Sig.
.018
.669
Cuadrtico
Resumen del modelo
R
.949
R cuadrado
.901
R cuadrado
corregida
.802
Error tpico de
la estimacin
.681
ANOVA
Regresin
Residual
Total
Suma de
cuadrados
8.455
.928
9.382
gl
2
2
4
Media
cuadrtica
4.227
.464
F
9.115
Sig.
.099
Coeficientes
Coeficientes no
estandarizados
Ao
Ao ** 2
(Constante)
B
.241
.111
.480
Error tpico
1.113
.182
1.461
Coeficientes
estandarizad
os
Beta
.249
.704
t
.217
.612
.329
Sig.
.848
.603
.774
Potencia
239
ANOVA
Resumen del modelo
R
.936
R cuadrado
corregida
.835
R cuadrado
.876
Regresin
Error tpico de
la estimacin
.271
Suma de
cuadrados
1.552
Media
cuadrtica
1.552
.220
.073
1.772
Residual
Total
gl
F
21.203
Sig.
.019
F
40.782
Sig.
.008
Coeficientes
Coeficientes no
estandarizado
s
B
Error tpico
Coeficientes
estandarizad
os
t
4.605
Sig.
.019
(Constante
.800
.190
4.219
)La variable dependiente es ln(Ventas en millones de dlares).
.024
ln(Ao)
.980
.213
Beta
.936
Exponencial
ANOVA
Resumen del modelo
R
.965
R cuadrado
.931
R cuadrado
corregida
.909
Error tpico de
la estimacin
.201
Regresin
Suma de
cuadrado
s
1.650
Media
cuadrtic
a
1.650
.121
.040
1.772
Residual
Total
gl
Coeficientes
Coeficientes no
estandarizados
Ao
(Constante)
B
.406
.605
Error tpico
.064
.128
Coeficientes
estandarizad
os
Beta
.965
t
6.386
4.740
Sig.
.008
.018
137.La Enigma Steel S.A. ha estado buscando los factores que influyen en la cantidad de
acero (en miles de toneladas) que es capaz de vender al ao (Y). La administracin
sospecha que los siguientes son los factores principales: la tasa anual de inflacin del pas
(X1), el precio promedio por tonelada mediante el cual el acero importado establece los
precios (en dlares) de la Allegheny (X2), y el nmero de automviles (en cientos de
miles) que los fabricantes de autos de Estados Unidos estn planeando producir en ese
ao (X3). Se ha recogido los siguientes datos correspondientes a los ltimos aos:
Ao
Y (millones de
toneladas vendidas)
X1: Tasa
de inflacin
X3: Nmero
de automviles
2007
2008
2009
2010
3,90
3,30
3,70
4,90
5,40
4,70
5,00
3,00
2,90
5,30
4,00
4,80
6,30
4,90
5,80
6,90
240
2011
4,00
4,30
4,20
2012
3,90
5,50
2,90
2013
3,20
7,00
2,90
Se procesaron los datos en SPSS y se obtuvo la siguiente informacin:
6,60
5,90
6,00
27
34
45
44
2012
33
36
46
51
2013
34
40
47
53
2014
35
42
49
55
a. Calcule los ndices estacionales de estos datos (use un promedio mvil centrado de 4
trimestres).
b. Estime el ingreso de la compaa, para el primer trimestre del ao 2015.
139.Los siguientes datos corresponden a las ventas trimestrales de Televisores LCD (en miles
de $) de la tienda X-Mart:
Ao
Trimestre Ingreso
2013
2014
2015
III
40
IV
53
34
II
47
III
42
IV
55
35
a. Calcule los ndices estacionales de estos datos, use un promedio mvil centrado de 3
trimestres.
b. Estime las ventas para el primer trimestre del ao 2015 (con estacionalidad).
241
II
III
IV
II
III
IV
2011
1526,60
1645,38
1820,53
1810,41
2012
1585,12
1609,85
1883,20
2017,29
2013
1886,31
1937,36
2150,52
2261,44
2014
1937,03
1942,07
2171,69
2539,38
Fuente: INEI
a. Calcule los ndices estacionales usando un promedio mvil centrado de tres trimestres.
b. Estime las ventas de cemento para el ao 2015.
142.Se cuenta con datos trimestrales sobre la produccin de agua embotellada de mesa (miles
litros)
Aos
I
II
III
IV
2011
71616,44
45424,90
45378,07
64613,97
2012
80248,18
51302,09
54369,14
73153,71
2013
101889,36
63152,46
64466,90
86954,61
2014
109095,61
85450,26
90475,89
103314,44
300
II
350
242
2014
III
320
IV
800
742
II
655
III
488
IV
900
a. Calcule interprete los ndices estacionales de estos datos, use un promedio mvil
centrado de 3 trimestres.
b. Sobre la base de las salidas obtenidas con el SPSS que se muestran a continuacin,
escriba la ecuacin de estimacin de la serie desestacionalizada considerando el
mejor modelo vlido de tendencia. Luego estime las ventas para el ao 2015
(considerando la estacionalidad).
Resumen del modelo y estimaciones de los parmetros
Variable dependiente:ydes
Resumen del modelo
Ecuacin
R cuadrado
gl1
gl2
Sig.
Constante
b1
b2
Lineal
,566
7,812
,031
282,168
64,493
Cuadrtico
,625
4,175
,086
124,798
158,914
Potencia
,647 10,999
,016
290,591
,461
Exponencial
,612
,022
299,911
,129
9,478
-10,491
Potencia
Coeficientes
Coeficientes no
estandarizados
B
ln(t)
(Constante)
,461
290,591
Error tpico
,139
59,794
Coeficientes
estandarizados
t
Beta
,804
3,316
4,860
Sig.
,016
,003
144.Conservera Pez Azul est interesado en promover la venta de Salmn en conserva por
su alto valor nutritivo, motivo por el cual este producto se encuentra a la venta en el
autoservicio desde agosto del 2013. Se desea realizar la proyeccin para Abril de 2014
utilizando el mtodo de atenuacin exponencial, con una ponderacin de = 0.3, =
0.5 y = 0.8. Complete la tabla que se muestra a continuacin para cada constante de
suavizacin y realice el pronstico para Abril 2014. Debe tener en cuenta que la seal de
rastreo se encuentre dentro de los lmites indicados.
T
Mes
Venta Y est Error
1
Ag 2013
250
Set 2013
220
Oct 2013
225
243
Nov 2013
219
Dic 2013
200
En 2014
230
Feb 2014
270
Mar 2014
310
PRON
DAM
EMC
PEMA PME
145.El administrador de un restaurante desea mejorar el servicio que brinda a sus clientes y
tambin el horario de sus empleados, basndose en la afluencia diaria de clientes durante
las pasadas tres semanas y slo para los fines de semana incluyendo el viernes. El nmero
de clientes (cientos de clientes) atendidos en el restaurante en el perodo citado fue:
Clientes
Semanas Das
t
Yt
Vie
6.5
Sab
8,1
Dom
6,5
Vie
6,6
Sab
8,8
Dom
Vie
7,2
Sab
9,2
Dom
7,5
Semana 1
Semana 2
Semana 3
10
11
12
1720
2115
1980
2310
1850
1600
2120
1870
2200
2010
1550
2220