Вы находитесь на странице: 1из 175

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ

Facultad de Ciencias e Ingenierı́a

NOTAS DE CLASE DEL CURSO DE ESTADÍSTICA APLICADA

Luis Hilmar Valdivieso Serrano

2014
Introducción

Las presentes notas de clase del curso de Estadı́stica Aplicada son la sı́ntesis de varios semes-
tres de cátedra que el autor ha desarrollado en la Facultad de Ciencias e Ingenierı́a de la Pontificia
Universidad Católica del Perú. El curso esta básicamente orientado a los futuros Ingenieros Indus-
triales; sin embargo, su contenido puede servir también como material de consulta para estudiantes
o profesionales de otras áreas de la Ingenierı́a, la Administración o la Economı́a.

La Estadı́stica, como campo de estudio, es el arte y la ciencia de dar sentido a los datos. Ella
proporciona un conjunto de métodos, técnicas o procedimientos para recopilar, organizar, presentar
y analizar datos a fin de describirlos o realizar con ellos generalizaciones válidas. Estos aspectos
resultan invaluables para todo profesional, pues son finalmente los datos los que brindan al profesional
la información necesaria para su toma de decisiones.

Los tópicos que nosotros cubriremos en el curso recaen básicamente en el análisis de los datos
e intentan dar una introducción a las distintas técnicas estadı́sticas que se emplean en campos tan
diversos como el control de calidad, la investigación de operaciones, la simulación de sistemas, la
teorı́a de decisiones y la planificación entre otros. Dada la gran diversidad de aplicaciones, no existe
en la actualidad un texto adecuado que englobe todos estos puntos. Estas notas de clase, en su quinta
edición revisada, pretenden justamente cubrir tal vacı́o.

Deseo finalmente agradecer a la profesora Maria Luisa Montero y al profesor Carlos Véliz, quienes
han colaborado conmigo en el dictado del curso. Algunos de los problemas de esta edición son de su
autorı́a.

Prof. Luis Valdivieso


Índice general

1. VARIABLES ALEATORIAS 1
1.1. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Distribuciones importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. Simulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4. Confiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5. Teorı́a de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.5.1. Toma de decisiones sin información muestral . . . . . . . . . . . . . . . . . . . 24
1.5.2. Toma de decisiones con información muestral . . . . . . . . . . . . . . . . . . . 28
1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2. DISTRIBUCIONES MUESTRALES 53
2.1. Propiedades de la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.2. Distribuciones muestrales asociadas a la normal . . . . . . . . . . . . . . . . . . . . . . 54
2.2.1. La distribución chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.2. La distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.2.3. La distribución F de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3. Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.3.1. Corrección por finitud para los IC y tamaños de muestra . . . . . . . . . . . . 59
2.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3. CONTRASTES DE HIPÓTESIS 69
3.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.2. Tamaños de muestra y curvas OC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3. Muestreo por aceptación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4. La distribución multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.5. Contrastes de bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.6. Contrastes de Independencia y proporciones . . . . . . . . . . . . . . . . . . . . . . . . 91
3.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

3
0

4. DISEÑOS EXPERIMENTALES 109


4.1. Análisis de varianza a una via . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.1.1. El modelo de efectos fijos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.1.2. Estimación de los parámetros del modelo . . . . . . . . . . . . . . . . . . . . . 113
4.1.3. El modelo de efectos aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.1.4. Comparaciones múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.2. Diseños de bloques completamente aleatorizados . . . . . . . . . . . . . . . . . . . . . 120
4.3. Análisis de varianza a dos vias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.4. El diseño 2K . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.4.1. Una sola réplica en el diseño 2K . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

5. ANÁLISIS DE REGRESIÓN 149


5.1. El modelo de regresión lineal simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.2. El modelo de regresión lineal múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.3. El ajuste de los datos al modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.4. Contrastes de hipótesis en el modelo de regresión lineal . . . . . . . . . . . . . . . . . 155
5.4.1. El contraste de adecuación del modelo . . . . . . . . . . . . . . . . . . . . . . . 155
5.4.2. Contrastes sobre los parámetros individuales j ’s . . . . . . . . . . . . . . . . . 155
5.4.3. Contrastes sobre un grupo de variables independientes . . . . . . . . . . . . . . 156
5.5. Intervalos de estimación y predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.6. Contribución relativa de las variables independientes . . . . . . . . . . . . . . . . . . . 158
5.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

A. Formulario y tablas estadı́sticas 171


Capı́tulo 1

VARIABLES ALEATORIAS

1.1. Conceptos básicos

El concepto seminal de la teorı́a estadı́stica lo constituye el de experimento aleatorio. Este es defi-


nido como un proceso real o hipotético cuyos resultados no son posibles de preverse aún cuando éste
se repita indefinidamente. Si bien existe en todo esto un problema de incertidumbre ello no descarta
la posibilidad de listar todo lo que en el experimento pudiera pasar y agrupar estos resultados en un
conjunto S. Este conjunto es llamado el espacio muestral y todo subconjunto de él es denominado un
evento 1 . Diremos que un evento A ocurre, si es que el resultado del experimento aleatorio resulta
ser un elemento de A. Dado que uno no tiene la certeza de que un evento A ocurra, será conveniente
introducir una función que nos mida tal incertidumbre. Esta medida se denomina una probabilidad.
Ella asigna al evento A un número P (A) entre 0 y 1, el cual nos mide el grado de factibilidad de
que A ocurra ; mientras más cercano este P (A) a 0, menos seguros estaremos de que A ocurra; y
por el contrario, mientras más cercano este P (A) a 1, más seguros estaremos de que A ocurra. Para
ser más formales, una probabilidad es una función: P : 2S ! [0, 1] que satisface los dos siguientes
axiomas:
(P1) P (S ) = 1.
(P2) Para todo par de eventos disjuntos A y B (A \ B = ;), P (A [ B) = P (A) + P (B).
El axioma aditivo (P 2) puede también extenderse a más de dos eventos; es decir, a garantizar que
la probabilidad de la unión de varios eventos disjuntos entre sı́ sea la suma de las probabilidades de
estos eventos. Esta extensión puede hacerse incluso para una familia enumerable de eventos disjuntos.
1
En términos formales, a la colección de todos los eventos se le denomina una álgebra. Esta es una colección de
subconjuntos F de S que es cerrado bajo complementos y uniones enumerable de sus elementos. Lo que asumiremos en
nuestro curso es que F = 2S ; sin embargo, este conjunto potencia podrı́a ser demasiado grande como para permitir luego
que los eventos posean una medida de incertidumbre consistente. Tal hecho, por fortuna, no nos ocasionará inconveniente
práctico alguno.

1
2

Es directo verificar, partiendo sólo de la definición anterior, las siguientes propiedades de gran
utilidad.

Proposición 1 1. P (;) = 0.

2. P (Ac ) = 1 P (A).

3. P (A [ B) = P (A) + P (B) P (A \ B).

4. Si A ✓ B ) P (A)  P (B).

Al margen de las consideraciones teóricas, y contrario a lo que uno pueda creer, una probabilidad
no se define de una única manera. Consideremos por ejemplo que tenemos mañana una clase a las
8 am y que deseamos calcular la probabilidad de que lleguemos a la Universidad antes de esa hora.
Alguién que no lo conoce podrı́a estar tentado a decir que es igualmente probable que llegue como
no antes de las 8 am; es decir, el estima esta probabilidad en 0.5. Otra persona, por el contrario,
conociendo que usted usualmente llega temprano a la Universidad podrı́a estimar esta probabilidad
en 0.8. Desde un punto de vista formal, no podemos rechazar a priori ninguna de estas aseveraciones.
Ambas, eso si con diferentes supuestos, han calculado una probabilidad que a todas luces no puede
refutarse desde el punto de vista teórico.
Entre las distintas formas prácticas de definir una probabilidad podemos mencionar las siguientes:
Definición clásica: En ésta se asegura que si S es finito y todos sus elementos tienen la misma
factibilidad de ocurrencia, entonces la probabilidad del evento A ⇢ S, viene dada por:

número de elementos de A
P (A) = .
número de elementos de S

Esta definición, que muchas veces se lee como “casos favorables entre casos posibles”, presenta dos
limitaciones: ella carece de sentido si S es un conjunto infinito y además no nos provee de una
medida adecuada de incertidumbre cuando los elementos de S presentan distintas factibilidades de
ocurrencia. Piense, por ejemplo, en el experimento que consiste en lanzar una caja de fósforos y en
el evento de que esta caiga sobre uno de sus lados más pequeños. De aplicarse la definición clásica,
podrı́amos pensar equı́vocamente que es tan probable que la caja caiga sobre uno de sus lados más
pequeños a que caiga sobre uno de sus lados más grandes.
Para subsanar los inconvenientes de la definición clásica, se acostumbra utilizar la denominada
definición frecuencial.
Definición frecuencial: En ésta se asegura que de repetirse un experimento aleatorio n veces y ocurrir
en nA de ellas el evento A, entonces la probabilidad de A viene dada aproximadamente por:

nA
P (A) = .
n
ESTADISTICA APLICADA Luis Valdivieso 3

Decimos aproximadamente, pues la probabilidad exacta se obtiene de tomarse n ! 1.


Retomando el caso de la caja de fósforos es claro que se dispone ahora de una manera más adecuada
de definir la probabilidad de que la caja caiga sobre uno de sus lados más pequeños; si por decir
de las 100 veces que lanzamos el borrador solo en dos ocasiones resulta caer ésta sobre uno de sus
2
lados más pequeños, entonces la probabilidad de este evento será aproximadamente 100 = 0.02 y no
1
3 como lo es con la definición clásica.

Definición 1 La Probabilidad Condicional P (. | A) es una función que asigna a un evento B, un


número P (B | A) entre 0 y 1, el cual nos mide el grado de factibilidad de que ocurra el evento B, de
conocerse que el evento A ya ocurrió. Concretamente:

P (A \ B)
P (B | A) = .
P (A)

Si P (B | A) = P (B), entonces intuitivamente de nada nos servirá saber si A ya ocurrió o no


para calcular la probabilidad de que B ocurra. En este caso diremos que los eventos A y B son
independientes. De manera equivalente tenemos la siguiente definición.

Definición 2 Dos eventos A y B son independientes si P (A \ B) = P (A)P (B). En general, los


eventos A1 , A2 , . . . , An son independientes si la probabilidad de la intersección de cualquier subcon-
junto de estos es el producto de sus probabilidades.

Si por ejemplo lanzamos dos monedas y definimos los eventos A = la primera moneda cae sobre
su cara y B = la segunda moneda cae sobre su cara, entonces estos eventos son independientes. En
efecto, saber el resultado del primer lanzamiento no tendrá ninguna ingerencia en el resultado del
segundo lanzamiento.
Ejemplo: Supongamos que tenemos dos lotes de 7 y 9 artı́culos que los denotaremos respectivamente
como los lotes I y II. Por error en el lote I se colocaron dos y en el lote II tres artı́culos defectuosos.
Supongamos ahora que ud. elige uno de los lotes al azar y selecciona de este un artı́culo. Defı́nanse
los eventos A = El lote elegido es el lote I y B = Se seleccione un artı́culo defectuoso. Si se nos dijera
que hemos elegido el lote I, la probabilidad de eligir un artı́culo defectuoso viene dada por:

2
P (B | A) = .
7

¿ Qué es lo que pasarı́a ahora si es que no se nos diera la información A ?, ¿ cómo se modificarı́a, si
es que lo hace, la probabilidad de seleccionarse un artı́culo defectuoso ?. El siguiente teorema, que
nos permitirá resolver estas interrogantes, constituye una de las herramientas más útiles en el cálculo
de probabilidades.
4

Teorema 1 ( Probabilidad total) Sean A1 , A2 , . . . , An n eventos disjuntos dos a dos (Ai \ Aj =


;, 8i 6= j) que unidos conforman el espacio muestral S. Si B es un evento cualesquiera, entonces
n
X
P (B) = P (B | Ai )P (Ai )
i=1

Demostración: Puesto que S = [ni=1 Ai y los eventos Ai de la partición de S son disjuntos, se tiene
que B = B \ S = [ni=1 (B \ Ai ), donde esta última unión es también disjunta. Luego por (P 2):
n
X n
X
P (B) = P (B \ Ai ) = P (B | Ai )P (Ai ). 
i=1 i=1

Teorema 2 (Teorema de Bayes) En el contexto del teorema anterior, se cumple que


P (B | Aj )P (Aj )
P (Aj | B) = Pn , 8j = 1, 2, . . . , n.
i=1 P (B | Ai )P (Ai )

Demostración: De la definición de probabilidad condicional:


P (Aj \ B) P (B | Aj )P (Aj ) P (B | Aj )P (Aj )
P (Aj | B) = = = Pn ,
P (B) P (B) i=1 P (B | Ai )P (Ai )

donde la última igualdad se sigue del teorema anterior. ⌅


Una manera práctica de resolver problemas que involucren la aplicación de estos teoremas es con
el uso de diagramas de árbol. Por ejemplo, si n = 3, un diagrama de árbol viene dado por:
B

A1
@
R Bc
@

B

- A2
A @
A R Bc
@
A
A B
A ✓
AU A3
@
R Bc
@

Ejemplo. Supongamos que en el ejemplo anterior Ud., luego de seleccionar al azar uno de los lotes,
selecciona al azar de éste 2 artı́culos .
a) ¿ Con qué probabilidad sólo uno de los artı́culos le resultará defectuoso ?.
b) Si Ud. encuentra que los dos artı́culos le resultaron defectuosos, ¿ de qué lote es más probable que
estos hayan sido seleccionados ?.
Solución: a) Sean los eventos A = se selecciona el lote I y B = se encuentra un artı́culo defectuoso.
2⇥2⇥5 10 2⇥3⇥6 1
Se nos pide P (B). Dado que P (B | A) = 7⇥6 = 21 y P (B | Ac ) = 9⇥8 = 2, el teorema de
probabilidad total o el diagrama de árbol siguiente:
ESTADISTICA APLICADA Luis Valdivieso 5
10
21 B

A
@
R Bc
@
1
2

A
A
A
1 1
2 A 2 B
A ✓
AU Ac
@
R Bc
@

10 1 1 1
implican que P (B) = P (B | A)P (A) + P (B | Ac )P (Ac ) = 21 ⇥ 2 + 2 ⇥ 2 = 0.488.
b) Sea el evento C = se encuentran dos artı́culos defectuosos. Para responder la pregunta debemos
obtener solo P (A | C), ya que la otra probabilidad a compararse es el complemento de esta. Al
1 1 1 1 11
igual que en a), P (C) = P (C | A)P (A) + P (C | Ac )P (Ac ) = 21 ⇥ 2 + 12 ⇥ 2 = 168 y por tanto
1
P (C|A)P (A) ⇥ 12
P (A | C) = P (C) = 21
11 = 0.3636. Ası́, es más probable de que estos artı́culos hayan sido
168
seleccionados del lote II.

Definición 3 (Variable aleatoria) Una variable aleatoria (v.a.) X es cualquier función:

X:S!R

En otras palabras, una v.a. es una aplicación que especifica una manera particular de cuantificar
los posibles resultados de un experimento aleatorio. Al conjunto de todos los posibles valores que
X puede tomar se le denota RX y se le llama el rango de X. Si RX es finito o enumerable, X se
denomina una v.a. discreta; mientras que si RX no es enumerable, X se denomina una v.a. continua.
El comportamiento probabilı́stico de una v.a. discreta se describe mediante:

Definición 4 (La función de probabilidad) Si X es una v.a. discreta, la función de probabilidad de


X viene dada por:
PX (x) = P (X = x) = P ({! 2 S / X(!) = x}).

P
Se sigue de esta definición que x2RX PX (x) = 1 y que si x 2
/ RX , entonces PX (x) = 0.
En el caso de una v.a. continua, la noción de función de probabilidad carece de sentido ya que
la factibilidad de que X tome un solo valor de entre infinitos es siempre nula. Esto sin embargo, no
limita la posibilidad de evaluar la probabilidad de que X tome valores en un intervalo. Para ello se
utiliza el siguiente concepto.
6

Definición 5 (La función de densidad) Si X es una v.a. continua, la función de densidad de X es


Rb
una aplicación fX : R ! [0, 1[ tal que P (a  X  b) = a fX (x)dx y tal que:
Z 1
Area bajo la gráfica de fX = fX (x)dx = 1.
1

Cabe remarcar que fX no es una probabilidad, sino simplemente un modelo matemático que nos
permite evaluar la probabilidad de que X tome valores en un intervalo [a, b] como el área bajo su
gráfica entre los puntos a y b.

Definición 6 (La función de distribución) La función de distribución de una v.a. X viene dada por:

FX (x) = P (X  x) = P ({! 2 S / X(!)  x})

Proposición 2 La función de distribución satisface las siguientes propiedades:


1.- FX es una función creciente y continua por la derecha.
2.- lı́mx! 1 FX (x) = 0 y lı́mx!1 FX (x) = 1.
3.- (P
ux,u2RX PX (u), si X es una v.a. discreta
FX (x) = Rx
1 fX (u)du , si X es una v.a. continua.
dFX (x)
4.- Si X es una v.a. continua, fX (x) = dx .

Definición 7 (El valor esperado) Sea X una v.a. y H : R ! R una función que transforma a la
v.a. X en una nueva v.a. H(X). Se define el valor esperado de H(X) como:
(P
x2RX H(x)PX (x), si X es una v.a. discreta
E[H(X)] = R1
1 H(x)fX (x)dx , si X es una v.a. continua.

Si H es la función identidad, obtendremos µ = E[X]. A este número se le llama la media o valor


esperado de X y es utilizado como un representante, o si se quiere, como un valor promedio de los
posibles valores que X puede tomar.
Si tomamos la función H(x) = (x µ)2 en la definición anterior, obtendremos 2 = V (X) =
E[(X µ)2 ] = E[X 2 ] µ2 . A este número se le llama la varianza de X y a su raiz la desviación
estándar de X. Ambas constituyen medidas de la dispersión de los posibles valores de X.

Proposición 3 Dada una v.a. X y las constantes a y b, se cumple que:


1.- E[a + bX] = a + bE[X].
2.- V (a + bX) = b2 V (X).
ESTADISTICA APLICADA Luis Valdivieso 7

Ejemplo. Un comerciante desea averiguar el stock óptimo mensual K que deberı́a adquirir de un
bien perecedero. El precio de compra del bien es de a u.m. y el de venta de b u.m. Si a fin de mes,
le sobra cierta cantidad del bien, él lo rematará a c u.m.; mientras que si le falta para satisfacer la
demanda, comprará más del bien a d u.m. (se asume que los precios dados son unitarios y satisfacen
la relación: c < a < d < b). Si la demanda del bien es una v.a. continua X con función de distribución
conocida FX y se tiene un costo fijo mensual de e u.m., determine el valor óptimo de K.
Solución: La función de utilidad mensual del comerciante, que depende del stock K que él adquiere
y de la demanda del bien, viene dada por:
(
bX + c(K X) aK e, si X  K
U ⌘ U (X, k) =
bX aK d(X K) e, si X > K.

ó (
(b c)X + (c a)K e, si X  K
U ⌘ U (X, k) =
(b d)X + (d a)K e, si X > K.
El valor esperado de la utilidad mensual del comerciante, que lo denotaremos por g(K), es entonces:
Z 1 Z K Z 1
g(K) = E[U (X, k)] = U (x, K)fX (x)dx = U (x, K)fX (x)dx + U (x, K)fX (x)dx
1 1 K
Z K Z 1
= ((b c)x + (c a)K e)fX (x)dx + ((b d)x + (d a)K e)fX (x)dx
1 K
R1 RK R1 RK
Recordando que K fX (x)dx = 1 1 fX (x)dx y que K xfX (x)dx = µX 1 xfX (x)dx se tiene
que:
Z K Z K
g(K) = (d c) xfX (x)dx + (c d)K fX (x)dx + (d a)K + (b d)µX e (⇤).
1 1

El stock óptimo K ⇤ será aquel que maximize la utilidad esperada g(K). Para obtenerlo podrı́amos
reemplazar fX en (*); sin embargo, esta opción resulta poco práctica en los casos que la integración
resulte complicada. Una opción más recomendable será aquella consistente en resolver el problema
de maximización, utilizando el teorema fundamental del cálculo al momento de derivar g(K). La
derivada de g(K) con respecto a K viene dada por:
Z K Z K
0
g (K) = (d c)KfX (K)+(c d) fX (x)dx+(c d)KfX (K)+d a = (c d) fX (x)dx+d a.
1 1
00 0
Dado que g (K) = (c d)fX (K) < 0, la solución de la ecuación g (K) = 0 nos provee del stock
óptimo buscado. Este viene dado por el valor K ⇤ que satisface la relación:
d a
FX (K ⇤ ) = .
d c

8

Proposición 4 (Desigualdad de Chevychev) Sea X una v.a. con media µ y varianza 2. Entonces
para cualquier K > 0 se cumple que:

1
P (|X µ|  K ) 1 .
K2

Esta desigualdad, con K = 3, se aplica en el establecimiento de lı́mites de control de calidad. En


efecto, con K = 3 la desigualdad de Chevychev nos garantiza que X se ubicará en mas menos 3
8
desviaciones estándares de su media con una probabilidad de por lo menos 9; en otras palabras,
será poco probable de que X escape del intervalo

[µ 3 , µ + 3 ].

Si en un proceso se diera tal situación, entonces el proceso se dice que esta fuera de control y por
tanto debe de revisarse para poder detectar las causas de tan inusual comportamiento.
Ejemplo. En una lı́nea de producción contı́nua, se ha estimado que la probabilidad de que un artı́culo
resulte defectuoso es p = 0.2. Los artı́culos se empacan en lotes de 5. Si Ud. selecciona al azar un
lote y esta interesado en estudiar la v.a. X = número de artı́culos defectuosos que se encuentran en
el lote, halle la función de probabilidad de X ası́ como su media y desviación estándar.
Solución: El experimento aleatorio que genera esta situación consiste en seleccionar al azar uno de
los lotes producidos para averiguar luego la calidad de sus artı́culos. El espacio muestral S asociado
a este experimento contiene 25 = 32 posibles resultados y está dado explı́citamente por:

S = {(1B, 2B, 3B, 4B, 5B), (1B, 2B, 3B, 4B, 5D), . . . , (1D, 2D, 3D, 4D, 5D)}

La v.a. X = número de defectos en el lote es claramente una función que va de S en R; por


ejemplo, X((1B, 2B, 3B, 4B, 5B)) = 0. El rango de esta v.a. es RX = {0, 1, 2, 3, 4, 5}, por lo que X
es una v.a. discreta. Para hallar su función de probabilidad, haremos uso de las propiedades de una
probabilidad. Ya sabemos que si x 2
/ RX , entonces PX (x) = 0. Resta entonces hallar esta función
para los elementos del rango de X. Asumiendo independencia entre las calidades de los artı́culos que
se producen, comencemos por evaluar PX (0):

PX (0) = P (X = 0) = P ({! 2 S / X(!) = 0}) = P ({(1B, 2B, 3B, 4B, 5B)})

= P ({1B} \ {2B} \ . . . \ {5B}) = P ({1B})P ({2B}) . . . P ({5B}) = (0.8)5 ,

Ası́ también PX (1) = P (X = 1) = P ({! 2 S / X(!) = 1})

= P ({(1B, 2B, 3B, 4B, 5D), (1B, 2B, 3B, 4D, 5B), (1B, 2B, 3D, 4B, 5B), (1B, 2D, 3B, 4B, 5B),

(1D, 2B, 3B, 4B, 5B)}) = P ({(1B, 2B, 3B, 4B, 5D)}[{(1B, 2B, 3B, 4D, 5B)}[. . .[{(1D, 2B, 3B, 4B, 5B)})
ESTADISTICA APLICADA Luis Valdivieso 9

(P 2)
= P ({(1B, 2B, 3B, 4B, 5D)}) + P ({(1B, 2B, 3B, 4D, 5B)}) + . . . + P ({(1D, 2B, 3B, 4B, 5B)})
indep.
= P ({1B})P ({2B})P ({3B})P ({4B})P ({5D})+. . .+P ({1D})P ({2B})P ({3B})P ({4B})P ({5D})

= 5(0.2)(0.8)4 .

En general, no es difı́cil deducir que:


(
Cx5 0.2x 0.85 x, si x 2 RX
PX (x) =
0, en caso contrario.

y consecuentemente que,
5
X
µ = E[X] = xPX (x) = 5(0.2) = 1;
x=0

es decir, esperaremos obtener un artı́culo defectuoso en cada lote que elijamos al azar. Por otro lado,
v
u 5
p p uX p
= 2 = E[X ] µ = t
2 2 x2 PX (x) 1 = 5(0.2)(0.8) = 0.894427.
x=0


Una v.a. X con las caracterı́sticas anteriores se dice que tiene distribución Binomial de parámetros
n = 5 y p = 0.2 y es denotada por X ⇠ B(n = 5, p =0.2). A continuación mostramos algunas de las
distribuciones más importantes que utilizaremos recurrentemente en el curso.

1.2. Distribuciones importantes

Existen, como en el caso de la última variable ejemplificada, otras variables cuyas funciones
de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones.
Nosotros citaremos brevemente algunos de los modelos de mayor importancia.

Distribuciones Discretas
Un experimento de Bernoulli, es un experimento aleatorio con solo 2 posibles resultados: éxito y
fracaso. Sea p = P (éxito).
Distribución Binomial. Notación: X ⇠ B(n, p).
X = Número de éxitos en n experimentos independientes de Bernoulli.
Función de Probabilidad:
(
Cxn px (1 p)n x , si x = 0, 1, 2, ..., n.
PX (x) =
0 , en otro caso.

Valor esperado: µX = np. Varianza: 2 = np(1 p).


X
10

Distribución de Pascal o Binomial Negativa. Notación: X ⇠ BN (r, p).


X = Número de ensayos ( experimentos independientes de Bernoulli) hasta conseguir el r-ésimo
éxito.
Función de Probabilidad:
(
Crx 1
1 (1 p)x r pr , si x = r, r + 1, r + 2, ...
PX (x) =
0 , en otro caso.

r(1 p)
Valor esperado: µX = pr . Varianza: 2
X = p2
.
NOTA: Si r = 1, X se dice que es una variable aleatoria con distribución geométrica de parámetro
p, y se le denota por X ⇠ G(p).
Distribución Hipergeométrica. Notación: X ⇠ H(N, M, n).
Considérese una población de N elementos, M de los cuales son de un tipo A, y supongamos se
extraen sin reemplazo una muestra de n elementos de esta población. Entonces:
X = Número de elementos de tipo A en la muestra.
Función de Probabilidad:
( N M
CxM Cn x
N , si x = 0, 1, 2, ..., n.
PX (x) = Cn
0 , en otro caso.

Valor esperado: µX = n M
N . Varianza:
2
X = nM
N (1
M N n
N )( N 1 ).
NOTAS: 1.- En PX se esta usando la convención que Cab = 0, si a > b.
M
2.- Si la selección de la muestra fuera con reemplazamiento, entonces X ⇠ B(n, p = N ).

PROCESO DE POISSON: Un conjunto de eventos discretos se dice que esta generado por un proceso
de Poisson de tasa !, si para cualquier intervalo I(usualmente de tiempo) de longitud suficientemente
pequeña h > 0, se tiene que:

i) P (ocurrencia de un evento en I) ⇠
= wh.
ii) P (ocurrencia de 2 o más eventos en I) ⇠
= 0.
iii) La ocurrencia de eventos en intervalos disjuntos del tipo I son independientes.

Distribución de Poisson. Notación: X ⇠ P( = wt).


Si se observa un proceso de Poisson de tasa ! durante t unidades, entonces
X = Número de eventos en [0, t] generados por el proceso.
Función de Probabilidad: ( xe
x! , si x = 0, 1, 2, ...
PX (x) =
0 , en otro caso.
Valor esperado: µX = . Varianza: 2 = .
X
ESTADISTICA APLICADA Luis Valdivieso 11

Distribuciones continuas
Distribución Uniforme. Notación: X ⇠ U ([a, b]).
Esta distribución se da cuando la variable aleatoria X puede tomar indistintamente cualquier
valor en el intervalo [a, b].
Función de densidad: (
1
b a , si x 2 [a, b]
fX (x) =
0 , en otro caso.

a+b 2 (b a)2
Valor esperado: µX = 2 . Varianza: X = 12 .
Distribución Exponencial. Notación: X ⇠ exp( ).
Función de densidad: (
e x , si x 0
fX (x) =
0 , en otro caso.

Valor esperado: µX = 1 . Varianza: 2


X = 1
2 .
NOTA: Si para un proceso de Poisson de tasa ! se define la variable aleatoria X = tiempo (u otra
magnitud) hasta la ocurrencia del primer evento, entonces X ⇠ exp( = !)
Distribución Gamma. Notación: X ⇠ (↵, ).
Función de densidad: (
1 ↵ x↵ 1 e x
(↵) , si x > 0
fX (x) =
0 , en otro caso.

Valor esperado: µX = ↵ . Varianza: 2


X = ↵
2 .
NOTAS: 1.- Si ↵ = 1, entonces X ⇠ exp( ).
2.- Si para un proceso de Poisson de tasa ! se define la variable aleatoria

X = tiempo (u otra magnitud) hasta la ocurrencia del ↵ ésimo evento,

entonces X ⇠ (↵, !)
n
3.- Si ↵ = 2 y = 21 , X se dice que es una variable aleatoria con distribución chi-cuadrado de n
grados de libertad, y se le denota por: X ⇠ 2 (n).

Distribución Beta. Notación: X ⇠ B(↵, ).


Función de densidad:
(
(↵+ ) ↵ 1 1
fX (x) = (↵) ( ) x (1 x) , si 0 < x < 1
0 , en otro caso.

↵ 2 ↵
Valor esperado: µX = ↵+ . Varianza: X = (↵+ )2 (↵+ +1)
.
NOTA: Si ↵ = = 1, entonces X ⇠ U (]0, 1[).
12

Distribución de Weibull. Notación: X ⇠ W (↵, ).


Función de densidad: (
↵ x↵ 1e x↵ , si x > 0
fX (x) =
0 , en otro caso.
1 2 1 2
(1+ ↵ ) 2 (1+ ↵ ) ( (1+ ↵ ))
Valor esperado: µX = 1 . Varianza: X = 2 .
↵ ↵
NOTA: Si ↵ = 1, entonces X ⇠ exp( ).
Distribución Normal. Notación: X ⇠ N (µ, 2 ).

Función de densidad:
1 1
(x µ)2
fX (x) = p e 2 2
2⇡
Valor esperado : µX = µ. Varianza : 2 = 2.
X
NOTA: Cuando µ = 0 y 2 = 1, a X se le denota por Z y se le llama una variable aleatoria
con distribución normal estándar; vale decir, Z ⇠ N (0, 1). Toda v.a. normal X ⇠ N (µ, 2) puede
convertirse en una v.a. normal estándar (estandarizarse) a través de la transformación:
X µ
Z=

Distribución Lognormal. Notación: X ⇠ Ln(µ, 2)

Una v.a. X tiene distribución lognormal de parámetros µ y 2, si es que su logaritmo natural


tiene distribución normal de parámetros µ y 2 ; vale decir:

X ⇠ Ln(µ, 2) , LnX ⇠ N (µ, 2 ).

2
2 2
Valor esperado: µX = eµ+ 2 . Varianza: 2
X = e2µ+ (e 1).

Ejemplo. Suponga que las imperfecciones de recubrimiento en un cable se presentan a través de


un proceso de Poisson a razón de 2 por cada 5 metros. Los cables son empacados en rollos de 20
metros cada uno. Para controlar la calidad de estos rollos, se selecciona al azar para inspección un
tramo de 5 metros de cable y se decide desechar (para otros usos) todo rollo que contenga mas de
una imperfección.
a) ¿ Con qué probabilidad este control desechara un rollo que contiene 3 imperfecciones ?.
b) Si en un dı́a se han producido 20 rollos , ¿ cuantos se esperará sean desechados ?.
c) Si el precio por metro de cable es una variable aleatoria con distribución normal de media 5 soles
y desviación estándar 0.5 soles y una empresa interesada descuenta por cada imperfección que se
de en un rollo 0.5 soles, ¿ cuánto esperará pagar la empresa por cada rollo que adquiera ?. ¿ Con
qué probabilidad la empresa pagará menos de 90 soles por un rollo sin imperfecciones ?.
d) Suponga que existe otra alternativa de control que consiste en determinar la longitud del rollo
apenas se ubique en la inspección una quinta imperfección. ¿ Con qué longitud se esperarı́a salgan
los rollos bajo esta polı́tica de control ?.
ESTADISTICA APLICADA Luis Valdivieso 13

Solución: a) Sea X1 = número de imperfecciones que contiene el tramo bajo inspección del rollo y
sea X2 = número de imperfecciones que contiene el tramo no inspeccionado del rollo. Se sigue que
X1 y X2 son variables aleatorias independientes con distribución de Poisson, teniendo la primera un
parámetro de 1 = 25 ⇥ 5 = 2 y la segunda un parámetro de 2 = 25 ⇥ 15 = 6. Note también que la v.a.
X = X1 + X2 , que representa el número de imperfecciones en todo el rollo, tiene una distribución de
2
Poisson con parámetro = 5 ⇥ 20 = 8 . Se nos pide

P (X1 2 | X1 + X2 = 3) = P (X1 = 2 | X1 + X2 = 3) + P (X1 = 3 | X1 + X2 = 3)


P (X1 = 2)P (X2 = 1) P (X1 = 3)P (X2 = 0) 72 8
= + = + = 0.15625.
P (X = 3) P (X = 3) 512 512
b) La probabilidad de que deseche un rollo es p = P (X1 2) = 1 P (X1 = 0) P (X1 = 1) =
1 3e 2 = 0.406. Ası́, Y = número de rollos que serán descartados de los 20 producidos es una
variable aleatoria con distribución Binomial de parámetros n = 20 y probabilidad de “éxito” p =
0.406. Luego se esperarán descartar en ese dia E[Y ] = 20 ⇥ 0.406 = 8.12 rollos (entre 8 y 9 rollos).
c) Si P ⇠ N (5, 0.25) denota a la variable del precio por metro (sin imperfecciones) que pagará la
empresa, entonces se espera que ella pague por un rollo cualquiera E[20P 0.5X] = 20E[P ]
0.5E[X] = 20(5) 0.5(8) = 96 soles. De otro lado, la probabilidad de que la empresa pague menos
de 90 soles por un rollo sin imperfecciones es P (20P < 90) = P (P < 4.5) = P (Z < 4.5 5
0.5 )
= P (Z < 1) = 0.15866.
d) Definamos la variable aleatoria continua L = longitud de cable inspeccionado hasta ubicar una
quinta imperfección (en metros). Entonces L tiene una distribución Gamma con parámetros ↵ = 5
y = 25 . Se nos pide luego E[L] = ↵
= 12.5; es decir, se esperarán obtener cables de 12 metros y
medio de longitud.

1.3. Simulación

En una simulación uno centra su interés en recrear, de manera artificial, un proceso real con el
fin de poder mejorar su comprensión. Nosotros estaremos interesados básicamente en simular valores
observados de una v.a. X, asumiendo que conocemos su función de distribución. Tales simulaciones
se pueden obtener a través del denominado método de Montecarlo. Este método se fundamenta en
el siguiente resultado.

Teorema 3 (La transformación integral) Sea F : R ! [0, 1] una función estrictamente creciente y
contı́nua y considérese la v.a. U ⇠ U (]0, 1[). Entonces
1
X=F (U )

es una v.a. con función de distribución F ; vale decir, FX = F .


14

Demostración: Sea x 2 R, entonces

FX (x) = P (X  x) = P (F 1
(U )  x) = P (U  F (x)) = F (x). ⌅

Dada una v.a. contı́nua X con función de distribución FX (que sabemos satisface los supuestos
del teorema), el teorema 3 implica que si U1 , U2 , . . . , Un son n v.a’s independientes de distribución
uniforme en el intervalo ]0, 1[ (esto es, una muestra aleatoria de tamaño n de U ⇠ U (]0, 1[), entonces

X1 = FX 1 (U1 ), X2 = FX 1 (U2 ), . . . , Xn = FX 1 (Un )

constituye una muestra aleatoria de tamaño n de la v.a. X. En otras palabras, si conocemos la función
de distribución de la v.a. contı́nua X, entonces podremos generar (simular) n valores observados de
una muestra aleatoria de esta variable en base a la selección al azar de n números en el intervalo
]0, 1[. Nótese que esto no es válido si X es una v.a. discreta, pues aquı́ FX no es una función contı́nua.
De manera práctica, la simulación de una muestra aleatoria de tamaño n de una v.a. X requiere
de los siguientes pasos:

1. Seleccionar de una tabla de números aleatorios o a través de algún software n números de 3


dı́gitos (esto es una convención y uno puede lograr mas precisión de tomarse más dı́gitos). En
caso de utilizarse una tabla de números aleatorios, uno seleccionará al azar cualquier número de
3 dı́gitos dentro de ella y luego tomará hacia abajo (o en cualquier otra dirección) los siguientes
números de tres dı́gitos requeridos. Vale aclarar que 0 como primer dı́gito se considera válido.
NOTA: En el curso estos números aleatorios serán dados. Ello se hará sólo para uniformizar
los resultados y evaluar los procedimientos.

2. Convertir los números aleatorios en decimales dividiéndolos entre 1,000 y obtener:


u1 , u2 , . . . , un . Estos números son los valores simulados de una muestra aleatoria de una v.a
U ⇠ U (]0, 1[), o si se quiere, n números seleccionados al azar del intervalo ]0, 1[.

3. Si la v.a. X es contı́nua, realizar con los números anteriores la transformación integral:

x1 = FX 1 (u1 ), x2 = FX 1 (u2 ), . . . , xn = FX 1 (un ).

Estos son los valores simulados de la muestra aleatoria de X que buscamos.

4. Si X es una v.a. discreta, los valores simulados de X vienen dados por:

xi = mı́n{x 2 RX /FX (x) ui }, 8i = 1, 2, . . . , n.

Ejemplo. Suponga que el tiempo de vida útil en años de una marca de fluorescentes es una v.a.
X ⇠ W (↵ = 2, = 1). Si Ud. adquiere 6 cualesquiera de estos fluorescentes, halle mediante simula-
ción sus tiempos de vida útil. Use los números aleatorios: 456, 987, 023, 333, 217, 620.
Solución: La densidad de la v.a. X viene dada por fX (x) = 2xe x2 , si x 0 y su gráfica es:
ESTADISTICA APLICADA Luis Valdivieso 15

p

El valor esperado de X es µX = (1 + 12 ) = 2 = 0.886; es decir, esperaremos que uno de estos
fluorescentes este funcionando sin problemas por aproximadamente unos 10 meses y tres semanas.
La función de distribución de esta v.a viene dada por FX (x) = 1 e x2 , si x 0 y FX (x) = 0,
en caso contrario. Su gráfica es la siguiente

2
Para la simulación necesitamos hallar la inversa de esta función. De la igualdad y = 1 e x .
q
obtenemos que x = Ln( 1 1 y ) y, por tanto, la función inversa de FX viene dada por F 1 (y) =
q
Ln( 1 1 y ), 8y 2 [0, 1[. Ası́, con los números aleatorios dados, tendremos los siguientes valores simu-
lados:
q q q
x1 = Ln( 1 01.456 ) = 0.78026, x2 = Ln( 1 01.987 ) = 2.084, x3 = Ln( 1 01.023 ) = 0.15254,
q q q
x4 = Ln( 1 01.333 ) = 0.63637, x5 = Ln( 1 01.217 ) = 0.4946 x6 = Ln( 1 01.620 ) = 0.98366.

Como se aprecia la mayorı́a de estos tiempos de vida caen por debajo del tiempo esperado de vida
del fluorescente. Esto puede explicarse por la asimetrı́a de la distribución. ⇤
16

Ejemplo. En una lı́nea de producción contı́nua, se ha estimado que la probabilidad de que un artı́culo
resulte defectuoso es p = 0.2. Los artı́culos se empacan en lotes de 5. Si ud. selecciona al azar 5 de
estos lotes, halle mediante simulación la cantidad de artı́culos defectuosos que contendrá cada uno.
Use los números aleatorios: 730, 602, 120, 456 y 310.
Solución: Si definimos la v.a. X = número de artı́culos defectuosos en un lote de la lı́nea de produc-
ción, entonces X ⇠ B(5, 0.2). La función de distribución de esta v.a. discreta se tabula seguidamente
para los elementos de su rango:

X=x PX (x) = Cx5 0.2x 0.85 x FX (x) = P (X  x)


0 0.32768 0.32768
1 0.4096 0.73728
2 0.2048 0.94208
3 0.0512 0.99328
4 0.0064 0.99968
5 0.00032 1
Con los números aleatorios convertidos a decimales y la tabla anterior obtendremos luego los siguien-
tes valores simulados:
x1 = 1, x2 = 1, x3 = 0, x4 = 1 y x5 = 0.

Según esta simulación en ninguno de los 5 lotes se encontrará más de un artı́culo defectuoso. ⇤
Ejemplo. El monto de los ahorros de los clientes de una financiera se asume que es una variable
aleatoria con distribución lognormal de parámetros µ = 6 y 2 = 4 (en dólares). La financiera
cataloga a sus clientes con ahorros iguales o superiores a los $ 5,000 como clientes preferenciales. Si
a ud. le asignan al azar a 6 clientes de la financiera
a) ¿ Cuál es la probabilidad de que le toquen al menos 2 clientes preferenciales ?.
b) Halle mediante simulación los montos de los ahorros de estos 6 clientes y con ello el número de
clientes preferenciales que le serán a usted asignados. Use los números aleatorios: 432, 520, 690, 101,
975 y 042.
Solución: a) Sea X el monto de ahorros de un cliente de la financiera y sea la v.a. U = número de
clientes preferenciales que le han sido a usted asignados. Entonces U ⇠ B(n = 6, p), donde
Ln(5, 000) 6
p = P (X 5, 000) = P (Y Ln(5, 000)) = P (Z ) = P (Z 1.26)
2
=1 FZ (1.26) = 1 0.89617 = 0.10383,

siendo Y ⇠ N (6, 4) y Z ⇠ N (0, 1). Ası́, P (U 2) = 1 P (U = 0) P (U = 1) = 1 0.896176


6(0.10383)(0.89617)5 = 0.12188243.
b) Estamos interesados en simular 6 valores x1 , . . . , x6 de la v.a. X. Por definición, x1 es tal que
Ln(x1 ) 6
P (X  x1 ) = 0.432. Esto es lo mismo a decir que P (Y  Ln(x1 )) = 0.432 ó P (Z  2 ) =0.432.
ESTADISTICA APLICADA Luis Valdivieso 17

De la tabla normal estándar obtenemos entonces que Ln(x1 ) 6


2 = 0.17 y por tanto x1 = e2( 0.17)+6 =
$ 287.148. De manera similar los demás valores simulados en dólares vienen dados por:

x2 = 450.33871, x3 = 1,096.6332, x4 = 32.136742, x5 = 20,332.991 y x6 = 12.8071.

Ası́, el número de clientes preferenciales que se nos asignará es de sólo uno (el quinto). ⇤

1.4. Confiabilidad

La confiabilidad de un producto se relaciona con la cualidad de éste de cumplir su función durante


el tiempo para el cual ha sido diseñado en condiciones medio ambientales controladas. Denotemos
por T a la variable aleatoria tiempo de vida útil del producto y supongamos se especifica que este
debe funcionar correctamente durante t0 unidades de tiempo. Entonces la confiabilidad del producto,
que la denotaremos por R, viene dada simplemente por:

R = P (T > t0 ).

Obviamente, al ser la confiabilidad la probabilidad de que el producto supere su tiempo de vida


especificado, el producto será más confiable mientras R este más cerca a uno y menos confiable,
mientras R este más cerca a 0.
Con frecuencia, un producto denota a un sistema conformado por varias componentes, cuya arqui-
tectura puede ser muy diversa. Nosotros estudiaremos los siguientes tipos de sistemas y veremos como
obtener la confiabilidad de estos conocidas las confiabilidades de cada una de sus n componentes.

a) Sistema en serie: En este sistema, todas las componentes deben funcionar para que el sistema
funcione. Esquemáticamente el sistema es del tipo:

b) Sistema en paralelo: En este sistema, basta que alguna de las componentes funcione para que
todo el sistema funcione: Esquemáticamente el sistema es del tipo:
18

c) Sistemas mixtos: Son sistemas conformados por una combinación de subsistemas en serie y en
paralelo. Esquemáticamente, un sistema de estos podrı́a ser el siguiente:

A fin de obtener las confiabilidades de los sistemas en serie y paralelo, supondremos en adelante un
tiempo de especificación t0 y la siguiente asunción natural: si Ti , i = 1, 2, ..., n denota el tiempo de
vida útil de cada componente i, entonces T1 , T2 , . . . , Tn son variables aleatorias independientes.
ESTADISTICA APLICADA Luis Valdivieso 19

Por definición, el tiempo de vida útil del sistema en serie, digamos TS , se relaciona con el tiempo
de vida útil de cada componente como TS = mı́n{T1 , T2 , . . . , Tn }. La confiabilidad de éste sistema
viene luego dada por:

Rs = P (TS > t0 ) = P (mı́n{T1 , T2 , . . . , Tn } > t0 ) = P (T1 > t0 )P (T2 > t0 ) . . . P (Tn > t0 ),

donde la última igualdad se desprende de la asunción de independencia. En resumen, la confiabilidad


de un sistema en serie, Rs , es:
Rs = R 1 R2 . . . Rn ,

donde Ri es la confiabilidad de la i-ésima componente.


Por definición, el tiempo de vida útil de un sistema en paralelo, digamos Tp , se relaciona con el
tiempo de vida de cada componente como TS = máx{T1 , T2 , . . . , Tn }. Entonces la confiabilidad de
éste sistema viene dada por:

Rp = P (Tp > t0 ) = P (máx{T1 , T2 , . . . , Tn } > t0 ) = 1 P (máx{T1 , T2 , . . . , Tn }  t0 )

=1 P (T1  t0 , T2  t0 , . . . , Tn  t0 ) = 1 P (T1  t0 )P (T2  t0 ) . . . P (Tn  t0 )

o brevemente por:
Rp = 1 ((1 R1 )(1 R2 ) . . . (1 Rn )),

donde Ri es la confiabilidad de la i-ésima componente.


En el caso mixto, la confiabilidad del sistema es obtenida reemplazando los subsistemas en serie
o paralelo por componentes que tengan exactamente la misma confiabilidad.
Estando capacitados para obtener la confiabilidad de un sistema complejo a través del de sus
componentes, nos ocuparemos ahora del estudio de una sola componente. Para ello supondremos que
el tiempo de vida útil de esta componente es una v.a T con función de densidad fT . Comenzaremos
extendiendo la noción de confiabilidad al de función de confiabilidad.

Definición 8 (Función de confiabilidad)

R(t) = P (T > t) = 1 FT (t).

Nótese que la confiabilidad de la componente se obtiene simplemente de evaluar esta función en su


tiempo de vida de especificación.
Supongamos ahora que observamos a la componente funcionando normalmente hasta el tiempo
t, entonces la probabilidad de que la componente falle un instante después (digamos antes de t + h)
es:
P (t < T < t + h) FT (t + h) FT (t)
P (t  T < t + h | T > t) = = .
P (T > t) R(t)
20

Si dividimos esta probabilidad entre h, obtendremos lo que se conoce como la razón de falla promedio
de la componente en el intervalo [t, t + h]. Al lı́mite de esta expresión cuando h ! 0 se le conoce
como la razón de falla instantánea en t, y se le denota por Z(t); concretamente:
FT (t + h) FT (t) fT (t)
Z(t) = lı́m = .
h!0 hR(t) R(t)

Definición 9 (Función razón de falla)


fT (t)
Z(t) = .
R(t)
La función razón de falla nos mide la propensión a falla de la componente a lo largo del tiempo.
Una tı́pica función razón de falla puede tener en la práctica la gráfica siguiente:

Como se aprecia se distinguen aqui tres zonas claramente diferenciadas: una zona de fallas ini-
ciales (Z(t) decreciente), una zona de fallas accidentales (Z(t) constante) y una zona de fallas por
desgaste (Z(t) creciente). Antes de mostrar algunos modelos que ajustan a gráficas como la anterior,
será interesante mostrar una relación que nos permite obtener la función de densidad del tiempo
dFT (t) dR(t)
de vida útil de la componente en base a su función razón de falla. Como fT (t) = dt = dt ,
entonces
fT (t) dLn(R(t))
Z(t) = =
R(t) dt
Rt
Z(u)du
y R(t) = e 0 . Luego, fT (t) = Z(t)R(t) puede escribirse como:
Rt
Z(u)du
fT (t) = Z(t)e 0 . (1.1)

El modelo exponencial. Este modelo asume que las fallas de la componente ocurren solo por accidente;
vale decir que:
Z(t) = = constante > 0, 8t 0.
ESTADISTICA APLICADA Luis Valdivieso 21

De (1.1) se sigue que el tiempo de vida útil T de una componente bajo este modelo tiene función de
densidad:
t
fT (t) = e , 8t 0.

En otras palabras, T ⇠ exp( ).


El modelo de Weibull. Este modelo asume que la función razón de falla de la componente toma la
forma:
Z(t) = ↵ t↵ 1
, 8t 0.

Nótese que si ↵ < 1, se estará modelando a una componente que tiene una alta propensión a sufrir
fallas iniciales; mientras que si ↵ > 1, se estará modelando a una componente con alta propensión
a sufrir fallas por desgaste. El modelo exponencial resulta un caso particular del modelo de Weibull
de tomarse ↵ = 1.
De (1.1) la función de densidad del tiempo de vida útil T de la componente bajo este modelo es:

t↵
fT (t) = ↵ t↵ 1
e , 8t 0.

En otras palabras, T ⇠ W (↵, ). En este modelo la función de confiabilidad de una componente


viene dada por:
fT (t) t↵
R(t) = =e .
Z(t)
Ejemplo: Considerese el siguiente sistema:

en donde las primeras 2 componentes: C1 y C2 son idénticas y siguen en su razón de falla un modelo
exponencial de parámetro = 1; mientras que la componente C3 en lı́nea sigue en su razón de falla
un modelo de Weibull de parámetros ↵ = 2 y = 1. Considere el tiempo en años.
a) Halle la función de confiabilidad del sistema y su confiabilidad si se especifica que este debe
funcionar medio año.
b) ¿ Qué tiempo se espera este funcionando el sistema ?.
22

Solución: a) Si Ri (t) denota a la función de confiabilidad de la i-ésima componente en este sistema,


entonces la confiabilidad de este sistema viene dada por:

t2 (t+t2 ) (2t+t2 )
R(t) = (1 (1 R1 (t))(1 R2 (t)))R3 (t) = (1 (1 e t )2 )e = 2e e

Como se especifica una duración de 6 meses, entonces t = 0.5 y la confiabilidad de este sistema es
R(0.5) = 0.658.
b) Si T es el tiempo de vida del sistema, deseamos hallar E[T ]. Para esto necesitaremos la función
de densidad de T , la cual se puede obtener por

0 (t+t2 ) (2t+t2 )
fT (t) = R (t) = 2(1 + 2t)e 2(1 + t)e .

R1
Por tanto, E[T ] = 0 tfT (t)dt = 1.47 años. ⇤

Ejemplo: Una tienda ha puesto en remate un lote de 60 pilas no etiquetadas, 12 de las cuales son
alcalinas de alta duración y el resto son pilas convencionales. Suponga que usted adquiere 4 de estas
pilas y las coloca en un dispositivo que necesita utilizarlo durante al menos 18 horas. Suponga que
según especificaciones, las razones de falla (en horas) de las pilas alcalinas siguen un modelo de
Weibull de parámetros ↵ = 2 y = 0.001 y la pilas convencionales siguen en su razón de falla un
modelo exponencial de parámetro = 0.05.
a) Si el dispositivo utiliza sus pilas en un sistema en paralelo, ¿ con qué probabilidad el dispositivo
le será de utilidad ?.
b)Si el dispositivo puede funcionar hasta con 3 pilas, ¿ con qué probabilidad el dispositivo le será de
utilidad ?.
Solución a) Sea X = número de pilas alcalinas de las 4 adquiridas y sea T Tiempo de vida útil del
sistema. Se sigue que X ⇠ H(60, 12, 4) y que la confiabilidad del sistema viene dado por R(18) =
P (T > 18). Por el teorema de probabilidad total esta última probabilidad puede escribirse como:

4
X
R(18) = P (T > 18) = P (T > 18 | X = x)PX (x)
x=0

Por tanto, si R1 = e 0.001(18 ) = 0.72325 y R2 = e 0.05(18) = 0.40657 denotan respectivamente a las


2

confiabilidades de las pilas alcalinas y convencionales a las 18 horas, se tiene que:

C012 C448 C112 C348


R(18) = (1 (1 R2 ) 4 ) + (1 (1 R1 )(1 R2 ) 3 )
C460 C460

C212 C248 C312 C148 C412 C048


+(1 (1 R1 )2 (1 R2 ) 2 ) + (1 (1 R1 )3 (1 R2 )) + (1 (1 R1 ) 4 )
C460 C460 C460
= 0.921475
ESTADISTICA APLICADA Luis Valdivieso 23

b) Sea Y = número de pilas de las 4 adquiridas que están funcionando pasadas las 18 horas. Se nos
pide la probabilidad de que Y sea al menos 3. Por el teorema de probabilidad total:
4
X
P (Y = 3) = P (Y = 3 | X = x)PX (x)
x=0

= 4(1 R2 )R23 PX (0) + ((1 R1 )R23 + 3R1 (1 R2 )R22 )PX (1) + (2(1 R1 )R1 R22 + 2R12 (1 R2 )R2 )PX (2)

+ (R13 (1 R2 ) + 3(1 R1 )R12 R2 )PX (3) + 4(1 R1 )R13 PX (4) = 0.2199121,

donde por ejemplo P (Y = 3 | X = 1) se obtiene al notar que la pila que no esta funcionando pudiera
ser la única alcalina o cualquiera de las otras 3 convencionales. Similarmente
4
X
P (Y = 4) = P (Y = 4 | X = x)PX (x)
x=0

= R24 PX (0) + R1 R23 PX (1) + R12 R22 PX (2) + R13 R2 PX (3) + R14 PX (4) = 0.0484

Luego, P (Y 3) = P (Y = 3) + P (Y = 4) =0.2683. ⇤
Ejemplo: Una máquina posee el siguiente modelo para su función razón de falla:
(
1, si 0 < t  2
Z(t) = t2
4 , si t > 2.

(Considere al tiempo en meses y que un mes tiene 30 dı́as)


a) Halle la función de densidad del tiempo de vida de la máquina.
b) Halle la función de confiabilidad de esta máquina.
c) Un empresario desea alquilar una máquina nueva de este tipo. El precio de alquiler es de $ 10 por
dı́a y la ganancia que le brinda la máquina de estar funcionando es de $ 15 por dı́a. En caso contrario
(de no funcionar la máquina) su ganancia se reducirá a solo $ 2 por dı́a. Si el alquiler se realiza por
un tiempo fijo y continuo K, ¿ cuál debe ser el valor de K que le permita al empresario maximizar
su utilidad esperada ?.
Solución: a) Sea T el tiempo de vida útil de la máquina en meses. Por (1.1) se tiene que si t  2,
R2 Rt u2 3
t2 ( 1du+ du) t2 ( 43 + 12
t
)
fT (t) = e t . De otro lado, si t > 2, fT (t) = 4e
0 2 4 = 4e . En resumen,
( t
e , si 0 < t  2
fT (t) = t2 ( 43 + 12
t
)
3

4e , si t > 2.

fT (t)
b) Por definición R(t) = Z(t) , luego:
(
e t , si 0 < t  2
R(t) = 3
( 43 + t4 )
e , si t > 2.
24

c) La función de utilidad del empresario viene dada por:



390T 240K, si 0  T  K
U (T, K) =
150K , si T > K.
Por tanto, él esperará obtener de utilidad al alquilar la máquina durante K meses:
Z K Z 1
g(K) = E[U (T, K] = (390t 240K)fT (t)dt + 150KfT (t)dt.
0 K
R1 RK
Recordando que K fT (t)dt = 1 0 fT (t)dt, podemos luego escribir que:
Z K Z K
g(K) = 390 tfT (t)dt 390K fT (t)dt + 150K.
0 0
Derivando e igualando a 0, el tiempo de alquiler óptimo viene dado por K ⇤ tal que este resuelve:
5
FT (K ⇤ ) = .
13
5
Dado que FT (2) = 1 e 2 = 0.8646 > 13 , se sigue entonces que K ⇤ < 2 y que por tanto
⇤ 5
1 e K = .
13
Consecuentemente, el empresario deberá de alquilar la máquina por un periodo de K ⇤ =0.4855 meses.

1.5. Teorı́a de decisiones

1.5.1. Toma de decisiones sin información muestral

En un problema de decisión un agente tiene ante si varias alternativas o actuaciones: a1 , a2 , ..., an


a seguir. Cada actuación tiene como consecuencia una retribución que depende a su vez de ciertos
eventos inciertos, excluyentes y exhaustivos: s1 , s2 , . . . , sk , llamados estados de la naturaleza.
El problema del agente consiste en decidir cuál actuación debe seguir a fin de lograr las mejores
retribuciones.

Definición 10 Una tabla de retribuciones es un arreglo tabular de las retribuciones asociadas a cada
posible actuación y estado de la naturaleza.

Estados de la naturaleza
s1 s2 ... sj ... sk
a1 R11 R12 ... R1j ... R1k
a2 R21 R22 ... R2j ... R2k
.. .. .. .. .. .. ..
. . . . . . .
Actuaciones ai Ri1 Ri2 ... Rij ... Rik
.. .. .. .. .. .. ..
. . . . . . .
an Rn1 Rn2 ... Rnj ... Rnk
ESTADISTICA APLICADA Luis Valdivieso 25

donde Rij ⌘ R(ai , sj ) denota a la retribución obtenida de elegirse la actuación ai y ocurrir el estado
de la naturaleza sj .
Nota: En adelante asumiremos, sin pérdida de generalidad, que las retribuciones son dadas en térmi-
nos de utilidades o ganancias. En caso de que ellas fueran costos o pérdidas, uno puede convertirlas
a utilidades o ganancias tomando, por ejemplo, el valor negativo de ellas u otra transformación
apropiada.

Definición 11 Una tabla de pérdidas de oportunidad es un arreglo tabular como:

Estados de la naturaleza

s1 s2 ... sj ... sk
a1 P11 P12 ... P1j ... P1k
a2 P21 P22 ... P2j ... P2k
.. .. .. .. .. .. ..
. . . . . . .
Actuaciones ai Pi1 Pi2 ... Pij ... Pik
.. .. .. .. .. .. ..
. . . . . . .
an Pn1 Pn2 ... Pnj ... Pnk

donde Pij ⌘ P(ai , sj ) denota la pérdida de oportunidad obtenida de elegirse la actuación ai y ocurrir
el estado de la naturaleza sj . Estas pérdidas vienen formalmente dadas por:

Pij = máx {Rij } Rij ;


i=1,2,..,n

vale decir, por lo que uno deja de ganar al elegir ai y no elegir la mejor actuación (aquella que lleva
a las máximas retribuciones) de ocurrir el estado de la naturaleza sj .

Definición 12 Las probabilidades a priori P1 , P2 , ..., Pk son las medidas de factibilidad de la ocu-
rrencia de los estados de la naturaleza, sin considerarse información muestral adicional al estudio.

Estas probabilidades a priori Pj = P (sj ) son comúnmente determinadas por criterios subjetivos, la
experiencia u otra información que posea el agente decisor.

Definición 13 Una decisión de valor esperado consiste en elegir la actuación que nos de la máxima
retribución esperada, o equivalentemente, la mı́nima pérdida de oportunidad esperada.

Formalmente, si A = {a1 , a2 , ..., an } es el conjunto de todas las actuaciones, S = {s1 , s2 , ..., sk } el


conjunto de todos los estados de la naturaleza y P1 , ...., Pk las probabilidades a priori, entonces uno
debe elegir a⇤ 2 A tal que
E[R(a⇤ )] = máx {E[Ri ]},
i=1,2,..,n
26

Pk
donde E[Ri ] = j=1 Rij Pj denota a la retribución esperada de elegirse la actuación ai . De manera
equivalente, uno debe elegir a⇤ 2 A tal que

E[P(a⇤ )] = mı́n {E[Pi ]},


i=1,2,...,n

Pk
donde E[Pi ] = j=1 Pij Pj denota a la pérdida de oportunidad esperada de elegirse la actuación ai .
Un aspecto fundamental en la teorı́a de decisiones lo conforman los problemas relacionados al
costo de la información. El elemento primordial en este tipo de estudios lo constituye el valor esperado
de la información perfecta o simplemente el VEIP. En términos prácticos, esta es la cantidad máxima
que en promedio deberı́a pagar el agente decisor por saber exactamente el estado de la naturaleza
que regirá cada vez que el enfrente su problema de decisión.
Definición 14
k
X
V EIP = ( máx {Rij })Pj E[R(a⇤ )].
i=1,2,..,n
j=1

Una manera más directa de hallar el VEIP viene dada por:

Teorema 4

V EIP = E[P(a⇤ )].

Demostración: Por definición,


k
X k
X

E[P(a )] = mı́n {E[Pi ]} = mı́n { Pij Pj } = mı́n { ( máx {Rij } Rij )Pj }
i=1,2,...,n i=1,2,...,n i=1,2,...,n i=1,2,..,n
j=1 j=1

k
X k
X k
X
mı́n { máx {Rij }Pj Rij Pj } = máx {Rij }Pj máx { Rij Pj } ⌅
i=1,2,...,n i=1,2,..,n i=1,2,..,n i=1,2,..,n
j=1 j=1 j=1

Ejemplo: Una persona desea adquirir un auto para lo cual tiene 3 posibilidades, comprar un auto
nuevo, uno de segunda en el Perú o uno de segunda directamente del Japón a través de un amigo
importador. El planea usar el auto durante un año y luego venderlo. De adquirir el auto nuevo él lo
venderá a $ 8,500, de adquirir el auto de segunda en el Perú él lo venderá a $ 5,000 y de adquirir el
auto de segunda importado del Japón él lo venderá a $ 4,500, salvo le resulte malo en cuyo caso lo
rematará a $ 2,500. El costo del auto nuevo es de $ 10,800, el de segunda vale $ 7,000 y el de segunda
con importación directa del Japón vale $ 4,200. Si el auto importado de segunda del Japón le resulta
bueno el estima que gastará en el cambio de timón y otros imprevistos unos $ 1,000 durante el año.
Este precio es el mismo que estima (por informes de su mecánico) gastará la persona en un año con
el auto de segunda adquirido en el Perú. Si el auto importado de segunda del Japón le resulta regular
el estima gastará unos $ 1,500 dólares durante el año y si le resulta malo unos $ 4,500 durante el
ESTADISTICA APLICADA Luis Valdivieso 27

año. El también estima probabilidades de 0.4, 0.35 y 0.25 de que este auto de segunda importado
del Japón le resulte respectivamente bueno, regular o malo.
a) Identificando claramente sus actuaciones y estados de la naturaleza, construya la tabla de pérdidas
de oportunidad para este problema.
b) En base a la información dada, ¿ qué auto le recomendarı́a comprar a esta persona ?.
Solución: a) En este problema de decisión la persona tiene ante si tres actuaciones a seguir a1 =
comprar un auto nuevo, a2 = comprar un auto de segunda en el Perú y a3 = comprar un auto de
segunda directamente importado del Japón. De otro lado, se disponen de tres estados de la naturaleza:
s1 = que el auto del Japón le resulte bueno, s2 = que el auto del Japón le resulte regular y s3 = que
el auto del Japón le resulte malo, donde P1 = 0.4, P2 = 0.35 y P3 = 0.25 denotan respectivamente
a las probabilidades a priori de que ocurran estos tres estados de la naturaleza. Según los datos del
problema la tabla de retribuciones, donde estas son medidas por la utilidad monetaria que la persona
logrará desde la compra del auto hasta su venta, viene dada por:

Estados de la naturaleza

s1 s2 s3
a1 -2,300 -2,300 -2,300
Actuaciones a2 -3,000 -3,000 -3,000
a3 -700 -1,200 -6,200

En base a esta tabla construimos la siguiente tabla de pérdidas de oportunidad:

Estados de la naturaleza

s1 s2 s3
a1 1,600 1,100 0
Actuaciones a2 2,300 1,800 700
a3 0 0 3,900

Para tomar la decisión, la persona deberá evaluar las pérdidas de oportunidad esperadas para cada
actuación. Estas vienen dadas por:

E[P(a1 )] = 1, 600 ⇥ 0.4 + 1, 100 ⇥ 0.35 = 1,025


E[P(a2 )] = 2, 300 ⇥ 0.4 + 1, 800 ⇥ 0.35 + 700 ⇥ 0.25 = 1,725
E[P(a3 )] = 3, 900 ⇥ 0.25 = 975 .

Luego se recomendarı́a de que la persona compre el auto directamente importado del Japón. ⇤
28

1.5.2. Toma de decisiones con información muestral

Un agente puede tomar decisiones más “finas” siempre que pueda actualizar sus probabilidades
a priori en base a información muestral adicional.

Definición 15 Las probabilidades a posteriori:

P (s1 | X = x), P (s2 | X = x), ...., P (sk | X = x),

son las medidas de factibilidad de la ocurrencia de los estados de la naturaleza dada la información
muestral x.

Al ser las probabilidades a posteriori probabilidades condicionales, podemos usar el teorema de


Bayes y escribir:

P (X = x | sj )Pj P (X = x | sj )Pj
P (sj | X = x) = = Pk , 8j = 1, 2, ..., k.
P (X = x) h=1 P (X = x | sh )Ph

Una decisión de valor esperado con información muestral se toma casi de manera idéntica al de
su contraparte sin información muestral. La única diferencia radica en que ahora en vez de utilizarse
las probabilidades a priori Pj = P (sj ), ellas son reemplazadas por las probabilidades a posteriori
P (sj | X = x).
Un punto importante a destacarse es que la información muestral, que la estamos denotando por
X, es en general una variable aleatoria que puede tomar varios valores: x1 , x2 , ..., xp . El agente decisor
debe elegir para cada posible información muestral que se le proporcione, xm , la mejor actuación,
a⇤m 2 A, en base al criterio del valor esperado y al uso de las probabilidades a posteriori bajo la
información muestral X = xm . En esta situación el valor esperado de la información perfecta, que lo
llamaremos el V EIP+ para diferenciarlo del de sin información muestral, viene dado por:
p
X
V EIP+ = E[P(a⇤m )]P (xm ).
m=1

Un concepto nuevo será ahora fundamental para analizar si le es económicamente conveniente al


agente realizar un estudio con vistas a obtener información muestral adicional.

Definición 16 El valor esperado de la información muestral, que lo denotaremos por el VEIM, es


la cantidad máxima que en promedio deberı́a pagar el agente decisor por obtener la información
muestral. Esta viene dada por:
V EIM = V EIP V EIP+
ESTADISTICA APLICADA Luis Valdivieso 29

Ejemplo: Suponga que en el ejemplo anterior, la persona antes de decidir la compra del auto podrı́a
contratar a un agente importador. El agente luego de varias investigaciones sobre caracterı́sticas
de sinestraliedad y otros le recomendará a la persona que adquiera o no el auto de segunda con
importación directa del Japón. Este agente tiene un “recordçonocido en este tipo de trabajo, asi
como una una vasta experiencia habiendolo realizado en 235 oportunidades. Según averiguaciones
posteriores se encontró que en 65, 98 y 72 de estas veces el auto resultó respectivamente bueno,
regular y malo. Más aún, él recomendó adquirir 47 de los autos que resultaron buenos, 60 de los
autos que resultaron regulares y 18 de los autos que resultaron malos.
a) Si la persona contrata a este agente importador y este le recomienda comprar el auto de segunda
directamente importado del Japón, ¿ qué es lo que la persona deberı́a decidir ?.
b) Si la persona contrata a este agente importador y este le recomienda no comprar el auto de
segunda directamente importado del Japón, ¿ qué es lo que la persona deberı́a decidir ?.
c) ¿ Cuánto deberı́a pagarle a lo más la persona al agente importador por el servicio que le presta ?.
¿ Cuál serı́a la retribución que la persona esperarı́a obtener de contratar al agente importador ?.
Solución: a) El agente importador es en este caso el que brindará la información adicional X requerida,
donde X = x1 denotará que el agente le recomienda a la persona que adquiera el auto de segunda
directamente importado del Japón y X = x2 que no lo adquiera. En base a los datos presentados
podemos construir las siguientes tablas que nos resumen la confiabilidad (y calidad) de la información
que proporciona este agente importador:

Estados de la naturaleza

s1 s2 s3 Totales
x1 Recomienda 47 60 18 125
x2 No recomienda 18 38 54 110
Totales 65 98 72 235

Estados de la naturaleza

Probabilidades P (X = xm | sj ) s1 s2 s3
x1 Recomienda 0.723076923 0.612244898 0.25
x2 No recomienda 0.276923077 0.387755102 0.75

Según estas tablas, la probabilidad de que el agente importador recomiende la compra del auto es
P (X = x1 ) = 0.723076923 ⇥ 0.4 + 0.612244898 ⇥ 0.35 + 0.25 ⇥ 0.25 = 0.566016484 y que no lo haga
0.433983516. Ahora si se diera x1 , las probabilidades a posteriori para los estados de la naturaleza
vienen dadas por:
30

P (s1 | X = x1 ) = 0.723076923⇥0
0.566016484
.4 = 0.510993545

P (s2 | X = x1 ) = 0.612244898⇥0
0.566016484
.35 = 0.378585643

P (s3 | X = x1 ) .25⇥0.25 = 0.110420813.


= 00.566016484

Por tanto las pérdidas de oportunidad esperadas en este caso son:

E[P(a1 )] = 1, 600 ⇥ 0.510993545 + 1, 100 ⇥ 0.378585643 = 1, 234.033879


E[P(a2 )] = 2, 300 ⇥ 0.510993545 + 1, 800 ⇥ 0.378585643 + 700 ⇥ 0.110420813 = 1, 934.033879
E[P(a3 )] = 3, 900 ⇥ 0.110420813 = 430,6411688.

Consecuentemente, bajo la recomendación favorable del agente, se sugerirá a la persona adquirir


el auto directamente importado del Japón. Notese que esta misma decisión usted la podrı́a haber
obtenido de trabajar con la tabla de retribuciones. Bajo este enfoque, la máxima utilidad esperada,
obtenida de adquirir el auto del Japón, es -1,496.60729 dólares (¡compruebelo!).
b) Si se diera x2 ; vale decir, si el agente le recomendará no adquirir el auto del Japón, las probabili-
dades a posteriori estarán determinadas por:

P (s1 | X = x2 ) = 0.255238336⇥0
0.433983516
.4 = 0.255238336

P (s2 | X = x2 ) = 0.312717605⇥0
0.433983516
.35 = 0.312717605

P (s3 | X = x2 ) = 0.432044059⇥0
0.433983516
.25 = 0.432044059

y las pérdidas de oportunidad esperadas son:

E[P(a1 )] = 1, 600 ⇥ 0.255238336 + 1, 100 ⇥ 0.312717605 = 752.3707033


E[P(a2 )] = 2, 300 ⇥ 0.255238336 + 1, 800 ⇥ 0.312717605 + 700 ⇥ 0.432044059 = 1, 452.370703
E[P(a3 )] = 3, 900 ⇥ 0.432044059 = 1, 684.97183.

Consecuentemente, bajo la recomendación desfavorable del agente, se sugerirá a la persona adquirir


el auto nuevo. En este caso usted puede comprobar que la máxima utilidad esperada, al tomarse
justamente esta acción, es del orden de los -2,300 dólares.
c) Se nos pide el V EIM = V EIP V EIP+ , donde el VEIP sin información muestral es por el
teorema 4 y por el ejemplo anterior igual a 975 dólares. De otro lado el V EIP+ , con información
muestral, viene dado por:

V EIP+ = 430.6411688 ⇥ 0.566016484 + 752.3707033 ⇥ 0.433983516 = 570.2664835.

Luego, el agente deberá pagar a lo más al agente 975 - 570.2664835 = 404.7335165 dólares por sus
servicios. Más aún, si la persona contratará a este agente sus utilidades esperadas serı́an del orden
de los:
( 1, 496.60729) ⇥ 0.566016484 + ( 2, 300) ⇥ 0.433983516 = 1, 845.266484.
ESTADISTICA APLICADA Luis Valdivieso 31

dólares. Nótese que estas utilidades superan a las que se esperarı́an obtener de no contratarse al
agente (-2,250 dólares). Más aún, la diferencia entre ambas utilidades constituye precisamente el
VEIM. ⇤
Ejemplo: Una empresa electrónica produce un tipo especial de tubos de rayos catódicos que re-
feriremos como cinescopios. En su elaboración se utilizan en uno de los recubrimientos el material
“Di-essolan”. La gerencia esta considerando utilizar “Tetra-essolan” en aquellos lotes de produc-
ción con bajo porcentaje de defectos. El “Tetra-essolan” es más caro que el “Di-essolan”, pero los
cinescopios con recubrimiento de “Tetra-essolan” tienen mayor aceptación entre los consumidores.
Existe una dificultad para determinar de antemano cuales serán los lotes con determinada proporción
de defectos para las que se les pudiera aplicar el recubrimiento adecuado. Después de investigar el
problema se logró la siguiente información:

Proporción de Probabilidad a priori de Material de recubrimiento


defectos en el lote la proporción de defectos “Di-essolan” “Tetra-essolan”
0.01 0.5 $ 50 $ 180
0.05 0.2 $ 80 $ 100
0.10 0.2 $120 $70
0.25 0.1 $160 $ 35

donde en las dos últimas columnas aparecen las utilidades que se tendrı́an por cada lote según se use
“Di-essolan” o “Tetra-essolan”.
a) Identificando las posibles actuaciones y estados de la naturaleza, construya su tabla de pérdidas
de oportunidad.
b) Si la gerencia de la empresa tiene como objetivo el maximizar las utilidades esperadas, ¿ qué re-
cubrimiento debe usar ?.
c) Suponga que la empresa ha decidido hacer un estudio piloto seleccionando una muestra de 25
cinescopios del proceso de producción antes de tomar la decisión de cambiar el recubrimiento a
“Tetra-essolan” o seguir con “Di-essolan”. Si se encuentran 3 cinescopios defectuosos en la muestra.
¿ Cuál debe ser ahora la decisión que debe tomar la empresa con respecto al recubrimiento a usar ?. ¿
Cuál serı́a (solo indique como se halları́a pero no resuelva), la cantidad máxima que estarı́a dispuesta
a invertir la empresa en este estudio piloto ?.
Solución: a) Aquı́ las actuaciones son dos: a1 : Utilizar en los recubrimientos el “Di-essolan” y a2 :
Utilizar en los recubrimientos el “Tetra-essolan”. De otro lado, los estados de la naturaleza están
dados por las proporciones inciertas de defectos que contienen los lotes a los cuales se les aplicará uno
de estos recubrimientos. Especı́ficamente estas son s1 : proporción de defectos de 0.01, s2 : proporción
de defectos de 0.05, s3 : proporción de defectos de 0.1 y s4 : proporción de defectos de 0.25. Las
tablas de retribuciones (utilidades) y las de pérdida de oportunidad, en este orden, se ilustran a
32

continuación:

Estados de la naturaleza

s1 s2 s3 s4
Actuaciones a1 50 80 120 160
a2 180 100 70 35

Estados de la naturaleza

s1 s2 s3 s4
Actuaciones a1 130 20 0 0
a2 0 0 50 125

b) Utilizando las pérdidas de oportunidad, los valores esperados de estas para cada actuación a seguir
(sin información muestral) son:

E[P(a1 )] = 130 ⇥ 0.5 + 20 ⇥ 0.2 = $ 69


E[P(a2 )] = 50 ⇥ 0.2 + 125 ⇥ 0.1 = $ 37.5

En consecuencia, se deberı́a elegir a2 (cambiar al “Tetra-essolan”) pues ası́ obtendrı́amos la mı́ni-


ma pérdida de oportunidad esperada. Recuerde que bajo esta actuación también se maximizan las
utilidades esperadas (¡compruebelo !). Nosotros elegimos las pérdidas de oportunidad pues estas nos
permiten obtener directamente el valor esperado de la información perfecta, a citar V EIP = $ 37.5.
c) Para poder tomar una decisión con información muestral, expresada a través del número de
unidades defectuosas en el muestreo, debemos calcular las probabilidades a posteriori para los estados
de la naturaleza. Para ello recordemos que X = número unidades defectuosas en la muestra piloto
de 25 cinescopios, es una v.a con distribución Binomial de parámetros n = 25 y p = proporción de
defectos en la producción.
Una cuestión importante será evaluar la probabilidad de que justamente se hayan obtenido 3
unidades defectuosas. Esta viene dada, según el teorema de probabilidad total, por:

P (X = 3) = P (X = 3 | s1 )P (s1 )+P (X = 3 | s2 )P (s2 )+P (X = 3 | s3 )P (s3 )+P (X = 3 | s4 )P (s4 ) =

C325 (0.01)3 ⇥ (0.99)22 ⇥ 0.5 + C325 (0.05)3 ⇥ (0.95)22 ⇥ 0.2

+ C325 (0.1)3 ⇥ (0.9)22 ⇥ 0.2 + C325 (0.25)3 ⇥ (0.75)22 ⇥ 0.1 = 0.071235.

Las probabilidades a posteriori para cada uno de los estados de la naturaleza, dada la información
muestral X = 3 vienen dadas por:
ESTADISTICA APLICADA Luis Valdivieso 33

P (X=3|s1 )P (s1 ) C 25 (0,01)3 ⇥(0.99)22 ⇥0.5


P (s1 /X = 3) = P (X=3) = 3 0.071235 = 0.01294
C (0,05) ⇥(0.95) ⇥0.2
25 3 22
P (s2 /X = 3) = P (X=3|s 2 )P (s2 )
P (X=3) = 3 0.071235 = 0.26115
C (0.1) ⇥(0.9) ⇥0..2
25 3 22
P (s3 /X = 3) = P (X=3|s 3 )P (s3 )
P (X=3) = 3 0.071235 = 0.63590
C (0.25) ⇥(0.75) ⇥0.1
25 3 22
P (s4 /X = 3) = P (X=3|s 4 )P (s4 )
P (X=3) = 3 0.071235 = 0.0899

Luego, las pérdidas de oportunidad esperadas con esta información muestral vienen dadas por:

E[P(a1 )] = 130 ⇥ 0.01294 + 20 ⇥ 0.26115 = $ 6.9052


E[P(a2 )] = 50 ⇥ 0.63590 + 125 ⇥ 0.0899 = $ 43.0325

y consecuentemente, uno debe elegir ahora a1 (seguir con el “Di-essolan”).


Un error frecuente es el de asumir que el V EIP+ es $ 6.9052. Esto no es cierto pues aquı́ uno
ya conoce lo que ocurrió en el muestreo. La idea de hallar el V EIM , y para esto el V EIP+ , es la
de saber antes del muestreo el costo que este representarı́a para la empresa. En tal sentido, uno no
puede conocer la cantidad de unidades defectuosas que se podrı́an obtener en el muestreo, si este
no se ha realizado, ya que la realización del muestreo dependerá de la decisión de si este es o no
económicamente conveniente. Concretamente el V EIP+ , vendrı́a dado por:
25
X
V EIP+ = E[P(a⇤x )]P (X = x),
x=1

donde E[P(a⇤x )] es la mı́nima pérdida de oportunidad esperada de obtenerse en el muestreo x unidades


defectuosas (en el caso de x = 3, el valor obtenido fue de $ 6.9052 y P (X = 3) = 0.071235). Por tanto
el valor esperado de la información muestral serı́a V EIM = V EIP V EIP+ = 37.5 V EIP+ . Si
este valor es superior al costo del muestreo, entonces valdrá la pena realizar el muestreo. ⇤

1.6. Ejercicios

Variables Aleatorias

1.- Un número binario está compuesto sólo de los dı́gitos 0 y 1 (por ejemplo, 1101, 0101, etc). Estos
números tienen un papel importante en el uso de computadores electrónicos. Supóngase que un
número binario está formado por n dı́gitos. Supóngase que la probabilidad de que aparezca un dı́gito
incorrecto es p y que los errores en dı́gitos diferentes son independientes uno de otro. ¿Cuál es la
probabilidad de formar un número incorrecto ?

2.- Utilizando las propiedades de una probabilidad:


a) Obtenga una fórmula para la probabilidad de la unión de tres eventos.
b) Muestre que si dos eventos son independientes, entonces sus complementos también lo son.
34

3.- Utilizando las propiedades de una probabilidad:


a) Muestre por inducción la siguiente regla llamada del producto:

P (A1 \A2 \. . .\An ) = P (An | A1 \A2 \. . .\An 1 )P (An 1 | A1 \A2 \. . .\An 2 ) . . . P (A2 | A1 )P (A1 ).

b) La siguiente desigualdad, llamada de Bonferroni, constituirá una herramienta sumamente útil en


diversas aplicaciones:
n
X
P (A1 \ A2 \ . . . \ An ) P (Ai ) (n 1).
i=1

Muestre la validez de este resultado mediante inducción.


c) Obtenga el máximo valor que puede tomar la probabilidad de que ocurra un evento A u otro
evento B, si es que estos son eventos independientes.

4.- En la inspección de control de calidad de cierto tipo de artı́culos se pudieran presentar 3 tipos de
defectos, defectos de tipo I con probabilidad 0.1, defectos de tipo II con probabilidad 0.6 y defectos
de tipo III con probabilidad 0.4. Se sabe que los defectos de tipo I son independientes de los de tipo
II y que de las veces en que se presento un defecto de tipo III, un 7 % ocurrió también un defecto
de tipo I, en un 70 % de tipo II y un 2 % conjuntamente los defectos de tipo I y II. Si usted realiza
una inspección de control:
a) ¿Con qué probabilidad no encontrará ningún defecto ?
b) ¿Con qué probabilidad se presentará sólo uno de los tipos de defectos?
c) Halle la función de probabilidad del número de defectos que se le pudieran presentar.
d) Si realizará 10 de estas inspecciones, ¿ con qué probabilidad encontrará más defectos de tipo I
que lo esperado?

5.- Suponga que el 20 % de una población sufre cierta enfermedad. En las farmacias se vende una
prueba clı́nica que detecta, con una probabilidad de 0.8, que en efecto una persona tiene la enfermedad
y que por otro lado tiene una probabilidad 0.3 de salir positiva (es decir, indicar que la persona tiene
la enfermedad) cuando en verdad la persona no tiene la enfermedad.
a) Si se elige al azar a una persona de la población y se le aplica la prueba clı́nica, ¿cuál es la
probabilidad de que esta prueba salga positiva?
b) Si se eligen al azar a 10 personas de la población y se les aplica la prueba clı́nica, ¿con qué pro-
babilidad en al menos uno de estos casos la prueba resultará positiva ? ¿Cuántas de estas personas
se esperará salgan con resultados positivos?
c) Halle el rango y la función de probabilidad del número de pruebas que se deberán de aplicar
a personas seleccionadas al azar de la población hasta encontrar a dos en que la prueba le resulte
positiva.
ESTADISTICA APLICADA Luis Valdivieso 35

6.- Un lote de 10 artı́culos contiene exactamente 4 unidades defectuosas. Si usted examina el lo-
te seleccionando las unidades una por una y sin reemplazamiento, halle el rango y la función de
probabilidad de la v.a. X = número de revisiones hasta lograr encontrar los 4 artı́culos
defectuosos.

7.- El error de medición de un instrumento de calibración (en milı́metros) se supone que es una v.a
continua X con función de densidad:
(
3 x2
8 (1 4 ), si |x| < 2
fX (x) =
0, en otro caso.

a) ¿ Con qué probabilidad este instrumento hará una medición con un error superior a los 1.8
milı́metros ?
b) Halle la función de distribución FX de X y realiza un bosquejo de su gráfica.
c) ¿ Qué error de medición se esperará que este instrumento produzca en una medición ?

8.- Una tienda ha adquirido una remesa de 40 productos perecederos, cuyos tiempos de vida en
dı́as(desde la compra hasta la fecha de expiración) siguen una distribución exponencial de parámetro
común = 0.02. La tienda pago por todos ellos $ 120. Suponga que estos productos se venden a $
5 cada uno en estado normal y se los remata a $ 2 si pasan de la fecha de expiración.
a) ¿ Con qúe probabilidad un producto estará vencido, pasados 30 dı́as de la compra ?
b) Si se deciden revender todos los productos (juntos) después de 15 dı́as de haberlos comprado, ¿
con qué probabilidad la tienda habrá hecho una inversión rentable ? ¿ Cuánto se espera reciba la
tienda por la reventa ?

9.- Supóngase que X, la resistencia a la ruptura de una cuerda (en libras) es una v.a. con distribución
normal de media 100 y varianza 16. Cada 100 pies de esta cuerda (paquete) produce una utilidad de
$ 25, si X > 95. Si X  95, la cuerda puede utilizarse con un propósito diferente y se obtienen una
utilidad de $ 10 por paquete. Encontrar la utilidad esperada por paquete.

10.- En un sistema hay 2 resistencias que funcionan de manera independiente. Los tiempos de vida de
cada resistencia se suponen que tienen distribución lognormal con parámetros µ = 4 horas y 2 = 4.
Halle la probabilidad de que la primera resistencia en fallar tenga una duración de vida útil menor
que las 2,000 horas.

11.- Para controlar la calidad de un lote de 50 unidades, se seleccionan al azar de este 10 unidades. Si
se encuentra a lo más una unidad defectuosa el lote sale al mercado. En caso contrario, se lo manda
a inspeccionar completamente a un costo de 20 soles, saliendo al mercado con 0 % de defectos.
El lote en el mercado se vende a 100 soles y su costo de producción es de 50 soles. Cada unidad
de las 10 inspeccionadas genera un costo de 0.2 soles y si se ubica una unidad defectuosa en estas
36

inspecciones esta es reemplazada por una unidad buena con un costo adicional de un sol. Suponga
que un lote con 5 unidades defectuosas pasa por este control de calidad y que la empresa productora
garantiza con indemnizar a todo consumidor que adquiera este lote en el mercado con 3 soles por
unidad defectuosa.
a) ¿ Con qué probabilidad el lote saldrá al mercado con 0 % de defectos?
b) ¿ Cuál es el número esperado de defectos que un consumidor esperará encontrar al adquirir este
lote en el mercado ?
c) Halle la utilidad esperada que obtendrá la empresa productora por vender este lote.

12.- Se planea hacer un control para lotes de 25 artı́culos en dos etapas: En la primera se sacan 5
artı́culos al azar del lote. Si se encuentra a lo más un defectuoso el lote pasa el control, si se encuentran
4 o más defectuosos el lote es rechazado mandándose a revisión completa y si se encuentran 2 o 3
artı́culos se pasa a una segunda etapa. En la segunda etapa, se sacan del lote 8 artı́culos (los 5
anteriores ya no se incluyen) y si se encuentran a lo más dos defectuosos, el lote pasa el control;
en caso contrario es rechazado y pasa a revisión total. Suponiendo que los lotes tienen 6 artı́culos
defectuosos (esto es irreal; pero muy ilustrativo):
a) Halle la probabilidad de que un lote sea rechazado en el control.
b) Si un lote es rechazado en el control, ¿ con qué probabilidad se lo habrá mandado a revisión total
en la primera etapa ?
c) Suponga ahora, como sucede en la realidad, que no sabemos la cantidad de artı́culos defectuosos
en un lote y que el lote es grande ( ya no con 25 artı́culos). Use la aproximación Binomial para
responder de manera aproximada las partes a) y b).
Nota: Suponga en c) que en controles anteriores se han seleccionado hasta la fecha 1,250 artı́culos,
encontrándose en total 105 artı́culos defectuosos. (Estime con esto p).

13.- En el control de calidad de los lotes producidos por una industria se tiene que:
i) Cada unidad inspeccionada genera un costo de 10 u.m.
ii) Reemplazar una unidad defectuosa, ubicada en una inspección, por una unidad buena genera
un costo de 25 u.m.
iii) Reemplazar una unidad defectuosa por una unidad buena,luego de vendido el lote, genera
un costo de 60 u.m.
Suponga que se disponen de las siguientes 3 polı́ticas para un lote de 15 unidades:
Polı́tica 1: Inspeccionar todo el lote y reemplazar las unidades defectuosas por buenas antes de
venderlo.
Polı́tica 2: Seleccionar una muestra al azar de 5 unidades y seguir la polı́tica 1 sólo si en la
muestra se ubican 2 o más unidades defectuosas. En caso contrario, el lote se sacará a la venta,
reeemplazando por una unidad buena, de existir alguna unidad defectuosa en la muestra.
ESTADISTICA APLICADA Luis Valdivieso 37

Polı́tica 3: Sacar a la venta el lote sin ninguna inspección.


Si hipotéticamente el lote en mención tuviera 4 unidades defectuosas:
a) Halle la probabilidad de se ubiquen todas las unidades defectuosas del lote bajo la polı́tica 2 .
b) Indique la polı́tica de comercialización más conveniente para el lote, en el sentido de que con ella
se minimizen los costos esperados de inspección y reemplazo.

14.- Una fábrica posee tres lı́neas de producción operativas A1 , A2 y A3 , las cuales se estiman tienen
respectivamente una probabilidad de 0.1, 0.08 y 0.012 de producir un artı́culo defectuoso. La mitad
de la producción es realizada por la lı́nea A1 ; mientras que el 60 % de la producción restante lo
realiza la máquina A2 .
a) Si usted adquiere un artı́culo producido por la fábrica, ¿ qué probabilidad hay de que este le
resulte defectuoso ?
b) Si usted adquiere 10 artı́culos producidos por la fábrica, halle la función de probabilidad del
número de artı́culos que le resultaran defectuosos.
c) Suponga que usted adquiere un lote de 9 artı́culos, donde sabe de que estos provienen de una
sola lı́nea de producción. Si usted selecciona al azar una muestra de 4 artı́culos del lote, halle la
probabilidad de que en su muestra encuentre 2 artı́culos defectuosos.

15.- En la fabricación de conductores, el número de fallas en su recubrimiento, se producen a razón


de 0.2 fallas por unidad de longitud, a través de un proceso de Poisson.
a) Si se fabrican conductores de 20 unidades de longitud, ¿ con qué probabilidad un conductor
tendrá una o menos fallas de revestimiento ?
b) Cada unidad de longitud fabricada tiene un costo de s/. 60 y se puede vender a s/. 101 , pero
con el compromiso de indemnizar al cliente por cada falla que se presente, a razón de 4X + X 2 por
conductor, si hay X fallas en él. Halle la longitud más conveniente de un conductor de tal manera
que el fabricante maximice su utilidad esperada.

16.- Una empresa adquiere rollos de alambre de cobre de 150 metros de longitud de cierto fabricante
y utiliza el siguiente procedimiento para la inspección de recibo:

Se inspecciona 14 metros de alambre de un rollo, si no se encuentra ninguna falla se acepta


el rollo, si se encuentran 3 o más fallas se rechaza, en cualquier otro caso se inspeccionan 12
metros adicionales.

Si el número total de fallas (en ambas inspecciones) es mayor a 3 se rechaza el rollo.

Finalmente si se rechaza un rollo, se inspecciona al 100 % y el fabricante debe pagar los costos
de inspección.
38

Si el número de fallas del alambre de cobre está descrito por una distribución de Poisson con media
de 0.05 fallas por metro y el costo por metro de inspección es de un sol:
a) Halle la probabilidad de rechazar un rollo.
b) ¿ Cuánto esperará gastar por inspección la empresa ?
c) ¿ Cuánto esperará gastar por inspección el fabricante ?

17.- En una empresa se desea determinar el nivel de producción óptimo K ⇤ de un solvente quı́mico
para una temporada. Cada litro producido del solvente le cuesta a la empresa 10 soles; mientras que
ella lo vende a 15 soles. Si al final de la temporada le sobra del solvente, la empresa rematará cada
litro de él a 8 soles; mientras que si le falta para cubrir la demanda podrá pedir más a otra empresa
asociada a un costo de 13 soles el litro y satisfacer la demanda. Si se supone que la demanda por
temporada del solvente en miles de litros a la empresa es una variable aleatoria X ⇠ B(↵ = 1, = 2)
y se tiene un costo fijo de producción de 150 soles.
a) Halle el valor de K ⇤ .
b) Suponga que el gerente de la empresa esta pensando en incrementar los precios de venta del
solvente a 18 soles el litro. Si bajo esta medida un estudio revela que la demanda se contraerı́a siendo
ahora X ⇠ B(↵ = 1, = 3), ¿ recomendarı́a ud. que se incrementen los precios ? Justifique.

18.- Una tienda necesita saber cuantas bolsas K de un tipo de harina especial (de 50kg cada bolsa)
debe comprar en la semana para maximizar su utilidad esperada. Cada bolsa se vende en la tienda
a 120 soles y la tienda lo compra a 85 soles. De no venderse una bolsa en la semana, la harina se
rancia, por lo que la bolsa de esta harina debe rematarse a 50 soles, existiendo siempre compradores
para esta. Si la demanda de bolsas de esta harina es una v.a. discreta X con la siguiente función de
probabilidad: (
Cx2 , si x = 1, 2, 3, 4, 5
PX (x) =
0, en otro caso.
a) Halle el valor de C.
b) Halle la función de distribución (acumulada) de X para x = 3. Interprete este último valor.
c) Muestre que la función de utilidad semanal para la tienda, como función de la demanda X y del
número de bolsas K que la tienda adquiere, viene dada por:


70X 35K, si X  K
U (X, K) =
35K, si X > K.
y determine el valor óptimo de K.

19.- Un productor de espárragos esta por firmar un contrato (opción) con una empresa industria-
lizadora, por el cual él venderá a esta empresa cada una de las 80 TN de espárragos que asegura
producirá a un precio de K soles la TN (el costo de producir cada tonelada es de 1,000 soles). El
ESTADISTICA APLICADA Luis Valdivieso 39

contrato estipula que si el precio de mercado de la TN de espárrago es al finalizar la cosecha superior


a los K soles, el productor podrá dejar sin efecto la venta a la empresa y podrá venderle libremente a
cualquier otro comprador. En razón de esta cláusula, el productor deberá de pagar a la empresa un
monto de 500 soles a la firma del contrato. Si se asume que el precio (en soles) por TN de espárrago
es al finalizar la cosecha una v.a. X con distribución uniforme en el intervalo [1, 000, 1, 200]:
a) Halle, de no firmarse el contrato, la utilidad esperada del productor al término de la cosecha.
b) Halle, de firmarse el contrato, el valor de K con el cual la utilidad esperada de este productor sea
la misma a la que obtendrı́a de no firmarse el contrato.

Simulación

20.- Suponga que la proporción diaria de artı́culos defectuosos X que una lı́nea continua produce
tiene una distribución Beta de parámetros ↵ = 1 y = 9.
a) Esboce la gráfica de fX e indique cuan factible es que el % de defectos en un dia supere el 90 %.
b) Halle mediante simulación la proporción de defectos que se obtendrá en 7 dias de producción. Use
los números aleatorios: 234, 098, 789, 666, 235, 589, 906. ¿ Se asemejan estos valores a la proporción
de defectos diaria esperada ?

21.- Un cajero automático puede atender hasta 3 clientes con códigos de cuenta errados, luego
de lo cuál automáticamente se cerrará hasta ser activado nuevamente por el personal del Banco.
Si la probabilidad de que un cliente (o no cliente) ingrese un código errado es de p = 0.3, halle
mediante simulación la cantidad de transacciones que hará el cajero antes de su reactivación durante
6 oportunidades. Use los números aleatorios: 456, 078, 756, 523, 614, 158.

22.- En una empresa, el 80 % de los trabajadores son empleados y sus ingresos mensuales (en soles)
tienen una distribución lognormal de parámetros µ = 6 y 2 = 4. El resto de trabajadores son
funcionarios, y sus ingresos mensuales en soles tienen una distribución N (4, 800 , 900).
a) Si usted selecciona al azar a un trabajador de la empresa, halle la probabilidad de que este tenga
ingresos mensuales superiores a los 2,000 soles.
b) Si ud selecciona al azar a 4 empleados de la empresa, halle mediante simulación sus ingresos
mensuales. Use los números aleatorios 879, 157, 438, 745.
c) Indique que procedimiento utilizarı́a para simular los ingresos mensuales de 5 trabajadores.

23.- Se sabe que el 20 % de los clientes que utilizan un cajero automático en un Banco, ingresan de
manera errónea su código en una oportunidad y que de este porcentaje un 60 % ingresa erróneamente
su código por segunda vez..
a) Halle la probabilidad de que un cliente ingrese erróneamente su código por segunda vez.
b) Un Banco ha establecido un nuevo sistema de seguridad en sus cajeros. Este inicia un proceso
40

de verificación cada vez que un cliente ingresa su código de manera errónea por segunda vez. El
cajero, de presentarse esta situación le pide al cliente que coloque su mano derecha sobre la pantalla
a fin de iniciar el proceso de verificación. Pasado un tiempo el cajero devolverá la tarjeta de crédito
sin cambio alguno si verificó su autenticidad (a través de las huellas digitales) o en caso contrario
con un código que lo inutilizará. El proceso inutilizará también una tarjeta en caso de cualquier
otra contingencia (uso de guantes, no respuesta del cliente, etc.). Una vez culminado el proceso de
verificación el cajero restablecerá sus funciones usuales y su mecanismo de verificación. Si el contador
de un cajero ha registrado durante un dı́a, 40 clientes atendidos:

b1) ¿ Cuál es la probabilidad que al menos 5 de ellos hallan tenido que pasar por el proceso de
verificación del cajero ?

b2) Si se asume que el tiempo en minutos que demora cada verificación es una v.a. continua con
distribución lognormal de parámetros µ = 1 y 2 = 4, halle mediante simulación el tiempo total
durante este dı́a que el cajero estuvo destinado sólo al trabajo de verificación. Use el número
aleatorio 567 para simular el número de verificaciones y todos, o algunos, de los siguientes
números aleatorios para cada uno de los tiempos de verificación: 352, 374, 769, 032, 657, 464.

24.- Un estudio ha revelado que la desviación en centı́metros con respecto a su valor nominal de las
longitudes de uno ejes producidos por una industria es una v.a. continua Y de la forma: Y = 2.2X 1,
donde X es una v.a. continua con distribución Beta de parámetros ↵ = 1 y = 3.
a) Halle la probabilidad de que la longitud de un eje producido por esta industria difiera de su valor
nominal en más de 0.5 centı́metros.
b) Suponga que todo eje que difiera en su longitud en más de 0.5 centı́metros de su valor nominal
es desechado. Si en un dı́a se produjeron 20 ejes, determine el número esperado de ejes que deberán
desecharse.
c) Si en un dı́a se produjeron solo 8 ejes, determine mediante simulación las desviaciones de sus
longitudes respecto a su valor nominal. Halle también el número de ejes que deberı́an ser desechados
durante ese dı́a. Use los números aleatorios: 321, 982, 123, 276, 073, 699, 879, 501.

25.- Un distribuidor tiene la polı́tica de ordenar mensualmente un stock de K unidades de un bien.


El compra cada unidad a 0.5 unidades monetarias (u.m) y las vende a p 1 u.m. Si a fin de mes
le sobra del bien, el las remata a 0.3 u.m cada uno y en caso contrario, si le falta para cubrir su
demanda, el tiene la posibilidad de comprar inmediatamente más del bien pero ahora a un precio
unitario de 0.7 u.m. Si la demanda del bien X es una variable aleatoria con distribución exponencial
p
de parámetro p ( X ⇠ exp( 1,000 )) y el tiene un costo fijo mensual de 50 u.m.
a) Halle el stock óptimo K, en función de p, que deberá adquirir este distribuidor del bien a fin de
que maximize sus utilidades esperadas mensuales.
ESTADISTICA APLICADA Luis Valdivieso 41

b)¿ Cuál serı́a el valor de p que le permita mensualmente al distribuidor duplicar en promedio su
inversión inicial ?
c) Suponga que se ha creado un impuesto nuevo que grava en un 10 % las utilidades mensuales. Halle
la probabilidad de que el impuesto sea inferior a su máxima cantidad esperada. Halle la distribución
(función de densidad) del impuesto y simule este para 5 meses. Use los números aleatorios 345, 209,
987, 630, 099.

26.- Con la finalidad de estudiar si se agrega un segundo mecánico para reparar los buses de una
compañı́a de transporte que a diario se malogran; se estudió la historia del número de buses que se
malograban diariamente. La distribución fué como sigue:

Número de buses malogrados Frecuencia (número de dı́as)


0 5
1 13
2 17
3 14
4 7
5 1

Se sabe que:

Los buses funcionan de Lunes a Sábado.

Existe actualmente un sólo mecánico que trabaja de Lunes a Viernes de 9 a 12 y de 2 a 5 de


la tarde.

El tiempo (en horas) que se demora en reparar un bus es aleatorio con distribución exponencial
de parámetro 15 .

Las fallas se reportan al final del dı́a y los buses que se malogran se reparan en los dı́as
subsiguientes por orden de llegada.

Simule el número de buses que se malogran en una semana (de Lunes a Sábado) e indique el pro-
cedimiento que utilizarı́a para hallar el número de buses que quedarı́an por ser reparados la semana
siguiente. Use los siguientes números aleatorios: 146, 227, 594, 023, 654 y 089.

Confiabilidad

27.- La razón de falla de una componente se modela como:



0.05 , si 0  t < t0
Z(t) =
0.05 + (t t0 ) , si t t0 .
42

Asumiendo que el tiempo se esta midiendo en horas:


a) Grafique la razón de falla de esta componente y comente que es lo que supone el modelo planteado.
b) Determine la función de confiabilidad de esta componente.
c) Si t0 = 10 y = 2, halle la función de densidad del tiempo de vida útil de la componente y la
probabilidad de que esta componente supere las 20 horas de vida útil.

28.- Un ingeniero Industrial debe comprar componentes electrónicas de un mismo tipo. De acuerdo
a sus especificaciones existen en el mercado solo 3 tipos de componentes A1, A2 o A3 que le podrı́an
ser de utilidad. Las componentes que él adquiera las instalará en un sistema como el siguiente:

Las componentes A1, A2 y A3 tienen tiempos de vida (en horas) modelados por distribuciones de
Weibull de parámetro ↵ = 2 y parámetros iguales a 0.0002, 0.0004 y 0.0005 respectivamente. El
objetivo del sistema es realizar una tarea que demandará 40 horas. Si se logra el objetivo se ganarán
1,800 dólares, pero si no es asi sólo 200 dólares. De otro lado los costos de cada componente del
tipo A1, A2 y A3 son respectivamente 120, 50 y 20 dólares. Según esta información, ¿ qué tipo de
componente le recomendarı́a adquirir al Ingeniero ?

29.- Tres componentes idénticas, cuyas razones de falla siguen un modelo de Weibull de parámetros
↵=2y = 1 se instalan en un sistema en serie.
a) Halle la media y varianza del tiempo de vida útil del sistema.
b) Si ud. adquiere 4 de estos sistemas , halle mediante simulación sus tiempos de vida útil. Use los
números aleatorios: 456, 103, 967, 665.
ESTADISTICA APLICADA Luis Valdivieso 43

30.- Un artı́culo está compuesto por 2 componentes en paralelo, en donde cada una sigue en su razón
de falla un modelo exponencial con parámetro . Un plan de muestreo para aceptación de un lote
de estos artı́culos requiere probar una muestra de 2 artı́culos durante 80 horas. Se acepta el lote si
no falla ningún artı́culo. Si el fabricante desea tener una probabilidad máxima de rechazo del lote de
0.078, ¿ cuál debe ser el tiempo de duración medio de los artı́culos ?

31.- En un sistema en paralelo de tres componentes, todas las componentes poseen una función razón
de falla constante de parámetro = 0.00757 (en horas), siendo el costo de cualquier componente de
$ 20. Si el sistema falla, el costo por mal funcionamiento es de $ 3,500.
a) Halle el costo esperado del sistema en cualquier instante t.
b) ¿ Cuántas componentes deberán quitarse o agregarse en paralelo al sistema a fin de que este
funcione durante 38 horas con un costo esperado óptimo ?
c) Calcule el costo esperado óptimo de la parte b).

32.- Suponga que la duración en años de una componente electrónica sigue en su razón de falla
un modelo de Weibull, cuyos parámetros ud. debe de estimar. Para tal efecto, suponga que usted
dispone de la siguiente información obtenida en las pruebas de vida de 50 de estas componentes y
en las cuales se registró el número de componentes aún operativas al final de cada año, durante un
periodo de 8 años:

Año 1 2 3 4 5 6 7 8
Número de componentes operativas 47 39 29 18 11 5 3 1

Usted esta interesado en adquirir algunas de estas componentes para instalarlas en el sistema:

a) Estime los parámetros asociados a la distribución de las componentes. Para ello se le recomienda
que utilize el método de mı́nimos cuadrados. Explique detalladamente el procedimiento seguido.
b) Determine el tiempo de vida esperado para un sistema como el arriba descrito.
c) Si usted instala 7 sistemas, como el de arriba, halle mediante simulación sus tiempos de vida útil.
44

Decisiones

33.- Un constructor debe decidir cuántas residencias construir en un sector cuyo desarrollo futuro es
incierto. Cada residencia le costará al constructor $ 40,000 y planea venderlas a $ 45,000, rematando
al cabo de 6 meses las residencias que no se hayan vendido a $ 37,000 cada una. Suponga que las
expectativas y creencias del constructor respecto al número de casas que se venderán antes de 6
meses son las que aparecen abajo.

Número de casas vendidas Probabilidad


dentro de seis meses
0 0.05
1 0.15
2 0.45
3 0.25
4 0.1
5 ó más 0

Si el contratista tiene como objetivo el maximizar su utilidad esperada, ¿ cuántas casas debera de
construir ?. Defina claramente sus actuaciones y estados de la naturaleza; ası́ como su tabla de
pérdidas de oportunidad.

34.- La compañı́a Quı́mica Unión del Pacı́fico tiene un problema con uno de sus procesos. Un co-
producto de la reacción involucrada es azufre con hidrógeno, un gas que expide malos olores. En
el pasado este gas junto con otros no dañinos han sido descargados utilizando la chimenea de la
compañı́a. Sin embargo, esta compañı́a recientemente ha notado su obligación con sus empleados y
las personas que viven en el pueblo, y ha comprado tres mecanismos para eliminar el gas dañino de
los demás. La cuestión que encara la compañı́a es saber ¿ cuál de los tres mecanismos deberá ser uti-
lizado cualquier dı́a en particular ?. El contenido de gas varia de dia a dia dependiendo del contenido
de sulfuro de las materias primas utilizadas en la reacción. Los mecanismos son:

Mecanismo A: Todos los gases exhaustos se pasan a través de una solución quı́mica que absorbe
el gas. Existe un costo fijo de $ 100 por conectar este mecanismo y un costo variable de $ 500
p , donde p = proporción del gas en los demás gases.

Mecanismo B: Coloca un absorvente quı́mico en la chimenea. Existe un costo de $ 350 por


hacer esto, y el absorvente tiene capacidad para cualquier concentración del gas (pero debe de
reemplazarse al final del dı́a)

Mecanismo C: Quema los gases, volviendo el gas que nos ocupa en agua y bioxido de sulfuro.
Este bioxido de sulfuro puede entonces absorverse en agua y esta solución venderse como
ESTADISTICA APLICADA Luis Valdivieso 45

ácido sulfúrico débil. El costo diario de este proceso es de $ 600, pero el ácido sulfúrico débil
proporciona un rendimiento proporcional a p de $ 500 p.

De experiencias pasadas la compañı́a siente que la proproción del gas dentro de los otros gases será de
0.1, 0.3, 0.5, 0.7 ó 0.9 con probabilidades correspondientes de 0.19, 0.18, 0.23, 0.21 y 0.19.
a) Construya, indicando explı́citamente las actuaciones y estados de la naturaleza, la tabla de pérdidas
de oportunidad para este problema.
b) ¿ Qué actuación recomendarı́a que siga la compañı́a ?
c) Si hipotéticamente, durante cada dia la compañı́a recibiera la información exacta de la proporción
del gas dentro de los otros gases, ¿ cuál serı́a en promedio el costo diario en que incurrirı́a la compañı́a
por la eliminación del gas ?
d) La materia prima que la compañı́a usa en su proceso se clasifica como alta, media y baja en
contenido de sulfuro. De experiencias pasadas la compañı́a ha encontrado en cada uno de estos
niveles de contenido de sulfuro la siguiente distribución de p:

Proporción p del gas dentro de los otros gases

0.1 0.3 0.5 0.7 0.9


Contenido de Alto 0.1 0.1 0.1 0.4 0.3
sulfuro en la Mediano 0.1 0.2 0.3 0.2 0.2
materia prima Bajo 0.4 0.2 0.2 0.1 0.1

Suponiéndose que la materia prima que va a ser utilizada en un dı́a puede restringirse a una de
las 3 calificaciones dadas, ¿ qué mecanismo deberá la compañı́a emplear para cada una de estas 3
calificaciones de la materia prima ?

35.- Un editor pretende firmar un contrato para un libro de texto de contabilidad con alguno de los
tres autores con los que ha trabajado; Gómez, Garcı́a o Pérez. Si resulta que el texto tiene mucho
éxito, los beneficios (excluyendo gastos extraordinarios de publicidad) serı́an de $ 250,000; si el éxito
es moderado, los beneficios serán de $ 80,000. En el caso de que el texto sea un fracaso se perderán
$ 80,000. Las probabilidades de la tabla siguiente son conjeturas sobre los estados de la naturaleza
para cada uno de los tres libros.

Gran éxito Éxito moderado Fracaso


Gómez 0.2 0.6 0.2
AUTOR Garcı́a 0.1 0.8 0.1
Pérez 0.3 0.2 0.5
El editor tiene la opción, además, de montar una gran campaña de publicidad, con un costo de 30,000
dólares, una vez publicado el texto. Se estima que si se lleva a cabo la campaña, las probabilidades
de los estados de la naturaleza serı́an:
46

Gran éxito Éxito moderado Fracaso


Gómez 0.4 0.4 0.2
AUTOR Garcı́a 0.3 0.6 0.1
Pérez 0.5 0.2 0.3

a) ¿ Deberı́a llevarse a cabo la campaña de publicidad ? ¿ Qué autor deberı́a elegirse ?


b) Siguiendo los cálculos de la parte a), el editor ha firmado un contrato con el autor seleccionado.
En ese momento, se descubre un error en las cuentas del departamento de marketing y se calcula
que el costo real de la campaña publicitaria es de $ 40,000. ¿ Deberı́a el editor ofrecer una suma al
autor a cambio de rescindir el contrato ?. ¿ Por qué ?. Si es ası́, ¿ cuál es la máxima cantidad que
podrı́a ofrecerle?

36.- Una compañı́a esta interesada a comienzos de año en decidir que hacer con su utilidad excedente
de $ 25,000 correspondiente al año anterior. Una posibilidad es colocar el dinero en un Banco a una
tasa de rentabilidad anual de 13 % en soles. Se puede también comprar dólares a 3.5 soles por dólar
y colocar el dinero en el Banco a una tasa de rentabilidad anual de 8 % en dólares. Otra posibilidad
es invertir en bolsa. La economı́a es incierta y ud., como responsable del estudio, piensa que este
año ella sufrirá una contracción con una probabilidad de 0.4, se mantendrá estable con probabilidad
0.5 o crecerá en otro caso. Si la economı́a se contrae, el tipo de cambio a fin de año se estima en 3
soles por dólar; si crece en 4 soles por dólar; mientras que en una economı́a estable la tasa de cambio
se piensa no cambiará. De otro lado, si la economı́a se contrae la rentabilidad anual equivalente en
bolsa será de -5 %, si se mantiene estable será de 5 % y si la economiı́a crece será de 30 %.
a) ¿ Qué tipo de inversión sugerirı́a que siga la compañı́a con su excedente ?
b) La compañı́a puede contratar a una consultora por $ 500, a fin de que ella le pronostique el
comportamiento de la economı́a durante este año. Según informes sobre la labor de esta consultora
se ha podido establecer la siguiente tabla que resume la fiabilidad de los estudios de esta:

Estado de la Naturaleza
P (xm | sj ) s1 = eco. contraida eco. estable eco. creciente
Opinión x1 = eco. contraida 0.7 0.05 0.2
de la x2 = eco. estable 0.2 0.8 0.05
consultora x3 = eco. creciente 0.1 0.15 0.75

¿ Debe contratar la compañı́a a la consultora ? ¿ Qué decisión deberı́a tomar la compañı́a de recibir
un pronóstico de economı́a creciente por parte de la consultora ?

37.- Un consultor está considerando la posibilidad de preparar propuestas para uno o dos contratos.
Puede no preparar propuestas para ninguno, pero las restricciones de tiempo le impiden preparar
ESTADISTICA APLICADA Luis Valdivieso 47

propuestas para ambos. Los costos de preparación de propuestas preliminares son de $ 500 para el
contrato A y $ 750 para el contrato B. Cuando se han presentado las ofertas preliminares, se recibe
una respuesta del cliente potencial. Estas respuestas pueden agruparse en tres categorı́as positiva,
ambigua o negativa. Las probabilidades para cada uno de los contratos se muestran en la tabla
de abajo. Si la respuesta a la propuesta preliminar es negativa, no se conseguirá el contrato. Si la
respuesta no es negativa, el consultor puede presentar una oferta final más detallada, cuyo costo
serı́a de $ 1,000 para el contrato A y $ 1,500 para el contrato B. Para el contrato A, existe una
probabilidad 0.9 de que esta propuesta sea aceptada, si la respuesta inicial fue positiva y 0.4 si la
respuesta fue ambigua. Para el contrato B, estas probabilidades son 0.8 y 0.2, respectivamente. Si
se consigue el contrato A, el beneficio para el consultor (del que deberán descontarse los gastos de
preparación) será de $ 5,000. Para el contrato B, será de $ 6,000.

POSITIVA AMBIGUA NEGATIVA


Contrato A 0.6 0.2 0.2
Contrato B 0.8 0.1 0.1

a) ¿ Debe el consultor presentar una oferta preliminar?. Si es ası́, ¿ para qué contrato?
b) Si la respuesta en a) es sı́, y se piensa que para el contrato seleccionado es correcta la probabilidad
de que la respuesta a la propuesta preliminar sea ambigua, pero no son tan seguras las probabilidades
de que las respuestas positiva y negativa se mantengan, ¿ entre qué rango estarı́a la probabilidad de
una respuesta negativa para que se mantenga la misma decisión ?. Asuma esto sólo para resolver b).
c) Suponiendo nuevamente sı́ como respuesta en a), ¿ cómo deberı́a proceder el consultor si la
respuesta a su propuesta preliminar hubiera sido ambigua?
d) Este consultor ha contratado recientemente a un ingeniero industrial que sostiene que serı́a más
beneficioso presentar solamente una propuesta final, sin tener que pasar por el proceso inicial de
preparar una oferta preliminar. Los costos de preparar una propuesta de este tipo son de $ 1,250
para el contrato A y de $ 1,875 para el contrato B. Suponiendo que las probabilidades de aceptación
final no cambian, ¿ tiene razón el ingeniero industrial ?

1
38.- Un productor de herramientas eléctricas está considerando la compra de motores eléctricos de 4
de caballo de fuerza a una compañı́a japonesa. Los motores que utiliza actualmente son del paı́s y es
sabido que el 97 % de ellos resultan no defectuosos. Los motores japoneses que le ofrecen resultarán
0.5$ más baratos que los del paı́s, pero no se sabe aún sobre su calidad. Basados en la mejor de
las informaciones disponibles se ha establecido la siguiente distribución de probabilidades sobre la
proporción defectuosos entre los motores japoneses:
48

Proporción de defectuosos Probabilidad


0.01 0.3
0.05 0.5
0.10 0.2
El costo en que incurre el productor por tener que reparar una herramienta eléctrica con defecto en
el motor es de $ 10 por herramienta. Si el productor requerirá 50,000 motores para el siguiente año:
a) ¿ Debe comprar los de la compañı́a japonesa o continuar con los del paı́s ?
b) Si antes de decidir si compra o no estos motores a la compañı́a japonesa o del paı́s, el industrial
selecciona al azar 27 motores japoneses y luego de someterlos a pruebas muy rigurosas encuentra que
exactamente 3 de ellos están defectuosos, ¿ cuál deberı́a ser ahora su decisión a tomar ?

39.- Una compañı́a de seguros está interesada en adquirir los servicios de una reaseguradora, la cual
le ofrece a sus propósitos los siguientes tres planes mensuales para cubrir sus siniestros de gravedad
(un siniestro de gravedad está definido como aquel reclamo a la compañı́a que alcanza la cobertura
máxima de 50,000 dólares):

Plan A: La reaseguradora cubre totalmente un solo siniestro al mes, cobrando por este plan un
monto de 2,000 dólares mensuales.

Plan B: La reaseguradora cubre totalmente hasta 3 siniestros al mes, cobrando por este plan
un monto de 5,000 dólares mensuales.

Plan C: La reaseguradora cubre totalmente hasta 5 siniestros al mes, cobrando por este plan
un monto de 8,000 dólares mensuales.

El gerente de la compañı́a de seguros piensa que mensualmente el número de siniestros de gravedad


que sus empresas clientes podrı́an reclamar, tiene la siguiente función de probabilidad:

X=x 0 1 2 3 4 5
PX (x) 0.7 0.1 0.09 0.06 0.03 0.02
Si la compañı́a tiene actualmente una cartera de 320 empresas clientes y cobra a cada una un
promedio de 400 dólares mensuales.
a) ¿ Qué plan de cobertura de la reaseguradora, si es que le conviene alguno, deberı́a el gerente
contratar ?. Defina claramente sus actuaciones, estados de la naturaleza y su tabla de pérdidas de
oportunidad.
b) Suponga que la compañı́a decide contratar a una consultora para que ésta le estudie la demanda de
siniestros de gravedad en el mercado de empresas. Si esta consultora, en base a estudios similares, le
alcanza a la compañı́a el siguiente registro del porcentaje de pronósticos para el número de siniestros,
dada la cantidad real de siniestros ocurrida:
ESTADISTICA APLICADA Luis Valdivieso 49

Número de siniestros ocurridos

0 1 2 3 4 5
0 65 % 10 % 3% 9 % 4 % 3%
Número de 1 19 % 70 % 9% 9 % 6 % 1 %
siniestros 2 9% 10 % 69 % 6 % 9 % 4 %
pronosticados 3 4 % 4 % 12 % 55 % 11 % 7 %
por la consultora 4 2 % 4 % 5 % 20 % 58 % 18 %
5 1 % 2% 2% 1% 12 % 67 %

y luego de su estudio le pronostica a la compañı́a que en el mes ocurrirán 2 siniestros, ¿ qué es lo


que el gerente deberı́a ahora decidir?

40.- Un fabricante debe decidir si monta, con un costo de 1 millón de dólares, una campaña de
publicidad para un producto cuyas ventas han sido malas. Se estima que una campanã muy exitosa
aumentarı́a los beneficios en 4 millones de dólares (de los cuales hay que restar los gastos de publici-
dad), una campaã moderadamente exitosa aumentarı́a los beneficios en 1.1 millones de dólares, pero
si la campaña es un fracaso, los beneficios no aumentarán. La experiencia pasada demuestra que el
40 % de este tipo de campañas han sido muy exitosas, el 30 % han tenido un éxito moderado y el
resto han fracasado. Este fabricante consulta con un especialista en medios para que juzgue como
favorable o no la posible efectividad de la campaña. El currı́culum de este especialista muestra que
su informe ha sido favorable el 80 % de las veces que la campaña fue muy exitosa, el 40 % de las
veces que la campaña fue moderadamente exitosa y sólo el 10 % cuando la campaña fue un fracaso.
a) De no contarse con un informe del especialista en medios, ¿ deberı́a montarse la campaña ?
b) ¿ Cómo afectarı́a su decisión el informe del especialista en medios ?
c) Si el especialista en medios cobra $ 1,000. ¿ Le parece razonable contratar sus servicios ?. Justifique.
d) Este fabricante se enfrenta a un problema de decisión en dos etapas. Primero debe decidir si
contratar al especialista, a continuación debe decidir si monta la campaña publicitaria o no. Indique
cómo deberı́a proceder el fabricante.

41.- En el diseño de los empaques de artı́culos manufacturados, se busca que los empaques permitan
su fácil manejo, almacenaje y que le parezcan atractivos al consumidor. El gerente de estudios de
mercado de una compañı́a elaboradora de productos alimenticios esta estudiando un nuevo empaque
para el principal producto de la compañı́a . Antes de aceptar el diseño del empaque debe decidir si
contrata a un grupo de investigadores de mercado para que estudien la reacción de los consumidores
ante el nuevo diseño. El costo de contratar al grupo de investigadores es de $ 2,000. Si con el nuevo
diseño las ventas son “buenas”, se estima que se ganarán mensualmente $ 20,000; si las ventas son
“regulares”se ganarán $ 10,000 mensuales y si son “malas”, solo $ 3,000. El gerente, de su experiencia
50

en el trato con este grupo de investigadores, ha elaborado la siguiente tabla para P (xi | sj ). Esta
tabla resume la confiabilidad de la información proporcionada por el grupo de investigadores.

Ventas
Conclusiones del Buenas, s1 Regulares, s2 Malas, s3
estudio (Opiniones/Diseño)
Favorable, x1 0.75 0.45 0.1
No favorable, x2 0.25 0.55 0.9
Si se decide no cambiar el empaque por el de nuevo diseño, se continuará con el antiguo con el cual
se tenı́an ganancias mensuales constantes del orden de los $ 8,000. Adicionalmente, los gastos de
publicidad para el empaque antiguo y nuevo son de $ 2,500 y $ 5,000, respectivamente y se supone
que las probabilidades asociadas a ventas “buenas”, “regulares” y “malas” una vez que se haga el
cambio al nuevo empaque son 0.425, 0.25 y 0.325, respectivamente.
a) Construya la tabla de retribuciones y pérdidas de oportunidad para este problema.
b) ¿ Cuál serı́a la mejor decisión del gerente de no contratar al grupo de investigadores ?
c) Si se le brinda al gerente la información perfecta; vale decir, la información exacta sobre las ventas,
¿ cuánto es lo que esperarı́a ganar la empresa al tener esta información ?
d) Halle e interprete el VEIP de este problema.
e) Si se contrata al grupo de investigadores de mercado, ¿ debe emplearse el nuevo diseño si la
conclusión del estudio es favorable ?
f) ¿ Cuál es el valor esperado de la información muestral ?. ¿ Debe el gerente recomendar su contra-
tación por los $ 2,000 que cobran ?

42.- Un fábrica de pañales que produce bolsas de 32 unidades está considerando, debido al alza
de sus insumos y a una consecuente disminución de 500 dólares mensuales en sus utilidades netas,
aumentar el precio de sus bolsas de pañales, mantener el precio de estos y reducir a 28 el número
de pañales dentro de sus bolsas (ambas acciones dan ahorro en sus costos) o, simplemente, dejar
las cosas como están. El gerente de ventas de la fábrica estima, en base a su experiencia, que de
aumentarse los precios, la demanda: disminuirı́a severamente con probabilidad 0.3, medianamente
con probabilidad 0.5 y mı́nimamente con probabilidad 0.2; mientras que, si se redujeran las bolsas,
estas probabilidades serı́an de 0.15, 0.5 y 0.35 , respectivamente. De otro lado, ya sea que se suban los
precios o se reduzcan las bolsas a 28 unidades, se estima que las utilidades netas mensuales bajarı́an
en 5,000 dólares de disminuirse severamente la demanda; aumentarı́an en 500 dólares de disminuirse
medianamente la demanda; y aumentarı́an en 6,800 dólares de reducirse mı́nimamente la demanda.
El gerente general de la fábrica ha mandado realizar un estudio de mercado. La empresa consultora
encargada de este ha entregado como parte de sus servicios la siguiente información en que registra,
para estudios similares realizados por ellos, las probabilidades de sus pronósticos de contracción de
ESTADISTICA APLICADA Luis Valdivieso 51

demanda sugeridos de subirse los precios o reducirse las bolsas (en negrita), dada la situción real de
la demanda que se presentó:

s1 s2 s3
P (xm | sj ) disminución disminución disminución
severa mediana mı́nima
x1 = contracción fuerte de la demanda 0.6 (0.8) 0.2 (0.3) 0.05 (0.1)
x2 = contracción mediana de la demanda 0.3 (0.15) 0.6 (0.3) 0.25 (0.15)
x3 = contracción mı́nima de la demanda 0.1 (0.05) 0.2 (0.4) 0.7 (0.75)

a) En base a la experiencia del gerente de ventas, ¿ cuál serı́a la decisión que deberı́a adoptar la
fábrica a fin de maximizar su utilidad neta mensual adicional para su producción futura ?
b) Si la consultora contratada por el gerente general pronostica una contracción fuerte en la demanda,
ya sea que se suban los precios o se reduzcan las bolsas, ¿ qué es lo que el gerente deberı́a decidir ?

Nota: Debe de notar que las probabilidades de los estados de la naturaleza dependen de la acción
que tome la fábrica. En este sentido, debe de tener cuidado en utilizar las probabilidades adecuadas
para cada decisión.
52
Capı́tulo 2

DISTRIBUCIONES MUESTRALES

2.1. Propiedades de la distribución normal

En este capı́tulo abordaremos el estudio de la distribución normal y de otras distribuciones


asociadas a funciones de una muestra al azar de esta variable. El porque de la importancia de la
distribución normal se ilustra a través de las siguientes propiedades.

Proposición 5 1.- Propiedad reproductiva: Si X1 , X2 , . . . , Xn son n v.a’s independientes, donde


cada Xi ⇠ N (µi , 2
i ), entonces

n
X n
X n
X
Y = c0 + ci Xi ⇠ N (c0 + ci µi , c2i 2
i) ,
i=1 i=1 i=1

siendo c0 , c1 , . . . , cn constantes arbitrarias. En particular, si todas las medias y varianzas son iguales:
2
X̄ ⇠ N (µ, ).
n
X̄ pµ
Recuerde que esta v.a. puede estandarizarse como: Z = / n
⇠ N (0, 1).
2.- Teorema del lı́mite central (TLC): Si X1 , X2 , ..., Xn son n v.a’s independientes, donde cada Xi
tiene la misma distribución de valor esperado µ y varianza 2, entonces para n suficientemente
grande (en la práctica n 30) se cumple que aproximadamente
Pn
i=1pXi nµ X̄ µ
p ⇠ N (0, 1).
Zn = =
n / n

3.- Aproximación de la Binomial por la Normal: Si X ⇠ B(n, p) y n es suficientemente grande,


entonces aproximadamente:
X np
Z=p ⇠ N (0, 1).
np(1 p)

53
54

Aquı́, para el cálculo de probabilidades, se recomienda utilizar la llamada corrección por continuidad:
Si a  b son dos números naturales, entonces aproximadamente:

1 1 b + 1 np a 1 np
P (a  X  b) = P (a  X  b + ) = FZ ( p 2 ) FZ ( p 2 ).
2 2 np(1 p) np(1 p)

De todas las propiedades listadas, el teorema del lı́mite central ocupa un lugar preponderante en
la teorı́a de inferencia estadı́stica. Lo que el teorema plantea es que si uno tiene un conjunto suficien-
temente grande de variables independendientes con una distribución común cualquiera, entonces por
más asimétrica o extraña que sea esta distribución, la suma o el promedio de estas v.a.’s tenderá a
tener una distribución acampanada tipo la de la distribución normal.
Ejemplo: Suponga que en una linea continua de producción, la probabilidad de que un artı́culo
resulte defectuoso es de p = 0.1. Si estos artı́culos se empacan en lotes de 1,000 unidades, ¿ qué pro-
babilidad existe de que un lote contenga entre 90 y 120 artı́culos defectuosos ?.
Solución: Formalmente, la variable aleatoria X = número de artı́culos defectuosos que contiene un
lote tiene distribución Binomial de parámetros n = 1, 000 y p = 0.1. Por tanto, si queremos evaluar
la probabilidad pedida tendrı́amos que calcular una suma de 31 términos con combinatorias grandes
de por medio. Dado que el lote es grande, podemos usar la aproximación de la binomial por la normal
y evaluar de manera aproximada esta probabilidad. Utilizando la correción por continuidad tenemos
que:
89.5 1, 000(0.1) 120.5 1, 000(0.1)
P (90  X  120) = P (89.5  X  120.5) ⌘ P ( p Z p )
1, 000(0.1)(0.9) 1, 000(0.1)(0.9)

= P ( 1.1  Z  2.16) = P (Z  2.16) P (Z < 1.1) = 0.98461 0.13567 = 0.84894.

Se puede comprobar que el valor exacto de esta probabilidad es 0.849339. Como se aprecia la apro-
ximación normal ha hecho un gran trabajo. ⇤

2.2. Distribuciones muestrales asociadas a la normal

El primer paso en un estudio inferencial sobre una v.a. X consiste en la definición de su pobla-
ción estadı́stica; esta es la colección de las posibles observaciones que puedan hacerse de X en una
población fı́sica determinada1 . Por ejemplo, la población estadı́stica si se indaga sobre la calidad
(defectuoso o no) de 1,500 artı́culos producidos por una lı́nea en un dı́a, estará constituida por las
1,500 calidades de los artı́culos y no por los 1,500 artı́culos en si.
Una muestra es un subconjunto de la población estadı́stica. Por ejemplo, al elegir en el control
de calidad 100 de los 1,500 artı́culos para luego anotar la calidad de estos, estamos obteniendo una
muestra de tamaño 100. Una muestra será representativa, si esta es seleccionada de forma aleatoria.
1
En este texto asumiremos, salvo se indique lo contrario, poblaciones infinitas o muy grandes.
ESTADISTICA APLICADA Luis Valdivieso 55

Una muestra aleatoria (m.a.) de tamaño n de la v.a. X es un conjunto de n v.a’s: X1 , X2 , ..., Xn


independientes y con la misma distribución de X.
Una estadı́stica es cualquier función de los elementos de una m.a. que no dependa de parámetros
desconocidos. La idea es que de tomarse la muestra y observarse sus valores uno pueda siempre
evaluar la estadı́stica y con ello resumir alguna información de interés.
Una Distribución Muestral es la distribución de una estadı́stica.
Ejemplo: Retomando el ejemplo del control de calidad, supongamos que estemos interesados en
estudiar ahora X = Peso de un artı́culo producido en el dı́a. Esta v.a. X puede pensarse, como es
usual, tenga distribución normal de media µ y varianza 2, siendo ambos parámetros desconocidos.
Ahora, al tomarse al azar 50 artı́culos producidos durante el dı́a para luego anotar sus pesos, estamos
realmente tomando una m.a de tamaño 50 de X: X1 , X2 , ..., X50 . Nuestro interés por esta m.a es
variado. Nos podrı́a interesar, por ejemplo, estimar el peso medio de los artı́culos producidos en el
dı́a ( esto es, tener una idea aproximada de µ). Si este es el caso, nos será útil la estadı́stica media
P 1 P50
muestral X̄ = n1 ni=1 Xi = 50 i=1 Xi . Por otro lado podrı́a ser de interés estimar
2 , por citar, para

medir la confiabilidad de la estimación anterior. En este caso, uno podrı́a considerar la estadı́stica
P 1 P50
varianza muestral S 2 = n 1 1 ni=1 (Xi X̄)2 = 49 i=1 (Xi X̄)2 . Queda claro que tanto X̄ como
S 2 dependen de los elementos de la m.a. y por tanto son también v.a’s ( no conoceremos sus valores
sino hasta después de haber seleccionado los 50 artı́culos y anotado sus pesos). En tal sentido, el
preguntarse acerca de las distribuciones de estas estadı́sticas tiene sentido y su respuesta una gran
importancia práctica . Las siguientes distribuciones nacen precisamente del intento de encontrar las
distribuciones de X̄ , S 2 y de otras v.a’s asociadas.

2.2.1. La distribución chi-cuadrado

Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le denota por X ⇠ 2 (n),

si es que X ⇠ ( n2 , 12 ). Es decir, la distribución chi-cuadrado es un caso particular de una distribución


gamma.

Proposición 6 1.- Si Z ⇠ N (0, 1), entonces Z 2 ⇠ 2 (1).

2.- Propiedad reproductiva: Si W1 , W2 , ...., Wk son k variables aleatorias independientes con distribu-
ciones chi-cuadrado de respectivamente n1 , n2 , . . . , nk grados de libertad, entonces
k
X
W = Wi
i=1
Pk
es también una v.a. con distribución chi-cuadrado de n = i=1 ni grados de libertad.
3.- Si X1 , X2 , ..., Xn es una m.a de X ⇠ N (µ, 2 ), entonces
(n 1)S 2 2
W = 2
⇠ (n 1).
56

2.2.2. La distribución t de Student

Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota por X ⇠ t(n),
si su función de densidad es:
( n+1
2 )
fX (x) = p .
x2 n+1
⇡n ( n2 )(1 + n)
2

2 n
Valor esperado: µX = 0. Varianza : X = n 2 (n > 2).

Proposición 7 1.- Sea X ⇠ t(n). Si n es grande, entonces aproximadamente X ⇠ N (0, 1).


2.- Si Z ⇠ N (0, 1) y W ⇠ 2 (n) son v.a’s independientes, entonces T = qZ ⇠ t(n). En particular,
W
n
dada una m.a. X1 , X2 , ..., Xn de X ⇠ N (µ, 2 ), se cumple que:

X̄ µ
T = p ⇠ t(n 1).
S/ n

2.2.3. La distribución F de Fisher

Una v.a. X tiene distribución F de Fisher con n grados de libertad en el numerador y m grados
de libertad en el denominador, y se le denota por X ⇠ F (n, m), si su función de densidad es:
n n
( n+m
2 )(n/m) x
2 2
1
fX (x) = n+m , x > 0.
( n2 ) ( m
2 )(1 + (n/m)x)
2

m 2 2m2 (n+m 2)
Valor esperado: µX = m 2 (m > 2). Varianza X = n(m 2)2 (m 4)
(m > 4).

1
Proposición 8 1.- Si X ⇠ F (n, m), entonces X ⇠ F (m, n).
2 (n) 2 (m) W1 /n
2.- Si W1 ⇠ y W2 ⇠ son v.a’s independientes, entonces F = W2 /m ⇠ F (n, m). En
particular, si X1 , X2 , ...., Xn es una m.a de una v.a. X ⇠ N (µ1 , 2
1 ), e Y1 , Y2 , ..., Ym una m.a de una
v.a. Y ⇠ N (µ2 , 2
2 ), donde X e Y son independientes, entonces

S12 2
2
F = ⇠ F (n 1, m 1),
S22 2
1

siendo S12 y S22 las varianzas muestrales asociadas a las poblaciones estadı́sticas determinadas por X
e Y , respectivamente.

Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas
en la que se tabulan algunos valores de su función de distribución. Estas tablas se incluyen en los
apéndice A, B, C y D de estas notas.
ESTADISTICA APLICADA Luis Valdivieso 57

2.3. Intervalos de Confianza

Como una primera aplicación del estudio de las distribuciones muestrales, veamos como obtener
intervalos de confianza para los parámetros de una v.a. X ⇠ N (µ, 2 ). Recuerde que un intervalo de
confianza (IC) al 100(1 ↵) % para un parámetro poblacional ✓ de una v.a. X es un intervalo con
estadı́sticas L1 y L2 en los extremos (IC = [L1 , L2 ]) tal que P (L1  ✓  L2 ) = 1 ↵.
Una técnica para obtener IC’s es utilizar las v.a’s Z, T, W y F de este capı́tulo como variables
pivotes en su construcción. Una pivote es por definición una v.a. con distribución conocida, que
depende solo como valor desconocido del parámetro cuyo intervalo deseamos hallar. Una aplicación
de esta técnica nos lleva a los siguientes intervalos de confianza:
2 X̄ pµ
IC al 100(1 ↵) % para µ, cuando es conocida: Se obtiene usando como pivote a Z = / n

N (0, 1) y vienen dado por
IC = [X̄ z1 ↵ p , X̄ + z1 ↵ p ],
2 n 2 n
donde z1 ↵
2
denota al valor de la distribución normal estándar que acumula un área por debajo de

la función de densidad de 1 2.

Es importante destacar que gracias al TLC este IC es aún válido para la media de cualquier
distribución, siempre que n sea lo suficientemente grande y se tenga una estimación de 2.
58

IC al 100(1 ↵) % para µ, cuando 2 es desconocida: Se obtiene usando como pivote a T =


X̄ pµ
S/ n
⇠ t(n 1) y viene dado por

S S
IC = [X̄ t1 ↵ (n-1) p , X̄ + t1 ↵ (n-1) p ] ,
2 n 2 n

donde t1 ↵
2
(n-1) denota al valor de la distribución t de Student con n 1 grados de libertad que

tiene un área por debajo de la función de densidad de 1 2.
2: (n 1)S 2 2 (n
IC al 100(1 ↵) % para Se obtiene usando como pivote a W = 2 ⇠ 1) y viene
dado por
(n 1)S 2 (n 1)S 2
IC = [ 2 , 2 ],
↵ (n- 1) ↵ (n- 1)
1 2 2

donde 2 (n-1) y 2 (n- 1) denotan a los valores en la distribución chi- cuadrado con n 1 grados
↵ ↵
2
1 2
↵ ↵
de libertad que tienen áreas por debajo de la función de densidad de 2 y1 2, respectivamente.
Otro parámetro recurrente en diversas aplicaciones lo constituye la proporción p de elementos en
la población que comparten cierta caracterı́stica común E. A fin de obtener un intervalo de confianza
aproximado al 100(1 ↵) % para p, tomemos al azar n elementos de la población y consideremos
las v.a’s Xi definidas como 1 si es que en la i-ésima selección se encuentra un elemento con la
caracterı́stica E y 0 en caso contrario. Vale aclarar que los elementos de esta muestra sólo podrán
garantizarse distintos, si es que la muestra es tomada sin reemplazamiento. Este hecho ocasiona que
las variables X1 , . . . , Xn no sean independientes; sin embargo, si el tamaño de la población N , es
como lo hemos estado asumiendo grande o infinito, podrı́a garantizarse una casi independencia entre
X1 , . . . , Xn . En la práctica si N es grande estas variables son consideradas independientes, por lo que
P
la distribución de X = ni=1 Xi , que representa al número de elementos en la muestra que comparten
la caracterı́stica E, puede asumirse Binomial de parámetros n y p. Más aún, si n es grande, podremos
utilizar la aproximación de la distribución Binomial por la Normal y utilizar la v.a:

X np p̄ p
Z=p =q ⇠ N (0, 1) ,
np(1 p) p(1 p)
n

X
con p̄ = n, como variable pivote para la construcción del IC para p. En efecto, tomando simétrica-
mente valores z1 ↵
2
y z1 ↵
2
en la tabla normal estándar, podemos afirmar que:

p̄ p
P ( z1 ↵
2
q  z1 ↵
2
)=1 ↵.
p(1 p)
n

A fin de despejar p en esta expresión, podemos considerar la probabilidad equivalente siguiente:

p̄ p
P (| q |2  z12 ↵ )=1 ↵
p(1 p) 2
n
ESTADISTICA APLICADA Luis Valdivieso 59


z12 ↵ z12 ↵
P (p2 (1 + 2
) p(2p̄ + 2
) + p̄2  0) = 1 ↵.
n n
Esta probabilidad, puede escribirse como:

P ((p p1 )(p p2 )  0) = 1 ↵,

donde p1 y p2 constituyen las raices de la ecuación cuadrática correspondiente. Si ahora en la fórmula


z12 ↵
del discriminante de esta ecuación cuadrática despreciamos los términos n
2
, que son pequeños al
ser n grande, obtendremos el IC = [p1 , p2 ] al 100(1 ↵) % para p siguiente:
r r
p̄(1 p̄) p̄(1 p̄)
IC = [p̄ z1 ↵2 , p̄ + z1 ↵2 ].
n n
Nota: Como el lector habrá apreciado, cada vez que construimos un IC al 100(1 ↵) % para un
parámetro poblacional utilizamos, para la distribución de la variable pivote, valores con áreas iguales

en las colas de 2. En realidad, podrı́amos haber utilizado cualquier otra distribución de áreas con la
única restricción de que entre los valores respectivos se tenga un área de 1 ↵. La razón de tomar
áreas iguales radica en que es posible probar matemáticamente que tales intervalos son óptimos bajo
esta distribución, en el sentido que el IC correspondiente tendrá la menor longitud esperada posible.
Cualquier otra elección de áreas en las colas que sumadas den ↵ nos generarán IC’s al 100(1 ↵) %
con longitudes media mayores que la de los intervalos considerados en esta sección.

2.3.1. Corrección por finitud para los IC y tamaños de muestra

La “independencia” entre las variables X1 , . . . , Xn del desarrollo previo, que indicaban si es


que en cada selección de la muestra se obtenı́a o no a un elemento con la caracterı́stica E, sólo se
podı́a garantizar si N era grande o infinito. En caso contrario, vale decir si N no es lo suficientemente
grande, la distribución exacta del número de elementos en la muestra que comparten la caracterı́stica
P
E, X = ni=1 Xi , es Hipergeométrica de parámetros N ,M y n, siendo M el número de elementos de
la población que comparten la caracterı́stica E. En tal situación, es posible aún utilizar un teorema
del lı́mite central especial que nos garantize para un n suficientemente grande que la distribución
Hipergeométrica puede aproximarse por la distribución Normal. Esto se logra mediante la siguiente
estandarización:
X E[X] X np p̄ p
Z= p =q =q q ⇠ N (0, 1).
V (X) np(1 p) N n p(1 p) N n
N 1 n N 1

M
Si procedemos a la construcción del IC al 100(1 ↵) % para p = N, bajo la misma técnica utilizada
en la sección anterior, obtendremos el siguiente IC:
r r r r
p̄(1 p̄) N n p̄(1 p̄) N n
IC = [p̄ z1 ↵2 , p̄ + z1 ↵ ]
n N 1 2 n N 1
60
q
N n
Nótese que este IC para p difiere del anterior sólo por el factor N 1, al cual se le acostumbra
llamar el factor de corrección para poblaciones finitas. Nótese también que si N ! 1, este factor
tiende a 1 y por tanto uno obtiene el IC anterior para p.
Es posible también realizar un estudio inferencial para poblaciones finitas en el caso de la esti-
mación de la media poblacional de una v.a. X. Si la población es finita, digamos con N elementos,
se puede deducir que un IC aproximado al 100(1 ↵) % para µ cuando n es grande es:
r r
N n N n
IC = [X̄ z1 ↵2 p , X̄ + z1 ↵2 p ]
n N 1 n N 1
Nuevamente, la diferencia con el IC tradicional radica en el factor de corrección, el cual tiende a 1 si
N ! 1.
Establecidas las fórmulas de los IC aproximados al 100(1 ↵) % para cualquier media y proporción
poblacional, nos interesará ahora saber qué tamaño de muestra n deberı́a uno considerar para poder
garantizar a un nivel de confianza del 100(1 ↵) % un error máximo de estimación e. Esto se
obtiene directamente de los IC obtenidos. En efecto, si queremos estimar µ, su IC correspondiente
al 100(1 ↵) % puede escribirse como:
r
N n
P (|X̄ µ|  z1 ↵ p )=1 ↵,
2 n N 1
luego, según las condiciones establecidas, se debe tener que:
r
N n
e = z1 ↵2 p ,
n N 1
de donde despejando obtenemos la siguiente fórmula para el tamaño de muestra:
z12 ↵
2N
2
n=
z12 ↵
2 + e2 (N 1)
2

y si N ! 1:
(z1 ↵
2
)2
n= .
e2
De manera similar, podemos deducir la siguiente fórmula del tamaño de muestra n para la estimación
de p con un error máximo de estimación de e y un nivel de confianza del 100(1 ↵) %:

z12 ↵ p̄(1 p̄)N


2
n=
z12 ↵ p̄(1 p̄) + e2 (N 1)
2

y si N ! 1:
z12 ↵ p̄(1 p̄)
2
n= .
e2
Un aspecto problemático en estas fórmulas lo constituyen tanto como p̄, ya uno es un parámetro
poblacional desconocido y el otro no puede calcularse sin haberse tomado la muestra. En la práctica
ESTADISTICA APLICADA Luis Valdivieso 61

estas cantidades se estiman mediante un muestreo piloto previo (es decir, una réplica en una escala
menor del muestreo final) o por cantidades similares de otros estudios semejantes. Más aún, en el caso
de la estimación de p, se acostumbra tomar p̄ = 12 . Esta es una regla conservadora, que simplemente
asigna el valor de p̄ que maximiza el tamaño de la muestra de tal manera que uno pueda siempre
garantizar, al margen del verdadero p̄, un error de estimación de a lo más e.

Ejemplo: El contenido neto en gramos, X, de las latas de café instantáneo de un productor es una
variable aleatoria con distribución normal de media µ y varianza 2. Se especifica que la producción
debe tener µ = 290 gramos y = 8 gramos.
a) De cumplirse las especificaciones, obtenga mediante simulación, los intervalos de confianza al 90 %
para µ que se obtendrı́an de tomarse al azar diez muestras de 5 latas de café cada una. Use los
números aleatorios: 550, 975, 310, 021, 345, 218, 856, 121, 972, 665.
b) Suponga que al obtenerse de la producción real 50 IC´s al 90 % para µ, se encontró que solo 40
de ellos contenı́an el valor de 290 gramos. ¿ Qué le dice esto de la producción ? Justifique.
c) Los intervalos anteriormente hallados se basaban en muestras de 5 latas de café cada una.
¿ Cuántas latas deberı́a contener una muestra para que el verdadero valor de µ pueda estimarse
con un error no mayor a los 5 gramos y una confianza del 95 % ?
Solución: a) Si bien no se dice explı́citamente, es claro asumir que la producción de latas de café es
lo suficientemente grande como para despreciar al factor de corrección. Hecha esta observación, el
intervalo de confianza al 90 % para µ es de la forma:

8 8
[X̄ z0.95 p , X̄ + z0.95 p ] = [X̄ 1.645 p , X̄ + 1.645 p ] = [X̄ 5.8853, X̄ + 5.8853].
n n 5 5

Por tanto, requeriremos simular 10 valores de la media muestral X̄ ⇠ N (290, 64


5 ) ⌘ N (290, 12.8).
Estas simulaciones, x1 , . . . , x10 , junto con los intervalos pedidos se resumen en la siguiente tabla:

ui = FX̄ (xi ) xi Intervalo simulado


0.55 290.4496 [284.5643, 296.3349]
0.975 297.0122 [291.1269, 302.8975]
0.31 288.2260 [282.3407, 294.1113]
0.021 282.2260 [276.8394, 288.6100]
0.345 288.5730 [282.6877, 294.4583]
0.218 287.2131 [281.3278, 293.0984]
0.856 293.8014 [287.9161, 299.6867]
0.121 285.8141 [279.9288, 291.6994]
0.972 296.8371 [290.9518, 302.7224]
0.665 291.5246 [285.6393, 297.4099]
62

b) Si sólo un 80 % de los intervalos contienen a µ = 290, ello indica que las especificaciones de
producción podrı́an no estar cumpliéndose, ya que este porcentaje deberı́a ser del 90 %.
c) Se especifica aquı́ un error máximo de e = |X̄ µ| = 5 con un nivel de confianza del 95 %. Luego,
n = ( z0.975 )2 = ( 1.96(8) )2 = 9.834 ⌘ 10 ; es decir, las muestras deberı́an de contener al menos 10
e 5
latas. ⇤
Ejemplo: La facultad de Ingenierı́a de una Universidad cuenta con 1,200 alumnos y esta interesada
en realizar una encuesta con el fin de determinar, entre otras cosas, el número de sus alumnos que
tienen una PC en su casa. El coordinador de la facultad desea estimar este total con un error máximo
no mayor a los 30 alumnos y una confianza del 99 %. ¿ A cuantós alumnos de la facultad se les deberı́a
aplicar la encuesta ?
Solución: Se desea estimar T = número los alumnos de la facultad que poseen un PC en su casa
con un margen de error no mayor a los 30 alumnos y un nivel de confianza del 99 %. Dado que
la población de alumnos en la facultad es finita ( N = 1, 200) y T = N p, donde p denota a la
porporción de alumnos de la facultad que poseen un PC en su casa, el problema equivale a estimar
30
p con un margen de error no mayor a e = 1,200 = 0.025 y un nivel de confianza del 99 %. Por tanto
se deberá tomar la encuesta a
z02.995 (0.52 )(1, 200)
n= = 880.639 ⌘ 891 alumnos.
z02.995 (0.52 ) + 0.0252 (1, 199)

2.4. Ejercicios

1.- Dada una muestra aleatoria X1 , X2 , . . . , X400 de una variable aleatoria X con distribución expo-
nencial con parámetro .
a) Hallar, en términos de , la probabilidad P (X > 10).
b) Usando el teorema del Lı́mite Central, encuentre un intervalo de confianza al 95 % para la
probabilidad P (X > 10).
c) Evalue el intervalo anterior, si es que la muestra dió una media de 23.6.

2.- Cierto tipo de tarjetas de video son empaquetadas en grupos de 35 tarjetas cada uno por una
máquina que realiza el recuento y empaquetado en forma automática. Con el fin de verificar la
exactitud de la máquina, los paquetes se pesan antes de enviarlos a las tiendas de expendio. Se sabe
que el peso de cada tarjeta es una variable aleatoria con media 40 gramos y desviación estándar 2
gramos. Si un paquete se considera que tiene 35 tarjetas cuando su peso está comprendido entre los
1,365 y 1,435 gramos, hallar:
ESTADISTICA APLICADA Luis Valdivieso 63

a) La probabilidad de que un paquete que tiene 34 tarjetas sea considerado como si tuviera 35.
b) La probabilidad de que un paquete que realmente tiene 35 tarjetas no sea considerado como si
tuviese 35.

3.- El número de quejas que semanalmente recibe una sucursal de comida rápida, X, se supone que
es una v.a discreta con la siguiente función de probabilidad:

Cx + 0,1, si x = 0, 1, 2, 3, 4, 5
PX (x) =
0, en otro caso.
a) Halle el valor de C y la media y varianza de esta distribución.
b) Suponga que en la ciudad hay 49 sucursales de la cadena. Halle de manera aproximada la proba-
bilidad de que en esta ciudad la cadena reciba durante una semana más de 150 quejas. Sugerencia:
Use el TLC.

4.- Dada una muestra aleatoria X1 , X2 , ..., Xn de una v.a. X ⇠ exp( ) , se puede probar que

Y = 2n X̄

es una v.a con distribución chi cuadrado de 2n grados de libertad.


a) Use este resultado para deducir un intervalo de confianza al 95 % para .
b) Otra manera de obtener un IC aproximado para es mediante el teorema del lı́mite central.
Usando un nivel de confianza del 95 % y asumiendo que se tiene una muestra suficientemente grande,
obtenga tal intervalo.
c) Suponga que los tiempos de vida útil (en horas) de una marca de bombillas eléctricas tienen
razones de fallas constantes e iguales a un parámetro . ¿ Entre qué valores estima se encuentre
con un nivel de confianza del 95 %, si es que en una muestra de 45 de estas bombillas se encontró un
tiempo promedio de vida útil de 120 horas ?. Use los métodos obtenidos en a) y en b) e indique con
cuál de estas estimaciones se quedarı́a. Justifique.

5.- Sea X1 , X2 , ...., Xn1 una m.a de una v.a. X ⇠ N (µ1 , 2) y sea Y1 , Y2 , ..., Yn2 una m.a de una v.a.
Y ⇠ N (µ2 , 2 ), donde X e Y son independientes.
(n1 1)S12 +(n2 1)S22
a) Muestre que la v.a. W = 2 tiene distribución chi-cuadrado con n1 + n2 2 grados
de libertad.
b) Muestre que
s
X̄ Ȳ (µ1 µ2 ) (n1 1)S12 + (n2 1)S22
T = q , donde Sp =
Sp n11 + 1 n1 + n2 2
n2

es una v.a. con distribución t de Student de n1 + n2 2 grados de libertad.


c) Utilice la v.a. anterior T como variable pivote para construir un intervalo de confianza al
100(1 ↵) % para µ1 µ2 .
64

d) Para comparar los gastos medios mensuales de los alumnos de dos universidades particulares
se han seleccionado de manera aleatoria dos muestras de 9 y 10 alumnos respectivamente de cada
universidad, encontrándose los siguientes valores en dólares:

Muestra de la U. A 390 395 380 390 400 380 370 390 380
Muestra de la U. B 400 410 420 380 390 410 400 405 405 400

Asumiendose normalidad e igual variabililidad en los gastos de ambas universidades, ¿ podrı́a ase-
gurar, a un nivel de confianza del 95 %, que los gastos medios en ambas universidades no son los
mismos ?

6.- Se piensa que la concentración del ingrediente activo de un detergente lı́quido para ropa, es
afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se sabe que la desviación
estándar de esta concentración, , es de 3.5 g/l (gramos por litro), sin importar el tipo de catalizador
utilizado. Se toman dos muestras aleatorias, una con cada catalizador y se obtienen los siguientes
datos:

Tamaños de Media muestral de la


muestra concentración activa
Concentración bajo el catalizador 1 (X) 10 88.5
Concentración bajo el catalizador 2 (Y) 15 87.0

Asumiendo que las distribuciones poblacionales de X e Y son normales:


a) Encuentre un intervalo de confianza al 95 % para la diferencia entre las medias de las concentracio-
nes activas para los dos catalizadores. Use, en la construcción del intervalo, a la variable estandarizada
de la diferencia de medias muestrales de X e Y .
b) ¿ Se podrı́a afirmar con una confianza del 95 % que las concentraciones activas medias dependen
del catalizador utilizado ?
c) ¿ Qué tamaño de muestra se requiere para cada población si se desea tener una confianza del 95 %
de que el error al estimar la diferencia entre las medias de las concentraciones activas para los dos
catalizadores sea menor que 1.2 g/l ? Suponga que se mantiene la relación actual entre los tamaños
muestrales.

7.- Se desea estimar el gasto total en adquisición de libros, para cada perı́odo, efectuado por los
alumnos de una universidad. A fin de reducir la variabilidad, se decide considerar 3 grupos de
acuerdo al nivel de estudios: Estudios Generales, Pre-grado y Post-grado. Se selecciona una muestra
aleatoria en cada grupo y se halla un estimado del total gastado en adquisición de libros durante un
perı́odo por cada alumno obteniéndose los siguientes resultados:
ESTADISTICA APLICADA Luis Valdivieso 65

Estudios Generales Pre-Grado Post-Grado


Ni 6,000 8,000 2,000
ni 120 160 40
X̄i 46.8 59.0 37.2
Si 6.6 9.6 18.2

a) Halle un intervalo de confianza al 95 % para el gasto total en libros efectuado por los alumnos de
Post-grado.
b) Si se desea que el margen de error en la estimación del inciso a) sea de 8,000 u.m, ¿ cuántos
alumnos de Post-grado se deben muestrear ?
c) Halle una estimación puntual del gasto total en adquisición de libros en la universidad.
d) Halle un intervalo de confianza al 95 % para el gasto total en adquisición de libros efectuado por
los alumnos de la universidad.

8.- a) ¿ Qué tamaño de muestra debe de usted considerar a fin de estimar la proporción de defectos
de un lote de 500 unidades de tal manera que el error máximo en su estimación sea de 0.1 con un
nivel de confianza del 95 % ?
b) Un instrumento electrónico tiene una duración T con distribución exponencial de parámetro
= 0.01
b1) Si se prueban 5 de estas componentes, determine la probabilidad de que el mayor valor
observado supere las 720 horas.
b2) Si se prueban 81 de estas componentes, determine la probabilidad que el tiempo promedio
de todas ellas supere las 720 horas.

9.- Se desea estimar la proporción de votantes p a favor de un candidato para las elecciones del
presidente de un club que cuenta en su padrón electoral con 1,500 socios inscritos. Para esto se ha
decidido realizar una encuesta de opinión entre los socios. Si p̄ representa la proporción muestral
de votantes a favor del candidato que se obtendrá en la encuesta y se desea cometer un error de
estimación E = |p̄ p| de a lo más 0.025 con una confianza del 95 %, ¿ qué tamaño de muestra n
deberı́a considerarse en la encuesta ? ¿ Cuál serı́a el tamño de muestra en la encuesta, si ahora se
desea un nivel de confianza del 99 % ?

10.- Una compañı́a eléctrica esta interesada en estimar, mediante un muestreo, el total en kilowatts-
hora (kwh) del consumo de electricidad de las viviendas en las dos zonas que conforman una región
A: la zona urbana y la zona industrial. Es de interés también para la compañı́a conocer la proporción
P de viviendas, en cada zona, que cuentan con un medidor de marca AFA, pues la compañı́a esta
muy interesada en reemplazar estos a corto plazo. Dado que los consumos son bastante diferenciados
66

en ambas zonas se ha previsto hacer estudios independientes en cada uno de ellos. Para tal efecto
se dispone de los resultados siguientes de un estudio muestral ya realizado en otra región B de
caracterı́sticas muy similares a la región de interés:

Número Tamaño Total de consumo Desv. Est. de los Número de viviendas


total de de la en kwh consumos en la en la muestra
viviendas muestra en la muestra muestra (en kwh) con medidores AFA
Zona urbana 1,200 50 8,500 15.2 22
Zona industrial 120 20 40,000 40.8 5

A un nivel de confianza del 95 %:


a) ¿ Cuál fue el máximo error de estimación considerado en la estimación de la proporción de viviendas
con medidores AFA para la zona urbana de la región B ?
b) ¿ Cuál fue el máximo error de estimación considerado en la estimación del consumo total de
electricidad para la zona urbana de la región B ?
c) Asumiendo normalidad en la distribución de los consumos por vivienda, ¿cuál fue el máximo error
de estimación considerado en la estimación del consumo total de electricidad para la zona Industrial
de la región B?. Note que el tamaño muestral 20 es aquı́ pequeño por lo que usted deberá de utilizar
la distribución exacta de la variable de interés.
d) Si ahora en la región A se desean estimar los consumos totales por zona con un máximo error de
estimación de 4,000 kwh y la proporción de viviendas con medidores AFA en cada zona con un error
máximo de estimación de 0.1, ¿ cuál debe de ser el tamaño de muestra apropiado para cada zona de
estudio ?
Sugerencia: A fin de estimar la dispersión de los consumos y la proporción poblacional de viviendas
con medidores AFA para las zonas de la región A, puede usted utilizar los datos dados para la región
B.
e) Si se tomaran al azar de la región A n viviendas, donde n es el número total de viviendas, calculadas
en d) para encuestarse en la región A, ¿ cuál serı́a el máximo error de estimación que se obtendrı́a
al estimarse el consumo medio en esta región ?
Sugerencia: Usted deberá estimar la dispersión de consumos de toda la región en base a las disper-
siones de cada una de las zonas de la región B.

11.- Una madererı́a minorista inspecciona los embarques de madera que llegan, a través de camiones
de carga, de sus proveedores. Para los embarques de pino de calidad selecta, de 8 pies (2 por 4),
el supervisor escoge aleatoriamente una gruesa (12 docenas o 144 hojas) de un embarque de varias
docenas de miles de hojas. En la muestra, 18 hojas no pueden venderse como de calidad selecta.
ESTADISTICA APLICADA Luis Valdivieso 67

a) Obtenga un intervalo de confianza al 95 % para la proporción de hojas de todo el embarque que


no pueden venderse como de calidad selecta.
b) Si el 20 % o más del embarque no puede venderse como madera de calidad selecta el embarque no
es rentable. ¿ Indica el intervalo de confianza anterior que hay razones para pensar que el embarque
no es rentable ?
c) La muestra se toma siempre de la plataforma ubicada en la parte posterior derecha del camión de
carga. Cada plataforma contiene 4 gruesas ubicadas en una misma linea, de modo que la madererı́a
selecciona, las 144 hojas de la muestra por rotación: del primer embarque, las 144 de arriba a la
izquierda; del siguiente embarque, las 144 de arriba a la derecha, y ası́ sucesivamente. ¿ Por qué ésta
no es una muestra aleatoria de hojas ? ¿ No podrı́a un proveedor falto de ética tomar ventajas de
este proceso ? En su opinión, ¿serı́a factible tomar una muestra aleatoria simple en esta situación ?
¿ Cómo tomarı́a la muestra para dificultar que un proveedor falto de ética lo engañe ?

12.- Suponga que la madererı́a del ejercicio 7 tiene que decidir cúantas hojas por embarque serán
inspeccionadas. ¿De qué tamaño se debe tomar una muestra para obtener un intervalo de confianza
del 95 % con una amplitud de 0.04 para la proporción de hojas invendibles ?. Suponga que entre
un 10 % y un 20 % del embarque es invendible. En esta situación, ¿ serı́a útil calcular el tamaño de
muestral con base en la hipótesis extrema de que el 50 % del embarque es invendible ?

13.-El Ingreso mensual de las 400 microempresas de metal-mecánica de una ciudad, se asume que
es una v.a. X normal con media µ y varianza 2, y para reactivar el sector se quiere establecer una
lı́nea de crédito cuyos pagos mensuales sean iguales al 10 % del ingreso de la empresa. Una muestra
de n = 70 microempresarios dió una media de 710 dólares y una desviación estándar de 26 dólares.
a) Construya un IC para µ al 95 % de confianza y determine el rango de pagos esperados de un
microempresario que toma el crédito.
b) ¿ Entre que valores se encontrará a un nivel de confianza del 95 % el total de pagos mensuales
que efectuaran las microempresas, si se asume que se otorgará crédito a todo el sector ?
c) Determine el máximo error de estimación que se pudiera cometer en la estimación en b).
68
Capı́tulo 3

CONTRASTES DE HIPÓTESIS

3.1. Generalidades

Consideremos una variable aleatoria X cuya función de distribución FX (x) = P (X  x) depende


de un parámetro (o vector de parámetros) ✓. A esto lo denotaremos en adelante por X ⇠ ✓.

Definición 17 Una hipótesis (estadı́stica) es cualquier enunciado o conjetura que podamos hacer
con respecto a la v.a. X ⇠ ✓.

En general estos enunciados pueden ir dirigidos a ✓ (hipótesis paramétricas), la forma de FX


(pruebas de bondad de ajuste) u otras relaciones basadas en la interrrelación de X con otras v.a’s.
Nosotros discutiremos inicialmente las denominadas pruebas paramétricas.
Todo contraste de hipótesis paramétrico posee la forma siguiente:
8
> = ✓1 simple
>
>
>
< > ✓0 a cola derecha
H0 : ✓ = ✓0 vs H1 : ✓
>
> < ✓0 a cola izquierda
>
>
:
6= ✓0 a dos colas

donde a H0 se le llama la hipótesis nula y a H1 la hipótesis alternativa (✓0 y ✓1 conocidos).


La hipótesis nula H0 puede, en base a una muestra aleatoria X1 , X2 , ..., Xn de X, probarse
verdadera o falsa. La idea es construir mediante algún procedimiento adecuado, una regla de decisión
con una estadı́stica de prueba
Y0 = f (X1 , X2 , ..., Xn ) : S ! R

que tenga distribución conocida bajo H0 . Aquı́ S denota a la colección de todas las posibles mues-
tras de tamaño n que pudieran elegirse de la población de X. La estadı́stica de prueba resume la
información contenida en la muestra y ,con la regla de decisión, particiona el espacio muestral S en

69
70

dos regiones: la región de aceptación de H0 y la región crı́tica o de rechazo de H0 . Luego, un expe-


rimentador al observar los valores que toma su muestra, evaluar su estadı́stica de prueba y apreciar
en que región cae, tomará finalmente la decisión que corresponda.

Definición 18 Un contraste, o prueba de hipótesis, es una partición del espacio muestral S en dos
regiones: una llamada la región de aceptación de H0 y la otra la región crı́tica o de rechazo de H0 .

Cuando un experimentador toma la decisión de rechazar o de aceptar H0 , él podrı́a cometer dos
tipos de error. Estos errores se miden como sigue

Definición 19 ↵ = P [Error tipo I] = P [Rechazar H0 | H0 es verdadera]


= P [Error tipo II] = P [Aceptar H0 | H0 es falsa].

Obviamente un buen contraste es aquel en el que ↵ y son los más pequeños posibles. Desafor-
tunadamente se prueba que ↵ y están en relación inversamente proporcional. Por tal motivo, se
ha convenido en fijar a ↵ a fin de tratar de encontrar la mejor prueba; es decir, aquella que con este
↵ dado tenga el más pequeño o si se quiere la potencia

= P [Rechazar H0 | H0 es falsa] = 1

máxima. Esta convención hace de que a ↵ se le denomine también el nivel de significación de la


prueba y a H1 la hipótesis de trabajo, ya que de probarse que H0 es falsa, uno tendrı́a controlado
mediante ↵ el error en su decisión. Nótese que bajo una hipótesis compuesta, no existe un único valor
para , pues este depende del valor que se especifique para ✓ cuando H1 es verdadera.

Definición 20 La curva caracterı́stica de operación (curva OC) viene dada por la gráfica de en
función del valor del parámetro bajo la hipótesis alternativa.

Ejemplo: Un inspector piensa que las balanzas que se utilizan en los mercados de abastos de un
distrito de la capital estan siendo adulteradas. Para tal efecto, se eligieron al azar 25 puestos de
expendio, registrándose en cada uno de ellos el peso de un kilo real en las balanzas de estos puestos.
Asumiendo normalidad:
a) Plantee las hipótesis del caso.
b) Si el inspector decide concluir que las balanzas de los mercados de abastos de este distrito estan
adulteradas de ocurrir que el promedio de pesos en la muestra supera un cierto valor C. Halle C de
tal manera que el nivel de significación de la prueba sea de ↵ = 0.05.
c) ¿ Qué es lo que el inspector determinarı́a si al registrar los pesos encuentra que en promedio estos
dan 1.075 kgs con una desviación estándar de 0.2 kgs ?. Use ↵ = 0.05.
ESTADISTICA APLICADA Luis Valdivieso 71

Solución: a) Sea X = Peso de un kilo real en una balanza de un puesto de expendio del distrito.
Asumiendo, como se indica, que X ⇠ N (µ, 2 ), estaremos interesados en contrastar a nivel ↵:

H0 : µ = 1 vs H1 : µ > 1.

Notese que H1 : µ > 1 es aquı́ la hipótesis de trabajo del inspector, pues él piensa que al estar
adulteradas las balanzas, ellas tenderán a registrar un mayor peso del que realmente miden.
b) El inspector plantea una región crı́tica de la forma:

R.C : X̄ > C.

Para que el nivel de significación de la prueba sea de ↵ = 0.05 se debe de cumplir que

C 1
0.05 = P (RechazarH0 | H0 es verdadera) = P (X̄ > C | µ = 1) = P (T0 > ),
S/5

X̄ 1 2
donde T0 = S/5 ⇠ t(24) es el estadı́stico de prueba ( desconocido). Equivalentemente

C 1
0.95 = P (T0  ),
S/5

de donde se sigue que


C 1
= t0.95 (24) = 1.711
S/5
y que
C = 1 + 0.3422 S,

siendo S la desviación estándar de la muestra.


c) Como la región crı́tica del contraste es

X̄ > 1 + 0.3422 S

y se ha observado en la muestra que X̄ = 1.075 y S = 0.2, entonces esta región crı́tica se satisface
(1.075 > 1.06844). En conclusión se rechazará H0 y el inspector podrá asegurar, con una probabilidad
de equivocarse del 5 %, que las balanzas que se utilizan en los mercados de abastos del distrito si
están siendo adulteradas. ⇤
Dada la relevancia de la distribución normal, mostraremos a continuación un resumen de los
distintos contrastes de hipótesis paramétricos sobre la media y la varianza de una y de dos poblaciones
normales independientes. Estos si bien parecen restrictivos, son pruebas asintóticamente válidas para
la medias de una y dos poblaciones cualesquieras en muestras grandes.
72

CONTRASTES SOBRE LOS PARAMETROS DE UNA O DOS POBLACIONES


NORMALES INDEPENDIENTES DE LAS V.A’ S X E Y .

Hipótesis
Nula Alternativa Estadı́stica de Prueba Región crı́tica
H1 : µ 6= µ0 |Z0 | > z1 ↵
2
X̄ pµ0
H0 : µ = µ 0 vs H1 : µ > µ 0 Z0 = / n
⇠ N (0, 1) Z0 > z1 ↵
2 conocido H1 : µ < µ 0 Z0 < z1 ↵

H1 : µ 6= µ0 |T0 | > t1 ↵
2
(n-1)
X̄ pµ0
H0 : µ = µ0 vs H1 : µ > µ 0 T0 = S/ n
⇠ t(n-1) T0 > t1 ↵ (n-1)
2 desconocido H1 : µ < µ 0 T0 < t1 ↵ (n-1)

H1 : µ1 6= µ2 |Z0 | > z1 ↵
2

H0 : µ1 = µ2 vs H1 : µ 1 > µ 2 Z0 = rX̄ Ȳ ⇠ N (0, 1) Z0 > z1 ↵


2 2
1+ 2
n1 n2
2 y 2 conocidos H1 : µ 1 < µ 2 Z0 < z1
1 2 ↵

H1 : µ1 6= µ2 |T0 | > t1 ↵
2
( n1 + n2 2)
X̄ Ȳ
H0 : µ1 = µ2 vs H1 : µ 1 > µ 2 T0 = q
1
⇠ t(n1 +n2 -2) T0 > t1 ↵ ( n1 + n2 2)
Sp + n1
q n 1 2
2 2 (n1 1)S12 +(n2 1)S22
1 = 2 desconocidos H1 : µ 1 < µ 2 Sp = n1 +n2 2 T0 < t1 ↵ ( n1 + n2 2)

H1 : µ1 6= µ2 |T0 | > t1 ↵
2
(v)
H0 : µ1 = µ2 vs H1 : µ 1 > µ 2 T0 = rX̄ Ȳ ⇠ T (v) T0 > t1 ↵ (v)
2
S1 S2
n1
+ n2
2
S2 S2
( n1 + n2 )2
2 6= 2 desconocidos H1 : µ 1 < µ 2 v= T0 < t1 ↵ (v)
1 2
1 2 2 /n )2
(S1 1 (S22 /n )2
2
n1 1
+ n2 1

H1 : 2 6= 2 2 < 2 (n-1) ó 2 > 2 (n-1)


0 0 ↵ 0 ↵
2
1 2
2 2 2 2 2 (n 1)S 2 2 (n-1) 2 2
H0 : = 0 vs H1 : > 0 0 = 2 ⇠ 0 > 1 ↵ (n-1)
0

H1 : 2 < 2 2 < 2 (n-1)


0 0 ↵

H1 : 2 6= 2 F0 < F ↵2 (n1 -1, n2 -1) ó F0 > F1 ↵ ( n1


1 2 2
2 2 2 2 S12
H0 : 1 = 2 vs H1 : 1 > 2 F0 = S22
⇠ F (n1 -1, n2 -1) F0 > F1 ↵ (n1 - 1, n2 -1)

H1 : 2 < 2 F0 < F↵ (n1 1, n 2 1)


1 2
ESTADISTICA APLICADA Luis Valdivieso 73

NOTA: Si X e Y no son variables independientes y se desea contrastar a nivel ↵ H0 : µ1 = µ2


vs H1 , uno puede definir la variable diferencia D = X Y y convertir este contraste en uno sobre
el de una sola población (H0 : µD = 0 ). Este contraste sobre la población de la nueva v.a. D de
diferencias se indica en el segundo juego de hipótesis de la última tabla.

Ejemplo: Una operación de montaje en una fábrica manufacturera requiere aproximadamente de


un entrenamiento de un mes para que un nuevo empleado alcance la máxima eficiencia. Se sugirió un
nuevo método para el entrenamiento y se realizó una prueba para comparar el método nuevo con el
procedimiento estándar. Dado que la fábrica tenı́a 2 turnos de trabajo, se entrenaron estos durante
un periodo de cuatro semanas; un turno utilizó el nuevo método y el otro el procedimiento estándar.
Se midió el tiempo (en minutos) que necesitó cada empleado para montar el dispositivo al término del
periodo de entrenamiento. Las mediciones de los 9 empleados que conforman cada turno se muestran
a continuación

Procedimiento
Estándar 32 37 35 28 41 44 35 31 34
Nuevo 35 31 29 25 34 40 27 32

donde debido a problemas, uno de los empleados no pudo completar el entrenamiento con el nuevo
método . Asumiendo normalidad en los tiempos y planteando claramente sus hipótesis y parámetros:
a) ¿ Se podrı́a decir que estos métodos originan diferente variabilidad en los tiempos de montaje de
los empleados ? Use ↵ = 0.05.
b) ¿ Se podrı́a decir que efectivamente el nuevo método resulta mejor que el procedimiento
estándar ? Use ↵ = 0.05.

Solución: a) Sean X e Y las variables aleatorias que denotan al tiempo en minutos que ne-
cesita un empleado para realizar la operación de montaje al término del entrenamiento con el
método estándar y con el nuevo método, respectivamente. Se asume que X ⇠ N (µ1 , 2
1) e
Y ⇠ N (µ2 , 2
2 ). Estaremos inicialmente interesados en contrastar a nivel ↵ = 0.05:

2 2 2 2
H0 : 1 = 2 vs H1 : 1 6= 2.

Se rechazará H0 si se satisface la región crı́tica

S12 S12
R.C: F0 = < F0.025 (8, 7) ó F0 = > F0.975 (8, 7).
S22 S22

De la tabla F en el apéndice del texto obtenemos F0.975 (8, 7) = 4.9 y por una de las propiedades de
24.4444
la distribución F se tiene que F0.025 (8, 7) = F0.9751 (7,8) = 4.153 = 0.22. Dado que F0 = 22 .83929 = 1.07
no cae en la región crı́tica podemos asumir que ambos métodos originan variabilidades similares en
los tiempos de montaje del dispositivo.
74

b) Se desea contrastar a nivel ↵ = 0.05:

H0 : µ1 = µ2 vs H1 : µ1 > µ2 .

Dado que 2 y 2 son desconocidos y por a) podemos asumir 2 = 2


1 2 1 2, se rechazará H0 a nivel
↵ =0.05 si se satisface la región crı́tica R.C: T0 > t0.95 (15) =1.753. Evaluando el estadı́stico de
X̄ Ȳ X̄ Ȳ
prueba T0 = r
2 +7S 2 q
obtenemos que T0 = r
2 +7S 2 q
= 1.52 no cae en la región crı́tica.
8S1 1 8S1
15
2
9
+ 18 15
2 1
9
+ 18
Por tanto, no podemos garantizar que el nuevo método resulte mejor que el método tradicional. ⇤

Ejemplo: Suponga en el ejemplo previo que antes de entrenarse a los 9 empleados con el método
estándar, se les hubiera medido (en el mismo orden) los tiempos en minutos que necesitaron cada
uno de ellos en montar el dispositivo, encontrándose los siguientes datos:

35 39 35 34 40 47 40 38 36

¿ Podrı́a afirmarse con una probabilidad de equivocarse del 5 % que el entrenamiento es efectivo ?

Solución: Se desea comparar los tiempos medios de montaje entre las poblaciones de empleados antes
y despúes del entrenamiento estándar. Dado que se trata de los mismos empleados, estas poblaciones
no son lógicamente independientes. En este sentido, si denotamos por XA y XB a los tiempos de
montaje antes y después del entrenamiento y asumimos que ambas tienen distribución normal con
medias respectivas µ1 y µ2 , estaremos interesados en contrastar a nivel ↵ = 0.05:

H0 : µ1 = µ2 vs H1 : µ1 > µ2 .

Por la nota previa a estos ejemplos, debemos de proceder a construir la siguiente tabla de datos:
XA (Antes) XD (Después) D = XA XB (Diferencia)
35 32 3
39 37 2
35 35 0
34 28 6
40 41 -1
47 44 3
40 35 5
38 31 7
36 34 2
de la cual obtenemos D̄ = 3 y SD = 2.646. Nuestra toma de decisiones consistirá en rechazar
p
D̄ n
H0 a nivel ↵ = 0.05 si se satisface la región crı́tica R.C: T0 = SD > t0.95 (8) = 1.86. Dado que
T0 = 3.4 > 1.86, sı́ podemos garantizar, con una probabilidad de equivocarnos de ↵ = 0.05, que el
entrenamiento resulta efectivo. ⇤
ESTADISTICA APLICADA Luis Valdivieso 75

3.2. Tamaños de muestra y curvas OC

Sea X ⇠ N (µ, 2 ), con 2 conocida, y supongamos deseamos contrastar a nivel ↵:

H0 : µ = µ0 vs H1 : µ > µ0 .

Supongamos que H0 es falsa y que el verdadero valor de µ es µ = µ0 + , con > 0. Luego, la


probabilidad de cometer el error tipo II viene dada por:

= P ( Aceptar H0 / H0 es f alsa ) = P (X̄  µ0 + z1 ↵p /µ = µ0 + )


n

µ 0 + z1 µ0 p
↵ pn n
= P (Z  ) = FZ (z1 ↵ )
p
n

Como se aprecia existen aquı́ 3 cantidades de interés relacionadas para un ↵ fijo: , n y . Dadas 2
de ellas la tercera puede obtenerse analı́ticamente. Permitámonos realizar el siguiente análisis:
X̄ µ0
Si H0 es verdadera, entonces Z0 = p ⇠ N (0, 1).
n
p
X̄ µ0 n
Si H1 es verdadera, entonces Z1 = p = Z0 ⇠ N (0, 1).
n

De aqui que:

1. La relación entre ↵ y es inversamente proporcional.

2. Si ↵ y n son dados, uno minimiza la probabilidad de cometer el error tipo II o, equivalentemente


maximiza la potencia de la prueba, incrementando la divergencia entre el verdadero valor de µ
y el µ0 especificado; es decir, aumentando =µ µ0 .

3. Si ↵ y son dados, uno maximiza la potencia de la prueba tomando un n más grande.

Definición 21 Una carta de control es una gráfica conjunta de las curvas caracterı́sticas de opera-
ción para distintos tamaños de muestra n y para un valor fijo de ↵. En ella las curvas OC utilizan
como parámetro de a un término d que nos indica en cuantas desviaciones estándares se desvia el
verdadero parámetro del que se especifica en H0 .

µ µ0
En el caso que hemos discutido el parámetro d vienen dado por: d = = . Ası́, la carta de
control para, por ejemplo un ↵ = 0.05 (se acostumbra también dar para un ↵ = 0.01), viene dada
p
por la yuxtaposición de las gráficas de la función (d) = FZ (1.645 d n) para distintos valores de
n. Esta carta de control se aprecia en la figura siguiente:
76

Carta de control a cola derecha y


nivel de significación 0.05
1.0
0.8
Probabilidad de aceptar Ho

0.6
0.4

3 2 n=1
75 15 5
6 4
9
0.2

50 20
7
30
8
n = 100
40 10
0.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Al igual que lo desarrollado para el contraste anterior, uno puede deducir, de manera similar,
las siguientes probabilidades de error tipo II para los contrastes a nivel ↵ sobre µ en una v.a.
X ⇠ N (µ, 2) de 2 conocido.
Si se desea contrastar
H0 : µ = µ0 vs H1 : µ < µ0 ,

entonces p
n
=1 FZ ( z1 ↵ + ) (donde = µ0 µ > 0)

Si se desea contrastar
H0 : µ = µ0 vs H1 : µ 6= µ0 ,

entonces p p
n n
= FZ (z1 ↵
2
) FZ ( z1 ↵
2
) (donde = |µ µ0 | > 0)

Nota: Si n es grande estas fórmulas son, por el TLC, válidas aún si X no tiene distribución normal. Si
se desconoce, ella puede reemplazarse por alguna estimación o por S. Por otro lado, si n es pequeño
(n < 30), uno deberá utilizar bajo normalidad no Z ⇠ N (0, 1) sino T ⇠ t(n 1) e igualmente alguna
estimación de ó S.
ESTADISTICA APLICADA Luis Valdivieso 77

Ejemplo: Unos pasadores de aluminio fabricados para la industria de la aviación tienen un diámetro
aleatorio cuya distribución es normal con media µ = 10 mm y desviación estándar = 0.5 mm. En
las placas de aluminio se barrenan agujeros cuyos diámetros tienen distribución normal de media µ
mm y desviación estándar de 0.5 mm.
a) ¿ Cuál debe de ser el valor de µ para que la probabilidad de que un pasador no entre en un agujero
sea 0.01 ?
b) Suponga que el ingeniero de control en la producción de los pasadores sospecha de que los diámetros
medios de estos no estan cumpliendo la especificación dada. Si el desea detectar una desviación de
la especificación de 1 mm con una probabilidad de al menos 0.99 y un nivel de significación de ↵ =
0.05, ¿ cuál serı́a el tamaño de muestra que deberı́a utilizar en un contraste tendiente a aclarar sus
sospechas ?

Solución: a) Sea X ⇠ N (10, 0.52 ) el diámetro de un pasador y sea Y ⇠ N (µ, 2) el diámetro de una
agujero barrenado (ambos en mm). Se plantea que

0.01 = P (X > Y ) = P (X Y > 0).

Como X Y ⇠ N (10 µ, 2(0.5)2 ), al ser X e Y independientes, se tiene que:

µ 10
0.99 = P (Z  p ).
2(0.5)
2(µ 10)
Luego de tabla, p
2
= 2.325 y por tanto µ = 11.644 mm.
b) El ingeniero estará interesado en contrastar a nivel ↵ = 0.05:

H0 : µX = 10 vs H1 : µX 6= 10.

y especifı́ca una potencia de al menos 0.99 (o  0.01) a fin de detectar una desviación de los 10
mm de = 1 mm. Luego se tiene que:
p p
n n
FZ (1.96 ) FZ ( 1.96 )  0.01.
0.5 0.5

Dado que el segundo término en esta expresión es pequeño podrı́amos inicialmente considerar sólo el
p
n
primero y por tanto ubicar un n tal que 1.96 0. 5  2.325, lo cual nos da que n > 4.59. Tomando
n = 5, vemos que
p p
n n
FZ (1.96 ) FZ ( 1.96 ) = FZ ( 2.51) FZ ( 6.432) = 0.006  0.01.
0.5 0.5

Luego, el ingeniero podrı́a utilizar una muestra de al menos 5 pasadores. Notese que este tamaño de
muestra es pequeño; sin embargo válido, pues no estamos realizando aquı́ una aproximación normal,
sino considerando que los diámetros de los pasadores tienen distribución normal. ⇤
78

3.3. Muestreo por aceptación

El muestreo por aceptación es una técnica de control de calidad para lotes que se realiza mediante
el muestreo de sus unidades. Consideremos un lote de N unidades y supongamos que este contiene M
unidades defectuosas. Si se extrae al azar del lote una muestra de n unidades (sin reemplazamiento)
y se define la v.a. X = número de unidades defectuosas encontradas en la muestra, entonces es
conocido que X ⇠ H(N, M, n).
M
Siendo el parámetro de interés la proporción de defectos por lote p = N , uno querrá contrastar:

H0 : p = p0 vs H1 : p > p0 (⇤) ,

donde p0 se denomina el AQL (acceptance quality level) o nivel de calidad aceptable del productor
y en H1 se acostumbra escribir p = p1 (p1 > p0 ), donde p1 se denomina el LTPD (limit tolerance
percentage of defects) o la proporción de defectos por lote que un consumidor estarı́a como máximo
dispuesto a tolerar.
Si se rechaza H0 en (*), entonces el lote bajo control deberá ser rechazado por el productor y
mandado a revisión total para la inspección y reemplazo de todas sus unidades defectuosas; mientras
que si no se rechaza H0 el lote podrá salir al mercado para su libre distribución a los consumidores.
En este contexto las probabilidades de cometer los errores tipo I y tipo II pueden interpretarse como:

↵ = Riesgo del productor = proporción de lotes buenos que serán rechazados por el control

= Riesgo del consumidor = proporción de lotes malos que serán aceptados por el control.

La región crı́tica o de rechazo de H0 en (*) viene dada por:

R.C: X > c.

Definición 22 Un plan de muestreo simple consiste en la especificación del número de aceptación


c y del tamaño de muestra n.

Un plan de muestreo puede mejor especificarse mediante su curva OC extendida. Esta es la


gráfica de la probabilidad de aceptación de un lote en términos de p; vale decir, de L(p) = P (X  c).
Explı́citamente L(p) viene dada por:
c N (1 p)
X CxN p Cn x
L(p) =
CnN
x=0

Esta expresión en la práctica es poco utilizada ya que por lo general los lotes a inspeccionarse son lo
suficientemente grandes (N grande) como para aproximar la distribución hipergeométrica de X por
una distribución binomial X ⇠ B(n, p). En este caso:
c
X
L(p) = Cxn px (1 p)n x

x=0
ESTADISTICA APLICADA Luis Valdivieso 79

Más aún, si n es grande (n 30) podemos , gracias al TLC, escribir:

c + 1 np 1
np
L(p) = P (0  X  c) = FZ ( p 2 ) FZ ( p 2 ).
np(1 p) np(1 p)
Ejemplo: En un plan de muestreo simple con n = 12 y c = 1 el nivel de calidad aceptable es p =0.01.
Halle el riesgo del productor y el riesgo del consumidor si el LTPD es de 0.15.

Solución: Al ser el lote grande, L(p) = (1 p)12 + 12p(1 p)11 y la curva OC del contraste de control:

H0 : p = 0.01 vs H1 : p > 0.01

viene dada por:

El riesgo del productor bajo este plan es:

↵ = P (Rechazar H0 | H0 es verdadera) = 1 P (Aceptar H0 | H0 es verdadera)

=1 P (X  1 | p = 0.01) = 1 L(0.01) = 0.0061745,

donde X denota al número de artı́culos defectuosos encontrados en la muestra. De otro lado, el riesgo
del consumidor para un LTPD de 0.15 es:

= P (Aceptar H0 | H0 es falsa) = P (X  1 | p = 0.15) = L(0.15) = 0.44346.


80

La bondad de un plan de muestreo puede medirse también mediante su curva de calidad aceptable
o curva AOQ. Esta nos mide el grado de protección que ofrece el plan a un consumidor una vez
finalizado el control de calidad. Especı́ficamente, si P = proporción de defectos de un lote a la salida
del control, entonces: (
M X
N , si el lote es aceptado (X  c)
P =
0 , si el lote es rechazado (X > c)
Pc M x M X
y AOQ(p) = E[P ] = x=0 ( N )pX (x). Puesto que M se desconoce, podemos aproximar N por
p y escribir:
AOQ(p) = pL(p).

Luego, la curva AOQ viene dada por la gráfica de esta función. Un elemento importante relacionado
con esta curva, y que nos da una medida de calidad puntual del plan, es la calidad lı́mite de salida
o AOQL. Este no es sino el máximo valor que toma la función AOQ.

Ejemplo: Halle la curva AOQ del problema anterior ası́ como su AOQL.

Solución: La curva AOQ de este problema viene dada por la gráfica de

AOQ(p) = p((1 p)12 + 12p(1 p)11 ).

El valor que maximiza esta función es p⇤ =0.1256 y por tanto se sigue que AOQL =
AOQ(0.1256) = 0.068339 ; es decir, un consumidor que adquiere un lote con este plan de control
esperará obtener un 6.8339 % de artı́culos defectuosos en el lote. ⇤
ESTADISTICA APLICADA Luis Valdivieso 81

3.4. La distribución multinomial

Consideremos un experimento aleatorio cuyos resultados pueden caer en cualquiera de k categorı́as


excluyentes C1 , C2 , . . . , Ck con probabilidades respectivas p1 , p2 , . . . , pk . Si este experimento se repite
de manera independiente n veces y se definen las variables aleatorias:

Xi = número de veces en que ocurre la categorı́a Ci , i = 1, 2, . . . , k,

entonces el vector aleatorio (X1 , X2 , . . . , Xk ) se dice tiene distribución multinomial de parámetros n,


p1 , p2 , . . . , pk , y se le denota por (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , p2 , . . . , pk ).

Proposición 9 Si (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , p2 , . . . , pk ) , entonces


a) La función de probabilidad conjunta de este vector aleatorio viene dada por:
(
n! x1 x2 xk
x1 !x2 !...xk ! p1 p2 . . . pk , si (x1 , x2 , . . . , xk ) 2 R
P (X1 = x1 , X2 = x2 , . . . , Xk = xk ) =
0 , en caso contrario
Pk
donde R = {(n1 , n2 , . . . , nk ) 2 {0, 1, . . . , n}k / i=1 ni = n} denota rango del vector.
b) Xi ⇠ B(n, pi ), 8i = 1, 2, . . . , k.

Demostración: a) La probabilidad de que en las primeras x1 repeticiones ocurra C1 , en las siguientes


x2 repeticiones ocurra C2 y ası́ sucesivamente hasta que en las últimas xk repeticiones ocurra Ck
es por la independencia px1 1 px2 2 . . . pxk k . Sin embargo, estas ocurrencias podrı́an darse de otras formas
en términos del orden de ocurrencia de cada categorı́a. Todas las ordenaciones posibles de los n
experimentos en donde x1 serán de tipo C1 y asi sucesivamente hasta xk del tipo Ck , viene dada por
n!
x1 !x2 !...xk ! . Por tanto, la probabilidad pedida viene dada por la fórmula indicada en a).
b) Basta notar que los experimentos que generan la multinomial podrı́an redefinirse como experi-
mentos de Bernoulli. En efecto, si llamamos éxito a que ocurra la categorı́a Ci y fracaso que ocurra
cualquier otra categorı́a, el número de éxitos en las n repeticiones independientes tiene distribución
binomial de parámetros n y pi . ⌅
La primera parte de la siguiente proposición es una consecuencia directa de la parte b) de la
proposición 9 y de lo que vimos en el capı́tulo sobre distribuciones muestrales. La otra parte nos
provee de un intervalo más interesante sobre la diferencia de proporciones de la ocurrencia de dos
categorı́as distintas Ci y Cj , tanto en el contexto multinomial de dependencia, como en el caso que
las proporciones correspondan mas bien a dos poblaciones independientes.

Proposición 10 a) Si n es grande, un intervalo de confianza al 100(1 ↵) % para pi es:


r r
p̄i (1 p̄i ) p̄i (1 p̄i )
[p̄i z1 ↵2 , p̄i + z1 ↵2 ],
n n
donde p̄i denota la proporción de veces que ocurre la categorı́a Ci en los n experimentos.
82

b) Si n es grande, un intervalo de confianza al 100(1 ↵) % para pi pj , con i 6= j, es:


r r
p̄i (1 p̄i ) + p̄j (1 p̄j ) + 2p̄i p̄j p̄i (1 p̄i ) + p̄j (1 p̄j ) + 2p̄i p̄j
[p̄i p̄j z1 ↵2 , p̄i p̄j + z1 ↵2 ],
n n
donde p̄i y p̄j denotan, respectivamente, a la proporción de veces que ocurre la categorı́a Ci y la
categorı́a Cj en los n experimentos.
c) Un intervalo de confianza al 100(1 ↵) % para p1 p2 , donde p1 y p2 representan las proporciones
de ocurrencia de un evento de interés en dos poblaciones independientes, viene dado por:
s s
p̄1 (1 p̄1 ) p̄2 (1 p̄2 ) p̄1 (1 p̄1 ) p̄2 (1 p̄2 )
[p̄1 p̄2 z1 ↵2 + , p̄1 p̄2 + z1 ↵2 + ],
n1 n2 n1 n2

donde p̄1 y p̄2 denotan a las proporciones de veces en que ocurre el evento de interés en muestras
grandes de tamaños n1 y n2 de ambas poblaciones.

Un problema clásico en la inferencia estadı́stica consiste en poder garantizar un nivel de confianza


o de significación fijo cuando uno realiza conjeturas múltiples. Por ejemplo, supongamos que en un
estudio de Marketing deseamos jerarquizar, con un nivel de confianza del 95 %, las proporciones de
sujetos p1 , p2 y p3 que estarı́an dispuestos a adquirir un nuevo producto en cada uno de los estratos
socioeconómicos bajo (1), medio (2) y alto (3), respectivamente. Para realizar esto podrı́amos tomar
tres muestras en cada una de estas poblaciones y con ellas construir intervalos de confianza al 95 %
para las diferencias p1 p2 , p1 p3 y p2 p3 . Si definimos los eventos A1 , A2 y A3 , donde A1 denota
al evento que el IC contenga a p1 p2 , A2 a que el IC contenga a p1 p3 y A3 a que el IC contenga a
p2 p3 , entonces por definición P (Ai ) = 0.95, 8i = 1, 2, 3 ; sin embargo, como deseamos comparar la
aceptación del producto en los tres estratos, nosotros quisieramos garantizar una probabilidad 0.95
de que simultáneamente p1 p 2 , p1 p3 y p2 p3 se ubiquen en sus IC respectivos; es decir, que
P (A1 \ A2 \ A3 ) = 0.95. Esta probabilidad en teorı́a es mucho menor. Una manera de resolver este
problema es recurriendo a la desigualdad de Bonferroni, descrita en el ejercicio 3 del primer capı́tulo.
Esta nos provee de una cota inferior para la intersección de cualquier número de eventos en términos
de las probabilidades individuales de cada evento. Concretamente, si deseamos garantizar de que
simultáneamente se satisfagan m eventos con una probabilidad de al menos q, podrı́amos fijar una
probabilidad individual q0 en:
m
X
q = P (A1 \ A2 \ . . . \ Am ) P (Ai ) (m 1) = mq0 (m 1)
i=1

q+m 1
para despejar y obtener que q0 = m . Si los eventos A1 , . . . , Am fueran independientes, entonces

q = P (A1 \ A2 \ . . . \ Am ) = P (A1 )P (A2 ) . . . P (Am ) = q0m


1
y en este caso, podrı́amos tomar q0 = q m .
ESTADISTICA APLICADA Luis Valdivieso 83

Adaptando estos desarrollos al caso de los intervalos de confianza, vemos que para garantizar
intervalos de confianza simultáneos de la ubicación de m parámetros poblacionales con un nivel de
confianza de al menos 100(1 ↵) %, deberemos tomar IC’s al 100(1 ↵0 ) % para cada parámetro
1

con un ↵0 = m ó con un ↵0 = 1 (1 ↵) m si las poblaciones involucradas son independientes.
Ejemplo: Una empresa ha encuestado a 640 personas sobre sus preferencias hacia 4 presentaciones
de un nuevo producto, encontrando que 220, 160, 80 y 180 de ellas preferı́an, respectivamente, las
presentaciones 1,2,3 y 4. De otro lado, se sabe que el costo de producción bajo estas presentaciones
varia siendo la menos costosa la presentación 4, la siguiente menos costosa la presentación 3 y la más
costosa la presentación 1.
a) Si antes del estudio los gerentes de la empresa pensaban sacar el producto con la presentación
1, ¿ podrı́a usted asegurarles con una confianza de al menos 95 %, que la proporción de personas
potenciales que adquirirán esta presentación superará al de las otras presentaciones ?
b) Si usted tuviera que recomendar alguna presentación, ¿ cuál recomendarı́a ? Justifique su elección.
Solución: a) Sea Xi = número de personas encuestadas que prefieren la presentación i. Entonces el
vector aleatorio (X1 , X2 , X3 , X4 ) tiene distribución multinomial de parámetros n = 640 y probabi-
lidades p1 , p2 , p3 y p4 , donde pi representa la probabilidad, o visto frecuencialmente, la proporción
poblacional, de que una persona prefiera el producto con la presentación i. Construiremos intervalos
de confianza al 100(1 ↵0 ) % para las diferencias entre todas estas proporciones a fin de analizar si
es que efectivamente p1 supera a las otras proporciones. Por la desigualdad de Bonferroni, el valor
de ↵0 vienen dado por ↵0 = 0.605 = 0.00833, pues se tienen que efectuar C24 = 6 comparaciones
con un nivel de al menos 95 %. En otras palabras, cada intervalo que compara a dos proporciones se
tomarán con un nivel de confianza del 100(1 ↵0 ) % = 99.167 %. Estos intervalos de la forma
r r
p̄i (1 p̄i ) + p̄j (1 p̄j ) + 2p̄i p̄j p̄i (1 p̄i ) + p̄j (1 p̄j ) + 2p̄i p̄j
[p̄i p̄j z0.9958 , p̄i p̄j +z0.9958 ] , son:
640 640
IC al 99.167 % para p1 p3 : [0.151048, 0.286452] ( p1 > p3 )
IC al 99.167 % para p1 p2 : [0.013936, 0.173564] ( p1 > p2 )
IC al 99,167 % para p1 p4 : [ 0.144742, 0.019742] (no existen diferencias)
IC al 99.167 % para p4 p3 : [0.091766, 0.220734] (p4 > p3 )
IC al 99.167 % para p4 p2 : [ 0.044741, 0.107241] ( no existen diferencias)
IC al 99.167 % para p2 p3 : [0.062441, 0.187559] ( p2 > p3 )
Luego, a un nivel de al menos 95 % no es posible garantizar que la presentación 1 sea la más
preferida, pues vemos que no se han ubicado diferencias significativas con la presentación 4.
b) En base al análisis anterior podemos inferir, con un nivel de confianza global de al menos 95 %,
la siguiente relación entre las proporciones de preferencia por las presentaciones:

p3 < p2 = p4 = p1 .
84

Por tanto, se podrı́a recomendar la presentación 4, ya que ella tiene los menores costos de producción
y una alta preferencia. ⇤
El siguiente resultado asintótico será la base para todos los contrastes de hipótesis relacionados
a una distribución multinomial.

Teorema 5 Sea (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , p2 , . . . , pk ). Si n es grande y se cumple que 8i, Ei =


npi 5, entonces aproximadamente
k
X (Xi Ei ) 2 2
U= ⇠ (k 1).
Ei
i=1

Este teorema nos provee de un estadı́stico de prueba adecuado para contrastar a nivel ↵:

H0 : p1 = p01 , p2 = p02 , . . . , pk = p0k vs H1 : 9i / pi 6= p0i

donde los valores p01 , . . . , p0k son conocidos. En efecto, si reemplazamos los p0i en U y este término
resulta ser suficientemente grande, entonces al menos algunas de las frecuencias observadas Xi van a
diferir considerablemente de las frecuencias E[Xi ] = np0i = Ei0 que se esperan de ser H0 verdadera.
En este sentido no es difı́cil apreciar que la siguiente región crı́tica, constituye un regla razonable (y
lo es formalmente) de decisión:
Rechazar H0 a nivel ↵ si
k
X (Xi Ei0 )2 2
RC: U0 = > 1 ↵ (k 1).
i=1
Ei0

En muchas circunstancias las probabilidades de ocurrencia pi de cada categorı́a Ci dependen de


otros parámetros poblacionales desconocidos. En este caso, antes uno de aplicar el contraste anterior
debrá primero ver como estimar las frecuencias esperadas Ei0 . El método canónico de estimación en
estadı́stica viene dado por el método de máxima verosimilitud.

Definición 23 Si X1 , X2 , . . . , Xn es una m.a. de una v.a. X ⇠ ✓ y x1 , x2 , . . . , xn son sus valores


observados, la función de verosimilitud de esta m.a. viene dada por:
(
PX (x1 )PX (x2 ) . . . PX (xn ) , si X es una v.a. discreta
L(✓) =
fX (x1 )fX (x2 ) . . . fX (xn ) , si X es una v.a. contı́nua.

En el caso discreto L(✓) representa la probabilidad de que una muestra aleatoria cualquiera de X
tome precisamente los valores que ya se han observado de ella. Como lo observado en la muestra es
para nosotros la única información fiable de la que disponemos es lógico pensar que la distribución
de X será más idónea mientras esta probabilidad sea mayor. Al depender esta probabilidad de ✓, lo
natural es entonces seleccionar el valor de ✓ que maximice la probabilidad en mención.
ESTADISTICA APLICADA Luis Valdivieso 85

Definición 24 En el contexto anterior, sea ✓⇤ = g(x1 , x2 , . . . , xn ) el valor de ✓ que maximiza L(✓).


Entonces el estimador de máxima verosimilitud de ✓ viene dado por ✓ˆ = g(X1 , X2 , . . . , Xn ).

Nota: Dado que los valores de ✓ que maximizan a las funciones L(✓) y K(✓) = LnL(✓) son los
mismos, uno puede maximizar K(✓) en lugar de L(✓). Esta práctica es muy común pues la gran
mayorı́a de distribuciones estudiadas tienen forma exponencial y por tanto la toma de logaritmos
simplifica considerablemente el problema de maximización.

Proposición 11 (Propiedad de invarianza) Sea = h(✓) un nuevo parámetro definido como una
ˆ
función del parámetro ✓ cuyo estimador de máxima verosimilitud es conocido y viene dado por ✓.
ˆ
Entonces el estimador de máxima verosimilitud del parámetro vienen dado por ˆ = h(✓).

Ejemplo: Una componente electrónica se asume que sigue en su razón de falla un modelo de Weibull
de parámetros ↵ = 3 y desconocido, donde el tiempo se mide en años.
a) Halle el estimador de máxima verosimilitud de y el estimador de máxima verosimilitud de la
función de confiabilidad de la componente.
b) Suponga que se seleccionaron al azar 15 de estas componentes y luego se registraron sus tiempos
de vida útil, obteniéndose en años los siguientes datos: 0.808, 1.060, 0.749, 0.476, 0.498, 0.925,
0.916, 1.021, 0.618, 0.336, 0.710, 0.445, 0.711, 0.757, 0.614. Estime la confiabilidad de esta
componente, si se especifica para ella un tiempo de vida útil de 7 meses.

Solución: a) Sea X ⇠ W (4, ) el tiempo de vida útil de la componente en años. Dada una m.a.
X1 , X2 , . . . , Xn de X, junto con sus valores observados x1 , x2 , . . . , xn , se tiene que la función de
verosimilitud de esta m.a. viene dada por:
n
Y Pn
x41 x4n x4i
L( ) = fX (x1 ) . . . fX (xn ) = 4 x31 e ...4 x3n e =4 n n
( x3i )e i=1

i=1

y por tanto
n
X n
X
K( ) = Ln(L( )) = nLn(4) nLn( ) 3 Ln(xi ) x4i .
i=1 i=1
n 00
Derivando, igualando a 0 y verificando que K ( ) = 2 < 0, obtenemos que el estimador de

máxima verosimilitud de viene dado por ˆ = Pn n X 4 . Más aún, por la propiedad de invarianza,
i=1 i
la estimación de la función de confiabilidad de la componente viene dada por:

ˆt4 ( Pn n )t4
X4
R̂(t) = e =e i=1 i .

b) La confiabilidad de la componente para una especificación de 7 meses viene dada por R =


R(0.583) = e 0.115789 . Según datos el valor estimado de viene dado por ˆ =2.578618.
86

Luego, por la propiedad de invarianza, la confiabilidad de esta componente se estimará en


R̂ = e 0.115789(2.578618) =0.7418743. ⇤
El siguiente resultado nos da una versión del teorema 5 cuando se requiera estimar una cierta
cantidad r de parámetros desconocidos.

Teorema 6 Sea (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , p2 , . . . , pk ) , con n grande y sean p̂i estimadores


de los pi obtenidos al estimarse r parámetros desconocidos por el método de máxima verosimilitud.
Entonces si 8i, Êi = np̂i 5, se sigue que aproximadamente:

k
X (Xi Êi )2 2
V = ⇠ (k r 1).
i=1 Êi

Ejemplo: En una gran tienda una muestra aleatoria de 100 personas comprará cada una un producto
que tiene cuatro marcas: 1, 2 , 3 , 4 y tres presentaciones: 1 , 2 , 3. Considérese las siguientes 12
variables aleatorias: Xi,j = Número de clientes que comprarán la marca i y con la presentación j,
para i = 1, 2, 3, 4 y j = 1, 2, 3. Asuma que la compra de cada cliente se produce bajo condiciones
similares y con resultados independientes.
P4
a) Si se consideran las variables X.j = i=1 Xi,j , para j = 1, 2, 3, realice una descripción de la
distribución conjunta de estas 3 variables.
b) El gerente de ventas sostiene que la frecuencia de compras para las presentaciones 1 y 3 son
iguales. Si al tomarse los datos, 20 personas compraron la presentación 1 y 30 la presentación 3, ¿
puede desecharse la afirmación del gerente ?. Para responder utilice un intervalo apropiado al 95 %
de confianza.

Solución: a) El vector aleatorio (X.1 , X.2 , X.3 ) tiene distribución multinomial de parámetros n = 100,
p.1 , p.2 y p.3 , donde p.j denota a la probabilidad de que una persona compre un producto con la
presentación j.
b) Obtengamos un IC al 95 % para p.1 p.3 . Como n = 100 es grande, este IC viene dado por:
r r
p̄1 (1 p̄1 ) + p̄3 (1 p̄3 ) + 2p̄1 p̄3 p̄1 (1 p̄1 ) + p̄3 (1 p̄3 ) + 2p̄1 p̄3
[p̄1 p̄3 z0.975 , p̄1 p̄3 +z0.975 ],
100 100
r r
0.2(0.8) + 0.3(0.7) + 2(0.2)(0.3) 0.2(0.8) + 0.3(0.7) + 2(0.2)(0.3)
= [ 0.1 1.96 , 0.1 + 1.96 ]
100 100

= [ 0.2372, 0.0372]

Como 0 pertenece al intervalo, no es posible descartar la afirmación del gerente al 95 % de confianza.



ESTADISTICA APLICADA Luis Valdivieso 87

3.5. Contrastes de bondad de ajuste

Sea Y una variable aleatoria con función de distribución FY desconocida y supongamos deseamos
contrastar a nivel ↵:
H 0 : FY = F0 vs H1 : FY 6= F0 , (3.1)

donde F0 es una función de distribución conocida. Para realizar este contraste tomemos una muestra
aleatoria Y1 , Y2 , . . . , Yn de Y y con sus valores observados construyamos la siguiente distribución de
frecuencias con k intervalos1 :

Intervalo Marca de clase Frecuencia observada


ŷi Oi
[a0 , a1 [ ŷ1 O1
[a1 , a2 [ ŷ2 O2
.. .. ..
. . .
[ak 1 , ak ] ŷk Ok
n

donde a0 es el menor valor de los datos observados. En esta distribución cada intervalo tiene un
maximo valor observado a0
ancho de c = k e ŷi es el punto medio del i-ésimo intervalo.
Si definimos las variables aleatorias Xi = número de elementos de la m.a. de tamaño n de Y que
caen en el i-ésimo intervalo, entonces (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , p2 , . . . , pk ), donde

pi = P (Y pertenezca al i ésimo intervalo) = FY (ai ) FY (ai 1 ).

En consecuencia, podemos transformar nuestro juego de hipótesis (3.1) sobre la distribución de Y


en el siguiente contraste:

H0 : (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p01 , . . . , p0k )

vs
H1 : (X1 , X2 , . . . , Xk ) ⇠ M ul(n, p1 , . . . , pk ) con algún pi 6= p0i ,

siendo p0i = F0 (ai ) F0 (ai 1 ).

Al ser este último un contraste sobre una multinomial, rechazaremos H0 : FY = F0 a nivel ↵ si:
k
X (0i Ei0 )2 2
RC: U0 = > 1 ↵ (k 1),
i=1
Ei0

donde Ei0 = np0i es denominada la frecuencia esperada bajo H0 .


1
Puede, si uno no tiene experiencia, determinar k con la llamada fórmula de Sturgles k = 1 + 3.3 ⇥ log10 (n). Este
valor se aproxima al entero mayor
88

Hasta aquı́ hemos supuesto que los p0i = F0 (ai ) F0 (ai 1) pueden obtenerse directamente; sin
embargo, F0 podrı́a depender de parámetros desconocidos. Si precisamos estimar los r parámetros
no conocidos de F0 a fin de especificar completamente F0 , tendremos que apelar al teorema 6 y con
ello decidir rechazar H0 : FY = F0 a nivel ↵ si:
k
X (0i Êi0 )2 2
R.C : V0 = > 1 ↵ (k r 1),
i=1 Êi0
siendo Êi0 = np̂0i y los p̂0i obtenidos de estimarse r parámetros de F0 por el método de máxima
verosimilitud.
Pk 1 0
OBSERVACIONES: 1.- Tómese en cuenta que p01 = F0 (a1 ) y p0k = 1 i=1 pi , relaciones que
también se cumplen para las probabilidades estimadas.
2.- Estos contrastes pueden sólo realizarse si n es grande y si las frecuencias esperadas son mayores
o iguales a 5. Si esto último no se cumple uno podrı́a juntar dos o más intervalos a fin de satisfacer
tal condición.
3.- El cálculo de las estimaciones por máxima verosimilitud se realiza con las fórmulas de datos
agrupados. Por ejemplo, si F0 es la función de distribución de una v.a. normal con media µ y varianza
2, n 1 2
se prueba que sus estimadores de máxima verosimilitud son respectivamente Ȳ y n S . Luego,
las estimaciones correspondientes deben calcularse respectivamente con las fórmulas:
k k
1X 1X 2
Ȳ = ŷi Oi y S2 = ŷi Oi ȳ 2 .
n n
i=1 i=1
Ejemplo: Un ingeniero de control piensa que la proporción de artı́culos no defectuosos encontrados
en el muestreo por aceptación de sus lotes tiene una distribución Beta con parámetro = 1. Si
tomados al azar controles de calidad en 60 de estos lotes se encontraron las siguientes proporciones
de artı́culos no defectuosos:
0.858 0.867 0.812 0.958 0.886 0.861 0.924 0.724 0.928 0.769 0.996 0.599 0.924 0.900 0.964 0.892
0.901 0.521 0.948 0.965 0.903 0.846 0.807 0.985 0.620 0.784 0.950 0.933 0.754 0.566 0.983 0.988 0.839
0.583 0.734 0.879 0.905 0.965 0.835 0.784 0.687 0.870 0.624 0.780 0.869 0.822 0.987 0.856 0.785 0.860
0.924 0.796 0.984 0.862 0.921 0.798 0.872 0.972 0.966 0.958.
¿ Muestran los datos que el ingeniero tiene razón ? Use un nivel de significación de ↵ =0.05.
Solución: Estaremos interesados en contrastar a nivel ↵ = 0.05:

H0 : Y ⇠ B(↵, 1) vs H1 : Y ⇠ B(↵, 1)

donde Y representa la proporción de artı́culos no defectuosos que se encuentran en un muestreo por


aceptación de sus lotes. Puesto que ↵ es un parámetro desconocido, tendremos que estimarlo por
máxima verosimilitud. Dado que la función de densidad de Y bajo H0 viene dada por:
(
↵y ↵ 1 , si 0  y  1
fY (y) = ,
0 , en otro caso
ESTADISTICA APLICADA Luis Valdivieso 89

la función de distribución de Y es
8
> 0, si y < 0
<
F0 (y) = y ↵ , si 0  y  1
>
:
1, si y > 1

y la función de verosimilitud de una m.a. de tamaño n de Y viene dada por:


n
Y
L(↵) = ↵ n
yi↵ 1
.
i=1

Pn
Tomando logaritmos K(↵) = nLn(↵)+(↵ 1) i=1 Ln(yi ). Derivando e igualando a 0, se comprueba
que el valor que maximiza a K(↵) es ↵⇤ = Pn n . En tal sentido el estimador de máxima
i=1 Ln(yi )
n
verosimilitud de ↵ es ↵
ˆ = Pn
Ln(Yi )
. Este se evaluará mediante la fórmula de datos agrupados
i=1
n

ˆ = Pk , siendo k el número de intervalos en la distribución de frecuencias. Usaremos
i=1 Ln(ŷi )Oi
k = 1 + 3.3log10 (60) = 6.8679 ⌘ 7 intervalos.
Para nuestro contraste necesitamos estimar las frecuencias esperadas y con ello obtener la dis-
tribución de frecuencias de los datos con los k = 7 intervalos. De los datos se observa que el menor
valor es 0.521 y el mayor 0.996. Por tanto, el rango es R = 0.996 0.521 =0.475 y cada uno de los
0.475
7 intervalos tendrá un ancho de c = R
k = 7 = 0.067857 ⌘ 0.068 (aquı́ aproximamos siempre por
exceso al número de decimales de los datos). Haciendo el conteo respectivo, obtenemos entonces la
siguiente distribución de frecuencias:

Intervalo Marca de clase (ŷi ) Frecuencia observada (Oi ) F̂0 (li+ ) Êi0
[0.521, 0.589[ 0.555 3 0.04920 2.9520
[0.589, 0.657[ 0.623 3 0.09161 2.5448
[0.657, 0.725[ 0.691 2 0.16045 4.1300
[0.725, 0.793[ 0.759 7 0.26722 6.4064
[0.793, 0.861[ 0.827 11 0.42675 9.5716
[0.861, 0.929[ 0.895 18 0.65768 13.8556
[0.929, 0.997] 0.963 16 1 20.5395

donde F̂0 (li+ ) denota a la función de distribución estimada en el extremo derecho de cada intervalo
60 60
con ↵
ˆ = P7
Ln(ŷi )Oi
= 10.5449 =5.6899. Dado que las 3 primeras frecuencias estimadas son
i=1
menores a 5, debemos de juntar estos intervalos. Esto significará formalmente un recálculo de la
estimación de ↵ y por tanto de las frecuencias esperadas; sin embargo, para evitar un desborde de
cálculos optaremos (sólo para efectos del curso) a consignar el mismo ↵
ˆ y a sumar directamente las
frecuencias esperadas. Este procedimiento modifica mı́nimamente al estadı́stico de prueba. Optando
por tal alternativa obtendremos entonces la siguiente distribución final de frecuencias:
90

Intervalo Marca de clase (ŷi ) Frecuencia observada (Oi ) F̂0 (li+ ) Êi0
[0.521, 0.725[ 0.623 8 0.16045 9.6269
[0.725, 0.793[ 0.759 7 0.26722 6.4064
[0.793, 0.861[ 0.827 11 0.42675 9.5716
[0.861, 0.929[ 0.895 18 0.65768 13.8556
[0.929, 0.997] 0.963 16 1 20.5395

La región crı́tica de nuestro contraste a nivel ↵ =0.05 viene dada por:


5
X (0i Êi0 )2 2
R.C : V0 = > 0.95 (3) = 7.815,
i=1 Êi0

donde en los grados de libertad se ha considerado r = 1 al estar estimándose tan solo un parámetro.
Evaluándose V0 obtenemos V0 = (8 99.6269 .6269)2 + . . . + (16 20.5395)2 = 2.786 y por tanto no se satisface
20.5395
la región crı́tica; es decir, se podrı́a decir que el Ingeniero tiene razón. ⇤

Ejemplo: Se desea contrastar a nivel ↵ =0.05 la hipótesis de que el número mensual Y de suicidios
en una ciudad es una variable aleatoria con distribución de Poisson, en base a los siguientes números
de suicidios por mes encontrados en un plazo de 5 años.

Número de suicidios Frecuencia observada (número de meses)


0 33
1 17
2 7
3 ó más 3

Solución: Cuando se realiza una prueba de bondad de ajuste sobre una v.a. discreta se trabaja
de manera análoga al caso de una v.a. contı́nua, solo que ahora cada posible valor de la variable
constituye un intervalo por si solo. Veamos:
Para el contraste a nivel ↵ =0.05:

H0 : Y ⇠ P( ) vs H1 : Y ⇠ P( )

no conocemos , por lo que debemos estimarlo a través del método de máxima verosimilitud. Pa-
ra esto, sea Y1 , Y2 , ..., Yn una m.a. de Y y sean y1 , y2 , ..., yn sus valores observados. La función de
Pn
y yn n yi
verosimilitud de esta muestra es L( ) = PY (y1 )....PY (yn ) = e y1 ! 1 ... e yn ! = e Q yii=1
! o me-
Pn Pn
jor K( ) = Ln(L( )) = n + ( i=1 yi )Ln( ) i=1 Ln(yi ). Derivando esta última función
1 P n
con respecto a e igualando a 0, K 0 ( ) = n + 00
i=1 yi = 0. Como K ( ) < 0, entonces el
estimador de máxima verosimilitud de es ˆ = Ȳ . Este luego de ser estimado con la fórmula
de datos agrupados nos da ˆ = 0⇥33+1⇥17+2⇥7+3⇥3
60 = 0.667 y por tanto, las frecuencias espera-
das estimadas de observar (si es que Y fuera Poisson) 0, 1, 2 y 3 o más suicidios por mes son
ESTADISTICA APLICADA Luis Valdivieso 91

Ê1 = 60 ⇥ 0.513 = 30.78, Ê2 = 60 ⇥ 0.342 = 20.52, Ê3 = 60 ⇥ 0.114 = 6.84 y Ê4 = 60 ⇥ 0.031 =1.86.
Como Ê4 = 1.86 < 5, se deben juntar los dos últimos intervalos. De esta manera obtenemos:

Número de suicidios Oi = Frecuencia observada Êi = Frecuencia esperada


0 33 30.78
1 17 20.52
2 0 más 10 8.7

Se rechazará H0 al nivel dado si:


3
X (Oi Êi0 )2 2
V0 = > 0.95 (1) = 3.84.
i=1 Êi0

Como V0 =0.096, no se rechaza H0 y se puede entonces suponer que el número mensual Y de suicidios
en la ciudad sigue una distribución de Poisson. ⇤

3.6. Contrastes de Independencia y proporciones

Sean U y V dos v.a’s discretas con rangos RU = {1, 2, . . . , r} y RV = {1, 2, . . . , s}, respectiva-
mente. Estaremos interesados en contrastar a nivel ↵:

H0 : U y V son independientes vs H1 : U y V no son independientes. (3.2)

Sean pij = P (U = i, V = j), pi. = P (U = i) y p.j = P (V = j). Por la definición de independencia el


contraste (3.2) equivale a contrastar a nivel ↵:

H0 : pij = pi. p.j , 8(i, j) vs H1 : 9(i, j) / pij 6= pi. p.j .

Para realizar el contraste debemos tomar una m.a. conjunta de las variables U y V :
(U1 , V1 ), (U2 , V2 ), . . . , (Un , Vn ) y con ella construir la siguiente tabla de contingencia que nos
revela cuantos elementos en la muestra tienen pares especı́ficos de valores de U y de V :

V
1 2 ... j ... s Total
1 O11 O12 ... O1j ... O1s O1.
2 O21 O22 ... O2j ... O2s O2.
.. .. .. .. .. .. .. ..
. . . . . . . .
U i Oi1 Oi2 ... Oij ... Ois Oi.
.. .. .. .. .. .. .. ..
. . . . . . . .
r Or1 Or2 ... Orj ... Ors Or.
Total O.1 O.2 ... O.j ... O.s n
92

siendo Oij = frecuencia de elementos de la m.a. que tienen valor de U = i y valor de V = j,


P P
Oi. = sj=1 Oij = frecuencia de elementos de la m.a. que tienen valor de U = i y O.j = ri=1 Oij =
frecuencia de elementos de la m.a. que tienen valor de V = j .
No es difı́cil apreciar que (O11 , O12 , . . . , Ors ) ⇠ M ul(n, p11 , p12 , . . . , prs ) y de aquı́ que (3.2)
equivalga a un contraste sobre una multinomial; sin embargo antes de plantearlo y tomar una de-
cisión es necesario primero estimar r 1 de los parámetros p0i. y s 1 de los parámetros p0.j . Los
estimadores de máxima verosimilitud de estos vienen dados por:

Oi. O.j
p̂0i. = y p̂0.j = .
n n

Ası́, se rechazará H0 : U y V son independientes a nivel ↵ si:


r X
X s 0 )2
(Oij Êij 2
R.C : V0 = 0
> 1 ↵ ((r 1)(s 1))
i=1 j=1 Êij

donde
0 Oi. O.j
Êij = np̂0i. p̂0.j =
n
denota a la frecuencia esperada en la celda (i, j) de ser H0 verdadera.

Ejemplo: Suponga que en el ejemplo de las sección 3.4 se obtuvo la siguiente tabla de contingencia:

Presentación

1 2 3 Total
1 5 13 7 25
2 6 15 8 29
Marca 3 4 9 8 21
4 5 13 7 25
Total 20 50 30 100

El gerente de ventas de la tienda sostiene que al abastecerse de cada marca del producto no se
necesita tener en cuenta la presentación. ¿Qué le dicen los datos?. Use un nivel de significación de
↵ =0.05.
Solución: Si definimos las variables aleatorias: U = Marca del producto que compra una persona y
V = Presentación del producto que compra una persona, estaremos interesados en contrastar a nivel
↵ =0.05:

H0 : U y V son independientes vs H1 : U y V no son independientes.


ESTADISTICA APLICADA Luis Valdivieso 93

Se rechazará H0 si:
4 X
X 3 0 )2
(0ij Êij 2
V0 = 0
> 0.95 (6) = 12.592.
i=1 j=1 Êij

Con el fin de evaluar V0 mostramos en la tabla de contingencia siguiente tanto a las frecuencias
observadas Oij como sus frecuencias esperadas estimadas Êij (en negrita), las cuales se obtienen
multiplicando los totales marginales de la celda (i, j) y dividiéndolas entre n = 100

Presentación

1 2 3 Total
1 5 5.0 13 12.5 7 7.5 25
2 6 5.8 15 14.5 8 8.7 29
Marca 3 4 4.2 9 10.5 8 6.3 21
4 5 5.0 13 12.5 7 7.5 25
Total 20 50 30 100

Haciendo los cálculos obtenemos V0 = 0.8697 y por tanto se podrı́a decir que el gerente de ventas
está en lo correcto. ⇤
Dadas s poblaciones independientes, estaremos ahora interesados en determinar si la proporción
poblacional pi de éxito en cada una de estas poblaciones es la misma o si existe al menos una
población en la cual esta proporción difiera. Formalmente, deseamos contrastar a nivel ↵ :

H0 : p1 = p2 = . . . = ps = p vs H1 : 9i / pi 6= p.

Este contraste podrı́a verse intuitivamente como un caso particular del contraste de independencia
para las variables U y V , que denotan la primera a una condición de éxito o no (presentación de
la caracterı́stica o no) y la otra a la pertenencia a una de las s poblaciones. En tal sentido, se
rechazará H0 a nivel ↵ si

2 X
X s 0 )2
(Oij Êij 2
R.C : V0 = 0
> 1 ↵ (s 1)
i=1 j=1 Êij

donde como antes


0 Oi. nj
Êij = np̂0i. p̂0.j = ,
n
denotando nj al tamaño de muestra tomado en la población j, O1. al número total de éxitos y O2.
al número total de fracasos.
94

3.7. Ejercicios

1.- Supóngase que X tiene una distribución de Poisson con parámetro . Para contrastar:

H0 : = 0.2 vs H1 : > 0.2

se toma una muestra aleatoria de tamaño n de X y se decide rechazar H0 si X̄ > C.


a) Si n = 10 y C =0.3, ¿ cuál es el nivel de significación del contraste ?
b) Si n = 10 y se fija un nivel de significación de ↵ =0.05, ¿ cuál deberı́a ser el valor de C ?
c) Si n = 50 y se fija un nivel de significación de ↵ =0.05, halle (utilizando el teorema del lı́mite
central) el valor de C y determine luego que decisión deberı́a de tomarse si se observa que la media
muestral dió un valor de 0.248.
Nota: Como en una v.a. discreta no siempre es posible alcanzar exactamente el nivel de significación,
ud. debe hallar C en b) de modo que ↵ para este C sea el mayor valor que no supere a 0.05. Use
el hecho de que la suma de n v.a’s independientes Poisson de parámetro es una v.a. Poisson de
parámetro n .

2.- En una planta generadora de energı́a eléctrica se especifica que la presión en cierta lı́nea debe
ser en promedio de 100 lbs/pulg 2 durante un periodo de 4 horas. Si la presión media es mayor
que 103 lbs/pulg 2 durante un periodo de 4 horas podrı́an surgir complicaciones de gravedad. Si el
ingeniero a cargo de planta piensa que en este periodo la presión esta superando su valor medio
especificado y él desea detectar que podrı́an darse complicaciones de gravedad con una probabilidad
de 0.99, ¿ cuál serı́a el tamaño de muestra que le sugerirı́a tome el ingeniero para probar su conjetura
a un nivel de significación de ↵ =0.01 ? ¿ Qué valor promedio deberı́a encontrar el ingeniero en la
muestra que ud. propone para mostrar que efectivamente él tenı́a razón ? Use como una estimación
de 2 a 25.

3.- Las especificaciones de construcción en cierta ciudad requieren que las tuberı́as de desague em-
pleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2,500 psi. Un
fabricante que desea proveer a la ciudad de tubos para desague ha presentado una licitación junto
con la siguiente información: un contratista independiente seleccionó al azar 7 secciones de los tubos
del fabricante y determinóó su resistencia a la ruptura. Los resultados en psi son los siguientes:

2,610 , 2,750 , 2,420 , 2,510 , 2,540 , 2,490 , 2,680

a) A un nivel de significacióón del 5 %, ¿ existe suficiente evidencia para llegar a la conclusión de


que los tubos del fabricante cumplen con las especificaciones requeridas?
b) Si la verdadera media de resistencia a la ruptura del fabricante fuera de 2,633.87 psi, ¿ qué pro-
babilidad existe de que una muestra cualquiera al azar como la anterior pueda llevar a la conclusión
de que él no cumple con las especificaciones ? Siga asumiendo ↵ = 0.05.
ESTADISTICA APLICADA Luis Valdivieso 95

4.- Se ha determinado que el consumo de agua potable en una ciudad es una v.a. con distribución
normal de media desconocida y desviación estándar 500 pies3 . La oficina del sector está revisando
la posibilidad de iniciar una campaña educativa en la ciudad para no hacer uso indiscriminado del
agua. La campaña no será iniciada si el promedio de agua consumida es menor que 2,500 pies3 . Ante
la posibilidad de saber si el promedio es menor que 2,500 se toma una muestra de tamaño n y se
pretende contrastar:
H0 : µ = 2, 500 vs H1 : µ < 2, 500.

¿ Cuál debe ser el tamaño de muestra n y la regla de decisión a tomar si se desea que la probabilidad
de cometer el error tipo I sea de 0.05 y que la probabilidad de cometer el error tipo II sea de 0.01
cuando el verdadero consumo medio es de 2,300 pies3 ?

5.- La presión a la que es sometida una placa debe, como es de esperarse para ser normal, ser inferior
a los 30 psi. Para verificarse si esto se esta cumpliendo se toma una m.a. X1 , X2 , . . . , Xn de la v.a.
X que denota a la presión a la que es sometida la placa. Se asume que esta variable es normal con
media µ y varianza conocida 2 = 9. Un ingeniero A decidirá que la presión en la placa es normal si
en la muestra:
1
(X1 + Xn )  C.
2
Otro ingeniero B decidirá mas bien que la presión en la placa es normal si en la muestra:

X̄  K.

a) Halle de fijarse un nivel de significación de ↵ =0.05 las constantes C y K.


b) Si luego de tomarse la muestra se obtuvieron las siguientes presiones (en este orden):

28.50, 29.26, 33.18, 24.00, 26.55, 27.81, 26.05, 22.72, 33.49.

Determine la decisión de cada ingeniero.


c) Halle la función de potencia del contraste de cada ingeniero e indique cuál de estos contrastes es
el más potente a un nivel de significación de ↵ = 0.05.

6.- El tiempo de vida X, en horas, de un cierto tipo de resistencia tiene una distribución exponencial
con esperanza ✓; y el fabricante de las resistencias dice que ✓ = 1,000. Un comprador duda que ✓ sea
tan grande y planea probar la tesis nula H0 : ✓ = 1, 000 comprando una resistencia y determinando
su tiempo de vida X1 . Si X1 es pequeño digamos X1 < A él rechazará H0 .
a) Determine A si desea rechazar H0 al nivel de significación ↵ = 0.05.
b) ¿ Con qué probabilidad la prueba detecta una diferencia de 10 unidades sobre la media indicada
por el fabricante ?
96

7.- Un empresa produce cables de 100 metros de longitud. Se asume que las fallas en sus cables
se producen a través de un proceso de Poisson y según las especificaciones de control estas deben
darse a una tasa de una por cada 20 metros. Cada cable tiene un costo de producción de 80 soles
y se vende en el mercado a 175 soles. La empresa garantiza restituir todo cable que no cumpla las
especificaciones de control (es decir, que tenga mas de 5 fallas) y más aún indenmizar por este motivo
al consumidor con 50 soles. Para verificarse la calidad de un cable se selecciona de él al azar una
sección de 10 metros de longitud y se concluirá que la tasa de ocurrencia de fallas en él es mayor a la
especificada si es que en esta sección se ubican 3 o más fallas. En este caso el cable será reemplazado
por uno nuevo. En caso contrario el cable pasará el control y se venderá en el mercado.
a) Plantee este problema como un contraste de hipótesis definiendo claramente sus hipótesis y obte-
niendo el nivel de significación del contraste.
b) Si un cable con una tasa de ocurrencia de fallas de ! =0.1 por metro es sometido al control,
¿ qué probabilidad existe de que pase el control ?
c) Halle la utilidad esperada que generará un cable producido con una tasa de ocurrencia de falla de
! = 0.1 por metro.

8.- Se asegura que la distribución de los tiempos que necesitan los operarios de una compañı́a es
normal con media 15 minutos y desviación estándar de 2 minutos. Para detectar, entre otras cosas,
si es que estos tiempos son más variables se realizará un muestreo de los tiempos obtenidos y se
usará el contraste de hipótesis usual para este tipo de problemas. Además, el tamaño de muestra que
se elegirá debe estar entre 20 y 25 operarios y el nivel de significación debe ser de 0.05.
a) Para un tamaño de muestra n = 20, obtenga la probabilidad de detectar un incremento en la
desviación estándar especificada de 1.45 minutos.
b) Determine el menor tamaño de muestra, dentro de las condiciones requeridas, que asegure una
potencia de por lo menos 90 % para detectar un incremento en la desviación estándar especificada
de 1.2 minutos.

9.- En una fábrica donde se producen tuberı́as de desague se piensa que la adición de un nuevo
compuesto en la producción de cada tuberı́a incrementará su nivel medio de resistencia a la ruptura.
Por tal motivo el gerente de la fábrica lo ha contratado a usted para que realice un contraste con-
ducente a ver si es que esto es cierto o no. Se asume que las distribuciones de las resistencias a la
ruptura sin y con la nueva componente son normales e independientes con varianzas iguales a 144 y
100 psi, respectivamente. El gerente le dice además que para realizar este contraste usted tiene un
presupuesto de solo 500 soles y que cada ensayo de medición de la resistencia a la ruptura cuesta
sin la adición del compuesto 7 soles y con la adición del compuesto 11 soles. Además el uso de la
máquina que hace las mediciones genera en total un costo de 80 soles.
a) Halle el número ensayos por tipo de tuberı́as para que su contraste tenga potencia máxima.
ESTADISTICA APLICADA Luis Valdivieso 97

b) En base a la cantidad de ensayos obtenidos en a), determine la potencia de este contraste si se


desea detectar que el nivel medio de resistencia de las tuberı́as con el nuevo compuesto supera al
actual en 10 psi. Use un nivel de significación de ↵ =0.05.
c) ¿ Cómo cambiarı́a este problema si es que los costos de ensayo con y sin la adición del compuesto
fueran los mismos ?

10.- Un ingeniero tiene que adquirir para la empresa con la cual trabaja un insumo, que se vende
en latas selladas de litro y medio. Este insumo para que tenga mejor calidad deberı́a de tener mayor
contenido de una sustancia X. Actualmente en el mercado se tienen 2 marcas A y B del insumo. Por
tradición, se ha manifestado siempre que el insumo de marca A es de mejor calidad que el insumo
de marca B, pero el ingeniero debe de probar si esto es o no cierto. En base a un estudio previo, se
puede asumir que el contenido en mililitros de la sustancia X en cada lata del insumo A es una v.a.
X ⇠ N (µ1 , 400); mientras que el contenido en mililitros de la sustancia X en cada lata del insumo B
es una v.a. Y ⇠ N (µ2 , 100). Para realizar el experimento de comparación de los insumos en cuanto
a sus contenidos de la sustancia, el ingeniero tiene un presupuesto suficiente para adquirir como
máximo 72 latas del insumo (todas las latas tienen el mismo costo).
a) Si él prueba 36 latas al azar del insumo A, encontrando una media de 102.85 mililitros y prueba
36 latas al azar del insumo B, encontrando una media de 94.78 mililitros, ¿ está él en capacidad de
afirmar con una probabilidad de equivocarse de 0.05 que lo que se dice por tradición es correcto ?
b) ¿ Cuál es la probabilidad de que el ingeniero pueda detectar en a) que efectivamente el insumo A
tiene 10 mililitros más de la sustancia X que el insumo B ?
c) El gerente de la empresa, al leer el informe del ingeniero, le indica que debió mejor distribuir
la compra de las 72 latas para que este contraste tenga la máxima potencia. Hallar n1 y n2 que
cumplan este requerimiento, siendo n1 el número de latas del insumo A y n2 del insumo B, donde
n1 + n2 = 72. Use ↵ = 0.05.
d) Para ↵ = 0.05, indique de manera explı́cita en cuánto se incrementarı́a la potencia del contraste
de seguir el consejo del gerente en comparación a la potencia que se encontró en la parte b).

11.- Se prueban 2 fórmulas diferentes de un combustible oxigenado para motor en cuanto al octanaje.
La varianza del octanaje para la fórmula 1 es 2 = 3, mientras que para la fórmula 2 es 2 = 2.16. Al
1 2
fabricante le han entregado un informe en el cual se afirma que la fórmula 2 produce un rendimiento
mayor en carretera que la fórmula 1, sin embargo, él pide al departamento de ingenierı́a que efectúe
una prueba para comprobar si lo que dice el informe es correcto con un riesgo máximo de 0.05 si no
lo es. Por otra parte no desea correr un riesgo mayor de 0.10 al afirmar que el informe no es correcto
si realmente el rendimiento promedio por ambas fórmulas difiere en 2 kms/galón. Si las pruebas con
la fórmula 2 cuestan el doble que con la fórmula 1, ¿ cuáles son los tamaños de muestra y los lı́mites
de aceptación que debe utilizar el departamento a fin de minimizar los costos de la prueba ?
98

12.- Doce inspectores midieron el diámetro de un cojinete usando dos calibradores diferentes. Los
resultados fueron los siguientes:

Inspector Calibrador 1 Calibrador 2


1 0.265 0.264
2 0.265 0.265
3 0.266 0.264
4 0.267 0.266
5 0.267 0.267
6 0.265 0.268
7 0.267 0.264
8 0.267 0.265
9 0.265 0.265
10 0.268 0.267
11 0.268 0.268
12 0.265 0.269

a) ¿ Hay una diferencia significativa en las medias de las poblaciones representadas por las dos
muestras ? Use ↵ = 0.05.
b) Si en el experimento anterior, hubiese sido de interés detectar una diferencia de mediciones
de aproximadamente 0.002064 unidades, ¿ cuál serı́a la potencia del contraste anterior ? Asuma
normalidad en la distribución de ambas mediciones.

13.- Un fabricante de aspiradoras afirma que la intensidad de ruido promedio es de 75.2 db (decibeles).
Los consumidores sospechan que dicha intensidad es mayor. Para tomar una decisión, se tomó una
m.a de 15 de estas máquinas y se midió en cada una la intensidad de ruido, obteniéndose una media
de x̄ = 80 db. Se asume un nivel de significación de ↵ =0.05 y normalidad en la intensidad de ruido
con una desviación estándar supuesta de 3.6 db. Con base en la información recibida de la muestra, ¿
cuál serı́a la decisión a tomar ? ¿ Serı́a suficiente este tamaño de muestra para detectar una diferencia
de 0.5 db a favor de los consumidores con una probabilidad 0.6 ?

14.- En cierto control de la calidad de la producción, los lotes son de 20 unidades, el plan de muestreo
para cada lote se hace con una muestra de 6 unidades y el nivel de calidad aceptable es 15 .
a) Si el productor desea un riesgo de 0.07 , ¿cuál debe ser la polı́tica para descartar un lote ?
b) Considerando la polı́tica anterior, ¿cuál serı́a el riesgo de los consumidores correspondientes a
1
lotes con una proporción de defectuosos igual a 4 ?
c) Si realmente se tuviera la calidad aceptable, ¿qué porcentaje de defectuosos por lote esperarı́a los
consumidores luego de efectuarse este control ?
ESTADISTICA APLICADA Luis Valdivieso 99

15.- En un plan de muestreo simple se tienen un tamaño de muestra de n = 10 y un número de


aceptación de c = 1. Este plan está destinado para controlar la calidad de lotes grandes de 100
unidades, donde el productor tiene un AQL de 0.08.
a) Si un consumidor de estos lotes estarı́a dispuesto a tolerar como máximo un 12 % de unidades
defectuosas en sus lotes, ¿ serı́a su riesgo menor que el del productor ?
b) Suponga que el productor gasta 0.5 soles por cada unidad que inspeccione en su plan. Si la
verdadera proporción de unidades defectuosas en uno de sus lotes fuera de 0.1, ¿ cuánto es lo que
este productor esperarı́a gastar por inspeccionar este lote ?

16.- En un plan de muestreo simple con n = 60 para lotes grandes de 250 unidades, se tiene un AQL
de 0.03.
a) Halle el número de aceptación de este plan si se quiere que el productor tenga un riesgo no mayor
a 0.1.
b) Con el valor hallado en a), determine el riesgo del consumidor si es que éste está dispuesto a
tolerar como máximo un 8 % de unidades defectuosas en los lotes que él adquiera.
c) Si inspeccionar cada unidad cuesta 0.25 soles y se va a realizar inspección al 100 % de los lotes
rechazados, ¿ cuánto es lo que esperarı́a gastar por inspección el productor en un lote A que satisface
exactamente su nivel de calidad aceptable ? Siga asumiendo el valor hallado en a).
d) Si para otro lote B, distinto al A de c), la proporción real de defectos difiere en un 2 %, ¿ cómo y
en cuánto se modificarı́a el costo de inspección esperado entre ambos lotes ? Siga asumiendo el valor
hallado en a).

17.- El productor de un bien ha implementado un plan de muestreo simple con n = 15 y c = 2


para controlar la calidad de sus lotes. Sus lotes son pequeños y contienen tan solo 40 unidades.
Cada unidad inspeccionada genera un costo de 2 u.m. y toda unidad que se encuentre defectuosa es
reemplazada por una buena, al margen de que el lote pase el control o se envı́e a revisión total. Si
cada unidad producida tiene un costo de 10 u.m, el AQL del productor es 0.1 y los lotes se venden
en el mercado a 600 u.m.:
a) Determine el riesgo del productor.
b) ¿ Serı́a el riesgo de este productor mayor, de contener sus lotes 10 unidades más ?
c) Si un lote con 5 unidades defectuosas está por pasar el control, ¿ qué probabilidad existe de que
éste salga al mercado con tan solo tres unidades defectuosas ? ¿ Cuál es la proporción esperada de
unidades defectuosas con las que este lote saldrá al mercado ?
d) Determine, en función de la verdadera proporción p de defectos por lote, la utilidad que este
productor esperará obtener por cada lote. Evalúe e interprete su valor si p = 0.2.
100

18.- Un plan de muestreo doble requiere seleccionar en un lote una m.a. de tamaño n1 . Si la muestra
0
contiene c1 o menos unidades defectuosas, el lote se acepta; si contiene c1 o más unidades defectuosos
0
(c1 > c1 ) el lote se rechaza; en caso contrario una segunda muestra de tamaño n2 se extrae del lote
y el lote es aceptado a menos que el número total de unidades defectuosas en la muestra combinada
de tamaño n1 + n2 exceda a c2 .
Se dispone del siguiente plan de muestro doble (para lotes grandes):

Muestras combinadas

Muestra Tamaño muestral Tamaño Número de aceptación Número de rechazo


0
Primera n1 = 15 15 c1 = 1 c1 = 5
Segunda n2 = 35 50 c2 = 5 6

destinado a contrastar:
H0 : p = 0.1 vs H1 : p > 0.1

siendo p la proporción de unidades defectuosas en un lote. Utilizando la aproximación normal (cuando


sea válida) halle:
a) El riesgo del productor.
b) Un esbozo de la curva AOQ y el AOQL.
c) Suponga que otro ingeniero propone para simplificar un plan de muestreo simple con un tamaño
de muestra de 50 y un número de aceptación de c = 5. Halle a) y b) para este plan y compárelo con
el de muestreo doble. ¿ Qué aspectos relevantes saca de este estudio comparativo ?

19.- Una empresa recibe lotes de 500 artı́culos de cierto fabricante y utiliza el siguiente plan de
muestreo doble para la inspección de recibo:

i) Se toma una muestra de 15 unidades, si no se encuentra ningún artı́culo defectuos se acepta el


lote, si se encuentran 3 o más artı́culos defectuosos se rechaza el lote, en cualquier otro caso se
toma una segunda muestra de 13 unidades.

ii) Si el número total de unidades defectuosas (en ambas muestras) es mayor a 3 se rechaza el lote.

iii) Finalmente si se rechaza el lote, se inspeccionan el 100 % de sus unidades y el fabricante debe
cambiar las unidades defectuosas por unidades buenas y pagar los costos de inspección.

Si los lotes recibidos tienen un 5 % de unidades defectuosas y el costo de inspección de una unidad
es de un sol, halle:
a) la probabilidad de rechazar el lote.
b) cuánto esperará gastar por inspección la empresa y cuánto el fabricante.
ESTADISTICA APLICADA Luis Valdivieso 101

20.- Un distribuidor de leche, desea controlar el contenido de grasas de mantequilla de la leche que
compra para distribución. Investigaciones anteriores indican que en condiciones normales la cantidad
de grasa de mantequilla por cuarto, varı́a de acuerdo con una distribución normal. El promedio
por cuarto de grasa de mantequilla varı́a significativamente, pero la desviación estándar permanece
constante en aproximadamente 0.10 onzas por cuarto. Las latas con menos de 1.00 onza de grasa
de mantequilla por cuarto son consideradas, como situadas abajo del estándar de su negocio (es
decir ”defectuosas”). Para controlar la calidad de sus compras, desea encontrar un procedimiento de
muestreo por variables que haga lo siguiente:

Aceptar el 95 por ciento de los lotes que tengan solamente 3 latas de cada 200 por abajo del
estándar.

Aceptar solamente el 7 por ciento de los lotes cuando tengan 13 latas de cada 200 por abajo
del estándar.

Si los lotes tienen 1,500 latas:


a) Encuentre un proceso de muestreo por variables que cumpla estos criterios.
b) Dibuje la curva OC extendida, es decir la gráfica de L(p) = probabilidad de aceptar un lote; donde
p es la fracción de no conformidad en el lote.
c) Encuentre un plan de muestreo simple (n, c) que cumpla los mismos criterios como su proceso por
variables.
d) Dibuje la curva OC extendida de este último plan.
e) Compare ambos planes, ¿ cuál le parece más recomendable ? Justifique.
f) Se va a emplear un plan de muestreo para aceptación mixto en la inspección de recibo de lotes de
la siguiente forma:

Primero se extrae la muestra por variables del lote. Si cumple con el criterio del inciso a) se
acepta el lote.

De lo contrario se extrae una segunda muestra según el inciso c) y finalmente se decide si se


acepta o se rechaza el lote.

Si llegan lotes con 2.5 % de latas por debajo del estáándar:

f1) ¿ Cuál es la probabilidad de aceptar un lote ?

f2) ¿ Cuál es el número promedio de latas muestreadas ?

f3) Genere mediante simulación las muestras necesarias para aplicar el plan de muestreo mixto a 5
lotes con 2.5 % de latas por debajo del estándar, luego determine cuántos lotes se aceptan y
el número promedio de latas muestreadas.
102

Nota: Si la caracterı́stica de calidad que se desea medir es una variable que sigue una distribución
normal, se puede aplicar un plan de muestreo para aceptación por variables. Para esta prueba,
cuando se tiene una especificación de tipo mı́nimo L, se toma una muestra de tamaño n, se mide
X̄ L
la caracterı́stica de calidad (X) de cada artı́culo y se halla el promedio muestral (X̄ ). Si k
se acepta el lote, de lo contrario se rechaza. En este caso, la probabilidad de aceptación de un lote
p
es P ( X̄ L k), lo que equivale a P (Z (k zp ) n), donde zp es el valor de Z ⇠ N (0, 1) tal que
P (Z < zp ) = p y p = P (X < L) es la fracción de no conformidad en el lote
Si se desea hallar un plan de muestreo por variables que tenga un riesgo del productor igual a ↵
y un riesgo del consumidor igual a , se utilizan las siguientes fórmulas:
z↵ + z 2 z 1 z + z2 z ↵
n=( ) y k= ,
z1 z2 z↵ + z
siendo para Z ⇠ N (0, 1): z1 tal que P (Z < z1 ) = AQL, z2 tal que P (Z < z2 ) = LT P D, z↵ tal
que P (Z > z↵ ) = 1 ↵ y z tal que P (Z > z ) = .

21.- Un empresa, que produce bolsas de frutas secas mixtas, asegura que estas, salvo variaciones
aleatorias, se empacan con un 40 % de unidades conformadas por pasas, un 20 % de unidades
conformadas por pecanas y el resto de unidades conformadas por manı́. Realizada la mezcla, las
bolsas son llenadas con aproximadamente 40 unidades. Suponga que el costo de cada unidad de
pasa, pecana y manı́ es de respectivamente 0.025, 0.5 y 0.01 soles.
a) De ser correctas las especificaciones del productor, determine cuál es el costo que esperará tener
él por cada bolsa de frutas mixtas que saque al mercado.
b) De ser correctas las especificaciones del productor, determine la probabilidad de que en una bolsa
de 40 unidades usted obtenga menos de 3 pecanas y exactamente 12 pasas.
c) Suponga que usted duda de las especificaciones del productor. Para ello adquiere 3 bolsas de frutas
mixtas y encuentra que ellas en total contienen 40 unidades de pasas y 50 de manı́ ¿ Confirman estos
datos sus dudas a un nivel de significación de ↵ =0.05 ?

22.- Un exámen estandarizado de Inglés tiene 4 modalidades A, B, C y D y las personas que lo toman
deben de decidir su preferencia por alguna de estas modalidades.
a) De tener estas modalidades igual preferencia, ¿ qué probabilidad existe de que al examinarse 5
exámenes tomados al azar se encuentre que nunca se elijan las modalidades B y D?
b) Se piensa que las personas que toman el examen, muestran un distinto nivel de preferencia por
las 4 modalidades. Por tal motivo se seleccionó al azar una muestra de 210 exámenes evaluados,
encontrándose que 40, 60, 100 y 10 de estos se dieron respectivamente con las modalidades A, B, C
y D. Muestran estos datos, que a un nivel de significación del 5 %, lo que se pensaba era correcto.
Si esto es ası́, ¿ podrı́a garantizar alguna o algunas modalidades como las más preferidas y alguna o
algunas modalidades como las menos preferidas ?
ESTADISTICA APLICADA Luis Valdivieso 103

23.- Un distribuidor de artı́culos deportivos desea comprar grandes lotes de éstos para la venta. En
cada lote pueden venir de clase A, de clase B y de clase C. La clasificación depende del menor número
de defectos que éstos presentan. Ası́, los de la clase A presentan entre 0 y 2 defectos, los de la clase
B, entre 3 y 5 defectos y los de la clase C más de 5 defectos. Cualquiera que sea la composición del
lote, el precio es el mismo por lo que al distribuidor le interesarı́a que:

PA > PB > PC ,

donde PA = Proporción de artı́culos de clase A en el lote, PB = Proporción de artı́culos de clase B


en el lote y PC = Proporción de artı́culos de clase C en el lote. El distribuidor para decidir la compra
toma de un lote una muestra de 185 artı́culos y ahı́ encuentra 68 de clase A, 62 de clase B y 55 de
clase C. Al nivel de confianza del 95 %; ¿ podrı́a decirse que:

PA > PB > PC ?

24.- Una financiera asume que los montos de los ahorros de sus clientes tiene una distribución
lognormal de parámetros µ = 8 y 2 = 4. Con la finalidad de comprobar la veracidad de la asunción
se toman al azar 140 cuentas. La distribución de éstas fue como sigue:

Intervalo de clase Frecuencia


Menos de 500 20
[500 600[ 50
[600 700[ 30
[700 800[ 25
[800 900[ 10
Más de 900 5

Usando un nivel de significación de ↵ =0.05 compruebe la asunción.

25.- Un programa de “números aleatorios” generó los siguientes números:

0.57 0.94 0.89 0.08 0.32 0.57


0.30 0.32 0.73 0.16 0.18 0.59
0.71 0.95 0.96 0.60 0.58 0.29
0.74 0.91 0.46 0.88 0.98 0.49
0.48 0.86 0.89 0.36 0.21 0.09

A un nivel de significación de ↵ = 0.05, ¿ podrı́a decirse que realmente los números generados son
aleatorios ? Use 5 intervalos.
104

26.- En el proceso de llenado de sacos de arroz de 50 kilos se asume, como es usual, que el peso
de un saco que pasa por este proceso, X, tiene una distribución normal con una media de 50 kilos.
Un ingeniero piensa que si bien el peso medio de llenado de un saco es de efectivamente 50 kilos,
la distribución de pesos de los sacos llenados con el proceso tiene un cierto grado de asimetrı́a y
por tanto sospecha que el modelo normal que se ha venido asumiendo no es adecuado para esta
distribución . Para estudiarse el problema, se seleccionaron al azar 70 sacos de arroz llenados bajo
el proceso. Luego del pesaje (en kilos) de estos sacos de arroz, se obtuvo la siguiente distribución de
frecuencias:

Intervalos Frecuencia Observada


[36.946, 41.264[ 5
[41.264, 45.582[ 15
[45.582, 49.900[ 18
[49.900, 54.218[ 13
[54.218, 58.536[ 9
[58.536, 62.854[ 6
[62.854, 67.172] 4

a) Asumiendo que la distribución de pesos de los sacos de arroz llenados con este proceso es la usual,
estime por máxima verosimilitud la desviación estándar de estos pesos.
b) A un nivel de significación de ↵ = 0.05, ¿ proveen estos datos al ingeniero de evidencia empı́rica
suficiente para validar sus sospechas ?

27.- Un fabricante piensa que el tiempo de vida útil de un tipo de circuito tiene una distribución
exponencial. Para comprobarlo él ha seleccionado 45 de estos circuitos y luego de someterlos a uso
continuo en condiciones ambientales controladas ha encontrado los siguientes tiempos de vidas en ho-
ras: 56.964220 16.727451 14.419384 11.693030 11.062747 20.731942 12.039204 249.734139 7.070935
24.330959 122.033890 17.056974 21.796482 16.677012 22.347398 30.389092 40.785651 39.138552
53.541172 63.871099 58.777938 62.624475 61.745463 9.925660 27.187030 11.707706 39.823348
133.639951 61.693134 4.860883 21.926937 33.479360 97.816661 79.735347 24.875191 6.419568
32.638556 13.018685 158.881303 62.466969 7.179301 65.765316 36.691724 21.199193 27.071903. A
un nivel de significación ↵ =0.01, ¿ es válida la conjetura del fabricante ?

28.- En un laboratorio se inspecciona según color una etapa de la producción de un fármaco. Para
evitar errores de observación, se han dispuesto turnos de inspección, donde cada cambio de turno se
realiza inmediatamente después de que un controlador ubique 2 unidades del fármaco con un color
que denote problemas de concentración. El ingeniero a cargo de la producción cree que la aparición
de fármacos defectuosos en el proceso se da a través de un proceso de Poisson y que por tanto el
ESTADISTICA APLICADA Luis Valdivieso 105

tiempo de observación de cada turno tiene distribución Gamma de parámetro ↵ = 2 y un cierto


parámetro . Para analizar esto, el ingeniero ha ordenado registrar los tiempos de observación del
proceso para 48 turnos seleccionados al azar, encontrando en minutos: 228.374, 99.733, 230.503,
214.352, 350.384, 88.892, 445.805, 68.282 , 145.961, 370.382, 68.428, 79.606, 308.906, 46.467,
293.379, 129.357, 410.636, 321.654, 453.652, 245.655, 273.724, 127.523 , 330.817, 28.072,
129.220, 120.474, 74.527, 348.326, 172.764, 153.049 , 205.517, 64.548, 100.410, 202.744,
469.416, 207.480, 249.156, 112.023, 287.380, 34.858, 111.865, 34.381, 78.239, 130.892, 302.128,
51.523, 92.375, 136.403. A un nivel de significación de ↵ =0.05, ¿ tiene razón el ingeniero ?

29.- Al usar varias leyes de falla se ha encontrado que la distribución exponencial desempeña un papel
muy importante y que, por tanto, interesa poder decidir si una muestra particular de tiempos para
que se presente la falla proviene de una distribución exponencial. Supóngase que un ingeniero piensa
que la duración de una marca particular de bombillas (en horas) tiene una distribución exponencial
con una media de 124 horas y para ello él ha seleccionado al azar 327 bombillas de esta marca
encontrándose la siguiente distribución de frecuencias de sus duraciones en horas:

Intervalo Frecuencia observada


[4, 100[ 82
[100, 196[ 70
[196, 292[ 67
[292, 388[ 60
[388, 484] 48

¿ Muestran estos datos, a un nivel de significación de ↵ =0.05, que la hipótesis del ingeniero es
correcta ?

30.- Un algoritmo de búsqueda de archivos logra localizar el archivo buscado en un tiempo menor al
requerido en el 100 p % de las veces. El algoritmo será puesto a prueba en 5 oportunidades, en cada
una se efectuará la búsqueda de un archivo, y se desea averiguar cuántos se localizarán dentro del
tiempo requerido. Suponga condiciones similares en cada busqueda y también independencia.
a) ¿Qué modelo probabilı́stico serı́a el más adecuado para describir la variable de interés ?
b) Halle el estimador de máxima verosimilitud de p.
c) A partir de una muestra aleatoria de 100 oportunidades, en las que el algoritmo realizó cinco
búsquedas, se obtuvieron los siguientes resultados:

Número de achivos localizados antes de lo requerido 0 1 2 3 4 5


Frecuencia registrada 1 7 19 28 33 12

A un nivel de significación de ↵ =0.05, ¿ descartan estos datos al modelo propuesto por usted ?
106

31.- Una encuestadora, a pedido del canal de televisión A, ha realizado un estudio de medición de
la teleaudiencia en el horario de las 8 pm. En este estudio se seleccionaron al azar 225 personas de
ambos sexos, a quienes se les pregunto por el canal que más frecuentemente sintonizaban de Lunes a
Viernes en el horario de las 8 pm. Los resultados de este estudio se muestran en el siguiente gráfico
de barras componentes:

a) ¿ Podrı́a afirmarse a un nivel de significación de ↵ =0.05, que existen diferencias significativas en


las proporciones de personas que sintonizan cada uno de estos canales de TV a las 8 pm. ?
b) ¿ Podrı́a afirmarse a un nivel de significación de ↵ =0.05, que la preferencia por un canal en el
horario de las 8 pm, es independiente del sexo de la teleaudiencia ?
c) Antes del estudio, los directivos del canal A pensaban que ellos junto con su principal competencia,
el canal C, cubrı́an en el horario de las 8pm. más del 50 % de toda la teleaudiencia. Utilice un intervalo
de confianza al 95 % para afirmar o refutar la conjetura de estos directivos.

32.- En un proceso de producción se fabrica cierto artı́culo de veinte en veinte unidades. La ca-
lidad resultante asume uno de tres valores aleatorios (1, 2 y 3 con probabilidades p.1 , p.2 y p.3 ,
respectivamente) y en el proceso se suele necesitar uno de cuatro tipos de ajuste también aleatorios
(1, 2, 3 y 4 con probabilidades p1. , p2. , p3. y p4. respectivamente). Suponga que se escogerán al azar
cien producciones y se registrará el tipo de calidad que resulte, ası́ como el tipo de ajuste que sea
necesario en cada producción de veinte unidades. Se asume condiciones similares e independencia
ESTADISTICA APLICADA Luis Valdivieso 107

entre los resultados de las producciones.


Los resultados obtenidos se muestran en la siguiente tabla:

Calidad
Ajuste 1 2 3 T otal
1 13 5 7 25
2 15 6 8 29
3 9 4 8 21
4 13 5 7 25
T otal 50 20 30 100

a) ¿Los tipos de calidad resultantes se dan con igual frecuencia? Use un nivel de significación de ↵ =
0.05.
b) ¿Puede afirmarse que el tipo de calidad y ajuste son independientes? Use un nivel de significación
de ↵ = 0.05.
c) Determine, usando un intervalo de confianza del 95 %, si se puede descartar que la frecuencia con
la cual se produce el tipo de calidad 1 y se necesita realizar un ajuste del tipo 3, es la misma que la
correspondiente al tipo de calidad 2 y ajuste del tipo 1.

33.- Un operador manifiesta con una probabilidad de equivocarse de 0.05 que la proporción de defectos
de las 3 lı́neas de producción de la planta difieren entre si. Ud. ha tomado en un dia una muestra de
50, 35 y 40 productos de cada lı́nea y encontrado 4, 10 y 5 productos defectuosos, respectivamente.
a) ¿ Estará en lo correcto el operador ?
b) En caso de encontrar diferencias significativas, utilice la desigualdad de Bonferroni con el fin de
jerarquizar las proporciones de defectos en las tres lı́neas de producción. Utilice un nivel de confianza
global de al menos 95 %.
108
Capı́tulo 4

DISEÑOS EXPERIMENTALES

4.1. Análisis de varianza a una via

Supongamos que a una variable aleatoria Y se la desea comparar bajo a tratamientos de un factor
A y que con este fin recolectamos las siguientes n observaciones de Y bajo cada tratamiento:

Totales Medias
1 Y11 Y12 ... Y1j ... Y1n Y1. Ȳ1.
2 Y21 Y22 ... Y2j ... Y2n Y2. Ȳ2.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
Tratamientos i Yi1 Yi2 ... Yij ... Yin Yi. Ȳi.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
a Ya1 Ya2 ... Yaj ... Yan Ya. Ȳa.
Y.. Ȳ..
Pn Yi.
donde Yij = j-ésimo elemento de la m.a. de Y bajo el i-ésimo tratamiento, Yi. = j=1 Yij , Ȳi. = n ,
P
Y.. = ai=1 Yi. e Ȳ.. = YN.. (N = an).
Cada elemento de la m.a.de Y puede modelarse linealmente como:

Yij = µ + ⌧i + ✏ij , 8i = 1, 2, ..., a ; j = 1, 2, ..., n , (4.1)

siendo µ la llamada media total, el cual es un parámetro común a todos los tratamientos, ⌧i el efecto
del i-ésimo tratamiento del factor A sobre Y y ✏ij un término de error aleatorio con distribución
normal de media 0 y varianza 2. Estos últimos errores se asumen independientes entre si.
Uno de los objetivos centrales en el análisis de varianza a una via consiste en determinar si es
que existen o no diferencias significativas en el valor medio de la variable dependiente Y , bajo los a
tratamientos del factor A.

109
110

Una cuestión clave para distinguir la naturaleza del modelo radica en determinar el significado
de los efectos de los tratamientos. Estos pueden ser

(i) Parámetros fijos definidos como desviaciones de la media total ó

(ii) Elementos de una m.a. de una v.a. ⌧ ⇠ N (0, 2


⌧ ).

En (i) al modelo se le conoce como de efectos fijos y si µi denota el valor medio de Y bajo el i-ésimo
tratamiento, entonces los efectos de los tratamientos son definidos como desviaciones de la media
P
total: ⌧i = µi µ, 8i. Luego, se cumple que ai=1 ⌧i = 0. Este modelo es aplicable cuando uno
solo desea comparar Y bajo a tratamientos prefijados de interés. Obviamente las conclusiones serán
válidas solo para los tratamientos comparados.
En (ii) al modelo se le conoce como de efectos aleatorios. Este modelo se emplea cuando uno
tiene una gran población de tratamientos y por tanto resulta poco práctico el compararlos todos. En
este caso se elijen al azar solo a tratamientos de los muchos existentes y luego de comparar Y bajo
tales, uno tiene la posibilidad de extender sus conclusiones a toda la población de tratamientos.
Antes de entrar a mayores detalles, vale indicar que el desarrollo que presentaremos se basará pre-
ferentemente en un contexto experimental; es decir, en un contexto donde existe un factor con a
tratamientos cuyos efectos en la variable respuesta Y deseamos investigar, pues pensamos que estos
tratamientos afectan solo la posición o tendencia central de las a poblaciones de Y asociadas. Existe,
por otro lado, otro contexto muy común en investigación, llamado contexto cuasi-experimental o de
encuesta. En él las poblaciones de Y son naturales (existen antes de tomarse las muestras) y lo que
se desea es ver si es que estas poblaciones son o no en cierta sentido equivalentes. En este caso, se
procede a una adaptación del presente análisis y a una más cuidadosa revisión de los supuestos del
modelo, en particular el concerniente a la homocedasticidad o igualdad de varianzas.
Otra diferencia de fondo en los contextos descritos es que las conclusiones de un estudio cuasi-
experimental son sólo de carácter tentativo ya que no es posible asegurar una relación causa-efecto
entre la caracterı́stica que define a las a poblaciones y la variable dependiente Y . Esta relación podrı́a
ser, por ejemplo, originada por otras variables no consideradas ni controladas en la comparación. Solo
las investigaciones experimentales pueden establecer verdaderas relaciones de causa-efecto.
Sea el contexto experimental o cuasi-experimental, los diseños que desarrollaremos serán comple-
tamente aleatorios. En un contexto cuasi-experimental, esto se logra al tomárse muestras aleatorias
de Y bajo cada tratamiento. En un contexto experimental, tal metodologı́a carece de sentido pues
las poblaciones como tales no existen y en cierta manera son definidas por los tratamientos. En este
caso uno selecciona al azar a las unidades experimentales en un número igual al total de réplicas de
Y para todos los tratamientos y asigna estas unidades a los a tratamientos, aleatorizando el orden
de ejecución del experimento. En pocas palabras esto significa que los tratamientos deben de ser
asignados de manera completamente aleatoria a las unidades experimentales.
ESTADISTICA APLICADA Luis Valdivieso 111

4.1.1. El modelo de efectos fijos

Estaremos interesados en contrastar a nivel ↵:

H0 : ⌧1 = ⌧2 = ... = ⌧a = 0 vs H1 : 9i / ⌧i 6= 0

o equivalentemente,
H0 : µ1 = µ2 = ... = µa = µ vs H1 : 9i / µi 6= µ.

Esta contraste se basa en la descomponer la variabilidad total de Y , SCT = (N 1)SY2 mediante el


siguiente artificio:
a X
X n a X
X n
2
SCT = (Yij Ȳ.. ) = (Yij Ȳi. + Ȳi. Ȳ.. )2 .
i=1 j=1 i=1 j=1

Se demuestra que al desarrollarse los cuadrados y operarse los productos cruzados, estos últimos se
cancelan quedándonos la siguiente descomposición fundamental de análisis de varianza:
a X
X n a
X a X
X n
2 2
(Yij Ȳ.. ) = n (Ȳi. Ȳ.. ) + (Yij Ȳi. )2
i=1 j=1 i=1 i=1 j=1

o respectivamente,
SCT = SCT r + SCE (4.2)

Suma de cuadrados totales = Suma de cuadrados de los trataminentos (entre tratamientos)


+ Suma de cuadrados del error (dentro de los tratamientos).

Por las asunciones de normalidad en el modelo, se cumplen que


a
X
SCT (N 1)SY2 2 SCE (n 1)SY2i. 2
2
= 2
⇠ (N 1) y 2
= 2
⇠ (N a).
i=1

SCT r 2 (a
Más aún, se prueba que si H0 es verdadera entonces 2 ⇠ 1) es una v.a. independiente de
SCE
2 y por tanto:

SCT r SCT r
2 /(a 1) a 1 M CT r
F0 = SCE
= SCE
= ⇠ F (a 1, N a).
2 /(N a) N a
M CE

Observando atentamente (4.2) y la definición de F0 vemos claramente que existe mayor evidencia de
que H0 sea falsa, mientras F0 sea mayor. En efecto, se puede concluir que a un nivel de significación
↵ la región crı́tica o de rechazo de H0 estará determinada por:

RC : F0 > F1 ↵ (a 1, N a).
112

OBSERVACIONES: 1.- Para efectos de cálculo pueden utilizarse las siguientes fórmulas simplificadas
de las sumas de cuadrados:
a X
X n a
Y..2 1X 2 Y..2
SCT = (N 1)SY2 = Yij2 , SCT r = Yi. y SCE = SCT SCT r.
N n N
i=1 j=1 i=1

2.- A modo de resumen, es recomendable utilizar la siguiente tabla de análisis de varianza a una via
(tabla ANOVA):

Fuente de variabilidad Sumas de cuadrado Grados de libertad Medias cuadráticas F0


SCT r M CT r
Tratamientos SCTr a 1 M CT r = a 1 F0 = M CE
SCE
Error SCE N a M CE = N a
Total SCT N 1

3.- Si bien los tamaños de muestra por tratamiento pueden diferir (diseño no balanceado), debe de
considerarse que por la asunción de homocedasticidad en el modelo (varianza común 2 de Y bajo
cualquier tratamiento) uno puede garantizar un contraste de máxima potencia sólo si los tamaños
de muestra por tratamiento son iguales (diseño balanceado). En un diseño no balanceado, el análisis
previo es, por fortuna, el mismo con la excepción de que las sumas de cuadrados se evaluan ahora
por:

X ni
a X XY2a
Y..2 Y..2
SCT = (N 1)SY2 = Yij2 , SCT r = i.
y SCE = SCT SCT r,
N ni N
i=1 j=1 i=1

Pa
siendo ni el tamaño de muestra de Y bajo el i-ésimo tratamiento y N = i=1 ni .

Ejemplo: En un experimento se quiere ver como influye en la resistencia a la tensión de un tejido de


fibra sintética, el agregar distintos porcentajes de un tipo de fibra de algodón. Se fijaron 5 porcentajes
y se midió la resistencia a la tracción (en unidades psi) en muestras de n = 5 unidades de tejido,
obteniéndose:

Totales Medias
15 % 7 7 15 11 9 49 9.8
20 % 12 17 12 18 18 77 15.4
Porcentajes 25 % 14 18 18 19 19 88 17.6
30 % 19 25 22 19 23 108 21.6
35 % 7 10 11 15 11 54 10.8

¿ Existen diferencias significativas en la resistencia media a la tensión debido a los porcentajes de


algodón utilizados en la fibra ? Use ↵ = 0.05.
ESTADISTICA APLICADA Luis Valdivieso 113

Solución: Se desea contrastar a nivel ↵ = 0.05:

H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ vs H1 : 9i / µi 6= µ.

donde µi = media de la resistencia a la tensión al utilizarse un 10 + 5i % de algodón en la fibra.


Se rechazará H0 si:
R.C : F0 > F0.95 (4, 20) = 2.87.

Evaluemos F0 : De los datos obtenemos que: Y.. = 376 , Ȳ.. = 15.05,

3762
SCT = (72 + ... + 112 ) = 636.96,
25
492 + ... + 542 3762
SCT r = = 475.76,
5 25
y una tabla ANOVA:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas F0


Tratamientos 475.67 4 118.94 F0 = 14.76
Error 161.2 20 8.06
Total 636.96 24

Como se aprecia F0 > 2.87 y por tanto sı́ existen diferencias significativas en la resistencia media a
la tracción según el porcentaje de algodón utilizado en la fibra. Nótese que esta conclusión resulta de
alguna manera exigua, pues no se nos dice donde es que se ubican las diferencias. De esto trataremos
en una próxima sección. ⇤

4.1.2. Estimación de los parámetros del modelo

Los estimadores puntuales (de mı́nimos cuadrados) de los parámetros en el modelo (4.1) se pueden
probar que vienen dados por:

µ̂ = Ȳ.. , ⌧ˆi = Ȳi. Ȳ.. , y µ̂i = Ȳi. , 8i = 1, 2, ..., a.

Es factible también obtener intervalos de confianza al 100(1 ↵) % para los parámetros del
modelo. Para ello uno solo tiene que encontrar una variable pivote adecuada para la construcción del
intervalo. Por ejemplo, supongamos que deseamos obtener un intervalo de confianza al 100(1 ↵) %
para la diferencia de medias de Y bajo dos tratamientos distintos i y j: µi µj . Dadas las asunciones
de normalidad, no resulta difı́cil deducir que

Ȳi. Ȳj. (µi µj )


T = p q ⇠ t(N a).
1 1
M CE ni + nj
114

Como T posee una distribución conocida (en tablas) que solo depende como parámetro desconocido
de µi µj , esta constituye nuestra variable pivote. Determinada la variable pivote lo que sigue es
rutinario. Por la simetrı́a en la distribución t, uno debe elegir en la tabla t el valor t1 ↵
2
(N-a) de tal
manera que el área bajo la curva t entre t1 ↵
2
(N-a) y t1 ↵
2
(N-a) sea de 1 ↵. Formalmente,

P [ t1 ↵
2
(N-a)  T  t1 ↵
2
(N-a)] = 1 ↵.

Reemplazando T y ordenando de tal manera que nuestro parámetro quede en la posición central,
resulta que:
s s
p 1 1 p 1 1
P [Ȳi. Ȳj. t1 ↵ (N-a) M CE +  µi µj  Ȳi. Ȳj. +t1 ↵ (N-a) M CE + ] = 1 ↵.
2 ni nj 2 ni nj

Esto quiere decir que un intervalo de confianza al 100(1 ↵) % para µi µj es:


s s
p 1 1 p 1 1
[Ȳi. Ȳj. t1 ↵2 (N-a) M CE + , Ȳi. Ȳj. + t1 ↵2 (N-a) M CE + ].
ni nj ni nj

Como ejercicio utilice las variables pivotes


Ȳi. µi SCE 2
T =q ⇠ t(N a) y W = 2
⇠ (N a)
M CE
ni

y obtenga para los µi y 2 los intervalos de confianza al 100(1 ↵) %:


r r
M CE M CE
[Ȳi. t1 ↵2 (N-a) , Ȳi. + t1 ↵2 (N-a) ].
ni ni
y
SCE SCE
[ 2 , 2 ],
↵ (N-a) ↵ (N-a)
1 2 2

respectivamente.

4.1.3. El modelo de efectos aleatorios

Como se precisó, en este modelo los efectos de los tratamientos ⌧1 , ⌧2 , ..., ⌧a constituyen una m.a.
de tamaño a de la v.a. ⌧ ⇠ N (0, 2
⌧ ). Aquı́ se desea contrastar a nivel ↵:

2 2
H0 : ⌧ = 0 vs H1 : ⌧ > 0.

Los cálculos en este modelo y la región crı́tica del contraste son por fortuna los mismos que en el
modelo de efectos fijos; aunque tengase en cuenta que si uno rechaza H0 no solo esta probando que
algunos de los efectos de los a tratamientos sobre la v.a. dependiente Y es no nulo sino, y eso es lo
trascendental, que algunos de los efectos de todos los tratamientos de la población de tratamientos
es no nulo.
ESTADISTICA APLICADA Luis Valdivieso 115

4.1.4. Comparaciones múltiples

Comparaciones planeadas

Estas comparaciones se realizan cuando, antes de la toma de datos, existı́a la intención de com-
parar algunos pares especı́ficos. Estas comparaciones pueden hacerse con una prueba t de Student
modificada, a la cual se denomina LSD (de Least Significance Di↵erence). Se presentan los siguientes
casos:

(A) Para someter a prueba H0 : µi = µj :


Se utiliza básicamente una prueba t de Student para dos muestras independientes, en donde Sp2
es reeemplazada por M CE. Esto es, se forma el estadı́stico:
Ȳi. Ȳj.
T0 = q
M CE M CE
ni + nj

y se consideran las siguientes regiones crı́ticas:

Hipótesis alternativa Región crı́tica


H1 : µi 6= µj |T0 | > t1 ↵
2
(N-a)
H1 : µ i > µ j T0 > t1 ↵ (N-a)

H1 : µ i < µ j T0 < t1 ↵ (N-a).

OBSERVACIONES: 1.- Notese de que la región crı́tica de la prueba anterior a dos colas no es sino
el complemento del intervalo de confianza al 100(1 ↵) % para µi µj .
2.- Si se desean comparar muchos pares de medias a la vez, aparece de inmediato el problema
del incremento en el nivel de significación ↵. Este problema lo analizaremos cuando veamos las
comparaciones no planeadas.

(B) Contrastes
Un contraste poblacional es por definición cualquier combinación lineal de medias poblacionales:
P P
CP = ci µi que satisface la condición ni ci = 0. Este parámetro poblacional CP se estima
ˆ = P ˆ un estimador que posee, bajo los supuestos en (4.1), las
puntualmente por CP ci Ȳi. , siendo CP
propiedades siguientes:

ˆ ⇠ N (CP, 2
P c2i
CP ni ).
ˆ P ci µ i
CP
T = r ⇠ t(N a).
P c2i
M CE n i

El interés aquı́ radica en someter a prueba H0 : CP = 0. Esto se hace utilizando el estadı́stico:


ˆ
CP
T0 = q P c2i
M CE ni
116

y considerando las siguientes regiones crı́ticas:

Hipótesis alternativa Región crı́tica


H1 : CP 6= 0 |T0 | > t1 ↵
2
(N-a)
H1 : CP > 0 T0 > t1 ↵ (N-a)

H1 : CP < 0 T0 < t1 ↵ (N-a)

Ejemplo: Supongamos que en el ejemplo de la resistencia a la tensión se tenı́a el interés adicional de


saber (antes de tomarse los datos) si a un nivel de significación de ↵ = 0.05 existı́an o no diferencias
significativas en la resistencia media a la tensión de la fibra bajo un 35 % de algodón y bajo un
promedio de los dos primeros tratamientos( con 15 y 20 % de algodón).
Formalmente, si CP = 12 µ1 + 12 µ2 µ5 , se tenı́a interés en contrastar:

H0 : CP = 0 vs H1 : CP 6= 0.

Nuestra regla de decisión indica que se rechazará H0 si |T0 | > t0.975 (20) = 2.086. Una directa
evaluación nos da
X c2
ˆ = 9.8 + 15.4
CP 10.8 = 1.8 y M CE i
= 2.58.
2 2 5

Luego, T0 = 1.121 y consecuentemente no existe evidencia empı́rica suficiente que nos lleve al rechazo
de H0 . ⇤

(C) Contrastes ortogonales.


P P
Dos contrastes poblacionales CP1 = ci µi ó {ci } y CP2 = di µi ó {di } se denominan orto-
P
gonales si ni ci di = 0. Con a tratamientos un conjunto de a 1 contrastes ortogonales estimados
particiona la suma de cuadrados debido a los tratamientos en a 1 componentes independientes
de un grado de libertad, implicando que los a 1 contrastes sean independientes. Las sumas de
cuadrados de estos contrastes vienen dados por:
Pa
( ci Yi. )2
SCC = Pi=1
a 2
i=1 ni ci

y tienen un sólo grado de libertad. Estas sumas de cuadrados divididas entre la media cuadratica del
error nos proporcionan los F de contrastes que se van a comparar con el valor de tabla F1 ↵ (1, N-a).

Los contrastes cuyos F superen el valor de tabla serán entonces significativos. Es interesante apreciar
que si el diseño es balanceado, entonces estos estadı́stico F coinciden con los cuadrados de los
estadı́sticos respectivos del contraste; vale decir, con T02 .
Existen muchas maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto
dado de tratamientos. Usualmente, algo de la naturaleza del experimento debe sugerir las compara-
ciones que resultan de interés. Por ejemplo, si se desean comparar los efectos de a = 3 tratamientos
ESTADISTICA APLICADA Luis Valdivieso 117

en la reducción de la presión arterial, siendo control el tratamiento 1 (un placebo por ejemplo), y
los tratamientos 2 y 3 los fármacos de interés, los contrastes ortogonales apropiados (para un diseño
balanceado) podrı́an ser los siguientes:

Coeficientes

Contraste 1 Contraste 2
1 (placebo) -1 0
1 1
Tratamiento 2 (fármaco 1) 2 2
1 1
3 (fármaco 2) 2 2

Debe observarse que el contraste {c1 , c2 , c3 } = { 1, 12 , 12 } compara el efecto promedio de los dos
fármacos con el efecto del placebo en cuanto a reducir la presión arterial, mientras que el contraste
1 1
{d1 , d2 , d3 } = {0, 2, 2} compara los efectos de los dos fármacos de interés en la reducción de la
presión arterial.
Ejemplo: Supóngase que antes de realizarse el experimento del efecto de los cinco porcentajes de
algodón sobre la resistencia a la tracción de la fibra, el investigador hubiese estado interesado en
realizar los siguientes 4 contrastes (ortogonales) poblacionales a un nivel de significación de ↵ =
0.05:
H0 : µ4 = µ5
µ1 +µ3 µ4 +µ5
H0 : 2 = 2
H0 : µ1 = µ3
µ1 +µ3 +µ4 +µ5
H0 : µ2 = 4
µ1 µ3 µ4 µ5
Las sumas de cuadrados de los cuatro contrastes (CP1 = µ4 µ5 , CP2 = 2 + 2 2 2 ,
µ1 µ3 µ4 µ5
CP3 = µ1 µ3 y CP4 = 4 µ2 + 4 + 4 + 4 ) pueden resumirse en la siguiente tabla ANOVA:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas F


CP1 291.6 1 291.6 36.18
CP2 31.25 1 31.25 3.88
CP3 152.1 1 152.1 18.87
CP4 0.81 1 0.81 0.1
Tratamientos 475.67 4 118.94 F0 = 14.76
Error 161.2 20 8.06
Total 636.96 24
Comparando F con F0.95 (1, 20) = 4.35, vemos que CP1 y CP3 son significativos; es decir, con un
error de equivocarnos del 5 %, si podemos afimar que existen diferencias en la resistencia media a la
tensión entre fibras con un 30 % y 35 % de algodón y entre fibras con un 15 % y 25 % de algodón. ⇤
118

Comparaciones no planeadas o a posteriori

Después de detectar que en un análisis de varianza de efectos fijos no todas las medias son iguales,
podrı́amos estar interesados en detectar cuáles son diferentes. Uno de los muchos procedimientos para
realizar esta tarea, manteniendo bajo control un mismo nivel de significación ↵, consiste en utilizar
la desigualdad de Bonferroni que expusimos en la sección 3.4. Bajo este procedimiento podrı́amos
construir, como en 4.1.2, IC’s al 100(1 ↵0 ) % para todas las C2a de diferencias de medias de Y
bajo pares de tratamientos. Dado que estos IC’s son equivalentes a las regiones de aceptación de la
hipótesis de igualdad de medias de Y bajo los tratamientos comparados, uno podrá garantizar un
nivel de significación global de ↵ o menos en todas las comparaciones, si es que toma para cada IC
↵ 2↵
un valor de ↵0 = C2a = a(a 1) .

Otro método muy popular y de buenos resultados, lo constituye el método de rangos de Duncan.
Este método consiste en comparar todas las C2a diferencias de medias muestrales con un conjunto
de rangos que se encuentran tabulados en una tabla especial (ver apéndice E). Dado que los detalles
de un tratamiento formal resultan engorrosos, optaremos por ilustrar el método con los datos del
ejemplo de la subsección 4.1.1. Usaremos un nivel de significación de ↵ = 0.05
Los pasos a seguir se detallan a continuación:
Paso 1. Se ordenan las medias muestrales de menor a mayor . Ası́, en nuestro ejemplo:

Ȳ1. < Ȳ5. < Ȳ2. < Ȳ3.  Ȳ4.


9.8 < 10.8 < 15.4 < 17.6 < 21.6.

q
M CE
Paso 2. Se calcula el error estándar de estimación de las medias muestrales, SȲi. = n , donde
si el diseño es no balanceado n se calcula como la media armónica de los tamaños de muestra bajo
q
cada tratamiento; es decir por: n = a 1 . En nuestro ejemplo, SȲi. = 8.506 = 1.27.
P a
i=1 ni

Paso 3. Se obtienen en la tabla de Duncan (véase el apéndice E) los valores r↵ (p; f ), para p = 2, ..., a,
donde ↵ es el nivel de significación fijado previamente y f son los grados de libertad del error (en el
análisis a una via f = N a). Para nuestro ejemplo, ↵ = 0.05 , f = 20 y de tabla obtenemos:

r0,05 (2; 20) = 2.95


r0,05 (3; 20) = 3.10
r0,05 (4; 20) = 3.18
r0,05 (5; 20) = 3.25.

Paso 4. Se calculan los rangos de ”mı́nima significancia”: Rp = SȲi. ⇥ r↵ (p; f ), para p = 2, ..., a. En
nuestro ejemplo:
ESTADISTICA APLICADA Luis Valdivieso 119

R2 = 1.27 ⇥ 2.95 = 3.75


R3 = 1.27 ⇥ 3.10 = 3.94
R4 = 1.27 ⇥ 3.18 = 4.04
R5 = 1.27 ⇥ 3.25 = 4.13.
Paso 5. Se evaluan las diferencias observadas entre las medias, comenzando por el valor más alto
contra el más pequeño y comparándola con el rango de mı́nima significancia Ra . Después se calcula
la diferencia entre el valor más alto y el segundo más pequeño, y se compara con el rango de mı́nima
significancia Ra 1. Este procedimiento continúa hasta que todas las medias hayan sido comparadas
con la más grande. A continuación, la diferencia entre la segunda media más grande y la más pequeña
es calculada y comparada con el rango de mı́nima significancia Ra 1. Este procedimiento continúa
a(a 1)
hasta que hayan sido consideradas las diferencias entre todos los C2a = 2 posibles pares. Si una
diferencia observada es mayor que la del rango de mı́nima significancia correspondiente, se concluye
que la pareja de medias en cuestión es significativamente diferente. Para evitar contradicciones,
ninguna diferencia entre una pareja de medias se considera significativa si las dos medias se encuentran
entre dos que no difieren. Finalmente una vez ubicadas las diferencias estaremos en capacidad de
jerarquizar la medias poblacionales de Y bajo todos los tratamientos. En nuestro ejemplo:
Diferencias de medias muestrales Rangos de mı́nima significancia
Ȳ4. Ȳ1. = 21.6 - 9.8 = 11.8 > 4.13 (= R5 ) : significativa
Ȳ4. Ȳ5. = 21.6 - 10.8 = 10.8 > 4.04 (= R4 ) : significativa
Ȳ4. Ȳ2. = 21.6 - 15.4 = 6.2 > 3.94 (= R3 ) : significativa
Ȳ4. Ȳ3. = 21.6 - 17.6 = 4.0 > 3.75 (= R2 ) : significativa
Ȳ3. Ȳ1. = 17.6 - 9.8 = 7.8 > 4.04 (= R4 ) : significativa
Ȳ3. Ȳ5. = 17.6 - 10.8 = 6.8 > 3.95 (= R3 ) : significativa
Ȳ3. Ȳ2. = 17.6 - 15.4 = 2.2 < 3.75 (= R2 ) : no significativa
Ȳ2. Ȳ1. = 15.4 - 9.8 = 5.6 > 3.94 (= R3 ) : significativa
Ȳ2. Ȳ5. = 15.4 - 10.8 = 4.6 > 3.75 (= R2 ) : significativa
Ȳ5. Ȳ1. = 10.8 - 9.8 = 1.0 < 3.75 (= R2 ) : no significativa
A partir de este análisis se observa que existen diferencias significativas entre todas los pares de
medias a excepción de las del tercer tratamiento y del segundo, y las del quinto tratamiento y el
primero. La conclusión final serı́a que, a un nivel de significación del 5 %, podemos afirmar que:

µ 1 = µ 5 < µ 2 = µ 3 < µ4 .

Esto es de vital importancia en la toma de decisiones. Imagı́nese, por ejemplo, que el manufacturero
debe decidir que % de algodón utilizar para obtener fibras de buena calidad (alta resistencia) y
bajos costos de producción (reflejados en un menor uso de algodón por ser una fibra cara). Bajo
estas premisas una buena sugerencia podrı́a ser el recomendarle fibras con un 20 % de algodón.
120

4.2. Diseños de bloques completamente aleatorizados

Cuando existe una fuente no evitable de variabilidad extraña sobre una variable de estudio Y
(aparte del de la variabilidad debido a los tratamientos de un factor A), es posible aún utilizar un
diseño experimental llamado de bloques a fin de reunir información válida para la comparación de
los efectos de los tratamientos del factor A sobre la v.a. dependiente Y . Formalmente, un diseño de
bloques aleatorios consiste en un plan para reunir datos en el que cada uno de los a tratamientos se
mide una sola vez en cada uno de los k bloques existentes, siendo el orden de los tratamientos dentro
de cada bloque aleatorio.
El objetivo de este diseño es el de comparar una v.a. dependiente Y bajo a tratamientos de un
factor A, controlando estadı́sticamente la fuente extraña de variabilidad mediante el uso de bloques.
Al realizarse un diseño de bloques uno obtiene la siguiente información:

Bloques

1 2 ... j ... k Totales Medias


1 Y11 Y12 ... Y1j ... Y1k Y1. Ȳ1.
2 Y21 Y22 ... Y2j ... Y2k Y2. Ȳ2.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
Tratamientos i Yi1 Yi2 ... Yij ... Yik Yi. Ȳi.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
a Ya1 Ya2 ... Yaj ... Yak Ya. Ȳa.
Totales Y,1 Y,2 ... Y.j ... Y.k Y..
Medias Ȳ,1 Ȳ,2 ... Ȳ.j ... Ȳ.k Ȳ..

Pk Yi.
donde Yij = observación de Y bajo el i-ésimo tratamiento en el bloque j, Yi. = j=1 Yij , Ȳi. = k ,
P P
Y.. = ai=1 Yi. = kj=1 Y.j e Ȳ.. = YN.. (N = ak).
Cada elemento de la tabla se escribe según el siguiente modelo lineal:

Yij = µ + ⌧i + j + ✏ij , i = 1, 2, ..., a; j = 1, 2, ..., k. (4.3)

donde µ es la llamada media total, el cual es un parámetro común a todos los tratamientos, ⌧i el
efecto del i-ésimo tratamiento del factor A sobre Y , j el efecto del j-ésimo bloque sobre Y y ✏ij un
término de error aleatorio de distribución normal con media 0 y varianza 2. Estos últimos errores
se asumen independientes entre si.
El objetivo central del análisis de varianza con un diseño de bloques consiste como siempre en
encontrar si existen o no diferencias significativas en el valor medio de la variable dependiente Y , bajo
ESTADISTICA APLICADA Luis Valdivieso 121

los a tratamientos del factor A; pero controlando mediante bloques la fuente extraña de variabilidad.
Formalmente, se desea contrastar a nivel ↵:

H0 : ⌧1 = ⌧2 = ... = ⌧a = 0 vs H1 : 9i / ⌧i 6= 0.

La prueba se basa como antes en descomponer la variabilidad total de Y , SCT = (N 1)SY2


escribiendo:
a X
X k a X
X k
SCT = (Yij Ȳ.. )2 = (Yij Ȳi. + Ȳi. Ȳ.j + Ȳ.j Ȳ.. + Ȳ.. Ȳ.. )2 .
i=1 j=1 i=1 j=1

Simples cálculos nos conducen luego a la siguiente descomposición de variabilidad:


a
X k
X a X
X k
2 2
SCT = k (Ȳi. Ȳ.. ) + a (Ȳ.j Ȳ.. ) + (Yij Ȳi. Ȳ.j + Ȳ.. )2
i=1 j=1 i=1 j=1

SCT = SCT r + SCb + SCE (4.4)

Suma de cuadrados totales = Suma de cuadrados de los tratamientos


+ Suma de cuadrados de bloques + Suma de cuadrados del error.

En base a esta descomposición se obtiene la siguiente tabla ANOVA de bloques:

Fuente de variabilidad Sumas de cuadrado Grados de libertad Medias cuadráticas F0


SCT r M CT r
Tratamientos SCTr a 1 M CT r = a 1 F0 = M CE
SCb M Cb
Bloques SCb k 1 M Cb = k 1 Fb = M CE
SCE
Error SCE (a 1)(k 1) M CE = (a 1)(k 1)
Total SCT N 1
y se rechaza H0 a nivel ↵ si:

RC : F0 > F1 ↵ (a 1, (a 1)(k 1)).

Si bien es el interés del análisis, es encontrar si existen o no diferencias significativas de Y bajo


los a tratamientos de A, es importante comprobar si realmente el diseño de bloques utilizado ha
sido el adecuado para la experimentación; es decir, comprobar si la fuente de las observaciones, que
suponemos es un factor extraño de variabilidad, en realidad lo es. Para ello podemos plantear a nivel
↵ el siguiente juego de hipótesis:

H0 : 1 = 2 = ... = k = 0 vs H1 : 9j / j 6= 0.

y se rechazará H0 (lo cual indicará que el diseño en bloques fue adecuado) si:

RC : Fb > F1 ↵ (k 1, (a 1)(k 1)).


122

OBSERVACIONES: 1.- Para efectos prácticos se pueden utilizar las siguientes fórmulas simplificadas
de las sumas de cuadrados:
a X
X k a k
Y..2 1X 2 Y..2 1X 2 Y..2
SCT = (N 1)SY2 = Y ij 2
, SCT r = Yi. y SCb = Y.j .
N k N a N
i=1 j=1 i=1 j=1

2.- Al igual que en un modelo ANOVA, uno puede utilizar la desigualdad de Bonferroni o la prueba
de rangos de Duncan para detectar a que se deben las discrepancias halladas de rechazarse H0 . Para
un diseño de bloques completamente aleatorizado, se puede deducir que un intervalo de confianza al
100(1 ↵) % para la diferencia de medias de Y bajo dos tratamientos, µi µj , vienen dada por:
r r
p 2 p 2
[ Ȳi. Ȳj. t1 ↵2 ((a-1)(k-1)) M CE , Ȳi. Ȳj. + t1 ↵2 ((a-1)(k-1)) M CE ].
k k

Ejemplo: Se van a comparar 4 tratamientos quı́micos en cuanto a su capacidad de resistencia a


las manchas (medida con una escala hecha para tal fin). Se disponen de dos tipos de tela para el
experimento, los cuales se sospecha podrı́an constituir una fuente de variabilidad extraña para la
comparación. Por tal razón se decidió aplicar cada tratamiento a una muestra de cada uno de los
tipos de tela. El resultado es un diseño de bloques aleatorizados con las siguientes observaciones:

Tipos de tela

1 2 Totales
1 5 9 14
2 3 8 11
Tratamientos 3 8 13 21
4 4 6 10
Totales 20 36 56

¿ Se puede decir a un nivel de ↵ = 0,05, que los tratamientos producen distintas resistencias a las
manchas en las telas ?. ¿ Fue apropiado usar un diseño de bloques para esta comparación ?. Asuma
normalidad.
Solución: Sea Y = Resistencia a las manchas, ⌧i = Efecto de usar el tratamiento i en Y (i = 1, 2, 3, 4)
y j = Efecto de usar la tela j en Y .
Se desea contrastar a nivel ↵ = 0.05:

H0 : ⌧1 = ⌧2 = ⌧3 = ⌧4 = 0 vs H1 : 9i / ⌧i 6= 0.

Se rechazará H0 si:
R.C : F0 > F0.95 (3, 3) = 9.28.
142 +112 +212 +102 562
De los datos obtenemos que: SCT = 7SY2 = 72, SCT r = 2 8 = 37,
202 +362 562
SCb = 4 8 = 32 y una tabla ANOVA:
ESTADISTICA APLICADA Luis Valdivieso 123

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas F0


Tratamientos 37 3 12.33 F0 = 12.33
Bloques 32 1 32 Fb = 32
Error 3 3 1
Total 72 7

Como F0 > 9.28 si existen a un nivel ↵ = 0.05 diferencias significativas en la resistencia media a las
manchas según el tratamiento utilizado. Además, como Fb > F0.95 (1, 3) = 10.13, podemos también
concluir que nuestro diseño de bloques fue adecuado para reducir el error en nuestra comparación.

4.3. Análisis de varianza a dos vias

En este análisis, se intenta averiguar si es que una una v.a. dependiente Y se ve afectada por los
niveles de dos factores A y B que contienen respectivamente a y b tratamientos. Para ello es necesario
recolectar la data ya sea tomándose una m.a. de Y bajo cada par de tratamientos, asignandose al azar
los pares de tratamientos a las unidades experimentales y/o realizando las corridas del experimento en
un orden completamente aleatorizado. Sea como sea el plan de recolección de datos, uno obtendrá al
final una tabla como la siguiente:

B
1 ... j ... b Total
1 Y111 , Y112 , ..., Y11n ... Y1j1 , Y1j2 , ..., Y1jn ... Y1b1 , Y1b2 , ..., Y1bn Y1..
2 Y211 , Y212 , ..., Y21n ... Y2j1 , Y2j2 , ..., Y2jn ... Y2b1 , Y2b2 , ..., Y2bn Y2..
.. .. .. .. .. .. ..
. . . . . . .
A i Yi11 , Yi12 , ..., Yi1n ... Yij1 , Yij2 , ..., Yijn ... Yib1 , Yib2 , ..., Yibn Yi..
.. .. .. .. .. .. ..
. . . . . . .
a Ya11 , Ya12 , ..., Ya1n ... Yaj1 , Yaj2 , ..., Yajn ... Yab1 , Yab2 , ..., Yabn Ya..
Total Y.1. ... Y.j. ... Y.b. Y...

donde Yijk =k-ésimo elemento de la m.a.de Y bajo el i ésimo tratamiento de e A y el j ésimo de B,


P P P P P Y
Yi.. = bj=1 nk=1 Yijk , Ȳi.. = Ybn
i..
, Y.j. = ai=1 nk=1 Yijk , Ȳ.j. = Yan
i..
, Yij. = nk=1 Yijk , Ȳij. = nij.
P P P
, Y... = ai=1 bj=1 nk=1 Yijk e Ȳ... = YN... ( con N = abn).
El modelo de análisis de varianza a dos vias plantea que cada elemento dentro de la tabla de
arriba, puede escribirse como:

Yijk = µ + ⌧i + j + (⌧ )ij + ✏ijk ,


124

siendo µ = media global poblacional, ⌧i = Efecto del i-ésimo tratamiento de A sobre Y , j = Efecto
del j-ésimo tratamiento de B sobre Y , (⌧ )ij = Efecto de la interacción entre el i-ésimo tratamiento
de A y el j ésimo tratamiento de B y ✏ijk = Error aleatorio.
Se asume que los ✏0ijk s son todos independientes y con distribución normal de media 0 y varianza
común 2 y que los efectos de los tratamientos son desviaciones de la media global: Si µi. = media
poblacional de Y bajo el i ésimo tratamiento y µ.j = media poblacional de Y bajo el j ésimo
P P
tratamiento, entonces ⌧i = µi. µ y j = µ.j µ. Consecuentemente, ai=1 ⌧i = bj=1 j = 0. Se
P P
concluye también que ai=1 bj=1 (⌧ )ij = 0.
Es vital en el análisis aclarar el papel que desempeña la interacción. Se dice que existe interacción
entre los factores A y B, cuando las diferencias entre las medias o totales de Y bajo los tratamientos
de uno de los factores, no mantiene el mismo patrón bajo los tratamientos del otro factor.
Ejemplo: Supongamos que estamos estudiando Y = porcentaje de pureza de un metal después de
un proceso de mezclado y pensamos que este porcentaje se ve afectado por el método que se emplea
en el mezclado (factor A) y/o por el operario que esta a cargo del proceso de mezclado (factor B). Se
disponen de dos métodos y dos operarios y se mide el porcentaje de pureza eligiendo al azar una sola
observación por cada método y operario. La información obtenida se presenta en la tabla siguiente:

B
1 2 Total
A 1 70 50 120
2 40 20 60
Total 110 70 180

Si graficamos los totales de Y bajo el factor máquinas por cada nivel del factor operarios, obtendremos
la figura siguiente, la cual nos dice de que no existe interacción entre los factores.
ESTADISTICA APLICADA Luis Valdivieso 125

Aquı́ podrı́amos pensar fácilmente que el operario 1 muestra una mayor eficiencia e igualmente que
el mejor método es el primero. Sin embargo, si hubiésemos obtenido la siguiente información:

B
1 2 Total
A 1 70 20 90
2 30 60 90
Total 100 80 180
cuyo gráfico de lı́neas es:

sı́ existe interacción y las conclusiones dadas anteriormente no tienen sentido, ya que por ejemplo, el
método 1 no es superior al método 2 si es que esta cargo el operario 2. ⇤
En el análisis de varianza a dos vias se desean contrastar a nivel ↵:

(I) H0 : ⌧1 = ⌧2 = ... = ⌧a = 0 vs H1 : 9i / ⌧i 6= 0.

(H1 nos dice de que existen diferencias significativas o efectos significativos en el valor medio de Y
según los tratamientos del factor A)

(II) H0 : 1 = 2 = ... = b = 0 vs H1 : 9j / j 6= 0.

(H1 nos dice de que existen diferencias significativas o efectos significativos en el valor medio de Y
según los tratamientos del factor B)

(III) H0 : (⌧ )ij = 0, 8i, j vs H1 : 9(i, j) / (⌧ )ij 6= 0.

(H1 nos dice de que existe una interacción significativas entre los tratamientos de los factores A y
B)
126

Si se rechaza H0 en (III), existirá interacción significativa entre los factores A y B. En este caso,
las conclusiones de las pruebas en (I) y (II) serán relativas y en algunos casos inválidas ya que no
existirá uniformidad en los efectos de los tratamientos de A o B bajo los tratamientos del otro factor.
Las contrastes de hipótesis se basan como antes en descomponer la variabilidad total SCT =
(N 1)SY2 :
a X
X b X
n a X
X b X
n
2
SCT = (Yijk Ȳ... ) = (Yijk Ȳi.. + Ȳi.. Ȳ.j. + Ȳ.j. Ȳij. + Ȳij. Ȳ... + Ȳ... Ȳ... )2 .
i=1 j=1 k=1 i=1 j=1 k=1

Se prueba que al desarrollarse los cuadrados, los productos cruzados se cancelan quedándonos la
siguiente descomposición de variabilidad:
a X
X b X
n a
X b
X
(Yijk Ȳ... )2 = bn (Ȳi.. Ȳ... )2 + an (Ȳ.j. Ȳ... )2
i=1 j=1 k=1 i=1 j=1

a X
X n a X
X b X
n
2
+n (Ȳij. Ȳi.. Ȳ.j. + Ȳ... ) + (Yijk Ȳij. )2
i=1 j=1 i=1 j=1 k=1

o respectivamente,
SCT = SCA + SCB + SCAB + SCE

Suma de cuadrados totales = Suma de cuadrados de A + Suma de cuadrados de B


+ Suma de cuadrados de la interacción + Suma de cuadrados del error.

A manera de resumen se obtiene la siguiente tabla ANOVA a dos vias:

Fuente de variabilidad Sumas de Grados de Medias cuadráticas F


variabilidad cuadrados libertad
SCA M CA
Factor A SCA a-1 M CA =
a 1 FA = M CE
SCB M CB
Factor B SCB b-1 M CB = b 1 FB = M CE
Interacción SCAB (a-1)(b-1) M CAB = (a SCAB
1)(b 1) FAB = M CAB
M CE
SCE
Error SCE ab(n-1) M CE = ab(n 1)
Total SCT N-1

Se puede deducir luego, bajo las asunciones del modelo, las siguientes regiones crı́ticas:

Se rechazará H0 en (I) a nivel ↵ si:

FA > F1 ↵ (a 1, ab(n 1)).

Se rechazará H0 en (II) a nivel ↵ si:

FB > F1 ↵ (b 1, ab(n 1)).


ESTADISTICA APLICADA Luis Valdivieso 127

Se rechazará H0 en (III) a nivel ↵ si:

FAB > F1 ↵ ((a 1)(b 1), ab(n 1)).

OBSERVACIONES 1.- Para efectos de cálculo pueden utilizarse las siguientes fórmulas de sumas de
cuadrados:
a X
X b X
n a j
Y...2 1 X 2 Y...2 1 X 2 Y...2
SCT = (N 1)SY2 = 2
Yijk , SCA = Yi.. , SCB = Y.j. ,
N bn N an N
i=1 j=1 k=1 i=1 j=1

a b
1 XX 2 Y...2
SCAB = ( Yij. ) SCA SCB y SCE = SCT SCA SCB SCAB.
n N
i=1 j=1

2.- Una técnica descriptiva para detectar la presencia de interacción consiste en hacer una gráfica
para las medias muestrales (o totales) de Y con los tratamientos de un factor, bajo los distintos
tratamientos del otro factor (vease el ejemplo anterior). Si las lı́neas divergen del paralelismo se
puede pensar en interacción. Se dice pensar, pues la decisión definitiva sobre si esa interacción es
significativa o no nos las dará la prueba de hipótesis (III).
3.- Se pueden también realizar aqui pruebas de Duncan. En este caso se podrı́a, de existir por decir
interacción, fijar un tratamiento de un factor a fin de comparar las medias poblacionales de Y bajo
todos los tratamientos del otro factor. En el caso de no interacción uno puede aplicar Duncan a cada
factor por separado. Vale aclarar que en estas pruebas debe utilizarse:
r
M CE
SȲi. = ,
m
siendo M CE la media cuadrática de la tabla ANOVA a dos vias y m el tamaño de muestra con el
cual se calcula cada media muestral en comparación.
4.- Hemos asumido hasta el momento que nuestro modelo es de efectos fijos en los dos factores. Sin
embargo, uno podrı́a tener modelos de efectos aleatorios o mixtos. En cada caso el análisis anterior
es el mismo; pero cambian las hipótesis y conclusiones. Estas se plantean ahora como:

Modelo de efectos aleatorios (A y B aleatorios)

Se rechazará H0 : 2 = 0 en (I) a nivel ↵ si:


M CA
FA = > F1 ↵ (a 1, (a 1)(b 1)).
M CAB

Se rechazará H0 : 2 = 0 en (II) a nivel ↵ si:

M CB
FB = > F1 ↵ (b 1, (a 1)(b 1)).
M CAB
La prueba de interacción es la misma.
128

Modelo de efectos mixtos (A fijo y B aleatorio)

Se rechazará H0 : ⌧i = 0, 8i en (I) a nivel ↵ si:


M CA
FA = > F1 ↵ (a 1, (a 1)(b 1)).
M CAB
Se rechazará H0 : 2 = 0 en (II) a nivel ↵ si:

M CB
FB = > F1 ↵ (b 1, ab(n 1)).
M CE
La prueba de interacción es la misma.

Ejemplo: El voltaje máximo de salida de un tipo particular de baterı́a se piensa que esta influenciado
por el material usado en las placas y la temperatura del lugar de instalación. Para estudiarse esto
se han tomado al azar 36 observaciones del voltaje máximo de salida, 4 por tipo de material y
temperatura obteniéndose:

TEMPERATURA oF
50 65 80
1 130, 155, 74, 180 34, 40, 80, 75 20, 70, 82, 58
Tipo de Material 2 150, 188, 159, 126 136, 122, 106, 115 25, 70, 58 45
3 138, 110, 168, 160 174, 120, 150, 139 96, 104, 82, 60

A un nivel de ↵ = 0.05, ¿ qué es lo que se puede concluir de este estudio ?.

Solución: Sea Y = Voltaje máximo de salida. Asumiremos a falta de aclaración que Y tiene distri-
bución normal. Se disponen de 2 factores A = Material en la placa con 3 niveles o tratamientos y
B = Temperatura del lugar de instalación con también 3 niveles o tratamientos. Sean: ⌧i = Efecto
de usar el material i en Y , j = Efecto de la temperatura j en Y y (⌧ )ij = Efecto de la interacción
entre A y B.
Lo primero que nos será útil es hallar los estadı́sticos de la tabla de datos.

TEMPERATURA (oF)
50 65 80 Totales
1 Y11. = 539 Y12. = 229 Y13. = 230 Y1.. = 998
Material 2 Y21. = 623 Y22. = 479 Y23. = 198 Y2.. = 1,300
3 Y31. = 576 Y32. = 583 Y33. = 342 Y3.. =1,501
Totales Y.1. = 1,738 Y.2. = 1,291 Y.3. = 770 Y... = 3,799

Antes de realizar las pruebas del caso, veamos si existe aparente evidencia de interacción entre los
factores dados. Para ello realizemos un gráfico de lı́neas sobre los totales de voltaje por temperaturas
para cada tipo de material en las placas.
ESTADISTICA APLICADA Luis Valdivieso 129

Dado de que la desviación del paralelismo en esta gráfica es algo considerable se puede sospechar
la presencia de interacción. Realicemos ahora el contraste de interacción

H0 : (⌧ )ij = 0 vs H1 : 9(i, j) / (⌧ )ij 6= 0.

Para ello construyamos nuestra tabla ANOVA comenzando por calcular las sumas de cuadrados:

SCT = 35SY2 = 77, 646.96 ,

1 3, 7992
SCA = (9982 + 1, 3002 + 1, 5012 ) = 10, 683.72 ,
12 36
1 3, 7992
SCB = (1, 7382 + 1, 2912 + 7702 ) = 39, 118.72
12 36
y
1 3, 7992
SCAB = (5392 + 2292 + ... + 3422 ) 10, 683.72 39, 118.72 = 9, 613.77.
4 36
Entonces la tabla ANOVA resulta:

Fuente de variabilidad Sumas de cuadrado Grados de libertad Medias cuadráticas F


A = Tipo de Material 10,638.72 2 5,341.86 FA = 7.91
B = Temperatura 39,118.72 2 19,558.36 FB = 28.97
A ⇥ B = Interacción 9,613.77 4 2,403.44 FAB = 3.56
Error 18,230.75 27 675.21
Total 77,646 35
130

Dado que
FAB = 3.56 > F0.95 (4, 27) = 2.73 ,

rechazaremos H0 a un nivel de significación de ↵ = 0.05. Esto quiere decir, tal como lo sospechamos,
que si existe interacción significativa entre los dos factores. En tal sentido, no tiene ya sentido realizar
los contrastes sobre los efectos principales de A y B, pues no existe uniformidad en los efectos de los
tratamientos. ⇤

4.4. El diseño 2K

Este es un diseño que involucra a K factores y en el cual cada factor posee 2 niveles o tratamientos.
Los diseños 2K son particulamente útiles en las primeras fases de un trabajo experimental, cuando
es probable que existan muchos factores por investigar. A lo largo de este trabajo asumiremos que
los factores son fijos, los diseños completamente aleatorizados y que se satisface la suposición usual
de normalidad y de homocedasticidad.
El modelo estadı́stico del diseño 2K incluye a K efectos principales, C2K interacciones de 2 factores,
C3K interacciones de 3 factores y asi sucesivamente hasta una interacción de los K factores; es decir, el
modelo incluye un total de 2K 1 efectos. Si bien podemos tratar al diseño 2K como un diseño factorial
genérico, este tratamiento resulta poco práctico y lo mejor será intimar con algunas simplificaciones en
el cálculo de las estimaciones de los efectos y de sus sumas de cuadrados. Para guiarnos, consideremos
el diseño más simple de la familia, el diseño 22 .
Supongamos que disponemos de n replicas por cada par de tratamientos (a los cuales denotaremos
con los signos - y +). Denotemos por (1), a, b y ab a los siguientes totales por celda:

Factor B

- + Total
- Y111 . . . Y11n Y121 . . . Y12n Y1.. = (1) + b
Factor A Y11. = (1) Y12. = b
+ Y211 . . . Y21n Y221 . . . Y22n Y2.. = a + ab
Y21. = a Y22. = ab
Total Y,1. = (1) + a Y,2. = b + ab Y...

Los efectos estimados de cada factor y de la interacción se definen por:

ab + a b (1)
A = Ȳ2.. Ȳ1.. =
2n
ab + b a (1)
B = Ȳ,2. Ȳ,1. =
2n
ESTADISTICA APLICADA Luis Valdivieso 131

y
ab + (1) a b
AB = (Ȳ22. Ȳ12. ) (Ȳ21. Ȳ11. ) = (Ȳ22. Ȳ21. ) (Ȳ12. Ȳ11. ) = ,
2n
respectivamente.
Notese que los numeradores de estos efectos:

CA = ab + a b (1), CB = ab + b a (1) y CAB = ab + (1) a b

no son otra cosa que un conjunto de contrastes ortogonales sobre los totales. En vista de ello, sus
sumas de cuadrados vienen dados respectivamente por:
2
CA 2
CB 2
CAB
SCA = , SCB = y SCAB = ,
4n 4n 4n

donde hemos utilizado las mismas notaciones que en un análisis de varianza a dos vias, pues es-
tas sumas coinciden, como no es difı́cil probar, con las sumas de cuadrados de la descomposición
fundamental del ANOVA a dos vias.
Antes de apreciar un ejemplo concreto, es importante apuntar el hecho de que cualquiera de los
contrastes dados previamente podrı́an haber sido también obtenidos con la fórmula:

CAB = (a ± 1)(b ± 1),

donde el signo (-) aparecerá si es que si incluye al factor en ese contraste y el signo (+) en caso
contrario. Obviamente “1” será reemplazado por (1) en el cálculo final.

Ejemplo: Se llevó a cabo un experimento para comparar las resistencias de dos marcas de papeles
faciales M1 y M2 en condiciones tanto secas como húmedas. Se probaron 4 papeles faciales por marca
y condición en un orden completamente aleatorizado. La medición de resistencia se hizo como sigue:
se tensó un papel sobre la boca de una taza de plástico y se la sujetó con una liga. A continuación se
dejó caer una canica sobre el papel tenso. La altura mı́nima, en pulgadas, desde la que se dejo caer
para atravesar el papel es la medición de resistencia. Los datos se muestran en la tabla siguiente:

Condición

seca (-) húmeda (+)


Marca M1 (-) 14, 14 , 12, 11 4, 4, 3, 5
M2 (+) 10, 11, 11, 12 5, 5, 6, 6

En este experimento tenemos como variable dependiente a la resistencia Y y como factores fijos a
A = marca del papel y B = condición del papel. La tabla de datos con sus totales marginales y por
celda viene dada por
132

Condición

seca (-) húmeda (+) Total


M1 (-) 14, 14 , 12, 11 4, 4, 3, 5 67
Marca (1) = 51 b = 16
M2 (+) 10, 11, 11, 12 5, 5, 6, 6 66
a = 44 ab = 22
Total 95 38 133

Los efectos estimados de los factores A, B y de la interacción vienen dados por:


22 + 44 16 51 22 + 16 44 51
A= = 0,125, B = = 7,125
8 8
y
22 + 51 44 16
AB = = 1,625.
8
Esto, a nivel descriptivo, nos indica aparentemente pocas diferencias en las resistencias de las marcas
de papel, mucho mayor resistencia del papel en condiciones secas (lo cual es obvio) y cierta interacción
entre los factores.
En pocas palabras, los papeles de la marca M1 parecen ser más resistentes que los de la marca
M2 cuando están secos, pero los de la marca M2 parecen ser ligeramente más resistentes que los de
la marca M1 cuando están húmedos.
La tabla ANOVA se obtiene calculándose primero la suma de cuadrados totales SCT = 11SY2 =
225,437, las sumas de cuadrados de los efectos principales e interacción con las fórmulas anteriormente
descritas, y la suma de cuadrados del error por diferencia. Esta es:

Fuente de variabilidad Sumas de Grados Medias F


cuadrados de libertad cuadráticas
A ( Marca) 0.063 1 0.063 FA = 0.06435
B (Condición) 203.062 1 203.062 FB = 207.417
A ⇥ B (Interacción) 10.563 1 10.563 FAB = 10.78958
Error 11.75 12 0.979
Total 225.437 15

Dado que FAB = 10.78958 > F0.95 (1, 12) = 4.75, se podrá afirmar, con una probabilidad de
equivocarnos del 5 %, de que si existe una interacción significativa entre los dos factores A y B
considerados. ⇤

Para analizar un diseño general 2K , denotaremos con su correspondiente letra minúscula f al


total de la celda donde el factor F toma su nivel alto (+) y todos los demás K 1 factores sus niveles
ESTADISTICA APLICADA Luis Valdivieso 133

bajos (-). El contraste para el efecto de AB . . . K se determina desarrollando el segundo miembro de:

CAB...K = (a ± 1)(b ± 1) . . . (k ± 1).

En este desarrollo se usa álgebra ordinaria, y se reemplaza 1 por (1) en la expresión final. Además,
en cada conjunto de paréntesis debe usarse el signo negativo si se incluye el factor en este efecto y
el signo positivo en caso contrario. Por ejemplo, en un diseño 24 , el contraste para el efecto de ACD
(que corresponde a una interacción de tercer orden) viene dado por:

CACD = (a 1)(b + 1)(c 1)(d 1)

= abcd + acd + bd + d + bc + c + ab + a bcd cd abd ad abc ac b (1).

Una vez determinados los contrastes para todos los efectos, estos pueden estimarse por:
CAB...K
AB . . . K = .
n2K 1
2
CAB...K
Además, las sumas de cuadrados para todos los factores vienen dados por SCAB . . . K = n2K
,en
donde n corresponde al número de réplicas.
Seguidamente mostramos la tabla ANOVA de un diseño 2K :

Fuente de variabilidad Sumas de Grados Medias F


cuadrados de libertad cuadráticas
K Efectos principales
M CA
A SCA 1 MCA FA = M CE
.. .. .. .. ..
. . . . .
M CK
K SCK 1 MCK FK = M CE
C2K interacciones de 2 factores
M CAB
AB SCAB 1 MCAB FAB = M CE
.. .. .. .. ..
. . . . .
M CJK
JK SCJK 1 MCJK FJK = M CE
C3K interacciones de 3 factores
M CABC
ABC SCABC 1 MCABC FABC = M CE
.. .. .. .. ..
. . . . .
M CIJK
IJK SCIJK 1 MCIJK FIJK = M CE
.. .. .. .. ..
. . . . .
K interacciones de K factores
CK
M CABC...K
ABC. . . K SCABC. . . K 1 MCABC. . . K FABC...K = M CE
Error SCE 2K (n 1) MCE
Total SCT n2K 1
134

Aquı́, la suma de cuadrados totales se halla con la fórmula usual SCT = (n2K 1)SY2 y la suma
de cuadrados del error por diferencia. Además, siempre que tenga sentido, los indicadores F se
comparan con los valores de la tabla F de Fisher con los grados de libertad correspondientes a las
medias cuadráticas de las cuales F es su cociente.

4.4.1. Una sola réplica en el diseño 2K

Debido a las limitaciones naturales de dinero, tiempo, equipos y otros, el número de réplicas que
pueden efectuarse puede ser restringido. Es frecuente que en muchos experimentos sólo se pueda
efectuar una réplica de Y por cada combinación de los K tratamientos a menos, claro esta, que se
deseen omitir algunos factores originales. Con una sola réplica no es posible calcular una estimación
del error. Una aproximación al análisis de un factorial no replicado consiste en suponer que ciertas
interacciones de orden superior son despreciables y que por tanto sus cuadrados medios pueden
combinarse para la estimación del error. Esta es una aplicación al principio de dispersividad de
efectos; esto es, la mayorı́a de los sistemas son dominados en general por algunos de los efectos
principales e interaciones de bajo orden y la mayorı́a de las interacciones de orden superior son
despreciables.
Aún con un diseño no replicado, la cantidad de datos a tomarse en un diseño 2K pueden ser todavı́a
no manejable. En estos casos se han creado una serie de técnicas avanzadas de fraccionamiento y
bloqueo con las cuales un investigador puede analizar efectos principales e interacciones de bajo
orden a costo de sacrificar, o más técnicamente confundir, interacciones de ordenes superiores. Estas
técnicas, que constituyen la base de los métodos modernaos de control de calidad fuera de lı́nea,
pueden consultarse en [4] ó [5].

4.5. Ejercicios

1.- Un campus universitario tiene cuatro facultades. Se quiere estudiar la variable tiempo en minutos
que tarda un alumno en hacer una consulta en la base de datos de la biblioteca de su facultad. Para
ello se ha recogido una muestra aleatoria cuyos resultados son los de la tabla adjunta. Analizar estos
datos y estudiar inferencialmente la influencia del factor facultad en la variable de interés.

Arquitectura 48, 31, 31, 36, 39, 37, 29, 24, 38, 41
Facultad Ingenierı́a 24,16, 22, 10, 25, 11, 18, 6, 24, 30, 24, 15
Derecho 37, 40, 51, 49, 36, 24, 35, 26, 43, 40, 35, 33, 39, 55, 40
Humanidades 19, 26, 31, 13, 12, 16, 30, 13, 21, 26, 24, 12, 21
ESTADISTICA APLICADA Luis Valdivieso 135

2.- La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la
empresa por debe y haber, y el apalancamiento financiero al porcentaje de activos financiados por
deuda. En un estudio se afirma que el apalancamiento financiero puede utilizarse para aumentar las
tasas de rendimiento sobre la inversión; es decir que, los accionistas puedan recibir rendimientos más
altos con la misma inversión gracias a su uso. Los siguientes datos muestran las tasas de rendimientos
utilizando tres diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de
20 empresas seleccionadas al azar. A un nivel de significación de ↵ = 0.05:

Control 4.6 2 6.8 4.2 1.6


Bajo 2 7.4 1.8 3.2 4
Apalancamiento Medio 7 4.5 11.6 6 6.8
Alto 7.9 6.8 5.8 9.2 11

a) ¿ Existen diferencias en las tasas medias de rendimiento bajo los 4 niveles de apalancamiento ?
b) ¿ Se puede decir que las tasas medias de rendimiento en los niveles bajo medio y alto son más
altas que las del nivel de control ? Use, de ser factible, la prueba de rangos de Duncan.

3.- Se realizó un estudio de tránsito sobre los retrasos en las intersecciones con semáforos en las calles
de una ciudad. Se usaron 3 tipos de semáforos: 1) programado, 2) semiactivado y 3) activado. Se
usaron 5 intersecciones para cada tipo de semáforo. La medida de retraso fué el promedio de tiempo
que cada vehı́culo permanece detenido en cada intersección (segundos/vehı́culo). Los datos son:

Programado 36.6 39.2 30.4 37.1 34.1


Tipo de Semáforo Semiactivado 17.5 20.6 18.7 25.7 22.0
Activado 15.0 10.4 18.9 10.5 15.2
a) Defina claramente la variable dependiente y los parámetros de un modelo lineal para este problema.
Estime e interprete el efecto de utilizarse un semáforo activado en el valor medio de la variable
dependiente.
b) A un nivel de significación de ↵ = 0.05, ¿ podrı́a decirse de que si existen diferencias entre las
medias de retraso para los tipos de semáforo ?
c) Mediante el método de Bonferroni, ¿ podrı́a decirse con un nivel de confianza de al menos 95 %
que existe algún tipo de semáforo que ocasione una media de retraso menor al resto ?
d) Aplique, de ser factible, la prueba de rangos de Duncan a un nivel de significación de ↵ = 0.05. ¿
Difieren estos resultados de los obtenidos en c) ? Comente sus resultados.

4.- Si se desean comparar las medias de dos poblaciones normales independientes, ¿ será el análisis
de varianza en este contexto, equivalente a la prueba de comparación de medias vista anteriormente?
Analice esto empı́ricamente aplicándolo al problema 3 con sólo los tipos de semáforo Programado y
Semiactivado. ¿ Es esto en general cierto ?
136

5.- Con la esperanza de atraer más usuarios, una compañı́a de transportes urbano planea ofrecer
servicios de autobuses a partir de una terminal suburbana hacia el centro de la ciudad. Estos auto-
buses deben reducir el tiempo de traslado. La municipalidad decide realizar un estudio del efecto de
4 diferentes proyectos ( tales como un carril especial para los autobuses y una señalización secuencial
del tráfico) sobre el tiempo de traslado de los autobuses. Se miden los tiempos (en minutos) durante
varios dı́as de la semana durante un viaje, a la hora de mayor afluencia en la mañana, cuando cada
proyecto esta en operación. Los resultados se muestran en la tabla siguiente:

1 27 25 29 26
Proyecto 2 25 28 30 27 24
3 34 29 32 31 36
4 30 33 31

a) Existe evidencia de una diferencia en los tiempos medios de traslado para los 4 proyectos ?
b) ¿ En cuanto estima Ud. el efecto del tercer proyecto en el tiempo de traslado ?
c) Realice la prueba de rangos de Duncan a nivel ↵ = 0.05, para decidir cuál seria a su consideración
el o los mejores proyectos. Haga lo mismo utilizando la desigualdad de Bonferroni.

6.- Una compañı́a textil utiliza 3 telares. Se desea que los telares sean homogéneos con el objeto
de producir telas de resistencia uniforme. El ingeniero de procesos piensa que, puede existir una
variación significativa de la resistencia entre los distintos telares. Para ello realiza un experimento y
obtiene los siguientes datos:

Observaciones

1 98 97 99 96
Telar 2 91 90 93 92
3 96 95 97 95

a) Escriba el modelo adecuado para analizar el experimento y pruebe si existe diferencia en la


resistencia de las telas producidas entre los telares. Use ↵ = 0.05.
b) ¿ Se podrı́a decir que el promedio de las resistencias de las telas que producen los dos primeros
telares es igual a la resistencia promedio del tercer telar ? Use ↵ = 0.05.

7.- ¿ Cómo afecta el tiempo flexible a la satisfacción de un trabajador por su empleo ?. En un estudio
para este fin se seleccionaron al azar un grupo de trabajadores a 3 tipos de horario de trabajo. Estos
fueron evaluados 4 meses, al término de los cuales se obtuvieron los datos de satisfacción:
ESTADISTICA APLICADA Luis Valdivieso 137

Grupo
Tiempo Flexible Entrada Alternada Entrada Fija
Tamaño de la muestra 27 59 24
Media muestral 35.22 31.05 28.71
Desviación estándar muestral 10.22 7.22 9.28

Usando un nivel de significación de ↵ = 0.05:


a) ¿ Existen diferencias entre las calificaciones promedios de satisfacción para los tres grupos ?
b) Determine un intervalo de confianza del 98 % para la diferencia entre las calificaciones medias de
satisfacción por el trabajo entre trabajadores con tiempo flexible y horario fijo.

8.- Un ingeniero en electrónica está interesado en el efecto sobre la conductividad de una válvula
electrónica que tienen cinco tipos diferentes de recubrimiento para los tubos de rayos catódicos
utilizados en un dispositivo de visualización de un sistema de telecomunicaciones. Se obtienen los
datos siguientes sobre la conductividad:

Conductividad

1 143 141 150 146


2 152 149 137 143
Tipo de recubrimiento 3 134 133 132 127
4 129 127 132 129
5 147 148 144 142

a) Defina la variable dependiente y el factor de interés. Estime e interprete la diferencia media de


conductividad al usar el recubrimiento tipo 2 y el tipo 3.
b) ¿ Existe alguna diferencia en la conductividad debida al tipo de recubrimiento ? Utilice ↵ = 0.01.
c) Utilice la prueba de rangos múltiples de Duncan para analizar las 5 medias de los tipos de
recubrimiento. Utilice ↵ = 0.01.
d) Considere el experimento descrito y suponga que antes de realizarlo, se le pide averiguar si se
produce mejores resultados en la conductividad media al utilizar una combinación en partes iguales
de los recubrimientos tipo 1 y 2 versus los tipos 3, 4 y 5. Si se utiliza ↵ = 0.01, ¿ qué conclusiones
pueden obtenerse ?
e) Si los 5 tipos de recubrimientos se hubieran elegido al azar entre una gran variedad, ¿ cuál hubiera
sido su conclusión ?

9.- En un estudio de Marketing se desea comparar la calidad del servicio de los 4 supermercados A, B,
C y D de una ciudad. Los supermercados A y C pertenecen a un grupo de inversiones I; mientras que
los supermercados B y D a otro gran grupo de inversionistas II. Con este fin se seleccionaron al azar
138

a 20 sujetos y se les pidió su opinión sobre uno de los 4 supermercados en un orden completamente
aleatorio. Los resultados en una escala de opinión de 0 a 100 se muestran en la tabla siguiente:

A 40 45 50 58 42
Supermercado B 59 70 61 63 69
C 60 52 49 56 55
D 54 52 66 60 68

a) ¿ Se podrı́a asegurar, a un nivel de significación de ↵ = 0.05, que la calidad de servicio difiere


entre los 4 supermercados ?
b) Antes del estudio se pensaba que los supermercados del grupo II brindaban un mejor servicio que
los supermercados del grupo I, ¿ muestran los datos que esto es cierto ? Use un nivel de significación
de ↵ = 0.05.
c) Un objetivo del estudio era estimar con una confianza del 95 % las diferencias entre las calidades
medias de servicios de los supermercados del grupo I a través de las diferencias entre sus medias
muestrales respectivas. Si era la intención de que este proceso tuviera un error de estimación no
mayor a los 5 puntos, ¿ fué adecuado el número de sujetos entrevistados por cada supermercado ?

10.- Juan y Pepe estan en discusión acerca de la metodologı́a a emplearse en comparar el volumen de
ventas promedio diarias (en dólares) de 4 sucursales de una cadena de comida rápida. Ambos tienen
tiempo solo los martes y fines de semana para registrar estos volumenes. Juan ha decidido escoger
una sucursal en cada dia durante todo un mes, encontrándo las siguientes volumenes de ventas para
cada sucursal: En la sucursal 1 para los 5 martes del mes: 200, 310, 275, 228, 290; en la sucursal 2
para los 4 Viernes del mes: 460, 490, 420, 508; en la sucursal 3 para los 4 Sábados del mes: 500, 510,
475, 600; y en la sucursal 4 para los 5 Domingos del mes: 350, 340, 425, 328, 495.
De otro lado, Pepe utilizó un diseño de bloques encontrando los siguientes volúmenes:

DIA
Martes Viernes Sabado Domingo
300 2 400 1 500 3 340 4
280 3 410 4 520 1 320 2
320 1 415 2 580 4 360 3
300 4 408 3 560 2 350 1

en donde se anota al costado derecho en negrita la sucursal de donde se obtuvo la información.


a) A un nivel ↵ = 0.05, ¿ muestran sus datos a Juan y a Pepe que existen diferencias significativas
en los volumenes de ventas promedios de las 4 sucursales ?
b) ¿ Cuál de los dos tiene para Ud. razón ? Justifique.
ESTADISTICA APLICADA Luis Valdivieso 139

11.- Se les pidió a 4 agentes inmobiliarios que dieran cada uno la valoración de 6 casas situadas
en un vecindario y los datos se recopilaron usando un diseño de bloques. Las apreciaciones fueron
realizadas en miles de dólares, obteniéndose los resultados de la siguiente tabla:

Fuente de Variación Suma de Cuadrados


Agente 1,019.667
Casa 691.500
Error 440.833

a) Contrastar la hipóótesis nula de que la valoración media para los 4 agentes es la misma. Utilice
↵ = 0.01.
b) Si, en base a la muestra, las estimaciones de las valoraciones medias de los agentes 2 y 4 son
respectivamente 90.1667 y 81.3333, ¿ se puede concluir que las valoraciones medias de los agentes 2
y 4 son iguales ? Utilice ↵ = 0.05.
c) Un investigador que no sabı́a cómo se recolectaron los datos consideró al modelo como de una vı́a,

c1) ¿ variarán sus conclusiones en el inciso a)?

c2) ¿ el resultado del inciso b) se modificará ? Explique porqué.

12.- Se realizó, a un nivel de ↵ = 0.05, un estudio de movimientos para determinar el mejor de tres
métodos de montar un mecanismo. Para esto se diseño un experimento de un factor por bloques
aleatorios seleccionando 5 operarios con supuestamente la misma velocidad. El número de montajes
terminados diarios por cada operario y con cada método se dan en la tabla siguiente:

Operarios

1 2 3 4 5
1 3 4 3 5 4
Método 2 9 8 7 9 6
3 5 6 8 7 9

a) ¿ Se puede concluir que los tres métodos de montaje son significativamente diferentes ?
b) ¿ Fue correcto asumir que los operarios tenı́an en promedio la misma velocidad ?
c) Realice, de ser factible, una prueba de rangos de Duncan e indique explı́citamente las conclusiones
que sacarı́a en esta prueba. Haga lo mismo utilizando la desigualdad de Bonferroni.
d) ¿ Porque cree usted que la aleatorización del método de montaje a cada operario es importante
en esta experimentación ?

13.- En un experimento se comparan cuatro mezclas diferentes de las componentes de un propelente


para cohetes; las mezclas contienen proporciones distintas de carburante, oxidante, combustible y
140

sustancias aglutinantes. Para comparar las mezclas , se preparan cinco muestras diferentes de prope-
lente con cada una de ellas. Después, a cada uno de los 5 investigadores se le asigna aleatoriamente
una muestra de cada una de las cuatro mezclas y se le pide que midan el empuje del propelente. Los
datos son los siguientes:

Investigador

Mezcla 1 2 3 4 5
1 2340 2355 2362 2350 2348
2 2658 2650 2665 2640 2653
3 2449 2458 2432 2437 2445
4 2403 2410 2418 2397 2405

a) A un nivel de significación de ↵ = 0.05, existen diferencias significativas en el empuje medio del


propelente bajo estas 4 mezclas ?. ¿ Pudiera decirse que los investigadores podrı́an haber afectado
el resultado en la comparación del empuje del propelente bajo las 4 mezclas ?
b) A un nivel de significación de ↵ = 0.05, use la pruebas de rangos de Duncan para decidir sobre la
mejor mezcla.

14.- Se hace una evaluación de la adhesión por difusión de componentes de zircaloy. El principal
objeto es determinar cuál de los tres elementos, nı́quel, hierro o cobre, es el mejor adhesivo. Para ello
se reportó en el informe del experimento que se pegaron varias componentes de zircaloy con cada
uno de los adhesivos y que como existı́a mucha variación en los componentes maquinados de zircaloy
que procedı́an de lingotes diferentes, se usó un diseño de bloques completamente aleatorizados para
agrupar los lingotes en bloques. El informe reporta también la siguiente información de la presión
necesaria en miles de libras por pulgada cuadrada que se necesita para separar las partes:

Lingote

1 2 3 4 5 6 7
Nı́quel 67.0 67.5 76.0 72.7 73.1 65.8 75.6
Adhesivo Hierro 71.9 68.8 82.6 78.1 74.2 70.8 84.9
Cobre 72.2 66.4 74.5 67.3 73.2 68.7 69.0

a) Indique de manera explı́cita cómo cree usted que debió de diseñarse la recolección de estos datos
para este estudio comparativo.
b) ¿ Existe evidencia de una diferencia en la presión necesaria para separar las partes con respecto
a los tres agentes adhesivos ? Use ↵ = 0.05.
c) Aplique, de tener sentido, el método de Bonferroni, e interprete las conclusiones que obtenga. Use
↵ = 0.05.
ESTADISTICA APLICADA Luis Valdivieso 141

15.- Una compañı́a de servicios informáticos dispone de tres bases de datos a las que pueden acceder
sus clientes. La compañı́a dispone de cuatro operadores los cuales se encargan de una sola base cada
dı́a. Se desea hacer un estudio para determinar si la base de datos es un factor que explica el tiempo
que demoran los clientes en acceder y verificando al mismo tiempo si se puede considerar al operador
como una causa adicional de variación en el tiempo de acceso. Para este fin se dispone de la siguiente
información correspondiente a los tiempos promedios de acceso de pedidos registrados bajo un diseño
de bloques completamente aleatorizado :

Base de Operador Operador Operador Operador


Totales
datos 1 2 3 4
1 4.2 4.5 4.7 4.5 17.9
2 8.4 8.7 8.1 8.3 33.5
3 4.8 5.0 5.2 5.1 20.1
Totales 17.4 18.2 18.0 17.9 71.5

a) Describa la ecuación del modelo subyacente y las hipótesis estadı́sticas que se deben contrastar.
Luego, utilizando un nivel de significación del 5 % y determine cuáles son las conclusiones.
b) Usando un nivel de significación global del 5 % ordenar las bases de datos de acuerdo a su
correspondiente tiempo promedio de acceso. Utilce para ello la prueba de rangos de Duncan y la
desigualdad de Bonferroni indicando, si existiera, la diferencias en los resultados que proveen los dos
métodos.

16.- Una agencia estatal para el medio ambiente prueba dos métodos diferentes para quemar carbón
bituminoso para generar electricidad, en conexión con 4 purificadores diferentes que han sido di-
señados para reducir la contaminación del aire. El interés primordial es la emisión de partı́culas. Se
llevan a cabo cuatro ensayos con cada purificador combinándolos con cada método de combustión.
La emisión de partı́culas se mide en cada ensayo. De los datos resultantes se obtuvieron los resultados
descriptivos siguientes:

Método Purificador Número de datos Media muestral de emisión


A 1 4 16.650
A 2 4 12.500
A 3 4 18.450
A 4 4 20.325
B 1 4 19.900
B 2 4 24.200
B 3 4 12.350
B 4 4 13.000
142

junto con la tabla ANOVA:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas


Método 1.16281250 1 1.16281250
Purificador 48.0309375 3 16.0103125
Interacción (Método ⇥ Purificador) 475.4734375 3 158.491146
Error 240.9768 24 10.0407
Total 765.6439875 31

a) Haga un gráfico de lı́neas e indique, a nivel descriptivo, si es que se podrı́a suponer o no interacción
entre los dos factores considerados.
b) ¿ Existe interacción significativa entre los factores considerados ? Use ↵ = 0.05
c) Mediante una prueba de rangos de Duncan a un nivel de significación de ↵ = 0.05, determine, de
ser factible, el tipo de purificador adecuado para cada método de quemado.
d) Aplique, de ser factible, la prueba de rangos de Duncan a las combinaciones de método y purificador
¿ Qué concluye de este análisis ? Use ↵ = 0.05.

17.- Se realiza un experimento para estudiar la influencia que tienen la temperatura de operación y
tres tipos de vidrio sobre la luminosidad producida por un tubo de osciloscopio. Se obtuvieron los
siguientes datos:

Temperatura

100 125 150


580 1,090 1,392
1 568 1,087 1,380
570 1,085 1,386
550 1,070 1,328
Tipo de vidrio 2 530 1,035 1,312
579 1,000 1,299
546 1,045 867
3 575 1,053 904
599 1,066 889

a) ¿ Existe alguna interacción entre los factores ? ¿ Qué es lo que podrı́a decir del efecto de la
temperatura y el tipo de vidrio en la luminosidad ? Utilice ↵ = 0.05.
b) ¿ A qué temperatura deberá operar este proceso para obtener tubos con una mayor luminosidad
? Utilice ↵ = 0.05.
ESTADISTICA APLICADA Luis Valdivieso 143

18.- Se realizó un experimento para comparar el efecto de 4 diferentes productos quı́micos A, B, C y


D en producir resistencia al agua en textiles. Se cortó en cuatro una tira del material, seleccionada
aleatoriamente de un rollo, y se asignaron aleatoriamente las piezas para ser tratadas con uno de los
productos quı́micoa A,B,C o D. Se repitió el proceso tres veces para producir ası́ un diseño de bloques
completamente aleatorizados. El diseño, con mediciones de resistencia a la humedad, es como se ve
en la tabla siguiente (lecturas bajas indican una baja penetración de la humedad):

Bloques( Muestras de los rollos)

1 2 3
C D B
9.9 13.4 12.7
A B D
10.1 12.9 12.9
B A C
11.4 12.2 11.4
D C A
12.1 12.3 11.9

a) ¿ Proporcionan los datos anteriores suficiente evidencia para indicar una diferencia en la pene-
tración media de la humedad para telas tratadas con los cuatro productos quı́micos ? Use ↵ =
0.05.
b) Un investigador opina que fué innecesario el uso de un diseño de bloques aleatorizado y que
simplemente se pudiesen haber comparado el efecto de los productos quı́micos sobre la resistencia
con un análisis de varianza a una via. ¿ Estarı́a usted de acuerdo con este investigador ? Use un nivel
de significación de ↵ = 0.05.

19.- Un factor importante para determinar qué lugar es más adecuado para un negocio de ventas al
menudeo es la intensidad de tránsito qué pasa por el lugar cada dı́a hábil. Se colocaron contadores en
4 lugares distintos los 5 dı́as de la semana , y se anotó el número de vehı́culos que pasaron por cada
lugar. Los datos, que se obtuvieron a través de un diseño de bloques completamente aleatorizado,
son los siguientes:

Dı́a
Lunes Martes Miércoles Jueves Viernes
I 453 500 392 441 427
Lugar II 482 605 400 450 431
III 444 505 383 429 440
IV 395 490 390 405 430
144

a) De alguna razón por la cual cree usted que se halla tenido que utilizar un diseño de bloques
completamente aleatorizado.
b) ¿ Se podrı́a concluir con una probabilidad de equivocarse del 5 % que existen diferencias en el
número medio de vehı́culos por dı́a en los cuatro lugares ?
c) A un nivel de significación de ↵ = 0.05, podrı́a usted asegurar algún lugar especı́fico adecuado
para un negocio de venta ¿ Porqué ? Use la prueba de rangos de Duncan.

20.- Se desea verificar si las pérdidas, en porcentaje, ocasionados en la operación de baño electrolı́tico
de joyas de oro dependen del tipo de oro usado (en kilates) y de la cantidad empleada en el trata-
miento. Para el experimento se utilizó oro de 24, 22, 18 y 14 kilates, siendo éstos números medidas
nominales. Por lo tanto los niveles de este factor son cualitativos. Además, se escogieron tres niveles
de cantidad tratada: 50, 100 y 150 gramos. Otros factores como el tiempo del baño, solución elec-
trolı́tica, balanza, equipo y operador se mantuvieron constantes durante el experimento. La tabla
siguiente muestra los datos sobre los porcentajes de pérdida.

Cantidad usada en el Baño


Tipo de Oro
50 100 150
24 0.8 ,1.0 ,1.2 ,0.8 0.8 ,1.3 , 1.1 , 1.0 0.5 , 0.9 , 0.7 , 1.1
22 1.8 , 1.6 , 1.6 , 2.0 1.7 , 1.3 , 1.3 ,1.4 1.1 , 1.1 , 0.9 , 1.0
18 2.2 , 2.0 , 2.2 , 1.4 2.2 , 1.8 , 2.0 , 1.9 1.5 , 1.4 , 1.2 , 1.3
14 15.2 , 4.8 , 10.0 , 4.0 2.0 , 3.6 , 4.2 , 2.6 2.2 , 4.4 ,5.8 , 3.2

A un nivel de significación de ↵ = 0.05 y suponiéndose que se tenia solo interés en las tres cantidades
usadas.
a) ¿ Existe interacción significativa entre los factores considerados en el experimento ? Haga un
gráfico para apreciar esto.
b) ¿ Qué podrı́a decir de la influencia del tipo de Oro y la cantidad usada en los porcentajes medios
de pérdidas ?
c) Si tuviera que estimar el efecto en la pérdida de utilizar oro de 22 dilates, ¿ en cuanto estimarı́a
este efecto? ¿ cuál serı́a su interpretación?
d) Suponiendo se decida utilizar una cantidad de 50 gramos en los baños electrolı́ticos, haga una
prueba de rangos de Duncan para determinar que tipo ( o tipos) de Oro es el que produce las mayores
pérdidas medias.
e) Si las tres cantidades hubiesen sido escogidas al azar, ¿ qué es lo que responderı́a en b) ?
ESTADISTICA APLICADA Luis Valdivieso 145

21.- Un constructor de casas con fines especulativos, utiliza 3 diseños posibles y asigna cada casa a la
supervisión de uno de 4 ingenieros. Al observar una variación de la utilidad por casa, el constructor
decide investigar el efecto de los factores ”diseño de casa” y ”supervisor” en la utilidad por casa.
El constructor utilizó cada ingeniero como supervisor de cada diseño y realizó 3 casas por cada
combinación ingeniero-diseño. Los datos (en utilidades en miles de dólares por casa) fueron:

Supervisor
Diseño A1 A2 A3 A4
12.8 9.2 11.6 8.7
B1 9.4 7.8 12.9 7.4
10.3 10.9 9.6 8.5
9.2 11.4 8.7 10.3
B2 7.4 9.6 7.5 10.9
8.6 8.3 9.0 11.7
13.7 10.7 10.1 7.3
B3 12.0 10.2 8.7 8.6
14.6 11.1 9.1 6.9
a) Realize un diagrama de lı́neas, que le permita analizar gráficamente la presencia de interacción.
b) A un nivel de significación de ↵ = 0.05, ¿ existe interacción significativa entre los factores de
diseño y de supervisión?. ¿ Qué puede decir del efecto de los factores de diseño y de supervisor en
las utilidades ?

22.- Se efectúa un experimento para investigar el alabeo de placas de cobre. Los dos factores estudia-
dos son la temperatura y el contenido de cobre de las placas. La variable de respuesta es la magnitud
del alabeo. Los datos son los siguientes:

Contenido de cobre

40 60 80 100
50 17, 20 16, 21 24, 22 28, 27
Temperatura 75 12, 9 18, 13 17, 12 27, 31
(oC) 100 16, 12 18, 21 25, 23 30, 23
125 21, 17 23, 21 23, 22 29, 31

a) ¿ Qué es lo que usted podrı́a decir del efecto de estos factores sobre la magnitud del alabeo ?. ¿
Existe alguna interacción entre los factores ? Utilice ↵ = 0.05.
b) Si lo deseable es que el alabeo sea bajo, ¿ qué contenido de cobre es necesario especificar en
ambientes donde el cobre está a temperaturas de 75 y 125 grados centı́grados ? Realice la prueba de
rangos de Duncan a un nivel de ↵ = 0.05, para justificar su respuesta.
146

23.- Con el fin de estudiar los efectos que en el tiempo de sobrevivencia (en horas) de animales de
laboratorio tienen 3 drogas A1, A2 y A3 y 4 tratamientos B1, B2, B3 y B4, un laboratorio realizó un
experimento que consistió en seleccionar 48 animales con las mismas caracterı́sticas a los cuales se
les inoculó un agente patógeno. Luego, se dividieron los animales en grupos de 4 y a cada animal de
un mismo grupo se le administró una de las tres drogas y uno de los 4 tratamientos, registrándose
finalmente los siguientes tiempos de sobrevivencia:

Tratamiento

B1 B2 B3 B4
3.1 8.2 4.3 4.5
A1 4.5 11.0 4.5 7.1
4.6 8.8 6.3 6.6
4.3 7.2 7.6 6.2
3.6 9.2 4.4 5.6
Droga A2 2.9 6.1 3.5 10.2
4.0 4.9 3.1 7.1
2.3 12.4 4.0 3.8
2.2 3.0 2.3 3.0
A3 2.1 3.7 2.5 3.6
1.8 3.8 2.4 3.1
2.3 2.9 2.2 3.3

Al realizar un análisis exploratorio de estos datos se encontró que no era posible asumir una varianza
constante en Y para los distintos tratamientos, por lo cual al consultársele a un estadı́stico, él sugi-
1
rió tomar como variable dependiente en este experimento a Y , donde Y es el tiempo de sobrevivencia.
Algunos cálculos con la variable transformada son los siguientes:

SC(Droga) = 0.349, SC(Tratamiento) = 0.204, SC(Interacción) = 0.01571 y SCT = 0.655.

Siguiendo la recomendación de estadı́stico:


a) Realice un gráfico de lı́neas y explore si podrı́a pensarse que existan aquı́ efectos de interacción.
Luego, a un nivel de significación del 5 %, decida si se pueda hablar o no de interacción en este
modelo.
b) El principal objetivo del estudio era determinar la existencia de una mejor droga y un mejor
tratamiento (en el sentido de prolongar los tiempos de vida de los animales). En base a los datos
encontrados, ¿ podrı́a usted garantizar que tales existen y decir cuááles son ? Use un nivel de
significación del 5 %.
ESTADISTICA APLICADA Luis Valdivieso 147

24.- Con el fin de precisar las condiciones óptimas de un baño de niquel, son estudiados los efectos
de la concentración de sulfona y la temperatura en el poder de reflexión de un metal niquelado. Los
datos obtenidos de poder de reflexión en este experimento factorial fueron:

Temperatura ( grados F)

75 100 125 150 175


Concentración (gramos por litro) 5 35, 39, 36 31, 37, 36 30, 31, 33 28, 20, 23 19,18,22
10 38, 46, 41 36, 44, 39 39, 32, 38 35, 47, 40 30, 38, 31

Asumiendo que los factores en estudio son fijos y usando un nivel de significación de ↵ = 0.01
a) ¿ Puede concluirse que no existe uniformidad en los efectos de los tratamientos de los dos factores
en estudio sobre el poder de reflexión ?
b) Use la prueba de Duncan y determine para cada concentración la condición de temperatura
óptima.

25.- Un Ingeniero Industrial que trabaja en una embotelladora está interesado en el efecto de dos
tipos de botellas de 32 onzas sobre el tiempo de reparto de cajas de 12 botellas de este producto. Los
dos tipos de botellas son de plástico y de vidrio. Con el fin de analizar esto, él utiliza dos repartidores
para que realicen la tarea que consiste en mover 40 cajas del producto a una distancia de 50 pies
sobre un carrito repartidor, y acomodarlos. Se realizaron 4 réplicas de un diseño factorial 22 ; y los
tiempos que se observaron fueron los que a continuación se detallan:

Operario

1 2
Tipo de Vidrio 5.12, 4.89, 4.98, 5.00 6.65, 6.24, 5.49, 5.55
botella Plástico 4.95, 4.27, 4.43, 4.25 5.28, 4.75, 4.71, 4.91

A un nivel de significación de ↵ = 0.05,


a) ¿ Es posible hablar aquı́ de una interacción significativa entre los factores analizados? Haga primero
un gráfico que le permita explorar este asunto.
b) ¿ Qué hay de los efectos principales ?
148

26.- Se realizó un diseño 24 replicado tres veces para estudiar cómo influyen cuatro factores en la
velocidad de rebobinado de una cinta de cassette. Estos factores son: A = calidad de la cinta; B =
alimentación (red (+), pilas(-)); C = posición del equipo (vertical (+), horizontal (-)) y D = tipo de
equipo (con radio(+), sin radio (-)). Los resultados fueron los siguientes:

Velocidad

A B C D
+ + + + 8.7, 4.9, 8.9
+ + + - 8.3, 8.6, 8.3
+ + - + 12.9, 12.6, 13.5
+ + - - 12.8, 12.4 , 13.5
+ - + + 10.8 , 10.8 , 10.5
+ - + - 10.8, 10.3 , 10.1
+ - - + 14.3, 14.4 , 14.8
+ - - - 12.8, 13.7, 13.1
- + + + 10.7, 11.2, 10.5
- + + - 9, 8.6 , 8.5
- + - + 12.7 , 14 , 13.5
- + - - 14.3 , 15.3, 15.4
- - + + 10.6 , 11 , 10.5
- - + - 10.6, 11, 10.8
- - - + 15.2, 14.2 , 15
- - - - 15.1, 15.7, 16

¿ Qué conclusiones saca de este estudio a un nivel de significación de ↵ = 0.01 ?


Capı́tulo 5

ANÁLISIS DE REGRESIÓN

5.1. El modelo de regresión lineal simple

Consideremos una v.a. continua Y , que la llamaremos dependiente, y una variable X que la lla-
maremos independiente o predictora. El modelo de regresión lineal simple plantea que Y se relaciona
con X según:
Y = 0 + 1X + ✏, (5.1)

donde ✏ es un error aleatorio que usualmente se asume tiene distribución normal con media 0 y
varianza 2.

Antes de analizar (5.1), es importante distinguir la naturaleza del modelo. El modelo se denomina
de efectos fijos cuando X es una variable no aleatoria y controlada por el investigador. En este caso
el investigador seleccionará valores prefijados x1 , x2 , . . . , xn de X y observará los correspondientes
valores que toma Y ; por decir, y1 , y2 . . . , yn . De otro lado el modelo se denomina de efectos aleatorios,
cuando tanto X como Y son variables aleatorias. En este caso el investigador tomará al azar n
“sujetos” y observará conjuntamente los correspondientes valores que X e Y toman en estos “sujetos”;
por decir: (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).
De (5.1) obtenemos que:
yx = E[Y | X = x] = 0 + 1x

El análisis de regresión lineal simple busca una estimación ŷx de yx ; vale decir, una estimación del
valor medio de Y para un x dado. Notese que para esto requerimos tan solo estimar los parámetros
0 y 1.

Supongamos que ahora al graficar los pares de datos (x1 , Y1 ), (x2 , Y2 ), . . . , (xn , Yn ) obtenidos por
el investigador 1 , obtenemos la nube de puntos o gráfico de dispersión siguiente:
1
Asumiremos en adelante, para simplicidad, un modelo de efectos fijos.

149
150

Claramente este gráfico da pie a pensar que (5.1) es un modelo válido para estos datos, pues los
puntos se encuentran más o menos alineados y cada Yi puede escribirse como:

Yi = 0 + 1 xi + ✏i , 8i = 1, 2, . . . , n ,

donde es natural asumir que los errores son independientes. El método de mı́nimos cuadrados consiste
en obtener las estimaciones de y
que minimizen las sumas de los cuadrados de todos los errores.
0 1

En otras palabras, los estimadores de mı́nimos cuadrados ˆ0 y ˆ1 vienen dados por la solución al
problema:
n
X n
X
mı́n ✏2i ⌘ mı́n (Yi 0 1 xi )
2
.
0, 1 0, 1
i=1 i=1
Vale decir por:
Pn Pn
(x x̄)(Yi Ȳ ) i=1 xi Yi nx̄Ȳ
ˆ0 = Ȳ ˆ1 x̄ y ˆ1 = Pn i
i=1
= .
i=1 (xi x̄)2 (n 1)Sx2
Esto nos provee de la estimación ŷx buscada, la cual se llama también la recta de mı́nimos cuadrados:

ŷx = ˆ0 + ˆ1 x

De las asunciones de normalidad e independencia de los errores, se desprenden las siguientes propie-
dades básicas:
2
Proposición 12 1) ŷx ⇠ N (yx , 2( 1 + Pn(x x̄) 2 )).
n i=1 (xi x̄)

Pn p
2) Si S✏2 = 1 ˆ0 ˆ1 xi )2 = n 1 2 ˆ2 S 2 ), a S✏ = S✏2 , se le denomina el
n 2 i=1 (Yi n 2 (SY 1 x
error estándar de estimación. Este error es una v.a. independiente de ŷx y se cumple que
(n 2)S✏2 2 (n
W = 2 ⇠ 2).

Con base en esta proposición, uno puede construir la variable pivote T = qZ ⇠ t(n 2),
W
n 2
ŷx yx
donde Z = r
(x x̄)2
⇠ N (0, 1) a fin de construir el siguiente intervalo de confianza al
1
+ Pn
n (x x̄)2
i=1 i
100(1 ↵) % para yx ; vale decir, para el valor esperado de Y dado un x dado:
ESTADISTICA APLICADA Luis Valdivieso 151

s s
1 (x x̄)2 1 (x x̄)2
[ŷx t1 ↵ (n-2)S✏ + Pn ŷx + t1 ↵ (n-2)S✏ + Pn ]
2 n i=1 (xi x̄)2 2 n i=1 (xi x̄)2
En algunas circunstancias, estimar el valor medio de Y para un x dado no es tan útil como
predecir el valor especı́fico que Y tomará para un x dado. En este caso, se puede contruir lo que se
denomina un intervalo de confianza al 100(1 ↵) % para la predicción de un valor particular de Y
para un x dado. Esta predicción, que la denotaremos por ŷ(x), puede escribirse simplemente como
ŷ(x) = ŷx + ✏, por lo que su intervalo de predicción resulta ser:
s s
1 (x x̄)2 1 (x x̄)2
[ŷx t1 ↵2 (n-2)S✏ 1 + + Pn 2
ŷx + t1 ↵2 (n-2)S✏ 1 + + Pn ]
n i=1 (xi x̄) n i=1 (xi x̄)2
Si graficamos los extremos de ambos intervalos como funciones de x, obtendremos las denomi-
nadas bandas de confianza. Estas bandas son claramente más anchas en la predicción que en la
estimación del valor medio de Y y ambas son más angostas (y por tanto dan mejores estimaciones
y/o predicciones) si x se encuentra más cerca de x̄. Esto nos provee de la siguiente moraleja: ¡ no
deben de hacerse estimaciones o predicciones de Y fuera del rango de valores de los datos de x !
Ejemplo: Un instituto del mar ha realizado un estudio acerca de la cantidad de peces que una flota
recolecta en función de la temperatura de las aguas. Ellos han obtenido en 9 dias, para temperaturas
medias fijas, los siguientes volumenes de recolección en cientos de toneladas métricas:
Volumen de recolección 100 95 80 75 60 55 52 48 40
Temperatura (en c) -2 -1 0 2 3 4 5 7 8
A la flota le interesarı́a saber si mañana su volumen de pesca será de por lo menos 52 toneladas
métricas a fin de que le sea rentable salir a la mar.
a) Haga su diagrama de dispersión y ajuste la recta de mı́nimos cuadrados.
b) Si el instituto del mar pronostica para mañana un temperatura media de 2.5 c, ¿ recomendarı́a
o no, con un nivel de confianza del 95 %, que la flota salga a la mar ? ¿ Porqué ?
Solución: a) El diagrama de dispersión siguiente muestra claramente una tendencia lineal inversa.
152

De los datos del problema, obtenemos: x̄ = 2.89 , Sx = 3.48, ȳ = 67.22 , Sy = 21.25,


P9
i=1 xi yi = 1,171 y la recta de mı́nimos cuadrados:

ŷx = 84.419725 5.952982x.

Esta nos estima el volumen medio de pesca para una temperatura dada x.
b) Si bien ŷ2.5 = 69.53727 TN; es decir, que el volumen medio de pesca para un dia con 2.5 c de
temperatura supera en la estimación fácilmente las 52 TN, no se puede garantizar que el volumen
de pesca para este dia especı́fico lo supere. En tal sentido para tomar la decisión, debemos hallar su
intervaloqde predicción al 95 %. De los datos obtenidos, tenemos que el error estándar de estimación
8(SY2 ( 1 Sx )2 )
es S✏ = 7 = 5.07104 y por tanto, el intervalo buscado es:
s s
1 (2.5 2.889)2 1 (2.5 2.889)2
[ŷ2.5 t0.975 (7)S✏ 1 + + , ŷ 2,5 + t 0 . 975 (7)S ✏ 1 + + ]
9 8(3.480)2 9 8(3.480)2
o
[56.88, 82.18575]

Dado que el intervalo supera el volumen de 52 toneladas mı́nimo requerido, si se recomendarı́a salir
a la mar. ¿ Qué hubiese usted concluido si es que el volumen mı́nimo requerido hubiese sido de 65
TN ? ⇤

5.2. El modelo de regresión lineal múltiple

En el modelo de regresión lineal múltiple se trata de expresar una v.a. dependiente Y como una
función de k variables independientes X1 , X2 , . . . , Xk , según:

Y = 0 + 1 X1 + 2 X2 + ... + k Xk +✏ ,

donde se asume que el error aleatorio ✏ tiene distribución normal de media 0 y varianza 2.

Al igual que antes, el modelo de regresión lineal múltiple puede ser de efectos fijos (si las Xj ’s
no son variables aleatorias y las prefija el investigador) aleatorios (si los Xj ’s son también variables
aleatorias que se observan en una muestra de ”sujetos”junto con Y ) o mixtos, que es una combinación
de los dos anteriores. Para simplificar asumiremos en adelante un modelo de efectos fijos y comenta-
remos, solo cuando existan diferencias, el caso del modelo aleatorio. Para estimar el valor medio de
Y dados los valores ~x = (x1 , . . . , xk ) de las variables independientes, vale decir para estimar:

y~x = E[Y | X1 = x1 , . . . , Xk = xk ] = 0 + 1 x1 + 2 x2 + ... + k xk ,

~ =
uno deberá observar el correspondiente valor de Y para n valores dados del vector X
(X1 , X2 , . . . , Xk ) (en un modelo aleatorio tanto los valores del vector como de Y se observan simul-
taneamente al tomarse una muestra aleatoria de ”sujetos”). El modelo en términos de esta muestra
ESTADISTICA APLICADA Luis Valdivieso 153

se escribe como:

yi = 0 + 1 xi1 + 2 xi2 + ... + k xik + ✏i , 8i = 1, 2, . . . , n

o en forma matricial como:


Yn⇥1 = Xn⇥(k+1) B(k+1)⇥1 + En⇥1 .

Podemos aplicar ahora el método de mı́nimos cuadrados a fin de estimar B. El estimador B̂ de


mı́nimos cuadrados viene dado por aquel vector de parámetros B que resuelve:
n
X
mı́n ✏2i = mı́n Et E = mı́n(Y XB)t (Y XB).
i=1

La solución de este problema nos conduce a resolver el siguiente sistema lineal de k + 1 ecuaciones
con k + 1 incognitas:
(Xt X)B̂ = Xt Y

o explı́citamente
B̂ = (Xt X) 1 Xt Y.

Luego, la estimación buscada del valor medio de Y para un ~x dado, al cual también llamaremos el
hiperplano de regresión, vienen dada por:

ŷ~x = ~x B̂ = ˆ0 + ˆ1 x1 + . . . + ˆk xk .

5.3. El ajuste de los datos al modelo

Tanto en el modelo de regresión lineal simple como en el múltiple hemos asumido hasta el momen-
to que los datos ajustan bien a tales modelos teóricos. Una manera de verificarse esto, en el modelo
de regresión lineal simple, es simplemente viendo si los puntos se encuentran mas o menos alineados o
no en el gráfico de dispersión. En el modelo múltiple, tal criterio tiene obviamente poco sentido por la
dimensionalidad inherente. Por esta razón necesitaremos contar con alguna herramienta cuantitativa
para medir un ajuste lineal. La idea para ubicar un indicador se basa en el ya consabido análisis de
varianza. No es difı́cil probar que la variabilidad total de la v.a. dependiente Y , SCT = (n 1)SY2 ,
se puede descomponer como:
n
X n
X n
X
(Yi Ȳ )2 = (Ŷi Ȳ )2 + (Yi Ŷi )2
i=1 i=1 i=1

Suma de cuadrados de Y = Suma de cuadrados de la regresión + Suma de cuadrados del error.


154

SCT = SCR + SCE, (5.2)

donde Ŷi = ˆ0 + ˆ1 xi1 + . . . + ˆk xik es la estimación del valor medio de Y para el i ésimo ~x dado.
Notese que de la descomposición última se tiene que:

SCR SCE
1= + .
SCT SCT
SCR
Luego R2 = SCT (2 [0, 1]) representa la proporción de la variabilidad total de Y que es explicada por
el modelo de regresión lineal múltiple. Mientras R2 ! 1, mejor será el ajuste de los datos al modelo.
R2 se denomina el coeficiente de determinación y una manera de obtenerlo es usando la siguiente
fórmula:
k
X
SCR = ˆj SjY ,
j=1
Pn 1 Pn
donde SjY = i=1 xij Yi nx̄j Ȳ ( con x̄j = n i=1 xij ) y SCT = (n 1)SY2 . Es importante destacar,
que R2 presenta el inconveniente de crecer con k. Por esta razón, y a la luz de comparar de manera
descriptiva dos o más modelos con desigual número de variables independientes, se aconseja utilizar
el coeficiente de determinación ajustado:

2 (1 R2 )(n 1)
RA =1 .
n k 1

Nota: En el caso de un modelo de regresión lineal simple, es común utilizar como medida del ajuste
el coeficiente de correlación de Pearson entre x e Y :
Pn
xi Yi nx̄Ȳ Sx
rxY = i=1 = ˆ1 .
(n 1)Sx SY SY

Este coeficiente, que sólo toma valores entre -1 y 1, nos indica un mejor ajuste lineal entre x e Y
mientras rxY se encuentre más cerca a estos extremos. El signo positivo o negativo de rxY indicará,
respectivamente, si la relación es inversa o directa. Puede probarse que en el modelo de regresión
lineal simple: R2 = rxY
2 .

Otro criterio práctico para medir el ajuste del modelo, lo constituye la variabilidad de los resi-
duales ei = Yi Ŷi . Este se mide, como en el caso del modelo simple, a través del error estándar de
estimación S✏ : v
u n r
u 1 X SCE
S✏ = t e2i = .
n k 1 n k 1
i=1

Mientras más pequeño sea S✏ , mejor ajuste tendran los datos al modelo.
Si bien R2 , RA
2 y S son indicadores descriptivos para medir el ajuste de los datos al modelo de

regresión lineal, ellos no nos proveen de una decisión definitiva en cuanto a que si el modelo es idóneo
o no para relacionar de manera lineal Y con las variables independientes del estudio.
ESTADISTICA APLICADA Luis Valdivieso 155

5.4. Contrastes de hipótesis en el modelo de regresión lineal

5.4.1. El contraste de adecuación del modelo

Se desea contrastar a nivel ↵:

H0 : 1 = 2 = ... = k = 0 vs H1 : 9j / j 6= 0.

Si rechazamos H0 , se concluirá que el modelo podrı́a ser útil para estimar el valor medio de Y , pues
algunas de las k variables independientes contribuyen con información significativa para ello. De
darse esto, es posible aún continuar con el análisis, entendiéndose que el contraste solo nos dice que
nuestro modelo es aceptable, pero no el mejor.
El contraste de hipótesis se basa en la descomposición (5.2), por lo que no es de extrañar se tenga
la siguiente tabla ANOVA

Fuente de variabilidad Suma de cuadrados Grados de libertad Medias cuadráticas


SCR M CR
Regresión SCR k M CR = k F0 = M CE
SCE
Error SCE n-k-1 M CE = n k 1
Total SCT n-1

y que se rechaze H0 si F0 > F1 ↵ (k, n k 1).

5.4.2. Contrastes sobre los parámetros individuales j ’s

Estas pruebas tratan de ver si una variable independiente xj contribuye o no con información
significativa en la estimación del valor medio de Y en presencia de las otras variables independientes.
El contraste se resume como sigue:

Hipótesis nula Hipótesis alternativa Región crı́tica


H1 : j >0 T0j > t1 ↵ (n k 1)
H0 : j =0 H1 : j <0 T0j < t1 ↵ (n k 1)
H1 : j 6= 0 |T0j | > t1 ↵
2
(n k 1)

ˆ
donde el estadı́stico T0j = p j tiene bajo H0 una distribución t de Student con n k 1
S✏ cj+1,j+1
grados de libertad y cj+1,j+1 es la entrada j + 1, j + 1 de la matriz ( Xt X ) 1 .
Si por ejemplo se rechaza H0 : j = 0 en favor de H1 : j 6= 0 podremos decir con una probabilidad
de equivocarnos de ↵ que la variable xj si contribuye con información significativa en la estimación
del valor medio de Y .
156

5.4.3. Contrastes sobre un grupo de variables independientes

En algunas situaciones será de interés contrastar si un grupo de variables independientes tienen


parámetros de regresión nulos o no. Concretamente estaremos interesados en contrastar a nivel ↵:

H0 : m+1 = m+2 = ... = k = 0 vs H1 : 9j 2 {m + 1, . . . , k} / j 6= 0, (5.3)

donde por simplificar hemos colocado que las variables de interés son las últimas del modelo, lo cual
obviamente es un caso particular y la prueba puede hacerse sobre cualquier grupo de k m variables.
El procedimiento para realizar el contraste es intuitivamente el siguiente. Primero ajustamos
el modelo reducido (sin las variables xm+1 , . . . , xk ) y calculamos la suma de cuadrados del error
SCER . Luego ajustamos el modelo completo (con las k variables independientes) y calculamos la
suma de cuadrados del error SCEC . Después comparamos SCER con SCEC calculando la diferencia
SCER SCEC . Si las variables xm+1 , . . . , xk contribuyen al modelo, SCEC será mucho más pequeño
que SCER y por tanto SCER SCEC será más grande. Cuanto más grande sea la diferencia, más
contundentes serán las pruebas de que el modelo completo produce mejores estimaciones de E[Y ]
que el modelo reducido y que por tanto H0 es falsa. Formalmente, se rechazará H0 en (5.3) a nivel
↵ si:
SCER SCEC
k m
R.C : F1 = SCEC
> F1 ↵ (k m, n k 1).
n k 1
Ejemplo: El rendimiento de una reacción quı́mica parece depender de la concentración de un cierto
reactivo y de la temperatura de operación. Para estudiar, esto se registraron, los siguientes rendi-
mientos a concentraciones y temperaturas dadas:
Y = Rendimiento 78 84 89 90 92 90 91 92 97 98
x = Concentración 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50
z = Temperatura 135 150 165 180 190 160 165 188 195 195
a) Ajuste los datos a un modelo de regresión múltiple y analice la correlación.
b) Realice el contraste de significación del modelo. Use ↵ = 0.05. ¿ Se podria decir que este modelo
es mejor que uno de regresión lineal simple con solo la temperatura como variable predictora ?
c) ¿ En cuánto estimarı́a el rendimiento medio de una reacción quı́mica en la cual se utiliza una
concentración de 0.78 a una temperatura de 177 grados ?
Solución: a) Matricialmente en cualquier modelo de regresión lineal multiple con dos variables in-
dependientes se tiene que la matriz de variables independientes y el vector columna de la variable
dependiente es:
0 1 0 1
1 x1 z1 Y1
B C B C
B1 x2 z2 C B Y2 C
B. .. .. C B . C
B
X = @ .. . . C e B C
Y = @ .. A
A
1 xn zn Yn
ESTADISTICA APLICADA Luis Valdivieso 157

Luego, el sistema (Xt X)B = Xt Y nos conduce al siguiente sistema de ecuaciones normales:
Pn Pn Pn
n 0 +
i=1 xi 1 + i=1 zi 2 = i=1 Yi
Pn Pn 2
P n Pn
i=1 xi 0 + i=1 xi 1 + i=1 xi zi 2 = i=1 xi Yi
Pn Pn Pn 2
Pn
i=1 zi 0 + i=1 xi zi 1 + i=1 zi 2 = i=1 zi Yi .

P10 P10 2 P10 P10 2


En nuestro caso: i=1 xi = 7.25, i=1 xi = 5.4625, i=1 zi = 1,723, i=1 zi = 300, 669,
P10 P10 2
i=1 Yi = 901 , i=1 Yi = 81, 483 y el sistema de ecuaciones normales queda:

10 0 + 7.25 1 + 1, 723 2 = 901


7.25 0 + 5.4625 1 + 1, 226.8 2 = 646.05
1, 723 0 + 1, 226.8 1 + 300, 669 2 = 156, 231.

La solución de este sistema nos provee de las estimaciones de mı́nimos cuadrados ˆ0 , ˆ1 y ˆ2 y el


hiperplano (en este caso un plano) de regresión :

ŷ(x,z) = 76.760212 18.118188x + 0.153659z.

Para medir el grado de ajuste de los datos a un modelo lineal, hallemos el coeficiente de de-
terminación y el error estándar de estimación. De los datos tenemos que la suma de cuadrados
Pn
totales SCT = 9SY2 = i=1 Yi
2 10Ȳ 2 = 302.8644 y la suma cuadrados de la regresión es
P P
SCR = ˆ1 ( ni=1 xi Yi 10x̄Ȳ ) + ˆ2 ( ni=1 zi Yi 10z̄ Ȳ ) = 281.92081. Por tanto R2 = SCR
SCT = 0.93074
q
SCT SCR
y el ajuste es muy bueno. Además S✏ = n 3 = 1.73119, lo cuál nos indica también al parecer
un muy buen ajuste lineal.
b) Para la significación del modelo, debemos contrastar a nivel ↵ = 0.05

H0 : 1 = 2 = 0 vs H1 : 9j 2 {1, 2} / j 6= 0.

Para esto la tabla ANOVA es:

Fuente de variabilidad Suma de cuadrados G. de libertad Medias cuadraticas F0


Regresion 281.92081 2 140.96041 47.03341
Error 20.9792 7 2.99703
Total 302.8644 9

Como F0 = 47.03341 > F0.95 (2, 7) = 4.74, se rechaza H0 y el modelo lineal dado es aceptable.
Para ver si el modelo de regresión múltiple es mejor que el lineal indicado, debemos probar que
la variable predictora x contribuya significativamente con información adicional para la estimación
del valor medio de Y . Es decir contrastar a nivel ↵ = 0.05:

H0 : 1 = 0 vs H1 : 1 6= 0.
158

Se rechazará H0 si
ˆ1
|T01 = p | > t0.975 (7) = 2.365,
S✏ c22
donde c22 es la entrada 2,2, de la matriz (Xt X) 1. Realizando los cálculos respectivos, obtenemos
que T01 = 2.854 y consecuentemente se rechaza H0 . Esto es, la concentración si contribuye con
información significativa en la predicción de Y y por tanto es mejor un modelo de regresión lineal
multiple que el simple propuesto.
c) Como el modelo múltiple es mejor, se nos pide

ŷ(0.78,177) = 76.760212 18.118188(0.78) + 0.153659(177) = 89.825668. ⇤

5.5. Intervalos de estimación y predicción

Al igual que en el caso del modelo de regresión lineal simple, se disponen para el modelo de
regresión lineal múltiple de intervalos de confianza al 100(1 ↵) % para estimar el valor medio de Y
y predecir un valor particular de Y para un ~x dado. Estos intervalos toman en el modelo múltiple
las formas siguientes:
Intervalo de confianza al 100(1 ↵) % para el valor medio de Y dado un ~x = (x1 , x2 , . . . , xk )t :
q q
[ ŷ~x t1 ↵
2
(n-k-1)S✏ a t ( Xt X) 1a , ŷ~x + t1 ↵
2
(n-k-1)S✏ a t ( Xt X) 1a ] ,

Intervalo de predicción al 100(1 ↵) % de un valor particular de Y dado un ~x = (x1 , x2 , . . . , xk )t :


q q
[ ŷ~x t1 ↵
2
(n-k-1)S✏ 1 + a t ( Xt X) 1a , ŷ~x + t1 ↵
2
(n-k-1)S✏ 1 + a t ( Xt X ) 1a ] ,

En ambos casos S✏ es el error estándar de estimación y a representa al vector columna


a = (1, x1 , x2 , . . . , xk )t .

5.6. Contribución relativa de las variables independientes

La contribución de una variable xj en la estimación del valor medio de Y se mide en apariencia


por ˆj . Sin embargo, a pesar de trabajarse con un modelo de efectos fijos, uno debe de tener cuidado,
pues ˆj presenta el inconveniente de verse afectada por las unidades de medición de xj y la no
conmensurabilidad de las distintas variables involucradas en el modelo. Por esta razón se recomienda,
cuando exista tal incompatibilidad, medir la contribución real de xj en E[Y ] mediante los ˆj ’s
estandarizados:
Sx
b̂j = ˆj j .
SY
ESTADISTICA APLICADA Luis Valdivieso 159

Estos b̂j ’s no son otros que los coeficientes estimados en el modelo, pero de trabajarse con las variables
estandarizadas
Yi Ȳ xij x̄j
zYi = y zxji = (j = 1, 2, . . . , k).
SY S xj

Si el modelo es de efectos aleatorios (es decir, si los Xj son variables aleatorias) entonces la
contribución de Xj sobre Y se mide a través de la correlación parcial entre Xj e Y . Esta se define
como sigue:
Llamemos a X1 , X2 , . . . , Xk (sin Xj ) las variables de control y realizemos un análisis de regresión
de Y con estas variables para luego calcular los residuales:

k
X
0
(1)
ei = Yi Ŷi = Yi ˆ0 ˆ0 Xih , 8i = 1, 2, . . . , n.
0 h
h=1,h6=j

Asimismo realizemos un análisis de regresión de Xj con las variables de control, para calcular luego
los residuales:

k
X
(2)
ei = Xij X̂ij = Xij ˆ00 ˆ00 Xih , 8i = 1, 2, . . . , n.
0 h
h=1,h6=j

Al estar estos residuales depurados del efecto de las otras variables de control, el coeficiente de corre-
lación lineal de Pearson entre e(1) y e(2) representa la relación entre Y y Xj que no puede explicarse
por el efecto de las variables restantes. Esta correlación, es justamente la llamada correlación parcial
entre Y y Xj y la denotaremos por rY Xj |X1 ...Xj 1 Xj+1 ...Xk
. Se puede probar que
s
2
T0j
|rY Xj |X1 ...Xj 1 Xj+1 ...Xk
|= 2 +n ,
T0j k 1

donde el signo de la correlación es el mismo que el de T0j .

Nota: En este capı́tulo y en el anterior, pues algunos enfocan el análisis de varianza como un caso
particular del análisis de regresión (véase el ejercicio 1 al respecto), debe tomarse en cuenta que
el análisis realizado se ha hecho con la asunción de que todos los supuestos teóricos en el modelo
son válidos. Este punto es muy delicado, pues los datos podrı́an indicar algunas inconsistencias
al respecto como por ejemplo, presentar problemas de multicolinealidad (variables independientes
que esten muy correlacionadas entre si), heterocedasticidad (varianza del error 2 no constante),
autocorrelación (errores que no son independientes) y no normalidad, entre otros. Para la detección
y corrección de tales problemas es vital realizar un estudio de residuales. Las técnicas descriptivas
estándares sobre residuales se encuentran implementadas en muchos de los paquetes estadı́sticos. El
lector interesado puede consultar [9], [12] ó algún texto econométrico.
160

5.7. Ejercicios

1.- Se condujo un experimento en un supermercado para estudiar la relación entre la cantidad de


espacio destinado a una determinada marca de café y el volumen de ventas semanales de este café.
La cantidad de espacio destinado en la estanterı́a se varió en exhibidores (“displays”) de 3, 6 y
9 anaqueles aleatoriamente durante 12 semanas, mientras que para las otras marcas de café, se
mantuvieron constantes en exhibidores de 3 anaqueles. Los datos del experimento se encuentran en
la tabla siguiente:

Ventas semanales 526 421 581 630 412 560 434 443 590 570 346 672
Número de anaqueles 6 3 6 9 3 9 6 3 9 6 3 9

a) De una medida del ajuste de los datos a un modelo lineal.


b) Suponga que durante la semana entrante se presentará el café en un exhibidor de 6 anaqueles.
Encuentre un intervalo de predicción al 95 % para las ventas semanales que se obtendrán en esa
semana.
c) ¿ Es posible analizar este problema mediante un análisis de varianza ? De ser esto factible, plantee
las hipótesis del caso y de las conclusiones que obtendrı́a de este estudio. Use ↵ = 0.05.

2.- Un distribuidor de cerveza está estudiando el sistema de reparto de su producto. Especı́ficamente,


el distribuidor está interesado en predecir el tiempo de servicio a un expendio al menudeo. El ingeniero
a cargo del estudio ha sugerido que los dos factores más importantes que intervienen en el tiempo de
reparto son el número de cajas de cerveza que se entregan y la máxima distancia que debe recorrer
el repartidor. El ingeniero reunió la siguiente información, para 15 repartos elegidos al azar:

x1 10 15 10 20 25 18 12 14 16 22 24 17 13 30 24
x2 30 25 40 18 22 31 26 34 29 37 20 25 27 23 33
y 24 27 29 31 25 33 26 28 31 39 33 30 25 42 40

donde x1 = número de cajas de cerveza x2 = distancia recorrida (en kmts) y = tiempo en minutos.
a) Realize la prueba de adecuación de estos datos a un modelo lineal, y de un indice del grado de
ajuste de los datos al modelo. Use ↵ = 0.05.
b) Ajuste el plano de regresión y estime el tiempo medio de servicio que se requerirá para satsfacer
un pedido 18 cajas de cerveza que se ubica a 35 kmts de distancia.
c) ¿ Contribuyen significativamente cada una de las variables independientes en la estimación del
tiempo medio de servicio ?. Use ↵ = 0.05. Cuál de las dos variables da una mayor contribución ?
Nota: Para su ayuda, si X es la matriz de variables independientes, entonces la matriz (Xt X) 1 viene
dada por:
ESTADISTICA APLICADA Luis Valdivieso 161

2 3
3.4779 0.06857 0.07775
6 7
6 0.06857 0.0009228 7
0.002374
4 5
0.07775 0.0009228 0.0021835

3.- Los siguientes datos provienen del número de torsiones necesarias para romper una barra , Y ,
hecha con cierto tipo de aleación y los porcentajes X y Z de los metales A y B que respectivamente,
la integran:

Y 38 40 85 40 60 68 31 35 42 18 34 29
X 1 2 3 1 2 3 1 2 3 1 2 3
Z 5 5 5 10 10 10 15 15 15 20 20 20

a) Ajuste el plano de regresión y haga la prueba de significación del modelo. Halle también R2 para
medir el ajuste. Comente.
b) ¿ Contribuye el porcentaje de metal A empleado en la aleación, con información significativa para
estimar el número medio de torsiones necesarias para romper una barra ? Use ↵ = 0.05. ¿ Es esta
contribución mayor que la del porcentaje del metal B ? Asuma un modelo de efectos fijos.
c) Estime el número medio de torsiones necesarias para romper una barra si se utiliza un 2.5 % de
metal A y un 12 % de metal B en la aleación.

Nota: Si X es la matriz de variables independientes en este problema, la matriz (Xt X) 1 es:

2 3
1 0.25 0.0333
6 7
( Xt X) 1
=6
4 0.25 0.125 0 7
5
0.0333 0 0.00267

4.- Un criador de patos esta interesado en determinar la relación entre la utilidad unitaria de sus
ventas en función del tiempo de crianza. Para ello, el ha seleccionado 10 tiempos de crianza y
observado las siguientes utilidades en las ventas de cada uno de 10 patos elegidos al azar bajo los
tiempos considerados de crianza.

Meses de crianza 4.75 5 5.25 5.5 5.75 6 6.25 6.5 6.75 7


Utilidad (en soles) 2.2 2.45 2.6 2.85 2.75 2.45 2.3 2.25 1.9 1.2

a) Haga un diagrama de dispersión, y en base a este proponga un modelo adecuado para la relación
de interés del criador.
b) Ajuste su modelo propuesto y haga la prueba de significación de este modelo. Use ↵ = 0.05.
c) Estime el tiempo óptimo de crianza, de tal manera que el criador obtenga las mayores utilidades
esperadas por la venta de cada pato.
162

5.- El departamento de transporte de una juridicción desea elaborar un modelo que relacione el
precio de licitación (Y ) para un proyecto de construcción de carretera con la longitud de la carretera
(x1 ) por construir o reparar y el número de licitadores (x2 ). Puesto que el departamento cree que
el precio licitado aumenta linealmente con la longitud de la carretera y el número de licitadores, ha
propuesto para el efecto un modelo lineal. Para el análisis se usaron datos recabados sobre el precio
de la licitación, longitud de la carretera y número de licitadores para 32 proyectos seleccionados al
azar, obteniéndose la tabla ANOVA:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas


Regresión 4’277,159.7074 2 2’138,579.8517
Error 514,034.5153 29 17,725.3281

el plano de regresión ajustado ŷx1 ,x2 = 1336.7220 + 12.7362x1 + 85.8151x2 y los estadı́sticos para
las pruebas individuales sobre las dos variables independientes T01 = 14.114 y T02 = 9.857.
a) ¿ Es útil el modelo para estimar el precio medio licitado ? Use ↵ = 0.01.
b) De una medida del ajuste de los datos a este modelo.
c) Suponga que en dos licitaciones se presentan el mismo número de licitadores; pero en la segunda
la longitud de la carretera en licitación supera en 5 unidades al de la primera licitación. ¿ Cómo y
en cuánto estimarı́a varie el precio entre una y otra licitación ?
d) Pruebe la hipótesis de que el precio medio licitado aumenta al aumentar el número de licitadores
para proyectos de contrucción de carreteras de la misma longitud. Use ↵ = 0.01.

6.- Al parecer las ventas de un producto en una compañı́a dependen del tamaño de la compañı́a y
del capital invertido en publicidad. Para investigar sobre esta cuestión se tomaron 25 compañı́as y se
midió para cada una de ellas las variables antes indicadas. Al ajustar un modelo de regresión lineal
simple usando sólo el tamaño de la compañı́a se obtuvo como suma de cuadrados para la regresión
0
el valor 15 351, 880. Posteriormente se ajustó un modelo de regresión lineal múltiple y en donde se
consideró además el capital invertido en publicidad. En este caso se obtuvo las siguientes sumas de
0 0
cuadrados: Para la regresión = 24 996, 987 y para los errores = 15 771, 404. Al nivel de significación
de ↵ = 0.05:
a) ¿ Se podrı́a decir que el modelo de regresión lineal simple es útil para estimar las ventas medias ?
b) ¿ Se podrı́a decir que el modelo de regresión lineal múltiple contribuye con mayor eficacia que el
modelo de regresión lineal simple para la estimación de las ventas medias ?

7.- Los siguientes datos son acerca de la cantidad de calor desprendido en el fraguado de un cubo de
cemento (en calorı́as por gramo de cemento) y el porcentaje de cuatro sustancias en el cemento, en
relación con el peso total de la mezcla a partir de la cual se preparó el cemento. Los cuatro regresores
son:
ESTADISTICA APLICADA Luis Valdivieso 163

X1 : cantidad de aluminato tricálcico


X2 : cantidad de silicato tricálcico
X3 : cantidad de aluminoferrito tetracálcico
X4 : cantidad de silicato dicálcico
La respuesta Y es la cantidad de calor desprendido.

Y X1 X2 X3 X4
78 7 29 6 60
74 1 29 15 52
104 11 56 8 20
95 7 52 6 33
102 3 71 17 6
72 1 31 22 44
93 2 54 18 22
115 21 47 4 26
83 1 40 23 34
113 11 66 9 12

Se realizó la prueba de adecuación de estos datos a un modelo lineal y se obtuvo la siguiente tabla
de análisis de varianza:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas


Regresión 2,190.805 4 547.701
Error 26.095 5 5.219
Total 2,216.90 9

a) Mida el grado de adecuación de estos datos al modelo. ¿ Es este significativo ?


b) ¿ Contribuyen significativamente las variables X3 y X4 (en forma conjunta) en la estimación de
la cantidad de calor desprendido ?
NOTA: Para su ayuda se le indica a continuación la matriz (Xt X 1, donde X es la matriz de variables
independientes con sólo las variables X1 y X2 .
2 3
1.208528514 0.003334522 0.022881139
6 7
( Xt X ) 1
=6
4 0.003334522 0.002867689 0.00032222 7
5
0.022881139 0.00032222 0.000525801

8.- Se realizaron pruebas de laboratorio para determinar el contenido de asfalto sobre la estabilidad
y la permeabilidad de concreto asfaltado de clasificación abierta. Se prepararon 4 especı́menes de
concreto con cada uno de los siguientes contenidos de asfalto (porcentaje del peso total de la mezcla):
164

3, 4, 5, 6, 7 y 8. Se determinó la permeabilidad al agua de cada espécimen de concreto haciendo fluir


sobre el espécimen agua al que se le extrajo el aire y midiendo la pérdida de agua. Las mediciones
de permeabilidad para los 24 espécimenes fueron:

Contenido de asfalto en % Permeabilidad en pulgadas por hora


3 1,189
3 840
3 1,020
3 980
4 1,440
4 1,227
4 1,022
4 1,293
5 1,227
5 1,180
5 980
5 1,210
6 707
6 927
6 1,067
6 822
7 853
7 900
7 733
7 585
8 395
8 270
8 310
8 208

a) Haga un gráfico que le permita visualizar la relación entre las dos variables en estudio. ¿ Se podrı́a
pensar en una relación lineal ?
b) Se tienen dudas entre plantear un modelo de regresión lineal simple o un modelo cuadrático:

2
Y = 0 + 1x + 2x + ✏.

A un nivel de significación de ↵ = 0.05, ¿ hay pruebas suficientes que indiquen que se debe incluir al
término cuadrático ? Para su ayuda se dispone de la siguiente tabla ANOVA del modelo cuadrático:
ESTADISTICA APLICADA Luis Valdivieso 165

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas F0


Regresión 2’203,970.7494 2 1’101,985.3747 52.85
Error 437,878.20893 21 20,851.34328
Total 2’641,848.9583

y de la matriz de variables independientes x, z con z = x2 :


2 3
5.4768 2.092 0.18304
6 7
( Xt X) 1
=6
4 2.092 0.82455 7.3661 ⇥ 10 2 7
5
0.18304 7.3661 ⇥ 10 2 6.6964 ⇥ 10 3

c) Obtenga a un nivel de confianza del 95 % una predicción de la permeabilidad en un espécimen de


concreto con un 5.5 % de asfalto.

9.- El gerente de ventas de una compañı́a que vende paquetes de soya a través de una cadena
nacional de supermercados, está interesado en estudiar la relación que tienen el precio al mayoreo
de su producto y la publicidad con las ventas del producto. Para lo anterior, él registró las ventas
anuales Y (en miles de dólares) que su compañı́a obtuvo a diferentes precios al mayoreo (X1 ) (en
dólares) y proporciones X2 de gastos en publicidad en cada una de n = 25 regiones respecto al total
gastado en el año pasado. Un resumen de sus resultados al realizar un análisis de regresión múltiple
es el siguiente:

Variable Media Desviación estándar


y 30.6519 7.9602
x1 0.3604 0.0357
x2 6.36 1.7049

Fuente de variabilidad Sumas de cuadrado Grados de libertad Medias cuadráticas F0


Regresión 1,042.917 2 521.458 F0 = 24.009
Error 477.826 22 21.719
Total 1,520.743 24

Los elementos de entradas 2,2 y 3,3 de (Xt X) 1; siendo X la matriz de variables independientes, fueron
c22 = 33.2263 y c33 = 0.01462; y finalmente el plano de mı́nimos cuadrados ajustado resultó ser:

Ŷx1 ,x2 = 35.617 72.8205x1 + 3.3458x2

a) A un nivel de significación de ↵ = 0.05, ¿ qué que le dice la tabla ANOVA anterior ?


b) Halle el coeficiente de determinación R2 e indique si es que el ajuste de los datos al modelo lineal
hallado es bueno.
166

c) ¿ Contribuyen, a un nivel de significación de ↵ = 0.05, las dos variables independientes con


información significativa en la estimación de las ventas medias anuales ? ¿ Cuál de las dos variables
da mayor contribución y porqué?

10.- En un estudio para relacionar el salario actual de los empleados Y en relación a sus años de
trabajo X y al salario con el cual comenzaron Z. Se registraron estas 3 variables para todos los 474
empleados de un Banco. Los datos obtenidos fueron:

Variable Media Desviación estándar


y 13,767.83 6,830.26
x 37.19 11.79
z 6,806.43 3,148.26
Asimismo las distintas tres correlaciones de Pearson obtenidas fueron:

rxy = 0.1459, rxz = 0.0110 y rzy = 0.8801.

El gerente de la compañı́a le da a ud. esta información resumida y le pide que le realice una análisis
de regresión lineal. El desea estimar el salario medio actual que un empleado con 25 y medio años
de trabajo y un sueldo inicial de 7,500 u.m deberı́a tener.
Sugerencia: Para hallar los estimadores de mı́nimos cuadrados, resuelva las ecuaciones normales
que aparecen en las notas con k = 2 y expreselas en términos de las correlaciones y desviaciones
estándares.

11.- Muchas universidades elaboran modelos de regresión para predecir el promedio de calificaciones
(Y ) de los alumnos de nuevo ingreso. Este promedio puede entonces ayudar a tomar decisiones en
la admisión. Aunque la mayor parte de los modelos emplean muchas variables independientes para
predecir el promedio de calificaciones, para esta aplicación se escogerán las variables x1 = calificación
de expresión oral (percentil) del examen de admisión y x2 = calificación de Matemáticas (percentil)
del examen de admisión.
Se obtuvieron los datos para una muestra aleatoria de 40 ex-candidatos a nuevo ingreso de una
Universidad y al ajustar un modelo de regresión lineal múltiple con ambas variables, se obtuvo la
siguiente tabla ANOVA:

Fuente de variabiliadad Suma de Cuadrados g.l. Medias cuadráticas F0


Regresión 319.649 2 159.824 39.505
Error 149.689 37 4.046
Total 469.337 39

a) Dé una medida del grado de ajuste de los datos al modelo y diga a un nivel de significación de
↵ = 0.05, si es que este modelo podrı́a ser de utilidad.
ESTADISTICA APLICADA Luis Valdivieso 167

b) Un profesor plantea que serı́a mejor emplear un modelo de regresión general de segundo orden
(no lineal):
2 2
Y = 0 + 1 x1 + 2 x2 + 3 x1 + 4 x2 + 5 x1 x2 + ✏.

Al linealizarse este modelo con las variables x1 , x2 , x3 = x21 , x4 = x22 y x5 = x1 x2 se obtuvo la


siguiente tabla ANOVA:

Fuente de variabiliadad Suma de Cuadrados g.l. Medias cuadráticas F0


Regresión 439.569 5 87.914 100.409
Error 29.769 34 0.876
Total 469.337 39

¿ Puede decirse, a un nivel de significacióón de ↵ = 0.05, si es que algunos de los nuevos términos
en el modelo de segundo orden, contribuyen con información significativa en la estimación del valor
medio de Y ? Compare luego de manera descriptiva, cual de los dos modelos propuestos da un mejor
ajuste a los datos e indique si le darı́a o no la razón al profesor.
c) Al realizarse el contraste de significación con ↵ = 0.05 para 5 se obtuvo un estadı́stico de prueba
de T05 = 1.675, puede entonces usted asegurar con una probabilidad de equivocarse del 5 % que la
variable de interacción x1 x2 si contribuye con información significativa en la estimación de Y .

12.- Con la finalidad de estudiar la influencia que pudiera existir entre el porcentaje del pulpa de
madera en la resistencia de bolsas de papel fabricadas, se tomaron 19 observaciones del porcentaje
de pulpa y las correspondientes resistencias medidas en psi.
En un comienzo se ajusto un modelo de regresión lineal entre la variable Y = resistencia y x =
concentración, encontrándose en el análisis una suma de cuadrados de la regresión de 1,044.584.
Posteriormente se ajustó un modelo de segundo orden Y = + 2
0 1x + 2x + ✏ encontrándose la
siguiente tabla ANOVA:

Fuente de variabilidad Sumas de cuadrados Grados de libertad Medias cuadráticas F0


Regresión 3,105.038 2 1,552.519 F0 = 79.242
Error 313.473 16 19.592
Total 3,418.512 18

a) A un nivel de significación de ↵ = 0.05, ¿ se podrı́a decir que el primer modelo de regresión lineal
simple es de utilidad para estimar la resistencia media ?
b) A un nivel de significación de ↵ = 0.05, ¿ podrı́a asegurarse que el modelo de segundo orden
contribuye con una mayor información significativa (que al modelo de regresión lineal simple) para
la estimación del valor medio de la resistencia ?
168

13.- Se realizó un experimento con objeto de investigar el efecto de la presión de extrusión P (en
psi) y la temperatura durante la extrusión T (en grados centigrados) sobre la resistencia Y de un
nuevo tipo de plástico. Se prepararon dos especı́menes de plástico para cada una de 5 combinaciones
de presión y temperatura. A continuación, los especı́menes se ensayaron en orden aleatorio y se
registró la resistencia a la ruptura de cada especı́men. Las variables independientes se codificaron
como sigue a fin de simplificar los cálculos:

P 200 T 400
x1 = y x2 = .
10 25
Los n = 10 puntos de datos se listan a continuación:

x1 -2 -2 -1 -1 0 0 1 1 2 2
x2 2 2 -1 -1 -2 -2 -1 -1 2 2
Y 5.2 5.0 0.3 -0.1 -1.2 -1.1 2.2 2.0 6.2 6.1

a) Realice la prueba de significación del modelo yx1 ,x2 = 0 + 1 x1 + 2 x2 y estime, de tener sentido,
cómo y en cuánto se modificarı́a la resistencia media del plástico si la temperatura durante la extrusión
se aumentara en 50 grados y la presión se mantuviera constante. Use ↵ = 0.05.
b) Contraste a un nivel de significación de ↵ = 0.05, la hipótesis nula H0 : 1 = 0 contra la hipótesis
alternativa H1 : 1 6= 0. ¿Qué implicación práctica tiene el resultado de este contraste ?
c) Mida la contribución de la presión de extrusión y la temperatura durante extrusión en la resistencia
del plástico e indique cuál de estas variables da una mayor contribución.
d) A un consumidor, que ha adquirido un especı́men del plástico producido a una presión de extrusión
de 200 psi y a una temperatura durante la extrusión de 450 grados centigrados, se le ha garantizado la
devolución de su dinero si es que la resistencia de su especı́men tiene 4.8 ó menos unidades . ¿ Podrı́a
asegurarse, con un nivel de confianza del 95 %, que no le será devuelto el dinero a este consumidor ?
REFERENCIAS

[1] BOWKER Y LIEBERMAN. Estadı́stica para Ingenieros. Prentice Hall. Madrid.

[2] CORDOVA. Estadı́stica Inferencial. Aplicaciones. Editorial Moshera.

[3] HILDEBRAND,DAVID Y OTT, LYMAN. Estadı́stica Aplicada a la Administración y


Economı́a. Addison-Wesley Iberoamericana.

[4] HINES Y MONTGOMERY. Probabilidad y Estadı́stica para Ingenierı́a y Administración.


Cecsa. México.

[5] KENETT Y ZACS. Estadı́stica Industrial Moderna. International Thomsom Editores.

[6] LARSON. Introducción a la Teorı́a de Probabilidades e Inferencia Estadı́stica. Limusa.

[7] MENDENHALL Y REINMUTH. Estadı́stica para Administración y Economı́a.


Grupo Editorial Iberoamericana.

[8] MENDENHALL SCHEAFFER Y WACKERLY. Estadı́stica Matemática con Aplicaciones.


Grupo Editorial Iberoamericana.

[9] MENDENHALL Y SINCICH. Probabilidad y Estadı́stica para Ingenierı́a y Ciencias.


Prentice Hall.

[10] MEYER. Probabilidad y Aplicaciones Estadı́sticas. Fondo Educativo Interamericano.

[11] MILLER Y FREUNDT. Probabilidad y Estadı́stica para Ingenieros.


Prentice Hall. Madrid.

[12] PEÑA SANCHEZ DE RIVERA. Estadı́stica, Modelos y Métodos. Tomos 1 y 2. Alianza


Editorial S.A. Madrid.

[13] SCHEAFFER Y MC. CLAVE. Probabilidad y Estadı́stica para Ingenierı́a. Grupo Editorial
Iberoamericana.

169
170
Apéndice A

Formulario y tablas estadı́sticas

171

Вам также может понравиться