Вы находитесь на странице: 1из 47

F FA AC CU UL LT TA AD D D DE E C CI IE EN NC CI IA AS S E E I IN NG GE EN NI IE ER R A A

T TE EX XT TO O

I IN NF FE ER RE EN NC CI IA A E ES ST TA AD D S ST TI IC CA A A AP PL LI IC CA AD DA A A A L LA A E EC CO ON NO OM M A A


A Au ut to or re es s: :

E Es sc cu ur rr ra a E Es st tr ra ad da a C Cr ri is st ti i n n I Iv v n n
F Fa ar rr ro o a an n S Sa an nt ti is st te eb ba an n J Jo os s N Na at ti iv vi id da ad d
R Ro oj ja as s P Pa az z, , J Jo or rg ge e L Lu u s s. .


C CO OL LA AB BO OR RA AD DO OR RE ES S: :

H H c ct to or r A Al le ex xi is s H He er rr re er ra a V Ve eg ga a






H Hu ua ac ch ho o P Pe er r 2 20 01 10 0



2



Agradecimiento


Los autores de este Texto desean expresar su agradecimiento a todas
nuestras familias que nos han comprendido las horas dedicadas a la
elaboracin de este texto que sin duda corresponde a un sacrificio
que los investigadores hacemos con el nico objetivo de que se
valore lo escrito y se use con fines acadmicos. Agracemos tambin
de manera especial a los autores identificados en la parte de
bibliografa que nos ha servido de gua en la utilizacin de algunas
tablas estadsticas y definiciones.

3


Contenido Pg.

INTRODUCCIN 4
CAPITULO I: DISTRIBUCIN DE PARMETROS 5
CAPITULO II: ESTIMACIN DE PARMETROS 16
CAPITULO III: PRUEBA DE HIPTESIS 29
BIBLIOGRAFA 46






4

Introduccin


En diversas investigaciones estadsticas el principal objetivo puede ser el estudio de determinada
caracterstica de una poblacin; muchas veces, por ejemplo, se desea estimar el coeficiente de
inteligencia promedio de los estudiantes, otras veces se requiere la prueba de una determinada
hiptesis respecto de un parmetro en estudio acerca del modelo que ha generado los datos. La
estadstica inferencial proporciona los medios para, a travs de la informacin contenida en
muestras aleatorias y con ayuda de la teora de la probabilidad, resolver problemas de ndole
econmico como para mejorar las inversiones o pronosticar la rentabilidad de una empresa en un
tiempo determinado bajo un nivel de confianza.
En lo que sigue nos vamos a limitar a la inferencia estadstica paramtrica, donde la variable
aleatoria objeto de estudio sigue una distribucin generalmente normal, y slo tendremos que
tratar de estimar los parmetros que la determinan, la media y la desviacin tpica.
Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma
funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente
indeterminados los parmetros que determinan la funcin de distribucin.
Los ejemplo y casos dados se corresponden a empresas o poblaciones grandes en las que se
pretende estudiar una determinada variable aleatoria, esta situacin hace que resulte muy caro o
imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra.
En todos estos problemas que estudia la inferencia estadstica juega un papel fundamental la
"Teora de la Probabilidad" basndose en muestras y siguiendo sus patrones de distribucin de la
variable(s) a estudiar.


Los Autores

5

INFERENCIA ESTADISTICA
CAPITULO I: DISTRIBUCIN DE PARMETROS
POBLACIN
Se denomina poblacin a la totalidad de personas u objetos que tienen al menos una
caracterstica en comn y las dems caractersticas varan y son medibles cualitativa o
cuantitativamente y reciben el nombre de variable estadstica cuyo valor o dato es una
observacin.
Si el anlisis es univariante (una sola variable), a cada elemento de la poblacin se le ha
anotado una observacin (un valor), en ese sentido; al conjunto de valores posibles de la
variable se le denomina poblacin. Y mucho ms si los elementos de la poblacin se definen en
forma aleatoria, entonces la variable estadstica es una variable aleatoria cuyos valores
constituyen la poblacin.
En este caso la distribucin de la poblacin es la distribucin de la variable aleatoria que tiene
parmetros como la Media y la Varianza para la variable cuantitativa; la proporcin p y la
varianza pq para la variable cualitativa.
Si la variable aleatoria tiene distribucin de probabilidad f(x) entonces nos podemos referir
que la poblacin es f(x).
Ejemplo.
, entonces se dice que la poblacin est normalmente distribuida con
media y la Varianza

Tamao poblacional( N).
El nmero de observaciones de la poblacin puede ser finita(N) o infinita(). Algunas
poblaciones finitas de tamaos grandes en teora son asumidas como poblaciones infinitas.

parmetro.
Son las medidas descriptivas que caracterizan a la distribucin de la variable de la poblacin, y
son:
- La Media , la Varianza y el Total X=N . Para la una variable cuantitativa.
- La proporcin p y la varianza pq para la variable cualitativa.
Si la distribucin de probabilidad es conocida, entonces se conocen sus parmetros y su forma
y no hay nada por investigar.
Si la distribucin de probabilidad es desconocida, entonces si hay que investigar pudiendo
estar interesados en:

6

1) Estimar sus parmetros, si es que se conoce su forma.
2) Probar determinada suposicin, acerca de un valor determinado del parmetro.
3) Probar la suposicin acerca del tipo de distribucin de probabilidades de la poblacin, es
decir; los datos siguen una distribucin Normal, o los datos siguen una distribucin T-
student, Binomial, exponencial, etc.

Tipos de poblacin.
Poblacin Finita: Denominada as, porque se conoce su tamao poblacional N.
Poblacin Infinita: Denominada as, porque no se conoce su tamao poblacional N=

VARIABLE ALEATORIA.
Es una funcin X que describe numricamente en x el resultado fsico del experimento y
est acompaada de una funcin de probabilidad f(x)

Ejemplo:
En un experimento suponga que se observa el nmero se vehculos que pasan por una garita
de control cada 5 minutos y se anota numricamente con x este resultado fsico. El resultado
fsico (ningn, el o los automviles) es el dominio y el rango es el nmero x de vehculos
anotado.

Ejemplo:
Suponga que se tiene una poblacin de 8 familias, de los cuales dos son de nivel Bajo, cuatro
son del nivel Medio y dos son del nivel Alto, si se selecciona al azar una por una a las familias
de toda la poblacin y se anota numricamente el nivel de status social; se pide:
1. Describir los resultados en una variable aleatoria.
2. Transformar la variable aleatoria acompaando su funcin de probabilidad en su: i)
Forma tabular.
ii) Grfica.
iii) Representarlo en un modelo matemtico probabilstico.

7

Sol.1.
Asignemos a: x =1 (nivel Bajo), x=2 (nivel medio) x= 3 (nivel Alto)
Base de datos:
Cdigo de la familia FB FM FB FM FA FM FM FA
Variable aleatoria: X
Status social
1 2 1 2 3 2 2 3


Sol. 2.i)
Tabla N 01.
Funcin de probabilidad f(x) de la poblacin de Familias segn su Status social en el
BLOCK 1 de la Residencial Costa del Norte, distrito de Huacho. 2010.
X f(x)
1 0.25
2 0.50
3 0.25
Total 1.00
Fuente: Elaborado por el autor.

Se observa que la variable aleatoria X tiene forma de distribucin simtrica.

Sol. 2.ii)
Grfica N 01.
Funcin de distribucin de probabilidad de la poblacin de Familias segn su Status
social en el BLOCK 1 de la Residencial Costa del Norte, distrito de Huacho. 2010.



8

Sol. 2. iii)



SELECCIN DE UNA MUESTRA EN UNA POBLACIN FINITA O INFINITA PERO QUE EL
MUESTREO ES CON REMPLAZO.
De la poblacin anterior se extrae una muestra de tamao n=2, es decir dos familias al azar. Es
razonable que cada familia puede tomar culquiera de los tres valores de la variable X con
probabilidades iguales a la poblacin. Entonces cada valor de la muestra respectiva genera una
variable aleatoria respectiva igual a la poblacin.
x1 x2 Valores de la muestra

X1

f(x1)

X2

f(x2)
Variables X1 y X2
igual a la
poblacin: X

f(x)
1 0.25 1 0.25 1 0.25
2 0.50 2 0.50 2 0.50
3 0.25 3 0.25 3 0.25
1.00 1.00 1.00

Luego;
x1, x2, .., xn generaran n variables aleatorias X1, X2, Xn que constituyen una muestra
aleatoria simple de tamao n de la poblacin f(x) de la variable X, siempre que estas
variables estn distribuidas idnticamente a la poblacin y sean independientes.

DEFINICION DE MUESTRA ALEATORIA SIMPLE:
Dado una poblacin f(x) con media y varianza que puede ser y si la variable es
cuantitativa o puede ser la proporcin p y la varianza pq si la variable cualitativa; se denomina
muestra aleatoria de tamao n de esa poblacin a un conjunto de variables aleatorias X1,
X2, X3, Xn, tales que:
1) Son independientes, que implica que la distribucin de probabilidad conjunta de X1, X2, X3,
Xn est definida como:

f(x1, x2, x3, , xn) = f(x1)f(x2)f(x3)f(xn)


9

2) Cada una de las variables Xi est distribuida de forma idntica a la variable X, es decir;
Primero:
E(Xi)= , V(Xi)= para la variable X cuantitativa.
E(Xi)= p , V(Xi)= para la variable X cualitativa.
Es decir; tiene la misma media y varianza de X



Segundo:
La distribucin de probabilidad de cada Xi es la misma distribucin de probabilidad de X,
esto es:
f(xi)=f(x)

Ejemplo:
Sea X1, X2, X3, Xn, una muestra aleatoria de tamao n de una poblacin Normal
, se pide:

a) Escribir la funcin de densidad de probabilidad conjunta de la muestra.
b) Si n=6, =20, ; calcular la probabilidad de que:
X1+X3+X4-X6 sea mayor que 52.
Sol.
Previamente se conoce que la funcin de densidad de X es Gaussiana (Normal), entonces:

Luego:
a) La funcin de densidad de probabilidad conjunta de la muestra es:
f(x1, x2, x3, , xn) = f(x1)f(x2)f(x3)f(xn)


b) Y= X1+X3+X4-X6

E[y]=E[X1]+E[X3]+E[X4]-E[X6]
= 20 + 20 + 20 - 20

y
= 40.


10

V[y]=V[X1]+V[X3]+V[X4]+V[-X6]
= 25 + 25 + 25 + 25
.

Por la propiedad reproductiva de la Normal, la variable aleatoria Y tiene distribucin
normal N(40,100), luego la variable Normal Estndar Z es:




DISTRIBUCIN DE LA VARIBLE MEDIA MUESTRAL CUANDO SE CONOCE LA VARIANZA
POBLACIONAL:
Al estudiar las propiedades que se deducan de la distribucin normal, la primera que
considerbamos era la referente a la distribucin de una combinacin lineal de variables
aleatorias normales. As pues, sabemos que si X1, ..., Xn, son variables aleatorias
independientes distribuidas segn una normal , para toda i = 1, .., n y si a1,, ..., an,
son nmeros reales, entonces la variable aleatoria

Y = a
1
X
1
+ .+ a
n
X
n


Sigue una distribucin

)

Entonces la distribucin de se define como:


Teorema:
Sea X1, X2, X3, Xn, una muestra aleatoria simple de tamao n de una poblacin Normal
, entonces la distribucin del estadstico media muestral tendr una
distribucin normal.


11


Ejemplo:
Sea X1, X2, X3, Xn, una muestra aleatoria de tamao n de una poblacin Normal
, se pide:

a) Escribir la funcin de densidad de probabilidad conjunta de la muestra.

b) Si n=6, =20, ; calcular la probabilidad de que:
X1+X3+X4-X6 sea mayor que 52.

Solucin a)
Previamente se conoce que la funcin de densidad de X es Gaussiana (Normal),
entonces:
Luego:
La funcin de densidad de probabilidad conjunta de la muestra es:
f(x
1
, x
2
, x
3
, , x
n
) = f(x
1
)f(x
2
)f(x
3
)f(x
n
)




Solucin b)
Por la propiedad reproductiva de la Normal; la suma de variables aleatorias forman una nueva
variable aleatoria normal

12


Y= X1+X3+X4-X6

E[y] = E[X1]+E[X3]+E[X4]-E[X6]
= 20 + 20 + 20 - 20

y
= 40.
V[y] = V[X1]+V[X3]+V[X4]+V[-X6]
= 25 + 25 + 25 + 25
.

Por la propiedad reproductiva de la Normal, la variable aleatoria Y tiene distribucin normal
N(40,100), luego la variable Normal Estndar Z es:



DISTRIBUCIN DE LA VARIABLE ALEATORIA MEDIA MUESTRAL:
(El Muestreo es con remplazo).
Teorema: Sea X1, X2, X3, Xn, una muestra aleatoria de tamao n escogida de una poblacin
f(x) Normal , entonces:
a) . tambin .
b) , Tambin ,
c)
d) , La variable aleatoria Z tiene media 0 y Varianza 1.
Observacin:
O1) Si n30 entonces, sin importar si la poblacin es normal, tiene distribucin
aproximadamente normal.

13

o2) Si la poblacin f(x) se conoce que es normal y se selecciona una muestra de tamao n2,
entonces tiene distribucin exactamente normal.
O3) Si la muestra es sin remplazo en una poblacin finita de tamao N, entonces la varianza de la
distribucin de es:

Ejemplo:
Cuatro secretarias que componen una poblacin de servicios secretarial del Vice Rectorado
Administrativo, se le pidi que dijera su tiempo de servicio, obtenindose los siguientes datos:
Secretaria X: Tiempo
serv
A 3
B 2
C 1
B 4

Se pide: determinar los parmetros de la variable X: , .
Adems:
a) * En una tabla describir X con f(x).
** Graficar f(x).
*** Expresar la Variable Aleatoria X en un Modelo Matemtico.

b) Si se seleccionan dos mecangrafas con remplazo de esta poblacin demostrar que:
i) , tambin .
ii)
iii)
c) Si el muestreo es sin remplazo demostrar que:
i) .
ii)

14

Solucin:
=2.5 aos de servicio.
Se espera que cada secretaria tenga dos aos y medio de servicio en la Vice Rectora.
.


a)
X: Tiempo serv f(x)
3 0.25
2 0.25
1 0.25
4 0.25
Total 0.25


Modelo matemtico probabilstico:
f(x)= , si x=


b) El nmero de muestras posibles M, seleccionadas de una poblacin de tamao N, con
tamao n es: . Donde se refleja que se forma una poblacin de muestras, de tamao
M.

Muestra

Secretaria

Resultado de la
muestra

Media de la
muestra
1 A,A 3;3 3,0
2 A,B 3;2 2,5
3 A,C 3;1 2,0
4 A,D 3;4 3,5
5 B,A 2;3 2,5
6 B,B 2;2 2,0
7 B,C 2;1 1,5
8 B,D 2;4 3,0
9 C,A 1;3 2,0
10 C,B 1;2 1,5
11 C,C 1;1 1,0
12 C,D 1;4 2,5
13 D,A 4;3 3,5
14 D,B 4:2 3,0
15 D,C 4;1 2,5
16 D,D 4;4 4,0

Total

0
0,25
1 2 3 4
P
r
o
b
a
b
i
l
i
d
a
d

f
(
x
)
Aos de servicio


15

.







n f(x)
1,0 1 0,0625
1,5 2 0,1250
2,0 3 0,1875
2,5 4 0,2500
3,0 3 0,1875
3,5 2 0,1250
4,0 1 0,0625

16 1




16

CAPITULO II: ESTIMACIN DE PARMETROS
Estimacin puntual. Estimacin por intervalos. Para promedios y proporciones con una y dos
poblaciones. Ejemplos.
ESTIMACIN DE PARMETROS

La inferencia estadstica nos da una idea de lo que pasa en la poblacin objeto de estudio, pero
basndose en datos tomados de una muestra estadstica.

Al utilizar varias muestras estadsticas para calcular un mismo parmetro de la poblacin es
normal que haya diferencia entre ellos y la igualdad ser solo coincidencia. La diferencia entre la
estadstica de la muestra y el parmetro de la poblacin se suele llamar error de estimacin. Solo
conoceramos dicho error si se conociera el parmetro poblacional que por lo general se
desconoce. La nica forma de tener alguna certeza al respecto es hacer todas las observaciones
posibles del total de la poblacin; en la mayora de las aplicaciones prcticas es imposible o
impracticable.

Las inferencias estadsticas se hacen por posibilidades o probabilidades Por ejemplo de la media
de una muestra se hacen inferencias sobre la media de la poblacin. Exactamente no sabemos
cul es la diferencia entre ambas. Lo que si sabemos es que es pequea la probabilidad de que
esta diferencia sea mayor que, por ejemplo 3 o 2 errores estndares.

En este captulo estudiaremos los problemas de estimacin puntual, por intervalos para
promedios y proporciones.

ESTIMACIN PUNTUAL
Un estimador puntual de un parmetro es cualquier estadstica que nos permita a partir de los
datos muestrales obtener valores aproximados del parmetro Esencialmente son tres los
parmetros de inters:
- En el caso de que investiguemos una variable cuantitativa:

17

a) Para la media de la poblacin tomaremos como aproximacin la media de la muestra.
=
b) Para la varianza de la poblacin 2 tomaremos la cuasivarianza de la muestra.

=
- Si el estudio se centra en el estudio de un carcter cualitativo el parmetro de inters ser la
proporcin de elementos de la poblacin que pertenecen a cierta categora C que lo
aproximaremos con la correspondiente proporcin en la muestra.



Es muy probable que haya error cuando un parmetro es estimado. Es cierto que si el nmero de
observaciones al azar se hace suficientemente grande, stas proporcionaran un valor que casi
sera semejante al parmetro; pero a menudo hay limitaciones de tiempo y de recursos y se
tendr que trabajar con unas cuntas observaciones. Para poder utilizar la informacin que se
tenga de la mejor forma posible, se necesita identificar las estadsticas que sean buenos
estimadores. Hay cuatro criterios que se suelen aplicar para determinar si una estadstica es un
buen estimador: Insesgamiento, eficiencia, consistencia y suficiencia

ESTIMADOR
Es un estadstico que se usa con el fin de estimar un parmetro desconocido de la poblacin. Por
ejemplo, si se desea conocer el precio medio de un producto (el parmetro desconocido) se
recogern observaciones del precio de dicho producto en diversos establecimientos y el promedio
de las observaciones puede utilizarse como estimador del precio medio.

18

Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el
estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,
convergencia y robustez (consistencia).
El valor de un estimador proporciona lo que se denomina en estadstica una estimacin puntual
del valor del parmetro en estudio. En general, se suele preferir realizar una estimacin mediante
un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera est el valor real del
parmetro con un cierto nivel de confianza. Utilizar un intervalo resulta ms informativo, al
proporcionar informacin sobre el posible error de estimacin, asociado con la amplitud de dicho
intervalo.

PROPIEDADES
Existe una propiedad que comprende conjuntamente las propiedades de insesgamiento y
eficiencia. Se trata del error cuadrtico medio.
Si T es un estimador del parmetro. El error cuadrtico medio de T, denotado ECM(T), se define
como el valor esperado de (T ).
ECM(T) = E[(T)
2
]
Cul es la informacin que nos proporciona el error cuadrtico medio?
Nos referimos al promedio de los cuadrados de las observaciones. Si ste es pequeo, debemos
aceptar que hay una tendencia para que los valores (T) sean pequeos, y as lo ser tambin la
diferencia (T), lo que quiere decir que T tiende a producir respuestas numricas prximas al
parmetro. El poder que tenga T para producir valores prximos depende de dos condiciones
bsicas. Una es la fuerza o intensidad con la que tiende a dar esos valores (insesgamiento) y la
otra es la fuerza que tenga para no permitir que se aparte de camino que lo conduce (eficiencia).
Estas dos condiciones matemticamente quedan establecidas y precisadas en el teorema
siguiente:
TEOREMA: Si T es un estimador del parmetro, ECM(T) = V[T] [ -E(T)]
2



19

Sesgo
Es la diferencia entre el valor esperado del estimador y el verdadero valor del parmetro a
estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo
por ser igual al parmetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es
un estimador insesgado de la misma, ya que su valor esperado es igual a la media de la poblacin.
En efecto, si una muestra X=(X
1
,X
2
,...,X
n
)
t
procede de una poblacin de media , quiere decir que:
E[X
i
+ = para cualquier i=1...n
La media aritmtica o media muestral se calcula de la siguiente manera:

Con lo que, al aplicar las propiedades de linealidad de la esperanza matemtica se tiene que:




Eficiencia
Diremos que un estimador es ms eficiente o ms preciso que otro estimador, si la varianza del
primero es menor que la del segundo. Por ejemplo, si y son ambos estimadores de y

,
diremos que es ms eficiente que . Un estimador es ms eficiente (ms preciso), por tanto,
cuanto menor es su varianza.

20

La eficiencia de los estimadores est limitada por las caractersticas de la distribucin de
probabilidad de la muestra de la que proceden. El teorema de Cramr-Rao determina que la
varianza de un estimador insesgado de un parmetro es, como mnimo,

donde f(X;) es la funcin de densidad de probabilidad de la muestra
en funcin del parmetro , (denominada funcin de verosimilitud).
Si un estimador alcanza esta cota mnima, entonces se dice que el estimador es de mnima
varianza.

Consistencia
Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable para un
estimador es que a medida que el tamao de la muestra crece, el valor del estimador tienda a ser
el valor del parmetro, propiedad que se denomina consistencia. Existen diversas definiciones de
consistencia, ms o menos restrictivas, pero la ms utilizada es la denominada consistencia en
media cuadrtica que exige que:
1. cuando
2. cuando

Robustez
El estimador ser un estimador robusto del parmetro si la vulneracin de los supuestos de
partida en los que se basa la estimacin (normalmente, atribuir a la poblacin un determinado
tipo de funcin de distribucin que, en realidad, no es la correcta), no altera de manera
significativa los resultados que ste proporciona.

21

Suficiencia
Se dice que un estimador es suficiente cuando resume toda la informacin relevante contenida en
la muestra, de forma que ningn otro estimador pueda proporcionar informacin adicional sobre
el parmetro desconocido de la poblacin.

Invarianza
Se dice que un estimador es invariante cuando el estimador de la funcin del parmetro coincide
con la funcin del estimador del parmetro, .
Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para
estimar la desviacin tpica poblacional ser razonable utilizar la desviacin tpica muestral.

NIVEL DE CONFIANZA; es la probabilidad de que a priori el verdadero valor del parmetro quede
contenido en el intervalo.

ERROR ESTNDAR
Cuando un mismo estimador ofrece diferentes valores para distintas muestras del mismo tamao
extradas de la misma poblacin. Por lo tanto deberamos tener una medida de la variabilidad del
estimador respecto del parmetro que se trata de estimar. Esta variabilidad se mide en trminos
de la desviacin estndar del estimador, la cual recibe el nombre de error estndar. El error
estndar de un estimador T de un parmetro es la desviacin estndar del estimador.
As por ejemplo, si tomamos como estimador de, entonces el error estndar est dado por el
error de estimacin.
Error de estimacin, que es el valor absoluto de la diferencia entre una estimacin particular y el
valor del parmetro.
En realidad por cada valor estimado del parmetro se tiene un error de estimacin por lo general
diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarn la mayora de
los valores de error de estimacin para un estimador y parmetro dados.


22

ESTIMACIN POR INTERVALOS
Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado
con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes conceptos:
Intervalo de confianza; es una expresin del tipo *1, 2+ 1 2, donde es el parmetro a
estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de
confianza.
Variabilidad del parmetro; si no se conoce, puede obtenerse una aproximacin en los datos
aportados por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el
tamao de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de
esta variabilidad la desviacin tpica poblacional y se denota .
Valor Tambin llamado nivel de significacin; es la probabilidad de fallar en nuestra estimacin;
esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-). Por ejemplo, en una
estimacin con un nivel de confianza del 95%, el valor es (10095)/100 = 0,05.
Valor crtico; se representa por Z
/2
. Es el valor de la abscisa en una determinada distribucin que
deja a su derecha un rea igual a /2, siendo 1- el nivel de confianza. Normalmente los valores
crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin. Por
ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para =
0,05 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms
aproximado), bajo la columna rea; se observa que se corresponde con 0,64. Entonces Z/2 =
0,64. Si la media o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se
puede realizar el cambio de variable t=(X-)/ para su clculo.

Hemos visto que la media muestral es un buen estimador puntual de la media poblacional. El
inconveniente principal es que un nico valor observado de generalmente no es exactamente
igual a ; habr cierta diferencia entre y . Sera conveniente tener idea de lo cerca que est
nuestra estimacin del verdadero valor de la media poblacional. Tambin sera bueno poder dar
informacin de lo seguros o confiados que estamos de la precisin de la estimacin.
Para tener una idea, no solo del valor de la media, sino tambin de la precisin de la estimacin,
los investigadores optan por el mtodo de estimacin por intervalo o intervalos de confianza. Un

23

intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos
extremos L 1 y L 2 son estadsticos. Esto se utiliza para determinar un intervalo numrico a partir
de la muestra. Se espera que este contenga el parmetro de la poblacin que est siendo
estimado. Si se ampla el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de
del 95% es tal que: . Decir que un intervalo es un intervalo de confianza del
95% de significa que, cuando se utiliza un muestreo repetido de la poblacin, el 95% de los
intervalos resultantes deber contener a ; debido al azar, el 5% no incluir la verdadera media
poblacional. El grado de confianza deseado es controlado por el investigador.

Ejemplo
Hallemos un intervalo de confianza, del 95%, de , nmero medio de productos vendidos por da,
sobre la base de una muestra aleatoria de tamao 5 dada en la que se ha calculado que una
estimacin puntual de es . Supongamos que por experiencias anteriores se sabe que ,
nmero de productos vendidos por da, est normalmente distribuido, con varianza .
Queremos extender la estimacin puntual a un intervalo, de forma talque podamos tener una
confianza del 95 % de que el intervalo obtenido contenga al verdadero valor de . Es decir,
queremos determinar y de forma que As:


Para hacerlo as, consideremos la particin de la curva normal tipificada dibujada en la siguiente
figura:

Particin de Z para obtener un intervalo de confianza de del 95 %

24

Puede verse que
En este caso, , por tanto, podemos concluir que

Veamos que los lmites superior e inferior del intervalo de confianza del 95% son:

Puesto que se supone que es 9, y y , son estadsticos. Sus valores observados por la
muestra son


Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos repetidos,
contendr a la media en un 95% de confianza de que est verdaderamente entre 58.37y 63.63:

58.37 = 61 - 2.63 61 61 +2.63 = 63.63
Dos observaciones son evidentes a partir de esta frmula:
La primera es que cada intervalo de confianza est centrado en
La segunda es que la amplitud del intervalo depende de tres factores:
- La confianza deseada.
- La desviacin estndar
- El tamao muestral

25

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL Y LA DISTRIBUCIN DE T
En la mayora de los casos, el estudio estadstico que interesa se hace por primera vez, por lo que
no hay una forma de conocer previamente cul es la media o la varianza de la poblacin en
cuestin.
Entonces, consideraremos ahora hacer inferencia sobre una media poblacional cuando se
considera que la varianza de la poblacin es desconocida.
S
Donde S es la desviacin entandar muestral
Z tiene como parmetros a y a
T tiene como parmetro a v grados de libertad
El nmero de grados de libertad implicados en la bsqueda de un intervalo de confianza de
cuando no se conoce es n-1.
La distribucin T es el cociente entre una variable aleatoria con una Distribucin normal tipificada
(z) y la raz cuadrada de otra variable aleatoria (independiente de la anterior) con su Distribucin ji
cuadrado de v grados de libertad dividida por sus grados de libertad:
t =
Esta distribucin solo depende de un parmetro, los grados de libertad, y est definida entre - y
+ . Existen tantas distribuciones de t de student-Fisher como grados de libertad haya.
Grados de libertad: El nmero de maneras en que los datos pueden variar libremente.
Entre ms grados de libertad tiene la curva de T se aproxima a la curva normal tipificada

26


Tpica relacin entre una curva T y una curva normal tipificada

Ejemplo: El valor t con v =14 grados de libertad que tiene un rea de 0.025 a la izquierda, y por lo
tanto un rea de 0.975 a la derecha, es:


Ejemplo: Encuentre
Dado que tiene un rea de 0.05 a la derecha, y tiene un rea de 0.025 a la izquierda, se
tiene un rea total de:

De aqu que,


ESTIMACIN DE UNA PROPORCION
El mejor estimador de la proporcin (p) de una caracterstica de una poblacin es la proporcin
observada (p
o
) en una muestra, que se corresponde con la frecuencia relativa de una caracterstica
en la muestra.

27

Si obtenemos distintas muestras de tamao n de una poblacin con una proporcin p de una
determinada caracterstica, los distintos valores de las proporciones observadas no son todos ellos
iguales y es necesario, por lo tanto, averiguar qu distribucin siguen. Se puede afirmar que la
distribucin de este estimador es una distribucin normal de media p y varianza p
x
q/n, cuando
el tamao de la muestra es suficientemente grande. Donde q al ser el complementario de p, vale
1-p.

INTERVALO DE CONFIANZA DE UNA PROPORCION
Al seguir esta variable p una distribucin normal, se puede calcular un intervalo que contenga
entre sus lmites una gran proporcin de los valores de la variable p:

p
Distribucin de intervalos de proporciones
Ejemplo. En un estudio para una empresa, se toma una muestra aleatoria de 280 trabajadores, y
se estudia la variable edad. Se desea realizar la estimacin por intervalo de confianza del 0.95 de la
proporcin de trabajadores de esa empresa con 28 aos o ms: luego se encontr que hay 70
trabajadores con 28 aos o ms. La estimacin puntual de p es p
o
siendo: p
o
= 70/280 = 0.25, que

28

representa el 25% de los trabajadores con 28 aos o mas. Sabiendo que: q
o
=1 - p
o
= 1 - 0,25 =
0,75, y consultando la tabla de la distribucin normal tipificada, se encuentra que el valor de
para una confianza del 0,95 es de 1.96, se obtiene:




De manera que, el intervalo de confianza del 0.95 de la proporcin de hombres con denticin
completa esta entre 0.1933 0.3007; es decir, que existe una probabilidad del 0,95% de que este
intervalo contenga entre sus lmites el valor de p.


29

CAPITULO III: PRUEBA DE HIPTESIS
Definicin de trminos. Tipos. Pruebas de hiptesis para promedios y proporciones para una y dos
poblaciones.

PRUEBA DE HIPTESIS
Definicin
Un contraste de hiptesis (tambin denominado test de hiptesis o prueba de significacin) es una
metodologa de inferencia estadstica para juzgar si una propiedad que se supone cumple una
poblacin estadstica es compatible con lo observado en una muestra de dicha poblacin. Fue
iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson.
Una prueba estadstica es un procedimiento para, a partir de una muestra aleatoria y significativa,
extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el
valor de un parmetro desconocido de una poblacin.
La hiptesis emitida se designa por H0 y se llama hiptesis nula.
La hiptesis contraria se designa por H1 y se llama hiptesis alternativa.

Contraste de Hiptesis
La aplicacin de clculos probabilsticos permite determinar a partir de qu valor debemos
rechazar la hiptesis garantizando que la probabilidad de cometer un error es un valor conocido a
priori. Las hiptesis pueden clasificarse en dos grupos, segn:
1. Especifiquen un valor concreto o un intervalo para los parmetros del modelo.
2. Determinen el tipo de distribucin de probabilidad que ha generado los datos.
Se denomina hiptesis nula a la hiptesis que se desea contrastar. El nombre de "nula" indica
que representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad, y
puede entenderse, por tanto, en el sentido de neutra. La hiptesis nunca se considera
probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de que dos
poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas difieren
mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser

30

"demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las medias
difieran en una cantidad lo suficientemente pequea para que no pueda ser detectada, aunque
la muestra sea muy grande.
A partir de una muestra de la poblacin en estudio, se extrae un estadstico (esto es, una valor que
es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la hiptesis en
estudio y sea conocida. Se toma entonces el conjunto de valores que es ms improbable bajo la
hiptesis como regin de rechazo, esto es, el conjunto de valores para el que consideraremos que,
si el valor del estadstico obtenido entra dentro de l, rechazaremos la hiptesis.
La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo an
siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger dicha regin de tal
forma que la probabilidad de cometer este error sea suficientemente pequea.

Procedimiento:
1. Enunciar la hiptesis nula H0 y la alternativa H1.
Bilateral H0=k H1 k
Unilateral
H0 k H1 < k
H0 k H1> k
2. A partir de un nivel de confianza 1 o el de significacin . Determinar:
El valor z/2 (bilaterales), o bien z (unilaterales)
La zona de aceptacin del parmetro muestral (x o p').
3. Calcular: x o p', a partir de la muestra.
4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis
con un nivel de significacin . Si no, se rechaza.
5. Se especifica la decisin de la prueba si se rechaza o no la hiptesis nula.
6. Se da una conclusin referente al caso que llevo a la prueba de hiptesis, la misma que tiene
que ser en un lenguaje comn.


31

Errores de Tipo I y II
En toda prueba de hiptesis existen dos tipos de errores, llamados Error de tipo I y error de tipo II;
el hecho de que las hiptesis, tanto la nula cmo la alternativa puedan recoger en sus
planteamientos uno o varios valores, da lugar a hiptesis de carcter simple, si el nmero de
valores plausibles e hipotticos es de uno en ambas, o bien a hiptesis compuestas si dicho valor
no es nico en alguna de ellas.
Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hiptesis
puede plantearse como un problema de decisin, en el que evidentemente existe la posibilidad de
fracasar o acertar en la eleccin o decisin a la hora de concluir que la hiptesis, bien nula o bien
alternativa, son rechazables o no.
Como es lgico para que una prueba de hiptesis o regla de decisin sea eficiente, es necesario
que ambos errores sean mnimos, esto no es tan fcil de lograr sobre todo cuando la muestra ya
esta dada. Un intento de disminuir uno de los errores aumenta el otro. La naturaleza de las
investigaciones obliga muchas veces a poner nfasis en la limitacin de un error, de all que en
muchos casos hagamos hincapi en el error de tipo I.
El problema de decisin: rechazo/no rechazo, vendra expresado en las siguientes opciones en
forma de tabla:
Hiptesis/Accin No Rechazamos Rechazamos
Es cierta Correcto Error Tipo I
Es falsa Error Tipo II Correcto

Prueba de Hiptesis sobre la Media Poblacional
Caso A: Cuando la varianza poblacional es conocida.
se distribuye normalmente y
conocemos tambin su varianza , o bien si nos es desconocida, el tamao muestral es lo
suficientemente grande cmo para poder utilizar la muestral cmo poblacional.

Hemos determinado un nivel de significacin para la realizacin del contraste y vamos a
plantearlo en el supuesto de realizar una muestra aleatoria de tamao n.

32

As: conocemos que
(

n
u N x
o
, de lo que deducimos que ] 1 , 0 [ N
n
u x

o
de forma que
la hiptesis nula es: H
0
:
0.
El estadstico est dado por:
n
u x
Z
o
0

= .

Ejemplo N 1

De 100 observaciones de una poblacin normal se obtiene que x = 5 y que S=2.Contrastar con
un nivel de significacin del 5% la hiptesis de que la media de la poblacin sea 7.

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
=7
H
1 =

2.
3.
n
u x
Z
o
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica: 10
100
2
7 5
=

= Z
6. Dado que Z=-10 y no pertenece a la regin de aceptacin estamos en condiciones de
=
7.

33

Ejemplo N 2
Un empresario est considerando la posibilidad de ampliar su negocio mediante la adquisicin
de un pequeo bar. El dueo actual del bar afirma que el ingreso diario del establecimiento
sigue una distribucin normal de media 675 soles y una desviacin estndar de 75 soles. Para
comprobar si deca la verdad, tom una muestra de treinta das y sta revel un ingreso diario
promedio de 625 soles. Utilizando un nivel de significacin del 10 %. Hay evidencia de que el
ingreso diario promedio sea menor del que afirma el presente dueo?.

Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0 >
675
H
1

2.
3.
n
u x
Z
o
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica: 65 . 3
30
75
675 625
=

= Z
6. Dado que Z=-3.65 y no pertenece a la regin de aceptacin estamos en condiciones de


Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequea.
Deseamo
muestral es pequeo, no podemos utilizar la muestral en su lugar.

34


Hemos determinado un nivel de significacin para la realizacin del contraste y vamos a
plantearlo en el supuesto de realizar una muestra aleatoria de tamao n.
As: conocemos que
1

n
t
n
s
u x
de forma que la hiptesis nula es: H
0 0.
El estadstico est dado por:
n
s
u x
t
0

= .
Ejemplo 3
Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71
metros con desviacin tpica de 0,02 .Contrastar la hiptesis de que la estatura media nacional
sea de 1.75 metros si utilizamos un nivel del significacin del 5%. Se supone normalidad
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: =1.75
H
1 =

2.
3.
n
s
u x
t
0

=
4. Establecemos la regin de aceptacin y de rechazo:
Utilizamos la tabla T.

5. Realizamos la prueba estadstica: 25 . 8
17
02 . 0
75 . 1 71 . 1
=

= t
6. Dado que t=-8.25 y no pertenece a la regin de aceptacin estamos en condiciones de


35

Prueba de Hiptesis para la Proporcin Poblacional: p
Se trata de efectuar una prueba de hiptesis acerca de la proporcin de elementos con
cierto atributo en una poblacin, hiptesis de la forma:
H
0 0.
H
1
: p= p
0.

H
0
: psp
0.
H
1
: p>p
0.

H
0
: p>p
0.
H
1
: p<p
0.

El estadstico est dado por:
n
p p
p P
Z
) 1 (
0 0
0

=
Donde
n
x
P = (proporcin muestral)

Tiene una distribucin N(0,1) cuando n>30.

Ejemplo 4.
Una empresa de publicidad desea comprobar si un determinado programa de televisin
es visto por el 30% de la audiencia potencial .Para ello se escoge al azar una muestra de
200 familias resultando que de ellas 50 lo ven asiduamente. Contrastar la hiptesis con un
nivel de significacin del 5%.
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: p=0.3
H
1
: p
=


36

2.
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica:
25 . 0
200
50
= = P
54 . 1
200
) 3 . 0 1 ( 3 . 0
30 . 0 25 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=-1.54 y pertenece a la regin de aceptacin estamos en condiciones


Ejemplo 5
Un fabricante de refrescos sin burbujas desea sacar al mercado una variedad de su
producto que tenga burbujas. Su director comercial opina que al menos el 50 % de los
consumidores ver con buenos ojos la innovacin. Se realiza un sondeo de mercado y
resulta que de 100 consumidores encuestados 40 son favorables a la innovacin.
a) Contrastar la hiptesis del director comercial frente a la alternativa de que el % de
aceptacin es inferior, con un nivel de significacin del 1%.
b) Si el aceptable la hiptesis de que el % de aceptacin del nuevo producto es inferior o
igual al 30 % el fabricante decidir no fabricarlo. Si es aceptable el criterio del director
comercial entonces s fabricarn el refresco con burbujas. Y si ninguna de las 2 hiptesis

37

es aceptable procedern a hacer otro sondeo. Para tomar esta decisin trabajarn con un
nivel de significacin del 5 %. Por qu optarn?.

Para el punto a)
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: ps0.5
H
1
: p
2.
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:

5. Realizamos la prueba estadstica:
4 . 0
100
40
= = P
2
100
) 5 . 0 1 ( 5 . 0
5 . 0 4 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=-2 y pertenece a la regin de aceptacin estamos en condiciones de
aceptar la hiptesis nula, es decir: ps

Para el punto b)
Aplicando el procedimiento para probar una hiptesis tenemos:
1. H
0
: ps0.3
H
1


38

2. %).
3.
n
p p
p P
Z
) 1 (
0 0
0

=
4. Establecemos la regin de aceptacin y de rechazo:


5. Realizamos la prueba estadstica:
4 . 0
100
40
= = P
18 . 2
100
) 3 . 0 1 ( 3 . 0
3 . 0 4 . 0
) 1 (
0 0
0
=

=
n
p p
p P
Z
6. Dado que Z=2.18 y pertenece a la regin de aceptacin estamos en condiciones de
aceptar la hiptesis nula, es decir: ps
refresco.

Estimacin de una Diferencia entre Dos Medias de Poblaciones normales (Poblacin 1 y 2)
Para encontrar el intervalo de la diferencia de la media de dos poblaciones se considera
que las muestras tomadas de las poblaciones son independientes.

Si se conoce las desviaciones estndar poblacionales (
1
o Y
2
o ).
El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior: ( )
2
2
2
1
2
1
2 1
n n
z x x
tabla
o o
+ - ;

39

Lmite superior: ( )
2
2
2
1
2
1
2 1
n n
z x x
tabla
o o
+ - +
Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
1
n : es el tamao de la muestra tomada de la poblacin 2
1
x : es la media de la muestra tomada de la poblacin 1
2
x : es la media de la muestra tomada de la poblacin 2
1
o : es la desviacin estndar de la poblacin 1
2
o : es la desviacin estndar de la poblacin 2
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

Si no se conoce las desviaciones estndar poblacionales (
1
o Y
2
o )

El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior:
2 1
2 ; 2 1
1 1
* *
2 1
n n
s t x x
p n n gl tabla
+
+ =
;
Lmite superior:
2 1
2 ; 2 1
1 1
* *
2 1
n n
s t x x
p n n gl tabla
+ +
+ =

Donde:
2 ; =n gl tabla
t : es el valor t de la tabla t de Student, con 2
2 1
+ n n grados de libertad

Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales,
2
c
s representa entonces la varianza comn y se calcula:
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
p


40


41

Estimacin de una Diferencia entre Dos Proporciones Poblacionales (Poblacin 1 y 2).
(Caso de muestras grandes)

El intervalo de ( )% 1 100 o , resulta ser:
Lmite inferior: ( )
2
2 2
1
1 1
2 1


n
Q P
n
Q P
z p p
tabla
-
+
-
- ;
Lmite superior: ( )
2
2 2
1
1 1
2 1


n
Q P
n
Q P
z p p
tabla
-
+
-
- +
Donde:
1
n : es el tamao de la muestra tomada de la poblacin 1
2
n : es el tamao de la muestra tomada de la poblacin 2
1

P : es la proporcin en la muestra tomada de la poblacin 1;


1 1

P Q =
2

P : es la proporcin en la muestra tomada de la poblacin 1;


2 2

P Q =
N es el tamao de la poblacin
tabla
z : es el valor z de la tabla N(0,1)

Prueba de Hiptesis para una Diferencia de Medias de Poblaciones con distribucin
normal (Con muestras independientes).

Aqu se tiene entonces: ( )
2
1 1 1
; ~ o N X y ( )
2
2 2 2
; ~ o N X

En este caso las hiptesis son de la forma:
1.
2 1
2 1 0
:
:


=
=
a
H
H
2.
2 1
2 1 0
:
:


<
=
a
H
H
3.
2 1
2 1 0
:
:


>
=
a
H
H

En forma equivalente se puede plantear las hiptesis:

42

1.
0 :
0 :
2 1
2 1 0
=
=


a
H
H
2.
0 :
0 :
2 1
2 1 0
<
=


a
H
H
3.
0 :
0 :
2 1
2 1 0
>
=


a
H
H


Caso en que se conocen las varianzas poblacionales (
2
1
o Y
2
2
o )
El valor calculado es:
2
2
2
1
2
1
2 1
n n
x x
z
calc
o o
+

=
Los valores crticos son: Hiptesis tipo 1:
tabla
z y
tabla
z , Hiptesis tipo 2:
tabla
z ,
Hiptesis tipo 3:
tabla
z

Caso en que no se conocen las varianzas poblacionales (
2
1
o Y
2
2
o )

Si se considera que:
2
2
2
1
o o =
El valor calculado es:
2 1
2 1
1 1
n n
s
x x
t
p
calc
+

=
Donde:
( ) ( )
2
1 1
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
p

2
1
s y
2
2
s ; son las varianzas de las muestras sacadas de la poblacin 1 y 2 respectivamente
1
x y
2
x ; son las medias de las muestras sacadas de la poblacin 1 y 2 respectivamente
Los valores crticos son:
Hiptesis tipo 1:
2 ;
2 1
+ =

n n gl tabla
t y
2 ;
2 1
+ = n n gl tabla
t
Hiptesis tipo 2:
2 ;
2 1
+ =

n n gl tabla
t
Hiptesis tipo 3:
2 ;
2 1
+ = n n gl tabla
t


43


Si se considera que:
2
2
2
1
o o =
El valor calculado es:
2
2
2
1
2
1
2 1
n
s
n
s
x x
t
calc
+

=
Los valores crticos son los mismos anteriores, pero, los grados de libertad estn dados
por:
2
1
1
1
1
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+
+
|
|
.
|

\
|
+
|
|
.
|

\
|
+
=
n
s
n n
s
n
n
s
n
s
gl


Ejemplo 6: Dos fabricantes A y B producen un artculo similar, cuyas vidas tiles tienen
desviaciones estndar respectivas de 120 horas y 90 horas. Para comparar el promedio de
vida til de estos artculos se extrae una muestra aleatoria de 60 artculos de cada
fabricante encontrndose la duracin media de 1.230 horas para la marca A y de 1.190
horas para la marca B. Se puede concluir a un nivel de significacin del 5% que los
artculos de marca A tienen mayor duracin media que los artculos de marca B?

Se tiene una prueba de hiptesis para la diferencia de dos medias con varianzas
poblacionales conocidas.
Datos: 645 , 1 z 90 ; 120 ; 190 . 1 ; 230 . 1 ; 60
tabla
2 2
2
2 2
1 2 1 2 1
= = = = = = = o o x x n n
En este problema, si bien es cierto, no se dice que las poblaciones sean normales, se tiene
que los tamaos de muestra son grandes, por lo que la estadstica de prueba:
2
2
2
1
2
1
2 1
n n
x x
z
calc
o o
+

=

44

Tiene una distribucin aproximadamente normal estndar, por lo que se puede usar lo
presentado en el punto 4.1.
0 :
0 :
2 1
2 1 0
>
=


a
H
H

El valor calculado es: 07 , 2
60
90
60
120
190 . 1 230 . 1
2 2
2
2
2
1
2
1
2 1
=
+

=
+

=
n n
x x
z
calc
o o

Valor critico: 645 , 1 =
tabla
z
La regin de rechazo es entonces: | | = ; 645 , 1 RR

Por lo tanto se rechaza Ho, se acepta Ha. Se puede decir que existen evidencias
significativas, al nivel de significacin del 5%, para decir que la duracin media de los
artculos de marca A es mayor a los de marca B.


Prueba de Hiptesis para una Diferencia de Proporciones (Muestras grandes).
En este caso las hiptesis son de la forma:
1.
2 1
2 1 0
:
:
P P H
P P H
a
=
=
2.
2 1
2 1 0
:
:
P P H
P P H
a
<
=
3.
2 1
2 1 0
:
:
P P H
P P H
a
>
=


En forma equivalente se puede plantear las hiptesis:
1.
0 :
0 :
2 1
2 1 0
=
=
P P H
P P H
a
2.
0 :
0 :
2 1
2 1 0
<
=
P P H
P P H
a
3.
0 :
0 :
2 1
2 1 0
>
=
P P H
P P H
a


El valor calculado es:
( )
|
|
.
|

\
|
+ -

=
2 1
2 1
1 1


n n
P P
P P
z
calc


45

Donde:
2 1
2 2 1 1

n n
P n P n
P
+
- + -
=
Los valores crticos son:
Hiptesis tipo 1:
tabla
z y
tabla
z
Hiptesis tipo 2:
tabla
z
Hiptesis tipo 3:
tabla
z
Ejemplo 7:
Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada
poblacin revel que 120 hombres y 120 mujeres estaban a favor de cierto candidato. Se
puede concluir a un nivel de significacin del 5% que la proporcin de hombres a favor del
candidato es mayor que la proporcin de mujeres?

Aqu se tiene una prueba de hiptesis para diferencias de proporciones con muestras
grandes.
Si denotamos con 1 a la poblacin de hombres y con 2 a la de mujeres, se tiene:
1 Plantear las hiptesis de inters
2 1
2 1 0
:
:
P P H
P P H
a
>
=

2 Calcular la estadstica de prueba (valor calculado), bajo Ho:
El valor calculado es:
( )
76 , 2
400
1
300
1
66 , 0 34 , 0
3 , 0 4 , 0
1 1


2 1
2 1
=
|
.
|

\
|
+ -

=
|
|
.
|

\
|
+ -

=
n n
P P
P P
z
calc

Donde: 34 , 0
400 300
3 , 0 400 4 , 0 300

2 1
2 2 1 1
=
+
- + -
=
+
- + -
=
n n
P n P n
P
3 Construir la regla de decisin y decidir
El valor crtico es: 645 , 1 =
tabla
z

46

La regin de rechazo (RR) es: | | = ; 645 , 1 RR
Por lo tanto se rechaza Ho, se acepta Ha
Se puede decir entonces que existen evidencias suficientes, a un 5% de significacin, para
decir que la proporcin de hombres a favor del candidato es mayor que el de las mujeres,
en esa poblacin.

47

BIBLIOGRAFIA
1) HINES W. Y MONTGOMERY D. Probabilidad Y Estadstica, Para Ingeniera y
Administracin. Cuarta Edicin. Editorial Continental. Mxico 2004.
2) Webster, Allen L.: Estadstica Aplicada a los Negocios y la Economa Irwin Mc.
Graw-Hill Interamericana S.S. Tercera Edicin. Colombia 2000.
3) Mason, Robert D.: Estadstica para Administracin y Economa. 10 Unid Douglas a.
Edicin Alfaomega grupo Editor S.A. de C.V. y Marchal, William G. Mxico 2001.
4) Kasmier Leonar, J.: Estadstica aplicada a la Administracin y Economa. Edit
Shaum. Tercera edic. Mc Graw Hill Interamericana Editores S.A. C.V.- Mxico
1998.
5) Levin, Richard I.: Estadstica para Administradores. Sexta Edicin. Prentice Hall
Hispanoamericana S.A. Mxico 1996.
6) Jonson, Robert: Estadstica elemental lo esencial Segunda edicin International
Thomson editores S.A. de C.V. Mxico 1999.
7) Stevenson, William: Estadstica para Administracin y Economa. Edit. Harla S.A.
1981
8) Newbaold, Paul: Estadstica para los Negocios y la Economa 4ta edicin
Prenticemay Madrid 1998.

Вам также может понравиться