Вы находитесь на странице: 1из 21

6.

ESTIMACIN DE PARAMETROS
6.1. INTRODUCCIN
A la inferencia estadstica le interesa sacar conclusiones de un gran nmero de
acontecimientos (poblacin), fundndose en las observaciones de una parte de los mismos
(muestra).

La estadstica nos proporciona herramientas que formalizan y uniforman los procedimientos
para sacar conclusiones siempre que las muestras seleccionadas sean representativas de la
poblacin que han sido extradas. Esta representatividad permite extender los valores que
describen a las muestras (estadsticos), tales como la media, la desviacin tpica, un coeficiente
de correlacin, a la poblacin correspondiente, es decir, la media o la desviacin tpica
(estadsticos) pueden tomarse como estimadores de los parmetros y , valores que
caracterizan a la poblacin.

Los estadsticos, valores obtenidos en la muestra, son, pues, estimadores de los parmetros
correspondientes (valores de la poblacin)
6.2. CARACTERISTICAS DE UN BUEN ESTIMADOR

Conviene que los estadsticos, en su funcin de estimadores de los correspondientes
parmetros, renan determinados requisitos. Fundamentalmente son:

CARENCIA DE SESGO.

Un estimador (estadstico) carece de sesgo si el promedio (media) de todos los valores posibles
de todas las muestras posibles de tamao n de una poblacin es igual al parmetro, es decir, si
la media de la distribucin muestral del estadstico considerado es igual al valor del parmetro.
As, la media es un estimador insesgado de porque se puede demostrar que la media
aritmtica de una distribucin muestral coincide con el valor del parmetro, algo que no puede
decirse de r, por ejemplo, o de la varianza (s2) o de la mediana de una poblacin no distribuida
normalmente.

CONSISTENCIA

Un estimador es consistente en la medida en que, al aumentar el tamao de la muestra, - n -
su valor se acerca cada vez ms al parmetro correspondiente o lo que es lo mismo, si a
medida que aumenta el tamao de la muestra, las estimaciones que sta proporciona son cada
vez ms prximas al valor del parmetro.

Algunos estimadores sesgados son consistentes, acercndose cada vez ms sus valores a los de
sus respectivos parmetros a medida que el tamao de la muestra (n) aumenta, tal es el caso
de s o s
2
que son estimadores sesgados pero consistentes de la desviacin tpica () o de la
varianza (
2
) de la poblacin.

EFICIENCIA

La 3 propiedad de los estimadores es su eficiencia, que se refiere a la precisin que alcanzan
los estadsticos en la estimacin de los parmetros, es decir, un estimador ser tanto ms
eficiente cuanto menos vare de muestra a muestra de una misma poblacin. Como la
variabilidad de una distribucin muestral viene dada por su error tpico, un buen estimador
ser aquel que menor error tpico alcanza. As, entre la media y la mediana, la primera es
claramente ms eficiente. La varianza de la distribucin muestral de la mediana es mayor que
la de la media, lo que significa que la mediana flucta ms que la media en muestras sucesivas
de la misma poblacin.

En una poblacin normal, la varianza de la distribucin muestral de la media es de
2
/n y la
varianza de la distribucin muestral de la mediana es de 1.57x
2
/n. Si comparamos la eficiencia
de la media respecto de la mediana dividiendo las varianzas de las distribuciones muestrales
respectivas, se aprecia la superioridad de la media en grado de eficiencia.

Eficiencia relativa = % 7 , 63 637 , 0
57 , 1
1
57 , 1
2
2
= =
n
n


Indicando con esto que para medidas normalmente distribuidas, independientemente de la
magnitud de n, la mediana es aproximadamente 2/3 menos eficiente que la media (Vase
Siegel, Cap. 3). Es decir que si se emplea una muestra de 100 casos y se utiliza la Me como
estimador de , puede obtenerse el mismo valor de estimacin calculando la media de 64
observaciones.

En general, para escoger un ptimo estimador de un parmetro, deben combinarse los
criterios de no tendenciosidad (carencia de sesgo) y de eficiencia. Ante dos estimadores
insesgados del mismo parmetro, se preferir aquel que tenga mayor eficiencia, es decir, que
tenga el mnimo error en trminos de varianza.

Estimadores insesgados: Media, Mediana, Moda, s
x
(distribucin normal n ), r
xy
=0,
( )
1
2
2

X X
s
i
x

Estimadores sesgados:
( )

X X
s
i
x

=
2
2
, s
x
, r
xy
0
Estimadores consistentes: Proporciones,
2
, ,
x x
s s X

Estimadores insesgados y eficientes: y
2

Estimadores insesgados y no eficientes: Me muestral y
2
3 1
Q Q +
[son estimadores insesgados
de ]
Estimadores sesgados y no eficientes: y desviacin tpica modificada (
2
1
s

) y rango
semiintercuartlico

6.3. ESTIMACIN PUNTUAL
Estimacin puntual: Es aquella que considera un nico valor como estimacin del parmetro;
es decir se usa un solo estadstico muestral para estimar el parmetro poblacional
correspondiente. Ej.: Si se desea conocer el promedio de horas que los alumnos universitarios
dedican a ver televisin se elige aleatoriamente una muestra y se calcula la media. Se supone
que la muestra es representativa de la poblacin y por lo tanto el valor calculado puede
considerarse como una buena estimacin del parmetro correspondiente. Tomamos un nico
valor como estimacin de su correspondiente parmetro.

La estimacin puntual de un parmetro no es muy significativa si no se acompaa de alguna
medida del error probable que se comete al realizar la estimacin. Por ello las estimaciones
suelen ser de intervalo.


6.3.1. METODOS
En este apartado vamos a dar dos mtodos sencillos y razonables para construir estimadores
que puedan aplicarse en cualquier situacin que nos encontremos: el mtodo de los
momentos y el mtodo de mxima verosimilitud.

Definicin: Sea ( X
1
, X
2
,..., X
n
) una muestra aleatoria simple de una poblacin X con funcin
de masa P

, o de densidad f

, donde = (
1
,
2
,...,
k
) es el vector paramtrico a estimar. El
estimador de por el mtodo de los momentos es el formado por los valores

1
,

2
,...,

k

obtenidos al resolver el siguiente sistema de ecuaciones:

E[ X ] =
1

n
X
i

n i=1
......................... k = n de parmetros a estimar
E[ X
k
] =
1

n
X
i
k



n

i=1

La justificacin de este mtodo es muy sencilla: se basa en la intuicin de que los momentos
de la poblacin se parecern a los momentos de la muestra.

Hay que sealar, no obstante, que el mtodo presenta serios inconvenientes ya que puede
darse el caso de que la estimacin obtenida quede fuera del espacio paramtrico (campo de
definicin del parmetro).


El mtodo ms utilizado para construir estimadores es el mtodo de mxima verosimilitud.
Est basado en una idea muy sencilla y no presenta los inconvenientes del mtodo de los
momentos.

La idea consiste en tomar como estimador de aquel valor que da ms probabilidad a la
muestra obtenida.

Definicin: Sea ( X
1
, X
2
,..., X
n
) una muestra aleatoria simple de una poblacin X con funcin
de masa P

, o de densidad f

, donde = (
1
,
2
,...,
k
) es el vector paramtrico a estimar. El
estimador de por el mtodo de mxima verosimilitud es el formado por los valores

1
,

2

,...,

k
que maximizan la llamada funcin de verosimilitud de la muestra (x
1
, x
2
,..., x
n
) obtenida:

L() = L(; x
1
, x
2
,..., x
n
) = P

(x
1
).P

(x
2
)...P

(x
n
)
(caso discreto)

L() = L(; x
1
, x
2
,..., x
n
) = f

(x
1
). f

(x
2
)... f

(x
n
)
(caso continuo)


La funcin de verosimilitud expresa la probabilidad, o densidad, que los diferentes valores de
dan a la muestra obtenida. Lo que hacemos es maximizar esa probabilidad, o densidad.
Por la propia definicin, la estimacin de mxima verosimilitud siempre es un valor del espacio
paramtrico.

En mucha ocasiones, la forma ms cmoda de encontrar el estimador de mxima verosimilitud
es considerando el logaritmo de la funcin de verosimilitud en lugar de la propia funcin de
verosimilitud, ya que es ms fcil de manejar, y presenta los mismos mximos y mnimos. Para
obtener los estimadores resolvemos el sistema:
log L()
=

0

1

................. k = n de parmetros a estimar
log L()
=

0

k


Por supuesto, hay que tener cuidado con este procedimiento, ya que el punto obtenido puede
no corresponder con un mximo (puede ser un mnimo o punto de inflexin). Adems puede
ocurrir que el mximo se alcance en un extremo, y no obtengamos ningn beneficio de este
procedimiento.

Sealemos que si

es el estimador de mxima verosimilitud del parmetro , entonces g (

)
es el estimador de mxima verosimilitud de g () . De esta

manera, si hemos obtenido que X es el estimador de mxima verosimilitud de , entonces X
2

es el estimador de mxima verosimilitud de
2
.

Ejemplo: Sea una muestra aleatoria de tamao n de una poblacin X con distribucin de
Bernoulli de parmetro p. Encontramos el estimador p del parmetro p.
En este caso la funcin de masa es P(x) = p
x
(1 p)
1x

Estimador por el mtodo de los momentos:
E[ X ] = p , como
1

n
x
i
= x , tomamos como estimador del parmetro p el
n
i=1
valor de la media muestral p = x .
Estimador por el mtodo de la mxima verosimilitud:
L( p) = P(x
1
).P(x
2
)....P(x
n
) =
= p
x
1
(1

p)
1x
1
.p

x
2
(1

p)
1x
2
....p

x
n
(1

p)
1x
n
=

= p

x
i
(1

p)
n

x
i
log L( p) = (x
i
) log p +(n x
i
) log(1 p)

log L( p)
=

x
i


n x
i

= 0 (sistema a resolver)


p

p 1 p

x
i
n
+

x
i = 0


p 1 p 1 p
( 1
p
+
1
1
p
)

x
i
=
1
n
p



1 p

+

p
xi =
n




p(1 p) 1 p
1
p

x
i
= n

p = x


6.3.2. MAXIMA VERISIMILITUD
Sea X una variable aleatoria con distribucin f ( x ; ) donde es el parmetro desconocido.
Sean X
1
, X
2
, . . . X
n
n variables aleatorias independientes con la misma distribucin que X; es
decir, sea ( X
1
, X
2
, . . . X
n
) una m.a.s. Bajo estas condiciones la distribucin conjunta de las
variables aleatorias X
1
, X
2
, . . . X
n
ser igual al producto de las marginales.

f ( x
1
, x
2
, . . . , x
n
; ) = f ( x
1
; ) f ( x
2
; ) . . . f ( x
n
; )

Si consideramos x
1
, x
2
, . . . x
n
fijos y estudiamos esta funcin como funcin de recibe el
nombre de funcin de verosimilitud y se denota por V( ).

Sean


1
= u
1
( X
1
, X
2
, . . . X
n
) ,


2
= u
2
( X
1
, X
2
, . . . X
n
) , etc. diversos estimadores de .
De todos ellos pretendemos elegir el que haga mxima la funcin de verosimilitud. Es decir, un
estimador

ser estimador mximo-verosmil (EMV) de si maximiza V( ).



Debido a que la funcin de verosimilitud es no negativa, continua y creciente, alcanzar su
mximo en los mismos puntos que su logaritmo y por ello, y por razones de clculo se suele
maximizar ln V ( ) cuando esta depende de exponenciales.As pues, deberemos resolver la
siguiente ecuacin:

d ( ln V ( ) )
d
= 0


En el caso de dos o ms parmetros desconocidos, el procedimiento es el mismo. Por ejemplo,
si tuviramos V (
1
,
2
,
3
) los tres estimadores mximo verosmiles sern los que
maximizan la funcin V (
1
,
2
,
3
) o su logaritmo. Se obtendran al resolver las ecuaciones
siguientes:

d ( ln V (
1
,
2
,
3
) )
d
1
= 0
^

d ( ln V (
1
,
2
,
3
) )
d
2
= 0


d ( ln V (
1
,
2
,
3
) )
d
3
= 0


Propiedades de los ESTIMADORES MUESTREALES V

a) Son consistentes.

b) Son asintoticamente eficientes. Es decir, tienen la varianza mnima cuando el tamao
muestral tiende a infinito.

c) Si


es estimador suficiente de

, el EMV de

es funcin de


.

d) Son asintoticamente normales. Es decir, su distribucin tiende a la distribucin normal
cuando tiende a infinito el tamao de la muestra.
e) Si

es EMV de , entonces g(

) es EMV de g( ), siendo g una aplicacin biyectiva.



Ejemplo: Obtener el EMV del parmetro de una v.a. X que sigue una distribucin de Bernouilli,
X Be( p ) . Su funcin de cuanta es f ( x ; p ) = p
x
( 1 p )
1 x


Si elegimos una muestra de tamao n, la funcin de verosimilitud correspondiente ser:

V ( p ) = f ( x
1
; p ) f ( x
2
; p ) . . . f ( x
n
; p ) = p
x
1
( 1 p )
1 x
1
p
x
2
( 1 p )
1 x
2
. . . p
x
n
( 1 p )
1 x
n
=

= p
x i
( 1 p )
n x i


Tomando logaritmos tenemos

ln V ( p ) = x
i
ln p + ( n x
i
) ln ( 1 p )

Para obtener el EMV de p debemos resolver la ecuacin

d ( ln V ( p ) )
dp
= 0
En este caso

d ( ln V ( p ) )
dp
= x
i
1
p
+ ( n x
i
)
( 1 )
( 1 p )
= 0


Haciendo operaciones e igualando denominadores obtenemos:

( 1 p ) x
i
p ( n x
i
) = x
i
p x
i
np + p x
i
= x
i
np = 0

Despejando el valor de p obtenemos el estimador p =
x
i

n

Por tanto EMV(p)=
x
i

n
. Es decir, la proporcin de xitos de la muestra.
6.3.1.2. MOMENTOS
Consiste en tomar como estimadores de los momentos poblacionales a los momentos
muestrales. Se obtiene una ecuacin de donde podemos despejar el parmetro a estimar.
6.4. INTERVALOS DE CONFIANZA PARA LA MEDIA
Si desconocemos la distribucin de la poblacin, podemos hallar un intervalo de confianza
para la media, basndonos en un resultado que conocemos como Desigualdad de TChebychev.

Sea X una v.a. cualquiera con media y varianza
2
. Se cumple que:

P
k

X +
k

|
\
|

1
1
k
2


Usando el anterior resultado, aplicndolo a la variable aleatoria X y tomando =
1
k
2
,
obtendramos que el intervalo para un nivel 1 sera:

X
n


n
, X
n
+

n


(



Para analizar los resultados que presentamos a continuacin, supongamos una poblacin que
se distribuye normal de media y varianza poblacional
2
. Tambin servirn cuando la
poblacin no es normal pero el tamao muestral es grande.

a) Si
2
es conocida.
Ya sabemos que
X
n


n
N ( 0 , 1 ) . Sea z
1

2
el percentil de la distribucin normal; es
decir, ( z ) = 1

2
.

P z
1

2

X
n


n
z
1

2
|
\


|

|
|
= 1


Haciendo operaciones P X
n
z
1

2

n
X
n
+ z
1

2

n
|
\

|

| = 1

Por tanto, el intervalo de confianza para ser:

X
n
z
1

2

n
, X
n
+ z
1

2

n



(

(


b) Si
2
es desconocida.
En este caso tenemos que
X
n

s
n
n 1 t
n 1

Por el mismo razonamiento anterior, si llamamos t
n 1
1

2
al percentil de la distribucin t de
Student tal que P t
n 1
x ( ) = 1

2
, el intervalo de confianza al nivel de significacin (o
equivalentemente, al nivel de confianza 1- ) ser:

X
n
t
n 1
1

2
s
n
n 1
, X
n
+ t
n 1
1

2
s
n
n 1



(

(


Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitarios. Responden a una prueba de
inteligencia espacial, en la que alcanzan una media de 80 y una varianza de 100. Entre qu
lmites se hallar la verdadera inteligencia espacial media de los estudiantes, a un nivel de
confianza del 99%?
1 = 0 ' 99 = 0 ' 01 1

2
= 0 ' 995

La varianza poblacional es desconocida y la poblacin no es normal, pero el tamao muestral
es mayor que 30, por tanto, el intervalo correspondiente ser:

X
n
t
n 1
1

2
s
n
n 1
, X
n
+ t
n 1
1

2
s
n
n 1



(

(


Buscamos en las tablas la distribucin t de Student t
6 0
0 , 9 9 5
= 2 ' 66.

Sabemos que X
n
= 80 y s
n
= 10. Sustituyendo en el intervalo de confianza tenemos:


80 2 ' 66
10
60
, 80 + 2 ' 66
10
60



(

(

por tanto, 76' 57, 83' 43 | | con un nivel de confianza del 99%.
6.6. INTERVALO DE CONFIANZA PARA LA PROPORCIN
Si en una poblacin Bernouilli de parmetro p definimos la v.a. X= n xitos en la muestra, X
sigue una distribucin binomial de parmetros (n,p). Si la muestra es grande, tenemos que la
proporcin muestral P=X/n se distribuye aproximadamente como una normal N p ,
pq
n
|
\

|

| y
podremos usar el teorema central del lmite.

En una poblacin Bernoulli, = p ,


2
= p ( 1 p ) y si denotamos por P a la proporcin
en la muestra X
n
= P. As pues podemos aplicar el intervalo de confianza para la media con
varianza conocida visto anteriormente, sustituyendo lo anterior y aproximando p(1-p) por P(1-
P). un intervalo de confianza aproximado para p a nivel 1 sera:

P z
1

2
P( 1 P)
n
, P+ z
1

2
P( 1 P)
n



(

(


Ejemplo: Uno de los lderes de un colectivo laboral desea plantear una cuestin a todos los
miembros del grupo. Si ms de la mitad respondieran NO entonces preferira no plantearla
para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100 trabajadores a los
que hace la pregunta y slo 30 responden NO. Entre qu lmites se hallar la verdadera
proporcin al nivel del 95%?

Como el tamao muestral es grande, podemos aplicar el teorema central del lmite. Tenemos
1 = 0 ' 95 1

2
= 0 ' 975 z
1

2
= 1 ' 96
Sustituyendo los valores en el intervalo correspondiente:

0 ' 3 1 ' 96
0 ' 3 0 ' 7
100
, 0 ' 3 + 1 ' 96
0 ' 3 0 ' 7
100



(

(
= 0 ' 2102 , 0 ' 3898 | |


Por tanto, la verdadera proporcin est en el intervalo 0 ' 2102 , 0 ' 3898 | | con un nivel de
confianza del 95%.
6.7. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES.
Sean X Be( p
1
) e Y Be( p
2
) dos poblaciones independientes con p
1
y p
2
desconocidos. Extraemos muestras de tamao n
1
y n
2
, respectivamente. Como
P
1
P
2
N p
1
p
2
,
p
1
q
1
n
1
+
p
2
q
2
n
2
|
\

|

|
y desconocemos los valores de p
1
y p
2
,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza ser:

p
1
p
2
P
1
P
2
z
1

2
P
1
Q
1
n
1
+
P
2
Q
2
n
2
, P
1
P
2
+ z
1

2
P
1
Q
1
n
1
+
P
2
Q
2
n
2



(

(


Caso particular: Si tenemos p
1
= p
2
= p , entonces E P
1
P
2
| | = 0 y
Var P
1
P
2
| | = pq
1
n
1
+
1
n
2
|
\

|

|
. Lo que haremos es sustituir p por
n
1
P
1
+ n
2
P
2
n
1
+ n
2

Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la proporcin de mujeres
entre sus empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de 40
empleados entre los diplomados y licenciados, obtenindose que en la empresa A haba 16
mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de
proporciones poblacionales al nivel de confianza 0'96 Podemos pensar que la proporcin es la
misma?

1 = 0 ' 96 1

2
= 0 ' 98 z
1

2
= 2 ' 05


P
1
=
16
40
= 0 ' 4

P
2
=
22
40
= 0 ' 55

Sustituyendo en el intervalo:

0 ' 4 0 ' 55 2 ' 05
0 ' 4 0 ' 6
40
+
0 ' 55 0 ' 45
40
, 0 ' 4 0 ' 55 + 2 ' 05
0 ' 4 0 ' 6
40
+
0 ' 55 0 ' 45
40



(

(
=
=
0 ' 15 0 ' 2265 , 0 ' 15 + 0 ' 2265 | | = 0 ' 3765 , 0 ' 0765 | |

El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.

6.8. INTERVALO DE CONFIANZA PARA LA VARIANZA
Si tenemos una poblacin X N ( ,
2
) con
2
desconocida, entonces

( ) n s
n
n

1
1
2
2 1
2



El intervalo de confianza para la varianza poblacional al nivel de confianza 1 lo podemos
obtener como sigue:

P
n s
n
n
n

|
\

| =

1
2 1
2
2
1
2
2
1
2
1
1
( )


Despejando
2
tenemos:


=
|
|
|
|

\
|

1
) 1 ( ) 1 (
2
1
2
1 2
2
1
2
1
2 2
1
n
n
n
n
s n s n
P


Es decir,



2 1
2
1
2
1
2
1
2
1 1
1
2 2

(
(
(

( )
,
( ) n s n s
n
n
n
n


Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la poblacin espaola. Segn las ltimas tablas en el servicio militar, los varones
entre 18 y 20 aos presentan una varianza de 0'0529. de las mujeres no tenemos informacin,
por ello tomamos una muestra de 101 mujeres entre 18 y 20 aos y obtenemos 18 ' 0
1
=
n
s
Entre qu valores se encontrar la verdadera varianza a un nivel de 0'95 de confianza?

22 ' 74 975 ' 0
2
1 95 ' 0 1
2
100
025 ' 0
= = =



Sustituyendo en el intervalo tendremos:

| | 0436 ' 0 , 025 ' 0
22 ' 74
18 ' 0 100
,
56 ' 129
18 ' 0 100
2 2
=
(




6.9. INTERVALO DE CONFIANZA PARA LA RELACIN DE VARIANZAS
La distribucin muestral del cociente de varianzas muestrales, cuando tenamos dos
poblaciones normales e independientes era:

1 , 1
2
2
2
1
2
1
2
1

m n
m
n
F
s
s



A partir de aqu deducimos el intervalo de confianza para el cociente de varianzas
poblacionales al nivel de 1 y obtenemos

(
(
(
(

2 2
1
1 , 1
2
1
2
1
1 , 1
2
1
2
1
2
2
2
1
1
,
1

m n
m
n
m n
m
n
F
s
s
F
s
s


Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para el
cociente de varianzas al nivel de confianza 0'95. Podramos aceptar la suposicin de que las
varianzas poblacionales son iguales?

07 ' 2 975 ' 0
2
1 95 ' 0 1
975 ' 0
30 , 30
= = = F

y
07 ' 2
1 1
025 ' 0
2
975 ' 0
025 ' 0
30 , 30
30 , 30
= = =
F
F


47 ' 5 3 ' 2
30
31
1
2 2 2
1
= =

=
n n
s
n
n
s 3 ' 9 3
30
31
1
2 2 2
1
= =

=
m m
s
m
m
s

Sustituyendo en el intervalo obtenemos
| | 218 ' 1 , 284 ' 0
07 ' 2 1
1
3 ' 9
47 ' 5
,
07 ' 2
1
3 ' 9
47 ' 5
=
(



El intervalo contiene al 1 y los extremos estn bastante prximos al 1. Hay mayor diferencia
por el extremo inferior, lo que indica que la varianza de la poblacin X es menor que la de la
poblacin Y.
6.10 DETERMINACIN DEL TAMAO DE LA MUESTRA
En general, cuanto ms estrecho es un intervalo de confianza mayor precisin tendr nuestra
estimacin (ser menor el error muestral mximo). Ahora bien, la amplitud de un intervalo
depende de dos factores: el nivel de confianza que decidimos utilizar y el tamao del error
tpico (es la desviacin tpica) del estadstico utilizado como estimador.

Si disminuimos el nivel de confianza, diminuye la amplitud del intervalo, pero aumenta el
riesgo. Debemos intentar reducir la amplitud del intervalo manteniendo constante el nivel de
confianza; para ello hay que reducir el error tpico del estimador.
En el caso de la media, el error tpico es
n
x

= . Por lo tanto, variando el tamao


muestral variaremos el error tpico. Al aumentar n, disminuye
x
. Por tanto, manipulando el
tamao de la muestra podemos obtener los intervalos de la precisin que deseemos.
6.10.1. BASADO EN LA MEDIA DE LA PROBLACIN

Para la media:

2
2
1
2
1
|
|

\
|
= =

E
z n
n
z E



2
1
1
1
1
2
1
2
1
|
|

\
|
= =

E
s
t n
n
s
t E
n
n
n
n



6.10.1. BASADO EN PROPORCIN DE LA POBLACIN

Para la proporcin:
2
2
2
1
2
1
E
PQz
n
n
PQ
z E

= =

Ejemplo: Queremos estimar la media de una poblacin normal con varianza poblacional igual a
4. qu tamao muestral debemos tomar para que E=0'02 al nivel de confianza 0'95?
96 ' 1 975 ' 0
2
1 05 ' 0 95 ' 0 1
975 ' 0
= = = = z


Como conocemos la varianza poblacional, el tamao muestral ser:

2
2
1
|
|

\
|
=

E
z n

= 38416 ) 196 (
02 ' 0
2
96 ' 1
2
2
= =
|

\
|


y si queremos un error E=1 al mismo nivel de confianza? En este caso


2
2
1
|
|

\
|
=

E
z n

= 37 ' 15 ) 92 ' 3 (
1
2
96 ' 1
2
2
= =
|

\
|
. Redondeamos n=16.
6.10.3. BASADO EN LA DIFERENCIA DE LAS MEDIAS DE LA POBLACIN
Comparacin de medias
Grupos independientes
Grupos emparejados

el clculo del tamao de muestra para la comparacin de medias de datos
cuantitativos, cuando los dos grupos son independientes, asume que los datos
siguen una distribucin normal y se basa en la prueba t de Student. Los
factores que intervienen en el clculo son:
La desviacin estndar de cada grupo.
Es muy habitual en la prctica asumir que los dos valores son iguales y
adelantar una estimacin para ese valor comn. Machin y cols.
16

sugieren, cuando no se conoce la magnitud de la desviacin estndar,
una aproximacin que consiste en dividir por 4 el recorrido (diferencia
entre el mximo y el mnimo) de las observaciones, cantidad que suele
ser ms fcil de estimar o conocer de antemano.
La diferencia de medias esperada entre los dos grupos.
Esta cantidad representa la magnitud de la diferencia que se considera
clnicamente relevante y que se quiere poder declarar, en caso de que
exista, como estadsticamente significativa, con el nivel de confianza y la
potencia prefijadas. Es lo que, en ensayos clnicos, se conoce como
"tamao del efecto".
Un ndice que cuantifica la magnitud de la diferencia entre los grupos,
pero que es independiente de las unidades de medida, es la
denominada diferencia estandarizada de medias (d), y que resulta de
dividir la diferencia de medias, en valor absoluto, entre la desviacin
estndar comn de los dos grupos. Esta alternativa es la utilizada por
Machin y cols.
16
para generar tablas de tamaos muestrales, en el caso
de comparacin de medias independientes, que sean de uso general.
Los valores tabulados de d, siguiendo las recomendaciones de Cohen
17
,
oscilan entre 0,05 y 1,50. Segn este autor, para un efecto "pequeo" se
puede definir d=0,2 y si el efecto es "grande" se puede tomar d=0,8.
se puede seleccionar entre dos opciones excluyentes relativas a la
varianza de los dos grupos:
Varianzas conocidas: en este caso, los valores que pide el
programa son las desviaciones estndar de cada grupo, que
pueden ser iguales o no, y la diferencia de medias.
Varianzas desconocidas pero iguales: en este caso se asume
que los dos grupos tienen la misma desviacin estndar, que no
se conoce, y el valor que pide el programa es la diferencia de
medias estandarizada.
Razn entre los tamaos de muestra de los dos grupos
Habitualmente, el diseo de un estudio para la comparacin de medias
en dos grupos independientes contempla la seleccin de dos muestras
de igual tamao, pero puede ocurrir que esto no sea as. En Epidat 3.0,
es necesario especificar la razn entre los tamaos de muestra de los
dos grupos.
Si se selecciona la opcin de calcular tamaos de muestra, el resultado que
produce es el tamao de cada uno de los grupos en funcin del valor o valores
de potencia especificada. En el caso contrario, cuando se pide calcular
potencia, el dato de entrada debe ser el tamao de muestra total, es decir, la
suma de los dos grupos.


















BIBLIOGRAFIA
PROBABILIDAD Y ESTADSTICA SPIEGEL, MURRAY
http://bochica.udea.edu.co/~bcalderon/4_relvarianzasnormale
s.html
Cannavos G. Probabilidad y Estadstica Aplicacin y mtodos. Ed. en
espaol Mc
GRAW- HILL/INTERAMERICANA DE MEXICO.1995.
http://www.eumed.net/libros/2006a/rmss/a8.htm
Devore, J.L. (2000). Probabilidad y Estadstica para Ingeniera y Ciencias, Quinta
Edicin, Thomson Learning.
Mendenhall, W. (1998). Estadstica para Administradores, Segunda Edicin,
Grupo Editorial Iberoamrica.
Montgomery, D.C. y Runger G.C. (1996). Probabilidad y Estadstica Aplicadas a
la Ingeniera, Primera Edicin, Mc Graw Hill.
Sheaffer, R. L. y McClave, J.T. (1990). Probabilidad y Estadstica para Ingeniera,
Primera Edicin, Grupo Editorial Iberoamrica.
Spiegel, M.R. (1970). Estadstica, Primera Edicin, Serie Schaum, Mc Graw Hill.
Walpole, R. E., Myers, R.H., y Myers, S.L. (1998). Probabilidad y Estadstica para
Ingenieros, Sexta Edicin, Prentice Hall.
Weimer, R.C. (1996). Estadstica, Segunda Edicin, CECSA.












ACTIVIDADES ADICIONALES COMPLEMENTARIAS

1.- En dos grandes empresas se lleva a cabo un estudio sobre la proporcin de mujeres
entre sus empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de
40 empleados entre los diplomados y licenciados, obtenindose que en la empresa A
haba 16 mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de confianza para la
diferencia de proporciones poblacionales al nivel de confianza 0'96 Podemos pensar que
la proporcin es la misma?
2.- La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el
contenido de nicotina de dos marcas de cigarrillos.

Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas desconocidas, construya un intervalo de confianza del
95% para la diferencia real de nicotina de las dos marcas.

Вам также может понравиться