Вы находитесь на странице: 1из 23

TEORA DE MUESTREO

II.1 Muestreo

Actualmente el muestreo puede ser considerado como un instrumento organizado para obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de importancia de los problemas que se desean resolver, adems de ocuparse de la adecuada presentacin de los hechos individuales registrados y de la manera en que stos se recopilan y resumen.

Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son mencionadas a continuacin:

Costo reducido. Si los datos obtenidos provienen de una pequea fraccin de la poblacin, los gastos asociados a su recopilacin sern mucho menores que si se intenta realizar un censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de muestras que solamente representan una pequea fraccin de la poblacin. Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y resumirse rpidamente con una muestra, siendo esto de vital importancia cuando se requiere la informacin con urgencia. Mayor alcance. Para la realizacin de algunos tipos de encuestas se cuenta con personal y recursos limitados. Lo anterior conlleva a que la realizacin de un censo sea algo

imprctico, y por tanto se tiene mayor flexibilidad respecto a la informacin que se puede llegar a obtener. Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede utilizar personal ms capacitado y someterlo a entrenamiento intensivo, con el fin de tener una supervisin cuidadosa del trabajo de campo y procesamiento de los resultados.

En el diseo de una muestra hay que considerar dos aspectos; inicialmente un proceso de seleccin, en la que se incluyen en la muestra algunos elementos de la poblacin; y posteriormente un proceso de estimacin, en el que se llevan a cabos los clculos de las estadsticas de la muestra, que son estimadores muestrales de valores de la poblacin.

El diseo de una muestra considera las tareas de seleccin y estimacin para realizar inferencias que vayan del valor muestral al valor de la poblacin. Un valor de la poblacin es una expresin numrica que sintetiza los valores de una o varias caractersticas de la totalidad de la poblacin; en otras palabras, una medida resumen de una cualidad de la distribucin de la variable o variables en la poblacin definida.

El valor de la muestra, o estadstica, es una estimacin que se calcula a partir de los elementos que conforman la muestra. Por el contrario, el valor de la poblacin depende de todos los elementos que forman parte de la poblacin.

Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una

designacin de solo una fraccin de la poblacin total a ser observada en la muestra, sin embargo, al realizar un buen diseo de muestra, se tiene como consecuencia que estos errores tengan la menor presencia posible.

Dentro del muestreo se pueden distinguir varias formas. 1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de elementos que llegan por casualidad. 2. Seleccin experta, que se considera como un tipo de muestro no aleatorio, ya que personas consideradas como expertas se encargan de escoger unidades que consideran tpicas o representativas. 3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables demogrficas, se construye una muestra relativamente proporcional a la poblacin. 4. Muestreo de poblaciones mviles. En el que la poblacin total es estimada de la proporcin de individuos en la recaptura, que han sido capturados de manera previa y fueron marcados.

En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las distribuciones de las variables de encuesta en la poblacin. En un sentido contrario, en los casos de muestreo probabilstico, se pueden llevar a cabo inferencias de la poblacin por medio de mtodos estadsticos, sin tener que hacer suposiciones acerca de ella. En este ltimo, cada uno de los elementos de la poblacin tiene una probabilidad conocida adems de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al diseo de la muestra.

Las muestras probabilsticas en general son diseadas para ser medibles, es decir, la inferencia estadstica de los valores de la poblacin, resultado de la ejecucin de un muestreo en una poblacin particular, pueda basarse en medidas de variabilidad.

El muestreo aleatorio simple es el proceso de seleccin bsico y los dems procedimientos de seleccin de muestras pueden considerarse como modificaciones de l. 1. Mesip, es un mtodo de seleccin con igual probabilidad para todos los elementos de la poblacin. 2. Muestreo de elementos, en este tipo los elementos son tambin las nicas unidades de muestreo. 3. La estratificacin, se refiere a la seleccin de la muestra a partir de varias subpoblaciones conocidas como estratos, en los que se ha divido la poblacin. 4. La seleccin sistemtica, se puede considerar como una alternativa de seleccin aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias separadas en lista usando un intervalo de seleccin. 5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una muestra preseleccionada ms grande, que contiene informacin que permite mejorar la seleccin final.

Un buen diseo de muestra, requiere se equilibren en la medida de lo posible 4 criterios: a. Orientacin haca la meta. El diseo completo, tanto al momento de realizar la seleccin como la estimacin, debe estar orientado a los objetivos de la

investigacin. Estas consideraciones deben figurar al momento de seleccionar y definir a la poblacin, en la medicin y procedimientos de muestreo. b. La medibilidad es una caracterstica que permite calcular, a partir de la informacin de la muestra, estimaciones vlidas o aproximaciones de su variabilidad de muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia estadstica, y sirve como puente entre el resultado de la muestra, y el valor desconocido de la poblacin. c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar a cabo el diseo como se propuso de manera inicial. La simplicidad siempre debe encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa en gran medida la prdida de un poco de eficiencia terica. El arte del muestreo consiste en llevar a cabo un diseo prctico que se comporte de la mejor manera posible, an cuando no sea perfecto, y se adapte a un modelo. d. Economa, que se refiere a cumplir los objetivos con un costo mnimo. Una muestra ser demasiado pequea si los resultados que ofrece carecen de precisin suficiente para contribuir a las decisiones. Por otro lado, una muestra ser demasiado grande si sus resultados son ms precisos de lo que se requiere. Es necesario mediar estas dos situaciones considerando el costo en el que se incurre al realizar el muestreo.

En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar y combinar para conseguir un buen diseo de muestreo.

A continuacin se exponen caractersticas deseables de una muestra, que sin embargo no son por s mismos necesarios y suficientes para tener una buena muestra. - Las muestras probabilsticas requieren de probabilidades no nulas y que sean conocidas. - Las muestras medibles son muestras probabilsticas, diseadas para permitir estimar la variabilidad de muestreo. - Los muestreos mesip, que son clases especiales de muestreo probabilstico, requieren probabilidades iguales para cada uno de los elementos. - Los muestreos de rea usan segmentos de rea como unidades de muestreo. - Las muestras insesgadas denotan a aquellos diseos en los que el valor esperado es igual al valor de la poblacin. - Las muestras precisas son aquellas que tienen errores estndar bajos. - Las muestras econmicas tienen costos unitarios bajos para una varianza fija. - Las muestras eficientes denotan una precisin alta, es decir, baja varianza por elemento.

II.2 Muestreo Aleatorio Estratificado

II.2.1 Descripcin. En el muestreo estratificado a la poblacin que consta de N unidades se le divide de manera primaria en subpoblaciones con N1, N2,, NL unidades respectivamente. Estas poblaciones no deben contener ningn traslape, es decir, sus elementos deben ser excluyentes, y al reunirlas deben comprender la totalidad de la poblacin, de tal manera que:
N1 + N 2 +...+ N L = N

A cada una de estas subpoblaciones se le denominar estrato. Para lograr el beneficio total derivado de la estratificacin, los valores de las Nh deben ser conocidos. Cuando los estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta seleccin independiente en cada uno de los diferentes estratos. El tamao de las muestras en cada uno de los estratos se denota por n1, n2,,nL, respectivamente.

En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a todo el procedimiento se le designar con el nombre de muestreo aleatorio estratificado.

De la muestra que se obtenga en cada uno de los estratos, se calcula la media correspondiente, o cualquier otra estadstica, y sta se pondera apropiadamente para obtener una estimacin combinada del total de la poblacin. Del mismo modo, se calculan las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a una estimacin combinada para la poblacin.

La estratificacin es una tcnica empleada comnmente, debido a razones diversas entre las que encontramos:

Existencia de una gran conveniencia administrativa, ya que si se cuenta con diversas oficinas de campo, se pueden supervisar varias encuestas en distintas partes de la poblacin. Presencia de problemas de muestreo que no son homogneos para todas las partes de la poblacin, por lo que al dividirla es posible conseguir estratos que compartan

caractersticas similares, lo cual es una caracterstica deseable al realizar la estratificacin. Se puede llegar a producir una ganancia en precisin para algunas caractersticas que se quieran conocer de la poblacin. Es posible llegar a dividir una poblacin heterognea en subpoblaciones que sean homogneas internamente. Si cada uno de los estratos es homogneo, en el hecho de que las medidas de la poblacin varen muy poco de una unidad a otra, se puede obtener un clculo preciso de la media de cualquier estrato de una pequea muestra de ste. Estos clculos pueden entonces combinarse para obtener una estimacin precisa del total de la poblacin. La estratificacin es utilizada para reducir las varianzas de las estimaciones de la muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los estratos difieran entre ellas y a la homogeneidad que exista dentro de ellos. Dentro de los diferentes estratos, se pueden utilizar diferentes mtodos y procedimientos. a. Si la distribucin fsica de algunas porciones de la poblacin difiere radicalmente, puede resultar beneficioso realizar procedimientos diferentes a las partes. b. Puede existir contraste en las listas disponibles para diversos sectores de la poblacin. c. La existencia de naturaleza diversa en los elementos en algunas partes de la poblacin podra requerir la utilizacin de procedimientos distintos. Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos tambin se consideran como dominios de estudio. Donde un dominio se define

como una parte de la poblacin para la cual se planean estimaciones separadas en el diseo de la muestra.

La teora del muestreo estratificado se relaciona con las propiedades de las estimaciones de una muestra estratificada y con la mejor opcin del tamao de la muestra nh para obtener la mxima precisin posible.

II.2.2 Notacin El sufijo h denota el estrato e i la unidad dentro del estrato.

Nh nh yhi Wh=Nh/N fh=nh/Nh

Nmero total de unidades en el estrato h Nmero de unidades en la muestra del estrato h Valor de la i-sima unidad Peso del estrato h Fraccin de muestreo en el estrato h

Yh =

y
i =1

Nh

hi

Nh

Media poblacional

yh =

y
i=1 Nh

nh

hi

Media muestral

nh

2 sh =

(y
i=1

hi

Yh)

Nh 1

Varianza poblacional

V ( y) =

(1 f ) n

S2

Varianza de la media en m.a.s.

II.2.3 Propiedades de los estimadores Para obtener la media global, el estimador utilizado en muestreo estratificado es donde: yst ,

= Wh y h N h=1 donde N = N1 + N 2 + ... + N L y st =


h=1

yh

(2.1)

El estimador yst en general no es el mismo para la media muestral. Esta media muestral, y , puede escribirse:

y=

h=1

yh (2.2)

n Es evidente que y coincide con yst , dado que en cualquier estrato se cumpla con lo siguiente: nh N h n = N nh Nh = n N fh = f

Lo cual implica que la fraccin de muestreo sea la misma en cualquiera de los estratos. Este tipo de estratificacin se conoce como estratificacin con asignacin proporcional de nh.

A continuacin se describen las propiedades principales del estimador yst en los siguientes teoremas:

Teorema 1. Si en cada estrato el estimador muestral yh es insesgado, entonces yst es un


_

estimador insesgado de la media poblacional Y . Demostracin: E(y

st

)= E W
h=1

y h

W
h=1

debido a que los estimadores son insesgados en los estratos individuales. La media poblacional puede escribirse:
L

yhi
N =

Nh

Y=

N
h =1

Yh =

h =1 i =1

h=1

W Y
h

Lo cual completa la demostracin.

Teorema 2. Si las muestras se obtienen de manera independiente en los diferentes estratos: V ( y st ) = Wh V ( y h )


2 h=1 L

(2.3)

donde V ( y h ) es la varianza de yh sobre muestras repetidas del estrato h. Demostracin: y st = Wh y h


h=1 L

(2.4)

yst es una funcin lineal de yh con sus respectivos pesos Wh . Por tanto es posible expresar el resultado estadstico para la varianza mediante la funcin lineal: V ( y st ) = Wh V ( y h ) + 2 WhW j Cov( y h y j )
2 h=1 h=1 j > h L L L

(2.5)

Sin embargo, debido a que las muestras entre estratos se eligieron de manera independiente, los trminos de covarianza desaparecen. Lo cual da como resultado la ecuacin (2.3).

Lo importante acerca de estos resultados es que la varianza de yst depende solo de las varianzas de los estimadores de las medias de los estratos individuales Y h . Si fuera posible fraccionar una poblacin altamente variable en estratos tales que todos los elementos tengan el mismo valor dentro del estrato, sera posible estimar Y sin error alguno. La ecuacin (2.4) muestra que el uso del peso correcto del estrato Nh/N al estimar permite alcanzar este propsito. yst

Teorema 3. Para muestreo aleatorio estratificado, la varianza del estimador yst es: 1 V ( y st ) = N
L 2 h= 1

S2
h

L 2

( N h nh )

h (1 f ) h = h = Wh n h n 1 h h

S2

(2.6)

Demostracin. Debido a que yh es un estimador insesgado de Y h , el teorema (2.2) puede aplicarse. Adems aplicado a un estrato individual:
2 h N h nh V (yh ) = S Nh nh

Por sustitucin en el resultado del teorema 2, se obtiene: 1 V ( y st ) = N 2 1 N h2 V (yh ) = N 2 h=


1 L 2 2 Sh 2 Sh (1 f h ) = W h = N h ( N h nh ) n h h nh 1 L

Algunos casos particulares para esta frmula se exponen en los siguientes corolarios.

Corolario 1. Si las fracciones de muestro nh/Nh son insignificantes para todos los estratos,
2 2 2 2

N h Sh Wh S h V ( y st ) = 1 2 N nh = n h

(2.7)

Corolario 2. En el caso de asignacin proporcional, se hace la siguiente sustitucin en 2.6: nN n


h h

N 1 f n

Reducindose la varianza a: V (y ) =
st

N S2 N n
h h

S2
h h

(2.8)

Corolario 3. Si el muestreo es proporcional y las varianzas en todos los estratos tienen el mismo valor, S w2, se obtiene el resultado siguiente: V (y ) =
st 2 S N n w

(2.9)

st = N yst es el estimador de la poblacin total Y, entonces: Teorema 4. Si Y st ) = N (N h nh ) S h V (Y h n


h 2

(2.10)

Lo cual se demuestra fcilmente utilizando el teorema 3.

Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador
2 insesgado de S h es: 2

Sh = n 1 h Lo que nos lleva al siguiente teorema.

i=1

(y

nh

hi

yh )

(2.11)

Teorema 5. Con muestreo aleatorio estratificado, un estimador insesgado de la varianza es


2 L sh 1 n ) v( y st ) = s ( y st ) = 2 N h (N h h N h=1 nh 2

(2.12)

Con la siguiente alternativa para propsitos de clculo:


L 2 2 W s2 W s h h s 2 ( y st ) = h h nh N h=1 h=1 L

(2.13)

II.2.4 Asignacin ptima En muestreo estratificado la seleccin de tamaos de muestra nh en el estrato respectivo h, puede llevarse a cabo para minimizar V ( y st ) con un costo especfico para minimizar el costo con un valor especfico de V ( y st ) .

Considerando la funcin de costo ms simple cos to = C = C0 + c h nh (2.14)

Entre estratos el costo es proporcional al tamao de la muestra, sin embargo, el costo por unidad ch puede variar entre estratos. El trmino c0 representa un costo fijo. Esta funcin de costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato respectivo tienen el mayor peso.

Teorema 6. Si consideramos la funcin de costo anterior, la varianza de la media estimada yst es mnima para un costo C, y el costo es mnimo para una varianza V( yst ) determinada, cuando nh es proporcional a Wh S h / ch .

Demostracin. Teniendo lo siguiente: C = c0 + c h n h


h=1 L

(2.15)
L

V = V ( y st ) =

2 Wh2 S h

h=1

nh

L W 2S 2 W 2S 2 h h h h (1 f h ) = nh Nh h=1 h=1

(2.16)

Los problemas a resolver son escoger nh para minimizar V con un determinado costo, y posteriormente escoger nh tal que se minimice el costo con un valor determinado de V. Ambos problemas resultan equivalentes a minimizar el producto
2 2 V 'C' = V + W S h h

(C c0 ) =

W 2S 2
h h

( c n )
h h

(2.17)

Nh

nh

Lo anterior puede minimizarse usando la desigualdad de Cauchy-Schwarz. Si ah, bh son conjuntos de nmeros positivos: ( ah )( bh ) ( ahbh )
2 2 2 i j >i

= ( a i b j a j bi )
2

(2.18)

Con la expresin anterior, la siguiente desigualdad es posible:

( a )( b ) ( a b )
2 2 h h

(2.19)

h h

sucediendo la igualdad si y solo si bh/ah es constante para toda h. En el caso presente se considera ah = Wh S h , bh = ch nh , ah bh = Wh S h ch nh haciendo uso de la desigualdad (2.19) V 'C'=

W h S2h nh

( c n

)) = ( a )( b ) (W S
2 2 h h

c
h h h

por lo tanto, el valor de nh que hace VC mas pequeo es mnimo cuando b


h

(W S

h h

ch

) . Ocurriendo un
2

ah

n
h

ch

=k

(2.20)

Wh Sh

En trminos del tamao total de la muestra nh en el estrato, se tiene nh n = Wh S h / ch = N h S h / ch (N h Sh / ch ) (2.21)

(W S

h h

ch )

Para completar la asignacin es necesario obtener el valor de n. La solucin depender si se escoger la muestra para obtener un costo determinado total C para obtener una varianza determinada V para yst . En el caso de un costo fijo, se sustituyen los valores ptimos de nh en la funcin de costo y se obtiene n. n=

(C co ) (N h S h /

ch )

(N

(2.22)

Sh

ch )

Para el caso de V fija, sustituimos el valor ptimo de nh en la frmula para V ( y st ) . n=

(W S

h h c h Wh S h / V + (1/ N ) W S 2 h h

ch

(2.23)

El caso especial en el que ch = c conlleva a lo siguiente NhSh n = n Wh S h =n h W h S h N h S h (2.24)

El resultado anterior, en general es conocido como asignacin de Neyman. Al sustituir el valor de nh en la frmula general para V ( y st )

W S
h h

Vmin

(y ) =
st h

W S2 (2.25)

II.2.5 Precisin relativa de muestreo aleatorio estratificado y muestreo aleatorio simple Realizada de manera adecuada la estratificacin puede traer como resultado una menor varianza para la media estimada o total que la proporcionada con una muestra aleatoria simple. Sin embargo si los valores de nh se encuentran lejos de los ptimos, la estratificacin puede tener como resultado una varianza mayor.

A continuacin se describe la manera en que se obtiene ganancia por medio de la estratificacin, en comparacin con el muestreo aleatorio simple. V
mas

= (1 f ) W S2
h h

S2 n

(2.26)

V
prop

(1 f ) n V
opt

=
(

W S
h

h2

W S
N

h h2

n
h

(2.27)

(2.28) WS ) n WS N
2

De la identidad algebraica estndar para el anlisis de varianza de una poblacin estratificada, se tiene (N 1)S 2 = ( y
h i h i hi

Y )2 =

= ( yhi Y h ) 2 + ( Y h Y )2
h i

= ( yhi
h i h

Y h) + N
2 h 2 h h h

(Y h Y ) 2 si 1/ N h 0 (2.29)

= ( N h 1)S + N

(Y h Y ) 2

S 2 = W S 2 + W
h h

(Y h Y ) 2
h

Por lo tanto V
mas

= (1 f ) = Vprop

(1 f ) (1 f ) 2 WS + W (Yh h h n n n (1 f ) + W h (Y h Y )2 n
2

Y )2 (2.30)

Por definicin de Vopt, se debe tener Vprop Vopt. De las expresiones (2.27) y (2.28) tenemos el siguiente resultado V
prop

V
opt

= =

(W S
h h

(W S
h h h

))
2

n 1 n

( W (S

S)

(2.31)

donde S = Wh S h es una media ponderada de las Sh. Lo anterior se puede ver en el desarrollo siguiente

W (S
h

2 S ) 2 = Wh (S 2h 2SS h + S ) 2 = W S 2S W S + S 2

W S
h h

h 2 h

2S + S =
2

h 2

W S2 S
h h

W
h 2

Al realizar algunas sustituciones Vmas = Vopt + 1 n

2 (Sh S ) + h

(1 f ) n

(Y h Y ) 2
h

(2.32)

Al analizar la ecuacin anterior, se puede notar que hay dos componentes que reducen la varianza cuando se cambia de muestreo aleatorio simple a asignacin ptima. El primer componente que la reduce, que es el trmino en la extrema derecha, se debe a la eliminacin de las diferencias de las medias de los estratos; la segunda, es decir, el trmino medio, proviene de la eliminacin del efecto de las diferencias entre las desviaciones estndar de los estratos.

El desarrollo anterior lleva a lo siguiente cuando 1/Nh es despreciable Vopt V prop Vmas En caso que tal trmino no fuera despreciable, se obtendra V
mas

=V
prop

(1 f ) n( N 1)

N (Y
h

Y )2

1 N

(N N
h

)S 2
h

(2.33)

Lo cual induce a pensar que en algunos casos la estratificacin puede proporcionar una varianza mayor que el muestro aleatorio simple cuando

N h (Y h Y )2 <

1 N

(N N

2 )S h h

II.2.6 Ganancias en precisin gracias al uso de la estratificacin La variable ideal para realizar estratificacin, es aquella que se va a medir en la encuesta correspondiente. Si fuera posible hacer esto, no habra traslape entre estratos, y la varianza dentro del estrato sera menor que la varianza global.

Prcticamente lo anterior no es posible, sin embargo, cumplindose las condiciones siguientes, se puede tratar de conseguir tal situacin 1. La poblacin conste de conjuntos que varen considerablemente en tamao. 2. Las variables que se intentan conocer estn altamente relacionadas con el tamao de tales conjuntos. 3. Se cuente con una buena medida de los tamaos de los distintos estratos.

La estratificacin geogrfica es muy comn y generalmente va acompaada por un incremento en la precisin por la existencia de muchos factores que hacen que las personas

vivan o se renan en un rea comn, mostrando similitudes en sus caractersticas principales. Lo cual genera estratos con mayor uniformidad.

En lo que concierne a la estratificacin proporcional respecto a la ptima, cuando se tienen subpoblaciones con tamaos grandes y pequeos estratificadas por tamao, el muestreo proporcional resulta ineficiente, ya que en una subpoblacin grande la varianza ser mucho mayor que en una pequea. Por lo que utilizar una asignacin ptima, generar mejores estimaciones de los valores que se quieran conocer.

II.2.7 Construccin de estratos Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar estratos en los que las unidades de muestreo sean lo ms homogneas posibles respecto a las variables que se desean conocer. Este objetivo se cumple cuando la variacin entre unidades de muestreo dentro del estrato sea menor que la variacin de la poblacin total.

Sean y0, yL el valor menor y valor mayor de y en la poblacin que se encuentra en estudio. El problema a resolver, es encontrar los lmites entre estratos y1, y2,, yL-1 tales que V ( y st ) =
h h=1

1 n

W S
h

Wh S h

1 N

(2.34)
h=1

se minimice. Si se ignora el segundo trmino, resulta suficiente minimizar WhSh. Debido a que yh solo aparece en la suma en los trminos WhSh y Wh+1Sh+1,se tiene lo siguiente yh

( W S ) =
h h

(Wh S h ) + (Wh.+1S h+1 ) yh yh

(2.35)

Si se tiene que f(y) es la funcin de frecuencia de y,

yh

Wh = Adems

yh 1

f (t)dt,

Wh = f ( yh ) yh

(2.36)

yh yh y tf (t)dt h 1 2 W S 2 = t f (t)dt
h h yh yh 1 yh 1

(2.37)

f (t)dt

Al derivar lo anterior
2 Sh

Wh + 2W S Sh = y 2 f ( y ) 2 y f ( y ) + 2 f ( y ) h h h h h h h h h yh y h

2 donde h es la media de y en el estrato h. Sumndose a ambos lados S h f(yh) y

posteriormente al dividir entre 2Sh


2 Wh Sh = 1 f ( y ( y ) 2 + S h (Wh S h ) h h = S h y + Wh y ) h yh h h Sh 2

(Wh+1 Sh+1 ) y h

f (y 2

2 2 ( yh h+1 ) + S h +1 h) Sh+1

(2.38)

Lo que deriva en las ecuaciones de clculo para yh


2 2 2 ( yh h ) 2 + S h ( yh h+1 ) + S h+1 = Sh+1 Sh

h = 1,2,K, L 1

(2.39)

No obstante, estas ecuaciones no son aplicables en la prctica, ya que h y S h2 dependen de las fronteras. Por tanto, es necesario realizar una aproximacin que permita conseguir los resultados deseados. Sea
y

Z ( y) =

y0

f (t )dt

(2.40)

Si se consideran estratos numerosos y estrechos, f(y) debera ser aproximadamente uniforme dentro de un estrato dado. Por lo que
yh

Wh =

yh 1

f (t )dt =&
1 12

f h ( y h yh 1 )

Sh &
yh

(y y ) h.1 h

Z h Z h 1 =

f (t ) dt = &

f h ( y h yh 1 )

yh 1

Al sustituir las aproximaciones anteriores 12 Wh S h = f h ( yh y h ) &


L L h=1 h=1 2 1

= ( Z h Z h ) & 1
L h=1

(2.41)

Debido a que (ZL-Z0) es fija, resulta fcil verificar que la suma de la derecha se minimiza al hacer (Zh-Zh-1) constante. Dado f(y), la regla consiste en computar el acumulado de f(y) y escoger yh de tal manera que se creen intervalos de amplitud similar en la escala del acumulado de f(y).

II.2.8 Cantidad de estratos El concepto general de estratificacin lleva a pensar que de una poblacin dividida en k estratos, siempre ser posible mejorar la situacin llevando a cabo ms subdivisiones a los estratos. De hecho, la estratificacin puede llevarse al grado de tener un nmero de estratos igual nmero de unidades que sern seleccionadas. Sin embargo, al sobrepasar un nmero prudente de estratos, el aumentar su cantidad no resulta en una reduccin considerable de la varianza cuando la estratificacin para cierta variable y se hace con respecto a otra llamada x, como se demuestra a continuacin de manera sencilla. Sea x una variable uniforme de 0 a d, adems y = x + e, donde e y x no tienen correlacin alguna. Entonces

V ( y) = V (x) + V (e) . Supngase el caso en el que se tienen k estratos con la misma amplitud. Entonces S2 =
xh

d2 12k 2

W =
h

Nh N

1 k

Si la asignacin de la muestra es la misma, la varianza estimada de la media poblacional es k n W 2S 2


h yh

S = + e 12nk n

d2

Si el nmero de estratos aumentara a k, la varianza relacionada con tal nmero ser


2 2

Se d 2 2 + 12nk n 1 En este caso el primer componente disminuye al realizar un incremento en el nmero de estratos, pero el segundo componente se mantiene constante. Debido a lo anterior, se llegar a un punto en el que el segundo componente se convierte en parte importante de la varianza y aunque haya incrementos en el nmero de estratos, no habr ganancias significativas en la varianza.

II.3 Estratificacin con ms de una Variable

Dado que la mejor asignacin para una variable puede no ser la mejor para otra, se debe llegar a un arreglo para encuestas con ms de una variable. El primer paso consiste en reducir las variables consideradas en la asignacin a un nmero relativamente pequeo donde se consideren las ms importantes. En el caso de que existan buenos datos previos, se puede calcular la asignacin ptima de cada caracterstica y ver en que punto existen desviaciones grandes. Puede darse el caso de variables que se encuentren tan correlacionadas, que las asignaciones no difieran en gran medida.

Вам также может понравиться