Академический Документы
Профессиональный Документы
Культура Документы
Introduccin
El estudio exhaustivo de colectivos de individuos o elementos con
un gran nmero de unidades supone, por lo general, graves dificultades
tcnicas y elevadsimo coste econmico. Pinsese, por ejemplo, en la dificultad
operativa y coste asociado de encuestar a toda la poblacin peruana de 15 a
65 aos, para investigar el porcentaje de ella que es consumidora de tabaco.
Para soslayar esas dificultades, se procede habitualmente a extraer del
colectivo a estudiar una parte o muestra. Sobre esta parte del colectivo se
analizan las caractersticas que interesa investigar, y del resultado de este
anlisis se infiere el comportamiento del colectivo total.
Ahora bien, siempre que se afirma algo de un colectivo total, a
travs de la informacin de slo una parte de l (muestra), se asume un riesgo.
Los valores obtenidos del anlisis de un colectivo a travs de una muestra del
mismo no son los valores reales del colectivo; son estimaciones aproximadas,
que vienen afectadas por unos errores, que denominaremos errores de
muestreo. Es, por tanto, evidente la utilidad de conocer y dimensionar este tipo
de errores de muestreo. De hecho, en cualquier investigacin los datos
recogidos vienen afectados por dos tipos de errores; los errores de medida y
los errores de muestreo. En la mayora de ocasiones, los errores de medicin
son mucho ms graves que lo derivados del muestreo, y no siempre se les da
la importancia que merecen. Si las respuestas a las preguntas de la encuesta
son incorrectas, si el entrevistado engaa conscientemente, o si -lo que es muy
frecuente- las preguntas son ambiguas, ambivalentes, incomprensibles, o
llevan a distintas interpretaciones para distintos encuestados, por muy riguroso
que haya sido el procedimiento de muestreo, y por muy acotados que estn
sus errores, la fiabilidad real de los resultados ser extraordinariamente pobre.
Poblacin y muestra
Poblacin es cualquier coleccin finita o infinita de elementos o
individuos. Los elementos o individuos pueden ser personas, familias,
establecimientos comerciales, empresas, clavos fabricados por una mquina,
etc. Los datos a medir sern habitualmente medias y/o proporciones. Por
ejemplo, porcentaje (proporcin) de consumidores que conocen, han probado,
o son habituales consumidores de una marca determinada de detergente.
Nmero medio (media) de pasajeros que transportan diariamente de Piura a
Chiclayo las compaas de transporte privado, etc.
Para el diseo muestral, hay que distinguir claramente entre
poblacin objetivo y poblacin marco (conjunto de individuos a partir del cual se
har la extraccin de la muestra). Las poblaciones objetivo y marco deben ser
lo ms parecidas posibles. Cuando esto sucede, es decir, cuando el conjunto
total (la poblacin objetivo) est a nuestro alcance (poblacin marco), la
eleccin del sistema de muestreo, y la seleccin y extraccin de las unidades
muestrales, no presentan ningn problema. Vase, por ejemplo, el caso de
conseguir una muestra de los clavos producidos en un da determinado en una
fbrica, una muestra de los pacientes de un hospital o de los estudiantes de
una escuela de negocios. Todos los elementos estn presentes, y pueden ser
manipulados,
ordenados
clasificados
nuestra
conveniencia.
Para un IC de 68,3%
Para un IC de 95,5%
Para un IC de 99,7%
El error de muestreo
e = t
es, habitualmente, un dato a fijar por parte del investigador, al igual que el
intervalo de confianza. Estos valores dependen en buena parte del presupuesto
econmico disponible para la realizacin del estudio. Como es intuitivo y luego
explicitaremos, a menor error y a mayor precisin requerida, mayor tamao de
la muestra. Cuantas ms encuestas sean precisas, mayor ser el coste
correspondiente.
Los errores que se suelen utilizar en investigacin comercial
siguen la siguiente norma:
Para estudios nacionales con segmentacin provincial, del 0,5 al
1%
Para
estudios
nacionales
con
segmentacin
regional
1
Recurdese que en este intervalo caer el valor real de la poblacin en el 68,3% de los casos, es decir, de
cada 100 muestras extradas, en 32,7% de ellas el valor real de la poblacin caer fuera del intervalo.
e = t
pq
n
t2 pq
n= 2
e
Veamos la aplicacin a unos sencillos ejemplos:
Ejemplo n 1
Queremos hacer una encuesta a nivel nacional, dirigida a conocer
el porcentaje de la poblacin de 15 a 65 aos que es fumadora. Hemos
decidido trabajar con un intervalo de confianza del 95,5%, con un error de
muestreo del 4%, y en condiciones desfavorables de muestreo. Queremos
conocer el nmero de personas a encuestar.
Las condiciones desfavorables de muestreo se definen como
p=50% y q=50%; es decir, al no tener ninguna idea preconcebida del nmero
de personas que se declararn fumadoras, hemos optado por ponernos en la
peor situacin de indeterminacin, -la mitad sern fumadores y, la otra mitad,
no fumadores-.
6
n=
2 2 x50 x50
= 625
42
n=
3 2 x50 x50
= 1406
42
Ejemplo n 2:
En la investigacin anterior, se ha decidido realizar un pre-test
para determinar los valores de p y q. Para ello, se han entrevistado 80
personas, y de ellas 28 han resultado ser fumadoras. Conservando el nivel de
error del 4%, y el intervalo de confianza del 99,7%, se pide el tamao de la
muestra.
p=
28
= 35% ; q = 1 p = 65%
80
3 2 x35 x65
n=
= 1280
42
t2 pqN
n= 2
e ( N 1) + t2 pq
Todos los trminos nos son ya familiares, excepto N, que
representa el tamao de la poblacin.
7
Ejemplo n 3:
Un concesionario de automviles desea realizar una encuesta
telefnica entre sus 15.000 clientes de cartera, para conocer su intencin de
cambio de vehculo en los prximos dos aos. Se ha decidido trabajar con un
intervalo de confianza del 95,5%, con un error de muestreo del 5%, y en
condiciones desfavorables. Se pide el tamao de la muestra.
n=
e=2
0. 5 x 0 . 5
= 2. 2 %
2000
Figura 1
Consumidores
encuestados
n = 2.00
No conocen
la marca investigada
n2 = 800
Conocen
la marca investigada
n1 = 1.200
Viven en un
hbitat urbano
n11 = 800
Clase
alta
n111 = 160
Menos de
18 aos
n1121 = 32
De 18 a
30 aos
n1122 = 108
Clase
media
n112 = 400
De 31 a
45 aos
n1123 = 140
Viven en un
hbitat rural
n12 = 400
Clase
baja
n113 = 240
De 46 a
60 aos
n1124 = 80
Ms de
60 aos
n1125 = 40
e=
0.5 x0.5
= 10.54%
90
10
11
Figura 2
Clase
alta
NA
NA = 700 encuestas
Clase
media
NM
NM = 700 encuestas
Clase
baja
NB
NB = 700 encuestas
N = 2 100 encuestas
12
Figura 3
Clase
alta
NA
nA - NA
Clase
media
NM
nM - NM
Clase
baja
NB
nB - NB
Ejemplo n 4
Se desea repartir una muestra de 816 encuestas correspondiente
a una poblacin de 1.450.000 individuos, por muestreo aleatorio estratificado
proporcional. El tamao de cada uno de los tres segmentos que constituyen
dicha poblacin es el siguiente:
13
Clase social
Tamao
Alta
150.000
Media
900.00
Baja
400.00
Total
1.450.000
Clase alta
Clase media =
Clase baja
14
Figura 4
Clase
alta
NA
nA = f (NA 1A )
Clase
media
NM
nM = f (NM 1M )
Clase
baja
NB
nB = f (NB 1B )
15
Ejemplo n 5
Se desea repartir una muestra constituida por 1.000 unidades
entre las tres clases de clientes que constituyen la cartera de un banco y que
se distribuyen de la siguiente manera:
- Clientes tipo A
150.000
- Clientes tipo B
900.000
- Clientes tipo C
400.000
10 %
- Clientes tipo B
30 %
- Clientes tipo C
60 %
150.000 X 0,10
nB
1.000
150.000 X 0,10 + 900.000 X 0,30 + 400.000 X 0,60
1.000
16
900.000 X 0,30
nC
400.000 X 0,60
1.000
150.000 X 0,10 + 900.000 X 0,30 + 400.000 X 0,60
nA =
29 encuestas
nB =
514 encuestas
nC =
457 encuestas
17
Anexo 1
METODOS Y APLICACIONES DE MUESTREO
Tamao de la muestra para poblaciones infinitas, con intervalo de
confianza del 95,5%
Lmites de
error en
porcentajes
0,1
2/98
3/97
4/96
5/95
10/90
15/85
20/80
25/75
30/70
35/65
40/60
45/55
39.600 78.400 116.400 153.600 190.000 360.000 510.000 640.000 750.000 840.000 910.000 960.000 990.000
50/50
1.000.000
0,2
9.900 19.600
29.100
38.400
47.500
250.000
0,3
4.400
8.711
12.933
17.067
21.111
40.000
56.667
71.111
83.333
111.111
0,4
2.475
4.900
7.275
9.600
11.875
22.500
31.875
40.000
46.875
52.500
56.875
60.000
61.875
0,5
1.584
3.136
4.656
6.144
6.600
13.400
20.400
25.600
30.000
33.600
36.400
38.400
39.600
40.000
0,6
1.100
2.178
3.233
4.267
5.278
10.000
14.167
17.778
20.833
23.333
25.278
26.667
27.500
27.778
0,7
808
1.600
2.376
3.135
3.878
7.347
10.408
13.061
15.306
17.143
28.577
19.592
20.204
20.408
0,8
619
1.225
1.819
2.400
2.969
5.625
7.969
10.000
11.719
13.125
14.219
15.000
15.469
15.625
0,9
489
968
1.437
1.896
2.346
4.444
6.296
7.901
9.259
10.370
11.235
11.852
12.222
12.346
1,0
396
784
1.164
1.536
1.900
3.600
5.100
6.400
7.500
8.400
9.100
8.600
9.900
10.000
1,5
176
348
517
683
844
1.600
2.267
2.844
3.333
3.733
4.044
4.267
4.400
4.444
2,0
99
196
291
384
475
900
1.275
1.600
1.875
2.100
2.275
2.400
2.475
2.500
2,5
63
125
186
246
304
576
816
1.024
1.200
1.344
1.456
1.536
1.584
1.600
3,0
44
87
129
171
211
400
517
711
833
933
1.011
1.067
1.100
1.111
3,5
32
64
95
125
155
294
416
522
612
686
743
784
808
816
4,0
25
49
73
96
119
225
310
400
469
525
569
600
619
625
4,5
20
39
57
76
94
178
252
316
370
415
449
474
489
494
5,0
16
31
47
61
76
144
204
256
300
336
364
384
396
400
6,0
11
22
32
43
53
100
142
178
208
233
253
267
275
278
7,0
16
24
31
73
104
131
153
171
186
196
202
204
8,0
12
18
24
30
56
80
100
117
131
142
150
155
156
9,0
10
14
19
23
44
63
79
93
104
112
119
122
123
10,0
12
15
19
36
51
64
75
83
91
96
99
100
15,0
16
23
28
33
37
40
43
44
43
20,0
13
16
19
21
23
24
25
25
25,0
0,6
12
12
13
15
15
16
16
18
62.500
Anexo 2
METODOS Y APLICACIONES DE MUESTREO
Tamao de la muestra para poblaciones infinitas, con intervalo de
confianza del 99,7%
Lmites de
error en
porcentajes
0,1
0,2
0,3
0,4
0,5
2/98
3/97
4/96
5/95
10/90
15/85
20/80
25/75
30/70
35/65
40/60
45/55
50/50
89.100 176.400 261.900 345.600 427.850 810.000 1.147.500 1.440.000 1.687.500 1.890.000 2.047.500 2.160.000 2.227.500 2.250.000
22.275 44.100
65.475
86.400 106.875 202.500
286.875
360.000
421.875
472.500
511.875
540.000
556.875
562.500
9.900 19.600
29.100
38.400 47.500 90.000
127.400
160.000
187.500
210.000
227.500
240.500
247.500
250.000
5.569 11.025
16.369
21.600 26.719 50.625
71.719
90.000
105.469
118.125
127.969
135.000
139.219
140.625
3.564
7.056
10.476
13.824 17.100 32.400
45.000
57.600
67.500
75.600
81.900
86.400
89.100
90.000
0,6
0,7
0,8
0,9
1,0
2.475
1.818
1.392
1.100
891
4.900
3.600
2.756
2.178
1.764
7.275
5.345
4.092
3.233
2.619
9.600
7.053
5.400
4.267
3.456
11.875
8.724
6.680
5.278
4.275
22.500
16.531
12.656
10.000
8.100
31.875
23.418
17.930
14.167
11.475
40.000
29.388
22.500
17.778
14.400
46.875
34.439
27.367
20.833
16.875
52.500
38.571
29.531
25.278
18.900
56.875
41.786
31.992
26.667
20.475
60.000
44.082
33.750
26.667
21.600
61.875
45.459
34.805
27.500
22.275
62.500
45.918
35.156
27.778
22.500
1,5
396
784
1.164
1.356
1.900
3.600
5.100
6.400
7.500
8.400
9.100
9.600
9.900
10.000
2,0
223
441
655
864
1.069
2.025
2.869
3.600
4.219
4.725
5.119
5.400
5.569
5.627
2,5
143
282
419
553
684
1.296
1.836
2.304
2.700
3.024
3.276
3.456
3.564
3.600
3,0
99
196
291
384
475
900
1.275
1.600
1.875
2.100
2.275
2.400
2.475
2.500
3,5
73
144
241
282
349
661
937
1.176
1.378
1.543
1.671
1.763
1.818
1.837
4,0
4,5
5,0
6,0
7,0
56
44
36
25
18
110
87
71
49
36
164
129
105
73
53
216
171
138
96
71
267
400
171
119
87
506
567
324
225
165
717
711
459
319
234
900
833
576
400
294
1.055
933
675
469
344
1.181
1.011
756
525
386
1.280
1.067
819
569
418
1.350
1.100
864
600
441
1.392
1.111
891
619
455
1.406
8,0
9,0
10,0
15,0
20,0
14
11
9
4
2
28
22
18
8
4
41
32
26
12
7
54
43
35
15
9
67
53
43
19
11
127
100
81
36
20
179
142
115
51
29
225
178
144
64
36
364
208
169
75
42
295
233
189
84
47
320
263
205
91
51
338
267
216
96
54
348
275
223
99
56
352
278
225
100
56
25,0
30,0
35,0
40,0
1
1
0.7
0.6
3
2
1
1
4
3
2
2
6
4
3
2
7
5
3
3
3
9
7
5
18
13
9
7
23
16
12
9
27
19
14
11
30
21
15
12
33
23
17
13
35
24
18
14
36
25
18
14
36
25
18
14
19
900
625
459