Вы находитесь на странице: 1из 62

O Muestreo Simple al Azar;

Es una tcnica estadstica para explorar poblaciones


que permite obtener informacin con niveles de
confianza conocidos y precisin determinada.
Abrir HE para generar Ejercicio.

Abrir HE con la base de datos operativa

Abrir HE con el anlisis

ISBN 978-9968-9634-3-5.
Manuel Pontigo Alvarado.
2

No slo los investigadores de las ciencias


fsicas, biolgicas y sociales sino los
ingenieros, directores de empresas,
funcionarios de estado, analizadores de
mercado requieren de informacin
confiable.
Puede ser una simple enumeracin o datos
muy costosos.
3

Del Fsico al leer un contador Geiger;


Del Ingeniero al someter a prueba un material de construccin;
Del Agrnomo al medir el rendimiento de un cereal hbrido;
Del Qumico al determinar la concentracin de un cido;
Del Estadgrafo al estudiar la opinin pblica sobre un candidato
a solicitud de un partido poltico.;
Del Especialista en marketing al estudiar la aceptacin de un
producto;
Y otros por el estilo, suelen resolverse mediante Tcnicas de
Muestreo.
4

Al planificar una muestra, debe especificarse claramente la


forma en que los datos que se han de registrar satisfarn los
propsitos del reconocimiento.
La poblacin de la que deben obtenerse las muestras debe
estar explcitamente definida.
El mtodo debe ser eficiente y conducir a un anlisis
imparcial.
Los elementos que deben incluirse en la poblacin dependen
de los propsitos del reconocimiento.
5

Elimina aspectos subjetivos en la eleccin de la


muestra;
Se conocen todas las posibles muestras distintas;
La eleccin de la muestra se hace de modo aleatorio
de acuerdo con una probabilidad preestablecida.
Y, el mtodo de anlisis est predeterminado sin
ambigedad.
Solamente con tales muestras es posible obtener
Inferencias con respecto a la poblacin que sean
confiables y de precisin mesurable.
6

Es el mtodo de elegir una muestra de n elementos de una


poblacin de N elementos tal que cada una estas muestras
tenga igual probabilidad de ser elegida.
Se elige al azar el primer elemento, despus, tambin al azar
un segundo elemento y as sucesivamente hasta obtener los
n elementos.
Como que un elemento no puede aparecer ms de una vez
en la muestra, esta es una forma de muestreo sin remplazar
las unidades extradas.
La razn muestral o fraccin muestral es n / N .
7

Frecuentemente, la finalidad de elegir una muestra es estimar el valor


medio de una caracterstica en la poblacin. Si y i es el valor de la
caracterstica en la -sima unidad, su valor medio y varianza son:
1 N 1 1 N
yi ( y1 y 2 ... y N ) ( yi ) 2
2
N i 1 N N i 1
Si xi es el valor de la i-sima unidad muestreada, su valor medio y varianza
de la n unidades exploradas son:

1 n 1 1 n
x xi ( x1 x2 ... xn ) s2 (x i x ) 2

n i 1 n n 1 i 1
Las cantidades x y s valor medio muestral y varianza muestral se llaman
2

estadsticos muestrales, son el primero y segundo momentos muestrales y


son, tambin, los estimadores de los parmetros de la poblacin
Las ms de las veces, desconocidos en la poblacin y aproximados mediante
los estimadores.
8

Los estimadores son variables aleatorias. Si se obtienen repetidas


muestras de magnitud n de la poblacin, y se calcula el promedio de
cada una, se obtendr una poblacin de promedios con su distribucin
propia que diferir de la distribucin de las observaciones X. La
poblacin de promedios tendr el mismo promedio que el de la
poblacin y una varianza de promedios igual a:
2 N n

2
x
n N 1
La segunda fraccin se aproxima a 1 cuando N es grande. O sea, que la
varianza de promedios es aproximadamente la fraccin 1 / n de la
varianza de la poblacin original. A medida que n, la magnitud de la
muestra aumenta, la distribucin de los promedios se concentran
alrededor del valor de la media poblacional , aumentando la precisin
de la estimacin del valor como estimacin del valor medio de la
poblacin.
9

Las observaciones de una muestra,


adems de proporcionar Histograma y Polgono de Frecuencias
del Peso Bebs al Nacimento
estimaciones de los parmetros de
la poblacin, se usan tambin para
25,0

obtener estimaciones de la funcin 20,0

de frecuencias de la poblacin. Esta 15,0

estimacin se consigue dividiendo el


recorrido o rango de las 10,0

observaciones muestrales en varios 5,0

intervalos de largo IC (Intervalo de 0,0


clase) y contando el nmero de 1,62 1,85 2,09 2,32 2,56 2,79 3,03 3,26 3,50 3,73 3,97 4,20 4,44 4,67 4,91

observaciones que ocurren en cada Peso en Kilogramos

intervalo.
Estos nmeros se dividen por n para obtener las frecuencias relativas
cuya suma es 1 o 100%. Que se grafican para obtener un figuras llamadas
Histograma y Polgono de Frecuencias.
10

El Teorema central del lmite: Una poblacin definida por sus


parmetros, media y varianza finita 2. Y siendo la media de una
muestra aleatoria de tamao n, de esa poblacin, la distribucin de
frecuencias de la variable estandarizada:
xi n xi
i

n
Se aproxima a la Distribucin de Frecuencias de la Normal Estndar
( media 0 y varianza 1) a medida que n crece.
Al menos la distribucin de los promedios se puede aproximar
mediante una Distribucin de Probabilidad perfectamente conocida
que es la Normal Estndar en donde, cualquier intervalo bajo la curva
determina una probabilidad. Esta distribucin, tambin aproxima
convenientemente a la distribucin de proporciones.

Regresa
11

Dos jvenes pasantes de Sociologa pretenden efectuar un estudio sobre


pesos y medidas de nias y nios recin nacidos y sus familias en un
hospital de Seguridad Social de la cabecera de una provincia de Costa
Rica durante un ao calendario.
Aun cuando el estudio involucr ms variables, para el ejemplo
interesan, el sexo, el peso y la estatura de los recin nacidos unitocos (un
producto) tomados directamente de los registros del hospital y, Nivel
Econmico, Hbitos Higinicos y Hbitos nutricionales obtenidos
mediante entrevista, de la muestra de las familias seleccionadas para el
estudio.
El peso en kilogramos ejemplifica la inferencia de variables continuas, la
estatura de variables discretas y el sexo de los infantes y las variables
familiares, de atributos.
12

Por la magnitud de las bases de datos que se operan es necesario


distribuir la carga en dos Libros Electrnicos llamados:

E08_Muestreo_Irresticto_X03.xls archivo que contiene el generador


de datos. Este archivo crea el conjunto de datos que simulan la
encuesta. Estos se copian al siguiente libro.

X08_Muestreo_Irresticto_X02.xls que se utiliza para generar la


muestra. a) copiar el archivo generado y pegar en la hoja que llamar
Base_D con Edicin / Pegado especial / Valores; c) Obtener la muestra
aleatoria que deber colocar en la hoja llamada Muestra, y; d) copiar
la Muestra a el libro E08_Muestreo_Irresticto_X01.xls a la hoja con el
mismo nombre.

E08_Muestreo_Irresticto_X01.xls en donde se pasa una copia de la


muestra que se utilizar para el anlisis y elaboracin de los cuadros
de resultados.
13
Delimitando los alcances de la investigacin.

Objetivo primario:
Explorar a las familias de nios recin nacidos en un Hospital de la Seguridad
Social en una cabecera de provincia de Costa Rica en las variables: Peso al
nacimiento, Talla, Sexo, Nivel de Ingresos, Hbitos Higinicos, Hbitos
Nutricionales.
Objetivos secundarios:
Caracterizar la poblacin de nios recin nacidos en un Hospital de la Seguridad
Social en una cabecera de provincia de Costa Rica.
Poblacin:
Los nios unitocos recin nacidos desde el 1 de enero hasta el 31 de diciembre de
un ao especfico.
Probabilidad del muestreo:
Confiabilidad de 99% con un nivel de precisin de 2,5% sobre el promedio de
peso.
14

La informacin se obtendr de los registros


sistematizados del hospital.
El departamento de computacin separ de
la base de datos universal, aquella que
cumpliera los requerimientos del estudio
eliminando datos confidenciales. Un total
de 4.591 registros.
15

El estudio consta de dos partes:


La caracterizacin de la poblacin de nios
recin nacidos que se podra efectuar con
precisin mediante un censo. No obstante, se
realiz mediante muestreo.
La exploracin mediante el muestreo de
variables socioeconmicas como: Nivel
Econmico, Hbitos Higinicos y Hbitos
nutricionales.
16

La exploracin se efectuar mediante la Tcnica


Estadstica de Muestreo Simple al Azar.
Se obtendr una muestra preliminar de 30 unidades
para determinar el tamao de muestra que cumpla
con un 99% de confianza y una precisin del 2,5%
sobre el promedio de la variable de peso al
nacimiento.
Se utilizar la prueba de 2 para la determinacin de
diferencias entre clases con niveles de confianza de
95%.
17

Para obtener la muestra piloto se programa la hoja electrnica para


que proporcione una secuencia de nmeros aleatorios entre 1 y 4.591,
inclusive.
El cuadro muestra los registros seleccionados, la referencia del nmero
en el listado y el peso del nio. Las unidades seleccionadas se marcan
mediante color verde claro en el listado de la poblacin, esto con el fin
de no seleccionarlas de nueva cuenta cuando se complete la muestra
definitiva.

Peso Peso Peso


N Muestra Item Kilologramos N Muestra Item Kilologramos N Muestra Item Kilologramos
1 3231 3,199 11 1390 3,999 21 4584 4,313
2 855 4,056 12 3951 3,35 22 1428 2,399
3 2318 3,346 13 3710 3,586 23 996 4,243
4 1608 3,15 14 930 3,321 24 212 3,301
5 4572 3,098 15 3539 4,519 25 2375 2,105
6 253 3,347 16 1828 2,348 26 1485 3,464
7 336 3,838 17 544 3,36 27 853 3,341
8 237 3,156 18 3626 3,394 28 2612 3,242
9 2422 3,245 19 3381 3,779 29 3959 3,216
10 2043 3,152 20 1207 3,751 30 1808 3,127
18

En este caso, la finalidad del Muestreo Piloto fue determinar el tamao de


la muestra con una precisin de 2,5% sobre el peso promedio y
confiabilidad de 99% utilizando la ecuacin:

z2 s2 2,5758 2 0,2886
n n 266
d 2
3,3915 0,025 2

Muestras a recolectar tanto en las variables directas cono en las variables


familiares.
Para poblaciones pequeas se considera el efecto de corregir por finitud, o
sea, asume que la poblacin es pequea y se utiliza:
z2 s2 n 266
n' 251
z s
2 2
n 266
d2 1 1
N N 4.591
Nuevamente se generan unos 300 nmeros aleatorios para completar la muestra a 266. En

este caso, las unidades seleccionadas se marcan en azul celeste.


19

El proceso de completar la muestra es idntico al de obtener la Muestra


Piloto. El estudiante deber imaginar que cada registro que seleccin
correspondera a un cuestionario. No podr de ninguna manera alterar
el orden en que aparecen los nmeros aleatorios, s por ejemplo
ordenara ascendentemente, lo nmeros aleatorios mayores no se
elegiran. Es conveniente listarlos. Es conveniente listarlos para
facilitarse la toma de la muestra.

Al localizar la unidad que indica el nmero aleatorio y siempre que no


haya sido seleccionada se marca con algn color de fondo, copiando
toda la informacin de la hilera a la Hoja Muestra inmediatamente
debajo de la muestra anterior.

El proceso se detiene cuando se han conseguido las 266muestras


incluyendo las 30 de la Muestra Piloto.

En cuanto tenga la muestra abre el archivo


E08_Muestreo_Irresticto_X01.xls. Copie y peque la muestra en la HE
con el mismo nombre.
20

En las variables cualitativas, el promedio que deber interpretarse como proporcin


es exacto, el resto de los estadsticos como la varianza sern aproximados. Por
ejemplo, para el sexo:
266

x i
1 0 0 ... 0 1
px I 01
0,511
266 266
Para Nivel Econmico 1 pNE1 =0,188 o 18,8%. Los estimadores derivados de la
varianza debern considerarse aproximados.
21

Histograma y Polgono de Frecuencias

25,0
El Histograma de
Frecuencias es una forma 20,0

Frecuencia Relativa %
prctica de observar 15,0

directamente, si las 10,0

frecuencias de las muestras 5,0

se distribuyen Normal (con


0,0
forma de campana), o 1,96 2,21 2,46 2,71 2,96 3,21 3,46 3,71 3,96 4,21 4,46 4,71 4,96

Peso en Kilos
campana de Gaus.
El coeficiente de curtosis 0,3883 indica una curva ligeramente
achatada y el coeficiente de asimetra de 0,0858 una cola
izquierda ligeramente ms larga, siempre con respecto a una
Distribucin Normal sin que las diferencias sean significantes.
22

Las socilogas del estudio quieren probar que los nios de menor
peso al nacer provienen de familias de pocas ventajas sociales.
Para esto, necesitan conocer el peso que separe al 25% de los pesos
ms ligeros.
Se puede proceder de dos formas:
Determinando el valor que separa al primer cuarto o 25% de
los datos o primer cuartil;
Utilizando la distribucin Normal Estndar separar el 25%
mediante probabilidades.
Para este segundo caso, es insoslayable que la distribucin de los
pesos al nacimiento sea normal puesto que se har inferencia sobre
datos particulares. Por tanto, es necesario hacer una prueba que
asegure que la aproximacin mediante la Distribucin Normal
Estndar es posible.
23

El mtodo directo es una prueba de normalidad que compara las frecuencias


esperadas con la observadas mediante una prueba que puede ser la de
Chi-cuadrada o la de Kolmogorov-Smirnov conocidas como Pruebas de
Bondad de Ajuste. Se usarn ambas.

En la prueba de K-S, puesto que la Mxima Diferencia Absoluta d = 0,0402 es menor al


criterio D(0,05; 266) = 0,0834 debe aceptarse que la distribucin observada puede
aproximarse por una Normal Estndar. La prueba de 2 indica diferencias que la
distribucin de las observaciones no debe ajustarse con una Normal.
24

Comparando Frecuencias Acumulativas


La figura que compara las dos
distribuciones ofrece una visin 1,00

condensada de la aproximacin de 0,80

Probabilidades
ambas distribuciones 0,60

acumulativas. 0,40

Como es de esperar, la 0,20

distribucin terica es la 0,00


1,960 2,210 2,460 2,710 2,960 3,210 3,460 3,710 3,960 4,210 4,460 4,710

sigmoides tpica de la Normal Kilos

acumulativa, la observada, Esperada Observada

muestra irregularidades cuya


magnitud es irrelevante por tanto,
la poblacin de los pesos de bebs
puede aproximarse mediante la
Distribucin Normal Estndar.
25

El 25% de la poblacin con menos peso.


El primer cuarto de la poblacin puede obtenerse de diferentes maneras.
La ms conveniente es usar la aproximacin mediante la distribucin
Normal Estndar:
X 25 x z( 0, 25 ) s 3,451 0,674 0,5346 3,090
Valor al que se le pueden hacer una estimacin por intervalo como se ver
en la siguiente diapositiva.
Usando los estadsticos de orden con datos agrupados usando o no
paramtrica (NP):
n 1
S0, 25
~ (266 1)0,25 55
x25 LI 0, 25 4 IC 2,835 0,250 2,899
f 0 , 25 46

O solicitndolos a la HE mediante:

x25 REDONDEAR(CUARTIL(Ra ngo;1);3) 3,160


26

El Teorema Central del Lmite ofrece ciertas ventajas para trabajar


con promedios, pero para trabajar con cuartiles, es indispensable
que los datos se distribuyan normal. Para el primer cuarto de la
poblacin se estima mediante:

1,3626 s 1,3626 s
Pr x25% z X 25 % x25% z 1
n n
1,3626 0,5346 1,3626 0,5346
Pr 3,090 1,96 X 3,090 1,96 0,95
266 266
Pr 3,002 X 25% 3,178 95%

En estas estimaciones por intervalo debe tenerse cuidado en el


tamao de la muestra que quiere estimarse. En este caso, se
toma el total de la muestras.
Diapositiva 10
27

Histograma de una variable discreta


Las Variables Discretas, cuando la
muestra es de ms de 30 25,0

observaciones se pueden operar 20,0

Porcentaje
como variables continuas, mxime 15,0

si la variable es una discreta 10,0

funcional, esto es, se tomaron 5,0

nmeros enteros pero en realidad 0,0


50 51 52 53 54 55 56
es una medida continua, con todas Talla en centmetros
las implicaciones de estas. Se
muestra el Histograma separando
las barras, indicando con esto la
calidad discreta de la variable.
28

En los estudios mediante muestreo estadstico, la


exploracin de variables Cualitativas es muy importante,
incluso de mayor inters que las cuantitativas, sobre todo en
encuestas de opinin y estudios de mercado.
En general, las variables Cualitativas se engloban en el
marco de la Distribucin Binomial que tambin puede ser
aproximada convenientemente por la Normal Estndar.
Muchas veces la accin de separar la informacin en pocos
grupos permite una panormica explcita del
comportamiento incuso de Variables Continuas o Mtricas.
En adelante se presentan Cuadros de Resultados que
involucran Variables Cualitativas.
29

Estadstico Nios Nias Total


Porcentajes 48,9 51,1 100
Talla:
Promedio 52,95 53,17 53,06
D. Estndar 1,377 1,693 1,548
Peso:
Promedio 3,460 3,437 3,448
D. Estndar 0,5290 0,5501 0,5390

El agrupamiento produce proporciones, tallas y pesos


diferentes. Es posible que se est interesado en comparar los
grupos. Las hiptesis involucradas en el cuadro anterior son:
Proporciones: Ho; P1 = P2 = 0,5; Ha; P1 P2 0,5

Tallas: Ho; 1 = 2 = 53,06; Ha; 1 2 53,06

Pesos: Ho; 1 = 2 = 3,448; Ha; 1 2 3,448


30

Las hiptesis sobre proporciones, porcentajes o nmeros se pueden


contrastar utilizando la aproximacin a la Distribucin Binomial mediante
la Distribucin Normal Estndar a travs de la Distribucin de 2. An
cuando frecuentemente la proporcin de nias es ligeramente mayor a la
de los nios, estadsticamente no difieren. Por tanto, no hay razn para
dudar que la proporcin de nias o nios sea 0,5. Dicho de otra manera, la
proporcin esperada es de 0,5. Por tanto, el cociente:
x xp 0,5 130 266 0,5 0,5
zc 0,3066
npq 266 0,5 0,5

La Probabilidad para ste estadstico:


1
1 0, 3066 0, 3066 2
F (0,3066 )
2

e 2
dx 0,3796

Probabilidad que no es suficiente para declarar que la proporcin de nios


difiera de 0,5. Por tanto se acepta la hiptesis para esta clase.
31

La intencin de este cuadro es presentar resultados concernientes a


varias hiptesis importantes para la investigacin:
El igual la proporcin para cada grupo? Ho; P1 = P2 = P3 = P4 = Pw.

El nivel econmico no tiene relacin con la talla de los Bebs? Ho; T1


= T2 = T3 = T4.

El nivel econmico no tiene relacin con la talla de los Bebs? Ho; P1


= P2 = P3 = P4.

El detalle de Las pruebas estadsticas para contrastar las hiptesis se


muestran en la HE.
32

La proporcin esperada para cada uno de los grupos es de P = 0,25.


La prueba de la 2 proporcionar el criterio mediante:
4
241
fo
i fei 0,5
2


50 66,5 0,5 2


81 66,5 0,5 2


i 1 fei 66,5 66,5


83 66,5 0,5 2


52 66,5 0,5 2

13,5940
66,5 66,5

Que determina una probabilidad de:


1 1
13,5940
13,5940 41
13,5940
F13,5940; 4-1 Y0 2 e 2
d 0,0035
0

Indica que al menos una de los estratos muestra una proporcin


diferente. Al estudio interesa el Nivel 1 con un porcentaje de 18% de
la muestra.
33

Para la valoracin de hiptesis de variables continuas se utiliza el Anlisis de


la Varianza Irrestricto y una prueba de promedios, el este ejemplo Diferencia
Mnima Significativa o de t..
El ANDEVA de Talla no indic diferencias significativas. El ANDEVA del
Peso es:
ANLISIS DE VARIANZA DEL PESO DE BEBS.
Origen de las Suma de Grados de Promedio Estadstico Probabilidad Valores crtico para F
variaciones cuadrados e libertad cuadrados F F 0,05 0,01
Entre grupos 61,1425 3 20,3808 337,0087 0,0000 2,6391 3,8572
Dentro de los grupos
15,8446 262 0,0605

Total 76,9871 265

Los contrastes entre promedios indicaron diferencias significativas entre


todos. El Nivel 1 mostr los pesos ms bajos.
Promedios Tamao Muestra Estadstico Probabilidad Criterios Resumen
Contraste 1 2 Diferencia n1 n2 t t 0,05 0,01
N1 vs N2 2,6950 3,2672 -0,5722 50 81 12,937 0,0000 1,969 2,595 **
N1 vs N3 2,6950 3,6217 -0,9266 50 83 21,049 0,0000 1,969 2,595 **
N1 vs N4 2,6950 4,1771 -1,4821 50 52 30,428 0,0000 1,969 2,595 **
N2 vs N3 3,2672 3,6217 -0,3545 81 83 9,229 0,0000 1,969 2,595 **
N2 vs N4 3,2672 4,1771 -0,9099 83 52 20,921 0,0000 1,969 2,595 **
N3 vs N4 3,6217 4,1771 -0,5554 83 52 12,771 0,0000 1,969 2,595 **
34

Deber entenderse est utilizando un ejemplo dinmico


para ejemplificar, y que los datos aun cuando se generan
partiendo de los resultados originales no son reales, por
esto, todos los registros de la poblacin tienen resultados de
la encuesta aplicada a las familias.
Se confa que el estudiante tiene la capacidad para
discernir que en la realidad, la informacin que se utiliza a
continuacin slo se recab en una muestra de familias
seleccionadas.
Puesto que se ejemplifican categoras en las que se encasilla
a las familias en respuestas concretas, el tratamiento
estadstico utiliza mtodos para Variables Cualitativas en:
nmeros, proporciones o porcentajes.
35

El Objetivo de los Cuadros de Resultados es ofrecer al lector una


apreciacin sinttica de los resultados de la exploracin, sea en nmeros
o en porcentajes, siendo ms universales los porcentajes.
Estos Cuadros de Resultados, como se sabe, definidos de previo para
responder a una o ms hiptesis del estudio, se obtienen mediante
clasificacin de la informacin capturada y se presenta en tablas de dos
o ms entradas en las que concurre la informacin de dos o ms
variables Cualitativas o Cuantitativas; en el ejemplo:
Nivel Econmico en 4 clases: bajo, Medio Bajo; Medio Alto y Alto.
Hbitos Higinicos: Deficiente, Suficiente y Eficiente.
Hbitos Nutricionales: Deficiente, Suficiente y Eficiente.
36

Cuadro de tres entradas. Porcentajes


Nivel Hbitos Hbitos Nutricionales Suma
Econmico Higinicos Deficiente Suficiente Eficiente H. Higinicos
Bajo Deficiente 1,13 1,13
Suficiente 4,51 6,39 4,14 15,04
Eficiente 2,26 0,38 2,63
Suma Nivel Bajo 5,64 8,65 4,51 18,80
Medio Bajo Deficiente 3,01 0,00 0,00 3,01
Suficiente 8,27 9,40 4,89 22,56
Eficiente 3,38 1,50 4,89
Suma Nivel Medio Bajo 11,28 12,78 6,39 30,45
Medio Alto Deficiente 4,14 4,14
Suficiente 6,02 12,78 3,38 22,18
Eficiente 3,38 1,50 4,89
Suma Nivel Medio Alto 6,02 16,17 9,02 31,20
Alto Deficiente 3,01 3,01
Suficiente 3,01 6,39 2,63 12,03
Eficiente 3,01 1,50 4,51
Suma Nivel Alto 6,02 9,40 4,14 19,55
Suma H. Nutricionales 28,95 46,99 24,06 100,00
Suma H Higinicos 11,28 71,80 16,92
37

La Informacin del Cuadro de Resultados anterior,


considera todas las variables de la encuesta, sirve para
estudiar los nmeros, proporciones o porcentajes que se
presentan, en cada una de las categoras que se forman al
separar la informacin en las diferentes clases que se crean
al combinar las variables.
Por ejemplo:
El Nivel Econmico bajo muestra nicamente Hbitos
Higinicos deficientes y Hbitos Nutricionales deficientes.
Los Niveles Medios muestran los mejores Hbitos
Higinicos y Nutricionales.
38

Para obtener una visione ms precisa sobre las relaciones que guardan entre
s las variables de tipo cualitativo, se acostumbra ir condensando la
informacin en Cuadros de Orden Inferior hasta llegar a Cuadros de Dos
Entradas.
En este ejemplo con tres variables el nivel subsecuente es la combinacin de
dos variables resultando en los siguientes Cuadros de Resultados.
Nivel Econmico con Hbitos Higinicos;
Nivel Econmico con Hbitos Nutricionales;
Y Hbitos Higinicos con Hbitos Nutricionales.
Habr notado que se usan para los mismos cuadros los nombres de Tablas
de n Entradas y Cuadros de Resultados. Tablas de n Entradas se refiere al
proceso de acomodar los datos en una forma determinada y Cuadros de
Resultados a la presentacin de los resultados en respuesta a hiptesis del
estudio
39

Nivel Hbitos Higinicos Suma


Econmico Deficiente Suficiente Eficiente N. Econmico
Bajo 3 40 7 50
Medio Bajo 8 60 13 81
Medio Alto 11 59 13 83
Alto 8 32 12 52
S. H. Higinicos 30 191 45 266

Nivel Econmico Encuestado Hbios Higinicos

20% 19%
Eficiente

Suficiente

31% 30% Deficiente

0,00 20,00 40,00 60,00 80,00

Bajo Medio Bajo Medio Alto Alto Porcentajes

En la presentacin de resultados muchas veces es conveniente utilizar


grficos, en este caso porcentuales, acompaando el cuadro de nmeros
de individuos. Los grficos suelen ser muy explcitos.
40

Nivel Hbitos Nutricionales S. Nivel


Econmico Deficiente Suficiente Eficiente Econmico
Bajo 5,64 8,65 4,51 18,80
Medio Bajo 11,28 12,78 6,39 30,45
Medio Alto 6,02 16,17 9,02 31,20
Alto 6,02 9,40 4,14 19,55
S. H. Nutricionales 28,95 46,99 24,06 100,00

En ocasiones, el comportamiento
Nivel con Hbitos Nutricionales % de los niveles de una variable
presenta magnitud y tendencias
20,00
diferentes en presencia de los
15,00
niveles de otras variables. Esta
10,00
condicin se conoce como
5,00 Interaccin, fenmeno que
0,00 Eficiente
Suficiente
muchas veces interesa a los
Bajo
Medio Deficiente
H.Nutricionales
investigadores y puede ser
Bajo Medio

Nivel Econm ico


Alto Alto
valorado mediante pruebas de 2
en tablas de contingencia, como
se ver ms adelante.
41

Hbitos Hbitos Nutricionales S. Hbitos


Higinicos Def. Suf. Efi. Higinicos
Def. 7,14 0,00 4,14 11,28
Suf. 21,80 34,96 15,04 71,80
Efi. 0,00 12,03 4,89 16,92
S. H. Notricionales 28,95 46,99 24,06 100,00

En el ltimo Cuadro de Resultados


queda por mostrar el Hbitos Niginicos y Nutricionales en
Porcentajes
comportamiento de la segunda y
35,00
tercera variables y las relaciones 30,00

entre los niveles de ambas que 25,00


20,00
aparenta una interaccin de 15,00

direccin: Los hbitos higinicos 10,00


Efi.
5,00
muestran un comportamiento 0,00
Suf.
Def.
H.
Nutricionales
parablico Con concavidad Def.
Suf.
Ef i.
H. Higinicos.
superior en el eficiente e inferior en
los otros.
42

En muchas ocasiones, los investigadores estn interesados en valorar la


interaccin entre grupos de clasificacin. Estas pueden ser de posicin,
esto es, que una o ms clases (celdas) muestran valores de magnitud tal
que resultan en pruebas significativas sin cambiar la direccin general
(Nivel Econmico con Hbitos Nutricionales); o interacciones de direccin
en donde la tendencia general de una clase dentro de la alterna muestran
direccin opuesta (Hbitos Higinicos con Hbitos Nutricionales). La
prueba recomendada es de 2 definida por:

h c
(2h1)( c 1)
foij feij 0,5 2

; i 1,2,..., c Columnas; j 1,2,..., h Hileras


j 1 i 1 feij

ni . n. j
En donde: feij
n..
El total par hileras es ni.; el total para columnas es n.j; y el total general es n...
La prueba se valora con (c 1)(h 1) grados de libertad
Ho; Los Hbitos Higinicos son Independientes 43

del Nivel Econmico?

Nivel Hbitos Higinicos Suma No hay Interaccin significativa


Econmico Deficiente Suficiente Eficiente N. Econmico
Bajo 3 40 7 50 25,0
Esperados 5,6 35,9 8,5
20,0

Porcentajes
X parciales 0,8114 0,3605 0,1086 1,2806
Medio Bajo 8 60 13 81 15,0
Esperados 9,1 58,2 13,7
X parciales 0,0442 0,0308 0,0030 0,0780 10,0
Medio Alto 11 59 13 83
5,0
Esperados 9,4 59,6 14,0
X parciales 0,1386 0,0002 0,0209 0,1596 0,0
Alto 8 32 12 52 Bajo Medio Bajo Medio Alto Alto
Esperados 5,9 37,3 8,8
X parciales 0,4560 0,6270 0,8305 1,9135 Nivel Econnico
S. H. Higinicos 30 191 45 266
Suma Chi-cuadradas parciales 3,4317 Deficiente Suficiente Eficiente
Probablida de la chi-cuadrada 0,7530

La prueba de 2 del cuadro indica que las diferencias se deben al azar y


debe aceptarse la hiptesis nula.
No se refleja la interaccin con una magnitud tal que la prueba lo indique.
Esto se puede corroborar en el grfico adjunto en donde para los Cuatro
Niveles Econmicos la tendencia es similar aun cuando hay diferencias en
magnitud.
Ho; Los Hbitos Nutricionales son 44

Independientes del Nivel Econmico?


Nivel Hbitos Nutricionales S. Nivel
Econmico Deficiente Suficiente Eficiente Econmico
Bajo 15 23 12 50
Esperado 14,5 23,5 12,0
Chi-parcial 0,0000 0,0000 0,0184 0,0184
Medio Bajo 30 34 17 81
Esperado 23,4 38,1 19,5
Chi-parcial 1,5624 0,3337 0,2029 2,0990
Medio Alto 16 43 24 83
Esperado 24,0 39,0 20,0
Chi-parcial 2,3576 0,3134 0,6240 3,2950
Alto 16 25 11 52
Esperado 15,1 24,4 12,5
Chi-parcial 0,0133 0,0002 0,0817 0,0952
S. H. Nutricionales 77 125 64 266
Suma de chi-parciales 5,4125
Probabilidad de la prueba 0,0000

Aun cuando no es correcto graficar con lneas las variables cualitativas,


facilitan la explicacin de este tipo de interaccin: Para los niveles Bajo,
Medio Bajo, Medio Alto y Alto las tendencias van de valores medios para
Hbitos Nutricionales deficientes, valores altos para niveles suficientes y
bajos para Nivel Nutricional deficiente, sealados con lneas de color rojo
(flechas hacia la derecha) mientras que para el Nivel Econmico Alto la
direccin es inversa sealada con una lnea de color verde brillante (flechas
hacia la izquierda). Las diferencias son ms que altamente significativas.
Ho; Los Hbitos Higinicos son Independientes 45

de los Hbitos Nutricionales?


Hbitos Hbitos Nutricionales S. Hbitos Interaccin de Direccin
Higinicos Deficiente Suficiente Eficiente Higinicos
Deficiente 19 0 11 30 40,00
8,6842 14,0977 7,2180 35,00
11,0948 13,1155 1,4923 25,7026 30,00

Porcenajes
Suficiente 58 93 40 191 25,00
55,2895 89,7556 45,9549 20,00
0,0884 0,0839 0,6475 0,8198
15,00
Eficiente 0 32 13 45
10,00
13,0263 21,1466 10,8271
5,00
12,0455 5,0690 0,2585 17,3730
0,00
S. H. Nutricionales 77 125 64 266
N. Def. N. Suf. N. Efi.
Suma de chi-parciales 43,8954
Probabilidad de la prueba 0,0000 Hbitos Nutricionales

H. Def. H. Suf. H. Efi.

Con Hbitos de Nutricin Deficientes la mayor proporcin de familias


muestra Hbitos Higinicos deficientes y suficientes, no aparecen familias
con Hbitos Suficientes (lnea verde brillante); con un Nivel Nutricional
Suficiente, la mayora de las familias muestran Hbitos Higinicos
Suficientes seguidas de familias con hbitos Higinicos deficientes y meno
eficientes (lnea roja); las familias con Hbitos Nutricionales Eficientes, no
hay familias con Hbitos Higinicos deficientes (lnea roja). El estudiante
habr notado, adems, una interaccin de posicin. Las diferencias son
ms que altamente significativas.
46

Aun cuando no se incluy en el proyecto original, es posible


conseguir Opciones Inductivas. Esto es, estimar algunas
variables, por ejemplo El Peso al Nacimiento de los recin
nacidos, partiendo de la informacin cualitativa recolectada
en la encuesta. Esto, se intentar calificando en una escala
de 0% a 100% las variables Nivel Nutricional con 25%,
50%, 75% y 100%; Hbitos Higinicos y Hbitos
Nutricionales con 33,33%, 66,66% y 99,99%.
De esta manera, las variables cualitativas se transforman en
variables numricas, facultando entonces, la posibilidad de
utilizar Tcnicas de Induccin como La Regresin y La
Correlacin.
47

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,8871
Coeficiente de determinacin R^2 0,7869
R^2 ajustado 0,7836
Error tpico 0,2507
Observaciones 266

ANLISIS DE VARIANZA
Fuente de Grados de Suma de Promedio de Estadstico Probabilida Valores Crticos
La variacin Libertad Cuadrados Cuadrados F F 0,05 0,01
Regresin 4 60,5786 15,1446 240,8962 0,0000 2,4062 3,3918
Residuos 261 16,4085 0,0629
Total 265 76,9871

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%


Intercepcin 2,2176 0,0754 29,4208 0,0000 2,0691 2,3660
N. Econmico 0,0189 0,0006 31,0250 0,0000 0,0177 0,0201
H. Higinico 0,0009 0,0010 0,9080 0,3647 -0,0011 0,0029
H. Nutricional -0,0001 0,0007 -0,0870 0,9308 -0,0015 0,0014
Sexo -0,0324 0,0310 -1,0477 0,2957 -0,0934 0,0285
48

Debe recordarse que la Tcnica de Regresin cuando no se usa en


experimentacin planificada, generalmente refleja relacione fortuitas.
Por esto, en estudios de muestreo, en donde no se tiene control del
material experimental la relacin nunca deber considerarse Causal.
La finalidad de la tcnica en conseguir un modelo lineal que permita
proyectar los resultados de una combinacin de factores. El modelo de
regresin significativo de la diapositiva anterior nicamente refiere al
Nivel Econmico como factor de prediccin mediante:

y i 2,2176 0,0189( N i )
Esto es, cada aumento de una unidad en el nivel econmico se refleja
en 0,0189 kilos de peso del recin nacido.
Las variables restantes no influyen en el peso o su influencia ha sido
absorbida por el Nivel Econmico.
49

La Correlacin es La Tcnica Estadstica que facilita la obtencin de


relaciones, casuales o causales, entre conjuntos de variables
aleatorias. Este coeficiente va desde 1 cuando una variable decrece
una unidad cuando la otra se incrementa en una unidad; pasando por
0 cuando no hay relacin; hasta +1 cuando una variable crece una
unidad cuando la otra se incrementa en una unidad. Los resultados se
muestran en el siguiente cuadro en donde la nica relacin
importante es el nivel econmico con el peso. Y. tal vez, los hbitos
nutricionales con el peso.
50

El muestreo completamente aleatorio en la eleccin de la


muestra, es, por definicin probabilstico y representativo. Sin
embargo es, uno de los ms costosos.
Los investigadores de la ciencia estadstica han desarrollado
tcnica de muestreo, algunas probabilsticas con mucha
seguridad de que sean a la vez representativas. Otras que no son
probabilsticas pero s representativas y otras que combinan
ambos objetivos. Las familias de estas son:
Muestreo de Unidades Accesibles;
Muestreo Sistemtico;
Muestreo por Estratos;
Muestreo por Etapas;
Muestreo de Razn y Regresin.
51
Muestreo de Unidades Accesibles.
Recuerde que en un muestreo completo al azar se requiere una enumeracin de
cada unidad que puede ser objeto de seleccin. En muchas ocasiones esto no es
posible recurriendo a esta tcnica de muestreo.

Esta tcnica de muestreo aprovecha proceso de mezcla y revoltura que


sufren las unidades de muestreo previo a la eleccin de la muestra.
Estibas de grano de caf que llegan a una torrefactora;
Furgones de carbn que entran a una industria geotrmica;
Apilados de minerales en un empresa fabricante de fertilizantes qumicos;
Cajas de verduras que entran a un centro de acopio;

No es estrictamente probabilstico, pero si es representativo del fenmeno, sobre


todo econmico y con buenos resultados.

Un ejemplo de este tipo de muestreo lo encuentra en el ejemplo 1 de la unidad 7.


Un doctor oftalmlogo que valora dos tcnicas quirrgicas y utiliza la
informacin que tiene a la mano.
52

Muestreo Sistemtico.

Este tipo de muestreo se utiliza mucho en el control de la calidad en los


procesos de lneas de fabricacin en donde se opera sin interrupciones.

No es un muestreo probabilstico pero si representativo del proceso de


produccin de la unidades mustrales, generalmente ms acucioso que un
muestreo CA (Complet la Azar) y sobre todo, ms econmico.

Un ejemplo de este tipo de muestreo lo encuentra en el problema 4 de la


unidad 7, de una empresa que exporta en envases de cartn.

Ejemplos de este tipo de muestreo lo encuentra en el problema 4 de la


unidad 7, de una empresa que exporta en envases de cartn y en casi
todas las unidades en que aborda el control de la calidad.
53
Muestreo por Estratos o Estratificado
Esta tcnica de muestreo, es probabilstica y especficamente
representativa de grupos bien diferenciados.

Aprovecha la facilidad que ofrece el Anlisis de la Varianza (ver


captulo 10) para reducir la variacin. Entonces, por definicin,
ste tipo de muestreo es ms eficiente.

La restriccin es, que cada grupo constituye una poblacin


independiente y como tal deben ser tratadas. Esto significa que
los resultados y conclusiones de un estrato nicamente son
vlidos para ese estrato.

La principal ventaja consiste en reducir enormemente el costo del


muestreo al reducir drsticamente el tamao de la muestra.
54
Tamao de muestra en Muestreo por Estratos.

Suponga que tiene informacin de un muestro precio, por


ejemplo en este caso. La diapositiva 33 muestra el ANDEVA
en donde la varianza o Cuadrado Medio del Error alcanza un
valor de:
S E2 0,0605

Qu, bajo las mismas condiciones determina un tamao de


muestra de:
z 2 S E2 2,57582 0,0605
n 2 2
54
d 0,086

Una reduccin muy significante del tamao de la muestra


comparada con las 266 anteriores.
55
Asignacin proporcional al tamao del estrato.

La manera inmediata de asignar las 54 muestras es considerando


el tamao relativo del estrato. Recuerde que el estrato lo define
el nivel econmico.
La asignacin proporcional se hace mediante:
ni 50
ni n ; para N1; n1 54 11
N 266

Cada una de las muestras se redondea al entero superior, por esto


se debern muestrear 56 unidades.
56

Asignacin Eficiente de la Muestra.


Otra forma de asignar la muestra a los estratos es utilizar un valor pesado
mediante el nmero de individuos en un estrato y la variacin intrnseca del
mismo. As, si el estrato es ms grande y tiene menos varianza, es posible que la
muestra sea menor si el estrato muestra ms varianza. Esto se puede conseguir
multiplicando el coeficiente de variacin por el tamao del estrato, sumarlo y
distribuir proporcionalmente la muestra. Esto es:

0,3218
50
N i c.v i 2,6950 18
ni nT ; para el estrato N1 : n 56
E
1
18,9250
N i c. v i
i 1
57

Eleccin de la muestra.
El estudiante habr comprendido que en esta tcnica de muestreo
es necesario contar con un listado que identifique a la unidad
muestral y el estrato al que pertenece.

A continuacin se obtienen nmeros aleatorios para cada estrato.


La seleccin se har de la misma manera en que se seleccion la
muestra en el diseo CA.

Puede auxiliarse del filtro de la HE para separar el estrato de la


Base de Datos.

En la HE se ofrece la muestra para el primer estrato. De aqu en


adelante, se procede como se hizo con el muestreo CA.
58

Muestreo por Etapas o Anidado


En sta tcnica de muestreo su supone que se suceden una serie de
estaciones en el proceso de muestreo. Supngase que se quiere explorar las
enfermedades que afectan a los cafetos de Costa Rica. Obtener una muestra
de todos los caficultores, ubicacin y estado del cafeto puede ser
complicado. Pero si se cuenta con la ubicacin de las zonas cafetaleras del
pas por provincia cantn y distrito.
Supngase que se obtiene una muestra al azar de 300 cantones productores,
dentro de estos cantones, al azar tambin 3 distritos cafetaleros, dentro de
estos distritos se revisarn 4 fincas que se eligen por su accesibilidad, dentro
de la finca se eligen al azar 2 cultivares, dentro de estos, tambin al azar 2
calles, y dentro de las calles, dos matas tambin al azar. De esta manera se
tendr una muestra de:

n 10 3 4 2 2 2 960
Muestras. Con una etapa que no se hace al azar.
59
Muestreo de Razn y Regresin
Este tipo de muestreo se aplica a variables que estn relacionadas sea de
manera casual o de manera causal. El objetivo es, fundamentalmente, reducir el
costo del muestreo utilizando, nuevamente, la propiedad de eficiencia
estadstica de los estimadores.
Esto quiere decir que vuelve a entrar en juego la tcnica del Anlisis de la
varianza en la modalidad de regresin.
nicamente como ejemplo, suponiendo que se utiliza la relacin del nivel
econmico con el peso de la diapositiva 8,47 para obtener una muestra. La
varianza o cuadrado medio del error para el peso del los bebs fue entonces, el
tamao de muestra sera:
z 2 S E2 2,5758 2 0,0629
n 2 57
d 0,086 2
Cantidad muy parecida a la que se obtendra del muestreo estratificado.
Cuando se analiza un factor como es el caso, el ANDEVA y la regresin suelen
ser idnticos. La diferencia se debe a la concurrencia de ms factores en la
regresin mltiple.
Tamao de muestra para variables cuantitativas 60

Usando la HE puede calcular diferentes tamaos de muestra


modificando los valores que se solicitan en verde brillante
Tamao de Muestra Para Variables Cualitativas 61

Usando la HE puede calcular diferentes tamaos de muestra


modificando los valores que se solicitan en verde brillante
62

La inmensa mayora de personas requerimos de un


punto de partida para iniciar la solucin de un
problema. Como profesionista enfrenta retos y
situaciones que debe resolver de inmediato; un ejemplo
personalizado, adems de no obligarlo a memorizar
situaciones que puede requerir eventualmente, le
llevar a recordad con firmeza.
Por esto, se recomienda al estudiante que elabore su
propia charla utilizando las facilidades de generar
problemas, siguiendo los pasos de este ejemplo,
obteniendo resultados muy similares, que pueden, sin
embargo, hacer variar las conclusiones en su problema.
Tcnicas de Muestreo.
Manuel Pontigo A.