Вы находитесь на странице: 1из 19

Estadística II

Unidad 1. Conceptos Básicos de Muestreo

1.1 Introducción al Muestreo.

El propósito de un estudio estadístico suele ser, extraer conclusiones acerca de la naturaleza de una
población. Al ser la población grande y no poder ser estudiada en su integridad en la mayoría de los
casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de ésta, lo
que nos lleva, en primer lugar a la justificación, necesidad y definición de las diferentes técnicas de
muestreo.

Una parte fundamental para realizar un estudio estadístico de cualquier tipo es obtener unos
resultados confiables y que puedan ser aplicables. Como ya se comentó anteriormente, resulta casi
imposible o impráctico llevar a cabo algunos estudios sobre toda una población, por lo que la solución
es llevar a cabo el estudio basándose en un subconjunto de ésta denominada muestra

Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que tal
subconjunto de datos, o muestra, posea algunas características específicas que permitan, al final,
generalizar los resultados hacia la población en total. Esas características tienen que ver
principalmente con el tamaño de la muestra y con la manera de obtenerla.

El muestreo: es una herramienta de la investigación científica. Su función básica es determinar que


parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer
inferencias sobre dicha población

El Muestreo es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se
procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no
necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.

La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución
de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.

El muestreo, como ya se mencionó, implica algo de incertidumbre que debe ser aceptada para poder
realizar el trabajo, pues aparte de que estudia una población resulta ser un trabajo en ocasiones
demasiado grande, se ofrecen las siguientes razones extras:

 Recursos limitados. Es decir, no existen los recursos humanos, materiales o económicos para
realizar el estudio sobre el total de la población. Es como cuando se compra un aparato, un automóvil
usado (por ejemplo), que se prueba unos minutos (el encendido, una carrerita, etc.) para ver si
funciona correctamente y luego se adquiere, pero no se espera a probarlo toda la vida (encendiéndolo
y apagándolo o, simplemente, dejándolo encendida) antes de realizar la adquisición.

 Costo reducido. Si los datos que buscamos los podemos obtener a partir de una pequeña parte del
total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo,

1
Estadística II
cuando se realizan encuestas previas a un referéndum, es más barato preguntar a 4.000 personas su
intención de voto, que a 30.000.000;

 Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio
paleontológico de los dinosaurios (el T. Rex por ejemplo) sería muy bueno contar con, al menos,
muchos restos fósiles y así realizar tales investigaciones; sin embargo, se cuenta sólo con una docena
de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo el mundo.

 El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la población total
puede causar errores por su tamaño o, en el caso de los censos, que sea necesario utilizar personal
no lo suficientemente capacitado; mientras que, por otro lado, el estudio sobre una muestra podría ser
realizada con menos personal pero más capacitado.

 Duración. El muestreo permite acelerar el proceso de inferencia estadística ya que proporciona


estimaciones en un breve plazo.

 Calidad de la información. El muestreo permite seleccionar personal calificado ya que se trabaja


con pocas personas.

 Mayor Alcance. En una encuesta por ejemplo, se puede realizar mayor cantidad de preguntas, es
decir se puede tratar un mayor número de variables.

 Mayor Precisión. La precisión del muestreo es controlable, ya que previa a la realización se


establece el margen de error.

 Medición del grado de precisión y eficiencia de la metodología empleada. La teoría de las


probabilidades permite hacer una evaluación del diseño de la muestra utilizada.

 Única alternativa. Algunas veces la población es infinita y no es posible analizar toda la población.
Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas, no es posible
en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es
mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.

1.2 Tipos de Muestreo.

1) Muestreo Probabilístico. Consiste en elegir una muestra de una población al azar. Podemos
distinguir varios tipos de muestreo:

2) Muestreo No Probabilístico. Es aquél para el que no puede calcularse la probabilidad de


extracción de una determinada muestra. Se busca seleccionar a individuos que tienen un conocimiento
profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas
personas es vital para la toma de decisiones.

Métodos de Muestreo Probabilístico.

a) Muestreo aleatorio simple


Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los “n”
elementos que contiene la muestra.

2
Estadística II
b) Muestreo aleatorio sistemático
Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta
completar la muestra.

Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de
25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 =
4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el
4, y a partir de él obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98

c) Muestreo aleatorio estratificado


Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de
cada estrato proporcional al número de componentes de cada estrato.

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay
200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

d) Muestreo aleatorio por conglomerados.


En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que
forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras
ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de


conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después
todos los elementos pertenecientes a los conglomerados elegidos.

Tipo de
Características Ventajas Inconveniente
Muestreo
Se selecciona una muestra  Sencillo y de fácil Requiere que se posea de
de tamaño n de una comprensión. antemano un listado completo
población de N unidades,  Cálculo rápido de medias y de toda la población.
Aleatorio cada elemento tiene una varianzas. Cuando se trabaja con
Simple probabilidad de inclusión  Se basa en la teoría muestras pequeñas es posible
igual y conocida de n/N estadística, y por tanto existen que no represente a la
paquetes informáticos para población adecuadamente.
analizar los datos.
Conseguir un listado de los N • Fácil de aplicar. Si la constante de muestreo
elementos de la población. • No siempre es necesario tener está asociada con el fenómeno
Determinar tamaño muestral un listado de toda la población. de interés, las estimaciones
n. • Cuando la población está obtenidas a partir de la
Definir un intervalo k= N/n. ordenada siguiendo una muestra pueden contener
Sistemático
Elegir un número aleatorio, r, tendencia conocida asegura sesgo de selección
entre 1 y k (r= arranque una cobertura de unidades de
aleatorio). todos los tipos.
Seleccionar los elementos
de la lista.

3
Estadística II
En ciertas ocasiones  Tiende a asegurar que la Se ha de conocer la
resultará conveniente muestra represente distribución en la población de
estratificar la muestra según adecuadamente a la población las variables utilizadas para la
ciertas variables de interés. en función de unas variables estratificación.
Para ello debemos conocer seleccionadas.
la composición estratificada  Se obtienen estimaciones
de la población objetivo a más precisa
Estratificado hacer un muestreo. Una vez  Su objetivo es conseguir una
calculado el tamaño muestra lo más semejante
muestral apropiado, este se posible a la población en lo que
reparte de manera a la o las variables
proporcional entre los estratificadoras se refiere.
distintos estratos definidos
en la población usando una
simple regla de tres.
Se realizan varias fases de o Es muy eficiente cuando la o El error estándar es mayor
muestreo sucesivas población es muy grande y que en el muestreo aleatorio
(polietápico) dispersa. simple o estratificado.
La necesidad de listados de o No es preciso tener un listado o El cálculo del error estándar
Conglomerado las unidades de una etapa de toda la población, sólo de las es complejo.
se limita a aquellas unidades primarias de
unidades de muestreo muestreo.
seleccionadas en la etapa
anterior.

Con independencia del tipo de muestreo que utilice, el muestreo puede hacerse con o sin reposición, y
la población de partida puede ser infinita o finita.

Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida
media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.

Con reposición de los elementos: Las observaciones se realizan con reemplazamiento de los
individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy
grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse
sin reposición aunque, realmente, no lo sea.

Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra
podemos calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.

2) Métodos de muestreo no probabilísticos

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se


acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la
muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma
probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando, en la medida de lo posible, que la muestra sea representativa.

4
Estadística II
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas
de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de
caso-control, donde los casos no son seleccionados aleatoriamente de la población.

Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:

a) Muestreo por cuotas.


También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados"
para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen
unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y
residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

b) Muestreo intencional o de conveniencia.


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas"
mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización
en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

También puede ser que el investigador seleccione directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los
que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios
alumnos).

c) Bola de nieve.
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir
una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

d) Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al
estudio.

1.3 Etapas de estudio por Muestreo.

1.- Objetivos del muestreo. Se debe presentar una exposición clara de los objetivos del estudio, ya
que de otra forma se pueden olvidar los objetivos principales establecidos en la planeación y tomar
decisiones equivocadas. Esta etapa comprende la identificación del problema y el establecimiento de
las metas del estudio.

2.- Definición del marco de muestreo. Antes de la selección de la muestra, la población debe ser
dividida en partes denominadas unidades de muestra. El marco de muestreo es el conjunto de las
unidades de muestreo que constituyen una población. Este generalmente puede ser de dos tipos:

a) Marco lista: Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada
unidad de muestreo. Por ejemplo, una lista que contenga el nombre de todos los proveedores de caña

5
Estadística II
de azúcar de un ingenio. Es recomendable que además de identificar a cada unidad muestral, incluya
algunas otras características de interés, por ejemplo, tamaño de la finca de cada proveedor.

b) Es un plano o mapa que permite identificar pequeñas áreas usadas como unidades de muestreo en
las que se ha dividido el área total.

3.- Variables a medir y métodos de medición. Debemos tener especial cuidado en la construcción
de la forma de registro de la información que se va a recolectar de forma tal que esta pueda ser
debidamente pre-codificada. Es importante considerar el tipo de variable a medir, por ejemplo: si se va
a estudiar el rendimiento de caña de azúcar, la variable es de tipo continuo, si interesa estimar la
proporción de agricultores que utilizan herbicidas para el control de malezas, se medirá una variable de
tipo binomial. El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo.

Los métodos de medición deben de tener las siguientes características:


a) uniformidad. b) practicabilidad. c) deber ser comprensibles para el grupo de trabajo.

4.- Nivel de Precisión deseado. Especificar lo más adecuado posible el nivel de precisión deseado de
tal forma que se pueda reducir la incertidumbre de los resultados.

5.-Tipo o Esquema de Muestreo. Existen actualmente una gran variedad de tipos o esquemas de
muestreo que han sido desarrollados para diferentes situaciones, entre los mas usados están:
muestreo simple aleatorio, muestreo aleatorio estratificado, muestreo sistemático.

6.- Determinación del tamaño de muestra (n). Hacer estimaciones del tamaño de la muestra
partiendo de un conocimiento del nivel de precisión deseado.

7.- Encuesta piloto. Es de gran utilidad probar los métodos de campo que se van a emplear en una
pequeña escala, para mejorar el cuestionario antes de iniciar el trabajo definitivo.

En un estudio, es conveniente someter el método a una prueba previa por las siguientes razones:
a) Algunas veces es imprescindible realizar un premuestreo para tener una estimación preliminar de
la variabilidad de la población.
b) Verificar la funcionalidad de un método de muestreo.
c) Estimar costos.
d) Conocer la eficiencia de la organización del trabajo de campo.
e) Captar la aceptación, rechazo o dificultad para obtener la información.

8.- Organización del trabajo de campo. El personal debe recibir la capacitación con relación al
propósito de la encuesta y debe ser supervisado por personal especializado.

9.- Selección de las unidades de muestreo. Consiste en extraer un número n de unidades


muestrales de una población de tamaño N.

10.- Resumen y análisis. Después de realizar la encuesta se corrigen errores, se desechan datos
equivocados y se redacta el informe. Este informe debe contemplar números, graficas, redacción en
prosa, infografías, cuadros comparativos, matrices, etc. Puede consistir sólo en la presentación e
interpretación de distribuciones simples, tabulaciones, gráficas o puede considerar un análisis
estadístico más complejo (Estimación, pruebas de hipótesis, etc.) esto depende básicamente de los
objetivos del trabajo.

6
Estadística II
Conceptos.
Población: Conjunto total de elementos objeto de estudio. También se denomina universo o colectivo.
La población puede estar formada por personas, hogares, instituciones u objetos.

Marco: Conjunto de elementos de la población total disponibles para la selección de la muestra. En


ocasiones todos los elementos de la población están disponibles y, por tanto, el marco es igual a la
población. En otros casos no se produce esa igualdad.

Unidad muestral: Unidad seleccionada de la población para la aplicación de la técnica de


investigación. Puede ser un elemento poblacional único o un conjunto de elementos.

Muestra: Conjunto de unidades muestrales seleccionadas para la aplicación de la técnica.

Método de Muestreo. Procedimiento utilizado para seleccionar de forma representativa las unidades
muestrales.

Tamaño de la muestra: Número de unidades muestrales que componen la muestra seleccionada. Es


un factor determinante del nivel de validez de las respuestas

Error de Muestreo: Error cometido al no tratar toda la población. Es un error admitido y controlado al
generalizar los resultados de una muestra obtenida aleatoriamente a la población total.

Error No Muestral: Error ajeno al proceso de muestreo difícil de acotar y motivado principalmente por
una elevada tasa de no respuesta, errores de diseño de cuestionario, sesgos del entrevistador, etc. Un
control riguroso de todo el proceso de realización del estudio reduce este tipo de errores que pueden
restar gran parte de la validez de los resultados.

Dispersión: Medida estadística del nivel de variación de la opinión del colectivo total sobre el tema
analizado respecto al valor medio.

Inferencia Estadística: Proceso de proyección o estimación de resultados válidos para una población
a partir de los resultados obtenidos de una muestra de esa población

Parámetro: Característica de la población que nos interesa. El valor verdadero del parámetro no se
conoce, puesto que es lo que tratamos de descubrir mediante el procedimiento muestral.

Estimador (Estadístico): Es el que resulta de la muestra escogida, es la estimación del verdadero


valor de la característica de la población. Valor muestral utilizado para inferir un valor poblacional.

Exactitud. Representa la aproximación más cercana de la muestra al valor verdadero del parámetro
de la población, expresándose a menudo como un intervalo.

Intervalo de Confianza: Intervalo con una determinada probabilidad de incluir el valor poblacional.
Este intervalo se determina a partir de los resultados muestrales y el error de muestreo.

Nivel de Confianza: Es el grado de certidumbre que tenemos sobre la exactitud de la estimación de la


muestra. Probabilidad de obtener un intervalo de confianza concreto.

7
Estadística II
1.4 Distribuciones Muestrales

La estadística inferencial involucra el uso de un estadístico para sacar una conclusión o inferencia
sobre el parámetro correspondiente de la población

Por ejemplo se usa:


X Media de muestra para estimar la  media poblacional
s Desviación estándar de muestra para estimar la  desviación estándar poblacional
p Proporción en la muestra para estimar la  proporción poblacional

Error de muestreo: es la diferencia entre el parámetro poblacional y el estadístico de la muestra


utilizado para estimar el parámetro.

Por ejemplo la diferencia entre:


X y  s y  p y 
Objetivos de la inferencia:
 Estimación de parámetros,
 Intervalos de confianza y
 Test de hipótesis o pruebas de significación estadística

A las distribuciones de los estadísticas muestrales se les llama distribuciones muestrales.

Distribución muestral: es un conjunto de todos los valores posibles para un estadístico y la


probabilidad relacionada con cada valor.

Una distribución de probabilidad de todos los parámetros de las muestras es una distribución muestral.
Esta distribución muestral puede ser de medias y de proporciones.

Cualquier distribución de probabilidad (y por lo tanto cualquier distribución de muestreo) puede ser
descrita parcialmente por su media y su desviación estándar.

Distribución de
Población Muestra Estadística de Muestreo
Muestreo
Agua de un Pozo Recipientes de 10 Numero medio de partes de Distribución de
galones de agua mercurio por millón de partes de muestreo de la media
agua.
Todos los equipo Grupos de 11 Estatura media Distribución de
profesionales de jugadores muestreo de la media
Fut-Bol
Partes producidas 50 partes Proporción defectuosa Distribución de
por un proceso de muestreo de la
fabricación proporción

1.5 De Medias.
8
Estadística II
La distribución muestral de la media muestral es la distribución de los valores de las medias
muestrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población

Distribución muestral de la media muestral. Si sacamos muestras aleatorias de tamaño n de una


población con media μ y desviación estándar σ, entonces la distribución muestral de la media muestral
tiene las siguientes propiedades:

1. El promedio de todos los valores posibles de medias muestrales es igual al parámetro μ. En otras
palabras, la media muestral X es un estimador insesgado de μ.
μ x =μ

2.- Error estándar de la media muestral: Es la desviación estándar de las posibles medias muestrales.

El error estándar disminuye si el tamaño de la muestra aumenta.

3. Si la población original tiene distribución Normal, entonces para cualquier tamaño muestral n la
distribución de la media muestral es también Normal.

4. Si la población de origen no es Normal, pero n es “suficientemente” grande la distribución de la


media muestral es aproximadamente Normal:

- Un tamaño de 30 es considerado suficiente.


- El resultado en (4) se conoce como el Teorema del Límite Central.

Ejemplo:
Media muestral Xi      P (cada. Xi )
150 1/6 Población
200 1/6
Con N
250 2/6
300 1/6
elementos
350 1/6 X media 1 X media K
1.0 Desv.est.1 Desv.est.K

Tomando K=6 muestras de Tamaño n cada una.

Media de las medias muestrales o Gran Media o Media de Medias

X   Xi X   Xi
K K
150  200  250  250  300 150350 200  250  250  300  350
X 
Varianza X  de lasmedias
de la distribución muestral 250 muestrales  250
6 2 6
 X2 
 ( X  X )   ( X  ) 2

K K
Del ejemplo anterior:
(150  250) 2  (200  250) 2  ...  (350  250) 2
 X2   4.167
6

Error estándar de la distribución muestral de las medias muestrales  X 
n
9
Estadística II
En el caso anterior vale 64.55

Si el muestreo se realiza sin reemplazo y si el tamaño de muestra es más del 5% de la población


(n>0.05N) debe aplicarse el factor de corrección para poblaciones finitas (FPC) al error estándar.

 N n
X 
n N 1

Las distribuciones muestrales adoptan diferentes formas según las estadísticas investigadas y las
características de la población estudiada.

Ejemplos:
Suponga que X = peso de carga de camionetas en kilos, tiene distribución normal con media = 300 k y
varianza = 25. Se toma una muestra aleatoria de 40 camionetas cargadas y se calcula la media
muestral. Haga un esquema de las distribuciones de la variable aleatoria X y de la media muestral.

Suponga que X = la edad de las madres en los nacimientos en León, Gto. el año 2005, tiene
distribución normal con media = 26,5 años y desviación estándar 6,3 años.
a) Describa la distribución de la edad de la madre.
b) ¿Cuál es la probabilidad de que una madre elegida al azar tenga más de 30 años?
c) Suponga que tomamos una muestra aleatoria de n=25 madres ¿cuál es la probabilidad de que la
media muestral sea mayor a 30?
d) ¿porqué las respuestas en (b) y (c) son distintas?

Una empresa de contestación de llamadas telefónicas, está interesada en conocer la probabilidad de


que la media de n llamadas dure un cierto periodo de tiempo, no le interesa una llamada individual, ya
que no le permitiría determinar la cantidad de personas que requiere:

Las llamadas durante un mes promediaron 150 seg. Con una desviación estándar de 15 seg.
a. ¿Cuál es la probabilidad de que una llamada en particular dure entre 150 y 155 segundos?

;
Por tanto la probabilidad de que una llamada dure entre 150 y 155 segundos es del 12.93%.

b. ¿Cuál es la probabilidad de que la media de n=50 llamadas esté entre 150 y 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:

10
Estadística II

Para el caso de las medias el área es mayor debido a que las medias muestrales están menos
dispersas que los valores individuales de llamadas.

c. ¿Cuál es la probabilidad de que la media de n=35 llamadas esté entre 145 y 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:

d. ¿Cuál es la probabilidad de que la media de n=35 llamadas sea mayor a 155 segundos?
Ahora se aplica la distribución muestral de las medias, con:

Distribución Muestral de Diferencia de Medias


Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar

1, y la segunda con media 2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de

tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n 2 de la segunda


población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias

o la distribución muestral del estadístico

11
Estadística II
La distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales,
entonces la distribución muestral de medias es normal sin importar los tamaños de las muestras.

En ejercicios anteriores se había demostrado que y que , por lo que no es difícil

deducir que y que .

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de medias es:

1.6 Teorema del Límite Central

Si una población tiene media μ y desviación típica σ, y tomamos muestras de tamaño n (n>30, ó
cualquier tamaño si la población es "normal"), las medias de estas muestras siguen
aproximadamente la distribución:

Consecuencias:
1. Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto
intervalo.
2. Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en
un cierto intervalo.

3. Inferir la media de la población a partir de una muestra.

Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se
empaquetaron en cajas de 100 unidades.

1. Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que
495 g.

2. Calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg.

La distribución de las medias de las muestras tiende a la normalidad independientemente de la forma


de la distribución poblacional de la que sean obtenidas.

12
Estadística II
F(X)
Distribución de las medias muestrales
Distribución de valores individuales

Distribución muestral de la media

X 1 , X 2 ,..., X n
A medida que n se vuelve más grande, la distribución de las medias muestrales se aproximará a una
distribución normal con una media X=μ y σx = σ / X      X   / n

Si X1, X2,….Xn es una muestra aleatoria de una Población (X) con distribución normal n(  ,  )
2

Entonces X se distribuye normalmente con media  , y varianza  / n


2

Por ejemplo, para los siguientes datos de la población:

Datos de la población para mostrar el teorema del límite central


PROMEDIO
2 7 5 5 2 4.2
1 7 7 9 4 5.6
5 8 1 1 5 4.0
7 1 4 1 4 3.4
7 6 9 8 5 7.0
1 6 4 7 9 5.4
7 3 1 7 3 4.2
6 7 9 4 3 5.8
9 7 7 6 1 6.0
8 3 4 4 7 5.2
5 3 3 4 2 3.4
5 9 9 1 9 6.6
5 5 3 9 5 5.4
3 1 9 1 5 3.8
4 3 9 5 5 5.2
9 1 7 7 8 6.4
2 1 7 8 6 4.8
7 7 9 8 3 6.8
3 4 5 6 8 5.2
4 8 3 4 5 4.8
5 3 2 2 6 3.6
8 1 5 5 9 5.6
7 5 9 6 8 7.0
2 2 7 2 1 2.8
3 1 4 1 7 3.2
9 3 2 3 8 5.0
13
Estadística II
6 2 7 4 4 4.6
5 2 6 8 6 5.4
9 6 2 9 4 6.0
2 6 3 5 5 4.2
9 2 2 3 6 4.4
2 6 6 8 3 5.0
5 4 2 1 9 4.2
4 2 9 4 2 4.2
8 1 2 1 4 3.2
3 2 8 5 4 4.4
5 8 9 6 2 6.0
7 9 3 8 5 6.4
5 6 8 7 5 6.2
9 6 4 8 7 6.8
7 9 9 8 3 7.2
5 5 1 4 6 4.2
8 4 7 8 7 6.8
8 7 7 1 8 6.2
5 5 1 7 5 4.6
7 7 2 9 8 6.6
9 5 2 5 9 6.0
2 5 3 5 8 4.6
4 5 8 4 2 4.6
9 2 6 6 1 4.8
1 7 7 3 4 4.4
7 7 2 8 7 6.2
8 1 1 7 6 4.6
2 2 1 4 9 3.6
9 4 3 7 3 5.2
7 8 4 3 2 4.8
1 2 9 3 8 4.6
2 4 6 2 8 4.4
2 9 3 3 1 3.6
2 6 7 8 7 6.0

El histograma de los datos de la población, es el siguiente:

Histogram of Poblacion

40

30
Frequency

20

10

0
2 4 6 8
Poblacion

El histograma de los promedios muestrales (subgrupos de 5 datos) se muestra a continuación :

14
Estadística II

1.7 De Proporciones.

La distribución muestral de la proporción muestral es la distribución de los valores de las


proporciones muestrales de todas las posibles muestras del mismo tamaño n tomadas de la misma
población.

Proporción promedio E ( p)  p 
p i
Desviación estándar de la Proporción
K
 (1   )
p 
n

Suponga que estamos interesados en conocer la proporción de mujeres en Guanajuato. Nuestro


parámetro de interés es:

P = Número de mujeres en Guanajuato


15
Estadística II
Número de habitantes en Guanajuato

La población es demasiado grande. Hacer un censo sería demasiado caro. Decidimos estimar el
verdadero parámetro a partir de una muestra.

La proporción muestral sería:


P = Número de mujeres en la Muestra
Tamaño de la Muestra

Distribución Muestral de Diferencia de Proporciones


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando
proporciones o porcentajes. A continuación se citan algunos ejemplos:
 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de
los que aprueban inglés?
 Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de
ese tipo?
 Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones
gerenciales.
 Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la
máquina A a los que genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para
tamaños de muestra grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2 tienen distribuciones
muestrales aproximadamente normales, así que su diferencia p 1-p2 también tiene una distribución
muestral aproximadamente normal.

Cuando se estudió a la distribución muestral de proporciones se comprobó que y que , por

lo que no es difícil deducir que y que .


La fórmula que se utilizará para el calculo de probabilidad del estadístico de diferencia de proporciones
es:

1.8 Estimación de Parámetros.

16
Estadística II
Es el procedimiento utilizado para conocer las características de un parámetro poblacional, a partir del
conocimiento de la muestra.

Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor de un
parámetro de la población; pero también necesitamos precisar un:

Intervalo de confianza
Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza
específico.

Nivel de confianza
Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.

Error de estimación admisible


Que estará relacionado con el radio del intervalo de confianza.

Limites de Confianza.
Son los límites del intervalo de confianza (Inferior LIC y Superior LSC), se determinan sumando y
restando a la media de la muestra X un cierto número Z (dependiendo del nivel o coeficiente de
confianza) de errores estándar de la media σ X .

Grado de Confianza.
Se refiere a la probabilidad de que, al aplicar repetidamente el procedimiento, el intervalo contenga el
parámetro, es decir, expresa la proporción de intervalo que efectivamente incluyen el parámetro.

Nivel de Significación.
Es una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

1.9 Concepto de Estimador y sus Propiedades.


Un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro
desconocido de la población. La media de la muestra (X) puede ser un estimador de la media de la
población μ, y la proporción de la muestra se puede utilizar como un estimador de la proporción de la
población.

Una estimación es un valor específico observado de un estadístico (estimador). Podemos hacer dos
tipos de estimaciones concernientes a una población: una Estimación de Intervalo y una Estimación
Puntual.

Propiedades:
• Insesgadez: Si el valor del estadístico muestral es igual al parámetro poblacional que se estudia, se
dice que el estudio muestral es una estimador insesgado del parámetro poblacional.

• Eficiencia: Se dice que el estimador con menor error estándar tiene mayor eficiencia relativa que los
otros.
Cuando se muestrean poblaciones normales, el error estándar de la media muestral es menor que el
error estándar de la mediana muestral.

17
Estadística II
• Consistencia: Un estimador es consistente si el valor del estimador tiende a estar más cerca del
parámetro poblacional a medida que el tamaño de la muestra aumenta. En otras palabras, una
muestra grande tiende a proporcionar mejor estimación puntual que una pequeña.

1.10 Estimación Puntual y por Intervalos.

Estimación puntual. Es un solo valor o número que se utiliza para estimar un parámetro de población
desconocido. A menudo una estimación puntual es insuficiente debido a que solo se tienen dos
opciones: es correcta o está equivocada. Se estaría haciendo una estimación puntual si por ejemplo,
un jefe de departamento de una Universidad afirmara “Nuestros datos actuales indican que la materia
de matemáticas tendremos 350 alumnos el siguiente semestre”.

Sólo utiliza la información de una muestra para llegar a un sólo número o punto que estima el
parámetro de interés. La estimación real se hace a través de un estimador (regla que expresa cómo
calcular la estimación basándose en la información de la muestra y se anuncia generalmente mediante
una fórmula; puede ser la media, mediana o desviación estándar). Por ejemplo, un biólogo desea
determinar el número promedio de huevos puestos en una estación y en cada nido por pájaros Febe.
Se sabe que el promedio de huevos para la muestra de 50 nidos es de 4.62; en tal caso la media
muestral es el estimador y el valor de 4.62 es de una estimación puntual.

Estimación por intervalo. Utiliza los datos de una muestra para determinar los valores extremos o los
puntos que puedan abarcar el valor real del parámetro estimado. Retomando el ejemplo de los huevos
de la ave Febe, el intervalo (4.57 – 4.67) sería una estimación por intervalo del verdadero número
promedio de huevos en cada nido. Cuando se trata de intervalos, la estimación presenta las siguientes
modalidades de acuerdo con el parámetro que se desea conocer.

1.11 Estimación de Medias y de Proporciones.

Sea α la probabilidad de tener error en la estimación del parámetro, entonces 1- α es un valor que
indica que el intervalo contiene el parámetro en cuestión; si este valor se localiza en el área bajo la
curva normal estándar (acumulada), los límites de 1- α son - Z α /2 y + Z α /2 . Como la distribución
muestral de x se puede aproximar mediante la distribución normal de media μ y error típico
e(x) = entonces el intervalo que contiene la verdadera media de la población será:

La expresión 1 - α se conoce como nivel de confianza de encontrar el parámetro, que se encuentra


entre los dos valores críticos y bajo la curva normal; es el intervalo de confiabilidad para localizar algún
evento.

Esta estimación se representa en la gráfica siguiente:

18
Estadística II

Estimación de la proporción de la población

Sea p la proporción muestral, donde x es el número de éxitos y n el tamaño de la muestra. Como


p= (1-p)
n es la desviación típica estimada de la proporción muestral, entonces la expresión que nos
otorga un intervalo de confianza para P, la verdadera proporción de la población, es:

19

Вам также может понравиться