Вы находитесь на странице: 1из 48

Instituto Tecnológico de Campeche

Ing. En Gestión Empresarial

Tarea 1. Investigación conceptual


UNIDAD 4. DISTRIBUCIONES MUESTRALES

Alumna: Nayroby del Carmen Caamal Kú


Probabilidad y Estadística Descriptiva
MG3

San Francisco de Campeche a 28 de Noviembre del 2017


ÍNDICE
COMPETENCIA ESPECÍFICA A DESARROLLAR................................................................... 4
INTRODUCCIÓN .............................................................................................................................. 5
- TEMAS DE INVESTIGACIÓN CONCEPTUAL - ...................................................................... 6
 Conceptos básicos de estadística (población, muestra, estadístico, parámetro) 6
 Los 2 problemas que atiende la Inferencia estadística ................................................ 6
Estimación de parámetros ........................................................................................................... 6
 Razones del muestreo ........................................................................................................ 10
 El muestreo aleatorio .......................................................................................................... 10
 Métodos de muestreo.......................................................................................................... 11
 Objetivo del muestreo ......................................................................................................... 11
 ¿Se puede esperar que al analizar una población un Estadístico sea igual al
Parámetro correspondiente? .................................................................................................... 11
 Teorema del Límite Central................................................................................................ 12
 Distribución de muestreo ................................................................................................... 14
 Distribución muestral para una media “σ2” conocida. .............................................. 17
 Características ...................................................................................................................... 17
 El estadístico de prueba ..................................................................................................... 17
 ¿Cómo se usa la tabla de esta distribución? ............................................................... 17
 Distribución muestral para una media, σ2 desconocida, la distribución “t” de
Student ............................................................................................................................................ 20
 Características ...................................................................................................................... 20
 El estadístico de prueba ..................................................................................................... 20
 ¿Cómo se usa la tabla de esta distribución? ............................................................... 20
 Distribución muestral para una proporción .................................................................. 24
 Aproximación d/la dist. normal a la binomial ............................................................... 24
 Características ...................................................................................................................... 24
 El estadístico de prueba ..................................................................................................... 24
 ¿Cómo se usa la tabla de esta distribución? ............................................................... 24
 Distribuciones muestrales para 2 poblaciones ............................................................ 26

- Propiedad reproductiva de la distribución normal ..................................................... 26


 Distribución muestral para 2 medias σ21 y σ22 conocidas ........................................ 27

- El estadístico de prueba ..................................................................................................... 27

2
 Distribución muestral para 2 medias con σ21 y σ22 desconocidas ......................... 28

- El estadístico de prueba ..................................................................................................... 28


 Distribución muestral para 2 proporciones .................................................................. 31

- El estadístico de prueba ..................................................................................................... 31


 Tipos de estimaciones y sus características................................................................ 36
Tipos de estimadores: ............................................................................................................... 36
 Intervalos de confianza para la media ............................................................................ 36
a. σ2 conocida ............................................................................................................................ 36
b. σ2 desconocida ..................................................................................................................... 36
 Intervalos de confianza para la proporción................................................................... 39
 Determinación del tamaño de muestra para llevar a cabo un análisis estadístico
40
c. Para una media ......................................................................................................................... 40
d. Para una proporción ............................................................................................................... 40

3
COMPETENCIA ESPECÍFICA A DESARROLLAR

Aplica el conocimiento básico de distribuciones y planes de


muestreo para la resolución de problemas con enfoque económico-
administrativo.

4
INTRODUCCIÓN

En este presente trabajo hablaremos de otros aspectos muy importantes para la


estadística como son las muestras. Generalmente las poblaciones son demasiado
grandes como para ser estudiadas en su totalidad. Es necesario seleccionar una
muestra representativa de un tamaño más manejable. Esta muestra se utiliza
luego para sacar conclusiones sobre la población. El estadístico se utiliza como
estimador del parámetro. Al confiar en una muestra para sacar alguna conclusión
p inferencia sobre la población, se está en la estadística inferencial.

Desde el punto de vista práctico, suele ser más importante poder inferir información
acerca de una población a partir de muestras obtenidas de ella. De estos problemas
se ocupa la inferencia estadística en la que se usan los principios de la teoría del
muestreo.
Un problema importante de la inferencia estadística es la estimación de parámetros
poblacionales, o simplemente parámetros (como, por ejemplo, la media y la varianza
poblacionales), a partir de los correspondientes estadísticos muestrales, o
simplemente estadísticos (por ejemplo, la media y la varianza muestral.

5
- TEMAS DE INVESTIGACIÓN CONCEPTUAL -

 Conceptos básicos de estadística (población, muestra, estadístico,


parámetro)
La población puede definirse como un conjunto de medidas, o el recuento
de todas las unidades que presentan una característica común. Se podría
definir como un conjunto de mediciones, finito o infinito, real o conceptual.
Una muestra es un subconjunto de observaciones seleccionadas de una
población. La muestra para que sea representativa de la población, requiere
que todas las unidades de la población tengan la misma probabilidad de ser
seleccionadas, es decir, debe ser aleatoria, al azar o probabilística.
Cualquier función de las variables aleatorias que forman una muestra
aleatoria se llama estadístico.
Parámetro (poblacional) son las medidas descriptivas numéricas aplicadas
a las características en las unidades de la población. También se les
denomina como valores estadísticos de la población. A las características
numéricas de una población, como la media y la desviación estándar, se les
llama parámetros.

 Los 2 problemas que atiende la Inferencia estadística


Estimación de parámetros
En general, de las variables experimentales u observacionales no
conocemos la fpd. Podemos conocer la familia (normal, binomial,...) pero no
los parámetros. Para calcularlos necesitaríamos tener todos los posibles
valores de la variable, lo que no suele ser posible.
La inferencia estadística trata de cómo obtener información (inferir) sobre
los parámetros a partir de subconjuntos de valores (muestras) de la
variable.
Estadístico: variable aleatoria que sólo depende de la muestra aleatoria
elegida para calcularla.
Estimación: Proceso por el que se trata de averiguar un parámetro de la
población representado, en general, por q a partir del valor de un estadístico
llamado estimador y representado por
El problema se resuelve en base al conocimiento de la "distribución
muestral" del estadístico que se use.
¿Qué es esto? Concretemos, p.e. en la media (m). Si para cada muestra
posible calculamos la media muestral ( ) obtenemos un valor distinto (
es un estadístico: es una variable aleatoria y sólo depende de la
muestra), habrá por tanto una fpd para , llamada distribución muestral de
medias. La desviación típica de esta distribución se denomina error típico
de la media. Evidentemente, habrá una distribución muestral para cada
estadístico, no sólo para la media, y en consecuencia un error típico para
cada estadístico.
Si la distribución muestral de un estadístico estuviera relacionada con algún

6
parámetro de interés, ese estadístico podría ser un estimador del
parámetro.
Contrastes de hipótesis
Una hipótesis estadística es una asunción relativa a una o varias
poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se
pueden contrastar con la información extraída de las muestras y tanto si se
aceptan como si se rechazan se puede cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y
se representa por H0. Rechazar H0 implica aceptar una hipótesis
alternativa (H1).
La situación se puede esquematizar:
H0 cierta H0 falsa
H1 cierta
H0 rechazada Error tipo I Decisión
(a ) correcta (*)
H0 no Decisión Error tipo II
rechazada correcta (b )
(*) Decisión correcta que se busca
= p(rechazar H0|H0 cierta)
b = p(aceptar H0|H0 falsa)
Potencia =1-b = p(rechazar H0|H0 falsa)
Detalles a tener en cuenta
1 a y b están inversamente relacionadas.
2 Sólo pueden disminuirse las dos, aumentando n.
Los pasos necesarios para realizar un contraste relativo a un
parámetro q son:
1. Establecer la hipótesis nula en términos de igualdad

2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras,


dependiendo del interés del investigador

en el primer caso se habla de contraste bilateral o de dos colas, y en los


otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.
3. Elegir un nivel de significación: nivel crítico para a
4. Elegir un estadístico de contraste: estadístico cuya distribución muestral
se conozca en H0 y que esté relacionado con q y establecer, en base a
dicha distribución, la región crítica: región en la que el estadístico tiene una
probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el
estadístico cayera en la misma, se rechazaría H0.
Obsérvese que, de esta manera, se está más seguro cuando se rechaza
una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere
rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente
no se ha podido rechazar. Por otro lado, la decisión se toma en base a la
distribución muestral en H0, por eso es necesario que tenga la igualdad.

7
5. Calcular el estadístico para una muestra aleatoria y compararlo con la
región crítica, o equivalentemente, calcular el "valor p" del estadístico
(probabilidad de obtener ese valor, u otro más alejado de la H0, si H0 fuera
cierta) y compararlo con a.
Ejemplo:
Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra
hipótesis es que la presión sistólica media en varones jóvenes estresados
es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y
encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que


queremos rechazar) es:

2. la hipótesis alternativa

es un contraste lateral derecho.


3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).
4. El estadístico para el contraste es

y la región crítica T>ta


Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t1-a
y si hubiera sido bilateral T<t1- a/2 o T>t a/2
En este ejemplo t(35)0,05=1,69.
5. Calculamos el valor de t en la muestra

no está en la región crítica (no es mayor que 1,69), por tanto no


rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes
estadísticos) es buscar en las tablas el "valor p" que corresponde a
T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera
cierta, la probabilidad de encontrar un valor de T como el que hemos
encontrado o mayor (¿por qué mayor? Porque la H1 es que es mayor, lo
que produciría una media muestral mayor y por tanto mayor valor de t) es
0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos
H0 es 0,20, como la frontera se establece en 0,05 no la rechazamos.
Este valor crítico de 0,05 es arbitrario pero es la convención habitual.
¿Cuán razonable es?

8
Problema al respecto: en la hipótesis de que un mazo de cartas esté bien
barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de
oros y 2 el rey de bastos es 1/40 x 1/39=0,000833.
Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la
hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la
lógica del contraste de hipótesis?
Volvamos al problema del estrés. Como no se rechaza H0, se puede
cometer un error tipo II. ¿Cuál es b?. De hecho, sería la información
relevante a comunicar en este estudio (la probabilidad del error que se pude
cometer en él). Habitualmente, sin embargo, no se da porque los paquetes
estadísticos no la calculan.
Para calcularla se debe concretar H1, p.e. m = 20 (el criterio para este
valor no es estadístico)

b =p(aceptar H0|H1 cierta)


Supongamos que el tamaño muestral sea suficientemente grande para
poder aproximar t a z.
¿Cuándo se acepta H0? si z 1,69

es decir, se acepta H0 si
¿Qué probabilidad hay de encontrar si m = 20 (zona verde del
gráfico)? En esta hipótesis lo que se distribuye como una z es

9
 Razones del muestreo
Las razones por las cuales se utiliza el muestreo y no toda la población
(censo) son varias; los grandes progresos hechos en la teoría del muestreo
durante las últimas décadas, hacen posible medir las propiedades de
cantidades masivas de datos con precisión calculada sobre la base dé
muestras.
Además del hecho de que pueden obtenerse resultados fidedignos de
procedimientos de muestreo correctos, hay otras importantes razones para
su amplia adopción. Primero, las poblaciones que se investigan pueden ser
infinitas, y en tales casos la muestra es el único procedimiento posible.
Segundo, aún en el caso de poblaciones finitas, muy frecuentemente el
muestreo es el único procedimiento práctico, pues, una población finita
puede constar de millares o millones de elementos y su enumeración
completa es prácticamente imposible.
En tercer lugar, la medición de las propiedades de una población a veces
requiere de la destrucción de sus elementos; por ejemplo si el productor
desea averiguar si la resistencia a la tracción de un lote de alambres de
acero cumple con las normas especificadas, se ejerce presión sobre el
alambre hasta que se rompe. Un censo significaría entonces la destrucción
completa de todos los alambres de acero, y no quedarían productos
después de concluida la prueba.
Por último, aunque financiera, práctica y físicamente sea posible observar
toda la población, el muestreo puede ser aún el procedimiento más
eficiente.
Los resultados obtenidos por el estudio de una muestra pueden ser iguales
o aún más precisos que los hallados de una cuenta completa del conjunto.
Como se explicará en seguida, cualquier encuesta estadística muestreo o
censo, siempre contiene cierto error. Los errores estadísticos son de dos
clases: no de muestreo y de muestreo. El error no de muestreo es
generalmente grande para un censo, pero puede ser reducido mucho con el
muestreo bien realizado. Además el error no de muestreo a menudo no
puede ser estimado objetivamente, mientras que esto generalmente es
posible en el error de muestreo. Por estas razones, no solo puede
esperarse que el error total sea menor en un estudio de muestra, sino que
los resultados de ella también pueden ser usados con un mayor grado de
confianza por nuestro conocimiento del tamaño probable del error.

 El muestreo aleatorio
Muestreo aleatorio:

En el cual todos los elementos de la población tienen la oportunidad de ser


escogidos para la muestra. Este procedimiento da a cada elemento de la
población una probabilidad de ser seleccionado. Dentro de este tipo se
encuentran:

a) muestreo aleatorio simple:

10
Permite que cada muestra posible pueda ser elegida con la misma
probabilidad. Por su parte cada elemento de la población tiene la misma
oportunidad igual de ser incluido en la muestra.

b) muestreo sistemático:

En el cual los elementos que se muestrearan se seleccionan de la


población en un intervalo uniforme que se mide con respecto al tiempo, al
orden o al espacio.

c) Muestreo estratificado:

Método en el que la población se divide en grupos homogéneos, o estratos.


Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es
grande.

Muestreo por conglomerado:

Método en el que la población se divide en grupos o racimos de elementos,


y luego se selecciona una muestra aleatoria de estos racimos. Aquí la
variabilidad dentro de cada grupo es grande y entre los grupos es pequeño.

 Métodos de muestreo
La muestra para que sea representativa de la población, requiere que todas
las unidades de la población tengan la misma probabilidad de ser
seleccionadas, es decir, debe ser aleatoria, al azar o probabilística.
El muestreo aleatorio, realizado bajo ciertas condiciones y sometido a
cumplir ciertos requisitos, se constituye en un procedimiento práctico,
económico y rápido para generalizar conclusiones obtenidas a través de
una muestra, aplicables a toda la población de la que forma parte, dentro de
ciertos límites de confiabilidad, establecidos de antemano.

 Objetivo del muestreo


El objetivo principal de muestreo es considerar el mayor número de
unidades con el menor costo posible.

 ¿Se puede esperar que al analizar una población un Estadístico sea


igual al Parámetro correspondiente?
La exactitud de toda estimación es de enorme importancia. Esta exactitud
depende en gran parte de la forma como tomó la muestra, y del cuidado
que se tenga para garantizar que la muestra proporcione una imagen
confiable de la población. Sin embargo, con mucha frecuencia se
comprueba que la muestra no es del todo representativa de la población y

11
resultara un error de muestreo. El error de muestreo es la diferencia entre el
estadístico de la muestra utilizada para calcular el parámetro de la
población y el valor real pero desconocido del parámetro.

 Teorema del Límite Central


Teorema del límite central: Al hacerse lo bastante grande el tamaño de
muestra (número de observaciones en cada muestra), la distribución de
muestreo de la media puede aproximarse mediante la distribución normal.
Esto es cierto no importando la forma de la distribución de los valores
individuales de la población.
¿Qué tamaño de la muestra es bastante grande? Una gran parte de la
investigación estadística se ha hecho sobre este tema. Como una regla
general, los estadísticos han encontrado que en la mayoría de las
distribuciones de población, un tamaño de muestra adecuado es de por lo
menos 30, la distribución de muestreo de la media deberá ser
aproximadamente normal. Sin embargo, podremos ser capaces de aplicar
el teorema del límite central para tamaños de muestra incluso menores si se
dispone de algún conocimiento de la población (por ejemplo, si la
distribución es simétrica).
Teorema del límite central
Cuando se seleccionan muestras aleatorias simples de tamaño n de una
población, la distribución muestral de la media muestral Ẋ puede
aproximarse mediante una distribución normal a medida que el tamaño de
la muestra se hace grande.
En la figura 7.3 se muestra cómo funciona el teorema del límite central en
tres poblaciones diferentes; cada columna se refiere a una de las
poblaciones. En el primer renglón de la figura se muestra que ninguna de
las tres poblaciones está distribuida normalmente. La población I tiene una
distribución uniforme. A la población II se le conoce como distribución en
forma de orejas de conejo. Esta distribución es simétrica, pero los valores
más probables se encuentran en las colas de la distribución. La forma de la
población III se parece a una distribución exponencial; es sesgada a la
derecha.
En los tres renglones siguientes de la figura 7.3 se muestran las formas de
las distribuciones muestrales para tamaños de muestras n = 2, n = 5 y n =
30. Cuando el tamaño de la muestra es 2, se observa que cada distribución
muestral tiene una forma diferente a la distribución poblacional
correspondiente. Con muestras de tamaño 5, se observa que las formas de
las distribuciones muestrales en los casos de las poblaciones I y II
empiezan a parecerse a la forma de una distribución normal. En el caso de
la población III, aun cuando la forma de la distribución muestral empieza a
ser parecida a una distribución normal, todavía se observa cierto sesgo a la
derecha

12
13
 Distribución de muestreo
Muchas decisiones se toman con base en los resultados muestrales. Por
ejemplo, un gerente administrativo puede tomar una muestra de un producto
para determinar si cumple con ciertas especificaciones de producción. Una
aplicación muy común y de gran utilidad en una distribución muestral es la de
determinar la probabilidad de que una media muestral clasifique dentro de un
rango dado. En este caso se usa la fórmula de conversión pero alterándola para
ser usada en una muestra completa y no solo en una observación única.

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la
media muestral, calculado a partir de las medias en una muestra aleatoria, cambie
su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos
los valores posibles de un estadístico. Tales distribuciones serán muy importantes
en el estudio de la estadística inferencial, porque las inferencias sobre las
poblaciones se harán usando estadísticas muestrales. Como el análisis de las
distribuciones asociadas con los estadísticos muestrales, podremos juzgar la
confiabilidad de un estadístico muestral como un instrumento para hacer
inferencias sobre un parámetro poblacional desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a
otra, se le puede considerar como una variable aleatoria con su correspondiente
distribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución
muestral. En general, la distribución muestral de un estadístico es la de todos
sus valores posibles calculados a partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una
población grande. Se calcula la madia muestral x para cada muestra; la colección
de todas estas medias muestrales recibe el nombre de distribución muestral de
medias, lo que se puede ilustrar en la siguiente figura:

14
Suponga que se eligen muestras aleatorias de tamaño 20, de una población
grande, y se calcula la deviación estándar de cada una. La colección de todas
estas desviaciones estándar muestrales se llama distribución muestral de la
desviación estándar, y lo podemos ver en la siguiente figura:

Ejemplo 1.6
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de
valores 0, 2, 4 y 6. Encuentre:
, la media poblacional.
, la desviación estándar poblacional.
x, la media de la distribución muestral de medias.

x, la desviación estándar de la distribución muestral de medias.


Además, grafique las frecuencias para la población y para la distribución muestral
de medias.
Solución:
a. La media poblacional es:

15
b. La desviación estándar de la población es:

c. A continuación se listan los elementos de la distribución muestral de la


media y la correspondiente distribución de frecuencias.

La media de la distribución muestral de medias es:

d) La desviación estándar de la distribución muestral de medias es:

De aquí que podamos deducir que:


Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene
una media o valor esperado, una varianza y una desviación estándar, se puede

16
demostrar que la distribución muestral de medias tiene una media igual a la media
poblacional. Esto es:

Distribuciones muestrales
Después de haber realizado el ejercicio anterior se puede ver que una distribución
muestral se genera extrayendo todas las posibles muestras del mismo tamaño de
la población y calculándoles a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la distribución
muestral de medias será normal sin importar el tamaño de la muestra.

Si la población de donde se extraen las muestras no es normal, entonces el


tamaño de la muestra debe ser mayor o igual a 30, para que la distribución
muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la
muestra, más cerca estará la distribución muestral de ser normal.
Para muchos propósitos, la aproximación normal se considera buena si se cumple
n=30. La forma de la disitribución muestral de medias sea aproximadamente
normal, aún en casos donde la población original es bimodal, es realmente
notable.

 Distribución muestral para una media “σ2” conocida.


 Características
 El estadístico de prueba
 ¿Cómo se usa la tabla de esta distribución?

17
18
Una de las estadísticas más importantes es la media de un conjunto de variables
aleatorias independientes e idénticamente distribuidas. Sea 𝑋1 , 𝑋2, … 𝑋𝑛 una
muestra aleatoria que consiste de n variables aleatorias IID tales que 𝐸(𝑋𝑖 ) = 𝜇
y 𝑉𝑎𝑟(𝑋𝑖 ) = 𝜎 2 para toda 𝑖 = 1,2, … 𝑛. Entonces la estadística:
𝑋̅ = (𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 )/𝑛
Se define como a media de las n variables aleatorias IID o sencillamente media
muestral. El valor esperado y la varianza de 𝑋̅ son:

Respetivamente, en donde 𝜇 𝑦 𝜎 2 son la media y la varianza de la distribución


de la población partir de la cual de obtuvo la muestra. La desviación estándar
es: 𝑑. 𝑒. (𝑋̅) = 𝜎/√𝑛 la cual recibe el nombre de error estándar de la media.

19
 Distribución muestral para una media, σ2 desconocida, la distribución
“t” de Student
 Características
 El estadístico de prueba
 ¿Cómo se usa la tabla de esta distribución?

20
21
22
23
 Distribución muestral para una proporción
 Aproximación d/la dist. normal a la binomial
 Características
 El estadístico de prueba
 ¿Cómo se usa la tabla de esta distribución?
Al tratar una variable categórica en la que cada individuo o elemento de la
población puede clasificarse como poseedor o no poseedor de una característica
particular como masculino o femenino, a los dos posibles resultados se le
podrían asignar valores de 1 o 0 para representar la presencia o ausencia de la
característica. Al tratar con datos categóricos, la media de muestra 𝑋̅ es la misma

24
proporción de muestra P, que tiene la característica de interés. Así pues, la
proporción de muestra p, puede definirse como:

La proporción de la muestra p, tiene la propiedad especial de que debe estar


entre 0 y 1. Si todos los individuos poseyeran la característica, a cada uno se le
asignaran un resultado de 1 y 𝑃𝑠 sería igual a 1. Si la mitad de los individuos
poseyeran la característica, a la mitad se le asignaran un resultado de 1, a la
otra mitad se le asignaran un resultado de 0 y 𝑃𝑠 sería igual a 0.5. Si ninguno de
los individuos poseyera la característica, a cada uno se le asignaría un resultado
de 0 y 𝑃𝑠 sería igual a 0. Mientras que la media de muestra 𝑋̅ es un estimador de
la media de población 𝜇, la estadística 𝑃𝑠 es un estimador de la proporción de
población p. Por analogía a la distribución de muestreo de la media, el error
estándar de la proporción 𝜎𝑃𝑠 seria:

La distribución de muestreo de la proporción en realidad seguiría la distribución


binomial. Sin embargo la distribución normal puede usarse para aproximar la
distribución binomial cuando np y n (1-p) son cada uno al menos 5. En la mayoría
de los casos en los que se hacen inferencias respecto a la proporción, el tamaño
de la muestra es lo bastante sustancial para cubrir las condiciones para usar la
aproximación normal para evaluar la distribución de muestreo de la proporción.
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En
estos casos la variable aleatoria toma SOLAMENTE dos valores diferentes
(éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión
de la población es grande la distribución binomial B(n,p) se aproxima a la
normal .
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue
una distribución normal

donde p es la proporción de uno de los valores QUE PRESENTA la variable


estadística en la población y q=1-p.
EJEMPLO: Si tiramos una moneda no trucada 100 veces, ¿cuál es la
probabilidad de que obtengamos más de 55 CARAS?
En una moneda no trucada la proporción de caras es 0,5, con lo que
p=0,5 q=0,5 n=100
La distribución muestral de proporciones se distribuye N (0,5;0,05)
Si llamamos p' a la proporción en la muestra hemos de calcular la probabilidad
P(p'>0,55) = P(z>1) =
=1-P(z£1) = 1-0,8413 = 0,1587

25
Utiliza la TABLA N(0,1) para comprobar la probabilidad correspondiente al valor
z

 Distribuciones muestrales para 2 poblaciones


- Propiedad reproductiva de la distribución normal

26
 Distribución muestral para 2 medias σ21 y σ22 conocidas
- El estadístico de prueba

27
Un estadístico de prueba es una variable aleatoria que se calcula a partir de datos
de muestra y se utiliza en una prueba de hipótesis. Puede utilizar los estadísticos
de prueba para determinar si puede rechazar la hipótesis nula. El estadístico de
prueba compara sus datos con lo que se espera bajo la hipótesis nula. El
estadístico de prueba se utiliza para calcular el valor p.
Un estadístico de prueba mide el grado de concordancia entre una muestra de
datos y la hipótesis nula. Su valor observado cambia aleatoriamente de una
muestra aleatoria a una muestra diferente. Un estadístico de prueba contiene
información acerca de los datos que es relevante para decidir si se puede
rechazar la hipótesis nula. La distribución del muestreo del estadístico de prueba
bajo la hipótesis nula se denomina distribución nula. Cuando los datos muestran
evidencia clara en contra de los supuestos de la hipótesis nula, la magnitud del
estadístico de prueba se vuelve demasiado grande o demasiado pequeña
dependiendo de la hipótesis alternativa. Esto hace que el valor p de la prueba se
vuelva lo suficientemente pequeño como para rechazar la hipótesis nula.
Por ejemplo, el estadístico de prueba para una prueba Z es el estadístico Z, que
sigue la distribución normal estándar bajo la hipótesis nula. Supongamos que
usted realiza una prueba Z de dos colas con un nivel de significancia (α) de 0.05 y
un obtiene un estadístico Z (también denominado valor Z) de 2.5 basado en sus
datos. Este valor Z corresponde a un valor p de 0.0124. Puesto que este valor p es
menor que α, usted declara significancia estadística y rechaza la hipótesis nula.
Las diferentes pruebas de hipótesis utilizan diferentes estadísticos de prueba
según el modelo de probabilidad asumido en la hipótesis nula. Las pruebas
comunes y sus respectivos estadísticos de prueba incluyen:
Prueba de hipótesis Estadístico de prueba
Prueba Z Estadístico Z
Pruebas t Estadístico t
ANOVA Estadístico F
Pruebas de chi-cuadrada Estadístico de chi-cuadrada

 Distribución muestral para 2 medias con σ21 y σ22 desconocidas


- El estadístico de prueba

28
29
30
 Distribución muestral para 2 proporciones
- El estadístico de prueba
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones o porcentajes. A continuación se citan algunos
ejemplos:
 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban
matemáticas que las de los que aprueban inglés?
 Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que
presentan una reacción adversa que el de los usuarios del fármaco B que
también presentan una reacción de ese tipo?

31
 Administración.- ¿Hay diferencia entre los porcentajes de hombres y
mujeres en posiciones gerenciales.
 Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos
que genera la máquina A a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos
proporciones muestrales, la distribución muestral de diferencia de proporciones es
aproximadamente normal para tamaños de muestra grande (n1p1 5, n1q1 5,n2p2
5 y n2q2 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente
normales, así que su diferencia p1-p2también tiene una distribución muestral
aproximadamente normal.

Cuando se estudió a la distribución muestral de proporciones se comprobó

que y que , por lo que no es difícil deducir

que y que .
La fórmula que se utilizará para el calculo de probabilidad del estadístico de
diferencia de proporciones es:

Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor
de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si
se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
Datos:
PH = 0.12

32
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la


pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Ejemplo:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo
durante por lo menos dos años. Supóngase que tuviera que seleccionar otra
muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos
entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de
trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje
obtenido en la encuesta de Boston College, en 5% o más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los
porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución
muestral de proporciones con P1= P2, ya que es una misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la
proporción de trabajadores despedidos entre 1979 y 1984 que estuvieron
desempleados por un período de por lo menos dos años, sólo se conoce la
p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa
proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de
probabilidad se necesita saber las proporciones de las poblaciones, las cuales en
este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una
estimación puntual de P. En el siguiente tema se abordará el tema de estimación
estadística y se comprenderá el porque estamos utilizando de esa manera el dato.

33
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál
sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo
durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de
Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir
una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que
se tendrán que calcular dos áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P 2

La probabilidad de que su proporcion muestral de trabajadores sin empleo durante


por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston
College, en 0.05 o más es de 0.1260.

Ejemplo:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y
que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman
muestras de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 2 rebase a la máquina 1 en por lo menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 1 rebase a la máquina 2 en por lo menos 0.15?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
34
n2 = 120 objetos
a. p(p2-p1 0.10) = ?

Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artículos


defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.
b. p(p1-p2
0.15)=?

La probabilidad de que exista una diferencia de proporciones de artículos


defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.

35
 Tipos de estimaciones y sus características
Tipos de estimadores:

 Estimadores insesgados.- Se dice que la estadística 𝑇 =


𝜇(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) es un estimador insesgado del parámetro θ, si E (T) = θ
para todos los posibles valores de θ. De esta forma, para cualquier
estimador insesgado de θ, la distribución de muestreo de T se encuentra
centrada alrededor de θ y ECM (T) = Var (T).
 Estimadores consistentes.- Sea T el estimador de un parámetro θ y
sea 𝑇1 , 𝑇2 , … , 𝑇𝑛 una e secuencia de estimadores que representa a T con
base en muestras de tamaño 1,2,…, n respectivamente. Se dice que T es
un estimador consistente para θ si:

Para todos los valores de θ y ε > 0

 Estimadores insesgados de varianza mínima.- Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛


una muestra aleatoria de una distribución cuya función de
probabilidad es 𝑓(𝑥; 𝜃). Sea la estadística 𝑇 = 𝜇(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) un
estimador 𝜃 tal que E (T) = θ y Var (T) es menor que la varianza de
cualquier otro estimador insesgado de 𝜃 para todos los posibles
valores de 𝜃. Se dice entonces que T es un estimador insesgado de
varianza mínima de 𝜃.

 Intervalos de confianza para la media


a. σ2 conocida
b. σ2 desconocida
Intervalo de confianza para la media de una distribución Normal

Dada una variable aleatoria con distribución Normal N(μ, σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.
Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la
desviación típica de la variable: que sea conocida o que sea desconocida y
tengamos que estimarla a partir de la muestra. El caso de σ conocida, ya
comentado anteriormente, no pasa de ser un caso académico con poca aplicación
en la práctica, sin embargo es útil desde del punto de vista didáctico.

Caso de varianza conocida


Dada una muestra X1, ..., Xn, el estadístico

36
se distribuye según una Normal estándar. Por tanto, aplicando el método del
pivote podemos construir la expresión

donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha
una probabilidad de α/2, de la que se deduce el intervalo de confianza

Puede repasarse la construcción más detallada.

Caso de varianza desconocida


Dada una muestra X1, ..., Xn, el estadístico

se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y


siguiendo pasos similares a los del apartado anterior, el intervalo de confianza
resultante es

donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad


que deja a su derecha una probabilidad de α/2.
Con el programa siguiente podemos calcular el intervalo de confianza para la
media de una distribución Normal con desviación típica desconocida.

Si y s son la media y la desviación estándar de una muestra aleatoria de una

población normal con varianza , desconocida, un intervalo de confianza de


( )100% para es:

donde /2 es el valor t con = n-1 grados de libertad, que deja un área de


/2 a la derecha.
Se hace una distinción entre los casos de conocida y desconocida al
calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para el

37
primer caso se utiliza el teorema del límite central, mientras que
para desconocida se hace uso de la distribución muestral de la variable
aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa de que el
muestreo se realiza de una distribución normal. En tanto que la distribución tenga
forma aproximada de campana, los intervalos de confianza se pueden calcular
cuando la varianza se desconoce mediante el uso de la distribución t y se puede
esperar buenos resultados.
Con mucha frecuencia los estadísticos recomiendan que aun cuando la
normalidad no se pueda suponer, con desconocida y n 30, s puede
reemplazar a y se puede utilizar el intervalo de confianza:

Por lo general éste se denomina como un intervalo de confianza de muestra


grande. La justificación yace sólo en la presunción de que con una muestra grande
como 30, s estará muy cerca de la real y de esta manera el teorema del límite
central sigue valiendo. Se debe hacer énfasis en que esto es solo una
aproximación y que la calidad de este enfoque mejora a medida que el tamaño de
la muestra crece más.
Ejemplos:
1. El contenido de siete contenedores similares de ácido sulfúrico son 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza
del 95% para la media de todos los contenedores si se supone una
distribución aproximadamente normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
10 y s= 0.283
En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí,
el intervalo de confianza de 95% para es:

Con un nivel de confianza del 95% se sabe que el promedio del contenido
de los contenedores está entre 9.47 y 10.26 litros.
2. Un artículo publicado en el Journal of Testing and Evaluation presenta las
siguientes 20 mediciones del tiempo de combustión residual en segundos
de especímenes tratados de ropa de dormir para niños:
9.85 9.93 9.75 9.77 9.67

38
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de
combustión residual promedio. Supóngase que el tiempo de combustión
residual sigue una distribución normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el
intervalo de confianza de 95% para es:

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión
residual promedio se encuentra entre 9.8073 y 9.8977 segundos.

 Intervalos de confianza para la proporción

39
 Determinación del tamaño de muestra para llevar a cabo un análisis
estadístico
c. Para una media
d. Para una proporción

Cálculo del Tamaño de la Muestra para Estimar una media


¿Qué tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional?. La respuesta depende del error estándar de la
media, si este fuera cero, entonces se necesitaría una sola media que será igual
necesariamente a la media poblacional desconocida , porque = 0. Este caso
extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras
menor sea el error estándar de la media, menor es el tamaño de muestra
necesario para lograr un cierto grado de precisión.

40
Se estableció antes que una forma de disminuir el error de estimación es
aumentar el tamaño de la muestra, si éste incluye el total de la población,

entonces sería igual a cero. Con esto en mente, parece razonable que para
un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que
el error de estimación sea tan pequeño como queramos, para ser mas preciso,
dado un nivel de confianza y un error fijo de estimación , se puede escoger un

tamaño de muestra n tal que P( ) = Nivel de confianza. Con el propósito


de determinar n. El error máximo de estimación esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la


ecuación resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los
resultados fraccionarios.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el
estado de Maryland. Un estudio anterior de diez ciervos cazados mostró
que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande
debe ser una muestra para que el biólogo tenga el 95% de confianza de
que el error de estimación es a lo más de 4 libras?
Solución:

En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95%


de confianza en que difiere en menos de 4 libras de .
2. Una empresa eléctrica fabrica focos que tienen una duración
aproximadamente normal con una desviación estándar de 40 horas. ¿De
qué tamaño se necesita una muestra si se desea tener 96% de confianza
que la media real esté dentro de 10 horas de la media real?

41
Se necesita una muestra de 68 focos para estimar la media de la población
y tener un error máximo de 10 horas.
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo
se requiere un error de 5 horas?

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene


como beneficio una estimación más exacta.
3. Suponga que en el ejercicio anterior se tiene una población de 300 focos, y
se desea saber de que tamaño debe de ser la muestra. El muestreo se
realizará sin reemplazo.
Solución:
Como se tiene una población finita y un muestreo sin reemplazo es necesario
utilizar la formula con el factor de corrección.

Si se tiene una población finita de 300 focos sólo se tiene que extraer de la
población una muestra sin reemplazo de 56 focos para poder estimar la duración
media de los focos restantes con un error máximo de 10 horas.
Cálculo del Tamaño de la Muestra para Estimar una Proporción
Se desea saber que tan grande se requiere que sea una muestra para asegurar
que el error al estimar P sea menor que una cantidad específica .

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el
tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones
en las cuales se tiene una idea del comportamiento de la proporción de la
población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada
referente a esa proporción entonces se tienen dos opciones:
 Tomar una muestra preliminar mayor o igual a 30 para proporcionar una
estimación de P. Después con el uso de la fórmula se podría determinar de
forma aproximada cuántas observaciones se necesitan para proporcionar el
grado de precisión que se desea.
 Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se
obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:

42
Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se
sustituirán en la formula para observar los diferentes tamaños de muestras. El
nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.

p n

0.10 3.84

0.20 6.82

0.30 8.96

0.40 10.24

0.50 10.67

0.60 10.24

0.70 8.96

0.80 6.82

0.90 3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la


muestra alcanza su máximo valor.

43
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la
ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO.
¿Qué tan grande se requiere que sea una muestra si se quiere tener 95%
de confianza de que la estimación de P esté dentro de 0.02?
Solución:
Se tratarán a las 500 familias como una muestra preliminar que proporciona
una estimación de p=340/500=0.68.

Por lo tanto si basamos nuestra estimación de P sobre una muestra


aleatoria de tamaño 2090, se puede tener una confianza de 95% de que
nuestra proporción muestral no diferirá de la proporción real por más de
0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qué proporción del electorado conoce la opinión de ella, respecto al
uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se
necesita si se requiere un confianza del 95% y un error máximo de
estimación de 0.10?
Solución:
En este problema, se desconoce totalmente la proporción de residentes que
conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.

Se requiere un tamaño de muestra de 97 residentes para que con una confianza


del 95% la estimación tenga un error máximo de 0.10.
Cálculo del Tamaño de la Muestra para Estimar una Proporción
Se desea saber que tan grande se requiere que sea una muestra para asegurar
que el error al estimar P sea menor que una cantidad específica .

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

44
Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el
tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones
en las cuales se tiene una idea del comportamiento de la proporción de la
población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada
referente a esa proporción entonces se tienen dos opciones:
 Tomar una muestra preliminar mayor o igual a 30 para proporcionar una
estimación de P. Después con el uso de la fórmula se podría determinar de
forma aproximada cuántas observaciones se necesitan para proporcionar el
grado de precisión que se desea.
 Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se
obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:
Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se
sustituirán en la formula para observar los diferentes tamaños de muestras. El
nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.

P n

0.10 3.84

0.20 6.82

0.30 8.96

0.40 10.24

0.50 10.67

0.60 10.24

45
0.70 8.96

0.80 6.82

0.90 3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la


muestra alcanza su máximo valor.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la
ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO.
¿Qué tan grande se requiere que sea una muestra si se quiere tener 95%
de confianza de que la estimación de P esté dentro de 0.02?
Solución:
Se tratarán a las 500 familias como una muestra preliminar que proporciona
una estimación de p=340/500=0.68.

Por lo tanto si basamos nuestra estimación de P sobre una muestra


aleatoria de tamaño 2090, se puede tener una confianza de 95% de que
nuestra proporción muestral no diferirá de la proporción real por más de
0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qué proporción del electorado conoce la opinión de ella, respecto al
uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se
necesita si se requiere un confianza del 95% y un error máximo de
estimación de 0.10?
Solución:

46
En este problema, se desconoce totalmente la proporción de residentes que
conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.

Se requiere un tamaño de muestra de 97 residentes para que con una confianza


del 95% la estimación tenga un error máximo de 0.10.
Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error
esta dado por:

En esta ecuación se nos pueden presentar dos casos:


 Los tamaños de muestra son iguales.
 Los tamaño de muestra son diferentes .
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación
y se despeja n ya que n1 es igual a n2.

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamaño y se sabe que una es K veces
mayor que la otra.

47
BIBLIOGRAFÍA
 Estadística para administración y economía, Anderson – Sweeney –
Williams, editorial Thomson, 10a edición, pp. 272
 Probabilidad Y Estadística Aplicadas A La Ing., Montgomery – Runger,
Editorial Limusa, 2ª Edición, pp.285, 330 y 331
 Estadística básica en administración, Berenson – Levine, editorial Prentice Hall, 6a
edición, pp.329
 Probabilidad y estadística para ciencias química – biológica, Ma. José Márquez de
Cantú, 1a edición, pp. 161
 Estadistica aplicada a los negocios y la economía, Webster, editorial
IRWIN-McGraw-HILL, 1a edición, pp. 180 y 181
 Estadistica y Muestreo, Martínez Bencardino, Editorial Bogotá ECOE
Ediciones, 13ª ED., Pp. 274, 275, 276
 g
WEBGRAFÍA
http://www.hrc.es/bioest/Introducion.html

http://www.hrc.es/bioest/Introducion_est.html

http://www.hrc.es/bioest/Introducion_ch.html

http://frecuenciaestadistica.blogspot.mx/2009/04/muestreo.html

https://es.wikipedia.org/wiki/Muestreo_(estad%C3%ADstica)
http://www.ugr.es/~bioestad/_private/Tema_6.pdf
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/
cap01d.html#u01calculoestimarproporcion
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/
cap01.html#distribucionesmuestrales
https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-
statistic/
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/
Capitulo8/B0C8m1t8.htm
https://riuma.uma.es/xmlui/bitstream/handle/10630/10390/8%20PI
E-%20MODELOS%20PROBABILIDAD%20VAC.pdf?sequence=1

48

Вам также может понравиться