Вы находитесь на странице: 1из 5

Teorema de Límite Central

El teorema del límite especifica la regularidad estadística de los promedios obtenidos de las
mediciones numéricas en las unidades experimentales analizadas en muestras de tamaño n. Es el
teorema de límite central, que dice:
En muestras de tamaño n, tomadas de una población en la que la regularidad estadística no sigue
una distribución normal (puede ser de cualquier forma), que tiene una media poblacional y
varianza poblacional 2, entonces si n es grande, el proceso de tomar muchas muestras y en cada
una de ellas tomar su media, el promedio maestral produce una regularidad estadística de los
valores de la media que se modela con la distribución normal con media y varianza 2 / n
en el teorema del límite depende del grado de alejamiento de la distribución de “muchas medias
muéstrales”. Si el alejamiento es muy fuerte, distribuciones asimétricas con mayores
probabilidades en los extremos, o con varias modas, un tamaño de muestra de 30 o más ya
produce la distribución normal. Sin embargo, si la distribución de la población es normal con
muestras de tamaño 10 o más se tiene la normalidad.

 Cuando la muestra se toma de una población pequeña y sin reemplazo se puede usar la
siguiente fórmula para encontrar x:
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑁 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝜎 𝑁−𝑛
𝜎𝑥 = √
√𝑛 𝑁−1

Cuando se extraen muestras mayores a 30 de una población normal se tiene:

𝑋−𝜇
𝑧= 𝜎
√𝑛
http://fcm.ens.uabc.mx/~chelo/estadistica/doc-pdf/t-l-c.pdf

Estimación de la media de una población mediante intervalos de confianza


Como se ha señalado uno de los métodos para estimar la media de una población es a través de
intervalos de confianza. Existen dos fórmulas para poder estimar la media de una población a
través de intervalos de confianza y el uso de cada una de ellas depende del caso que se examine.
En primer lugar, se mostrará un método generalmente utilizado cuando se dispone de muestras
grandes, es decir, para aquellas muestras compuestas de 30 o más datos. Este método también
puede ser utilizado para muestras menores a 30 datos, siempre y cuando se tenga pleno
conocimiento que la distribución de los datos de la población sea normal y que se conozca el
valor de la varianza poblacional o de la desviación estándar poblacional. En segundo lugar, se
mostrará un método empleado para el caso de muestras pequeñas cuando se desconoce el valor
de la varianza poblacional o de la desviación estándar poblacional, siempre y cuando también se
tenga pleno conocimiento de que la distribución de los datos de la población sea normal. Por
último, se presentará un método para estimar la diferencia que existe entre las medias
poblacionales de dos conjuntos de datos distintos. Este método ofrece grandes ventajas cuando
se desea conocer si existen diferencias significativas en la forma en que se concentran los datos
de dos poblaciones distintas.
El método de estimación de la media para muestras iguales o mayores a 30 datos se fundamenta
en el teorema del límite central en la unidad anterior, el cual señala que conforme se incremente
el tamaño n de cada muestra posible que se extrae de una población de tamaño N, la distribución
maestral de la media irá adquiriendo la forma de una distribución normal.
Formula 1
𝜎 𝜎
𝑋 − 𝑍𝛼⁄2 ( ) < 𝜇 < 𝑋 + 𝑍𝛼⁄2 ( )
𝑛 √ 𝑛 √

Cuando no se conoce la desviación estándar poblacional, la fórmula para estimar la media de


una población a través de intervalos de confianza, con la información contenida en una
muestra grande es:

Formula 2

𝑆 𝑆
𝑋 − 𝑍𝛼⁄2 ( ) < 𝜇 < 𝑋 + 𝑍𝛼⁄2 ( )
√𝑛 √𝑛
Los elementos que conforman el intervalo de confianza son:

X = Media de la muestra

𝑍𝛼⁄2 = Es el valor de Z situado bajo la curva normal estandarizada


𝜎
= Es el error estándar de la media muestral.
√𝑛
El nivel de confianza sirve para determinar el valor de Z / 2. Para esto, uno determina un nivel
de confianza considerable, por ejemplo, 90%, 95%, 98% o 99%. Este nivel de confianza se
define como ( 1 − 𝛼)% y señala el porcentaje de todos los intervalos que se pueden construir
con todas las medias muestrales posibles que contendrán al verdadero valor de la media
poblacional. Cabe señalar que 𝛼 se define como el nivel de significancia y representa la
probabilidad de que el parámetro µ no se encuentre considerado dentro del intervalo
estimado. Los niveles de confianza más comunes y sus respectivos valores de 𝑍𝛼⁄
2

1–𝛼 𝑍𝛼⁄2
90% 1.645
95% 1.96
98% 2.326
99% 2.576

http://gc.initelabs.com/recursos/files/r157r/w13122w/Estad%20para%20Ne
g_1aEd_07.pdf
Estimación de la proporción (Distribución binomial)
La distribución maestral de proporciones está estrechamente relacionada con la distribución
binomial; una distribución binomial es una distribución del total de éxitos en las muestras,
mientras que una distribución de proporciones es la distribución de un promedio (media) de
los éxitos. Como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la
proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre
que: np ≥ 5 y n(1- p) ≥ 5

Una distribución binomial: es, por ejemplo, si echamos una moneda al aire y observamos el
lado que cae. Está claro que sólo hay dos posibilidades. Ahora bien, la probabilidad de que
caiga la moneda de cualquier lado es la misma siempre que ésta no esté cargada. Como cada
caso tiene igual probabilidad de ocurrir, y siendo la suma de probabilidades siempre igual a 1,
entonces la probabilidad de que caiga la moneda de algún lado es 0.5. Si realizamos el
experimento n veces y queremos saber la probabilidad d de que salga águila o sol x veces,
entonces usamos una distribución binomial.

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de


proporciones está basada en la aproximación de la distribución binomial a la normal. Esta
fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la
muestra.
𝑝−𝑃
𝑍=
√𝑃(1 − 𝑃)
𝑛
Esta fórmula se puede comparar a las anteriores si pensamos en que estamos calculando una
diferencia entre la proporción de la muestra y la de la población en unidades de desviación
estándar, como era el caso de la distribución de medias:
𝑋−𝜇
𝑍= 𝜎
√𝑛
A la fórmula anterior se le puede agregar el factor de corrección (en el denominador):
𝑝−𝑃
𝑍=
√𝑃(1 − 𝑃) √𝑁 − 𝑛
𝑛 𝑁−1

si se cumplen con las condiciones mencionadas anteriormente de que sea una población finita
(N/n < 20) y sin reemplazo.

http://www.geociencias.unam.mx/~ramon/EstInf/Clase5.pdf
Determinación del tamaño de la muestra

Para determinar el tamaño maestral de un estudio, debemos considerar diferentes situaciones


A. Estudios para determinar parámetros. Es decir, pretendemos hacer inferencias a valores
poblacionales (proporciones, medias) a partir de una muestra (Tabla 1).

B. Estudios para contraste de hipótesis. Es decir, pretendemos comparar si las medias o las
proporciones de las muestras son diferentes.

A. Estudios para determinar parámetros


Con estos estudios pretendemos hacer inferencias a valores poblacionales
(proporciones, medias) a partir de una muestra.
1. Estimar una proporción:
Si deseamos estimar una proporción, debemos saber:
a) El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar a un
coeficiente (Zα).
Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.
b) La precisión que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parámetro que queremos medir (en este caso una
proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%)
𝑍2𝛼 ∗ 𝑃 ∗ 𝑞
𝑛=
𝑑2
• Zα2 = 1.962 (ya que la seguridad es del 95%)
• p = proporción esperada (en este caso 5% = 0.05)
• q = 1 – p (en este caso 1 – 0.05 = 0.95)
• d = precisión (en este caso deseamos un 3%)
Si la población es finita, es decir conocemos el total de la población y deseásemos saber
cuántos del total tendremos que estudiar la respuesta seria:

𝑁 ∗ 𝑍𝛼 2 𝑝 ∗ 𝑞
𝑛= 2
𝑑 ∗ (𝑁 − 1) + 𝑍𝛼 2 ∗ 𝑝 ∗ 𝑞

N = Total de la población
• Zα2= 1.962 (si la seguridad es del 95%)
• p = proporción esperada (en este caso 5% = 0.05)
• q = 1 – p (en este caso 1-0.05 = 0.95)
• d = precisión (en este caso deseamos un 3%).
A.2 Estimar una media:
Si deseamos estimar una media: debemos saber:
a. El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar a un
coeficiente(Zα). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58.
b. La precisión con que se desea estimar el parámetro (2 * d es la amplitud del intervalo
de confianza).
c. Una idea de la varianza S2 de la distribución de la variable cuantitativa que se supone
existe en la población.
𝑍2𝛼 ∗ 𝑆 2
𝑛=
𝑑2
El tamaño muestral ajustado a las pérdidas:
En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones
diversas (pérdida de información, abandono, no respuesta…) por lo que se debe
incrementar el tamaño muestral respecto a dichas pérdidas.
El tamaño muestral ajustado a las pérdidas se puede calcular:
Muestra ajustada a las pérdidas = n (1 / 1–R)
• n = número de sujetos sin pérdidas
• R = proporción esperada de pérdidas
http://navarrof.orgfree.com/Docencia/MatematicasIII/M3UT8/tamano_muestral2.pdf

Вам также может понравиться