Вы находитесь на странице: 1из 14

1._ ¿Qué es la Inferencia estadística?

La inferencia estadística es el conjunto de métodos y técnicas que permiten


inducir, a partir de la información empírica proporcionada por una muestra, cual es
el comportamiento de una determinada población con un riesgo de error medible
en términos de probabilidad.

El campo de la inferencia estadística está formado por los métodos utilizados para
tomar decisiones o para obtener conclusiones sobre una población. Estos
métodos utilizan la información contenida en una muestra de la población para
obtener conclusiones.

La inferencia estadística puede dividirse en dos grandes áreas: estimación de


parámetros y prueba de hipótesis. Como ejemplo de un problema de estimación
de parámetros, supóngase que un ingeniero de estructuras analiza la resistencia a
la tensión que un componente empleado en la carrocería de un automóvil. Puesto
que la variabilidad existe de manera natural en la resistencia a la tensión entre
distintos componentes, debido a diferencias en los lotes de materia prima, en el
proceso de fabricación y en los procedimientos de medición, el ingeniero está
interesado en estimar la resistencia a la tensión promedio de los componentes. El
conocimiento de las propiedades de muestreo estadísticas del estimador utilizado,
permite al ingeniero establecer la precisión del valor estimado.

Ahora considérese una situación donde pueden emplearse dos temperaturas de


reacción diferentes en un proceso químico, t 1 y t 2. El ingeniero establece la
conjetura de que la temperatura t 1 dará como resultado rendimientos mayores que
t 2. La prueba estadística de hipótesis es un marco de referencia para resolver
problemas de este tipo. En este caso, la hipótesis es que el rendimiento promedio
con la temperatura t 1 es mayor que el rendimiento promedio con la temperatura t 2.
Nótese que no se hace hincapié en la estimación de los promedios; en su lugar, la
atención se centra en obtener conclusiones sobre la hipótesis planeada.

Ya hemos hecho mención de la llamada Estadística Inferencial, que toma como


base las relaciones existentes entre las muestras y la población para “inferir”
1
0
acerca de ésta a partir de las muestras, es decir, hace generalizaciones a partir de
las muestras.

La Estadística Inferencial pretende resolver dos problemas fundamentales: la


estimación de parámetros poblacionales a partir de estadígrafos muéstrales
conocidos, y la toma de decisiones estadísticas acerca de hipótesis establecidas
sobre la población, también con base al conocimiento de sus muestras.

2._ Los dos problemas que atiende la estadística inferencial.

Los dos tipos de problemas que resuelven las técnicas estadísticas son:

Estimación y contraste de hipótesis. En ambos casos se trata de generalizar la


información obtenida en una muestra a una población. Estas técnicas exigen que
la muestra sea aleatoria. En la práctica rara vez se dispone de muestras
aleatorias.

3._ Razones del muestreo

Cuando se hace una investigación estadística, se deben seguir ciertos pasos o


etapas; después de definir el problema en términos estadísticos y antes de
recolectar los datos tenemos que decidir de qué forma se van a colectar dichos
datos; es decir, que procedimiento se va a utilizar para obtener la muestra, de
manera que podamos aprender algo acerca de la población sobre la base de los
datos extraídos de una parte de ella.

Las razones por las cuales se utiliza el muestreo y no toda la población


(censo) son varias; los grandes progresos hechos en la teoría del muestreo
durante las últimas décadas, hacen posible medir las propiedades de cantidades
masivas de datos con precisión calculada sobre la base dé muestras.

Además del hecho de que pueden obtenerse resultados fidedignos de


procedimientos de muestreo correctos, hay otras importantes razones para su
amplia adopción. Primero, las poblaciones que se investigan pueden ser infinitas,
y en tales casos la muestra es el único procedimiento posible. Segundo, aún en el
caso de poblaciones finitas, muy frecuentemente el muestreo es el único
1
0
procedimiento práctico, pues, una población finita puede constar de millares o
millones de elementos y su enumeración completa es prácticamente imposible.

En tercer lugar, la medición de las propiedades de una población a veces


requiere de la destrucción de sus elementos. Por último, aunque financiera,
práctica y físicamente sea posible observar toda la población, el muestreo puede
ser aún el procedimiento más eficiente.

Los resultados obtenidos por el estudio de una muestra pueden ser iguales o
aún más precisos que los hallados de una cuenta completa del conjunto.

4._ Muestreo aleatorio

Es el resultado de un mecanismo aleatorio. En consecuencia, la selección de


una muestra es un experimento aleatorio, y cada observación de la muestra es el
valor observado de una variable aleatoria.

El propósito principal de la toma de una muestra aleatoria es obtener


información sobre los parámetros no conocidos de la población.

5._ Métodos de muestreo

Los métodos de muestreo probabilísticos son aquellos que se basan en el


principio de N probabilidad. Es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas.

a)._ Muestreo aleatorio simple:

Se puede describir este método fundamental de selección de la muestra de la


siguiente manera. A partir de una población de N unidades selecciónese una,
dando igual probabilidad a todas las unidades. La mejor forma de proceder es con
la ayuda de una tabla de números aleatorios. Tome nota de la unidad
seleccionada y regrésela a la población. Si esta operación se realiza n veces,
obtenemos una muestra aleatoria simple de n unidades, seleccionadas con
1
0
reemplazo. Sin embargo, si se continúa este procedimiento hasta que n unidades
diferentes son seleccionadas y se ignoran todas las repeticiones, se obtiene una
muestra aleatoria simple, seleccionada sin reemplazo. Este último procedimiento
es exactamente el mismo que retener la unidad (o unidades) seleccionada, y
seleccionar otra unidad adicional con igual probabilidad entre las unidades
restantes en la población.

El muestreo aleatorio simple es ciertamente un procedimiento práctico si la


población no es grande y si es relativamente fácil y barato encontrar las unidades
de muestreo. También podría ser un procedimiento práctico para poblaciones
grandes cuyos elementos están concentrados dentro de un área pequeña.

b)._ Muestreo aleatorio estratificado:

El proceso de estratificación requiere que la población sea dividida en grupos o


clases llamados estratos. Entonces, se toma una muestra de cada estrato por
métodos simples al azar o aleatorios simples, y la muestra resultante se llama
muestra estratificada. Una muestra estratificada puede ser proporcional o
desproporcionada.

Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos


el muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).

Ejemplo

En el muestreo estratificado proporcional, el número de unidades extraídas de


cada estrato es proporcional al tamaño de éste. Por ejemplo, si la población es
dividida en cuatro estratos, siendo sus tamaños respectivos 10, 20, 30 y 40 por
ciento de la población y ha de extraerse una muestra de tamaño 500, la muestra
proporcional deseada deberá obtenerse de la siguiente manera:
1
0
La distribución de la muestra en función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos


muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de


la población en cada estrato.

Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de


modo que se considera la proporción y la desviación típica. Tiene poca aplicación
ya que no se suele conocer la desviación.

c)._Muestreo agrupado o por conglomerados

El muestreo agrupado o por conglomerados es el procedimiento de dividir la


población en grupos o regiones y extraer una muestra de ellos para representar la
población. Cuando los grupos o regiones que son las unidades primarias, son
extraídos, podemos incluir en la muestra todas las unidades elementales de las
regiones escogidas o tomar una muestra de unidades primarias más pequeñas o
unidades elementales de las regiones escogidas. Cuando se han observado todas
las unidades elementales de las regiones, tenemos lo que se conoce como
muestreo de una sola etapa. Cuando se extrae una muestra de unidades
elementales de las regiones, tenemos un tipo de diseño llamado muestreo de dos
etapas o submuestreo. En ambas etapas se escoge una muestra simple al azar.
Cuando el muestreo por agrupación supone más de dos etapas para escoger la
muestra final, se llama muestreo en múltiples etapas.
1
0
d)._ Muestreo aleatorio sistemático:

Para obtener una muestra sistemática al azar podemos numerar también las
unidades de muestreo de la población seriamente de 1 a N y determinar primero lo

N
que se conoce por intervalo de muestreo, K= Luego, se escoge al azar un
n
número del primer intervalo de muestreo. Si este número es, por ejemplo, a., con
a≤ K, entonces la muestra con tamaño n tendría como sus miembros las unidades
de muestreo cuyos números de serie corresponden a: a, a + K, a + 2K, a + 3K,…

Ejemplo

Supóngase que deseamos tomar una muestra sistemática de 200 de una


población de 100,000 miembros. Determinamos primero el intervalo de muestreo,
que es, k= 100,000/200 = 500. Después escogemos un número al azar de 1 a 500,
Suponiendo que este número es 253; entonces, comenzaríamos con el miembro
253 de la población numerada y escogeríamos cada 500 un nuevo miembro, el
753, el 1253…

6._ Objetivo del muestreo

Sirve para determinar si las diferencias que se observan entre dos muestras se
deben a variaciones casuales o si son diferencias realmente significativas. El
objetivo del muestreo es obtener inferencia sobre una población de interés, de la
forma más eficiente y confiable.

7._ ¿Se puede esperar, que al analizar una muestra de una población,

un Estadístico pudiera ser igual al Parámetro poblacional


correspondiente?
Si se puede, porque al tomar una muestra esta pertenece a una población y está a
su vez contiene datos que pertenecen a ella y estos datos contienen valores
iguales, como por ejemplo la media o el sesgo.
1
0
8._ TEOREMA DEL LIMITE CENTRAL.

A medida que n se vuelve más grande, la distribución de las medias muéstrales


se aproxima a una distribución normal con una media x́=μ y un error estándar de

σ́ =σ √ n

Indica que, en condiciones muy generales, si Sn es la suma de n variables


aleatorias independientes y de varianza no nula pero finita, entonces la función de
distribución de Sn «se aproxima bien» a una distribución normal (también llamada
distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el
teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e
independientes es lo suficientemente grande.

9._ DISTRIBUCIÓN DE MUESTREO

Es la distribución de probabilidad para los posibles valores de la estadística,


que resulta cuando muestras aleatorias de tamaño n se sacan repetidamente de la
población. La distribución muestral de un estadístico depende del tamaño de la
población, del tamaño de las muestras y del método de elección de éstas.

Es una lista de todos los valores posibles para un estadístico y la probabilidad


relacionada con cada valor.

Hay tres formas de hallar la distribución muestral de una estadística:

1. Deducir la distribución matemáticamente usando las leyes de probabilidad.

2. Usar una simulación para aproximar la distribución. Esto es, saque un gran
número de muestras de tamaño n, calculando el valor de la estadística para cada
muestra y tabule los resultados en un histograma de frecuencia relativa. Cuando el
número de muestras es grande, el histograma será muy cercano a la distribución
teórica muestral.

3. Usar teoremas estadísticos para obtener distribuciones muéstrales exactas o


aproximadas.

10._ DISTRIBUCIÓN MUESTRAL PARA MEDIAS “2” CONOCIDA.


1
0
Media muestral

Una muestra de tamaño n, extraída de una población cuya media es μ y


varianza σ², constituida por un conjunto de variables aleatorias independientes X1,
X2,…, Xn es una muestra aleatoria y los n valores que toma X serán los datos que
conforman la muestra.

Tomando en cuenta lo dicho en la introducción, supongamos que se han extraído


k muestras aleatorias de la población de tamaño N. Si  1,  2,…, k son las
medias muéstrales de cada una de las muestras, entonces podemos afirmar que
, media aritmética de las medias muéstrales, es una variable aleatoria definida
como Media muestral.

Siendo   una variable aleatoria, entonces debe tener una distribución de


probabilidad la cual estará definida por su media μ  y su varianza σ2 , donde

Siendo   una variable aleatoria y tiene una distribución de probabilidad, es


natural preguntarnos: ¿Se puede calcular P (  ≤ k)?

El siguiente teorema nos autorizará el uso de la distribución normal para resolver


problemas como se plantea en la pregunta, bajo ciertas condiciones.

1
0
11._ Distribución muestral para medias,  desconocida, la
distribución “t” de Student.

Distribución muestral para medias:

Indudablemente, la medición de tendencia central más ampliamente usada es la


media aritmética. Este es particularmente el caso si se puede suponer que la
población esta normalmente distribuida.

Entre varias propiedades matemáticas importantes de la media aritmética para


una distribución normal están:

a)._ La imparcialidad, implica el hecho de que el promedio de todas las medias


de muestra posibles (de un tamaño de muestra dado n) será igual a la media de
población μ x.

La media aritmética de muestra es un estimado imparcial de la media de


población. Esto nos dice que aun cuando no sepamos qué tan cerca este el
promedio de cualquier muestra particular seleccionada a la media de población, al
menos estamos seguros de que el promedio de todas las medias de muestra que
se podrían haber seleccionado será igual a la media de población.

b)._ eficiencia, posee la media, la eficiencia, se refiere a la precisión de la


muestra de estadística como un estimador del parámetro de población.

Para distribuciones como la normal, la media aritmética se considera más


estable de muestra a muestra que otras mediciones de tendencia central. Para
una muestra de tamaño n, la media de muestra se acercara más, en promedio, a
la media de población que cualquier otro estimador imparcial, por lo que la media
de muestra es una mejor estimación de la media de población.

c)._ la consistencia, se refiere al efecto del tamaño de muestra sobre la utilidad


de un estimador. Al incrementarse el tamaño de muestra, la variación de la media
de muestra de la media de población se hace más pequeña, de manera que la
media aritmética de muestra se vuelve una mejor estimación de la media de
población.
1
0
Distribución para Desviación estándar desconocida:

Del mismo modo en que la media de la población μ x, por lo general se


desconoce, es probable que la desviación estándar real de la población, σ x ,
tampoco sea conocida. Por tanto, necesitamos obtener una estimación de
intervalos de confianza de μ x utilizando solamente las estadísticas de muestra de
X́ y S.

Distribución “t” de Student:

Supóngase que se toma una muestra de una población normal con media μ y
varianza σ 2. Si x́ es el promedio de las n observaciones que contiene la muestra

x́−μ
z=
aleatoria, entonces la distribución σ es una distribución normal estándar.
√n
Supóngase que la varianza de la población σ 2 es desconocida. ¿Qué sucede con
la distribución de esta estadística si se reemplaza σ por s? La distribución t
proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son μ=0 y σ 2=v /( v−2) para v> 2,


respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia


general de la distribución t es similar a la de la distribución normal estándar:
ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza
en la media μ=0. Sin embargo, la distribución t tiene colas más amplias que la
normal; esto es, la probabilidad de las colas es mayor que en la distribución
normal. A medida que el número de grados de libertad tiende a infinito, la forma
límite de la distribución t es la distribución normal estándar.
1
0
12._ Distribución muestral para proporciones.

La proporción muestral es el estimador puntual de la proporción poblacional p.


La fórmula para calcular la proporción muestral es:

El proceso de proporciones muéstrales es muy similar al de las medias. De


cualquier población es posible obtener muchas muestras diferentes de un tamaño
dado. Cada muestra tendrá su propia proporción de “éxitos”, p. sin embargo, al
igual que como las medias, el valor esperado de la distribución muestral de las
proporciones muéstrales será igual a la proporción de éxitos en la población:
E ( p )=π .

Ejemplo

Lugget furniture pregunta a toda la población N=4 clientes si vieron el anuncio


de lugget en el periódico de esta mañana. Se registró una respuesta de “si” como
éxito, y de “no” como fracaso. Los cuatro clientes respondieron S, N, N y S. La
proporción poblacional de éxitos es π=0.50. Se tomaron muestras de tamaño n=2,
y la proporción de éxitos se registraron en la siguiente tabla:

1
0
La proporción muestral ṕ es una variable aleatoria y su distribución de
probabilidad se conoce como distribución muestral de ṕ.La distribución muestral
de ṕ es la distribución de probabilidad de todos los posibles valores de la
proporción muestral ṕ.

Para determinar qué tan cerca está la proporción muestral ṕ de la proporción


poblacional p, se necesita entender las propiedades de la distribución muestral de:
el valor esperado de ṕ, la desviación estándar de ṕ y la forma de la distribución
muestral de ṕ.

Valor esperado

El valor esperado de ṕ , la media de todos los posibles valores de ṕ , es igual a la


proporción poblacional p.

Desviación estándar

Como en el caso de la desviación estándar de x́ la desviación estándar de ṕ


obedece a si la población es finita o infinita. Las dos fórmulas para calcular la
desviación estándar de se presentan a continuación.

1
0
Aproximación de la distribución normal a la binomial

Ahora que se conoce la media y la desviación estándar de la distribución muestral


de ṕ, el último paso es determinar la forma de la distribución muestral. La
proporción muestral es ṕ = x/n.

En una muestra aleatoria simple de una población grande, el valor de x es una


variable aleatoria binomial que indica el número de los elementos de la muestra
que tienen la característica de interés.

Como n es una constante, la probabilidad de x/n es la misma que la probabilidad


de x, lo cual significa que la distribución muestral de ṕ también es una distribución
de probabilidad discreta y que la probabilidad de cada x/n es la misma que la
probabilidad de x.

Una distribución binomial se aproxima mediante una distribución normal siempre


que el tamaño de la muestra sea lo suficientemente grande para satisfacer las dos
condiciones siguientes: np ≥ 5 y n ( 1− p ) ≥ 5

Suponiendo que se satisfagan estas dos condiciones, la distribución de


probabilidad de x en la proporción muestral, ṕ = x/n, puede aproximarse por medio
de una distribución normal. Y como n es una constante, la distribución muestral de
ṕ también se aproxima mediante una distribución normal. Esta aproximación se
formula como sigue:

La distribución muestral de ṕ se aproxima mediante una distribución normal


siempre que np ≥ 5 y n ( 1− p ) ≥ 5.

El estadístico de prueba
1
0
Mediante pO se denota la proporción poblacional, las tres formas de una prueba de
hipótesis para la proporción poblacional son las siguientes:

La primera forma es una prueba de la cola inferior, la segunda es una prueba de


la cola superior y la tercera es una prueba de dos colas.

Las pruebas de hipótesis para la proporción poblacional se basan en la


diferencia entre la proporción muestral ṕ y la proporción poblacional hipotética p 0.
Los métodos para realizar la prueba de hipótesis son semejantes a los usados
para las pruebas de hipótesis para la media poblacional. La única diferencia es
que para calcular el estadístico de prueba se usa la proporción muestral y su error
estándar. Después, para determinar si se rechaza la hipótesis nula se usa el
método del valor-p o el método del valor crítico.

1
0

Вам также может понравиться