Unidad Conceptos

1._ ¿Qué es la Inferencia estadística?
La inferencia estadística es el conjunto de métodos y técnicas que permiten

inducir, a partir de la información empírica proporcionada por una muestra, cual es
el comportamiento de una determinada población con un riesgo de error medible
en términos de probabilidad.
El campo de la inferencia estadística está formado por los métodos utilizados para
tomar decisiones o para obtener conclusiones sobre una población. Estos
métodos utilizan la información contenida en una muestra de la población para
obtener conclusiones.
La inferencia estadística puede dividirse en dos grandes áreas: estimación de

parámetros y prueba de hipótesis. Como ejemplo de un problema de estimación
de parámetros, supóngase que un ingeniero de estructuras analiza la resistencia a
la tensión que un componente empleado en la carrocería de un automóvil. Puesto
que la variabilidad existe de manera natural en la resistencia a la tensión entre
distintos componentes, debido a diferencias en los lotes de materia prima, en el
proceso de fabricación y en los procedimientos de medición, el ingeniero está
interesado en estimar la resistencia a la tensión promedio de los componentes. El
conocimiento de las propiedades de muestreo estadísticas del estimador utilizado,
permite al ingeniero establecer la precisión del valor estimado.
Ahora considérese una situación donde pueden emplearse dos temperaturas de

reacción diferentes en un proceso químico, t 1 y t 2. El ingeniero establece la
conjetura de que la temperatura t 1 dará como resultado rendimientos mayores que
t 2. La prueba estadística de hipótesis es un marco de referencia para resolver
problemas de este tipo. En este caso, la hipótesis es que el rendimiento promedio
con la temperatura t 1 es mayor que el rendimiento promedio con la temperatura t 2.
Nótese que no se hace hincapié en la estimación de los promedios; en su lugar, la
atención se centra en obtener conclusiones sobre la hipótesis planeada.
Ya hemos hecho mención de la llamada Estadística Inferencial, que toma como

base las relaciones existentes entre las muestras y la población para “inferir”
1
0
acerca de ésta a partir de las muestras, es decir, hace generalizaciones a partir de
las muestras.
La Estadística Inferencial pretende resolver dos problemas fundamentales: la

estimación de parámetros poblacionales a partir de estadígrafos muéstrales
conocidos, y la toma de decisiones estadísticas acerca de hipótesis establecidas
sobre la población, también con base al conocimiento de sus muestras.
2._ Los dos problemas que atiende la estadística inferencial.
Los dos tipos de problemas que resuelven las técnicas estadísticas son:
Estimación y contraste de hipótesis. En ambos casos se trata de generalizar la

información obtenida en una muestra a una población. Estas técnicas exigen que
la muestra sea aleatoria. En la práctica rara vez se dispone de muestras
aleatorias.
3._ Razones del muestreo
Cuando se hace una investigación estadística, se deben seguir ciertos pasos o

etapas; después de definir el problema en términos estadísticos y antes de
recolectar los datos tenemos que decidir de qué forma se van a colectar dichos
datos; es decir, que procedimiento se va a utilizar para obtener la muestra, de
manera que podamos aprender algo acerca de la población sobre la base de los
datos extraídos de una parte de ella.
Las razones por las cuales se utiliza el muestreo y no toda la población

(censo) son varias; los grandes progresos hechos en la teoría del muestreo
durante las últimas décadas, hacen posible medir las propiedades de cantidades
masivas de datos con precisión calculada sobre la base dé muestras.
Además del hecho de que pueden obtenerse resultados fidedignos de

procedimientos de muestreo correctos, hay otras importantes razones para su
amplia adopción. Primero, las poblaciones que se investigan pueden ser infinitas,
y en tales casos la muestra es el único procedimiento posible. Segundo, aún en el
caso de poblaciones finitas, muy frecuentemente el muestreo es el único
1
0
procedimiento práctico, pues, una población finita puede constar de millares o
millones de elementos y su enumeración completa es prácticamente imposible.
En tercer lugar, la medición de las propiedades de una población a veces

requiere de la destrucción de sus elementos. Por último, aunque financiera,
práctica y físicamente sea posible observar toda la población, el muestreo puede
ser aún el procedimiento más eficiente.
Los resultados obtenidos por el estudio de una muestra pueden ser iguales o
aún más precisos que los hallados de una cuenta completa del conjunto.
4._ Muestreo aleatorio
Es el resultado de un mecanismo aleatorio. En consecuencia, la selección de

una muestra es un experimento aleatorio, y cada observación de la muestra es el
valor observado de una variable aleatoria.
El propósito principal de la toma de una muestra aleatoria es obtener

información sobre los parámetros no conocidos de la población.
5._ Métodos de muestreo
Los métodos de muestreo probabilísticos son aquellos que se basan en el

principio de N probabilidad. Es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas.
a)._ Muestreo aleatorio simple:
Se puede describir este método fundamental de selección de la muestra de la

siguiente manera. A partir de una población de N unidades selecciónese una,
dando igual probabilidad a todas las unidades. La mejor forma de proceder es con
la ayuda de una tabla de números aleatorios. Tome nota de la unidad
seleccionada y regrésela a la población. Si esta operación se realiza n veces,
obtenemos una muestra aleatoria simple de n unidades, seleccionadas con
1
0
reemplazo. Sin embargo, si se continúa este procedimiento hasta que n unidades
diferentes son seleccionadas y se ignoran todas las repeticiones, se obtiene una
muestra aleatoria simple, seleccionada sin reemplazo. Este último procedimiento
es exactamente el mismo que retener la unidad (o unidades) seleccionada, y
seleccionar otra unidad adicional con igual probabilidad entre las unidades
restantes en la población.
El muestreo aleatorio simple es ciertamente un procedimiento práctico si la

población no es grande y si es relativamente fácil y barato encontrar las unidades
de muestreo. También podría ser un procedimiento práctico para poblaciones
grandes cuyos elementos están concentrados dentro de un área pequeña.
b)._ Muestreo aleatorio estratificado:
El proceso de estratificación requiere que la población sea dividida en grupos o

clases llamados estratos. Entonces, se toma una muestra de cada estrato por
métodos simples al azar o aleatorios simples, y la muestra resultante se llama
muestra estratificada. Una muestra estratificada puede ser proporcional o
desproporcionada.
Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos

el muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).
Ejemplo
En el muestreo estratificado proporcional, el número de unidades extraídas de

cada estrato es proporcional al tamaño de éste. Por ejemplo, si la población es
dividida en cuatro estratos, siendo sus tamaños respectivos 10, 20, 30 y 40 por
ciento de la población y ha de extraerse una muestra de tamaño 500, la muestra
proporcional deseada deberá obtenerse de la siguiente manera:
1
0
La distribución de la muestra en función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos

muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de

la población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de

modo que se considera la proporción y la desviación típica. Tiene poca aplicación
ya que no se suele conocer la desviación.
c)._Muestreo agrupado o por conglomerados
El muestreo agrupado o por conglomerados es el procedimiento de dividir la

población en grupos o regiones y extraer una muestra de ellos para representar la
población. Cuando los grupos o regiones que son las unidades primarias, son
extraídos, podemos incluir en la muestra todas las unidades elementales de las
regiones escogidas o tomar una muestra de unidades primarias más pequeñas o
unidades elementales de las regiones escogidas. Cuando se han observado todas
las unidades elementales de las regiones, tenemos lo que se conoce como
muestreo de una sola etapa. Cuando se extrae una muestra de unidades
elementales de las regiones, tenemos un tipo de diseño llamado muestreo de dos
etapas o submuestreo. En ambas etapas se escoge una muestra simple al azar.
Cuando el muestreo por agrupación supone más de dos etapas para escoger la
muestra final, se llama muestreo en múltiples etapas.
1
0
d)._ Muestreo aleatorio sistemático:
Para obtener una muestra sistemática al azar podemos numerar también las
unidades de muestreo de la población seriamente de 1 a N y determinar primero lo
N
que se conoce por intervalo de muestreo, K= Luego, se escoge al azar un
n
número del primer intervalo de muestreo. Si este número es, por ejemplo, a., con
a≤ K, entonces la muestra con tamaño n tendría como sus miembros las unidades
de muestreo cuyos números de serie corresponden a: a, a + K, a + 2K, a + 3K,…
Ejemplo
Supóngase que deseamos tomar una muestra sistemática de 200 de una

población de 100,000 miembros. Determinamos primero el intervalo de muestreo,
que es, k= 100,000/200 = 500. Después escogemos un número al azar de 1 a 500,
Suponiendo que este número es 253; entonces, comenzaríamos con el miembro
253 de la población numerada y escogeríamos cada 500 un nuevo miembro, el
753, el 1253…
6._ Objetivo del muestreo
Sirve para determinar si las diferencias que se observan entre dos muestras se
deben a variaciones casuales o si son diferencias realmente significativas. El
objetivo del muestreo es obtener inferencia sobre una población de interés, de la
forma más eficiente y confiable.
7._ ¿Se puede esperar, que al analizar una muestra de una población,
un Estadístico pudiera ser igual al Parámetro poblacional

correspondiente?
Si se puede, porque al tomar una muestra esta pertenece a una población y está a
su vez contiene datos que pertenecen a ella y estos datos contienen valores
iguales, como por ejemplo la media o el sesgo.
1
0
8._ TEOREMA DEL LIMITE CENTRAL.
A medida que n se vuelve más grande, la distribución de las medias muéstrales

se aproxima a una distribución normal con una media x́=μ y un error estándar de
σ́ =σ √ n
Indica que, en condiciones muy generales, si Sn es la suma de n variables

aleatorias independientes y de varianza no nula pero finita, entonces la función de
distribución de Sn «se aproxima bien» a una distribución normal (también llamada
distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el
teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e
independientes es lo suficientemente grande.
9._ DISTRIBUCIÓN DE MUESTREO
Es la distribución de probabilidad para los posibles valores de la estadística,

que resulta cuando muestras aleatorias de tamaño n se sacan repetidamente de la
población. La distribución muestral de un estadístico depende del tamaño de la
población, del tamaño de las muestras y del método de elección de éstas.
Es una lista de todos los valores posibles para un estadístico y la probabilidad

relacionada con cada valor.
Hay tres formas de hallar la distribución muestral de una estadística:
1. Deducir la distribución matemáticamente usando las leyes de probabilidad.
2. Usar una simulación para aproximar la distribución. Esto es, saque un gran
número de muestras de tamaño n, calculando el valor de la estadística para cada
muestra y tabule los resultados en un histograma de frecuencia relativa. Cuando el
número de muestras es grande, el histograma será muy cercano a la distribución
teórica muestral.
3. Usar teoremas estadísticos para obtener distribuciones muéstrales exactas o

aproximadas.
10._ DISTRIBUCIÓN MUESTRAL PARA MEDIAS “2” CONOCIDA.

1
0
Media muestral
Una muestra de tamaño n, extraída de una población cuya media es μ y

varianza σ², constituida por un conjunto de variables aleatorias independientes X1,
X2,…, Xn es una muestra aleatoria y los n valores que toma X serán los datos que
conforman la muestra.
Tomando en cuenta lo dicho en la introducción, supongamos que se han extraído

k muestras aleatorias de la población de tamaño N. Si 1, 2,…, k son las
medias muéstrales de cada una de las muestras, entonces podemos afirmar que
, media aritmética de las medias muéstrales, es una variable aleatoria definida
como Media muestral.
Siendo una variable aleatoria, entonces debe tener una distribución de

probabilidad la cual estará definida por su media μ y su varianza σ2 , donde
Siendo una variable aleatoria y tiene una distribución de probabilidad, es

natural preguntarnos: ¿Se puede calcular P ( ≤ k)?
El siguiente teorema nos autorizará el uso de la distribución normal para resolver

problemas como se plantea en la pregunta, bajo ciertas condiciones.
1
0
11._ Distribución muestral para medias,  desconocida, la
distribución “t” de Student.
Distribución muestral para medias:
Indudablemente, la medición de tendencia central más ampliamente usada es la

media aritmética. Este es particularmente el caso si se puede suponer que la
población esta normalmente distribuida.
Entre varias propiedades matemáticas importantes de la media aritmética para

una distribución normal están:
a)._ La imparcialidad, implica el hecho de que el promedio de todas las medias

de muestra posibles (de un tamaño de muestra dado n) será igual a la media de
población μ x.
La media aritmética de muestra es un estimado imparcial de la media de

población. Esto nos dice que aun cuando no sepamos qué tan cerca este el
promedio de cualquier muestra particular seleccionada a la media de población, al
menos estamos seguros de que el promedio de todas las medias de muestra que
se podrían haber seleccionado será igual a la media de población.
b)._ eficiencia, posee la media, la eficiencia, se refiere a la precisión de la

muestra de estadística como un estimador del parámetro de población.
Para distribuciones como la normal, la media aritmética se considera más

estable de muestra a muestra que otras mediciones de tendencia central. Para
una muestra de tamaño n, la media de muestra se acercara más, en promedio, a
la media de población que cualquier otro estimador imparcial, por lo que la media
de muestra es una mejor estimación de la media de población.
c)._ la consistencia, se refiere al efecto del tamaño de muestra sobre la utilidad

de un estimador. Al incrementarse el tamaño de muestra, la variación de la media
de muestra de la media de población se hace más pequeña, de manera que la
media aritmética de muestra se vuelve una mejor estimación de la media de
población.
1
0
Distribución para Desviación estándar desconocida:
Del mismo modo en que la media de la población μ x, por lo general se

desconoce, es probable que la desviación estándar real de la población, σ x ,
tampoco sea conocida. Por tanto, necesitamos obtener una estimación de
intervalos de confianza de μ x utilizando solamente las estadísticas de muestra de
X́ y S.
Distribución “t” de Student:
Supóngase que se toma una muestra de una población normal con media μ y
varianza σ 2. Si x́ es el promedio de las n observaciones que contiene la muestra
x́−μ
z=
aleatoria, entonces la distribución σ es una distribución normal estándar.
√n
Supóngase que la varianza de la población σ 2 es desconocida. ¿Qué sucede con
la distribución de esta estadística si se reemplaza σ por s? La distribución t
proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son μ=0 y σ 2=v /( v−2) para v> 2,

respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia

general de la distribución t es similar a la de la distribución normal estándar:
ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza
en la media μ=0. Sin embargo, la distribución t tiene colas más amplias que la
normal; esto es, la probabilidad de las colas es mayor que en la distribución
normal. A medida que el número de grados de libertad tiende a infinito, la forma
límite de la distribución t es la distribución normal estándar.
1
0
12._ Distribución muestral para proporciones.
La proporción muestral es el estimador puntual de la proporción poblacional p.

La fórmula para calcular la proporción muestral es:
El proceso de proporciones muéstrales es muy similar al de las medias. De

cualquier población es posible obtener muchas muestras diferentes de un tamaño
dado. Cada muestra tendrá su propia proporción de “éxitos”, p. sin embargo, al
igual que como las medias, el valor esperado de la distribución muestral de las
proporciones muéstrales será igual a la proporción de éxitos en la población:
E ( p )=π .
Ejemplo
Lugget furniture pregunta a toda la población N=4 clientes si vieron el anuncio

de lugget en el periódico de esta mañana. Se registró una respuesta de “si” como
éxito, y de “no” como fracaso. Los cuatro clientes respondieron S, N, N y S. La
proporción poblacional de éxitos es π=0.50. Se tomaron muestras de tamaño n=2,
y la proporción de éxitos se registraron en la siguiente tabla:
1
0
La proporción muestral ṕ es una variable aleatoria y su distribución de
probabilidad se conoce como distribución muestral de ṕ.La distribución muestral
de ṕ es la distribución de probabilidad de todos los posibles valores de la
proporción muestral ṕ.
Para determinar qué tan cerca está la proporción muestral ṕ de la proporción

poblacional p, se necesita entender las propiedades de la distribución muestral de:
el valor esperado de ṕ, la desviación estándar de ṕ y la forma de la distribución
muestral de ṕ.
Valor esperado
El valor esperado de ṕ , la media de todos los posibles valores de ṕ , es igual a la

proporción poblacional p.
Desviación estándar
Como en el caso de la desviación estándar de x́ la desviación estándar de ṕ

obedece a si la población es finita o infinita. Las dos fórmulas para calcular la
desviación estándar de se presentan a continuación.
1
0
Aproximación de la distribución normal a la binomial
Ahora que se conoce la media y la desviación estándar de la distribución muestral

de ṕ, el último paso es determinar la forma de la distribución muestral. La
proporción muestral es ṕ = x/n.
En una muestra aleatoria simple de una población grande, el valor de x es una

variable aleatoria binomial que indica el número de los elementos de la muestra
que tienen la característica de interés.
Como n es una constante, la probabilidad de x/n es la misma que la probabilidad

de x, lo cual significa que la distribución muestral de ṕ también es una distribución
de probabilidad discreta y que la probabilidad de cada x/n es la misma que la
probabilidad de x.
Una distribución binomial se aproxima mediante una distribución normal siempre

que el tamaño de la muestra sea lo suficientemente grande para satisfacer las dos
condiciones siguientes: np ≥ 5 y n ( 1− p ) ≥ 5
Suponiendo que se satisfagan estas dos condiciones, la distribución de

probabilidad de x en la proporción muestral, ṕ = x/n, puede aproximarse por medio
de una distribución normal. Y como n es una constante, la distribución muestral de
ṕ también se aproxima mediante una distribución normal. Esta aproximación se
formula como sigue:
La distribución muestral de ṕ se aproxima mediante una distribución normal

siempre que np ≥ 5 y n ( 1− p ) ≥ 5.
El estadístico de prueba
1
0
Mediante pO se denota la proporción poblacional, las tres formas de una prueba de
hipótesis para la proporción poblacional son las siguientes:
La primera forma es una prueba de la cola inferior, la segunda es una prueba de

la cola superior y la tercera es una prueba de dos colas.
Las pruebas de hipótesis para la proporción poblacional se basan en la

diferencia entre la proporción muestral ṕ y la proporción poblacional hipotética p 0.
Los métodos para realizar la prueba de hipótesis son semejantes a los usados
para las pruebas de hipótesis para la media poblacional. La única diferencia es
que para calcular el estadístico de prueba se usa la proporción muestral y su error
estándar. Después, para determinar si se rechaza la hipótesis nula se usa el
método del valor-p o el método del valor crítico.
1
0

Unidad Conceptos

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Unidad Conceptos

Загружено:

Авторское право:

Доступные форматы

1._ ¿Qué es la Inferencia estadística?

La inferencia estadística es el conjunto de métodos y técnicas que permiten

La inferencia estadística puede dividirse en dos grandes áreas: estimación de

Ahora considérese una situación donde pueden emplearse dos temperaturas de

Ya hemos hecho mención de la llamada Estadística Inferencial, que toma como

La Estadística Inferencial pretende resolver dos problemas fundamentales: la

2._ Los dos problemas que atiende la estadística inferencial.

Estimación y contraste de hipótesis. En ambos casos se trata de generalizar la

3._ Razones del muestreo

Cuando se hace una investigación estadística, se deben seguir ciertos pasos o

Las razones por las cuales se utiliza el muestreo y no toda la población

Además del hecho de que pueden obtenerse resultados fidedignos de

En tercer lugar, la medición de las propiedades de una población a veces

4._ Muestreo aleatorio

Es el resultado de un mecanismo aleatorio. En consecuencia, la selección de

El propósito principal de la toma de una muestra aleatoria es obtener

5._ Métodos de muestreo

Los métodos de muestreo probabilísticos son aquellos que se basan en el

a)._ Muestreo aleatorio simple:

Se puede describir este método fundamental de selección de la muestra de la

El muestreo aleatorio simple es ciertamente un procedimiento práctico si la

b)._ Muestreo aleatorio estratificado:

El proceso de estratificación requiere que la población sea dividida en grupos o

Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos

En el muestreo estratificado proporcional, el número de unidades extraídas de

Afijación Simple: A cada estrato le corresponde igual número de elementos

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de

Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de

c)._Muestreo agrupado o por conglomerados

El muestreo agrupado o por conglomerados es el procedimiento de dividir la

Supóngase que deseamos tomar una muestra sistemática de 200 de una

6._ Objetivo del muestreo

un Estadístico pudiera ser igual al Parámetro poblacional

A medida que n se vuelve más grande, la distribución de las medias muéstrales

Indica que, en condiciones muy generales, si Sn es la suma de n variables

9._ DISTRIBUCIÓN DE MUESTREO

Es la distribución de probabilidad para los posibles valores de la estadística,

Es una lista de todos los valores posibles para un estadístico y la probabilidad

Hay tres formas de hallar la distribución muestral de una estadística:

1. Deducir la distribución matemáticamente usando las leyes de probabilidad.

3. Usar teoremas estadísticos para obtener distribuciones muéstrales exactas o

10._ DISTRIBUCIÓN MUESTRAL PARA MEDIAS “2” CONOCIDA.

Una muestra de tamaño n, extraída de una población cuya media es μ y

Tomando en cuenta lo dicho en la introducción, supongamos que se han extraído

Siendo una variable aleatoria, entonces debe tener una distribución de

Siendo una variable aleatoria y tiene una distribución de probabilidad, es

El siguiente teorema nos autorizará el uso de la distribución normal para resolver

Distribución muestral para medias:

Indudablemente, la medición de tendencia central más ampliamente usada es la

Entre varias propiedades matemáticas importantes de la media aritmética para

a)._ La imparcialidad, implica el hecho de que el promedio de todas las medias

La media aritmética de muestra es un estimado imparcial de la media de

b)._ eficiencia, posee la media, la eficiencia, se refiere a la precisión de la

Para distribuciones como la normal, la media aritmética se considera más

c)._ la consistencia, se refiere al efecto del tamaño de muestra sobre la utilidad

Del mismo modo en que la media de la población μ x, por lo general se

Distribución “t” de Student:

La media y la varianza de la distribución t son μ=0 y σ 2=v /( v−2) para v> 2,

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia

La proporción muestral es el estimador puntual de la proporción poblacional p.

El proceso de proporciones muéstrales es muy similar al de las medias. De

Lugget furniture pregunta a toda la población N=4 clientes si vieron el anuncio

Para determinar qué tan cerca está la proporción muestral ṕ de la proporción