Вы находитесь на странице: 1из 16

Repblica Bolivariana de Venezuela

Ministerio Para del Poder Popular para la Educacin Superior


Universidad Nacional Experimental Politcnico
Antonio Jos de Sucre
Vice-Rectorado Barquisimeto
Departamento de Ing. Industrial

Inferencia Estadstica

Alumno: Jos R Colmenares


C.I.: 18.432.814
Prof.: Eduardo Pinto
Seccin: 03

Barquisimeto; Marzo 2013

MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una poblacin), se selecciona una muestra, entendiendo por tal
una parte representativa de la poblacin.
El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya
funcin bsica es determinar que parte de una poblacin debe examinarse, con la
finalidad de hacer inferencias sobre dicha poblacin.
La muestra debe lograr una representacin adecuada de la poblacin, en la que
se reproduzca de la mejor manera los rasgos esenciales de dicha poblacin que son
importantes para la investigacin. Para que una muestra sea representativa, y por lo
tanto til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, es
decir ejemplificar las caractersticas de sta.
Los errores ms comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la observacin de slo una parte de la
Poblacin, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Poblacin mucho ms grandes de la que
originalmente se tom la muestra. Error de Inferencia. En la estadstica se usa la
palabra poblacin para referirse no slo a personas sino a todos los elementos que han
sido escogidos para su estudio y el trmino muestra se usa para describir una porcin
escogida de la poblacin.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.

I. Muestreo probabilstico
Los mtodos de muestreo probabilsticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen
la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la misma
probabilidad de ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos
aseguran la representatividad de la muestra extrada y son, por tanto, los ms
recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los
siguientes tipos:
1.- Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una
bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para
completar el tamao de muestra requerido. Este procedimiento, atractivo por su
simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos
manejando es muy grande.
2.- Muestreo aleatorio sistemtico:
Este procedimiento exige, como el anterior, numerar todos los elementos de la
poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte
de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que
integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir
se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la
poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como
punto de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se dan periodicidades
en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la poblacin.

Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en


los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo
aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo
mujeres, no podra haber una representacin de los dos sexos.
3.- Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican
los procesos y suelen reducir el error muestral para un tamao dado de la muestra.
Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran
homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo,
segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters
estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarn parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina
afijacin, y puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos
mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la
poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de
modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya
que no se suele conocer la desviacin.

4.- Muestreo aleatorio por conglomerados:


Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades mustrales son
los elementos de la poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido)
y en investigar despus todos los elementos pertenecientes a los conglomerados
elegidos.
II. Mtodos de muestreo no probabilsticos
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales
sobre la poblacin), pues no se tiene certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la poblacin tienen la misma
probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando, en la medida de lo posible, que la muestra sea
representativa. En algunas circunstancias los mtodos estadsticos y epidemiolgicos
permiten resolver los problemas de representatividad aun en situaciones de muestreo
no probabilstico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin.
Entre los mtodos de muestreo no probabilsticos ms utilizados en
investigacin encontramos:

1.- Muestreo por cuotas:


Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos
ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por
tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de
individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de
25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota
se eligen los primeros que se encuentren que cumplan esas caractersticas. Este
mtodo se utiliza mucho en las encuestas de opinin.
2.- Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener
muestras "representativas" mediante la inclusin en la muestra de grupos
supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto.
Tambin puede ser que el investigador seleccione directa e intencionadamente
los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fcil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos).
3.- Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y
as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.

4.- Muestreo Discrecional


A criterio del investigador los elementos son elegidos sobre lo que l cree que
pueden aportar al estudio.
ESTIMACION DE PARAMETROS
El proceso de estimacin en inferencia estadstica puede ser descrito como el proceso
de estimar un parmetro a partir del estadstico correspondiente, tal como usar una
media muestral (Estadstico) para estimar la media poblacional, (parmetro).
La estimacin de parmetros puede ser:

Puntual o Por Punto.

Por Intervalo.

Estimacin Puntual:
Tiene como objetivo dar un valor numrico que aproxime en forma muy cercana
al parmetro poblacional.
La estimacin puntual de un parmetro de una poblacin es un solo valor
numrico de un estadstico que corresponde a este parmetro.
Un estadstico utilizado para aproximar a un parmetro de una poblacin se
denomina Estimador del Parmetro.

El nmero obtenido cuando se evala el

estimador para una muestra particular, se denomina Estimacin del Parmetro.


Sea X una variable aleatoria de inters con distribucin de probabilidad
: Parmetro Desconocido.
: f (x 1 , x 2 , x 3 , , x n)
M.A. de tamao n.

f (x) .

Estimador:
n

Por ejemplo:

1
x
n i=1 i

es un posible estimador de .

= ; = ; =
: Estimador puntual de , porque al evaluarlo para una muestra es concreto, da un
solo nmero o punto.
: Estimacin puntual de .

Propiedades De Los Estimadores Puntuales:

Insesgabilidad

Eficiencia

Consistencia

Estimador Insesgado:
Sea

un estimador puntual de un parmetro , entonces

insesgado si E (

) = de lo contrario se dice que es sesgado

es un estimador

Distribucin muestral de un estimador insesgado.

Distribucin muestral de un estimador sesgado positivamente, para el cual

Eficiencia Relativa:
La eficiencia relativa entre dos estimadores
ECM respectivos ECM (

) y ECM (

de un parmetro , con

) se define como:

Estimador Consistente:
Si
decimos que

es un estimador insesgado de , basado en una M.A. de tamao n,


es consistente para , si:

La consistencia es una propiedad de muestras grandes.

Estimacin Por Intervalo.


Un estimador por intervalo es una regla que especifica un mtodo que utiliza las
mediciones de la muestra para calcular dos nmeros que forman los extremos del
intervalo.
Tiene como objetivo encontrar un estimador por intervalo que genere intervalos
angostos que contengan a (parmetro) con una alta probabilidad.
Los estimadores por intervalo se denominan comnmente intervalos de
confianza.
Un intervalo de confianza de , es un intervalo [L, U] que incluye a con un
grado de certidumbre establecido.
L y U se denominan extremos inferior y superior del intervalo de confianza.
L: Lmite inferior de confianza.
U: Limite de confianza superior.
L, U: Estadsticos (variables aleatorias).
Para construir un estimador por intervalo del parmetro desconocido, debemos
encontrar L y U tal que:
P (L U) = 1
La probabilidad 1 se le llama Coeficiente de Confianza. Usualmente, se
expresa en porcentaje: 100 (1 ) %.
1 es la probabilidad de que el intervalo contenga al parmetro.
0<<1
El intervalo resultante:

LU
Se llama intervalo de confianza del 100 (1 ) % para el parmetro . (Intervalo
de confianza de dos lados).
En ocasiones un intervalo de confianza de un lado podra ser til.
L Intervalo de confianza inferior del 100 (1 ) %.
U Intervalo de confianza superior del 100 (1 ) %
Donde U se elige de modo que:
P ( U) = 1 -

PRUEBAS DE HIPOTESIS DE PARAMETROS


Las secciones anteriores han mostrado cmo puede estimarse un parmetro a
partir de los datos contenidos en una muestra. Puede encontrarse ya sea un slo
nmero (estimador puntual) o un intervalo de valores posibles (intervalo de confianza).
Sin embargo, muchos problemas de ingeniera, ciencia, y administracin, requieren que
se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro.
Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms
tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse
como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros
de una o ms poblaciones.
Es importante recordar que las hiptesis siempre son proposiciones sobre la
poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parmetro de la poblacin especificado en la hiptesis nula se
determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,


entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular
recibe el nombre de prueba hiptesis. Los procedimientos de prueba de hiptesis
dependen del empleo de la informacin contenida en la muestra aleatoria de la
poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye
que sta es verdadera; sin embargo si esta informacin es inconsistente con la
hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o
falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a
menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en
muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de
prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin
equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a
priori).
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a
Ho, y sta generalmente es la hiptesis a investigar. La hiptesis nula se rechaza en

favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa.


Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de
la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de
hiptesis son: Rechazar Ho o No rechazar Ho.
PRUEBAS DE BONDAD DE AJUSTE (CHI-CUADRADO)
PRUEBAS DE BONDAD DE AJUSTE
Estas pruebas permiten verificar que la poblacin de la cual proviene una muestra tiene
una distribucin especificada o supuesta.
Sea

X: variable aleatoria poblacional


f o ( x)

la distribucin (o densidad) de probabilidad especificada o supuesta

para X
Se desea probar la hiptesis:
H o :f ( x )=f o ( x)

En contraste con la hiptesis alterna:


H a : f ( x ) n o=f o ( x ) (negacin de H o )

PRUEBA CHI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea
una muestra aleatoria de tamao n tomada de una poblacin con una distribucin
especificada

f o ( x ) que es de inters verificar.

Suponer que las observaciones de la muestra estn agrupadas en k clases,


siendo

Oi

la cantidad de observaciones en cada clase i = 1, 2,..., k

Con el modelo especificado

f o ( x ) se puede calcular la probabilidad pi que un

dato cualquiera pertenezca a una clase i.


Con este valor de probabilidad se puede encontrar la frecuencia esperada

ei

para la

clase i, es decir, la cantidad de datos que segn el modelo especificado deberan estar
incluidos en la clase i:
e i= pi

; n, i = 1, 2,..., k

Tenemos entonces dos valores de frecuencia para cada clase i


Oi

: Frecuencia observada (corresponde a los datos de la muestra)

ei

: Frecuencia esperada (corresponde al modelo propuesto)

La teora estadstica demuestra que la siguiente variable es apropiada para


realizar una prueba de bondad de ajuste:
Definicin: Estadstico para la prueba de bondad de ajuste Chi-Cuadrado
k

x 2=
i=1

(o ie i)
ei

Distribucin Chi-Cuadrado con =kr1 grados de libertad donde r es la


cantidad de parmetros de la distribucin que deben estimarse a partir de la
muestra.
Es una condicin necesaria para aplicar esta prueba que

CASO PRCTICO

i ,e i 5

1.- Encontrar un intervalo de confianza del 80% para media de una fundicin nodular,
sabiendo que

=4

a partir de una muestra de 8 probetas que dio los siguientes

resultados 9, 14, 10, 12, 7, 13, 11 y 12.


Solucin:
Debemos encontrar el intervalo de confianza, para ello usamos la frmula:

Pero sabemos que

x =

xi
n

x i=(9+14+ 10+12+ 7+13+11+12)


x =

x k /2

as,
= 88; n = 8

88
=11 ; k 0.10 =1.28
8

11 1.28

2
=11 0.9065
8

(10.0935 ; 11.9065)

Una empresa X concluye que su producto (Tubos de acero cdula 40) tendr una vida
til de 10 aos. Se elige una muestra entre los cuales tenemos: 11.8-9.7-10.5-12.113.3-13.4-10.3-8.5-15.0-10.5-7.6-6.3. Teniendo en cuenta una desviacin poblacional
de 1.2 aos. De acuerdo a lo anterior se puede corroborar que la desviacin
poblacional es de 1.2 aos?
Solucin: Debemos corroborar que la desviacin poblacional es de 1.2 aos, para

ellos usamos la frmula

x 2=

( n1 )s 2
2

Datos: =1.2; =10 ; s=2.53 ; n=12; V =11

x 2=

( 121 )2.532
=48.8
1.22

De acuerdo a lo anterior se puede observar que la desviacin poblacional es mayor que


1.2 aos (debido a que el valor de Chi Cuadrado es muy alto y por lo tanto no cae
dentro del intervalo de confianza para una muestra de 12).

Вам также может понравиться