Вы находитесь на странице: 1из 53

INTRODUCCION A LAS PROBABILIDADES

ORIGEN DE LAS PROBABILIDADES


Se remonta al siglo XVIII cuando Antoine Gombauld conocido como el caballero de Mer
quien crey haber descubierto una tcnica infalible para jugar a los dados, con muy
buenos resultados al comienzo, luego empez a perder, situacin que le oblig a
consultar a Blas Pascal y Pierre de Fernat, inicindose as los fundamentos de esta
ciencia.

PROBABILIDAD
La probabilidad es una medida numrica de la certidumbre de que suceder determinado
evento.
Los valores de probabilidad siempre se asignan en una escala de valores entre 0 y 1.
Una probabilidad cercana a cero indica que es difcil que el evento ocurra, una
probabilidad cercana a uno indica que es casi seguro que suceder. Las probabilidades
entre 0 y 1 indican los grados de certeza de que el evento ocurra.

Probabilidad creciente de ocurrencia.

0.5

La ocurrencia del evento


Es igualmente probable o
Improbable
EXPERIMENTO
Cualquier proceso que genere resultados bien definidos.
Proceso que conduce a que ocurra una y solamente una de varias observaciones posibles
EXPERIMENTO

RESULTADO EXPERIMENTAL

Lanzar una moneda

cara - sello

Seleccionar una pieza para inspeccin

defectuosa no defectuosa

Visita de ventas

venta no venta

Tirar un dado

123456

Nota: El concepto de experimento estadstico es diferente al usado en las ciencias de


laboratorio, en las que el investigador supone que cada vez que un experimento se repite
exactamente de la misma manera ocurrir el mismo resultado.
En probabilidad el resultado queda determinado por la casualidad, y aunque el
experimento se repita de la misma manera puede ocurrir un resultado distinto.

ESPACIO MUESTRAL
Es el conjunto de todos los resultados posibles de un experimento
PUNTO MUESTRAL
Cualquier resultado en particular de un experimento. Los elementos del espacio muestral
se llaman puntos muestrales.

S=

cara, sello

S=

defectuoso, no defectuoso

S=

1, 2, 3, 4, 5,6

ASIGNACION DE PROBABILIDADES A RESULTADOS EXPERIMENTALES


REQUISITOS BASICOS DE PROBABILIDADES.
1) P(Ei) es la probabilidad del resultado experimental
0 P(Ei) 1

para todas i

2) La sumatoria de todas las probabilidades de los resultados


experimentales debe ser igual a 1
P(E 1) + P(E2) + + P(En) = 1
Es aceptable para asignar valores probabilsticos para resultados experimentales que
satisfaga ambos requerimientos y resulte en medidas numricas razonables de la
posibilidad de los resultados.
La asignacin de probabilidades se puede realizar con base en los siguientes mtodos:

METODO CLASICO
Si un experimento tiene n resultados posibles, el mtodo clsico asignar una

1
n

probabilidad de

a cada resultado experimental (en el caso del lanzamiento de una

moneda ser entonces correspondiente la probabilidad de obtener el resultado cara o


sello en un intento)
METODO DE FRECUENCIA RELATIVA
Su clculo tiene normalmente un antecedente histrico basado en el nmero de
repeticiones de un suceso similar. (por ejemplo un vendedor que ha visitado 40 clientes y
en esas visitas realiz ventas en 10 de ellas; con base en este mtodo la probabilidad
para su siguiente visita de ventas ser

10
40

para una venta y

30
40

para una no venta).

METODO SUBJETIVO
Es una asignacin de probabilidad realizada por una persona basndose en cualquier
informacin que est disponible, o en su criterio. En este mtodo predomina la
experiencia subjetiva de la persona que toma la decisin.
EVENTO
Conjunto de uno o ms resultados de un experimento.
Ejemplo: El evento de obtener un nmero par al lanzar un dado:
A=

{ 2,4,6 }

PROBABILIDAD DE UN EVENTO
La probabilidad de un evento es igual a la suma de las probabilidades de los puntos
muestrales del evento.
Para el ejemplo anterior la probabilidad de obtener un nmero par al lanzar un dado es
igual a la probabilidad de obtener un 2 ms la probabilidad de obtener un 4 ms la
probabilidad de obtener un 6.

1 1 1 3 1
A= 6 + 6 + 6 = 6 = 2 =0,5

ALGUNAS RELACIONES BASICAS DE PROBABILIDAD


Espacio
muestral

AC

COMPLEMENTO DE UN EVENTO
Para un evento A, el complemento de A es aquel evento que contiene todos los puntos
muestrales no existentes en A.
P(A) + P(AC) = 1
EVENTOS MUTUAMENTE EXCLUYENTES
Se dice que dos o ms eventos son mutuamente excluyentes cuando la ocurrencia de un
evento implica que ninguno de los otros puede ocurrir al mismo tiempo.
LEY ADITIVA
Para dos eventos A y B la unin de los eventos A y B es aquel evento que contiene todos
los puntos muestrales contenidos en A y B.

P(AUB) = P(A) + P(B).


INTERSECCION DE EVENTOS
Para dos eventos A Y B la interseccin de los eventos A y B es aquel evento que tiene
todos los puntos muestrales existentes tanto en A como en B.

LEY ADITIVA PARA INTERSECCION


P(AUB) = P(A) + P(B) P(AnB)

EJEMPLO 1:
A= { 1,2,3 }

B= { 3,4,5 }

P(AUB) = P(1,2,3) + P(3,4,5) P(3) = P(1,2,3,4,5)


EJEMPLO 2:
De 200 estudiantes de estadstica, 160 pasaron el examen parcial y 140 pasaron el
examen final; y 124 estudiantes pasaron ambos.
Consideremos: A = evento de pasar el examen parcial
B = evento de pasar el examen final

P(A) =
P(AnB) =

124
200

160
200

= 0,8

P(B) =

140
=
200

0,7

= 0,62

Despus de revisar las notas, el profesor decidi aprobar a cualquier estudiante que
hubiera pasado por lo menos alguno de los dos exmenes. Cul es la probabilidad de
que un estudiante reciba nota de aprobado en el curso?
P(AUB) = 0,8 + 0,7 0,62 = 0,88

REGLA DE LA MULTIPLICACION
La regla especial de la multiplicacin requiere que dos eventos A y B sean
independientes; dos eventos son independientes si la ocurrencia de uno no altera la
probabilidad de que suceda el otro.

Si dos eventos A y B son independientes la probabilidad de que ocurran A y B se obtiene


multiplicando las dos probabilidades.
P(A y B) = P(A)* P(B)
Si P1, P2, P3Pn son todas las distintas probabilidades de presentacin de n sucesos
independientes, la probabilidad (p) de que ocurran todos estos sucesos en un solo
ensayo, estar dada por el producto de cada suceso.
P = P1*P2*P3.*Pn

DIFERENCIA ENTRE SUCESOS MUTUAMENTE EXCLUYENTES Y SUCESOS


INDEPENDIENTES
a) En el primero se tiene un solo dado, una baraja; en el segundo son dos o mas
dados o barajas
b) En el primero se extrae una sola carta o se obtiene una sola cara, es decir se
espera la presentacin de un suceso, en el segundo espera la presentacin de dos
o ms sucesos.
c) En el primero utilizamos la conjuncin o y en el segundo la conjuncin y.
SUCESOS DEPENDIENTES
Se dice que dos sucesos son dependientes si la ocurrencia o no ocurrencia de un evento
en cualquier prueba afecta la probabilidad de otros eventos en otras pruebas, es decir que
la probabilidad del segundo suceso depende del primer suceso, la del tercero de lo que
haya sucedido en el primero y segundo y as sucesivamente.
PROBABILIDAD CONDICIONAL
Es la probabilidad de que ocurra un evento determinado dado que otro evento ya haya
sucedido.
Regla general de la multiplicacin:

P(AyB) = P(A)*P(BA)

Ejemplo:
Suponga que hay 10 rollos de pelcula fotogrfica en una caja, y se sabe que tres estn
defectuosos; se selecciona uno
La probabilidad de escoger uno defectuoso es de
bueno es de

3
10

y la probabilidad de escoger uno

7
.
10

Despus se elige un segundo rollo de la caja sin devolver el primero; la probabilidad de


que sea defectuoso depende de si el primer rollo seleccionado no fue aceptable.

La probabilidad de que tambin el segundo rollo tenga defectos es:

2
9

Si el primer rollo seleccionado fue defectuoso

3
9

Si el primer rollo seleccionado fue bueno

A la fraccin

2
9

( o bien

3
9

) se le denomina probabilidad condicional, porque su

valor est condicionado por ( o depende ) el primer rollo que se sac de la caja que haya
sido defectuoso o no.
Cul es la probabilidad de escoger un rollo defectuoso, seguido de otro tambin
defectuoso?

P(A) =

2
9

3
10

; El segundo rollo seleccionado es el evento B; por tanto: P(BA) =

porque despus de que el primer rollo seleccionado fue defectuoso solo quedaron 2

en la caja que contena 9. La probabilidad de dos rollos defectuosos es:

P(AyB) = P(A)*P(BA) =

3
10

2
9

6
90

= 0,066.

EJEMPLO:
Una encuesta a ejecutivos se enfoc en su lealtad a la empresa; una de las preguntas
planteadas fue; si otra compaa le hiciera una oferta igual o ligeramente mejor que la de
su puesto actual, permanecera con la empresa, o tomara el otro empleo? Las respuestas
de los 200 ejecutivos se clasificaron en forma cruzada con su tiempo de servicio en la
compaa en la siguiente tabla de contingencias:
TIEMPO DE SERVICIO
LEALTAD
si
permanece
ra
No
permanece
ra

Menos de 1
ao
10

1 a 5 aos

Ms de 10
aos
75

TOTAL

30

6 a 10
aos
5

25

15

10

30

80

35

45

15

105

200

120

Cul es la probabilidad de seleccionar al azar un ejecutivo que sea leal a la empresa (si
permanecera) y que tenga ms de 10 aos de servicio?
Evento A permanencia

120

P(A) = 200

= 0.6

Evento B ejecutivo con ms de 10 aos en la empresa y que se queda

75

P(BA) = 120 =0.625


La probabilidad de que un ejecutivo seleccionado al azar sea uno de los que se quedaran
en la compaa y de los que tienen ms de 10 aos de servicio se determina utilizando la
regla general de multiplicacin

120

P(AyB) = P(A) * P(BA) =( 200

75

)( 120

9000

) = 24000

= 0.375

ESPERANZA
Si P es la probabilidad de xito de un suceso en un solo ensayo, el nmero esperado de
sucesos o la esperanza de ese suceso en n ensayos, estar dado por el producto de n y
la probabilidad de xito

E = np

MEDIA o VALOR ESPERADO


Es el promedio ponderado de los valores posibles de la variable aleatoria para el cual la
funcin de probabilidad proporciona las ponderaciones.

E(x) = = x*P(x)
VARIANZA
La varianza representa el grado de dispersin o de variabilidad de los datos con respecto
a la media.

2 = (x-)2*P(x)

DESVIACION ESTANDAR
La desviacin estndar se determina tomando la raz cuadrada de la varianza, es decir

TALLER DE EVALUACION

1. Una urna contiene 6 bolitas blancas y 4 negras. se extraen dos bolitas


sucesivamente con restitucin.
a) Cul es la probabilidad de que ambas bolitas sean blancas?
b) Cul es la probabilidad de que la primera sea blanca y la segunda
negra?
c) Cual es la probabilidad de que la primera sea negra y la segunda
blanca?
d) Cul es la probabilidad de que ambas sean negras?

2. Un inversionista dispone de 100 millones de pesos para una inversin a un


ao. El inversionista est considerando dos opciones: colocar el dinero en
el mercado de valores, lo que le garantiza una ganancia anual fija de 15%
o un plan de inversin cuya ganancia puede considerarse como una
variable aleatoria cuyos valores dependen de las condiciones econmicas
que prevalezcan. Con base en la historia pasada del segundo plan un
analista muy confiable ha determinado los posibles valores de la ganancia
y calculado sus probabilidades, como se muestra en la siguiente tabla. Con
base en la ganancia esperada Cul de los dos planes debe seleccionar?

Ganancia%

30

25

20

15

10

probabilida
d

0,2

0.2

0,3

0.15

0,1

0.05

3. Consideremos dos proyectos de inversin donde conocemos las


distribuciones de probabilidad de sus valores presentes y aparecen en la
siguiente tabla
Valores presentes(miles de
pesos)

Proyecto1

Proyecto 2

-20

0.1

0.02

-10

0.2

0.15

0.3

0.33

10

0.3

0.4

30

0.1

0.09

50

0.01

Hallar:
Valor esperado
Varianza
Desviacin estndar.
4. Un contratista estima las probabilidades del nmero de das necesarios
para concluir un proyecto.
Tiempo(das
)

probabilidad

0.05

0.20

0.35

0.30

0.10

Hallar el nmero de das esperados para la terminacin


del proyecto

DISTRIBUCIONES DE PROBABILIDAD

Una distribucin de probabilidad indica toda la gama de valores que pueden presentarse
como resultado de un experimento. Una distribucin de probabilidad es semejante a una
distribucin de frecuencias relativas. Sin embargo en vez de describir el pasado, describe
que tan probable es un evento futuro. Por ejemplo un fabricante de medicamentos afirma
que un tratamiento causar la prdida de peso en 80% de la poblacin. Una agencia de
proteccin al consumidor puede probar este medicamento en una muestra de seis
personas. Si la declaracin del fabricante es verdadera es casi imposible tener un
resultado en el que ninguna de las personas de la muestra pierda peso, y es muy
probable que 5 de las seis pierdan peso.
La distribucin de probabilidad muestra todos los resultados posibles de un experimento
y la probabilidad de cada resultado

Cmo se puede generar una distribucin de probabilidad?

Ejemplo:
Suponga que se quiere saber el nmero de caras que se obtienen al lanzar tres veces
una moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres
caras Cul es la distribucin de probabilidad del nmero de caras?
Hay ocho posibles resultados. En el primer lanzamiento puede caer sello, otro sello en el
segundo y otro en el tercero. O puede caer sello, sello y cara en ese orden. A continuacin
se indica todos los resultados posibles.

Lanzamientos de moneda
Resultado
posible

Primero Segundo Tercero

Numero de
caras

SELLO

SELLO

SELLO

SELLO

SELLO

CARA

SELLO

CARA

SELLO

SELLO

CARA

CARA

CARA

SELLO

SELLO

CARA

SELLO

CARA

CARA

CARA

SELLO

CARA

CARA

CARA

Observe que el resultado cero caras se obtuvo solo una vez, una cara apareci tres
veces, dos caras tres veces y el resultado tres caras solo una vez. Es decir cero caras
ocurri en una de ocho veces. De modo que la probabilidad de cero caras es un octavo
(1/8); la de una cara es tres octavos (3/8), y as sucesivamente. La distribucin de
probabilidad se muestra en la siguiente tabla.

probabilidad del resultado


0.4
0.35
0.3

probabilidad del
resultado

0.25
0.2
0.15
0.1
0.05
0
1

En el grafico anterior el valor uno (1) corresponde a cero (0) nmero de caras, el valor dos
(2) a un (1) nmero de caras y as de manera sucesiva el valor cuatro a tres caras.

Conviene recordar algunas definiciones que vamos a trabajar de manera reiterada en


estos temas:

Distribucin de probabilidad: son todos los posibles valores que resultan de un


experimento aleatorio, junto con la probabilidad asociada a cada valor.

Variable aleatoria: Corresponde a una caracterizacin cuantitativa de los resultados que


constituyen un espacio muestral. Cada cantidad o valor es el resultado de un experimento
aleatorio y como tal puede tomar distintos valores.

Variable aleatoria discreta: Se considera as cuando los valores que asume se pueden
contar, y si estos pueden organizarse en una secuencia al igual que los nmeros enteros
positivos. Solo puede asumir un nmero finito de valores.

Variable aleatoria continua. Se da, cuando puede asumir cualquier valor dentro de un
intervalo o en una unin de intervalos. Como ejemplo se podra considerar cualquier

resultado de medicin del ancho, longitud de una cosa, as como el tiempo de realizacin
de una tarea; en estos casos las variables admiten fracciones.

DISTRIBUCION DE PROBABILIDAD BINOMIAL

Es una distribucin de probabilidad discreta. Una caracterstica de dicha distribucin es


que solo hay dos resultados posibles en cada ensayo de un experimento.
Por ejemplo el enunciado de una pregunta del tipo verdadero/falso. Los resultados son
mutuamente excluyentes, lo cual significa, que la respuesta a una pregunta no puede ser
verdadera y falsa al mismo tiempo. Otros ejemplos son: un departamento de control de
calidad clasifica un producto como aceptable o no aceptable, un trabajador es clasificado
como empleado o desempleado y una llamada de venta hace que el cliente compre el
producto o no lo compre. Frecuentemente se clasifican los resultados posibles como
xito o fracaso. Sin embargo esta clasificacin no implica que un resultado sea buena y
el otro malo.
Otra caracterstica de la distribucin binomial es que la variable aleatoria es el resultado
de conteos. Esto es, se cuenta el nmero de xitos en la totalidad de ensayos. Por
ejemplo se lanza cinco veces una moneda y se cuentan el nmero de caras que resultan,
se seleccionan 10 trabajadores y se evala el nmero de ellos que tienen ms de 50 aos
de edad o bien se escogen 20 cajas de cereal y se cuentan las que pesaron ms de lo
que dice en la etiqueta.
Otra caracterstica de esta distribucin es que la probabilidad de un xito sigue siendo la
misma de un ensayo a otro. Ejemplo:
La probabilidad de que se adivine correctamente (xito) la primera pregunta de la prueba
de verdadero/falso es igual a , este es el primer ensayo. La probabilidad en forma
correcta la segunda pregunta (el segundo ensayo) tambin es ; la probabilidad de tener
xito en el tercer ensayo es y as sucesivamente.

La ltima caracterstica de la distribucin de probabilidad binomial es que cada ensayo es


independiente de cualquier otro. Esto significa que los resultados no siguen ningn patrn.
Por ejemplo las respuestas de la prueba de verdadero/falso no figuran como
V,V,V,F,F,F,V,V,V etc.

En resumen la distribucin binomial tiene las siguientes caractersticas:

1. El resultado de cada ensayo de un experimento se clasifica en una de dos


categoras mutuamente excluyentes a saber xito o fracaso.
2. La variable aleatoria cuenta el nmero de xitos en una cantidad fija de ensayos
3. La probabilidad de un xito permanece igual en todos los ensayos. Lo mismo
sucede con la probabilidad de un fracaso
4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo
no afecta el resultado de algn otro.

COMO SE CALCULA?

Para elaborar una distribucin de probabilidad binomial se necesita: (1) el nmero de


ensayos y (2) la probabilidad de xito en cada ensayo. Por ejemplo si un examen al
trmino de un seminario de administracin contiene 20 preguntas de opcin mltiple el
nmero de ensayos es 20. Si cada pregunta tiene cinco opciones y solo una es correcta la
probabilidad de xito en cada ensayo que tiene una persona que desconoce la materia es
de 0.20. de este modo la probabilidad de que una persona sin conocimiento del tema
adivine la respuesta correcta a una pregunta tiene un valor de 0.20. Por tanto se
satisfacen las condiciones descritas para una distribucin binomial.

En los casos en los que es aplicable la distribucin binomial, la formula matemtica para
calcular la probabilidad de cualquier valor de una variable aleatoria, es la funcin de
probabilidad:

F ( x )=

n!
x
n x
p (1 p)
x ! ( nx ) !

Dnde: n = nmero de intentos


p = probabilidad de acierto de un intento
x = nmero de aciertos en n intentos
f(x) = probabilidad de x aciertos en n intentos.

Ejemplo:
Elaboremos una distribucin de probabilidad con el experimento consistente en el
lanzamiento de cuatro monedas, para el cual la variable aleatoria discreta est dada por la
obtencin de exactamente cero, una, dos, tres y cuatro caras (x = 0, 1, 2, 3, 4)

fraccin

decimal

1/16

0.0625

4/16

0.2500

6/16

0.3750

4/16

0.2500

1/16

0.0625

16/16

1.0000

0.4000
0.3500
0.3000
0.2500
0.2000
0.1500
0.1000
0.0500
0.0000

Para encontrar en forma rpida, sin necesidad de hacer clculos engorrosos al aplicar la
frmula:

F ( x )=

n!
x
n x
p (1 p)
x ! ( nx ) !

Podemos hacer uso de la tabla de distribucin binomial como se presenta a continuacin


para n = 8 y p de 0,05 0,10 0,20 0,25 0,30 0,35 0,40 0,45 0,50

Distribucin binomial clculo de la probabilidad para x


p
n x 0.05 0.1

0.15 0.2

0.25 0.3

0.35 0.4

0.45 0.5

.
663
8 0 4

.
430
5

.
272
5

.
167
8

.
100
1

.
057
6

.
031
9

.
016
8

.
008
4

.
003
9

.
279
1 3

.
382
5

.
384
7

.
335
5

.
267
0

.
197
7

.
137
3

.
089
6

.
054
8

.
031
2

2 .
051

.
148

.
237

.
293

.
311

.
296

.
258

.
200

.
156

.
109

.
005
3 4

.
033
1

.
083
9

.
146
8

.
207
6

.
254
1

.
278
6

.
278
7

.
256
8

.
218
8

.
000
4 4

.
004
6

.
018
5

.
045
9

.
086
5

.
136
1

.
187
5

.
232
2

.
262
7

.
273
4

.
000
5 0

.
000
4

.
002
6

.
009
2

.
023
1

.
046
7

.
080
8

.
123
9

.
171
9

.
218
8

.
000
6 0

.
000
0

.
000
2

.
001
1

.
003
8

.
010
0

.
021
7

.
041
3

.
070
3

.
109
4

.
000
7 0

.
000
0

.
000
0

.
000
1

.
000
4

.
001
2

.
003
3

.
007
9

.
016
4

.
031
2

.
000
8 0

.
000
0

.
000
0

.
000
0

.
000
0

.
000
1

.
000
2

.
000
7

.
001
7

.
003
9

Media de la distribucin Binomial:


El valor esperado o esperanza matemtica de la variable aleatoria est dada por:

=np
Varianza de la distribucin binomial:
La varianza de la variable aleatoria es:

2=np ( 1 p )

DISTRIBUCION DE PROBABILIDAD DE POISSON

La distribucin de probabilidad de poisson describe la cantidad de veces que ocurre un


evento en un intervalo determinado. El intervalo puede ser de tiempo, distancia, rea o
volumen. La distribucin se basa en dos supuestos. El primero, es que la probabilidad es
proporcional a la extensin del intervalo. El segundo supuesto es que los intervalos son
independientes. Dicho de otra manera, cuanto mayor sea la magnitud o extensin del
intervalo tanto mayor ser la probabilidad, y el nmero de ocurrencias en un intervalo no
afecta a los otros intervalos. Esta distribucin tambin es una forma lmite de la
distribucin binomial, cuando la probabilidad de xito es muy pequea y n es grande.
La distribucin de probabilidad de poisson es una distribucin de probabilidad discreta
puesto que se forma por conteo.
Esta distribucin tiene muchas aplicaciones. Se utiliza como modelo para describir la
distribucin de errores en la captura de datos; en el nmero de imperfecciones en piezas
de fabricacin; en la cantidad de partes defectuosas en embarques de salida; en el
nmero de clientes que esperan servicio en un restaurante, o en la cantidad de clientes
que hacen fila para entrar a una de las atracciones en un parque de diversiones y tambin
en el nmero de accidentes en una carretera durante un periodo de tres meses.

La distribucin de poisson puede describirse matemticamente utilizando la siguiente


formula:

f ( x )=

e
x!

para = 0, 1, 2, .

Dnde:

= Numero promedio de ocurrencias de un intervalo (np)


e = 2.71828
x = nmero de ocurrencias dentro de un intervalo ( nmero de casos favorables)
f(x) = probabilidad de x ocurrencias en el intervalo

La varianza de la distribucin de poisson tambin es igual a su media. Si por ejemplo la


probabilidad de que sea devuelto un cheque emitido por un banco es 0.0003 y si se
cambian 10.000 cheques el nmero medio de cheques devueltos es 3 que se obtiene por
= np = 10.000(0.0003) = 3

Ejemplo:

Suponga que estamos interesados en el nmero de llegadas a un cajero automtico en un


periodo de 15 minutos en las maanas. Si suponemos que la probabilidad de que llegue
una persona es la misma para cualesquiera de 2 periodos de tiempo de igual duracin, y
que la llegada o no llegada de una persona en cualquier periodo de tiempo es
independiente de la llegada o no llegada en cualquier otro periodo de tiempo, es aplicable
la funcin de probabilidad de poisson. Entonces si suponemos que un anlisis de los
datos histricos muestra que el numero promedio de de personas que llegan durante un
intervalo de 15 minutos es de 10 es aplicable la funcin de distribucin de probabilidad de
poisson con = 10

f ( x )=

10

10 e
x!

Si deseamos saber cul es la probabilidad de 5 llegadas en 15 minutos hacemos x = 5 y


obtendremos:

f ( x )=

105 e10
=0.0378
5!

Aunque determinamos esta probabilidad evaluando la funcin de probabilidad mediante la


aplicacin de la formula a menudo resulta ms sencillo usar las tablas de distribucin de
probabilidad de poisson. Estas tablas proporcionan probabilidades para valores
especficos de x y de .

DISTRIBUCION DE PROBABILIDAD NORMAL

Quiz la distribucin de probabilidad ms importante utilizada para describir una variable


aleatoria continua es la distribucin de probabilidad normal; es aplicable a gran
cantidad de situaciones de problemas prcticos. Su funcin de densidad de probabilidad
tiene la forma de una curva en forma de campana.
La forma matemtica de la funcin de probabilidad de la distribucin normal es:

f ( x )=

1
(x) /2
e
2
2

Para < x <

= valor medio o esperado de la variable aleatoria x.

2= Varianza de la variable aleatoria x


= desviacin estndar de la variable aleatoria x
= 3.14159
e = 2.71828

Caractersticas:

1. La curva normal es acampanada y presenta un solo pico en el centro de la


distribucin. La media aritmtica, la mediana y la moda de la distribucin son
iguales y estn localizadas en el pico. De esta forma la mitad del rea bajo la
curva se encuentra por arriba de este punto central, y la otra mitad por abajo.

2. La distribucin de probabilidad normal es simtrica con respecto a su media. Si se


corta la curva normal verticalmente en este valor central, ambas mitades sern
como imgenes en el espejo.
3. La curva normal decrece uniformemente en ambas direcciones a partir del valor
central. Es asinttica, esto significa que la curva se acerca cada vez ms al eje X,
pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva se
extienden indefinidamente en ambas direcciones.
No existe solo una distribucin de probabilidad normal, sino que hay una familia de ellas.
Existe una distribucin de probabilidad normal para los aos de servicio en una empresa,
en la que la media es 20 aos y la desviacin es 3.1 aos. Existe otra distribucin de
probabilidad normal de los aos de servicio de otra empresa en la cual =20 y =3.9.

DISTRIBUCION DE PROBABILIDAD NORMAL ESTANDAR

Hay una familia de distribuciones normales. Cada distribucin puede tener una media ()
o desviacin estndar () diferentes. Por tanto el nmero de distribuciones normales es
ilimitado. Sera imposible proporcionar una tabla de probabilidades (como para las
distribuciones binomial y poisson) para cada combinacin de y . Por fortuna se puede
utilizar, en todos los casos en los que la distribucin normal es aplicable, un miembro de la
familia de distribuciones normales que tiene una media 0 y una desviacin estndar 1
denominado distribucin normal estndar. Cualquier distribucin normal puede
convertirse en una distribucin normal estndar restando a la media de cada
observacin, y dividiendo entre la desviacin estndar.
Primero se convierte o se estandariza, la distribucin que se tiene, en la distribucin
normal estndar utilizando el valor z (tambin denominado puntuacin z, valor estadstico,
desviacin normal estndar o simplemente desviacin normal).

Valor z diferencia entre un valor elegido, denotado por X, y la media , dividida entre la
desviacin estndar, .

Por tanto un valor z es la distancia a la media, medida en unidades de la desviacin


estndar.

Expresado en una frmula:

z=

Valor normal estndar

Dnde:
x es el valor de cualquier medida u observacin especifica
es la media de la distribucin
es la desviacin estndar de la distribucin.

Como se observa en la definicin anterior un valor z mide la distancia entre un valor


especfico x y la media aritmtica en unidades de desviacin estndar. Al determinar el
valor z mediante la frmula se puede obtener el rea o la probabilidad bajo cualquier
curva normal recurriendo a las tablas diseadas para el efecto.

Para explicar lo anterior suponga que el valor calculado para z es 1.91 Cul es el rea
bajo la curva normal entre la media y X ? En la tabla siguiente se reproduce una parte
de la tabla para una distribucin de probabilidad normal que ilustra el ejemplo.

La columna izquierda de la tabla encabezada por la letra z se recorre hacia abajo hasta
encontrar el 1.9. Despus se desplaza horizontalmente hacia la derecha se lee la
probabilidad bajo la columna encabezada con 0.01. La probabilidad es de 0.4719. Esto
significa que 47.19% del rea bajo la curva normal estndar se encuentra entre la media y
el valor X de 1.91 desviaciones estndar despus de la media. Esta es la probabilidad de
que una observacin se encuentre entre 0 y 1.91 desviaciones estndar despus de la
media.

0.00

0.01 0.02 0.03 0.04 0.05

0.4332

0.43 0.43 0.43 0.43 0.43


45
57
70
82
94

0.4452

0.44 0.44 0.44 0.44 0.45


63
74
84
95
05

1.7

0.4554

0.45 0.45 0.45 0.45 0.45


64
73
82
91
99

1.8

0.4641

0.46 0.46 0.46 0.46 0.46


49
56
64
71
78

0.4713

0.47 0.47 0.47 0.47 0.47


19
26
32
38
44

1.5
1.6

1.9

reas bajo la curva normal

Se consideran tres reas bajo la curva normal que sern muy utilizadas:

1. Aproximadamente 68% del rea bajo la curva normal esta entre la media ms una
y menos una desviaciones estndar se expresa 1
2. Alrededor de 95% del rea bajo la curva normal est entre la media ms dos y
menos de dos desviaciones estndar lo que se expresa 2
3. Prcticamente toda el rea bajo la curva normal est entre la media y tres
desviaciones estndar (a uno y otro lados del centro) es decir 3

Ejemplo:

Una prueba del tiempo de vida til de bateras alcalinas tipo D revelo que su tiempo medio
de vida es de 19 horas (h). La distribucin de los tiempos de vida se aproxima a una
distribucin normal. La desviacin estndar de la distribucin es 1.2 h.

1. Entre que par de valores falla alrededor de 68% de las bateras?


2. Entre que par de valores falla aproximadamente 95% de las bateras?
3. Entre que par de valores fallan prcticamente todas las bateras?
Para responder a estas preguntas se pueden utilizar los resultados de la regla emprica.

1. Aproximadamente 68% de las bateras falla entre 17.8 y 20.2 horas, valores
obtenidos de 19.0 1(1.2)h
2. Alrededor de 95% de las bateras falla entre 16.6 y 21.4 horas que se obtiene de
19.0 2(1.2)h
3. Prcticamente todas las bateras fallan entre 15.4 y 22.6 horas que se obtiene de
19.0 3(1.2)h.

TALLER DE EVALUACION
1. Se estima que una de cada 10.000 personas es alrgica a cierta sustancia
utilizada en la fabricacin de tintes para el cabello. Cul es la probabilidad
de que en 20.000 usuarios de tintes, mas de 5 sufran reacciones alrgicas
debido a su uso.
2. Si un jugador que al batear tiene un promedio de 0.40 llega a batear 5
veces en un juego Cul es la probabilidad de que obtenga:
a) Exactamente 2 golpes?
b) Menos de dos golpes?
3. Un estudio ha mostrado que en un cierto barrio el 60% de los hogares
tienen al menos dos televisores; se elige al azar una muestra de 50
hogares en el citado barrio.
Se pide calcular la probabilidad de que al menos 20 de los citados hogares
tengan cuando menos dos (2) televisores
4. Un banco tiene unos clientes de crdito hipotecario cuyos das en mora se
distribuyen normalmente con media de 420 das y desviacin estndar de
18 das. El 7,49% de los clientes de menor mora sern refinanciados Cul

es el mximo nmero de das en mora que deber tener un cliente para


que este sea financiado?
5. Un contratista estima el costo de ejecutar un contrato como una variable
aleatoria normal de media $500 millones y desviacin estndar $50
millones Cul es la probabilidad de que el costo de ejecutar el contrato
est entre $460 millones y $540 millones?

NOCIONES DE MUESTREO

El muestreo es un mtodo cientfico que utiliza principios matemticos y estadsticos para


la adecuada seleccin de una muestra y manejo de la informacin obtenida a partir de
ella, para as tener estimaciones confiables. El muestreo consiste en la seleccin de una
parte de la poblacin, de tal manera que sta parte represente adecuadamente la
poblacin.
CONCEPTOS GENERALES
Muestra. Es un subconjunto de una poblacin. Este subconjunto debe ser representativo
de la poblacin que se seleccion.
Para que una muestra sea aceptable es necesario que sea representativa de la poblacin,
que tenga una confiabilidad susceptible de medicin y que responda a un plan prctico y
eficaz.
Para que la muestra represente apropiadamente a la poblacin, se debe atribuir a cada
unidad una probabilidad conocida de ser elegida, la que debe ser siempre distinta de cero.

Poblacin. Cualquier conjunto de unidades o elementos claramente definido para el que


se obtienen las estimaciones. Cuando se va a hacer una investigacin se debe tener muy
claro cul es su cobertura o alcance para as mismo definir la poblacin.
Unidad de anlisis o elemento de muestreo es el objeto en el cual se toman las
mediciones. Estas unidades pueden ser personas, familias, fincas, empresas, tarjetas,
etc.
Unidades de muestreo "son colecciones no traslapadas de elementos de la poblacin
que cubren la poblacin completa" 1 es decir que no debe haber interseccin entre una
unidad y otra, por lo tanto, cada elemento de muestreo puede pertenecer a slo una
unidad de muestreo. Estas unidades pueden ser manzanas de barrios, barrios, familias,
fincas, parcelas, sectores, etc.. Si cada unidad de muestreo contiene un solo elemento,
entonces la unidad de muestreo y el elemento de muestreo son iguales.

Marco de muestreo es un listado o mapa que contiene todas las unidades de muestreo y
por consiguiente cubre a toda la poblacin.
Error de muestreo Un error en estadstica es la diferencia entre el valor de un estimador
y el del parmetro correspondiente. Existen varias causas para producir estos errores.
Segn la causa son clasificados en errores de muestreo y de no muestreo.
El error de no muestreo puede ocurrir en cualquier encuesta, sea un censo o una
muestra. Estos errores comprenden errores sistemticos y equivocaciones.
Los factores que causan error sistemtico son: falta de definicin clara de la poblacin,
inadecuada elaboracin del marco de muestreo, falta de definicin del cuestionario, vaga
concepcin de la informacin deseada, mtodos imprecisos de entrevistas.
Surgen errores por equivocacin cuando las respuestas son anotadas en lugares
equivocados, cuando los entrevistados no responden, dan respuestas incorrectas o
inapropiadas y cuando se hacen clculos y anotaciones incorrectas al procesar los datos.
"Los errores de no muestreo pueden ser controlados mediante una atencin cuidadosa en
la construccin de los cuestionarios y en los detalles del trabajo de campo"1. Estos errores
en las encuestas pueden ser minimizados as: la no respuesta con un plan para hacer reentrevistas a los elementos muestreados, con recompensas e incentivos para quien
responde y entrevistadores adiestrados; la respuesta incorrecta se puede corregir si los
cuestionarios despus de diligenciados son revisados por alguien diferente al
encuestador.
Los errores de muestreo son resultado de la eleccin casual de unidades de muestreo.
Este tipo de error ocurre porque solo se observa una parte de la poblacin; as que si se
hace un censo, puede esperarse que desaparezca el error de muestreo.
Ventajas del muestreo. Hay dos formas de estudiar las poblaciones: por censo o por
muestreo. En el censo se analizan todos y cada una uno de los elementos de una
poblacin y en el muestreo se analiza una parte de la poblacin.
Las principales ventajas del muestreo comparadas con el censo son:
a. Costo reducido. Si la informacin se obtienen nicamente para una parte de la
poblacin, los gastos son menores que los se tendran si se realiza un censo.
b. Mayor rapidez. La informacin puede ser recolectada y procesada ms rpidamente
cuando se selecciona una muestra que cuando se realiza un censo.
c. Mayor exactitud. Cuando los errores ajenos al muestreo son necesariamente grandes,
una muestra puede dar mejores resultados que un censo, ya que esos errores se
controlan con ms facilidad si la operacin es de pequea escala. Como el volumen de
trabajo se reduce, se puede emplear personal calificado y realizar una supervisin

cuidadosa del trabajo de campo y del procesamiento de la informacin, reduciendo as los


errores de no muestreo.
d. Posibilidad de hacerse. En la industria algunas pruebas son destructivas, por lo tanto,
ciertas investigaciones slo pueden realizarse con una muestra de productos. Por
ejemplo, un estudio sobre la duracin de los bombillos o la resistencia de cualquier
material.
Muestreo Aleatorio Simple. (M.A.S) Si de una poblacin de tamao N se selecciona
una muestra de tamao n, de tal manera que cada muestra posible de tamao n tenga la
misma probabilidad de ser seleccionada, el tipo de muestreo utilizado se llama Muestreo
Aleatorio Simple.
En la prctica, una muestra aleatoria simple es seleccionada unidad por unidad. Las
unidades de muestreo son numeradas de 1 a N, a continuacin se seleccionan n nmeros
entre 1 y N, ya sea utilizando una tabla de nmeros aleatorios o colocando los N nmeros
en una urna y las unidades de muestreo que lleven los nmeros seleccionados
constituirn la muestra. La muestra se selecciona sin repeticin o sin sustitucin, es decir,
que cada unidad de muestreo solo puede aparecer una sola vez en una muestra
determinada.
Este tipo de muestreo se utiliza cuando: la poblacin es ms o menos homognea con
respecto a las caractersticas que se desean estudiar; cuando los elementos de la
poblacin no se pueden enumerar fcilmente; cuando las estimaciones que se deben
obtener se refieren a todo el conjunto y no a subgrupos de la poblacin.
Cuando se selecciona una muestra el objetivo es tener estimaciones para los parmetros
a travs de la informacin suministrada por la muestra.
Muestreo Aleatorio Estratificado. (MAE) El muestreo aleatorio estratificado (MAE)
consiste en clasificar primero los elementos de la poblacin en grupos que no presenten
traslapes o intersecciones, y de estos grupos o estratos seleccionar una muestra
irrestricta aleatoria, tomando al menos un elemento de cada grupo o estrato.
El proceso que se sigue para establecer los grupos se conoce como estratificacin. Al
formar los estratos se debe buscar que los elementos de cada estrato sean lo ms
homogneos entre s y que haya marcadas diferencias entre un estrato y otro. Estos
estratos pueden reflejar regiones geogrficas de un pas, clases sociales dentro de una
ciudad, etc.
Cuando se utiliza el muestreo aleatorio estratificado las probabilidades de seleccin de un
grupo al otro pueden ser iguales o diferentes, aunque se debe conocer la probabilidad de
seleccin que corresponde a cada uno. Las muestras se seleccionan separadamente para
cada estrato y las estimaciones se realizan separadamente para cada estrato y se
ponderan para obtener una estimacin combinada para la poblacin.

El utilizar muestreo estratificado tiene sus ventajas como son: aumento en la exactitud de
los resultados, reduciendo el error de muestreo y permite obtener estimaciones para cada
estrato. A cambio de lo anterior, se necesita ms informacin que en MAS. para definir los
estratos y el clculo de los errores es ms complejo que en MAS.

CONSIDERACIONES PARA LA SELECCIN DE UNA MUESTRA.


1. Se debe seguir un diseo estadstico (Muestreo Aleatorio Simple, Muestreo
Aleatorio Estratificado). El mejor es el que muestra la precisin necesaria en
trminos de un limite en cuanto al error de estimacin a un menor costo.
2. La seleccin de los elementos al azar para luego recolectar la informacin por
cualquiera de los mtodos: (Entrevista, Correo, Observacion directa, telfono etc)
3. El error muestral. Es decir la diferencia entre el resultado obtenido mediante la
muestra y el obtenido mediante la investigacin total o censo.
Parametro: Son las medidas descriptivas numricas aplicadas a las caractersticas de la
poblacin ( valores estadsticos de la poblacin.
Estimador puntual: son las medidas descriptivas numricas aplicadas a las caractersticas
de las unidades de muestra
Estimador por intervalos: Es la estimacin del parmetro mediante la especificacin de un
intervalo de valores determinado por un limite inferior y otro superior (limites de confianza)
dentro del cual estar el parmetro poblacional.
Intervalo de confianza: corresponde a un intervalo de valores dentro de los cuales se
espera que este el parmetro, con cierto grado de confianza o con riesgo de error
conocido.
DISTRIBUCION DE LAS MEDIAS MUESTRALES
Las estimaciones que tienen la propiedad de que sus valores esperados sean iguales a
los valores poblacionales se denominan estimaciones insesgadas. En el Muestreo
Aleatorio Simple (MAS) la media muestral es una estimacin insesgada del promedio
poblacional.
Las muestras tienden a dar estimaciones relativamente ms confiables, es decir se
aproximan ms al valor verdadero, a medida que aumenta el tamao de la muestra. La
concentracin cada vez mayor de las estimaciones muestrales alrededor del valor
verdadero a medida que aumenta el tamao de la muestra, es lo que se conoce como la
consistencia del estimador.

Supongamos una poblacin N=5 o sea de 5 elementos cuyos elementos (valores) son: 7,
3, 5, 8, 2,
Calculamos

xi
= N = 5

( xi)2
N

= 5.2

= 5.2 =2.28
El nmero de muestras posibles de tamao 2 seleccionadas sin reposicion corresponde a
10 muestras.
Los valores de las medias aritmticas de cada una de ls muestras encontradas son los
siguientes:

7 +3
=5
2
7 +5
=6
2
7 +8
=7.5
2
7 +2
=4.5
2
3+ 5
=4
2
3+ 8
=5.5
2
3+ 2
=2.5
2
5+ 8
=6.5
2
5+ 2
=3.5
2

8+2
=5
2
Al calcular la media aritmtica del total de las medias muestrales el resultado obtenido es
el valor de la media de la poblacin, con lo cual podemos afirmar lo siguiente:

TEOREMA DEL LIMITE CENTRAL.


Si de una poblacin, se extraen muestras aleatorias de tamao constante n la distribucin
de las medias muestrales es una distribucin normal; la media aritmtica de la distribucin
es igual a la media de la poblacin, y la varianza de las muestras ser igual a

2
n

LEY DE LOS GRANDES NUMEROS


Si se extraen de cualquier poblacin muestras aleatorias de tamao constante n, a
medida que n aumenta, la distribucin de las medias de las muestras se aproxima cada
vez mas a una distribucin normal, la media de las distribucin de las medias es igual a la
media de la poblacin y la varianza de las medias ser igual a

2
n

En conclusin:
La distribucin de las medias tiende a ser normal
La media de las muestras es igual a la media de la poblacin
Si la estimacin del valor de la media se basa en una sola muestra de tamao n, la
aproximacin ser tanto mas cercana, cuanto mayor sea el valor de n.
El error estndar =

que es el valor de la desviacin estndar de las medias de

las muestras. Cuanto mas pequeo sea el error estndar mas representativa es la media
muestral. En general, el error estndar es utilizado principalmente para cuantificar la
dispersin del estimador obtenido.
El intervalo de confianza para la media es:

p(-zs<<+zs) = 1

Si la muestra es grande (n> 30), Z pertenece a una distribucin normal y si la muestra es


pequea (n < 30), Z pertenece a una distribucin t con n-1 grados de libertad.

EJEMPLO
Se desea estimar el promedio de hectreas destinadas al cultivo de caf; para ello se
toma una muestra aleatoria de 15 fincas de un total de 750 en el departamento de
Caldas, obtenindose los siguientes resultados en hectreas sembradas en caf:

FINCA

Has. CAF

FINCA

Has. CAF

FINCA

Has. CAF

12

10

11

15

15

12

12

25

11

13

10

30

24

14

19

22

10

18

15

22

Una vez estimado el promedio obtenga un intervalo de confianza para el promedio.


Solucin:
El promedio se obtiene:

251
=16.733
15

La desviacin estndar para el promedio se obtiene con la frmula, pero para aplicarla se
necesita la varianza corregida.

Los anteriores resultados quieren decir que en el departamento de Caldas el promedio de


hectreas sembradas en caf por finca es de 16,73 con un margen de error de 1,74
hectreas.
El intervalo de confianza para el promedio se obtiene teniendo en cuenta que la muestra
es pequea, el valor de Z se halla en una tabla de la distribucin t con 14 grados de
libertad, que para una confiabilidad del 95 por ciento es de 2,145.

Esto quiere decir que con una confiabilidad del 95 por ciento, el promedio de hectreas
cultivadas en caf por finca en el departamento de Caldas, est entre 13 y 20,47.

DETERMINACION DEL TAMAO DE LA MUESTRA


Cuando deseamos estimar el tamao de la muestra se deben tener en cuenta que los
objetivos de la encuesta suelen requerir varias estadsticas y que al considerar cada una
de ellas pueden llevar a un diseo diferente, por lo tanto, para determinar el tamao de la
muestra se debe elegir el principal objetivo y calcular el tamao de muestra necesario
para cumplir dicho objetivo. En caso de ser varios los objetivos principales se determina
un tamao de muestra para cumplir cada objetivo y entre todos ellos, se elige el mayor.
El tamao de la muestra depende bsicamente del tamao de la poblacin, del nivel de
confianza o confiabilidad de las estimaciones, del grado de variacin o dispersin de la
variable a estudiar y del error de estimacin.
El nivel de confianza o confiabilidad lo fija arbitrariamente quien est calculando el tamao
de la muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y el
noventa y nueve por ciento. A mayor confiabilidad mayor tamao de muestra.
El grado de variacin o dispersin de la variable se mide a travs de la desviacin
estndar, la cual puede ser estimada a partir de una muestra piloto o a partir de la
informacin recopilada en una investigacin similar, realizada anteriormente.
El error de estimacin es la mxima diferencia en valor absoluto, que se est dispuesto a
aceptar, entre el valor del estimador y el valor del parmetro, a ste error de estimacin se
le nota como E. El valor del error de estimacin depende del estimador que se desee
obtener y de la magnitud de la variable. Por ejemplo si se va a estimar la proporcin de
desempleados, un error de estimacin lgico puede ser del 3 por ciento; pero si se va a
estimar el peso promedio de un grupo de estudiantes, un error de estimacin lgico puede
ser de 7 kilos. A mayor error de estimacin menor tamao de muestra.

Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una frmula
diferente para calcular el tamao de la muestra.
Tamao de la muestra para la media poblacional para poblaciones infinitas:

n=

Z
E

E = es el margen de error que se puede aceptar al nivel de confianza dado.


Z = es el nivel de confianza que se usa
= desviacin estndar de la poblacin (una estimacin)
Cuando no se conoce la desviacin estndar de la poblacin es necesario buscar un valor
preliminar o un valor de planeacin. Se puede optar en la practica por:
Usar una desviacin estndar muestral de muestras previas.
Usar un estudio piloto para seleccionar una muestra preliminar de unidades
Usar el juicio o una mejor estimacin

Tamao de la muestra para la media poblacional para poblaciones finitas:

n=

Z
E
2 2
1 Z s
1+ ( 2 )
N E

DISTRIBUCION MUESTRAL DE LA PROPORCION


En el anlisis de una caracterstica cualitativa o atributo se emplea la proporcin de xitos
y no el numero de xitos como en la distribucin binomial.

numero de casos favorables o exitos


total de casos posibles

p=

Antes

Ahora en vez de expresar la variable en trminos de xitos nos referiremos al numero de


atributos en la muestra (a) y lo dividimos por el tamao de la muestra (n).

numero de exitos

P = tama o de la muestra

a = ai = np

P=

Si lo trasladamos a la poblacion

A
N

A= Ai = NP

P es la proporcin de elementos que presenta la caracterstica en la poblacin; (1 P) es


la proporcin de elementos que no presenta la caracterstica en la poblacin.
p = varianza de la proporcin de la poblacin p = P(1 P)
= desviacin estndar =

P = 2 P (1P)

TAMAO DE LA MUESTRA
Para determinar el tamao de la muestra es necesario identificar los siguientes
componentes:
La varianza (x) que corresponde al grado de variabilidad que presentan las unidades de
la poblacin. Mientras mas grande sea x mayor ser el tamao de la muestra. El valor
de x supuestamente es conocido, de lo contrario se debe estimar a travs de una
investigacin preliminar. En el caso de p = P(1 P) sucede algo similar pero se tiene la
costumbre de tomar P = 0,50 con lo cual se obtiene el mximo valor posible de n.
Nivel de confianza. Tiene relacin directa con el tamao de la muestra, por lo tanto se dir
que a mayor nivel de confianza, mas grande debe ser el tamao de la muestra. Los
valores de Z se obtienen mediante el uso de tablas. El nivel es fijado por el investigador
con base en su experiencia.
Precisin de la estimacin: corresponde al margen de error que el investigador fija de
acuerdo al conocimiento que tenga acerca del parmetro que piensa estimar. Se le
conoce como error de muestreo (E) siendo:

E=Z

N n
N 1

E=Z

n
2

Tamao de la muestra para la proporcin poblacional para poblaciones infinitas:

n =

Z P (1P)
E

E = error muestral
Z = el nivel de confianza
P = el valor de la proporcin de la poblacin
El valor de planeacin de la proporcin de la poblacin se puede elegir mediante:
Usar una proporcin muestral de una muestra anterior
Llevar a cabo un estudio piloto
Usar el juicio o un estimado mejor del valor de P
Usar P = 0.50
Tamao de la muestra para la proporcin poblacional para poblaciones finitas:

n=

Z P (1P)
E
2
N1 1 Z P ( 1P )
+
N
N
E

TALLER DE EVALUACION

1. Un estudiante de administracin quiere determinar el ingreso medio mensual de


los miembros del consejo de la ciudad. El error al estimar la media debe sr inferior
a $ 100 con un nivel de confianza de 95%. El estudiante encontr un informe de la
secretara de trabajo en el que se estim que la desviacin estndar era $ 1000
de que tamao deber ser la muestra? si el estudiante quisiera aumentar el
nivel de confianza a 99% de que tamao debe ser la muestra?
2. Se quiere estimar la proporcin de barrios que tienen vigilancia privada. Se quiere
que la estimacin este dentro del 0,1 de la proporcin poblacional, el nivel de
confianza deseado es 90% y no se cuentaq con una estimacin de la proporcin
poblacional de que tamao deber ser la muestra?
3. Se estima que la desviacin estndar de una poblacin es 10 se quiere estimar la
media poblacional con un error mximo de 2, y con un nivel de confianza de 95%.
De que tamao deber se la muestra?
4. Se quiere hacer una encuesta para determinar el nmero medio de horas que un
ejecutivo ve televisin. Un estudio piloto indica que la media semanal es 12 horas
con 3 horas de desviacin estndar. Se desea que el error mximo al estimar la
cantidad media sea un cuarto de hora; se quiere un nivel de confianza de 95%
Cuntos ejecutivos habr que entrevistar?
5. Suponga que el alcalde quiere una estimacin de la proporcin de la poblacin
que apoya la propuesta respecto al control de armas de fuego. El alcalde desea
que la estimacin este dentro de 0.04 de la verdadera proporcin. Use un nivel de

confianza de 95%. El asesor del alcalde estima que la proporcin que apoya su
propuesta deber ser 0.60.
a) De que tamao deber ser la muestra?
b) De que tamao debera ser la muestra si no se contara con ninguna estimacin
de la proporcin que apoya la propuesta del alcalde?

CONCEPTO DE INTERVALO DE CONFIANZA.


En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del
parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes
son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal
Estndar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa
computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( ,
cumple:

), entonces el 95% de las veces se

Despejando

en la ecuacin se tiene:

El resultado es un intervalo que incluye al


de confianza al 95% para la media

el 95% de las veces. Es decir, es un intervalo

cuando la variable X es normal y

es conocido.

II- Intervalo de confianza para un promedio:


Generalmente, cuando se quiere construir un intervalo de confianza para la media
poblacional , la varianza poblacional
es desconocida, por lo que el intervalo para
construido al final de II es muy poco prctico.
Si en el intervalo se reemplaza la desviacin estndar poblacional
estndar muestral s, el intervalo de confianza toma la forma:

por la desviacin

La cual es una buena aproximacin para el intervalo de confianza de 95% para con
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea
grande.

Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de
depresin (mayor puntaje significa mayor depresin).
2
5
6
8
8
9
9
10
11
11
11
13
13
14
14
14
14
14
14
15
15
16
16
16
16
16
16
16
16
17
17
17
18
18
18
19
19
19
19
19
19
19
19
20
20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos
que los datos tienen distribucin normal, con varianza poblacional

desconocida.

Como
es desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza
aproximado es:

Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje promedio


poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
Intervalo de Confianza para una Proporcin.
En este caso, interesa construir un intervalo de confianza para una proporcin o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensin,
fumadoras, etc.)
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o


sea, es el parmetro de inters) y p es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo
de 95% de confianza para la proporcin poblacional p.

Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres
mayores de 15 aos en la Regin Metropolitana, se encontr que el 17.6% eran
hipertensas. Un intervalo de 95% de confianza para la proporcin de mujeres hipertensas
en la Regin Metropolitana est dado por:

Luego, la proporcin de hipertensas vara entre (0,139 , 0,212) con una confianza de 95%.

PRUEBAS DE HIPOTESIS1

Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de una


poblacin determinada. Este supuesto debe comprobarse con la informacin suministrada
por una muestra aleatoria obtenida de dicha poblacin.
Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben ser
mutuamente excluyentes; una es la hiptesis nula que se nota como H0 y la otra es la
hiptesis alternativa que se nota como H1 .
Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesis
nula o se rechace. Si se rechaza la hiptesis nula (H0 ) se acepta hiptesis alternativa
(H1 ). Para establecer esta regla de decisin la distribucin de probabilidad se divide en
dos categoras mutuamente excluyentes: la que lleva al rechazo de H0 , es decir est en la
zona de rechazo y la que lleva al no rechazo de H0 , es decir, est en la zona de no
rechazo.
Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba
de hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0 ) es en
realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes
con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se
llama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiramos
una accin errnea, se puede definir el nivel de significancia como la probabilidad de
decidirnos por H1 dado que H0 es verdadera.
Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama
ERROR TIPO II.

FORMULACION DE HIPOTESIS
El primer paso en la prueba de hiptesis es el planteamiento de las hiptesis, lo que en
algunos casos no es una tarea fcil.
Hay tres tipos de hiptesis, a saber:
- Prueba de hiptesis a dos colas
H0: = k
H1:

- Prueba de hiptesis a una cola superior


H0 : = k

H0:

H1 : > k

H1 : > k

- Prueba de hiptesis a una cola inferior


H0 : = k

H0 :

H1 : < k

H1 : < k

Ntese que las hiptesis siempre se plantean para un parmetro .


Una vez establecidas las hiptesis, se selecciona el nivel de significancia o mrgen de
error ( ) el que generalmente se fija entre el uno y el diez por ciento.
El tercer paso es la estadstica a probar o estadstica de trabajo, la cual depende de la
distribucin en el muestreo del estimador con el que se est trabajando y de los
supuestos correspondientes a la poblacin y al tamao de la muestra. Cuando se realizan
los clculos siempre se supone que la hiptesis nula (H0) es cierta.
El cuarto paso es establecer la regla de decisin, la cual depende de la distribucin de
probabilidad de la estadstica a probar, del nivel de significancia ( ) y de la hiptesis
alternativa (H1).
Finalmente se toma la decisin de no rechazar la hiptesis nula o rechazarla.

PRUEBA DE HIPOTESIS PARA LA MEDIA


El promedio aritmtico poblacional es un indicador muy importante, por lo tanto, frecuentemente
se desea probar si dicho promedio ha permanecido igual, ha aumentado o ha disminudo. A
travs de la prueba de hiptesis se determina si la media poblacional es significativamente
mayor o menor que algn valor supuesto.

Hiptesis
Se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 : = k
H1 :

- Prueba de hiptesis a una cola superior


H0 : = k

H0 :

H1 : >k

H1 : > k

- Prueba de hiptesis a una cola inferior


H0 : = k

H0 :

H1 : < k

H1 : < k

En las distribuciones en el muestreo se vio que para el caso de la media, hay tres
situaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestos
de la poblacin y del tamao de la muestra.
Prueba de hiptesis para la media si la poblacin de donde se obtiene la muestra
tiene distribucin normal con

conocida.

La estadstica de trabajo a usar corresponde a la expresin

Dnde:

es el valor que se est suponiendo en la hiptesis nula (H0).

REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de
hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes
iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la
figura

Regla de decisin para una prueba de hiptesis a dos colas.


y

pertenecen a una distribucin normal estndar. Si el valor de la estadstica de

trabajo (Zx) est entre


y
no se rechaza la hiptesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1. Es decir:

- Si se ha planteado la hiptesis alternativa como:


H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura

Regla de decisin para una prueba de hiptesis a una cola superior.


pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo
(Zx) es menor que
no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1. Es decir,

Si se ha planteado la hiptesis alternativa como:


H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura

Regla de decisin para una prueba de hiptesis a una cola inferior.


Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo
(Zx) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1. Es decir,

EJEMPLO
Un proceso manufacturero usado por una fbrica durante los ltimos aos da una
produccin media de 100 unidades por hora con una desviacin estndar de 8 unidades.
Se acaba de introducir en el mercado una nueva mquina para realizar ese tipo de
producto. Aunque es muy cara comparada con la que est ahora en uso, si la media de
produccin de la nueva mquina es de ms de 150 unidades por hora, su adopcin dara
bastantes beneficios.
Para decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se le
permite hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades por
hora. Con sta informacin qu decisin se debe tomar si se asume un nivel de confianza
del 99 por ciento.

Solucin.

Segn el enunciado, solo se compra la mquina si la produccin es de mas de 150


unidades por hora, por lo tanto las hiptesis son:
H0 : = 150
H1 : > 150
Para elegir la estadstica de trabajo se tiene en cuenta que se conoce la varianza
poblacional, por lo tanto se usa la expresin:

por el planteamiento de la hiptesis alternativa se trabaja a una cola superior. En la


distribucin normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como
puede observarse en la figura, la estadstica de trabajo est en la zona de rechazo de la
hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior a
las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva
mquina.

Regla de decisin para una prueba de hiptesis a una cola inferior.

Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao


n 30 de una poblacin con cualquier distribucin.

La estadstica de trabajo a usar es la expresin:

REGLA DE DECISION
Es la misma que en el caso anterior y depende en todo caso de la hiptesis alternativa.
EJEMPLO
La duracin promedio de las llantas producidas por una fbrica de llantas, segn
experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional
ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una
duracin promedio de 45.050 kms. con una desviacin estndar de 3.070 kms.
Solucin
H 0 : = 46.050
H1 :

46.050

Teniendo en cuenta que el tamao de la muestra es grande, como estadstica de trabajo


se utiliza la expresin 3.2

Por la hiptesis alternativa, la regla de decisin es a dos colas. La tabla a utilizar es la de


la distribucin normal. Asumiendo un nivel de confianza del 95 por ciento, los
correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura el
valor de la estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por
consiguiente, con una confiabilidad del 95 por ciento se acepta que la duracin promedio
de las llantas ha cambiado.

Regla de decisin para una prueba de hiptesis a dos colas

Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao


n<30 .
En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral
sin corregir o corregida.
Si se utiliza la varianza sin corregir (

) la estadstica de trabajo es la expresin:

Si se utiliza la varianza corregida la estadstica de trabajo es la expresin:

EJEMPLO
En su calidad de comprador comercial para un supermercado, se toma una muestra
aleatoria de doce (12) sobres de caf de una empacadora. Se encuentra que el peso
promedio del contenido de caf de cada sobre es 15,97 grs. con una desviacin estndar
de 0,15. La compaa empacadora afirma que el peso promedio mnimo del caf es de 16
grs. por sobre. Puede aceptarse sta afirmacin si se asume un nivel de confianza del 90
por ciento?

Solucin
Se desea probar si el peso mnimo es de 16 grs., es decir mayor o igual a 16 grs., as que
las hiiptesis adecuadas son:
H0 :

16

H1 : < 16
Teniendo en cuenta que el tamao de la muestra es pequeo, como estadstica de trabajo
se utiliza la expresin:

Como lo indica la hiptesis alternativa, se trabaja a una cola inferior en la tabla de la


distribucin t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z
es - 1,363
Como puede observarse, la estadstica de trabajo (-0,663) est ubicada en la zona de no
rechazo de la hiptesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no
se rechaza que los empacadores de caf tienen la razn, por lo tanto se concluye que el
peso promedio de los sobres de caf es mayor o igual a 16 grs.

Regla de decisin para una prueba de hiptesis a una cola inferior

PRUEBA DE HIPOTESIS PARA LA PROPORCION


Frecuentemente se desea estimar la proporcin de elementos que tienen una
caracterstica determinada, en tal caso, las observaciones son de naturaleza cualitativa.
Cuando se analiza informacin cualitativa y se est interesado en verificar un supuesto
acerca de la proporcin poblacional de elementos que tienen determinada caracterstica,
es til trabajar con la prueba de hiptesis para la proporcin.
HIPTESIS
Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de
hiptesis:
- Prueba de hiptesis a dos colas
H0 : = k
H1 :

- Prueba de hiptesis a una cola superior


H0 : = k

H0 :

H1 : > k

H1 : > k

- Prueba de hiptesis a una cola inferior


H0 : = k

H0 :

H1: < k

H1 : < k

Cuando se va a estimar una proporcin el tamao de la muestra (n) siempre debe ser
mayor a 30, por lo tanto se tiene un solo caso.
La estadstica de trabajo a utilizar es la expresin:

REGLA DE DECISION
Si se ha planteado la hiptesis alternativa como:

H1: k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia
( ) se divide en dos partes iguales, quedando estos valores en los extremos de la
distribucin
y
pertenecen a una distribucin normal estndar. Si el valor de la estadstica de
trabajo (Zp) est entre
y
no se rechaza la hiptesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1 . Es decir, si
< Zp <
no se rechaza H0 .
- Si se ha planteado la hiptesis alternativa como:
H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribucin
pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp
) es menor que
no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1 . Es decir, si Zp <
no se rechaza H0 .
- Si se ha planteado la hiptesis alternativa como:
H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribucin
Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo
(Zp ) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 .
EJEMPLO
Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria
que suministra a una fbrica guardan las formas especificadas. Un exmen de 200 de
esas piezas revel que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el
fabricante es cierto.
Solucin
H0 :

0,9

H1 : < 0,9
Para realizar una prueba de hiptesis para la proporcin se utiliza la expresin:

Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la


distribucin normal es -1,64

Como puede observarse en la figura, el valor de la estadstica de trabajo se encuentra en


la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por
ciento se concluye que la afirmacin del fabricante no es cierta.

Regla de decisin para una prueba de hiptesis a una cola inferior

BIBLIOGRAFIA

BERENSON, Mark L. y LEVINE , David M. Estadstica bsica en


administracin, conceptos y aplicaciones. Mxico: Prentice-Hall
Hispanoamericana S.A. 1992. 946 p.
GUJARATI Damodar . ECONOMETRIA, tercera edicin. Ed. Mc Graww Hill.
ABAD, Adela y SERVIN, Luis A. Introduccin al muestreo, segunda
edicin. Mxico D.F: Ed. Limusa, 1984. 216 p.
MENDENHALL, William y REINMUTH, James E. Estadstica para
administracin
y
economa.
California:
Ed.
Wadsworth
Internacional/Iberoamrica, 1982. 707 p.
LARSON, Harold J. Introduccin a la teora de probabilidades e inferencia
estadstica. Mxico D.F: Limusa, 1978. 466 p
ANDERSON David, SWEENEY Dennis J, WILLIAMS Thomas, Estadistica
para Administracin y Economia sptima edicin ed: Thomson
Internacional
SCHEAFFER, Richard L.; MENDENHALL, William y OTT, Lyman.
Elementos de muestreo. Mxico D.F: Grupo editorial iberoamrica, 1986.
321 p.
MARTINEZ Bencardino Ciro, Estadistica y muestreo Onceava edicin ed:
Ecoe ediciones
LIND Douglas A, MARCHAL William, MASON Robert, Estadistica para
Administracion y Economia Undecima edicion ed: Alfaomega
STEVENSON, William J. Estadstica para administracin y economa,
conceptos y aplicaciones. Mxico D.F.: Harla, 1981. 585 p.
Universidad Nacional de Colombia Curso de estadistica II copia textual
del capitulo pruebas de hiptesis. www.virtual.unal.edu.co

Вам также может понравиться