Академический Документы
Профессиональный Документы
Культура Документы
Distribuciones discretas
-Qu tal van las clases,
Bartolo? Me pregunta mi
barbero.
-Bien... Dando probabilidad
y estadstica... Respondo.
-Ah! Probabilidad... Yo
suelo jugar a la lotera...
Dice mientras me pasa la
cuchilla.
-Cuando compro un nmero, tal y como yo lo veo, hay dos
posibilidades: ganar o perder. De modo que tengo un 50% de
probabilidad de ganar y un 50% de perder.
-Muy bien, Ricardo! Respondo, mientras pienso que no es bueno
1
contradecir a nadie que tenga una navaja en mi cuello...
Distribucin de Bernoulli
Experimento de Bernoulli: solo son
posibles dos resultados: xito o fracaso.
Podemos definir una variable aleatoria
discreta X tal que:
xito 1
fracaso 0
Si la probabilidad de xito es p y la de fracaso 1 - p,
podemos construir una funcin de probabilidad:
1 x
P ( x) p (1 p )
x
x 0,1
1 x
P ( x) p (1 p )
x
x 0, 1
Funcin de distribucin:
1 p, para x 0
F ( x)
1, para x 1
E[ X ] x P ( X x)
x 0
0 P ( X 0) 1 P ( X 1) p
1
Var ( X ) E[ X ] ( E[ X ]) x P ( X x) p
2
x 0
0 P ( X 0) 1 P ( X 1) p
2
p p p (1 p )
2
Distribucin binomial
La distribucin binomial aparece cuando estamos
interesados en el nmero de veces que un suceso
A ocurre (xitos) en n intentos independientes
de un experimento.
P. ej.: # de caras en n lanzamientos de una moneda.
3 p 2 (1 p )
3 p(1 p) 2
n x
n!
n x
x
n x
B(n, p ) p ( x) p (1 p )
p (1 p )
x!(n x)!
x
Distribucin binomial para n = 5 y
distintos valores de p, B(5, p)
Tablero de Galton
o quincunx
Quincunx
Ejercicio:
Cul es la probabilidad de que en una familia de 4 hijos
exactamente 2 sean nias?
n x
p(x) p ( 1 p)n x
x
p 0.5;
n 4;
x2
4
2
4- 2
p( 2 ) ( 0.5 ) ( 1-0.5 )
2
11
Ejercicio:
Si una dcima parte de personas tiene cierto grupo
sanguneo, cul es la probabilidad de que entre 100
personas escogidas al azar exactamente 8 de ellas
pertenezcan a este grupo sanguneo?
n x
n x
p(x) p ( 1 p)
x
p 0.1;
n 100;
x 8
100
( 0.1 )8( 1-0.1 )92
p( 8 )
8
12
n x
p(x 8 ) p ( 1 p)n x
x 0 x
8
100
(0.1) x ( 0.9 )100 x
x
x 0
8
13
p = 1/6, q = 5/6, n = 4
n k nk
P (k ) p q
k
(k 0,1,....n)
4 1 5
4 1 5 4 1
2 6 6
3 6 6 4 6
1
171
4 (6 25 4 5 1)
0.132
6
1296
14
Ejercicio:
Supongamos que la probabilidad de encontrar una estrella
de masa m* >10 M en un cmulo estelar joven es del 4%.
Cul es la probabilidad de que en una muestra escogida al
azar, entre 10 miembros del cmulo encontremos 3 estrellas
con m* >10 M?
n x
p(x) p ( 1 p)n x
x
p 0.04;
n 10;
x3
10
3
10 - 3
p( 3 ) ( 0.04 ) ( 1-0.04 ) 0.043 0.967 0.006
3
15
3 1 5
3 1 5
3 2
3 6 6
2 6 6
1
3 1 5
3 5
1 (1) 0.08
1 6 6
0 6
16
Caractersticas de la distribucin
binomial
Media
= E(X) = n p
= 5 0.1 = 0.5
= 5 0.5 = 0.25
.6
.4
.2
0
P(X)
X
0
Desviacin estndar
np (1 p)
5 0.1 (1 0.1) 0.67
5 0.5 (1 0.5) 1.1
.6
.4
.2
0
n = 5 p = 0.1
P(X)
n = 5 p = 0.5
X
5
17
18
Distribucin multinomial
Cuando hay ms de dos acontecimientos posibles (A1, A2,
A3 ...) con probabilidades p1 , p2 , p3 ... constantes y
tales que:
pi 1
i
x1 x2 x3
n!
p ( x1 , x2 , x3 ...)
p1 . p 2 . p3 ....
x1! x2 ! x3!..
19
5!
1
1
3
p (1,3,1)
0.1 0.7 0.2 0.0112
1!.3!.1!
20
Distribucin geomtrica
Consideremos el siguiente experimento:
Partimos de un experimento de Bernoulli donde la
probabilidad de que ocurra un suceso es
p (xito) y la probabilidad de que no ocurra
q = 1- p (fracaso). Repetimos nuestro experimento
hasta conseguir el primer xito. Definimos la variable
aleatoria X, como el nmero de fracasos hasta que
se obtiene el primer xito. Entonces:
G ( p ) P ( X x ) 1 p p ,
x
x 0 ,1, 2 , ...
21
p(x)
G ( p ) P ( X x ) 1 p p ,
x 0 ,1, 2 , ...
x
x
Funcin de distribucin:
n
F (n) (1 p ) p 1 (1 p )
x
n 1
x 0
22
1 q rnd
Y
Entonces tenemos:
i 1
P (Y i ) P (1 q rnd 1 q )
i
i 1
i 1
i 1
q q (1 q ) q p.
i
1 q rnd
Y
Ln (1 rnd )
Y int
Ln q
25
26
0.95 pq
x 1
x 1
q 1
p.
q 1
0.9 n 1
0.95 0.1.
0.95 (0.9 n 1) 0.95 0.9 n 1
0.9 1
ln 0.05
0.05 0.9 ln 0.05 n ln 0.9 n
28.4 29
ln 0.9
n
27
x r 1 r
x
p 1 p ,
BN (r , p ) P( X x)
x
x 0 ,1, 2 , ...
Se denomina binomial negativa porque los coeficiente provienen de
la serie binomial negativa:
p -x ( 1-q)-x
28
x 1 r
xr
p 1 p ,
BN (r , p) P( X x)
r 1
x r, r 1, r 2, ...
29
x 1
x2
2
0.25 1 0.25 ,
BN (r 2, p 0.25) P( X x)
2 1
x 2 ,3, 4, ...
P(x)
30
n A
A
P ( x)
1
N
x N
n x
( x 0,1,....n)
(Una distribucin binomial) 31
N
Casos posibles
n
Distribucin hipergeomtrica
A
diferentes formas de tomar x bolas rojas de A
x
N A
N A
nx
H (n, N , A) P( x)
A
x
N A
nx
N
n
( x 0,1, ..., n)
33
p ( x)
3 7
10 10
2 x
p( x)
3
x
2 x
10
2
21
3
p (0) p (1)
0.47 , p (2)
0.07
45
45
34
Hipergeomtrica
N = 24
X=8
n=5
x
0
1
2
3
4
5
P(x)
0.1028
0.3426
0.3689
0.1581
0.0264
0.0013
N = 240
X = 80
n=5
x
0
1
2
3
4
5
P(x)
0.1289
0.3306
0.3327
0.1642
0.0398
0.0038
Binomial
n=5
p = 8/24 =1/3
P(x)
0.1317
0.3292
0.3292
0.1646
0.0412
0.0041
Error
-0.0289
0.0133
0.0397
-0.0065
-0.0148
-0.0028
n=5
p = 80/240 =1/3
P(x)
0.1317
0.3292
0.3292
0.1646
0.0412
0.0041
Error
-0.0028
0.0014
0.0035
-0.0004
-0.0014
-0.0003
Observa que si N,
A, N-A son grandes
comparados con n
no hay gran
diferencia en qu
distribucin
empleemos.
La distribucin
binomial es una
aproximacin
aceptable a la
hipergeomtrica
si n < 5% de N.
35
Distribucin de Poisson
Cuando en una distribucin binomial el nmero de intentos (n)
es grande y la probabilidad de xito (p) es pequea, la
distribucin binomial converge a la distribucin de Poisson:
e
p( x)
, x 0 ,1,2 , ... 0
x!
x
donde np =
Observa que si p es pequea, el xito es
un suceso raro.
La distribucin de Poisson, junto con la uniforme y la
36
binomial, son las distribuciones ms utilizadas.
P ( X 0) B (n, p,0) (1 p ) 1
n
B (n, p, k )
(k 1) p
B(n, p, k 1)
k (1 p )
k
38
Tenemos entonces
la siguiente ecuacin
iterada:
B ( n, p , 0) e
B(n, p, k ) B(n, p, k 1)
k
P ( X 1) B (n, p,1) e
2
P ( X 2) B ( n, p , 2) e
2
...
k
P( X k ) e
k!
39
(Feller)
Supn que vivas en uno de los 100 bloques que aparecen en la grfica
inferior. La probabilidad de que una bomba cayera en tu bloque era 1/100.
Como cayeron 400 bombas, podemos entender el nmero de impactos en tu
bloque como el nmero de xitos en un experimento de Bernoulli con n = 400
y p = 1/100. Podemos usar una Poisson con =400 1/100=4:
400 bombas
e 4 4 x
p ( x)
x!
Observado
Predicho
10 x 10
40
Caractersticas de la distribucin de
Poisson
Media
E (X )
Desviacin estndar
.6
.4
.2
0
X
0
.6
.4
.2
0
= 0.5
P(X)
= 6
P(X)
X
0
10
41
n p =
42
0 100
100
100 99
1 100
0.9206
99
100
100 99
2 100
n x n x
p ( x) p q
x
98
100
( x 0,1,....n)
P( A ) e (1 1 12 ) 0.9197
c
x
p( x)
e
x!
( x 0,1,....)
43
x
p( x)
e
x!
( x 0,1,....)
9%
22
2!
) 0.857
x
p( x)
e
x!
( x 0,1,....)
21
1!
23
3!
45
46
Ley de Benford
47
299.959
x , x m 10 , 1 m 10
d ( x) m
n
2,99959 10
[2,99959] = 2
5
1,74 10-2
[1,74] = 1
48
49
30.1 %
17.6 %
12.5 %
9.7 %
7.9 %
6.7 %
5.8 %
5.1 %
4.6 %
Simon Newcomb
(1835-1909).
Note on the frequency of use of the
different digits in natural numbers.
Amer. J. Math. 4 (1881) 39-40.
d 1
P (d ) log
51
Frank Benford
Sampls
Rivers, Area
31.0
16.4
10.7
11.3
7.2
8.6
5.5
4.2
5.1
335
Population
33.9
20.4
14.2
8.1
7.2
6.2
4.1
3.7
2.2
3259
Constants
41.3
14.4
4.8
8.6
10.6
5.8
1.0
2.9
10.6
104
Newspapers
30.0
18.0
12.0
10.0
8.0
6.0
6.0
5.0
5.0
100
Specific Heat
24.0
18.4
16.2
14.6
10.6
4.1
3.2
4.8
4.1
1389
Pressure
29.6
18.3
12.8
9.8
8.3
6.4
5.7
4.4
4.7
703
H.P. Lost
30.0
18.4
11.9
10.8
8.1
7.0
5.1
5.1
3.6
690
Mol. Wgt.
26.7
25.2
15.4
10.8
6.7
5.1
4.1
2.8
3.2
1800
Drainage
27.1
23.9
13.8
12.6
8.2
5.0
5.0
2.5
1.9
159
Atomic Wgt.
47.2
18.7
5.5
4.4
6.6
4.4
3.3
4.4
5.5
91
25.7
20.3
9.7
6.8
6.6
6.8
7.2
8.0
8.9
5000
Design
26.8
14.8
14.3
7.5
8.3
8.4
7.0
7.3
5.6
560
Reader's Digest
33.4
18.5
12.4
7.5
7.1
6.5
5.5
4.9
4.2
308
Cost Data
32.4
18.8
10.1
10.1
9.8
5.5
4.7
5.5
3.1
741
X-Ray Volts
27.9
17.5
14.4
9.0
8.1
7.4
5.1
5.8
4.8
707
Am. League
32.7
17.6
12.6
9.8
7.4
6.4
4.9
5.6
3.0
1458
Blackbody
31.0
17.3
14.1
8.7
6.6
7.0
5.2
4.7
5.4
1165
Addresses
28.9
19.2
12.6
8.8
8.5
6.4
5.6
5.0
5.0
342
25.3
16.0
12.0
10.0
8.5
8.8
6.8
7.1
5.5
900
Death Rate
27.0
18.6
15.7
9.4
6.7
6.5
7.2
4.8
4.1
418
Average
30.6
18.5
12.4
9.4
8.0
6.4
5.1
4.9
4.7
1011
Title
Probable Error
52
53
Invarianza de escala
Invarianza de base
55
Procesos multiplicativos
56
= -1
5 dcadas
5 dcadas
57
10 k d
10 k ( d 1)
d 1
Ln
Ln
k
10 d
d
Normalizando:
d 1
P (d ) log
58
The demonstration of Benfords Law (and also for the distribution of the second
digit) was done in 1996 by Professor Theodore Hill (School of
Mathematics, Center for Applied Probability, Georgia Institute of Technology) in his
article: A Statistical Derivation of the Significant Digit law.
Hill later showed there was a kind of central limit theorem that applied to a wide
variety of distributions--that combinations of distributions tend towards the
59
distribution predicted by Benfords law even when the original distributions do not [