Академический Документы
Профессиональный Документы
Культура Документы
aleatorias
Carles Rovira Escofet
P08/75057/02305
FUOC P08/75057/02305
Variables aleatorias
ndice
Sesin 1
Introduccin a las variables aleatorias
Variables aleatorias discretas ...........................................................
3. Resumen ...............................................................................................
10
Ejercicios ...................................................................................................
11
Sesin 2
Esperanza y varianza ..........................................................................
15
1. Definiciones .........................................................................................
15
19
20
21
5. Resumen ...............................................................................................
22
Ejercicios ...................................................................................................
23
Sesin 3
Algunas distribuciones discretas .....................................................
27
27
28
30
33
5. Resumen ...............................................................................................
35
Ejercicios ...................................................................................................
36
Sesin 4
Variables aleatorias continuas ..........................................................
39
39
42
3. Independencia .....................................................................................
44
45
5. Resumen ...............................................................................................
46
Ejercicios ...................................................................................................
47
Sesin 5
Algunas leyes continuas. La ley normal .........................................
50
50
FUOC P08/75057/02305
Variables aleatorias
52
54
55
57
60
4. Resumen ...............................................................................................
62
Ejercicios ...................................................................................................
63
Sesin 6
Procesos estocsticos.............................................................................
65
1. Definiciones ..........................................................................................
65
67
69
69
71
4. Resumen................................................................................................
72
FUOC P08/75057/02305
Variables aleatorias
En el mdulo anterior hemos visto el concepto de probabilidad y cmo podamos utilizarlo para modelar el resultado de un experimento.
Consideremos, por ejemplo, el espacio muestral que obtenemos si lanzamos
una moneda tres veces. En este caso el espacio muestral tiene ocho elementos y
Espacio muestral
Es el espacio con todos los posibles resultados de nuestro experimento.
es el siguiente:
= {(C,C,C),(C,C,),(,C,C),(C,,C), (C,,),(,C,),(,,C), (,,)}
donde C indica que ha salido una cara y indica que ha salido una cruz. Tenemos tambin una probabilidad sobre este espacio muestral, en concreto sabemos que la probabilidad de cada elemento del espacio muestral es de 1/8.
FUOC P08/75057/02305
Estudiaremos bsicamente dos tipos de variables aleatorias, las variables aleatorias discretas y las variables aleatorias continuas (existen otros tipos que no
estudiaremos). Como idea bsica, podemos diferenciarlas de la manera siguiente: cuando una variable aleatoria toma valores slo sobre un conjunto finito, es una variable aleatoria discreta, y cuando toma valores sobre todo un
Variables aleatorias
Nuestro entorno...
... est lleno de variables
aleatorias. Slo un ejemplo: el
nmero de letras de cada pgina de estas notas.
intervalo de los nmeros reales, es una variable aleatoria continua. Esta definicin no es rigurosa, pero nos sirve para hacer una primera aproximacin.
Una variable aleatoria discreta es una variable aleatoria que puede tomar un nmero finito o numerable de valores, en los que cada uno de
estos valores tiene una probabilidad mayor que cero de ser observado.
Fijaos en los ejemplos que hemos dado de variables aleatorias. Algunas son variables aleatorias discretas y otras no lo son. El ejemplo de los dados es un caso
claramente discreto, en el que la variable aleatoria que nos da el mximo de los
cinco resultados slo puede alcanzar uno de los seis valores siguientes: 1, 2, 3,
4, 5 y 6. Adems, somos capaces de calcular la probabilidad de que la variable
tome cada uno de estos valores.
Ejemplo de las tres monedas
Si lanzamos tres veces una moneda, el conjunto de resultados posibles es:
= {(c,c,c),(c,c,),(,c,c),(c,,c), (c,,),(,c,),(,,c), (,,)}
donde c indica una cara y indica una cruz. En este espacio muestral podemos definir
muchas variables aleatorias diferentes. Llamaremos X al nmero de caras que han salido.
Esta variable puede tomar los valores siguientes:
Valores posibles X
(,,)
(c,,),(,c,),(,,c)
(c,c,),(,c,c),(c,,c)
(c,c,c)
Podemos ver cul es la probabilidad asociada a cada uno de los posibles valores
de la variable X. De la tabla anterior y sabiendo que los resultados son equiprobables, resulta muy claro que obtenemos las probabilidades siguientes:
Valores posibles
X=x
P(X = x)
1/8
3/8
3/8
1/8
Conjunto numerable
de valores
Es aquel que podemos numerar utilizando los nmeros naturales.
FUOC P08/75057/02305
Variables aleatorias
Sumatorios
El smbolo
fx
indica hacer
PX = x
= 1
Recordad que la probabilidad del conjunto total era 1. Fijaos, por tanto, en que
en la propiedad anterior slo recordamos este resultado, ya que cuando sumamos las probabilidades de todos los valores posibles, obtenemos la probabilidad del conjunto total.
En definitiva, la funcin de masa de probabilidad nos explica cmo se distribuye una probabilidad total igual a la unidad en los resultados que toma la variable X.
CDF
En ingls la funcin de distribucin se denomina cumulative
distribution function. Esto hace
que en el software estadstico
se denomine usualmente CDF.
FUOC P08/75057/02305
F(x)
P (X y)
yx
Esta funcin a veces resulta muy til. Conociendo la funcin de masa de probabilidad, podemos calcular la funcin de distribucin, lo cual resulta fcil de
comprobar. Cuando conozcamos una de estas dos funciones, diremos que conocemos la ley o la distribucin de la variable aleatoria discreta.
P(X x)
1/8
4/8
7/8
Variables aleatorias
FUOC P08/75057/02305
2.2. Independencia
Para finalizar esta sesin, introducimos el concepto de independencia.
En el ejemplo de las tres monedas, la variable X nos daba el nmero de caras
que han salido. Consideremos tambin la variable Y, que valdr 1 si al tirar la
moneda la primera vez sale cara y valdr 0 si sale cruz. Finalmente definimos
la Z, que valdr 1 si al lanzar la moneda la segunda vez sale cara y valdr 0 si
sale cruz.
Est claro que si conocemos el valor de la variable Y, ya tenemos cierta informaci sobre los valores que puede tomar la variable X. Por ejemplo, si Y 1,
ya sabemos que X no puede ser cero. Esto nos indica que X e Y no son independientes.
En cambio, aunque conozcamos el valor que toma Y, no tenemos ninguna informacin sobre qu puede pasar con la variable Z. En este caso diremos que
Y y Z son independientes.
La definicin rigurosa de independencia entre variables aleatorias, que nos
permitir tratar fcilmente con parejas de variables aleatorias, es muy parecida
al concepto de sucesos independientes que vimos en el mdulo de Clculo
de probabilidades.
Variables aleatorias
Histograma de frecuencias
Si repetimos un experimento
muchas veces, el histograma
de las frecuencias relativas para
cada valor se parece al grfico
de la funcin de masa de probabilidad.
10
FUOC P08/75057/02305
3. Resumen
En esta seccin hemos aprendido el concepto de variable aleatoria y hemos estudiado un tipo particular: las variables aleatorias discretas. Hemos presentado
los conceptos de funcin de masa de probabilidad y funcin de distribucin.
Finalmente, hemos extendido el concepto de independencia de sucesos a variables aleatorias.
Variables aleatorias
Notacin
Observad que utilizamos la notacin:
P({X x} {Y y}) =
= P(X = x, Y = y).
Y recordad que: P(X = x |Y = y)
indica la probabilidad de que
X x si sabemos que Y y.
11
FUOC P08/75057/02305
Ejercicios
1. Lanzamos dos veces un dado y consideramos las variables aleatorias siguientes: Y es el resultado del primer dado, Z es el resultado del segundo y X
es la suma de ambos.
a) Determinad el espacio muestral asociado al experimento.
b) Determinad las funciones de masa de probabilidad y de distribucin de X.
Dibujadlas.
c) Calculad P(X = 2,Y = 3), P(X = 8), P(X = 7,5), P(X > 7), P(X 7,5).
d) Son independientes las variables X e Y? Son independientes las variables
Z e Y?
2. Un estudiante debe contestar un cuestionario con cuatro preguntas. Todas
las preguntas tienen dos posibles respuestas. El estudiante, que no se ha preparado para el cuestionario, contesta las preguntas al azar. Sea X el nmero total
de respuestas correctas del estudiante e Y el nmero de respuestas incorrectas a
las tres primeras preguntas.
a) Calculad la funcin de masa de probabilidad de X.
b) Calculad la probabilidad de que el estudiante conteste al menos una pregunta bien.
c) Calculad P(X 2,Y 3).
d) Son independientes las variables X e Y ?
Solucionario
1.
a) Si lanzamos dos veces un dado, los resultados posibles son todos los pares
de nmeros del 1 al 6. Fijaos en que el conjunto de estos pares forma el espacio
muestral y tiene 36 elementos (tenemos en cuenta el orden):
{(1,1), (1,2), (1,3), ..., (6,5), (6,6)}
b) Para la variable X tenemos:
Valores posibles X
(1,1)
(1,2), (2,1)
10
11
(5,6), (6,5)
12
(6,6)
Variables aleatorias
12
FUOC P08/75057/02305
P(X = x)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
10
3/36
11
2/36
12
1/36
Y la funcin de distribucin:
P(X x)
1/36
3/36
6/36
10/36
15/36
21/36
26/36
30/36
10
33/36
11
35/36
12
36/36
Variables aleatorias
13
FUOC P08/75057/02305
c) Utilizando estas tablas resulta fcil calcular la probabilidad de los acontecimientos que se pueden escribir en trminos de la variable X. As:
5
P(X 8) -----36
P(X 7,5) 0
21 15
P(X 7) 1 P(X 7) 1 F(7) 1 ------ -----36 36
21
P(X 7,5) P(X 7) -----36
Tambin est claro que el suceso {X 2, Y 3} es el suceso vaco, as que:
P(X 2, Y 3) 0
d) Observad:
P(X 8, Y 1) 0
y en cambio:
5
1
P(X 8) ------ y P(Y 1) --36
6
En este caso est claro que X e Y no son independientes.
Por otro lado, si z e y son dos valores entre 1 y 6:
1
1
P(Y y, Z z) ------ , y P(Z z) P(Y y) --36
6
Por tanto, Z e Y son independientes.
2.
a) Si decimos que la respuesta a cada pregunta es independiente de las otras,
podemos calcular fcilmente:
1
P(X 0) --2-
1
P(X 1) 4 --2-
1
P(X 2) 6 --2-
1
P(X 3) 4 --2-
1
P(X 4) --2-
Variables aleatorias
14
FUOC P08/75057/02305
Los coeficientes 4, 6 y 4 salen del nmero de combinaciones en las que podemos hacer 1, 2 3 respuestas correctas respectivamente. Este clculo est
relacionado con la llamada distribucin binomial, que se explica en la sesin
Algunas distribuciones discretas.
b) El acontecimiento contestar al menos alguna pregunta bien es el acontecimiento contestar una pregunta o ms bien. As, tenemos que calcular:
1
P(X 1) 1 P(X 1) 1 P(X 0) 1 -----16
c) Est claro que el acontecimiento {X 2, Y 3} no se puede dar nunca.
Por tanto:
P(X 2, Y 3) 0
d) Ya hemos visto que la P(X 2) 6/16. Con un razonamiento anlogo es
fcil comprobar que:
3
1
1
P(Y 3) --2- --8
Por tanto,
P(X = 2, Y = 3) P(X = 2)P(Y = 3)
y las variables no son independientes.
Variables aleatorias
15
FUOC P08/75057/02305
Variables aleatorias
Esperanza y varianza
Representabilidad de la
esperanza y la varianza
La esperanza y la varianza nos
permiten conocer un poco cmo es una variable aleatoria.
1. Definiciones
Suponed que lanzamos un dado veinte veces y que obtenemos los valores siguientes:
2, 2, 6, 1, 1, 6, 2, 5, 3, 2, 4, 6, 4, 4, 5, 2, 6, 6, 5, 4
La media de estos datos, utilizando las frecuencias relativas, tal como hemos
visto en el mdulo Estadstica descriptiva, se puede calcular como:
x =
if i
i=1
5
3
4
1
5
2
= 1 ------ + 2 ------ + 3 ------ + 4 ------ + 5 ------ + 6 ------ = 3,8
20
20
20
20
20
20
s2 =
i x 2 f i 3,06
i=1
Por otra parte, podemos pensar que si tenemos un dado (no trucado) y lo lanzamos muchas veces, las frecuencias esperadas de cada uno de los 6 posibles
valores se ir acercando cada vez ms a 1/6 (que es la probabilidad de cada valor). As, la media de los datos cuando hiciramos muchas tiradas sera:
i --6-
i=1
21
= ------ = 3,5
6
Recordad cmo...
... calculbamos la media
y la varianza muestral.
16
FUOC P08/75057/02305
y la varianza muestral:
Variables aleatorias
Qu esperamos?
6
i=1
Estos dos valores, equivalentes a la media y a la varianza muestral, sern la esperanza y la varianza de la variable aleatoria que nos da el resultado del lanza-
Como su propio nombre indica, la esperanza de una variable aleatoria es el valor que
esperamos que salga. Pero
qu significa que esperamos que salga? Pensad en el
ejemplo del dado.
Notacin
En algunos libros la esperanza
se denomina valor esperado.
xP X = x
x
La esperanza de una variable aleatoria X se puede mirar tambin como la media ponderada de los valores que toma la variable aleatoria.
Ejemplo de la ruleta
Un ejemplo muy fcil es el de la ruleta. Podemos plantearnos la pregunta siguiente. Si
vamos al casino a jugar a la ruleta a rojo o negro, qu ganancias esperamos tener?
Para aquellos que no tengis este vicio, recordemos cmo funciona una ruleta. La ruleta
tiene 18 casillas rojas, 18 negras y 2 blancas. Si jugamos 1.000 u.m. a rojo y la bola cae
en una casilla roja, ganamos 1.000 u.m., y si cae en una negra o en una blanca, perdemos
las 1.000 u.m. que hemos jugado. Si llamamos X a las ganancias que esperamos obtener,
tenemos la tabla siguiente:
Valores posibles
Xx
P(X x)
1.000
18/38
1.000
20/38
P(X x)
1.200
1/3
1.000
1/2
900
1/6
17
FUOC P08/75057/02305
Variables aleatorias
Una vez calculada la esperanza, podemos calcular la dispersin para cada valor
x que puede tomar la variable aleatoria X, como la distancia entre el valor x y
la esperanza E(X), es decir, x E(X). La varianza, medida de la dispersin, es en
realidad el valor esperado de las desviaciones al cuadrado. El hecho de que las
elevemos al cuadrado es para evitar que si tenemos desviaciones de diferentes
signos, stas se pudieran cancelar.
x E X 2 P(X x)
x
Var x
Medida de la dispersin
de una variable aleatoria
Como en el caso poblacional,
la desviacin tpica es muy til,
ya que se da con las mismas
unidades que la esperanza, de
manera que nos puede dar una
idea ms clara de la medida de
la dispersin de una variable
aleatoria.
18
FUOC P08/75057/02305
Variables aleatorias
Dispersin x E(x)
P(X x)
1.200
150
1/3
1.000
50
1/2
900
150
1/6
X=x
19
FUOC P08/75057/02305
Podemos calcular la esperanza de la variable Z, indicada por una lnea discontinua, que
nos da el precio de la accin para la semana siguiente:
1
1
1
E(Z) 1.300 --- 800 --- 100 --- 850
3
2
6
que es menor que la de las otras compaas. La varianza, en cambio, vale:
1
1
1
Var(Z) (1.300 850)2 --- (800 850)2 --- (100 850)2 --- 162.500
3
2
6
que es la misma que para la compaa B. As, Z e Y tienen la misma varianza y esperanzas
diferentes. Podemos verlo tambin comparando los grficos de las funciones de masa de
probabilidad.
kxP X = x = k xP X = x = kE X
x
Variables aleatorias
20
FUOC P08/75057/02305
Variables aleatorias
Extensin de n variables
Esta propiedad se extiende fcilmente a n variables, de manera que la esperanza de la
suma de n variables aleatorias
es la suma de sus esperanzas.
tante, es decir:
E(X + k) = E(X) + k
Para demostrarlo, slo hay que utilizar la definicin de esperanza y pensar que
la nueva variable X k toma los valores x k, donde las x son los valores que
toma la variable X con probabilidad P(X x). Vemoslo:
E(X + k) =
x + k P(X = x) = xP X = x
x
kP X = x
Recordad que...
= E(X) + k P X = x = E(X) + k
x
...
PX = x
x
= 1
21
FUOC P08/75057/02305
Variables aleatorias
Obsevad que...
... si tenemos dos variables
aleatorias X e Y que no son
independientes, entonces en
general:
Var(X + Y) Var(X) + Var(Y).
Aunque dos variables aleatorias X e Y sean independientes,
en general:
s(X + Y) s(X) + s(Y).
4. La desigualdad de Tchebichev
La desigualdad de Tchebichev nos permite interpretar la informacin conjunta que nos dan la esperanza y la varianza de una variable aleatoria indicando
la masa de probabilidad mnima en intervalos de longitud 2n Var X centrados en E(X).
1
P X E X k ----2- Var X
k
x E X 2 P X = x =
x
x, x E X k
x E X 2 P X = x +
x E X 2 P X = x
x, x E X k
Extensin a n variables
Esta propiedad se extiende fcilmente a n variables, de manera que la varianza de la suma
de n variables aleatorias independientes es la suma de las
varianzas.
22
FUOC P08/75057/02305
Var(X )
x E X 2 P X = x
x, x E X k
Variables aleatorias
k2 P X = x k2 P X E X k
x, x E X k
1
P X E X n Var x -----2
n
1
Es decir, que tendremos como mnimo una masa de probabilidad de 1 -----2 en
n
el intervalo:
E X n Var x , E X + n Var x
Ejemplo
Probabilidad para n 2
Para cualquier variable X en el
intervalo:
(E(X) 2s, E(X) + 2s)
se concentra como mnimo
una probabilidad de 0,75.
Recordad que:
s =
Var X
es decir:
1
8
P(4 < X < 8) 1 --- = --9
9
5. Resumen
En esta sesin hemos aprendido los conceptos de esperanza y de varianza de
una variable aleatoria. Hemos estudiado sus propiedades bsicas y hemos visto
cmo calcularlas para variables aleatorias discretas. Para acabar, hemos visto cmo utilizar la desigualdad de Tchebichev para relacionar los dos conceptos.
Fijaos en que 6 = 3 4
23
FUOC P08/75057/02305
Ejercicios
1. Lanzamos dos veces un dado y consideramos la variable aleatoria que nos
da el mximo de los dos valores obtenidos.
a) Calculad la funcin de masa de probabilidad de esta variable aleatoria.
b) Calculad su esperanza y su varianza.
2. En la compaa ACBXX tienen cuatro tipos de trabajadores: directivos, con
un sueldo de 15.000.000 u.m.; especialistas, con un sueldo de 5.000.000; obreros,
con un sueldo de 2.000.000, y aprendices, con un sueldo de 1.000.000. Sabemos
que la compaa tiene cuatro directivos, cuarenta especialistas, doscientos obreros y cien aprendices. Cogemos a un trabajador al azar y llamamos X a la variable
aleatoria que nos da el sueldo de este trabajador.
a) Calculad la esperanza y la varianza de esta variable.
b) Si en la compaa se hace un aumento lineal de 200.000 a todos los trabajadores, cmo vara la esperanza y la varianza de la variable X?
c) Y si hacemos un aumento proporcional del 10%?
3. Tenemos una variable aleatoria X con esperanza 10 y varianza 1.
a) Calculad E(3X), Var(2X X).
b) Utilizando la desigualdad de Tchebichev, encontrad una cota inferior para P(8
< X < 12).
Solucionario
1.
a) Para calcular la funcin de masa de probabilidad, observad el cuadro siguiente con todos los posibles resultados (fijaos en que hemos tenido en
cuenta el orden):
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)
(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
Hemos marcado la tabla con dos colores para distinguir mejor qu casos nos
da cada valor. Por ejemplo, el mximo igual a 1 slo lo obtendremos con el
resultado (1,1). En cambio, obtenemos que el mximo es igual a 2 en tres situaciones (1,2),(2,2) y (2,1). Si utilizamos esta tabla y los resultados son equiprobables, podemos construir fcilmente la funcin de masa de probabilidad.
Variables aleatorias
24
FUOC P08/75057/02305
Valores posibles
Variables aleatorias
P(X x)
Xx
1
1/36
3/36
5/36
7/36
9/36
11/36
161
11
9
7
5
3
1
E X = 1 ------ + 2 ------ + 3 ------ + 4 ------ + 5 ------ + 6 ------ = ---------- 4,47
36
36
36
36
36
36
36
Dispersin
P(X x)
x E(X)
x E(X)2
1/36
125/36
15.625/(36)2
3/36
89/36
7.921/(36)2
5/36
53/36
2.809/(36)2
7/36
17/36
289/(36)2
9/36
19/36
361/(36)2
11/36
55/36
3.025/(36)2
Y si utilizamos la frmula:
Var(X) =
x E X 2 P(X x)
x
2.
a) Tenemos una variable X que tiene funcin de masa de probabilidad:
Valores posibles
Xx
P(X x)
15.000.000
4/344
5.000.000
40/344
2.000.000
200/344
1.000.000
100/344
25
FUOC P08/75057/02305
1
1
1
P X 10 2 -----2 Var V = --- 1 = --4
4
2
Variables aleatorias
FUOC P08/75057/02305
26
Variables aleatorias
27
FUOC P08/75057/02305
Variables aleatorias
Ahora estudiaremos algunas de las distribuciones discretas ms usuales. Imaginemos la situacin siguiente. Sabemos que cada vez que intentemos conectarnos a Internet utilizando la lnea telefnica, cabe la posibilidad de que la
conexin falle y no podamos conectarnos. Adems, sabemos que la probabilidad de que esto suceda, es decir, de que falle la conexin, es de 0,1. Finalmente,
supondremos tambin que el resultado de cada llamada que intentemos es independiente de las otras llamadas que hayamos hecho. Indicaremos finalmente con una C el acontecimiento llamada que obtiene la conexin y con C , el
acontecimiento complementario, llamada que no obtiene la conexin.
1. Distribucin de Bernoulli
Consideremos ahora una variable aleatoria X que, cuando intentemos conectarnos una vez a Internet, vale 1 si podemos hacerlo y 0 si la conexin falla y
no podemos. Esta variable tiene la funcin de masa de probabilidad siguiente:
Bernoulli
El nombre de Bernoulli proviene de un importante matemtico del siglo XVII.
P(X 0) 0,1
P(X 1) 0,9
La ley de esta variable se conoce como una distribucin de Bernoulli de parmetro 0,9.
Una variable aleatoria X sigue a una distribucin de Bernoulli de parmetro p, p (0,1). Escribiremos B(p) si slo toma los valores 0 y 1 con
probabilidades:
P(X 1) p, P(X 0) 1 p
E(X) = 0P(x = 0) + 1P (x = 1) = p
Var(X) = (0 p)2P(X = 0) + (1 p)2P(X = 1) = p(1 p)
28
FUOC P08/75057/02305
Variables aleatorias
Concepto de xito
El concepto de xito es
relativo. Por ejemplo, en un
proceso de control de calidad,
podemos considerar un xito la produccin de una pieza
defectuosa.
2. Distribucin binomial
Volvamos a nuestro ejemplo de la conexin a Internet. En general no intentamos conectarnos slo una vez. As, imaginemos que, durante todo un da,
nos intentamos conectar n veces y llamamos Y a la variable aleatoria que cuenta el nmero de veces que nos hemos podido conectar. Los valores que puede
tomar esta nueva variable aleatoria son los nmeros naturales entre cero (si todas las veces que hemos intentado conectarnos la conexin ha fallado) y n (si
nos hemos podido conectar todas las veces que lo hemos intentado).
Veamos cmo podemos calcular la funcin de masa de probabilidad asociada
a la variable Y:
CC...C
Si decimos que cada llamada es independiente de las otras, tenemos que calcular el producto de las probabilidades de que cada llamada haya fallado:
P(Y 0) (0,1) ... (0,1) (0,1)n
La probabilidad P(Y 1) de que la conexin haya funcionado bien exactamente una vez vendr dada por la frmula siguiente:
P(Y 1) n(0,9)(0,1)n1
Vemoslo: si suponemos que la llamada en la que nos hemos podido conectar ha sido la primera, el acontecimiento de que haya exactamente una
nica conexin y que sta se haya producido en la primera llamada es el
suceso:
CCC...C
Condiciones
del experimento
Durante buena parte de
esta sesin supondremos que
estamos repitiendo un experimento bajo las condiciones
siguientes: el resultado de cada
prueba puede ser xito o fracaso, la probabilidad de xito
(bien, de lo que entendemos
por xito) siempre es p y cada
repeticin de la prueba es
independiente del resto.
29
FUOC P08/75057/02305
Variables aleatorias
Observacin
Evidentemente, si k < 0 o k > n,
entonces P(Y = k) = 0.
n
n!
= -----------------------k!
n
k !
k
As, tenemos que:
n
P(Y = k) = (0,9)k (0,1)nk
k
donde k 0,..., n.
La ley de la variable Y se conoce como la distribucin binomial de parmetros
n y 0,9.
FUOC P08/75057/02305
30
Variables aleatorias
Obsevacin
En particular la distribucin de
Bernoulli B(p) es una binomial
B(1, p).
El clculo de la esperanza y la varianza de la binomial se obtiene de la esperanza y la varianza de una distribucin de Bernoulli:
E(X1 + ... + Xn) =E(X1) + ... + E(Xn) np
Var(X1 + ... + Xn) =Var(X1) + ... + Var(Xn) np(1 p)
Como se ve por su esperanza y su varianza, la forma de una distribucin binomial depende mucho de los valores de los parmetros. Podis verlo tambin
en los grficos de las funciones de masa de probabilidad de una B(10, 0,1) y de
una B(20, 0,5).
3. Distribucin geomtrica
Volvamos a la situacin en la que estbamos: continuemos intentando conectarnos a Internet. Lo ms comn es que lo intentemos hasta que consigamos
conectarnos, de manera que podemos contar el nmero de veces que hay que
Valor de p
Observad que si p es pequea,
la probabilidad de lograr pocos
xitos es grande.
Simetra
Observad que la funcin de
masa de probabilidad es simtrica cuando p = 0,5.
31
FUOC P08/75057/02305
Variables aleatorias
Y la expresin general para P(Z k), donde k ser un nmero natural mayor
que 1, vendr dada por:
P(Z k) (0,1)k 1(0,9)
Esta expresin sale fcilmente del hecho de que el acontecimiento {Z = k} significa que en los k 1 primeros intentos la conexin ha fallado y que en k-simo
hemos conseguido conectarnos.
La ley de la variable Z se conoce como la distribucin geomtrica de parmetro
0,9.
Una variable aleatoria Z sigue una distribucin geomtrica de parmetro p, p [0,1] escribiremos geom(p) si toma valores sobre todos los naturales estrictamente positivos con funcin de masa de probabilidad:
P(Z k) (1 p)k 1p
donde k 1 natural.
Observacin
Los valores que puede tomar
esta nueva variable aleatoria
son los nmeros naturales desde 1 (si nos conectamos al primer intento) en adelante (sin
lmite superior).
32
FUOC P08/75057/02305
Variables aleatorias
ner un fracaso, ahora se trata de contar cuntas veces hemos repetido el experimento hasta el primer xito.
Para esta distribucin el clculo de la esperanza y la varianza es un poco ms
complicado, as que slo daremos el resultado.
1
Si Z es una variable aleatoria con ley geom(p), entonces E Z = --- y
p
1 pVar Z = ----------.
p2
PZ = i
P(Z 5) =
0,1 i 1 0,9
i=1
i=1
F(k) P(Z k)
PZ = i =
i=1
0,1 i 1 0,9
1 (0,1)k
i=1
Disparidad
de experimentos
Recordad que el concepto de
experimento es muy amplio:
puede incluir lanzar una moneda al aire y mirar si sale cara,
poner en marcha un coche y
mirar si se pone en funcionamiento, etc.
33
FUOC P08/75057/02305
Variables aleatorias
4. Distribucin de Poisson
La ltima distribucin discreta que estudiaremos es la llamada distribucin de
Poisson. Este tipo de distribucin se utiliza para modelar varias clases de situaciones, como el nmero de coches que pasan por un peaje durante una hora,
el nmero de clientes que recibe una peluquera durante un da, el nmero de
llamadas que pasan por una centralita durante una hora o el nmero de terremotos que hay en un ao, etc.
Primeras utilizaciones
de la Poisson
Uno de los primeros ejemplos
de la utilizacin de la distribucin de Poisson que recoge
la literatura (siglo XIX) trataba
del nmero de soldados prusianos muertos por una coz de caballo.
Observacin
Fijaos en que para valores de k
granos el valor de la probabilidad P(X k) ser pequeo.
k
P X = k = ----- exp
k!
donde k 0.
Recordad exp () = e
34
FUOC P08/75057/02305
Variables aleatorias
variable aleatoria que cuenta el nmero de vehculos que pasan por el peaje. Podemos
responder preguntas del tipo siguiente:
a) Probabilidad de que pasen exactamente tres coches por el peaje durante un minuto:
53
P X = 3 = ----- exp 5 = 0,1404
3!
b) Probabilidad de que pase algn coche:
P(X > 0) = 1 P(X = 0) = 1 exp(5) = 0,9933
c) Nmero esperado de coches que pasan por el peaje durante un minuto:
E(X) = 5
La distribucin de Poisson se utiliza en ciertas condiciones como una aproximacin de la distribucin binomial. Se considera que si tenemos una variable
aleatoria X con distribucin B(n, p) con n grande y p pequea, podemos
aproximarla por una variable Y con distribucin de Poisson de parmetro np.
Por ejemplo, fijado k > 0, en las condiciones anteriores, podemos aproximar
la probabilidad de que una binomial de parmetros n y p tome el valor k:
n
pk 1 p n k
k
por la probabilidad correspondiente a la ley de Poisson de parmetro np, es decir:
np k
------------- exp np
k!
que es ms fcil de calcular.
Observad que estamos aproximando una distribucin binomial, que slo puede tomar un nmero finito de valores, por una distribucin de Poisson, que
toma valores sobre todos los naturales. Esto es posible porque las probabilidades de la distribucin de Poisson para valores grandes son prcticamente nulas.
Veamos algunos ejemplos de la funcin de masa de probabilidades:
35
FUOC P08/75057/02305
6
As, podemos calcular la probabilidad de que salgan exactamente dos seises quince veces,
que ser:
60 1 15
1 45
P X = 15 = -----2 1 -----2
15 6
6
Este clculo no es fcil de hacer. En cambio, si utilizamos la aproximacin por la distribucin de Poisson, podemos aproximar la probabilidad anterior:
15
10
------
6
----------------- exp 10
------
6
15!
que es ms fcil de calcular.
5. Resumen
Hemos presentado las distribuciones discretas ms habituales: la de Bernoulli,
la binomial, la geomtrica y la de Poisson. Hemos aprendido a calcular probabilidades expresadas a partir de estas leyes y hemos visto cules son sus esperanzas y sus varianzas.
Variables aleatorias
FUOC P08/75057/02305
36
Ejercicios
1. En la carretera C969 hay una nica gasolinera. Los automviles que pasan
por delante deciden repostar con una probabilidad de 0,1. Sabemos que entre
las 3 y las 4 de la tarde han pasado diez coches por la carretera.
a) Cul es la probabilidad de que como mnimo hayan decidido poner gasolina
ocho coches?
b) Cuntos coches esperamos que se hayan detenido a repostar?
Supongamos ahora que el nmero de coches que pasan entre las 4 y las 5 de
la tarde por la carretera C-969 sigue una ley de Poisson de parmetro 10.
c) Cul es la probabilidad de que no pase ningn coche?
d) Cul es la probabilidad de que al menos pasen tres?
e) Cuntos automviles esperamos que pasen?
2. Por problemas de nuestro servidor de correo, sabemos que cada vez que recibimos un correo electrnico hay una probabilidad de 0,05 de que no podamos leerlo correctamente.
a) Cul es la probabilidad de que no podamos leer correctamente el tercer mensaje?
b) Cul es la probabilidad de que el tercer mensaje sea el primero que no podamos leer correctamente?
c) Cul es la probabilidad de que podamos leer correctamente ms de tres
mensajes antes de que llegue alguno que no se lea bien?
d) Qu mensaje esperamos que sea el primero que no podamos leer correctamente?
Solucionario
1. Llamamos X a la variable aleatoria que nos da el nmero de coches que se
han detenido en la gasolinera entre las 3 y las 4. Segn el enunciado, est claro
que la variable X sigue una distribucin B(10, 0,1).
a) Entonces, dado que el acontecimiento {al menos ocho coches se detengan
a repostar} es el suceso {X 8}, debemos calcular:
P X 8 = P X = 8 + P X = 9 + P X = 10 =
10
10
10
= (0,1)8(0,9)2 + (0,1)9(0,9)1 + (0,1)10(0,9)0 =
8
9
10
= 45(0,1)8(0,9)2 + 10(0,1)9(0,9)1 + (0,1)10(0,9)0
0,0000003736
Como veis, es muy pequea.
Variables aleatorias
37
FUOC P08/75057/02305
10 0
P Y = 0 = --------- exp 10 = exp 10 0,000045
0!
d) De forma anloga, calcularemos:
P X 3 = 1 PY 3 = 1 PY = 0 + PY = 1 + PY = 2 =
10 0
10 1
10 2
= 1 --------- exp 10 + --------- exp 10 + --------- exp 10 =
0!
1!
2!
= 1 ([1 10 50]exp(10)) 0,9973
e) El nmero de coches que esperamos que pasen vendr dado por la esperanza
de Y. Puesto que conocemos la esperanza de una ley de Poisson, tenemos que:
E(Y) 10
es decir, diez coches.
2.
a) El tercer mensaje es como todos los otros y, por tanto, existe una probabilidad de 0,05 de que no podamos leerlo correctamente.
Consideraremos ahora la variable aleatoria X que nos dar el nmero del primer mensaje que no podemos leer correctamente. La variable X seguir una
distribucin geom(0,05).
b) El suceso {el tercer mensaje es el primero que no podemos leer correctamente} es el acontecimiento {X = 3}. Utilizando la funcin de masa de probabilidad de una ley geomtrica, tenemos:
P(X 3) = (0,95)2 (0,05) 0,0451
Variables aleatorias
38
FUOC P08/75057/02305
Variables aleatorias
FUOC P08/75057/02305
39
Variables aleatorias
Terminologa
Nosotros hablamos de variables aleatorias continuas,
pero en muchos libros se denominan variables aleatorias
absolutamente continuas.
1. Funcin de densidad
La herramienta bsica para el estudio de este tipo de distribuciones es la llamada funcin de densidad. Para entenderla bien, primero la relacionaremos con los
histogramas de densidades.
Supongamos que queremos estudiar el tiempo de vida de un componente determinado de los PC. Observemos primero los tiempos de vida de una muestra
de cien discos duros, despus de quinientos y finalmente, de diez mil. Representamos los datos en los histogramas de densidades siguientes.
Tiempo de vida
Cuando hablamos del tiempo
de vida de un disco duro, nos
referimos al tiempo que durar
hasta que se estropee.
FUOC P08/75057/02305
40
Puesto que cada vez tomamos muestras de mayores dimensiones, podemos aumentar el nmero de clases y coger intervalos de menor longitud, de manera
que obtendremos los histogramas de densidad de probabilidad siguientes:
Si cogemos cada vez muestras ms grandes y hacemos un histograma de densidades con un nmero ms elevado de clases, el perfil del histograma de densidades se acerca cada vez ms a la siguiente curva, que llamaremos curva de
densidad de probabilidad:
Variables aleatorias
41
FUOC P08/75057/02305
Variables aleatorias
A partir de las propiedades del histograma es fcil comprobar que esta curva
tambin satisface las condiciones siguientes:
1) El rea total bajo la curva de densidad es 1.
2) La probabilidad de que el tiempo de vida de un componente est entre dos
valores a y b es el rea bajo la curva de densidad entre estos puntos.
3) La funcin de densidad es siempre positiva.
Podemos definir as la funcin de densidad.
La funcin de densidad de una variable aleatoria X continua es una
funcin f(X) positiva tal que para todo a b :
b
P a X b =
f X dx
Signo de la funcin
de densidad
Observad que la funcin de
densidad siempre debe ser
positiva.
f X dx
= 1
x0
f 1 X = 0,
exp x , x 0
x9
--- ,
f2 X =
2
0,
de otro modo
f 3 X = 2,
0,
3
--- x 1
2
de otro modo
5x6
En todos los casos es fcil comprobar que se trata de funciones positivas y que su integral
vale 1.
Ahora, si nos preguntan cul es la probabilidad de que nuestro disco duro haya
tenido un tiempo de vida de exactamente tres aos (ni un segundo ms, ni un
segundo menos), la respuesta deber ser cero. Puede parecer una paradoja. Lo
que nos est diciendo es que, dado que la medida terica del tiempo puede ser
tan precisa como queramos, la posibilidad de que un componente dure exactamente tres aos es prcticamente despreciable. Podramos pensar la probabilidad de que el tiempo de vida estuviese entre tres aos menos un segundo
y tres aos ms un segundo. La probabilidad sera muy pequea. Y podemos
42
FUOC P08/75057/02305
Variables aleatorias
hacerla todava ms pequea. Pensad en una centsima de segundo o una millonsima, etc.
cierto intervalo.
A partir de la funcin de densidad podemos recuperar, para las variables continuas, algunos conceptos que ya habamos visto para las variables discretas.
F x =
f y dy
Recordatorio
La funcin de distribucin se
define como:
FX = PX x
y arranca siempre desde cero
y llega hasta uno. Adems, es
siempre una funcin creciente.
Si F es la funcin de distribucin de una variable aleatoria y F es una funcin derivable, entonces F es la funcin de distribucin de una variable
continua con densidad F.
Por las variables
discretas...
43
FUOC P08/75057/02305
Variables aleatorias
P X a = Fa =
f x dx
P b X =
f x dx
b
Adems:
b
P b X = 1 PX b = 1
f x dx
= 1 Fb
Y como antes:
P(b < X) = P(b X)
3) Clculo de P(a < X b).
Fijaos en que, utilizando:
a X b X a = X b
tenemos:
b
P a X b = PX b PX a = Fb Fa =
f x dx
a
Adems, tenemos:
P(a < X b) = P(a < X < b) = P(a X b) = P(a X < b)
44
FUOC P08/75057/02305
Variables aleatorias
f x = exp x 2 , x 2
x2
0
Llamamos X a esta variable aleatoria. Entonces, utilizando la funcin de densidad, podemos calcular la probabilidad de toda una serie de acontecimientos:
a) Probabilidad de que tarde como mucho cinco minutos.
b) Probabilidad de que tarde ms de ocho minutos y menos de diez.
c) Probabilidad de que tarde como mnimo ocho minutos.
d) Probabilidad de que tarde ms de cuatro minutos y menos de diez si sabemos que como
mnimo tarda ocho.
5
a) P X 5 =
2
5
2
b) P 8 X 10 =
10
8
10
c) P X 8 =
F ( x)
( ( y 2))
dy e y e 2 dy e 2 e y dy e 2 e y
2
e 2 e y e 2 e x e 2 e 2 e x e 2 e x e 2 e 2 e 2 e 2 x 1
2
x
1 e ( x 2)
si x 2 y F(x) 0 si x 2 .
Observad que si derivamos la funcin de distribucin, recuperamos la funcin de densidad.
Ahora damos las respuestas utilizando la funcin de distribucin:
a)
b)
c)
d)
P X 4 = F 4 = 0
P X 5 = F 5 = 1 exp 3
P 8 X 10 = P X 10 P X 8 = F 10 F 8 = exp 6 exp 8
P X 8 = 1 P X 8 = 1 P X 8 = exp 6
3. Independencia
El concepto de independencia se extiende tambin a las variables continuas.
Aunque la idea es la misma que para las variables discretas, debemos dar otra
45
FUOC P08/75057/02305
Variables aleatorias
4. Esperanza y varianza
La esperanza y la varianza se pueden calcular tambin utilizando la funcin de
densidad.
Recordemos que para calcular la funcin de distribucin para una variable
aleatoria discreta X, tenamos que calcular el sumatorio:
F x =
PX = y
yx
f y dy
F x =
xP X = x
x
Var X =
x EX
PX = x
EX =
xf x dx
46
FUOC P08/75057/02305
Variables aleatorias
Var X =
x E X f x dx
2
EX =
x =
x
--- , 0 x 2
2
0 de otro modo
EX =
3 2
1 x
----3
x 2--- dx = --2-
4
= --3
y puesto que:
2
2
EX =
4 2
1 x
2x
x --- dx = --- ----2
2 4
= 2
0
tenemos:
2
16
2
2
Var X = E X E X = 2 ------ = --9
9
5. Resumen
En esta sesin hemos aprendido el concepto de variable aleatoria continua.
Hemos estudiado la funcin de densidad y hemos extendido a esta clase de variables los conceptos de funcin de distribucin, independencia, esperanza y
varianza que habamos estudiado para las variables discretas.
Recordatorio
La varianza se poda calcular
como:
E(X2) (E(X))2
47
FUOC P08/75057/02305
Ejercicios
1.
1 2
Sea X una variable aleatoria continua con funcin de densidad f x = --- x , si
9
0x3.
a) Comprobad que es una funcin de densidad.
b) Calculad la funcin de distribucin.
c) Calculad: P(X > 2) y P(X 5).
d) Calculad la esperanza y la varianza de X.
2.
Sea X una variable aleatoria continua con funcin de distribucin:
F x =
x1
0,
2
x 1
------------------- , 1 x 4
9
1
4x
f x dx =
3 3
1 2
x
--9- x dx = -----27
= 1
0
--9- y dy
y
= -----27
x
0
x
= -----27
Fx =
0,
3
x
------ ,
27
1
x0
0x3
3x
Variables aleatorias
48
FUOC P08/75057/02305
P X 2 =
f x dx =
3 3
1 2
x
--9- x dx = -----27
8
19
= 1 ------ = -----27
27
o la funcin de distribucin:
8
19
P X 2 = 1 P X 2 = 1 F 2 = 1 ------ = -----27
27
EX =
4 3
1 x
x
x ----9- dx = --9- ----4-
9
= --4
Y puesto que:
3
2
EX =
5 3
1 x
2x
x ----9- dx = --9- ----5-
27
= -----5
tenemos:
432 405
27
27 81
2
2
Var X = E X E X = ------ ------ = -------------------------- = -----80
80
5 16
2.
a) Para obtener la funcin de densidad, debemos derivar la funcin de distribucin. Fijaos en que la derivada de la funcin:
2
x 1
------------------9
es:
2
x 1 -------------------9
Por tanto, la funcin de densidad es:
2x 1
--------------------- , 1 x 4
x =
9
de otro modo
0
Variables aleatorias
49
FUOC P08/75057/02305
Variables aleatorias
f x dx =
P X 2 =
2 2
2 x 1 x 1
dx = ------------------ -------------------9
9
1
1
= --- 0 = --9
9
o la funcin de distribucin:
1
P X 2 = P X 2 = F 2 = --9
La probabilidad P 2 X 3 tambin se puede calcular utilizando la funcin
de densidad:
3
P2 X 3 =
2 3
f x dx =
2 x 1 x 1
dx = ------------------ -------------------9
9
4 1
1
= --- --- = --9 9
3
o la funcin de distribucin:
4 1
1
P 2 X 3 = P X 3 P X 2 = F 3 F 2 = --- --- = --9 9
3
c) Una vez conocida la funcin de densidad de probabilidad, calculamos la
esperanza y la varianza de X siguiendo el mismo procedimiento que en el ejercicio 1:
EX =
Y puesto que: E X =
2 x 1
2 3 1 2 4
x ---------------------- dx = ------ x --- x = 3
27
9 1
9
1 4 2 3 4 19
2 2x 1
x --------------------- dx = ------ x ------ x = ----- 18
27 1
9
2
19
1
2
2
Var X = E X E X = ------ 9 = --2
2
50
FUOC P08/75057/02305
Variables aleatorias
1. Distribucin uniforme
Comencemos con un ejemplo sencillo. Imaginad que tenemos una especie
de ruleta y la hacemos girar alrededor de su eje. Despus medimos el ngulo
que hemos recorrido.
Suponemos que al hacer girar nuestra ruleta, sta puede detenerse en cualquier punto de la circunferencia y que no hay puntos en los que tenga ms
tendencia a parar. Si llamamos X a la variable que nos da el ngulo, tendremos
que tomar valores entre 0 y 2. Segn nuestras hiptesis, si nos preguntan
P 0 X --- = --
4
2
ya que el ngulo que hemos pedido corresponde a una cuarta parte de los ngulos posibles y hemos supuesto que la probabilidad est distribuida de una
manera uniforme.
Tenemos as un primer ejemplo de una distribucin uniforme, en este caso en
el intervalo (0,2).
Sin embargo, es habitual tomar una variable uniforme con valores entre 0 y 1.
Puesto que la probabilidad de cualquier nmero debe ser la misma, la funcin
de densidad deber ser constante. Imponiendo que la integral de la funcin de
densidad valga 1, obtenemos que la funcin de densidad ha de ser constante a 1.
Como ya sabis,...
... el ngulo puede tomar un
valor entre 0 y 2.
51
FUOC P08/75057/02305
f x = 1, 0 x 1
0 de otro modo
En general, podemos definir una distribucin uniforme en un intervalo (a,b). Siguiendo el mismo razonamiento anterior, podemos obtener ahora su funcin
de densidad.
La funcin de densidad de la distribucin uniforme (a,b) es:
1
-----------fx = b a , a x b
de otro modo
0
P 0,4 X 0,6 =
1 dx
0,4
Fijaos en que la probabilidad depende slo del ancho del intervalo. As, esta probabilidad ser la misma que la probabilidad de obtener un valor entre 0,1 y 0,3.
La funcin de distribucin es:
x
F x =
1 dy
0
= x
Variables aleatorias
52
FUOC P08/75057/02305
Variables aleatorias
EX =
1 2
x dx = --2- x
0
1
0
1
= --2
x 0,5 dx
Var X = E X 0,5 =
1
3
= --- x 0,5
3
1
0
1
= -----12
Con clculos similares podemos obtener la funcin de distribucin, la esperanza y la varianza de una uniforme (a,b). Por ejemplo, la funcin de distribucin ser:
x
F x =
xa
= -----------ba
- dy
----------ba
a
Ex =
2
1
1
- dx = --------------------- x
x ----------ba
2b a
a
b
a
b a
1
= --------------------- = --- b + a
2b a
2
F x =
0,
xa
x a----------, axb
ba
1,
bx
1
1
2
Adems, E X = --- b + a y Var X = ------- b a
2
12
2. Distribucin exponencial
Una distribucin continua muy importante es la llamada distribucin exponencial.
En muchas ocasiones est relacionada con la distribucin de Poisson que vimos hace dos sesiones. Recordemos que la distribucin de Poisson se utiliza
para modelar el nmero de sucesos que se dan en una unidad de tiempo. Por
53
FUOC P08/75057/02305
Variables aleatorias
Consideremos el peaje
de una autopista
Hemos visto que el nmero de
coches que pasan por el peaje
durante un minuto se puede
representar con una variable
aleatoria Poisson. En cambio,
utilizamos una exponencial
para modelar el tiempo que
pasa entre el primer y el
segundo coche (y entre el segundo y el tercero, y entre
el tercero y el cuarto y etc.).
Para modelizar los tiempos de vida, tambin se utiliza la distribucin exponencial. Fijaos en que, en una distribucin exponencial, cuanto ms tiempo
pasa, menos probable es que se d el suceso.
Calculemos ahora la funcin de distribucin, la esperanza y la varianza. La
funcin de distribucin ser sta:
x
F x =
dy = e
y x
0
= 1e
Valores de la variable
EX =
xe
0
dx =
x
xe 0
+ e
0
1 x
dx = --- e
1
= --
54
FUOC P08/75057/02305
Variables aleatorias
Si X es una variable aleatoria con distribucin exponencial de parmetro entonces su funcin de distribucin es:
0,
x0
Fx =
x
1e , 0x
1
1
Adems, E X = --- y Var X = ----2
El tiempo de vida de una bombilla (en aos) sigue una exponencial de parmetro 3. LLamamos X a la variable aleatoria que nos da este tiempo de vida. Entonces tenemos que
su funcin de densidad ser:
0,
x0
fx =
3e 3x , 0 x
Su funcin de distribucin ser:
0,
x0
Fx =
1 e 3x , 0 x
El tiempo de vida esperado de la bombilla ser de 1/3 y su varianza, de 1/9.
A partir de aqu tambin podemos calcular cualquier probabilidad:
Notacin
Recordad que a veces
utilizamos la notacin ex y a
veces, exp(x).
PX 1 =
b) Probabilidad de que dure ms de dos aos; si los resolvemos con la funcin de distribucin:
P X 2 = 1 F 2 = exp 6 = 0,0025
3. Distribucin normal
La ley ms utilizada en estadstica es la llamada ley normal. La curva normal
aparece en numerosos fenmenos naturales: en la altura de una especie de rboles, en el nmero de glbulos rojos en la sangre y en la mayora de las caractersticas biolgicas que se pueden determinar. Tambin la distribucin de los
errores en un proceso de fabricacin se acerca a una ley normal, hecho que hace
que sea un trabajo fundamental en los procesos de control de calidad.
Una variable aleatoria X sigue una ley normal con media y varianza 2,
que denotaremos por N(,
2),
1
1
2
f x = --------------- exp ---------2 x
2
2
para todo x real.
El nombre de normal...
... proviene del hecho de que
se pensaba que era el patrn
natural de las distribuciones.
55
FUOC P08/75057/02305
Variables aleatorias
Campana de Gauss
Esta forma es conocida con el
nombre de la campana de
Gauss. El nombre de Gauss se
debe a que l fue uno de los
primeros en deducirla cuando
estudiaba los errores en observaciones astronmicas. Gauss
fue un famoso matemtico
alemn del siglo XVIII.
En este caso no tenemos una expresin explcita para la funcin de distribucin. Evidentemente, podemos darla como la integral de la densidad, es
decir, si X es una variable aleatoria con ley N(, 2), su funcin de distribucin es:
F x =
- exp --------- y dy
-------------2
2
1
pero dado que no sabemos calcular esta integral, esta expresin no nos sirve
de mucho y tendremos que utilizar las llamadas tablas de la normal.
El clculo de la esperanza
y la varianza requiere resolver unas
integrales bastante complicadas.
FUOC P08/75057/02305
56
Variables aleatorias
Atencin
Tened siempre cuidado cuando os den una ley normal.
Tenis que saber si os estn
dando la varianza o la desviacin tpica.
57
FUOC P08/75057/02305
Variables aleatorias
Como podis observar, las formas son diferentes. Para que veais bien la ltima,
quiz ser mejor verla con otra escala:
En las representaciones grficas hemos visto dibujado qu sucede cuando vara la . Cuando vara la , lo nico que tenemos que hacer es una translacin
y mover la curva hacia la derecha o hacia la izquierda.
3.2. Estandarizar
Una propiedad especial de la ley normal nos permite reducir el estudio de cualquier probabilidad de cualquier variable normal al estudio de una ley N(0,1).
Llamaremos a esta ley una distribucin normal estndar.
La distribucin normal estndar es la distribucin normal con esperanza 0 y varianza 1. Su funcin de densidad es:
1
1 2
f x = ----------- exp --- x
2
2
Normalmente la denotaremos con la letra Z.
Suponed que tenis X, una variable aleatoria con distribucin N(, 2). Si utilizamos la funcin de densidad, tenemos:
x2
P x1 X x2 =
- exp --------- x dx
------------- 2
2
1
x1
58
FUOC P08/75057/02305
x
Sin embargo, si hacemos el cambio de variable z = ------------ , podemos escribir esta
Variables aleatorias
x2
--------------
x1
--------------
1 - exp 1
--- z 2 dz
--------- 2
2
x1
x 2
=
P ------------- Z -------------
x2
--------------
x1
-------------
1 2
1---------exp --- z dz
2
2
x
donde la Z indica la variable ------------ .
x
As, la probabilidad de que la variable Z = ------------ tome valores en el intervalo
x 1 x 2
------------- -------------- viene dada por la integral entre estos puntos de la funcin de
densidad de una distribucin normal estndar. Por tanto, Z deber ser una ley
normal estndar.
una N(0,1).
La consecuencia fundamental de esta propiedad es que los clculos del rea bajo
la curva en trminos de la desviacin son los mismos para todas las densidades
normales.
Si X es una variable aleatoria con distribucin N(, 2) y Z una distribucin N(0,1), entonces para todo par k1,k2 de nmeros positivos:
P k2 X + k1 = P k2 Z k1
En particular, para todo k:
P k X + k = P k Z k
donde k no debe ser necesariamente entero.
As, encontramos:
la probabilidad del intervalo dado por una desviacin estndar a un lado y
otro de la media es siempre la misma, de 0,68. Podemos decir, por tanto, que
en una distribucin normal el 68% de los individuos toma valores entre la media menos una desviacin estndar y la media ms una desviacin estndar.
Normal estndar
La ley normal estndar es importante porque podemos reducir cualquier otra ley normal
a una de este tipo.
59
FUOC P08/75057/02305
Tambin podemos hacer el proceso inverso: si queremos tener una probabilidad del 0,90, debemos coger el intervalo dado por la media menos
1,645 desviaciones estndar y la media ms 1,645 desviaciones estndar, es
decir:
P 1,645 X + 1,645 = 0,90
Ejemplo de las resistencias
La fbrica XSE fabrica unas resistencias con un valor nominal de 100 ( es el smbolo
del ohmio, unidad de resistencia), pero en realidad la resistencia de las resistencias sigue
una distribucin normal con media 100,6 y desviacin estndar 3. Por tanto, tendremos:
a) El 68% de las resistencias tendr un valor real entre 97,6 y 103,6
b) El 95% de las resistencias tendr un valor real entre 94,6 y 106,6
c) El 99,7% de las resistencias tendr un valor real entre 91,6 y 109,6
d) Si queremos un intervalo que contenga el valor real del 90% de las resistencias, debemos considerar el intervalo 95,6650 y 105,5350
Comparar valores de diferentes leyes normales para ver cules son ms probables.
Reducir los clculos de probabilidades de cualquier variable normal en el
estudio de la distribucin normal estndar.
Veamos primero cmo comparar varios valores de diferentes poblaciones normales. Por ejemplo, imaginad que las alturas de los hombres de una determinada tribu de la selva de la Amazonia siguen una distribucin normal con media 167 cm
y desviacin estndar 3, mientras que las alturas de las mujeres siguen tambin
una distribucin normal, pero con media 162 cm y desviacin estndar 2. Cogemos a un hombre y una mujer de esta tribu y los medimos: el hombre mide
168 cm y la mujer, 163 cm. Claro que la mujer es ms baja que el hombre, pero
dentro de sus sexos, cul de los dos se puede considerar ms alto?
Variables aleatorias
60
FUOC P08/75057/02305
Variables aleatorias
Para responder a esta pregunta, lo que hacemos es estandarizar los dos valores,
es decir, pasarlos a observaciones de una normal estndar y despus compararlos. As, el valor estandarizado para el hombre es:
168
167------------------------= 0,333
3
y para la mujer:
163
162------------------------= 0,5
2
Puesto que 0,333 < 0,5 y los datos hacen referencia a la misma distribucin, la
mujer es, dentro de su sexo, ms alta que el hombre.
Sabemos que la fbrica XSE fabrica unas resistencias con un valor nominal de 100,
pero en realidad siguen una distribucin normal con media 100,6 y desviacin estndar
3. Por otra parte, la SXX fabrica tambin resistencias con un valor nominal de 100,
pero ahora en realidad siguen una distribucin normal con media 100,2 y desviacin
estndar 4.
Compramos una resistencia a la fbrica SXX cuyo valor real es de 106, y una resistencia
a la fbrica XSE con un valor real tambin de 106. As, sus valores estandarizados son:
106 100,6 3 = 1,8
para la resistencia comprada a XSE y de:
106 100,2 4 = 1,45
para la comprada a la fbrica SXX. Por tanto, la de XSE est en un lado alto si la comparamos con la de SXX.
Observacin
Dado que se trata de una ley
continua, es lo mismo P(X x)
que P(X < x).
61
FUOC P08/75057/02305
Para la normal estndar hasta hace poco se utilizaban unas tablas estadsticas,
pero actualmente es mucho ms sencillo y potente utilizar herramientas informticas. De todos modos, para acabar la sesin calculamos algunas probabilidades
utilizando las tablas (podis repetir los ejemplos con el software estadstico que
utilicis). Fijaos primero en que en la tabla que utilizaremos nos dan la cola su-
Variables aleatorias
Repasad el clculo
de probabilidades de la sesin
Variables aleatorias continuas.
Simplificacin
Reducimos todos los clculos
a expresiones del tipo P(Z a),
que son los que salen en las
tablas.
entonces P Z x = P Z x y P Z x = P Z x .
Esta ltima propiedad de simetra nos ser muy til para calcular probabilidades mediante las tablas.
Ejemplo del clculo de probabilidades
Supongamos que tenemos una variable aleatoria X con distribucin normal de media 6 y
varianza 4; calculemos lo siguiente:
a) Probabilidad de que X tome valores menores que 8:
X6 86
X6
X6
P X 8 = P ------------- ------------ = P ------------- 1 = 1 P ------------- 1
2
2
2
Mirando la tabla, encontramos por el punto 1,00 (la fila nos da las unidades y las dcimas
cogemos 1,0 y la columna la centsima cogemos 0,00) el valor 0,1587. As:
X6
P ------------- 1 = 0,1587
2
y, por tanto:
P X 8 = 1 0,1587 = 0,8413
b) Probabilidad de que X tome valores mayores que 3:
X6
36 X6
P 3 X = P ------------ ------------- = P 1,5 -------------
2
2
2
y por simetra de la normal:
X6
X6
P 1,5 ------------- = P 1,5 ------------- = 1 0,0668
2
2
c) Valor a tal que la probabilidad de que X sea mayor que a sea 0,22:
x6 a6
0,22 = P X a = P ------------ ------------
2
2
62
FUOC P08/75057/02305
4. Resumen
Hemos visto las distribuciones continuas ms habituales: la uniforme, la exponencial y la normal. Hemos hecho un estudio a fondo de esta ltima y hemos visto el proceso de estandarizacin y la reduccin de cualquier clculo
con una ley normal a un clculo con una ley normal estndar. Hemos visto
tambin cmo utilizar las tablas de la distribucin normal.
Variables aleatorias
63
FUOC P08/75057/02305
Ejercicios
1. Sabemos que el tiempo que transcurre entre que abrimos nuestra tienda de
ordenadores y la llegada del primer cliente sigue una distribucin exponencial
de parmetro 0,1 (en minutos). Si abrimos a las nueve y media, calculad:
a) La probabilidad de que llegue despus de las diez menos cuarto.
b) La probabilidad de que llegue exactamente a las 9.42 h.
c) La probabilidad de que no nos deje ni los cinco minutos necesarios para
fumar un cigarrillo.
d) La hora a la que esperamos que llegue.
2. En 1972 la altura de los hombres en edad militar en Espaa segua una distribucin normal con media 169 cm y desviacin estndar de 6 cm. Calculad:
a) Si eran rechazados los ms bajos de 150 cm y los ms altos de 200 cm, qu
proporcin de hombres tenan la suerte de ser rechazados?
b) Si un hombre en edad militar meda 175 cm y se encontraba, por ejemplo en
un bar, a otro hombre en edad militar, cul es la probabilidad de que el primero
fuese ms alto que el segundo? Y de que fuesen exactamente iguales?
c) Calculad el valor estandarizado de vuestra altura y la probabilidad de que
un hombre en edad militar del ao 1972 fuese ms alto que vosotros. Creis
que este resultado todava es cierto?
d) Determinad un intervalo en el que se encuentren las alturas del 90% de los
hombres en edad militar.
Solucionario
1. Llamaremos X a la variable que nos da el tiempo entre que abrimos y la llegada del primer cliente. Entonces deberemos calcular:
a) Realizaremos este apartado utilizando la funcin de densidad:
P X 15 =
15
b) Puesto que se trata de una ley continua, la probabilidad de que tome un valor concreto ser cero, es decir:
P(X 12) 0
c) Realizaremos este apartado utilizando la funcin de distribucin:
P X 5 = P X 5 = F 5 = 1 exp 0,5 = 0,3935
d) La esperanza de la variable aleatoria X es 1/0,1 10. Esperamos, por tanto,
que el primer cliente llegue a las 9.40 h.
2. Haremos este problema utilizando la tabla de la distribucin normal estndar. De todos modos, si despus lo repets utilizando un software estadstico, encontraris unos resultados ms precisos y ms rpidamente.
Variables aleatorias
64
FUOC P08/75057/02305
6
Y 169
Y 169 200 169
P Y 200 = P -------------------- -------------------------- = P -------------------- 5,1667
6
6
que mirando a la tabla es despreciable. Por tanto, nos sale una probabilidad de
0,0008.
b) Nos piden primero:
Y 169
Y 169 175 169
P Y 175 = P Y 175 = P -------------------- -------------------------- = P -------------------- 1 =
6
6
= P Z 1 = 1 P Z 1 = 1 0,1587 = 0,8413
y la probabilidad de que midan exactamente igual ser:
P(Y 175) 0
ya que la normal es una distribucin continua.
c) Supongamos que un hombre mide 181 cm de altura. Su valor estandarizado ser:
181
169------------------------= 2
6
y si miramos la tabla de la normal, tenemos que slo el 2,28% de los hombres
en edad militar eran ms altos que nuestro hombre. Creemos que hoy en da
esto no es cierto.
d) Debemos coger el intervalo dado por la media menos 1,645 desviaciones
estndar y la media ms 1,645 desviaciones estndar, es decir:
(169 (1,645 6);169 + (1,645 6)) = (159,13;178,870)
Variables aleatorias
65
FUOC P08/75057/02305
Variables aleatorias
Procesos estocsticos
Acabaremos este mdulo con una ltima sesin dedicada a introducir, de manera bsicamente descriptiva, el concepto de proceso estocstico. Aunque la
utilizacin de procesos estocsticos supera con creces el objetivo de este curso,
a causa de su importancia (por ejemplo, se utilizan procesos estocsticos en el
tratamiento de imgenes, el reconocimiento de la voz o el estudio de colas) es
interesante que conozcis algunas de sus ideas. Sin embargo, veris que el tratamiento de esta sesin es un tanto diferente al de las otras, es bastante ms corta y no encontraris ejercicios.
1. Definiciones
Estocstico o aleatorio
Podemos usar indistintamente
los trminos procesos estocsticos o procesos aleatorios.
Consideremos, por ejemplo, el consumo de electricidad en la ciudad de Barcelona durante un da. Supongamos que a cada instante t (t 0 indicar el principio del da) sabemos que el consumo de electricidad sigue una distribucin
2
Sin embargo, lo ms probable es que no nos interese especialmente el consumo en un instante concreto, sino que queramos estudiar cmo se comporta el
consumo de electricidad a lo largo de todo el da. As, en realidad, nos interesa
considerar la familia de variables aleatorias:
X(t), 0 t 86400
Unidad de tiempo
Daremos el tiempo en segundos: 24 horas =86.400 segundos.
66
FUOC P08/75057/02305
Como ya hemos comentado, el resultado de la realizacin de una variable aleatoria es un valor numrico. En cambio, el resultado de la realizacin de un proceso estocstico es una funcin que depende del tiempo y que llamaremos
trayectoria.
En el caso anterior, en el que estudibamos el consumo de electricidad en Barcelona, si cogemos un da determinado, podemos obtener la trayectoria (realizacin) siguiente:
Mientras que para otro da podemos obtener otra (realizacin) diferente, como
por ejemplo:
Variables aleatorias
Observacin
Para cada instante t fijado, X(t)
es una variable aleatoria.
67
FUOC P08/75057/02305
En un proceso a tiempo discreto tenemos una familia de variables aleatorias indexada slo sobre los naturales:
X n , n N
En un proceso a tiempo continuo tenemos una familia de variables aleatorias indexada en un intervalo:
X t , 0 t T
Variables aleatorias
Notacin
En los procesos a tiempo
discreto utilizamos X(n)
en lugar de X(t).
68
FUOC P08/75057/02305
Variables aleatorias
en la que claramente eX(5) vale 1, mientras que si el resultado de los cinco lanzamientos es , , C, C, C, llegamos al mismo punto pero con una trayectoria
diferente.
X n =
I k .
k=1
69
FUOC P08/75057/02305
Variables aleatorias
Esta forma de expresar cada X(n) nos permite estudiar algunas de sus propiedades. Observad primero que es muy fcil comprobar que:
E(I(k)) = P(I(k) = 1) P(I(k) = 1) = 0
Var(I(k)) = 12P(I(k) = 1) + (1)2P(I(k) = 1) = 1
Puesto que las I(k) son variables aleatorias independientes (el resultado de un
lanzamiento de la moneda no afecta a los otros lanzamientos), utilizando las
propiedades de la esperanza y de la varianza que hemos estudiado, tenemos:
n
E X n = E I k =
k = 1
EIk
= 0
k=1
Var X n = Var I k =
k = 1
Var I k
= n
k=1
Es decir, en cualquier paso la esperanza nos indica que deberamos estar al nivel cero, pero con una varianza cada vez mayor.
Observacin
No hay que confundir el proceso de Poisson con la distribucin
de Poisson.
70
FUOC P08/75057/02305
Variables aleatorias
donde S(1) indica el instante en que llega la primera peticin, S(2) indica el
instante en que llega la segunda y, en general, S(i) indica el instante en que llega
la i-sima.
ste es un ejemplo de un proceso que se puede representar utilizando el proceso
de Poisson. Tiene algunas caractersticas fundamentales:
Para cada instante t, X(t) seguir una distribucin de Poisson de parmetro
t , donde es un parmetro que depende del proceso.
Las diferencias entre los tiempos de llegada siguen una distribucin exponencial de parmetro , es decir, S(i 1) S(i) siguen una exponencial de
parmetro .
As, tenemos la propiedad siguiente:
Ejemplo de la centralita
Las llamadas que llegan a una centralita siguen un proceso de Poisson de parmetro 2
(daremos el tiempo en minutos). Podemos calcular las probabilidades siguientes:
a) Probabilidad de que en los cinco primeros minutos lleguen exactamente cuatro llamadas.
La variable X(5), que corresponde al nmero de llamadas que hemos recibido hasta el minuto 5, sabemos que seguir una distribucin de Poisson de parmetro 2 5 10, por tanto:
4
10
P X 5 = 4 = -------------- exp 10 = 0,0189
4!
b) Probabilidad de que entre la primera y la segunda llamada pasen ms de tres minutos.
Si llamamos Y a la variable que nos da el tiempo que transcurre entre la primera y la segunda llamada, por la definicin del proceso de Poisson sabemos que seguir una distribucin exponencial de parmetro 2.
As, debemos calcular:
PY 3 =
2 exp 2x dx = exp 2x
= exp 6 = 0,0025
Proceso de cuenteo
El proceso de Poisson es un
proceso de cuenteo, ya que
nos dedicamos a contar el nmero de veces que sucede un
acontecimiento. El nombre de
proceso de Poisson proviene
del hecho de que las leyes que
aparecen son del tipo Poisson.
FUOC P08/75057/02305
71
que slo puede tomar los valores 1 1 y que al inicio vale 1 1 con probabilidad 0,5. El proceso X(t) cambia de polaridad (pasa de 1 a 1 o a la inversa)
en los puntos de salto del proceso de Poisson, de manera que obtendremos trayectorias del tipo siguiente:
Variables aleatorias
Proceso de la seal
telegrfica
A partir del proceso de Poisson
podemos construir fcilmente el proceso de la seal telegrfica.
Terminologa
Como podis suponer, el nombre de movimiento browniano
proviene del Sr. Brown. El
nombre de Wiener es el del
matemtico que hizo la primera
construccin rigurosa del
proceso.
Finanzas
FUOC P08/75057/02305
72
Entre muchas otras caractersticas, presenta una que lo hace muy til: las leyes
que aparecen son distribuciones normales.
Si {X(t), t 0} sigue un proceso de Wiener, entonces X(t) sigue una distribucin normal con media 0 y varianza t2.
4. Resumen
Hemos presentado el concepto de proceso estocstico para estudiar situaciones en las que no podemos utilizar una nica variable aleatoria. Asimismo, hemos presentado algunos de los procesos ms habituales: el paseo aleatorio, el
proceso de Poisson y el proceso de Wiener.
Variables aleatorias