Академический Документы
Профессиональный Документы
Культура Документы
Variables estadsticas
unidimensionales: la Binomial y la
Normal
La Estadstica es la rama de las Matemticas que se ocupa del estudio de los procedimientos
y los mtodos para trabajar con datos, con el n de obtener informacin relacionada con ellos.
Podemos distinguir entre dos grandes bloques dentro de la Estadstica.
z La Estadstica Descriptiva, que se encarga de la recogida de datos, su representacin y
elaboracin de tablas para su posterior estudio.
z La Estadstica Inferencial, que se ocupa del diseo de mtodos o modelos con el objetivo
de obtener informacin acerca de ciertos parmetros que nos interesan.
Ambas partes trabajan con algunos conceptos generales que repasamos a continuacin.
I Poblacin (o universo): es el conjunto formado por todos los elementos que son objeto del
estudio estadstico.
I Individuo: es cada uno de los elementos de la poblacin.
I Muestra: es cualquier subconjunto de la poblacin.
I Tamao: es el nmero de individuos de la muestra.
Volveremos a repasar estos conceptos en el captulo 12.
31
32
11.1.
Variables estadsticas
Llamaremos variable estadstica (o carcter) a cualquier cualidad que tienen todos los
individuos de la poblacin a estudiar. A los distintos valores que puede tomar una variable los
llamaremos modalidades. Las variables estadsticas se clasican en cualitativas (sus modalidades no son numricas; por ejemplo, el color de ojos toma los valores marrn, azul, verde,
negro, etc.) y cuantitativas (sus modalidades son numricas; por ejemplo, el peso o la estatura
de las personas). En este estudio slo trabajaremos este ltimo tipo de variables.
Las variables estadsticas cuantitativas (a las que, a partir de ahora, llamaremos simplemente
variables ya que son las nicas que nos interesan) se dividen a su vez en:
Discretas, si slo pueden tomar un nmero nito de modalidades distintas (a veces se admite
que sea innito numerable). Por ejemplo, el nmero de hermanos.
Continuas, si pueden tomar, al menos tericamente, todos los valores comprendidos en un
intervalo. Por ejemplo, el peso o la estatura de una persona.
En lo que sigue, y dado que el presente curso slo pretende hacer una introduccin somera
a la Estadstica, desarrollaremos la teora principalmente para variables discretas. No obstante,
utilizando marcas de clase de intervalos, todo se puede generalizar a variables continuas.
11.1.1.
Tabla de frecuencias
En lo que sigue, sea X una variable estadstica (cuantitativa) discreta que toma un nmero
nito de valores distintos. Representaremos por fx1 ; x2 ; : : : ; xk g a las distintas modalidades que
puede tomar X; si fuese continua, las agruparamos en intervalos
f [x1 ; x2 [ ; [x2 ; x3 [ ; : : : ; [xk
2 ; xk 1 [ ;
[xk
1 ; xk ]
g;
y trabajaramos con la marca de clase (el punto medio de cada intervalo) como lo haremos
a continuacin con cada modalidad xi . Supongamos que cada modalidad xi se repite en la
poblacin (o en la muestra) un nmero ni de veces, al que llamaremos frecuencia absoluta de
la modalidad xi . Llamemos N = n1 + n2 + : : : + nk al tamao total de la poblacin estudiada.
Representaremos por fi a la frecuencia relativa de la modalidad xi , que se dene como fi =
A. Roldn
33
ni
Ni
fi
Fi
x2i ni
xi ni
x1
x2
..
.
(11.1)
xk
N
N
(1)
1
1
xi ni
(2)
x2i ni
(3)
11.1.2.
Existen diversas formas para representar una distribucin cuantitativa: diagrama de puntos,
diagrama de barras, histograma, polgono de frecuencias. Tambin para representar un cualitativa: diagrama de sectores, pictograma.
### Poner ejemplos.
11.2.
Los parmetros asociados a una distribucin son nmeros que indican alguna propiedad de la
misma. Podemos dividirlos en medidas de centralizacin (que indican valores representativos
de la distribucin en algn sentido) y de dispersin (que indican cmo de unidos o separados
est dichos valores).
11.2.1.
Medidas de centralizacin
Son nmeros que tratan de representar, en algn sentido, a toda la distribucin, o tratan
de aportar alguna informacin sobre la misma. Indudablemente, la ms importante es la media
aritmtica.
A. Roldn
34
Media (aritmtica)
Llamaremos media aritmtica (o simplemente, media) de la variable X, y la representaremos por X o por X (o simplemente por ), al nmero:
X=
k
X
xi fi = x1 f1 + x2 f2 + : : : + xk fk :
(11.2)
i=1
Como se puede observar, el smbolo signica sumatoria, e indica la suma de todos los trminos
que hay dentro cuando se vara el ndice a que hace referencia (en este caso, i). Teniendo en
cuenta que fi = ni =N , la forma ms usual de determinar la media es
k
X=
1X
xi ni ;
N
(11.3)
i=1
que se consigue dividiendo la casilla (2) entre la casilla (1) en la tabla de frecuencias (11.1). La
media aritmtica es un parmetro que nos da una idea de en torno a qu valor se encuentran
concentrados los valores de la variable estadstica (aunque en ocasiones no resulte un valor
demasiado representativo). Entre las propiedades ms interesantes de la media destacamos las
siguientes:
Cambio de origen: si le sumamos (o restamos) una constante C a todos los valores de la
variable X, yi = xi + C, la media de la nueva variable Y = X + C es la media de la variable
anterior ms la constante C.
Y = X + C:
Cambio de escala: Si multiplicamos todos los valores de la variable X por una constante C,
yi = C xi , la media de la nueva variable Y = CX es la media de la anterior multiplicada
por C.
Y =C X
La media de las desviaciones de los valores de la variable con respecto a la media aritmtica
es cero.
k
X
xi X ni = 0:
i=1
Moda
La moda de la variable X es el valor (o valores) que posee mayor frecuencia absoluta, es
decir, la modalidad que ms se repite en la distribucin. Se representa por M o. Puede haber
varias modas en una misma distribucin, por lo que se puede hablar de distribuciones bimodales,
trimodales, etc.
A. Roldn
35
Mediana
La mediana de la variable X es el valor numrico que deja igual nmero de observaciones
inferiores a l que superiores. Se representa por M e.
Percentil
Se llama percentil de orden m, y lo denotaremos por Pm , al valor numrico que deja a su
izquierda un m % de valores de la distribucin. As, se habla tambin de cuartiles (si se divide
la distribucin en cuatro partes equifrecuentes) y deciles (en diez partes).
11.2.2.
Medidas de dispersin
Las medidas de dispersin tratan de indicar la forma con la que se distribuyen las modalidades
sobre la recta real. Sin duda, la ms importante es la varianza (y su raz cuadrada). Aunque
comenzamos explicando un coeciente que da una idea clara de cmo tener una concepcin
rpida de la dispersin de la variable.
Recorrido
El recorrido de una distribucin se dene como la diferencia entre los valores mayor y menor
de la variable.
rec X = xmax
xm n :
Este parmetro no da una idea de un valor central, sino de cmo se dispersan los valores de la
variable.
Varianza
2 o por s2 (o simplemente
Llamaremos varianza de la variable X, y la denotaremos por X
X
2
2
por
o por s si no hace falta indicar la variable), a la media aritmtica de los cuadrados de
las desviaciones de los valores de la variable con respecto a la media aritmtica del colectivo, es
decir,
k h
i
X
2
2
2
=
s
=
x
X
f
(11.4)
i
i :
X
X
i=1
A. Roldn
36
X2 =
= X2
1X 2
xi ni
N
X 2;
(11.5)
i=1
lo cual se consigue dividiendo la casilla (3) entre la casilla (1) en la tabla de frecuencias (11.1) y
restndole el cuadrado de la media. La varianza indica la forma en la que se distribuyen los datos
alrededor de la media aritmtica, de tal forma que cuanto mayor sea, ms dispersos estn los
datos, y cuanto ms prxima est a cero, ms agrupados estn. Sus principales caractersticas
son las siguientes.
2
2
A la varianza no le afectan los cambios de origen, ya que si Y = X + C, entonces Y2 = X
(esto es debido a que no slo se trasladan los datos, tambin lo hace la media aritmtica).
Si Y = CX, entonces
2
Y
= C2
2
X,
Desviacin tpica
Llamaremos desviacin tpica de la variable X, y la denotaremos por X o por sX (o
simplemente por o por s si no hace falta indicar la variable), a la raz cuadrada (no negativa)
de la varianza.
q
2
=
X
X:
Para calcularla, se debe determinar primeramente la varianza con la frmula (11.5). La desviacin
tpica tiene las mismas propiedades que la varianza.
0.
=C
X,
;X +
verica:
37
I En el intervalo X
2 ;X + 2
I En el intervalo X
3 ;X + 3
La correccin con este factor resuelve clculos muy complicados. Adems, como ya indicaremos,
la cuasivarianza muestral es un estimador insesgado de la varianza poblacional, lo que lo convierte en el mejor estimador posible. De la misma forma, llamaremos cuasidesviacin tpica
de la variable X a la raz cuadrada de su cuasivarianza.
q
2 :
(11.7)
^X = ^X
Coeciente de variacin
La desviacin tpica permite comparar la dispersin de distribuciones cuyas medias aritmticas estn prximas y vengan expresadas en las mismas unidades. Ahora bien, si las medias de
las distribuciones son muy dispares, la comparacin a travs de la desviacin tpica no es nada
representativa. Se utiliza entonces el coeciente de variacin de la variable X, que se dene
como el cociente entre su desviacin tpica y su media aritmtica (si sta no es nula).
CX =
Desviacin media
La varianza de X da una idea de cmo de prximos estn los valores de la distribucin de
su media aritmtica. Pero tiene la desventaja de que lo hace elevando al cuadrado, de tal forma
que las unidades pueden sufrir modicaciones. Una forma de arreglar este problema es tomar las
diferencias respecto de la media aritmtica en valor absoluto, lo que da lugar a la desviacin
media de la variable X, que se dene como
Dm =
k
X
i=1
xi
fi =
1X
N
xi
ni :
(11.8)
i=1
A. Roldn
38
El problema que tiene este parmetro es que es mucho ms laborioso de calcular, pues es inevitable calcular todas las desviaciones respecto de la media aritmtica.
Ejercicio 19 En el instituto Acci hay 800 alumnos y alumnas, de los cuales 85 llevan un
piercing, 23 llevan dos y 7 llevan tres. Realiza un estudio completo de la variable estadstica que
mide el nmero de piercing en el Acci.
Solucin :
Sea X la variable estadstica que mide el nmero de piercing que lleva cada alumno
o alumna. Una tabla de frecuencias sencilla es la siguiente:
xi
0
1
2
3
ni
685
85
23
7
Ni
fi
Fi
685
770
793
800
00 856
00 856
00 106
00 962
00 029
00 009
00 991
1
800
xi ni
x2i ni
xi
0
85
46
21
0
85
92
63
1300 15
152
240
2600 3
ni
680 85
410 63
190 67
La media y la varianza son los dos coecientes que debemos aprender a calcular ms rpidamente,
porque son los ms importantes.
8
152
0
>
>
< X = 800 = 0 19;
>
>
: 2 = 240 00 192 = 00 2639:
X
800
N
N
2
^X
=
800 0
0 2639
799
00 264:
2600 3
800
00 325:
11.3.
Sea X una variable estadstica (cuantitativa). Denotemos por X y por X a su media aritmtica y a su desviacin tpica. Como hemos visto al explicar los parmetros anteriores, si llamamos
A. Roldn
39
Y = X X, tendremos una nueva variable cuya media es cero y de igual desviacin tpica que
X, es decir,
Y = X X = 0;
Y = X:
Hemos ganado que ahora su media est centrada en el cero, pero queremos hacer un proceso
para tener controlada tambin su desviacin tpica. Para ello, recurrimos a un cambio de escala
dividiendo entre X (si este valor no es nulo, es decir, si la variable no es constante). Denimos
as
X X
Y
=
:
Z=
X
Esta nueva variable tiene media cero y desviacin tpica uno, ya que
Z=
Y =
0
X
= 0;
1
Y
X
= 1:
Este proceso se denomina tipicacin de la variable X, y nos permite construir otra variable
de media cero y desviacin tpica uno, ntimamente relacionada con la anterior.
8
8
<
<
media X;
media 0;
X X
X!
)
Z=
!
: desv. tpica
: desv. tpica 1:
X
;
X
Este proceso sirve para comparar datos de distribuciones distintas. Otra ventaja de la tipicacin
es que la variable Z sigue conservando el mismo tipo de distribucin que X, es decir, si X sigue
una distribucin normal, entonces Z tambin posee el mismo tipo de distribucin.
11.4.
Variables aleatorias
Hay ocasiones en que nos interesa estudiar probabilidades asociadas a funciones que relacionan sucesos aleatorios y nmeros (por ejemplo, la probabilidad de que un alumno, elegido
al azar, tenga tres hermanos). Necesitamos as introducir el concepto de funcin denida sobre
algunos tipos de sucesos.
Denicin 11.4.1 Sea E el espacio muestral asociado a algn experimento aleatorio. Llamaremos variable aleatoria a cualquier ley X : E ! R que asocie un nmero real a cada suceso
elemental. Llamaremos recorrido de la variable aleatoria X, y lo denotaremos por rec X o
por X (E), al conjunto de valores reales que forman sus imgenes.
Esta denicin es parecida a la de funcin de probabilidad p : S ! R, pero tiene dos diferencias importantes: en primer lugar, la funcin de probabilidad se puede aplicar a cualquier
suceso del espacio de sucesos, mientras que la variable aleatoria slo se puede aplicar a sucesos
elementales. En este sentido, es ms restrictiva. Sin embargo, la funcin de probabilidad est
acotada entre cero y uno, mientras que la variable aleatoria puede tomar cualquier valor real.
A. Roldn
40
11.4.1.
Una de las primeras necesidades que nos planteamos es la de traducir probabilidades sobre
un espacio de sucesos a conjuntos de nmeros reales. Por ejemplo, nos interesa la probabilidad
de que, al lanzar cuatro monedas aparezcan exactamente dos cruces, o menos de dos cruces, o
al menos dos cruces, o no aparezcan dos cruces. Esta necesidad de hacer intervenir los nmeros
reales relacionndolos con probabilidades justica las siguientes deniciones.
Denicin 11.4.4 Sea (E; S; p) un espacio de probabilidad y sea X : E ! R una variable
aleatoria. Dado cualquier subconjunto de nmeros reales A
R, llamaremos probabilidad
de que X pertenezca al conjunto A, y la denotaremos por p (A) o por p (X 2 A), a la
probabilidad del suceso aleatorio formado por todos los sucesos elementales de E cuyas imgenes
por X pertenecen al conjunto A, es decir,
p (A) = p (X 2 A) = p (f ! 2 E / X (!) 2 Ag) :
Llamaremos funcin de distribucin asociada a la variable aleatoria X, y la denotaremos por FX (o, abreviadamente, por F ), a la funcin FX : R ! R (real de variable real) que
a cada nmero x 2 R le asocia la probabilidad de que la variable X tome valores en el intervalo
cerrado no acotado ( 1; x].
FX (x) = p (X
x) = p (X 2 ( 1; x]) = p (f ! 2 E / X (!)
xg) :
(11.9)
41
1
5) = p (X 2 f3g) = p (f3g) = :
6
F (6) = p (X
F (15) = p (X
F (30) = p (X
F ( 2) = p (X
11.4.2.
2
1
= :
6
3
5
15) = p (X 2 f3; 6; 9; 12; 15g) = p (f3; 6; 9; 12; 15g) = :
6
30) = p (X 2 f3; 6; 9; 12; 15; 18g) = p (E) = 1:
2) = p (X 2 ?) = p (?) = 0:
Al igual que las variables estadsticas, las variables aleatorias de clasican en discretas o
continuas segn si el nmero de valores que pueden tomar es nito (o incluso innito numerable)
o bien pueden tomar, al menos tericamente, todos los valores de un intervalo real. En el primer
caso est la variable que mide el nmero de hermanos de una persona, el nmero de tornillos
defectuosos que fabrica una mquina en un da, el nmero del calzado que utiliza, etc. En el
segundo grupo tenemos la variable aleatoria que mide el peso o la estatura de una persona, el
tiempo que tarda en llegar al trabajo, la energa que gasta una mquina para calentar un litro
de leche, etc.
El ejemplo ms conocido de variable aleatoria discreta es el caso de la variable binomial, y el
de variable continua es el de variable normal. Dedicamos el resto del captulo a familiarizarnos
con estas distribuciones de probabilidad, que sern de gran importancia en lo que resta del
temario.
11.5.
fX (x) = p (X = x) :
Como suponemos que X slo toma un nmero nito de valores distintos, su funcin de densidad
es siempre nula salvo en los propios valores que puede tomar, en los que vale:
pi = fX (xi ) = p (X = xi ) ;
8i 2 f1; 2; : : : ; kg :
A. Roldn
42
Evidentemente,
p1 + p2 + : : : + pk = p (X 2 fx1 ; x2 ; : : : ; xk g) = p (X 2 E) = p (E) = 1:
Llamaremos media (o esperanza matemtica) de la variable X, y la denotaremos por X (o
por X o por E (X)), al nmero real
X=
k
X
xi pi = x1 p1 + x2 p2 + : : : + xk pk :
(11.10)
i=1
Se trata de la misma denicin que en (11.2) cambiando las frecuencias relativas por probabilidades. De la misma forma, llamaremos varianza de la variable X al valor
2
X
= s2X =
k h
X
xi
i=1
i
pi ;
(11.11)
X2
X =
k
X
x2i pi
X 2:
(11.12)
i=1
2:
(11.13)
11.5.1.
La distribucin binomial
43
Es claro que X toma valores naturales entre 0 y n, pues no se pueden obtener menos de cero
xitos ni ms de n xitos. Por tanto,
rec X = f0; 1; 2; : : : ; ng :
Aunque no vamos a demostrarlo, la probabilidad de que X tome cualquiera de estos valores es
exactamente
pk = p (X = k) =
n
k
pk q n
k;
8k 2 f0; 1; 2; : : : ; ng
n
k
(11.14)
n!
:
k! (n k)!
n p q
Ejercicio 20 Ana ha estudiado 12 de los 20 temas que componen el temario de una asignatura.
Si realiza 5 exmenes sobre el temario, calcula la probabilidad de:
Solucin :
5
2
00 62 00 43 = 00 230 4
23 %:
A. Roldn
44
5
3
3) = p (X = 3) + p (X = 4) + p (X = 5) =
00 63 00 42 +
5
4
00 64 00 41 +
5
5
00 65 00 40 =
68 %:
5
0
00 60 00 45 = 00 010 24
1 %:
Finalmente, la probabilidad de que apruebe algn examen, que podramos calcularla como:
p (X
1) = p (X = 1) + p (X = 2) + p (X = 3) + p (X = 4) + p (X = 5) ;
1) = 1
p (X < 1) = 1
p (X = 0) = 1
00 01024 = 00 98976
99 %:
p0 = p (X = 0) =
3
0
00 70 00 33 = 00 027;
p1 = p (X = 1) =
3
1
00 71 00 32 = 00 189;
p2 = p (X = 2) =
3
2
00 72 00 31 = 00 441;
p3 = p (X = 3) =
3
3
00 73 00 30 = 00 343:
pi
xi pi
x2i ni
0
1
2
3
00 027
00 189
00 441
00 343
0
0
0 189
00 882
10 027
0
0
0 189
10 764
30 087
20 1
50 04
8
20 1
>
>
< X=
= 20 1;
1
>
p
p
>
:
50 04 20 12 = 00 63 :
X =
n p q =
3 00 7 00 3 =
45
n=0
60 %
40 %
&
00 6
xito
00 4
Fracaso
n=1
Pero la fuente puede continuar hacia abajo, teniendo en cuenta que por la izquierda cae el 60 %
del agua (y se aade un xito) y por la derecha el 40 % (y se aade un fracaso).
1
00 6
00 36
1E
n=0
.
&
2E
&
00 48
00 4
1F
n=1
&
1E1F
00 16
2F
n=2
Debajo de cada nmero se indica el nmero de xitos y fracasos; por ejemplo, 1E1F signica un
xito y un fracaso. Obsrvese tambin cmo a la fuente central le cae agua (probabilidad) de las
dos posiciones superiores, por lo que acumula: 00 6 00 4 + 00 4 00 6 = 00 48. Y la tabla seguira:
1
00 6
00 36
00 216
00 1296
4E
3E
.
&
2E
00 3456
3E1F
.
&
.
&
1E
00 432
2E1F
00 3456
3E2F
.
&
.
&
.
n=0
&
00 48
1E1F
00 3456
2E2F
.
&
.
&
00 4
1F
00 288
1E2F
00 2304
n=1
&
.
&
.
00 16
2F
00 1536
n=2
&
.
1E3F
2E3F
A. Roldn
00 064
3F
n=3
&
00 025
4F
46
11.6.
Una variable aleatoria (cuantitativa) se dice continua si puede tomar, al menos de forma
terica, todos los valores de un intervalo. Como en ste hay una cantidad de nmeros innita
no numerable, no es posible que la probabilidad de que la variable tome los valores del intervalo
sea positiva, pues entonces una suma no numerable de nmeros estrictamente positivos nunca
est acotada superiormente. Por eso, la probabilidad de que una variable continua tome un valor
concreto es cero. Realmente, no debera ser cero, porque podra ocurrir que la estatura de un
determinado alumno fuese de 165 m, pero como no tenemos un instrumento de medida lo
sucientemente sutil como para armarlo de forma tajante (podremos sacar 20 decimales a su
altura, pero no 300), preferimos hablar de la probabilidad de que la altura del alumno est en
el intervalo ]10 6499; 10 6501[.
Esto modica sustancialmente la forma que tenemos de calcular probabilidades con una
variable continua, pues debemos hacer una denicin con integrales (quiz no sea el objetivo de
este curso saber calcular las siguientes integrales; si es as, psate a la seccin 11.6.1).
Denicin 11.6.1 Sea (E; S; p) un espacio de probabilidad y sea X : E ! R una variable
aleatoria. Diremos que X es una variable continua si existe una funcin integrable fX : R ! R,
llamada funcin de densidad de X, de manera que la probabilidad de que la variable aleatoria
X tome valores en un intervalo I es la integral (denida o no) de fX en I, es decir,
Z
p (X 2 I) = fX (x) dx; 8I R; I intervalo:
(11.15)
I
fX (x) dx:
De acuerdo con esta denicin, la probabilidad de que la variable tome un valor puntual es nula,
ya que
Z
a
p (X = a) = p (X 2 [a; a]) =
fX (x) dx = 0:
Por ello, es lo mismo considerar intervalos abiertos que cerrados (o semiabiertos o semicerrados). La condicin (11.15) impone varias restricciones sobre la posible funcin de densidad fX .
Esencialmente, esta funcin debe ser no negativa (fX
0) y su integral (impropia) en R debe
valer uno.
Z
fX (x) dx = p ( 1 < X < +1) = p (E) = 1:
R
A. Roldn
47
Utilizando esta funcin de densidad (que, si existe, es nica c.p.d.), es posible denir los principales parmetros de la variable X. Por ejemplo, llamaremos media (o esperanza matemtica) de la variable X, y la denotaremos por X (o por X o por E (X)), al valor real:
Z
[x fX (x)] dx:
X=
R
= X2
X2 =
x2 f (x) dx
X 2:
2:
11.6.1.
La distribucin normal
Existe una variable aleatoria que tenga cualquier media (real) y cualquier desviacin tpica
(no negativa)? Si = 0, la variable es constantemente igual a la media, y hemos acabado.
Este caso es trivial y no nos interesa en lo sucesivo. Y si > 0? La respuesta es positiva y
se puede conseguir con la distribucin normal, que tiene una funcin de densidad ciertamente
peculiar. A partir de ahora, supondremos que las variables que intervengan no son constantes,
es decir, > 0.
Denicin 11.6.2 Sea 2 R cualquier nmero real y sea 2 R+ cualquier nmero positivo.
Denotaremos por f ; a la funcin f ; : R ! R (real de variable real) denida por
f
1
(x) = p
2
1
2
(x
) ;
8x 2 R:
> 0) y continua en R.
.
A. Roldn
48
a ambos lados.
(x) dx = 1:
a
Los parmetros
A. Roldn
49
y su desviacin tpica es .
= :
Z=
(11.16)
,! N (0; 1)
Esto nos permite calcular probabilidades normales en cualquier distribucin con slo utilizar la
tabla de la distribucin normal estndar. Es lo que haremos a continuacin.
y
1
x) = p
2
FZ (x) = p (Z
t2
2
dt:
Z
Z
a) = p (Z > a) = 1
b) = p (Z
b)
p (Z
a) = p (a
b)
p (Z
a) :
a) :
A. Roldn
50
a) ;
a>0
p (Z
a) ;
a>0
p (Z
a) ;
a<0
p (Z
a) ;
a<0
p (a
a; b > 0
b)
p (Z
10 12) = 00 8686:
p (Z
20 39) = 00 9916:
p (Z
10 98) = 1
p (Z
10 98) = 1
00 9761 = 00 0239:
p (Z
00 25) = 1
p (Z
00 25) = 1
00 5987 = 00 4013:
p (Z
00 76) = 1
p (Z
00 76) = 1
00 7764 = 00 2236:
p (Z <
00 3) = p (Z > 00 3) = 1
p (Z
00 3) = 1
00 6179 = 00 3821:
p (Z
20 5) = p (Z > 20 5) = 1
p (Z
20 5) = 1
00 9938 = 00 0062:
p (Z <
p (Z >
10 4) = p (Z
p (Z
00 58) = p (Z
00 58) = 00 7190:
p (Z >
30 05) = p (Z
30 05) = 00 9989:
p (00 1 < Z
p (Z
10 48) = 1
00 9306 = 00 0694:
10 4) = 00 9192:
10 05) = p (Z
10 05)
p (Z
00 1) = 00 8531
00 5398 =
= 00 3133:
p (20 03
20 98) = p (Z
20 98)
p (Z
20 03) = 00 9986
00 9788 =
20 17)
p (Z
00 39) = 00 9850
00 6517 =
= 00 0198 = 00 0197:
p (00 39 < Z < 20 17) = p (Z
= 00 3133:
A. Roldn
51
p (a
p ( 10 31
b)
a; b < 0
10 31)
= p (Z
= p (Z
a < 0 < b;
= p (Z
p (a
b)
[1
Z<
10 59) = p (10 59
20 48)
b) = p (Z
b)
p (Z
a)] = p (Z
a) + p (Z
p ( 10 48
a<0<b
p (Z
00 59) = p (Z
= p (Z
00 59)
= p (Z
00 59) + p (Z
p ( 00 53
00 6443 = 00 197:
20 48) =
10 59) = 00 9934
p (Z
00 59)
= p (Z
10 43)
= p (Z
10 43) + p (Z
10 48)
10 43)
b)
b)
p (Z
a) =
1:
p (Z
10 48) =
00 59)
[1
1 = 00 7224 + 00 9306
p (Z
p (Z > 00 53) = p (Z
00 53)
00 9441 = 00 0493:
a) = p (Z
p (Z > 10 48) = p (Z
10 43) = p (Z
00 7054 = 00 1995:
1) =
00 37) = 00 8413
p (Z
= p (Z
p( a
b)
1)
10 31) =
00 54) = 00 9049
p (Z
00 37) = p (00 37
p( 1 < Z
p ( 20 48
00 54) = p (00 54
p (Z
10 48)] =
1 = 00 653:
00 53) =
10 43)
[1
1 = 00 9236 + 00 7019
p (Z
00 53)] =
1 = 00 6255 =
= 00 6256:
p ( 00 98 < Z < 10 34) = p (Z
= p (Z
10 34)
= p (Z
10 34) + p (Z
10 34)
p (Z
p (Z > 00 98) = p (Z
00 98)
00 98) =
10 34)
[1
1 = 00 9099 + 00 8365
p (Z
00 98)] =
1 = 00 7464 =
= 00 7463:
Calculamos ahora probabilidades con distribuciones normales cualesquiera, tipicando en
todo momento. Conviene aprender (y entender) el siguiente razonamiento sobre tipicacin. En
la prctica, aplicaremos todo el tiempo el siguiente enunciado.
Lema 11.6.5 Si X ,! N ( ; ) y a; b 2 R, a
p (a
donde Z =
Demostracin :
b) = p
b, entonces
X
(11.17)
,! N (0; 1).
Es claro que las desigualdades con nmeros reales se conservan si restamos a
A. Roldn
52
X
X
,
b
Z=
X 3
00 8
30 5 3
00 8
=p Z
p X < 20 7 = p
X 3
00 8
20 7 3
00 8
=p Z
p Z
00 37 = 1
p X
00 63 = 00 7357 = 00 7340:
Igualmente,
=1
00 37 = p Z
00 37 =
Finalmente, calculamos:
p 2 < X < 30 4 = p
X 3
00 8
2 3
00 8
=p Z
00 5 + p Z
30 4 3
00 8
10 25
10 25
1 = 00 6915 + 00 8944
00 5 =
1=
= 0 5859 = 0 5859:
X<
20 25).
Por un lado:
p (X < 0) = p
A. Roldn
4) y p ( 40 12
( 30 25)
8
( 30 25)
8
53
De la misma forma:
p (X
4) = p
( 30 25)
8
p Z < 00 09 = 1
=1
( 30 25)
8
00 09 =
=p Z<
Y repitiendo el proceso:
40 12
40 12
20 25 = p
X<
=p
( 30 25)
8
00 11
00 13 = p Z
= 00 5517 + 00 5438
( 30 25)
8
00 11
1=
00 13 + p Z
1 = 00 0955 = 00 09304
( 30 25)
8
X < 13).
p 80 56 < X
80 56 120 4
10 27
140 26 = p
30 02
=p
120 4
10 27
10 46 = p Z
= 00 9279 + 00 9987
140 26 120 4
10 27
10 46 + p Z
=
30 02
1=
1 = 00 9266 = 00 9272:
X < 13) = p
=p
120 4
11
10 27
10 10
120 4
10 27
= 00 6808 + 00 8643
00 47 = p Z
13
120 4
10 27
00 47 + p Z
10 10
1=
1 = 00 5451 = 00 5465:
;X +
54
I En el intervalo X
2 ;X + 2
I En el intervalo X
3 ;X + 3
Demostracin :
p X
<X<X+
=p
<X
X<
= p (Z
1)
p (Z
= p (Z
1)
[1
= 2 00 8413
=p
1<
1) = p (Z
p (Z
1)
p (Z
1)] = 2 p (Z
<1
1)
= p ( 1 < Z < 1) =
1) =
1=
1 = 00 6826:
Igualmente,
p X
2 <X <X +2
= p ( 2 < Z < 2) = 2 p (Z
= 2 00 9772
2)
1=
1 = 00 9544 = 00 9545;
y tambin
p X
3 <X <X +3
= p ( 3 < Z < 3) = 2 p (Z
= 2 00 9987
11.7.
3)
1=
1 = 00 9974 = 00 9973;
20
12
00 712 00 38 +
20
13
00 713 00 37 + : : : +
20
20
00 720 00 30 :
Estos ocho sumandos no son nada fciles de calcular, y menos an su suma. Es imprescindible
calcularlos para conocer p (X 12)? La respuesta es negativa: si podemos aproximar X por
una variable normal, estas probabilidades sern mucho ms sencillas de calcular, pero siempre
teniendo en cuenta que se trata de una aproximacin. Es el caso del siguiente teorema.
A. Roldn
55
n q
5;
(siendo q = 1 p) entonces la variable X se puede aproximar por una variable aleatoria normal
~ que posee su misma media y su misma desviacin tpica.
X
X
~ ,! N n p; pn p q
X
Es importante aprender a interpretar este teorema. Lo que quiere decir es que, como p y q
estn acotadas entre cero y uno, una distribucin binomial es tanto ms parecida a una normal
cuanto mayor es el nmero n de repeticiones del experimento. De hecho, la aproximacin es
buena si n p; n q 3, y es casi perfecta si n p; n q 5. A medida que n crece, la aproximacin
es cada vez mejor (volveremos sobre esta idea en el teorema central de lmite 12.2.1).
~ es continua? La variable X acumula su proCmo es esto posible si X es discreta y X
~ tome un valor concreto es nula.
babilidad en puntos concretos, pero la probabilidad de que X
Realmente, en este caso, debemos tomar el intervalo adecuado:
p (X = k) = p k
00 5
~
X
k + 00 5
Solucin :
Por un lado,
p (X = 8) =
15
8
00 48 00 67
00 11806:
N 6; 10 897 ;
tendremos el valor
p 70 5
~
X
80 5 = p
70 5 6
10 897
=p Z
10 32
~ 6
X
10 897
p Z
80 5 6
10 897
= p 00 79
00 79 = 00 9066
10 32 =
p (X
25) ;
p (20
30) :
A. Roldn
56
Solucin :
40
20
~
X
200 5 = p
190 5 28
20 898
~ 28
X
20 898
= p 20 59
= 00 9983
00 9952 = 00 031:
N 28; 20 898 :
~
X
5, vamos a
20 93 = p Z
20 93
20 59 =
p Z
Esta aproximacin de p (X = 20) es bastante mala. Ello se debe a que estamos intentando
aproximar un valor puntual de la binomial. Veamos cmo con un intervalo nos va mucho mejor.
La segunda probabilidad es:
p (X
25) =
40
X
p (X = k) =
40
X
40
k
k=25
k=25
00 7k 00 340
00 884853;
240 5 = p
~ 28
X
20 898
240 5 28
20 898
=p Z
10 21 = p Z
10 21 = 00 8869:
Esta aproximacin en un intervalo es mucho mejor que la anterior, y cuesta mucho menos trabajo
que calcular la sumatoria anterior (que se ha hecho con ordenador). Igualmente,
p (20
30) =
30
X
p (X = k) =
k=20
30
X
k=20
40
k
00 7k 00 340
00 801655;
~
X
300 5 = p
190 5 28
20 898
=p Z
~ 28
X
20 898
00 86 + p Z
20 93
300 5 28
20 898
20 93
1 = 00 8051 + 00 9983
00 86 =
1 = 00 8034:
A. Roldn