Вы находитесь на странице: 1из 26

Captulo 11

Variables estadsticas
unidimensionales: la Binomial y la
Normal
La Estadstica es la rama de las Matemticas que se ocupa del estudio de los procedimientos
y los mtodos para trabajar con datos, con el n de obtener informacin relacionada con ellos.
Podemos distinguir entre dos grandes bloques dentro de la Estadstica.
z La Estadstica Descriptiva, que se encarga de la recogida de datos, su representacin y
elaboracin de tablas para su posterior estudio.
z La Estadstica Inferencial, que se ocupa del diseo de mtodos o modelos con el objetivo
de obtener informacin acerca de ciertos parmetros que nos interesan.

Ambas partes trabajan con algunos conceptos generales que repasamos a continuacin.
I Poblacin (o universo): es el conjunto formado por todos los elementos que son objeto del
estudio estadstico.
I Individuo: es cada uno de los elementos de la poblacin.
I Muestra: es cualquier subconjunto de la poblacin.
I Tamao: es el nmero de individuos de la muestra.
Volveremos a repasar estos conceptos en el captulo 12.
31

32

CAPTULO 11. VARIABLES UNIDIMENSIONALES

11.1.

Variables estadsticas

Llamaremos variable estadstica (o carcter) a cualquier cualidad que tienen todos los
individuos de la poblacin a estudiar. A los distintos valores que puede tomar una variable los
llamaremos modalidades. Las variables estadsticas se clasican en cualitativas (sus modalidades no son numricas; por ejemplo, el color de ojos toma los valores marrn, azul, verde,
negro, etc.) y cuantitativas (sus modalidades son numricas; por ejemplo, el peso o la estatura
de las personas). En este estudio slo trabajaremos este ltimo tipo de variables.
Las variables estadsticas cuantitativas (a las que, a partir de ahora, llamaremos simplemente
variables ya que son las nicas que nos interesan) se dividen a su vez en:

Discretas, si slo pueden tomar un nmero nito de modalidades distintas (a veces se admite
que sea innito numerable). Por ejemplo, el nmero de hermanos.
Continuas, si pueden tomar, al menos tericamente, todos los valores comprendidos en un
intervalo. Por ejemplo, el peso o la estatura de una persona.

En lo que sigue, y dado que el presente curso slo pretende hacer una introduccin somera
a la Estadstica, desarrollaremos la teora principalmente para variables discretas. No obstante,
utilizando marcas de clase de intervalos, todo se puede generalizar a variables continuas.

11.1.1.

Tabla de frecuencias

En lo que sigue, sea X una variable estadstica (cuantitativa) discreta que toma un nmero
nito de valores distintos. Representaremos por fx1 ; x2 ; : : : ; xk g a las distintas modalidades que
puede tomar X; si fuese continua, las agruparamos en intervalos
f [x1 ; x2 [ ; [x2 ; x3 [ ; : : : ; [xk

2 ; xk 1 [ ;

[xk

1 ; xk ]

g;

y trabajaramos con la marca de clase (el punto medio de cada intervalo) como lo haremos
a continuacin con cada modalidad xi . Supongamos que cada modalidad xi se repite en la
poblacin (o en la muestra) un nmero ni de veces, al que llamaremos frecuencia absoluta de
la modalidad xi . Llamemos N = n1 + n2 + : : : + nk al tamao total de la poblacin estudiada.
Representaremos por fi a la frecuencia relativa de la modalidad xi , que se dene como fi =
A. Roldn

33

11.2. Parmetros asociados a una distribucin de frecuencias

ni =N . Usualmente, estas frecuencias se agrupan en una tabla de frecuencias como la siguiente:


xi

ni

Ni

fi

Fi

x2i ni

xi ni

x1
x2
..
.

(11.1)

xk

N
N

(1)

1
1

xi ni

(2)

x2i ni

(3)

Las columnas Ni y Fi se denominan frecuencias absolutas (o relativas) acumuladas y se


denen, en el caso de las primeras, como Ni = n1 + n2 + : : : + ni , para cada i entre 1 y k. Como
veremos, son tiles a la hora de determinar la mediana o los distintos cuartiles y percentiles de
la distribucin.

11.1.2.

Representacin grca de una distribucin

Existen diversas formas para representar una distribucin cuantitativa: diagrama de puntos,
diagrama de barras, histograma, polgono de frecuencias. Tambin para representar un cualitativa: diagrama de sectores, pictograma.
### Poner ejemplos.

11.2.

Parmetros asociados a una distribucin de frecuencias

Los parmetros asociados a una distribucin son nmeros que indican alguna propiedad de la
misma. Podemos dividirlos en medidas de centralizacin (que indican valores representativos
de la distribucin en algn sentido) y de dispersin (que indican cmo de unidos o separados
est dichos valores).

11.2.1.

Medidas de centralizacin

Son nmeros que tratan de representar, en algn sentido, a toda la distribucin, o tratan
de aportar alguna informacin sobre la misma. Indudablemente, la ms importante es la media
aritmtica.
A. Roldn

34

CAPTULO 11. VARIABLES UNIDIMENSIONALES

Media (aritmtica)
Llamaremos media aritmtica (o simplemente, media) de la variable X, y la representaremos por X o por X (o simplemente por ), al nmero:
X=

k
X

xi fi = x1 f1 + x2 f2 + : : : + xk fk :

(11.2)

i=1

Como se puede observar, el smbolo signica sumatoria, e indica la suma de todos los trminos
que hay dentro cuando se vara el ndice a que hace referencia (en este caso, i). Teniendo en
cuenta que fi = ni =N , la forma ms usual de determinar la media es
k

X=

1X
xi ni ;
N

(11.3)

i=1

que se consigue dividiendo la casilla (2) entre la casilla (1) en la tabla de frecuencias (11.1). La
media aritmtica es un parmetro que nos da una idea de en torno a qu valor se encuentran
concentrados los valores de la variable estadstica (aunque en ocasiones no resulte un valor
demasiado representativo). Entre las propiedades ms interesantes de la media destacamos las
siguientes:
Cambio de origen: si le sumamos (o restamos) una constante C a todos los valores de la
variable X, yi = xi + C, la media de la nueva variable Y = X + C es la media de la variable
anterior ms la constante C.
Y = X + C:
Cambio de escala: Si multiplicamos todos los valores de la variable X por una constante C,
yi = C xi , la media de la nueva variable Y = CX es la media de la anterior multiplicada
por C.
Y =C X
La media de las desviaciones de los valores de la variable con respecto a la media aritmtica
es cero.
k
X
xi X ni = 0:
i=1

Moda
La moda de la variable X es el valor (o valores) que posee mayor frecuencia absoluta, es
decir, la modalidad que ms se repite en la distribucin. Se representa por M o. Puede haber
varias modas en una misma distribucin, por lo que se puede hablar de distribuciones bimodales,
trimodales, etc.
A. Roldn

11.2. Parmetros asociados a una distribucin de frecuencias

35

Mediana
La mediana de la variable X es el valor numrico que deja igual nmero de observaciones
inferiores a l que superiores. Se representa por M e.

Percentil
Se llama percentil de orden m, y lo denotaremos por Pm , al valor numrico que deja a su
izquierda un m % de valores de la distribucin. As, se habla tambin de cuartiles (si se divide
la distribucin en cuatro partes equifrecuentes) y deciles (en diez partes).

11.2.2.

Medidas de dispersin

Las medidas de dispersin tratan de indicar la forma con la que se distribuyen las modalidades
sobre la recta real. Sin duda, la ms importante es la varianza (y su raz cuadrada). Aunque
comenzamos explicando un coeciente que da una idea clara de cmo tener una concepcin
rpida de la dispersin de la variable.

Recorrido
El recorrido de una distribucin se dene como la diferencia entre los valores mayor y menor
de la variable.
rec X = xmax

xm n :

Este parmetro no da una idea de un valor central, sino de cmo se dispersan los valores de la
variable.

Varianza
2 o por s2 (o simplemente
Llamaremos varianza de la variable X, y la denotaremos por X
X
2
2
por
o por s si no hace falta indicar la variable), a la media aritmtica de los cuadrados de
las desviaciones de los valores de la variable con respecto a la media aritmtica del colectivo, es
decir,
k h
i
X
2
2
2
=
s
=
x
X
f
(11.4)
i
i :
X
X
i=1

A. Roldn

36

CAPTULO 11. VARIABLES UNIDIMENSIONALES

Desarrollando esta frmula, la forma ms sencilla de calcularla es la siguiente:


k

X2 =

= X2

1X 2
xi ni
N

X 2;

(11.5)

i=1

lo cual se consigue dividiendo la casilla (3) entre la casilla (1) en la tabla de frecuencias (11.1) y
restndole el cuadrado de la media. La varianza indica la forma en la que se distribuyen los datos
alrededor de la media aritmtica, de tal forma que cuanto mayor sea, ms dispersos estn los
datos, y cuanto ms prxima est a cero, ms agrupados estn. Sus principales caractersticas
son las siguientes.
2

La varianza nunca es negativa:


tribucin es constante.

0. Adems, la varianza es nula si, y slo si, la dis-

2
A la varianza no le afectan los cambios de origen, ya que si Y = X + C, entonces Y2 = X
(esto es debido a que no slo se trasladan los datos, tambin lo hace la media aritmtica).

Si Y = CX, entonces

2
Y

= C2

2
X,

donde C es una constante.

Desviacin tpica
Llamaremos desviacin tpica de la variable X, y la denotaremos por X o por sX (o
simplemente por o por s si no hace falta indicar la variable), a la raz cuadrada (no negativa)
de la varianza.
q
2
=
X
X:
Para calcularla, se debe determinar primeramente la varianza con la frmula (11.5). La desviacin
tpica tiene las mismas propiedades que la varianza.

La desviacin tpica nunca es negativa:

0.

A la desviacin tpica no le afectan los cambios de origen, ya que si Y = X + C, entonces


Y = X.
Si Y = CX, entonces

=C

X,

donde C es una constante.

Pero hay una cuarta propiedad que merece la pena resaltar.


Lema 11.2.1 La desviacin tpica
I En el intervalo X
A. Roldn

;X +

verica:

se encuentra, al menos, el 68 % de la poblacin.

37

11.2. Parmetros asociados a una distribucin de frecuencias

I En el intervalo X

2 ;X + 2

se encuentra, al menos, el 95 % de la poblacin.

I En el intervalo X

3 ;X + 3

se encuentra, al menos, el 99 % de la poblacin.

Cuasivarianza y cuasidesviacin tpica


En muchas ocasiones, la varianza interviene en clculos complicados que pueden ser simplicados con un parmetro casi idntico. Llamaremos cuasivarianza de la variable X, y la
2 o por s
denotaremos por ^X
^2X (o simplemente por ^ 2 o por s^2 si no hace falta indicar la variable), a la varianza de la variable corregida con el factor N=(N 1), donde N es el tamao de
la poblacin.
k h
i
X
N
1
2
2
ni =
xi X
^2 :
(11.6)
^X =
N 1 X
N 1
i=1

La correccin con este factor resuelve clculos muy complicados. Adems, como ya indicaremos,
la cuasivarianza muestral es un estimador insesgado de la varianza poblacional, lo que lo convierte en el mejor estimador posible. De la misma forma, llamaremos cuasidesviacin tpica
de la variable X a la raz cuadrada de su cuasivarianza.
q
2 :
(11.7)
^X = ^X
Coeciente de variacin
La desviacin tpica permite comparar la dispersin de distribuciones cuyas medias aritmticas estn prximas y vengan expresadas en las mismas unidades. Ahora bien, si las medias de
las distribuciones son muy dispares, la comparacin a travs de la desviacin tpica no es nada
representativa. Se utiliza entonces el coeciente de variacin de la variable X, que se dene
como el cociente entre su desviacin tpica y su media aritmtica (si sta no es nula).
CX =

Desviacin media
La varianza de X da una idea de cmo de prximos estn los valores de la distribucin de
su media aritmtica. Pero tiene la desventaja de que lo hace elevando al cuadrado, de tal forma
que las unidades pueden sufrir modicaciones. Una forma de arreglar este problema es tomar las
diferencias respecto de la media aritmtica en valor absoluto, lo que da lugar a la desviacin
media de la variable X, que se dene como
Dm =

k
X
i=1

xi

fi =

1X
N

xi

ni :

(11.8)

i=1

A. Roldn

38

CAPTULO 11. VARIABLES UNIDIMENSIONALES

El problema que tiene este parmetro es que es mucho ms laborioso de calcular, pues es inevitable calcular todas las desviaciones respecto de la media aritmtica.
Ejercicio 19 En el instituto Acci hay 800 alumnos y alumnas, de los cuales 85 llevan un
piercing, 23 llevan dos y 7 llevan tres. Realiza un estudio completo de la variable estadstica que
mide el nmero de piercing en el Acci.

Solucin :

Sea X la variable estadstica que mide el nmero de piercing que lleva cada alumno
o alumna. Una tabla de frecuencias sencilla es la siguiente:
xi
0
1
2
3

ni
685
85
23
7

Ni

fi

Fi

685
770
793
800

00 856

00 856

00 106

00 962

00 029
00 009

00 991
1

800

xi ni

x2i ni

xi

0
85
46
21

0
85
92
63

1300 15

152

240

2600 3

ni

680 85
410 63
190 67

La media y la varianza son los dos coecientes que debemos aprender a calcular ms rpidamente,
porque son los ms importantes.
8
152
0
>
>
< X = 800 = 0 19;
>
>
: 2 = 240 00 192 = 00 2639:
X
800

Entonces la desviacin tpica es


00 514. Est claro que la moda es 0 piercing, al igual que la
mediana. El recorrido es de 3 0 = 3 piercing y la cuasivarianza se calcula tambin fcilmente:
2
^X
=

N
N

2
^X
=

800 0
0 2639
799

00 264:

El coeciente de variacin es CX = X =X 20 705. La desviacin media es la ms laboriosa de


calcular, por lo que cuesta en la tabla de frecuencias.
Dm =

2600 3
800

00 325:

Esto acaba el estudio.

11.3.

Tipicacin de una variable

Sea X una variable estadstica (cuantitativa). Denotemos por X y por X a su media aritmtica y a su desviacin tpica. Como hemos visto al explicar los parmetros anteriores, si llamamos
A. Roldn

39

11.4. Variables aleatorias

Y = X X, tendremos una nueva variable cuya media es cero y de igual desviacin tpica que
X, es decir,
Y = X X = 0;
Y = X:
Hemos ganado que ahora su media est centrada en el cero, pero queremos hacer un proceso
para tener controlada tambin su desviacin tpica. Para ello, recurrimos a un cambio de escala
dividiendo entre X (si este valor no es nulo, es decir, si la variable no es constante). Denimos
as
X X
Y
=
:
Z=
X

Esta nueva variable tiene media cero y desviacin tpica uno, ya que
Z=

Y =

0
X

= 0;

1
Y
X

= 1:

Este proceso se denomina tipicacin de la variable X, y nos permite construir otra variable
de media cero y desviacin tpica uno, ntimamente relacionada con la anterior.
8
8
<
<
media X;
media 0;
X X
X!
)
Z=
!
: desv. tpica
: desv. tpica 1:
X
;
X

Este proceso sirve para comparar datos de distribuciones distintas. Otra ventaja de la tipicacin
es que la variable Z sigue conservando el mismo tipo de distribucin que X, es decir, si X sigue
una distribucin normal, entonces Z tambin posee el mismo tipo de distribucin.

11.4.

Variables aleatorias

Hay ocasiones en que nos interesa estudiar probabilidades asociadas a funciones que relacionan sucesos aleatorios y nmeros (por ejemplo, la probabilidad de que un alumno, elegido
al azar, tenga tres hermanos). Necesitamos as introducir el concepto de funcin denida sobre
algunos tipos de sucesos.
Denicin 11.4.1 Sea E el espacio muestral asociado a algn experimento aleatorio. Llamaremos variable aleatoria a cualquier ley X : E ! R que asocie un nmero real a cada suceso
elemental. Llamaremos recorrido de la variable aleatoria X, y lo denotaremos por rec X o
por X (E), al conjunto de valores reales que forman sus imgenes.
Esta denicin es parecida a la de funcin de probabilidad p : S ! R, pero tiene dos diferencias importantes: en primer lugar, la funcin de probabilidad se puede aplicar a cualquier
suceso del espacio de sucesos, mientras que la variable aleatoria slo se puede aplicar a sucesos
elementales. En este sentido, es ms restrictiva. Sin embargo, la funcin de probabilidad est
acotada entre cero y uno, mientras que la variable aleatoria puede tomar cualquier valor real.
A. Roldn

40

CAPTULO 11. VARIABLES UNIDIMENSIONALES

Ejemplo 11.4.2 Sea E = f1; 2; 3; 4; 5; 6g el espacio muestral asociado al lanzamiento de un


dado. Entonces podemos denir la variable aleatoria que a cada resultado le asocia su triple, es
decir, X (fxg) = 3x. Entonces la variable X puede tomar valores entre 3 y 18. Obsrvese que
no tiene sentido aplicar la variable X al suceso f2; 5g.
Ejemplo 11.4.3 Sea E el conjunto de alumnos y alumnas del instituto Acci. Podemos denir
una variable X que a cada alumno/a le asocia su nmero de hermanos y hermanas (sin contarse
a s mismo/a). Entonces X toma valores naturales entre cero y, quiz, como mucho, diez (habr
algn caso?). No tiene sentido aplicarle X a dos alumnos a la vez, porque no sabramos qu
nmero asociarles.

11.4.1.

Funcin de distribucin de una variable aleatoria

Una de las primeras necesidades que nos planteamos es la de traducir probabilidades sobre
un espacio de sucesos a conjuntos de nmeros reales. Por ejemplo, nos interesa la probabilidad
de que, al lanzar cuatro monedas aparezcan exactamente dos cruces, o menos de dos cruces, o
al menos dos cruces, o no aparezcan dos cruces. Esta necesidad de hacer intervenir los nmeros
reales relacionndolos con probabilidades justica las siguientes deniciones.
Denicin 11.4.4 Sea (E; S; p) un espacio de probabilidad y sea X : E ! R una variable
aleatoria. Dado cualquier subconjunto de nmeros reales A
R, llamaremos probabilidad
de que X pertenezca al conjunto A, y la denotaremos por p (A) o por p (X 2 A), a la
probabilidad del suceso aleatorio formado por todos los sucesos elementales de E cuyas imgenes
por X pertenecen al conjunto A, es decir,
p (A) = p (X 2 A) = p (f ! 2 E / X (!) 2 Ag) :
Llamaremos funcin de distribucin asociada a la variable aleatoria X, y la denotaremos por FX (o, abreviadamente, por F ), a la funcin FX : R ! R (real de variable real) que
a cada nmero x 2 R le asocia la probabilidad de que la variable X tome valores en el intervalo
cerrado no acotado ( 1; x].
FX (x) = p (X

x) = p (X 2 ( 1; x]) = p (f ! 2 E / X (!)

xg) :

(11.9)

La funcin de distribucin caracteriza completamente a la variable aleatoria, de tal forma


que es equivalente conocer su accin a conocer su funcin de distribucin.
Ejemplo 11.4.5 Consideremos el espacio de probabilidad asociado al lanzamiento de un dado
(no trucado), donde cada cara tiene probabilidad 1=6 de salir, y la variable aleatoria X (fxg) = 3x
A. Roldn

41

11.5. Variable aleatoria discreta: la distribucin binomial

denida en el ejemplo 11.4.2. Calculemos algunos valores de su funcin de distribucin:


F (5) = p (X

1
5) = p (X 2 f3g) = p (f3g) = :
6

F (6) = p (X

6) = p (X 2 f3; 6g) = p (f3; 6g) =

F (15) = p (X
F (30) = p (X
F ( 2) = p (X

11.4.2.

2
1
= :
6
3

5
15) = p (X 2 f3; 6; 9; 12; 15g) = p (f3; 6; 9; 12; 15g) = :
6
30) = p (X 2 f3; 6; 9; 12; 15; 18g) = p (E) = 1:
2) = p (X 2 ?) = p (?) = 0:

Clasicacin de variables aleatorias

Al igual que las variables estadsticas, las variables aleatorias de clasican en discretas o
continuas segn si el nmero de valores que pueden tomar es nito (o incluso innito numerable)
o bien pueden tomar, al menos tericamente, todos los valores de un intervalo real. En el primer
caso est la variable que mide el nmero de hermanos de una persona, el nmero de tornillos
defectuosos que fabrica una mquina en un da, el nmero del calzado que utiliza, etc. En el
segundo grupo tenemos la variable aleatoria que mide el peso o la estatura de una persona, el
tiempo que tarda en llegar al trabajo, la energa que gasta una mquina para calentar un litro
de leche, etc.
El ejemplo ms conocido de variable aleatoria discreta es el caso de la variable binomial, y el
de variable continua es el de variable normal. Dedicamos el resto del captulo a familiarizarnos
con estas distribuciones de probabilidad, que sern de gran importancia en lo que resta del
temario.

11.5.

Variable aleatoria discreta: la distribucin binomial

Sea (E; S; p) un espacio de probabilidad y sea X : E ! R una variable aleatoria discreta.


Denotemos por rec X = fx1 ; x2 ; : : : ; xk g R a su recorrido. Llamaremos funcin de densidad
(o distribucin de probabilidad) de X a la funcin real de variable real que a cada nmero
le asocia la probabilidad de que la variable X tome dicho valor.
fX : R ! R;

fX (x) = p (X = x) :

Como suponemos que X slo toma un nmero nito de valores distintos, su funcin de densidad
es siempre nula salvo en los propios valores que puede tomar, en los que vale:
pi = fX (xi ) = p (X = xi ) ;

8i 2 f1; 2; : : : ; kg :
A. Roldn

42

CAPTULO 11. VARIABLES UNIDIMENSIONALES

Evidentemente,
p1 + p2 + : : : + pk = p (X 2 fx1 ; x2 ; : : : ; xk g) = p (X 2 E) = p (E) = 1:
Llamaremos media (o esperanza matemtica) de la variable X, y la denotaremos por X (o
por X o por E (X)), al nmero real
X=

k
X

xi pi = x1 p1 + x2 p2 + : : : + xk pk :

(11.10)

i=1

Se trata de la misma denicin que en (11.2) cambiando las frecuencias relativas por probabilidades. De la misma forma, llamaremos varianza de la variable X al valor
2
X

= s2X =

k h
X

xi

i=1

i
pi ;

(11.11)

que, ms fcilmente, se calcula como:


2

X2

X =

k
X

x2i pi

X 2:

(11.12)

i=1

La desviacin tpica de la variable aleatoria X es la raz cuadrada no negativa de la varianza:


=

2:

(11.13)

De forma anloga podemos denir la cuasivarianza y los dems parmetros estadsticos.

11.5.1.

La distribucin binomial

Consideremos un experimento aleatorio en el que slo pueden ocurrir dos posibilidades: o


bien ocurre un suceso A con probabilidad p o bien ocurre su complementario, A, con probabilidad
q = 1 p. En lo sucesivo, llamaremos al suceso A xito y a su complementario A, fracaso.
Supongamos que podemos repetir el experimento n veces de manera independiente, es decir,
de tal forma que un resultado no inuya para nada en el siguiente, o dicho de otra manera, la
probabilidad de xito p debe mantenerse constante a lo largo de todas las repeticiones.
Llamemos X a la variable aleatoria que mide el nmero de xitos que se obtienen al realizar
n veces el experimento (de forma independiente). Diremos entonces que la variable X presenta
una distribucin binomial de parmetros n (el nmero de repeticiones independientes) y p
(la probabilidad de xito, constante a lo largo de las repeticiones), y lo denotaremos por
X ,! B (n; p) :
A. Roldn

43

11.5. Variable aleatoria discreta: la distribucin binomial

Es claro que X toma valores naturales entre 0 y n, pues no se pueden obtener menos de cero
xitos ni ms de n xitos. Por tanto,
rec X = f0; 1; 2; : : : ; ng :
Aunque no vamos a demostrarlo, la probabilidad de que X tome cualquiera de estos valores es
exactamente
pk = p (X = k) =

n
k

pk q n

k;

8k 2 f0; 1; 2; : : : ; ng
n
k

(y vale cero en todos los dems nmeros reales), donde


elementos tomadas de k en k, es decir,
n
k

(11.14)

representa las combinaciones de n

n!
:
k! (n k)!

Lema 11.5.1 Si X ,! B (n; p), entonces su media y su desviacin tpica son:


X=n p

n p q

Ejercicio 20 Ana ha estudiado 12 de los 20 temas que componen el temario de una asignatura.
Si realiza 5 exmenes sobre el temario, calcula la probabilidad de:

(a) aprobar exactamente dos exmenes;


(b) aprobar ms de dos exmenes;
(c) no aprobar ningn examen;
(d) aprobar algn examen.

Solucin :

Llamemos A al suceso seleccionado un tema al azar, Ana lo sabe. Es claro que A es


el suceso xito, pues en este caso Ana aprueba el examen. La probabilidad de que Ana se sepa
el tema del examen es
3
12
= = 00 6;
p = p (A) =
20
5
por lo que la probabilidad de fracaso es q = 1 p = 2=5. Si repetimos cinco veces el examen
de manera independiente, podemos llamar X al nmero de exmenes aprobados por Ana, es
decir, al nmero de xitos que se presentan en cinco repeticiones. Claramente, por denicin,
X ,! B (5; 00 6). Entonces la probabilidad de aprobar exactamente dos exmenes es:
p (X = 2) =

5
2

00 62 00 43 = 00 230 4

23 %:
A. Roldn

44

CAPTULO 11. VARIABLES UNIDIMENSIONALES

La probabilidad de que apruebe ms de dos exmenes es


p (X > 2) = p (X
=

5
3

3) = p (X = 3) + p (X = 4) + p (X = 5) =
00 63 00 42 +

5
4

00 64 00 41 +

5
5

= 00 345 6 + 00 259 2 + 00 077 76 = 00 682 5

00 65 00 40 =
68 %:

La probabilidad de que no apruebe ningn examen es:


p (X = 0) =

5
0

00 60 00 45 = 00 010 24

1 %:

Finalmente, la probabilidad de que apruebe algn examen, que podramos calcularla como:
p (X

1) = p (X = 1) + p (X = 2) + p (X = 3) + p (X = 4) + p (X = 5) ;

preferimos calcularla mediante el paso al complementario, es decir,


p (X

1) = 1

p (X < 1) = 1

p (X = 0) = 1

00 01024 = 00 98976

99 %:

Ejercicio 21 Calcula la media y la desviacin tpica de una variable X ,! B (3; 00 7) haciendo


todos los clculos necesarios.
Como X ,! B (3; 00 7), esta variable slo puede tomar cuatro valores, f0; 1; 2; 3g.
Calculamos cada probabilidad.
Solucin :

p0 = p (X = 0) =

3
0

00 70 00 33 = 00 027;

p1 = p (X = 1) =

3
1

00 71 00 32 = 00 189;

p2 = p (X = 2) =

3
2

00 72 00 31 = 00 441;

p3 = p (X = 3) =

3
3

00 73 00 30 = 00 343:

Agrupamos estas probabilidades en una tabla de frecuencias, y calculamos la media y la desviacin


tpica de X:
xi

pi

xi pi

x2i ni

0
1
2
3

00 027
00 189
00 441
00 343

0
0
0 189
00 882
10 027

0
0
0 189
10 764
30 087

20 1

50 04

8
20 1
>
>
< X=
= 20 1;
1
>
p
p
>
:
50 04 20 12 = 00 63 :
X =

Obsrvese cmo se cumple que X = n p = 3 00 7 = 20 1 y que


p
00 63 .
A. Roldn

n p q =

3 00 7 00 3 =

45

11.5. Variable aleatoria discreta: la distribucin binomial

Esquema de las fuentes


Hemos podido calcular en el ejercicio 21 todas las probabilidades asociadas a la variable
porque n es un nmero relativamente pequeo. En este caso, quiz convenga aplicar la frmula
(11.14). Pero hay un proceso en cascada que quiz sea tambin factible. Supongamos que X ,!
B (n; 00 6) y vamos a calcular las distintas probabilidades segn sea n. Si n = 0, entendemos que
p (X = 0) = 1. Si n = 1, la probabilidad de obtener un xito es 00 6, y la de un fracaso, 00 4. Es
como si el 100 % del agua de una fuente que est desequilibrada cayese por los dos lados: en
uno se recoge el 60 % y en otro, el 40 %, como en el siguiente esquema.
1

n=0

60 %

40 %

&

00 6
xito

00 4
Fracaso

n=1

Pero la fuente puede continuar hacia abajo, teniendo en cuenta que por la izquierda cae el 60 %
del agua (y se aade un xito) y por la derecha el 40 % (y se aade un fracaso).
1
00 6
00 36

1E

n=0

.
&

2E

&

00 48

00 4
1F

n=1
&

1E1F

00 16
2F

n=2

Debajo de cada nmero se indica el nmero de xitos y fracasos; por ejemplo, 1E1F signica un
xito y un fracaso. Obsrvese tambin cmo a la fuente central le cae agua (probabilidad) de las
dos posiciones superiores, por lo que acumula: 00 6 00 4 + 00 4 00 6 = 00 48. Y la tabla seguira:
1
00 6
00 36
00 216
00 1296
4E

3E

.
&

2E

00 3456
3E1F

.
&
.
&

1E

00 432
2E1F

00 3456
3E2F

.
&
.
&
.

n=0
&

00 48
1E1F

00 3456
2E2F

.
&
.
&

00 4
1F

00 288
1E2F

00 2304

n=1
&
.
&
.

00 16
2F

00 1536

n=2
&
.

1E3F

2E3F
A. Roldn

00 064
3F

n=3
&

00 025
4F

46

CAPTULO 11. VARIABLES UNIDIMENSIONALES

En la tabla anterior se observa que si X ,! B (3; 00 6), entonces p (X = 2) = 00 432, porque se


conseguiran dos xitos.

11.6.

Variable aleatoria continua: la distribucin normal

Una variable aleatoria (cuantitativa) se dice continua si puede tomar, al menos de forma
terica, todos los valores de un intervalo. Como en ste hay una cantidad de nmeros innita
no numerable, no es posible que la probabilidad de que la variable tome los valores del intervalo
sea positiva, pues entonces una suma no numerable de nmeros estrictamente positivos nunca
est acotada superiormente. Por eso, la probabilidad de que una variable continua tome un valor
concreto es cero. Realmente, no debera ser cero, porque podra ocurrir que la estatura de un
determinado alumno fuese de 165 m, pero como no tenemos un instrumento de medida lo
sucientemente sutil como para armarlo de forma tajante (podremos sacar 20 decimales a su
altura, pero no 300), preferimos hablar de la probabilidad de que la altura del alumno est en
el intervalo ]10 6499; 10 6501[.
Esto modica sustancialmente la forma que tenemos de calcular probabilidades con una
variable continua, pues debemos hacer una denicin con integrales (quiz no sea el objetivo de
este curso saber calcular las siguientes integrales; si es as, psate a la seccin 11.6.1).
Denicin 11.6.1 Sea (E; S; p) un espacio de probabilidad y sea X : E ! R una variable
aleatoria. Diremos que X es una variable continua si existe una funcin integrable fX : R ! R,
llamada funcin de densidad de X, de manera que la probabilidad de que la variable aleatoria
X tome valores en un intervalo I es la integral (denida o no) de fX en I, es decir,
Z
p (X 2 I) = fX (x) dx; 8I R; I intervalo:
(11.15)
I

En el caso de que I = ]a; b[, se denota


p (a < X < b) =

fX (x) dx:

De acuerdo con esta denicin, la probabilidad de que la variable tome un valor puntual es nula,
ya que
Z
a

p (X = a) = p (X 2 [a; a]) =

fX (x) dx = 0:

Por ello, es lo mismo considerar intervalos abiertos que cerrados (o semiabiertos o semicerrados). La condicin (11.15) impone varias restricciones sobre la posible funcin de densidad fX .
Esencialmente, esta funcin debe ser no negativa (fX
0) y su integral (impropia) en R debe
valer uno.
Z
fX (x) dx = p ( 1 < X < +1) = p (E) = 1:
R

A. Roldn

47

11.6. Variable aleatoria continua: la distribucin normal

Utilizando esta funcin de densidad (que, si existe, es nica c.p.d.), es posible denir los principales parmetros de la variable X. Por ejemplo, llamaremos media (o esperanza matemtica) de la variable X, y la denotaremos por X (o por X o por E (X)), al valor real:
Z
[x fX (x)] dx:
X=
R

Igualmente, llamaremos varianza de la variable X al valor


Z h
i
2
2
2
=
s
=
x
X
f
(x)
dx;
X
X
X
R

que, ms fcilmente, se calcula como:


2

= X2

X2 =

x2 f (x) dx

X 2:

La desviacin tpica de la variable aleatoria X es la raz cuadrada no negativa de la varianza:


=

2:

De forma anloga podemos denir los dems parmetros estadsticos.

11.6.1.

La distribucin normal

Existe una variable aleatoria que tenga cualquier media (real) y cualquier desviacin tpica
(no negativa)? Si = 0, la variable es constantemente igual a la media, y hemos acabado.
Este caso es trivial y no nos interesa en lo sucesivo. Y si > 0? La respuesta es positiva y
se puede conseguir con la distribucin normal, que tiene una funcin de densidad ciertamente
peculiar. A partir de ahora, supondremos que las variables que intervengan no son constantes,
es decir, > 0.
Denicin 11.6.2 Sea 2 R cualquier nmero real y sea 2 R+ cualquier nmero positivo.
Denotaremos por f ; a la funcin f ; : R ! R (real de variable real) denida por
f

1
(x) = p
2

1
2

(x

) ;

8x 2 R:

Esta funcin cumple las siguientes propiedades:

1. Es una funcin positiva (f

> 0) y continua en R.

2. Posee un nico mximo, que es absoluto y est en el punto de abscisa x = .


3. Posee dos puntos de inexin, cuyas abscisas son x =

.
A. Roldn

48

CAPTULO 11. VARIABLES UNIDIMENSIONALES

4. Es creciente en ] 1; [ y decreciente en ] ; +1[.


5. Es una funcin simtrica par respecto de la asntota vertical x = .
6. El eje de abscisas es asntota horizontal de f
7. El rea total encerrada entre f
y de ), es decir,

a ambos lados.

y el eje de abscisas es la unidad (independientemente de


Z

(x) dx = 1:

Con todos estos datos, es posible dibujarla de la siguiente manera.

El caso ms interesante ocurre cuando = 0 y = 1. La funcin f0;1 est dibujada a la derecha


manteniendo la escala de los ejes; el rea determinada por la funcin f0;1 con el eje de abscisas
es la misma que la del cuadrado unidad.
Denicin 11.6.3 Diremos que una variable aleatoria X sigue una distribucin normal de
parmetros
y , y lo denotaremos por X ,! N ( ; ), si es una variable continua cuya
funcin de densidad es f ; . En el caso particular de que una variable Z siga una distribucin
N (0; 1), diremos que posee una distribucin normal estndar.
En tal caso, la probabilidad de que la variable X tome valores en un intervalo ]a; b[ coincide
con el rea delimitada por la funcin f ; y el eje de abscisas entre las rectas verticales x = a y
x = b, como en la siguiente gura.

a
Los parmetros
A. Roldn

estn ntimamente relacionados con la media y la desviacin tpica de X.

49

11.6. Variable aleatoria continua: la distribucin normal

Teorema 11.6.4 Si X ,! N ( ; ), entonces la media de X es


X= ;

y su desviacin tpica es .

= :

Siempre es posible pasar de una distribucin N ( ; ) a una distribucin normal estndar


mediante el proceso de tipicacin que estudiamos en la seccin 11.3. Esto quiere decir que
X ,! N ( ; )

Z=

(11.16)

,! N (0; 1)

Esto nos permite calcular probabilidades normales en cualquier distribucin con slo utilizar la
tabla de la distribucin normal estndar. Es lo que haremos a continuacin.

Clculo de probabilidades con la tabla de la distribucin normal estndar


2

Es posible demostrar que la funcin x 2 R 7! e x es continua y positiva en R, de tal


forma que sabemos que es localmente integrable. Por eso, posee alguna primitiva en todo R. Sin
embargo, no es posible expresar dicha primitiva en trminos de las funciones elementales que
manejamos. De esta forma, no podemos calcular una integral del tipo
Z b
2
1 x
1
) dx
p (a < X < b) = p
e 2(
2 a
directamente integrando cuando X ,! N ( ; ). Nos vemos obligados a utilizar tablas con probabilidades que han sido calculadas por aproximacin. Pero, podemos reducirlas todas a una
sola? La respuesta es que s: si tipicamos cada variable, slo nos har falta la tabla de la distribucin normal estndar. Existen diferentes tipos de tablas. Nosotros vamos a utilizar en lo
sucesivo tablas de colas a la izquierda, es decir, que nos dan las probabilidades de que una
variable normal estndar tome valores menores o iguales que un nmero no negativo.

y
1
x) = p
2

FZ (x) = p (Z

t2
2

dt:

A continuacin escribimos algunas probabilidades normales utilizando la tabla de colas a la


izquierda. Las calculamos teniendo en cuenta principalmente las siguientes propiedades:
p (Z <
p (a
p( b

Z
Z

a) = p (Z > a) = 1
b) = p (Z

b)

p (Z

a) = p (a

b)

p (Z

a) :

a) :

A. Roldn

50

CAPTULO 11. VARIABLES UNIDIMENSIONALES

En lo que sigue, si escribimos 00 0198 = 00 0197 queremos indicar lo siguiente: la primera


aproximacin, 00 0198, ha sido calculada con la tabla de la normal estndar, y la segunda aproximacin, 00 0197, ha sido calculada con el ordenador. Si no se escribe nada, es porque ambas
coinciden.
p (Z

p (Z < 00 55) = 00 7088:

a) ;

a>0

p (Z

a) ;

a>0

p (Z

a) ;

a<0

p (Z

a) ;

a<0

p (a

a; b > 0

b)

p (Z

10 12) = 00 8686:

p (Z

20 39) = 00 9916:

p (Z

10 98) = 1

p (Z

10 98) = 1

00 9761 = 00 0239:

p (Z

00 25) = 1

p (Z

00 25) = 1

00 5987 = 00 4013:

p (Z

00 76) = 1

p (Z

00 76) = 1

00 7764 = 00 2236:

p (Z <

00 3) = p (Z > 00 3) = 1

p (Z

00 3) = 1

00 6179 = 00 3821:

p (Z

20 5) = p (Z > 20 5) = 1

p (Z

20 5) = 1

00 9938 = 00 0062:

p (Z <

10 48) = p (Z > 10 48) = 1

p (Z >

10 4) = p (Z

p (Z

00 58) = p (Z

00 58) = 00 7190:

p (Z >

30 05) = p (Z

30 05) = 00 9989:

p (00 1 < Z

p (Z

10 48) = 1

00 9306 = 00 0694:

10 4) = 00 9192:

10 05) = p (Z

10 05)

p (Z

00 1) = 00 8531

00 5398 =

= 00 3133:
p (20 03

20 98) = p (Z

20 98)

p (Z

20 03) = 00 9986

00 9788 =

20 17)

p (Z

00 39) = 00 9850

00 6517 =

= 00 0198 = 00 0197:
p (00 39 < Z < 20 17) = p (Z
= 00 3133:

A. Roldn

51

11.6. Variable aleatoria continua: la distribucin normal

p (a

p ( 10 31

b)

a; b < 0

10 31)

= p (Z

= p (Z

a < 0 < b;
= p (Z

p (a

b)

[1

Z<

10 59) = p (10 59

20 48)

b) = p (Z

b)

p (Z

a)] = p (Z

a) + p (Z

p ( 10 48

a<0<b

p (Z

00 59) = p (Z

= p (Z

00 59)

= p (Z

00 59) + p (Z

p ( 00 53

00 6443 = 00 197:

20 48) =

10 59) = 00 9934
p (Z

00 59)

= p (Z

10 43)

= p (Z

10 43) + p (Z

10 48)
10 43)

b)

b)

p (Z

a) =

1:

p (Z

10 48) =
00 59)

[1

1 = 00 7224 + 00 9306
p (Z

p (Z > 00 53) = p (Z
00 53)

00 9441 = 00 0493:

a) = p (Z

p (Z > 10 48) = p (Z

10 43) = p (Z

00 7054 = 00 1995:

1) =

00 37) = 00 8413

p (Z

= p (Z
p( a
b)

1)

10 31) =

00 54) = 00 9049

p (Z

00 37) = p (00 37

p( 1 < Z

p ( 20 48

00 54) = p (00 54

p (Z

10 48)] =

1 = 00 653:

00 53) =
10 43)

[1

1 = 00 9236 + 00 7019

p (Z

00 53)] =

1 = 00 6255 =

= 00 6256:
p ( 00 98 < Z < 10 34) = p (Z
= p (Z

10 34)

= p (Z

10 34) + p (Z

10 34)

p (Z

p (Z > 00 98) = p (Z
00 98)

00 98) =
10 34)

[1

1 = 00 9099 + 00 8365

p (Z

00 98)] =

1 = 00 7464 =

= 00 7463:
Calculamos ahora probabilidades con distribuciones normales cualesquiera, tipicando en
todo momento. Conviene aprender (y entender) el siguiente razonamiento sobre tipicacin. En
la prctica, aplicaremos todo el tiempo el siguiente enunciado.
Lema 11.6.5 Si X ,! N ( ; ) y a; b 2 R, a
p (a

donde Z =

Demostracin :

b) = p

b, entonces
X

(11.17)

,! N (0; 1).
Es claro que las desigualdades con nmeros reales se conservan si restamos a
A. Roldn

52

CAPTULO 11. VARIABLES UNIDIMENSIONALES

todos los trminos la media


a

y despus dividimos entre el nmero positivo . As,

X
X

,
b

Es lo que utilizamos en los siguientes ejercicios.


Ejercicio 22 Si X ,! N (3; 00 8), calcula p (X
Solucin :

30 5), p (X < 20 7) y p (2 < X < 30 4).

Si X ,! N (3; 00 8), la variable


X 3
,! N (0; 1)
00 8

Z=

es una variable normal estndar. De esta forma,


30 5 = p

X 3
00 8

30 5 3
00 8

=p Z

p X < 20 7 = p

X 3
00 8

20 7 3
00 8

=p Z

p Z

00 37 = 1

p X

00 63 = 00 7357 = 00 7340:

Igualmente,

=1

00 37 = p Z

00 37 =

00 6443 = 00 3557 = 00 3538:

Finalmente, calculamos:
p 2 < X < 30 4 = p

X 3
00 8

2 3
00 8

=p Z

00 5 + p Z

30 4 3
00 8
10 25

10 25

1 = 00 6915 + 00 8944

00 5 =
1=

= 0 5859 = 0 5859:

Ejercicio 23 Si X ,! N ( 30 25; 8), calcula p (X < 0), p (X


Solucin :

X<

20 25).

Por un lado:

p (X < 0) = p
A. Roldn

4) y p ( 40 12

( 30 25)
8

( 30 25)
8

= p Z < 00 41 = 00 6591 = 00 6577:

53

11.6. Variable aleatoria continua: la distribucin normal

De la misma forma:
p (X

4) = p

( 30 25)
8

p Z < 00 09 = 1

=1

( 30 25)
8

00 09 =

=p Z<

00 5359 = 00 4641 = 00 4626:

Y repitiendo el proceso:
40 12

40 12

20 25 = p

X<

=p

( 30 25)
8

00 11

00 13 = p Z

= 00 5517 + 00 5438

( 30 25)
8

00 11

1=

00 13 + p Z

1 = 00 0955 = 00 09304

Ejercicio 24 Si X ,! N (120 4; 10 27), calcula p (80 56 < X


Solucin :

( 30 25)
8

140 26) y p (11

X < 13).

Razonamos exactamente igual que antes:

p 80 56 < X

80 56 120 4
10 27

140 26 = p

30 02

=p

120 4

10 27
10 46 = p Z

= 00 9279 + 00 9987

140 26 120 4
10 27
10 46 + p Z

=
30 02

1=

1 = 00 9266 = 00 9272:

Y lo repetimos todo igual:


p (11

X < 13) = p
=p

120 4

11

10 27
10 10

120 4
10 27

= 00 6808 + 00 8643

00 47 = p Z

13

120 4
10 27

00 47 + p Z

10 10

1=

1 = 00 5451 = 00 5465:

Justicamos a continuacin el lema 11.2.1 de la pgina 36 en el caso de la distribucin normal,


pero precisando an ms.
Lema 11.6.6 Si X ,! N ( ; ), entonces:
I En el intervalo X

;X +

se encuentra, aproximadamente, el 6826 % de la poblacin.


A. Roldn

54

CAPTULO 11. VARIABLES UNIDIMENSIONALES

I En el intervalo X

2 ;X + 2

se encuentra, aproximadamente, el 9545 % de la poblacin.

I En el intervalo X

3 ;X + 3

se encuentra, aproximadamente, el 9973 % de la poblacin.

Demostracin :

p X

Tipicando se obtiene lo siguiente:

<X<X+

=p

<X

X<

= p (Z

1)

p (Z

= p (Z

1)

[1

= 2 00 8413

=p

1<

1) = p (Z
p (Z

1)

p (Z

1)] = 2 p (Z

<1

1)

= p ( 1 < Z < 1) =
1) =

1=

1 = 00 6826:

Igualmente,
p X

2 <X <X +2

= p ( 2 < Z < 2) = 2 p (Z
= 2 00 9772

2)

1=

1 = 00 9544 = 00 9545;

y tambin
p X

3 <X <X +3

= p ( 3 < Z < 3) = 2 p (Z
= 2 00 9987

11.7.

3)

1=

1 = 00 9974 = 00 9973;

Aproximacin de distribuciones binomiales

En muchas ocasiones no es sencillo calcular probabilidades asociadas a una distribucin


binomial, pues las frmulas son bastante complicadas, y adems es posible que tengamos que
hacer muchas sumas. Por ejemplo, si X ,! B (20; 00 7), entonces
p (X

12) = p (X = 12) + p (X = 13) + : : : + p (X = 20) =


=

20
12

00 712 00 38 +

20
13

00 713 00 37 + : : : +

20
20

00 720 00 30 :

Estos ocho sumandos no son nada fciles de calcular, y menos an su suma. Es imprescindible
calcularlos para conocer p (X 12)? La respuesta es negativa: si podemos aproximar X por
una variable normal, estas probabilidades sern mucho ms sencillas de calcular, pero siempre
teniendo en cuenta que se trata de una aproximacin. Es el caso del siguiente teorema.
A. Roldn

55

11.7. Aproximacin de distribuciones binomiales

Teorema 11.7.1 (de De Moivre) Si X ,! B (n; p) y se tiene que


n p

n q

5;

(siendo q = 1 p) entonces la variable X se puede aproximar por una variable aleatoria normal
~ que posee su misma media y su misma desviacin tpica.
X
X

~ ,! N n p; pn p q
X

Es importante aprender a interpretar este teorema. Lo que quiere decir es que, como p y q
estn acotadas entre cero y uno, una distribucin binomial es tanto ms parecida a una normal
cuanto mayor es el nmero n de repeticiones del experimento. De hecho, la aproximacin es
buena si n p; n q 3, y es casi perfecta si n p; n q 5. A medida que n crece, la aproximacin
es cada vez mejor (volveremos sobre esta idea en el teorema central de lmite 12.2.1).
~ es continua? La variable X acumula su proCmo es esto posible si X es discreta y X
~ tome un valor concreto es nula.
babilidad en puntos concretos, pero la probabilidad de que X
Realmente, en este caso, debemos tomar el intervalo adecuado:
p (X = k) = p k

00 5

~
X

k + 00 5

Ejercicio 25 Si X ,! B (15; 00 4), calcula p (X = 8) con la frmula de la binomial y aproximando.

Solucin :

Por un lado,
p (X = 8) =

15
8

00 48 00 67

00 11806:

Si aproximamos con una variable


p
~ ,! N (n p; pn p q) = N 6; 30 6
X

N 6; 10 897 ;

tendremos el valor
p 70 5

~
X

80 5 = p

70 5 6
10 897

=p Z

10 32

~ 6
X
10 897
p Z

80 5 6
10 897

= p 00 79

00 79 = 00 9066

10 32 =

00 7852 = 00 1214 = 00 1208:

Esta aproximacin comete un error relativo del 232 %.


Ejercicio 26 Supongamos que X ,! B (40; 00 7). Calcula las siguientes probabilidades, aproximando si es necesario:
p (X = 20) ;

p (X

25) ;

p (20

30) :
A. Roldn

56

CAPTULO 11. VARIABLES UNIDIMENSIONALES

Solucin :

La primera probabilidad se puede calcular con la frmula (11.14):


p (X = 20) =

40
20

00 720 00 320 = 00 003835 14;

pero tiene bastantes cuentas. Como n p = 40 00 7 = 28 5 y n q = 40 00 3 = 12


~ con distribucin
intentar aproximar X con una variable X
p
~ ,! N (n p; pn p q) = N 28; 80 4
X

~
X

200 5 = p

190 5 28
20 898

200 5, de manera que obtenemos:


!
200 5 28
p 20 93 Z
20 59 =
20 898

~ 28
X
20 898

= p 20 59

= 00 9983

00 9952 = 00 031:

N 28; 20 898 :

~
X

Aproximamos el suceso X = 20 con el suceso 190 5


p 190 5

5, vamos a

20 93 = p Z

20 93

20 59 =

p Z

Esta aproximacin de p (X = 20) es bastante mala. Ello se debe a que estamos intentando
aproximar un valor puntual de la binomial. Veamos cmo con un intervalo nos va mucho mejor.
La segunda probabilidad es:
p (X

25) =

40
X

p (X = k) =

40
X

40
k

k=25

k=25

00 7k 00 340

00 884853;

que se aproxima con:


~
p X

240 5 = p

~ 28
X
20 898

240 5 28
20 898

=p Z

10 21 = p Z

10 21 = 00 8869:

Esta aproximacin en un intervalo es mucho mejor que la anterior, y cuesta mucho menos trabajo
que calcular la sumatoria anterior (que se ha hecho con ordenador). Igualmente,
p (20

30) =

30
X

p (X = k) =

k=20

30
X

k=20

40
k

00 7k 00 340

00 801655;

y, por otro lado,


p 190 5

~
X

300 5 = p

190 5 28
20 898

=p Z

~ 28
X
20 898

00 86 + p Z

20 93

300 5 28
20 898

20 93

1 = 00 8051 + 00 9983

00 86 =

1 = 00 8034:

Esta aproximacin tambin es muy buena, y elimina un montn de tediosos clculos.

A. Roldn

Вам также может понравиться