Академический Документы
Профессиональный Документы
Культура Документы
VARIABLES ALEATORIAS Y
DISCTRIBUCIÓN DE PROBABILIDAD
3.1 INTRODUCCIÓN
Qué son las variables aleatorias, distinguiendo entre las discretas y las
continuas.
Cómo se caracterizan los modelos de probabilidad para las variables aleatorias
discretas y las variables aleatorias continuas mediante la función de
probabilidad, la función de densidad y la función de distribución.
Algunos modelos de probabilidad para variables aleatorias discretas: Bernoulli,
Binomial, de Poisson.
Cómo, en determinadas condiciones, se pueden aproximar modelos de
probabilidad discretos por otros más sencillos e incluso por modelos de
probabilidad continuos, como por ejemplo por la distribución normal.
Ejemplo 3.1
Ejemplo 3.2
Como las variables aleatorias son funciones definidas sobre el espacio muestral E, sus
posibles valores tendrán asociada una probabilidad, que corresponderá a la
probabilidad del suceso constituido por aquellos resultados del experimento que toman
dichos valores. Los diferentes valores de una variable aleatoria y las probabilidades
asociadas constituyen la distribución de probabilidad de la variable. La estadística
es l
Ejemplo 3.3
Ejemplo 3.4
MUESTRA POBLACIÓN
Estimador Parámetro
x , s2,s μ , σ2, σ
Cuando el método que usamos requiere que asumamos que los datos de una muestra
pertenecen a una población con una distribución teórica conocida, suele decirse que
dicho método es paramétrico. Es decir, se basa en los parámetros que definen esa
distribución teórica. En el caso de no presuponer nada acerca de la distribución de la
población, se utilizan los métodos no paramétricos.
1
Las letras griegas μ y σ, se leen mu y sigma, respectivamente.
03. Variables aleatorias y distribución de probabilidad 3 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
Volviendo al tema que nos ocupa, los tipos de distribución más utilizados y que vamos
a ir desarrollando son: la distribución Binomial o la distribución de Poisson para
variables discretas, y la distribución normal o de Gauss para variables continuas.
La función que asigna a cada posible valor xi, i = 1, 2,..., de la variable discreta X su
probabilidad P(X = xi) se conoce como función de probabilidad f(xi).
35%
30%
25%
20%
15%
10%
5%
0%
0 1 2 3
Figura 3.1. Número de caras al lanzar 3 monedas
La función de distribución de una v.a. discreta será una función escalonada creciente
con saltos en los valores xi con probabilidad no nula.
03. Variables aleatorias y distribución de probabilidad 4 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
Ejemplo 3.5
Figura 3.2. Función de probabilidad (a) y función de distribución (b) del número de
supervivientes a los 6 meses de 4 pacientes con cáncer sometidos a tratamiento.
Ejemplo 3.6
A partir de los datos del ejemplo anterior, el valor esperado del número de
supervivientes a los 6 meses de 4 pacientes con cáncer sometidos a tratamiento sería:
y la varianza,
Consiste en realizar un experimento aleatorio una sola vez y observar si cierto suceso
ocurre o no, teniendo dos posibles resultados:
Podríamos por tanto definir este experimento mediante una v.a. discreta X que toma
los valores X = 0 si el suceso no ocurre, y X = 1 en caso contrario, y que se denota
X≈Ber (p).
Un ejemplo típico de este tipo de variables aleatorias consiste en lanzar una moneda
al aire y considerar la v.a. X=”número de caras obtenidas” con probabilidad de éxito
p=1/2 y q=1/2.
Ejemplo 3.7
Se dice que una v.a. X sigue una ley binomial de parámetros n y p, X≈B(n, p), si es
la suma de n v.a. independientes de Bernoulli con el mismo parámetro, p:
03. Variables aleatorias y distribución de probabilidad 7 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
n
f (k ) P[ X k ] p k q nk , 0 k n
k
El valor esperado y la varianza de esta variable son: E[X] = np , Var [X] = np(1-p)
Ejemplo 3.8
2 En la práctica, resulta tedioso calcular las probabilidades de una distribución binomial mediante su
función de probabilidad, los valores f (k) los podemos encontrar tabulados para ciertos valores pequeños
de n, y ciertos valores usuales de p.
Una v.a. X posee una ley de distribución de probabilidades del tipo Poisson cuando:
k
P[ X k ] e , k 0,1,2,...
k!
Este tipo de leyes se aplican a sucesos con probabilidad muy baja de ocurrir.
Esta distribución queda caracterizada por un único parámetro (es a su vez su media
y varianza):
E [X] = VAR [X] = = n ·p
Ejemplo 3.9
Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular
la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas
con dicha enfermedad. Calcular el nº esperado de habitantes que la padecen.
Ejemplo 3.10
Por término medio, en una determinada comunidad se producen 10 urgencias médicas
por hora. ¿Qué probabilidad hay de que se produzcan 10 urgencias en una hora
determinada?
Podemos asumir que la variable X= “número de urgencias por hora” sigue una Poisson
de parámetro 10, ya que la esperanza (promedio de muchas observaciones) coincide
con el parámetro de la distribución.
El dato de que se producen, por término medio, 10 urgencias en una hora puede
utilizarse como argumento para escoger = 10.
Por tanto:
1010
P X 10 e 10 0,125
10!
Luego existe un 12% de probabilidad de que se produzcan 10 urgencias en una hora
determinada.
Las variables aleatorias continuas son aquellas que pueden tomar cualquier valor
dentro de un intervalo. La probabilidad de que estas variables tomen exactamente un
valor determinado es 0, por tanto, para las variables aleatorias continuas, las
probabilidades se asignan a intervalos de valores mediante una función de densidad
de probabilidad, denotada por f(x).
Esta función ha de ser no negativa para cualquier valor x, f(x) ≥ 0, y el área total bajo
la curva definida por esta función de densidad debe ser igual a 1,
3
Al igual que en la distribución Binomial podemos utilizar las tablas de probabilidad existentes para la
distribución de Poisson que podéis encontrar en muchos libros de estadística.
03. Variables aleatorias y distribución de probabilidad 10 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
De forma más sencilla, la función de distribución F(x) es la función que asocia a cada
valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.
Como podemos ver en la figura 3.4, a los valores extremadamente bajos les
corresponden valores de la función de distribución cercanos a 0, mientras que a los
valores extremadamente altos les corresponden valores de la función de distribución
cercanos a 1. Por tanto, es una función que, partiendo de 0, crece de forma continua
hasta alcanzar el valor 1.
Sé que una persona adulta que mida menos de 140 cm es “anómala” porque la
función de distribución es muy baja para 140 cm.
Sé que una persona que mida 170 cm no posee una altura nada extraña pues
su función de distribución es aproximadamente 0,5.
Ejemplo 3.11
Así, por ejemplo, la probabilidad de que un hombre adulto tenga un nivel de colesterol
HDL inferior a 0,90 mmol/l (niveles bajos según las recomendaciones del “National
Cholesterol Education Program”) corresponde al área sombreada bajo la curva a la
izquierda de 0,90 mmol/l y es igual a P(X ≤ 0,90) = 0,3274.
Figura 3.5. Función de densidad (a) y función de distribución (b) del colesterol HDL en hombres adultos
1 x
2
1
2
f ( x) e
2
4
Incluso v.a discretas pueden ser aproximadas por la ley gaussiana.
5
Teorema central de límite.
03. Variables aleatorias y distribución de probabilidad 13 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
La distribución normal o Gaussiana con media μ y varianza σ2 se denota por N(μ, σ2).
La forma de la función de densidad es la llamada campana de Gauss.
Figura 3.6. Función de densidad de una v.a. de distribución normal. El parámetro μ indica el
centro y σ la dispersión. La distancia del centro a los puntos de inflexión es precisamente σ.
Asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exactamente la misma
probabilidad por debajo. Nos permite así comparar entre dos valores de dos
distribuciones normales diferentes, para saber cuál de los dos es más extremo.
Figura 3.8. Función de densidad (a) y función de distribución (b) de una variable aleatoria
Normal estandarizada.
En general, estas tablas facilitan la función de distribución Ф(z) = P(Z ≤ z)6, es decir, la
probabilidad de que la variable normal estandarizada tome un valor igual o inferior a z.
Ejemplo 3.12
6
Para valores z negativos, Φ(z) = P(Z ≤ z) = P(Z ≥ – z) = 1 – P(Z ≤ – z) = 1 – Φ(– z)
03. Variables aleatorias y distribución de probabilidad 15 - 19
Diplomado en Salud Pública
2. Metodología en Salud Pública
De la Tabla 3.3, se tiene que F (1,96) = 0,9750 y, por tanto, z0,975 = 1,96.
Ejemplo 3.13
Supongamos que el colesterol HDL en una población de hombres adultos sigue una
distribución normal X con media μ = 1,10 mmol/l y desviación típica σ = 0,30 mmol/l.
Utilizando la estandarización de variables normales, el porcentaje de hombres de esta
población que tienen niveles de colesterol HDL entre 0,90 y 1,20 mmol/l corresponde a
Utilizando la tabla:
Así, resulta que P (0,90 ≤ X ≤ 1,20) = 0,6293 – 0,2514 = 0,3779; es decir, el 37,79% de
los hombres de esta población tienen niveles de colesterol HDL entre 0,90 y 1,20
mmol/l.
Se demuestra que una v.a. discreta X con distribución binomial, X≈ Bin(n, p) se puede
aproximar mediante una distribución normal si n es suficientemente grande y p no está
ni muy próximo a 0 ni a 1.
Como el valor esperado y la varianza de X son respectivamente np y np(1-p), la
aproximación consiste en decir que X≈ N(np, np(1-p)).
El convenio que se suele utilizar para poder realizar esta aproximación es:
Ejemplo 3.14
La probabilidad de obtener entre 12 y 14 éxitos sobre un total de 100 pruebas con una
probabilidad individual de éxito del 0,10 se obtiene a partir de la distribución binomial X
con parámetros n = 100 y p = 0,10.
Como el cálculo utilizando la función de probabilidad de la distribución binomial es muy
laborioso y se cumplen las condiciones para poder utilizar una aproximación a la
distribución normal Y ≈ N (np, np(1-p)) ≈ N(10, 9) tenemos que:
Como hemos comentado anteriormente puede probarse que, bajo ciertas condiciones,
la distribución de los valores medios de una v.a. continua seguirá un modelo
aproximadamente normal.
Cuanto más grande sea la muestra, mejor se cumple este teorema. Por encima de 60
individuos la adaptación de la distribución muestral de estimadores a la distribución
normal es muy buena. Entre 30 y 60 es aceptable. Por debajo de 30 individuos en la
muestra empiezan a aparecer problemas.
En los temas de inferencia estadística veremos diversos test para comprobar si los
valores de una variable siguen o no la distribución normal.
El teorema central del límite constituye la base fundamental del proceso de inferencia
estadística, dado que posibilita tanto la construcción de intervalos de confianza como
el contraste de hipótesis acerca de la media poblacional μ.