Вы находитесь на странице: 1из 40

TEMA 4

DISTRIBUCIONES CONTINUAS
IMPORTANTES

DOCENTE : MARCO ANTONIO SÁNCHEZ L.


AÑO: 2014
DISTRIBUCIONES CONTINUAS
Son aquellas que presentan un numero infinito de
soluciones. El rango es un intervalo y tienen una función de
densidad de probabilidad.
Ejemplo:
El peso de los alumnos de una clase puede tomar infinitos
valores dentro de cierto intervalo (42,37 kg; 42,3764kg;
42,376541kg, etc); la esperanza media de vida de una
población (75,2 años, 72,513 años, 72,51234 años)
Función de distribución: P[X≤x]= 𝑅𝑥
𝑓 𝑥 𝑑𝑥
Además se cumple:
DISTRIBUCIONES CONTINUAS
1).- 𝑓 𝑥 𝑑𝑥 = 1
2).- E(X)= 𝑥𝑓 𝑥 𝑑𝑥
3).- Var(x)=𝜎 2 = 𝐸(𝑋 2 )-(E(X))2
Las principales distribuciones continuas son:
La distribución uniforme
La distribución normal
La distribución normal tipificada
La distribución t student
La distribución Chi2
La distribución de Fisher
DISTRIBUCION UNIFORME
Una variable aleatoria continua tiene distribución
uniforme con parámetros  y  ( < ) que pueden
tomar cualquier valor en un intervalo , todos ellos con la
misma probabilidad.
Su función de densidad es aquella que nos permite
conocer las probabilidades que tiene cada punto del
intervalo y esta dada por:
DISTRIBUCION UNIFORME
1
, 𝑆𝑖 𝛼 ≤ 𝑥 ≤ 𝛽
f(x) 𝛽−𝛼
0 , 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
La función de distribución esta dada por :
F(X)=P 𝑋 ≤ 𝑥 = 𝑓 𝑥 𝑑𝑥
Sus características serian:
𝛼+𝛽
Esperanza matemática : =E(X)=
2
(𝛽−𝛼) 2
La varianza : Var (X)=𝜎 2 =
12
DISTRIBUCION UNIFORME
EJEMPLO 1: El precio medio del litro de gasolina durante el
próximo año se estima que puede oscilar entre 40 y 45 Bs el
galón de 10 litros. Esto podría ser Bs.42,0 a Bs 42,10, Bs
42,135, Bs 42,99 etc. Hay infinitas posibilidades todas con la
misma probabilidad.
Por lo tanto la función de distribución del ejemplo seria:
1
f(x)= =0,20
45−40
Es decir , que el valor final que este entre 40 y 41, tiene un
20% de probabilidad, que este entre 41 y 42 otro 20%
DISTRIBUCION UNIFORME
Por tanto el precio medio esperado para la gasolina es
de 42,5 el galón de 10 litros.
(40+45)
𝜇= = 42,5
2
DISTRIBUCIÓN NORMAL
La distribución de probabilidad continua mas importante en el
campo de la estadística es la distribución normal, debido a que
en la practica muchos fenómenos industriales, científicos o de
la vida diaria pueden describirse por esta distribución.
DEFINICION :Una variable aleatoria continua X, se dice que esta
distribuida normalmente con media  (-∞< < ∞) y varianza
2>0 si su función de densidad de probabilidad esta dada por:
1 (𝑥−𝜇) 2
1 −
f(x)= 𝑒 2 𝜎 , -∞< x < ∞
𝜎 2𝜋
Donde =3,14159 … y e=2,71828…
DISTRIBUCIÓN NORMAL
NOTACION Una notación muy usada para la distribución
normal es : X N(,2)
Que se lee: la variable aleatoria X se distribuye normalmente
con media  y varianza 2 (se usa también la notación
XN(,) que se “lee X tiene una distribución normal con
media  y desviación estándar ”
Los dos parámetros que determinan completamente la
distribución normal son su media y su varianza
Los valores medios se pueden representar en las graficas de
las funciones de densidad como se representa en la figura
siguiente:
DISTRIBUCIÓN NORMAL
1< 2

1 2

El caso del grafico es una comparación de dos distribuciones


normales con similar varianza y medias diferentes
DISTRIBUCIÓN NORMAL
La varianza es una medida de la variabilidad o
dispersión de la variable aleatoria
A mayor varianza mayor variabilidad .
La desviación estándar puede usarse para identificar los
puntos de inflexión de la función de densidad , es decir
estos puntos corresponden a : - y +.
Esto se muestra en la grafica siguiente:
DISTRIBUCIÓN NORMAL

La grafica muestra una comparación de dos distribuciones


normales con varianzas diferentes y medias similares
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
Cuando la media de la distribución es cero y la varianza
es uno con función de densidad:
1 2
1
f(z)= 𝑒 2𝑧 ∀𝑧 ∈ℝ
2𝜋

La función de distribución de Z se denota por (z) o Nz(z)


y esta dada por:
−𝑡2
𝑍 1
(z)=P[Z ≤ z]= −∞ 2𝜋
𝑒 2 𝑑𝑡
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
Su ventaja reside en que hay tablas donde se recoge la
probabilidad acumulada para cada punto de la curva de
esta distribución.
En la tabla los valores de (z) están dados para valores
de z desde -3 a 3.
Cualquier variable aleatoria X normal con media y
varianza pueden ser transformadas a una variable
estandarizada Z por la siguiente transformación:
𝑋−𝜇 𝑋−𝜇 𝑋−𝜇
Z= obviamente E( )=0 y Var( )=1
𝜎 𝜎 𝜎
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
Ejemplo: Una variable aleatoria sigue el modelo de la
distribución normal con media 10 y varianza 4
transformarla en una normal tipificada X:N(10,4)
𝑥−10
Z=
2
Esta nueva variable se distribuye como una normal
tipificada, permitiéndonos por lo tanto conocer la
probabilidad acumulada en cada valor de Z:N(0,1)
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
USO DE LA TABLA DE DISTRIBUCION NORMAL ESTANDAR
El formato de la tabla lo podemos ver en la grafica
siguiente:
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
Donde la columna de la izquierda indica el valor cuya
probabilidad acumulada queremos conocer.
La primera fila nos indica el segundo decimal del valor
que estamos consultando.
Ejemplo1: Queremos conocer la probabilidad acumulada
del valor 2,75. Entonces buscamos en la columna de la
izquierda el valor 2,7 y en la primera fila el valor 0,05 y
en el cruce de esta fila y columna se encuentra la
probabilidad acumulada (de 0,99702 es decir 99,72%)
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
IMPORTANTE
La tabla presentada nos da la probabilidad acumulada, no
la probabilidad concreta en ese punto, es decir la que va
desde el inicio de la curva por la izquierda hasta dicho valor.
𝑧
Y responden a la expresión: P[Z ≤ z] = (z)= −∞ 𝑓 𝑧 𝑑𝑧 , que
corresponde a la siguiente figura:
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
En una distribución continua en la que la variable puede
tomar infinitos valores, la probabilidad en un punto
concreto es prácticamente despreciable.
Existen otras tablas que nos dan la probabilidad de la
𝑧
media al punto P[0 ≤ Z ≤ z]=(z)= 0 𝑓 𝑧 𝑑𝑧 .
Cuya grafica correspondiente es:
DISTRIBUCIÓN NORMAL ESTANDAR O TIPIFICADA
Algunas características que debemos recordar de esta
distribución son:
La forma de la curva normal es simétrica a ambos lados.
La media , mediana y moda son iguales y se ubican en el
punto más alto de la grafica.
Ejercicio: el tiempo que demoran los estudiantes en
llegar a la universidad es de 35 minutos y con una
desviación estándar de 10 minutos.
Los parámetros son: = 35 y =10
DISTRIBUCIÓN NORMAL
1.¿Qué porcentaje de los estudiantes llega entre 35 y 50
minutos?
PASO 1 Se debe dibujar la curva de distribución normal
considerando que la media y la moda se ubican en el
puto mas alto de la curva:

Área que nos piden calcular la probabilidad

𝑥−𝜇
𝑍=
𝜎
DISTRIBUCIÓN NORMAL
Para el calculo remplazando valores tendríamos:
50−35
𝑍= = 1,5 entonces en tabla (z)=0,4392
10
Este es el valor que busco en tablas y expresado en
porcentaje es: 43,92%
b) Que porcentaje de los estudiantes llega entre 18 y 41
minutos ?
Lo primero que se hace es graficar la curva y analizar el
área que debo encontrar para dar la respuesta al problema

Área por encontrar


DISTRIBUCIÓN NORMAL
Se debe según la tabla que se usa hallar primero el área
de la media a 41 minutos y luego de la media a 18
minutos , entonces tendríamos:
18−35 41−35
𝑍= = −1,7 𝑍= = 0,6
10 10
Buscando los valores en la tabla tendríamos :
Z=-1,7 y =0,4554 y para Z=0,6 y =0,2257 y esto
expresado en porcentajes seria 45,54% y 22,57% que
sumados nos dan la probabilidad que estamos
buscando correspondiente a 68,11%
DISTRIBUCIÓN NORMAL
c) ¿Que porcentaje de los estudiantes llega en mas de 28
minutos?
Lo primero que hacemos es graficar la pregunta y determinar
el área a encontrar:
Se determina que el área inicia de 28 y llega hasta el final y
sabemos que por simetría la mitad tiene el 50% y solo habría
que calcular de 28 a la media y sumar el restante
Área a determinar
DISTRIBUCIÓN NORMAL
28−35
𝑍= = −0,7 y = 0,2580 o 25,80% que sumado
10
al lado derecho 50%, da una probabilidad del 75,80%
d) ¿Que porcentaje de los estudiantes llega en mas de
42,5 minutos?
Lo que hacemos primero es hacer la grafica y determinar
el área que nos solicitan que encontremos que de
acuerdo al grafico es la cola que queda después de 42,5
minutos tal como nos muestra el grafico
Área a calcular
DISTRIBUCIÓN NORMAL
Y lo que aplicamos para encontrar esa área es primero
calcular de la media al punto que nos daría:
42,5−35
𝑍= = 0,75 y = 0,2734 o 27,34% pero esta no
10
es la probabilidad que buscamos sino la de la cola y por
simetría sabemos que el 50% se tiene en ese lado y
tendríamos 50%-27,34% =22,66% que es el porcentaje
de los estudiantes que llegan después de los 42,5
minutos.
DISTRIBUCIÓN NORMAL
e) Que porcentaje de los estudiantes llega entre 15,8 y
32,4 minutos?
Lo que se hace es graficar el área y establecer el método
de calculo
Como podemos apreciar debemos
Área a determinar calcular primero de la media al
punto 15,8 para luego restarle el
valor de la media a 32,4,
aplicando esto tendríamos el
siguiente resultado:
DISTRIBUCIÓN NORMAL
15,8−35
𝑍= =-1,92 y = 0,4726 o 47,26% para el otro:
10
32,4−35
= = 0,26 y = 0,1026 o 10,26% y restando
10
estos valores el porcentaje buscado es:
47,26 -10,26=37,0% son los alumnos que llegan entre
15,8 y 32,4 minutos.
PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN
NORMAL
Si dos o mas variables aleatorias que tienen distribuciones del
mimo tipo se suman, la variable aleatoria resultante tiene una
distribución del mismo tipo de los sumandos, esta es la
denominada propiedad reproductiva del tipo de variable que se
trabaje.
Sean X1,X2,X3,…Xn , n variables aleatorias independientes donde
Xi N(i, 2i) con i= 1,2,3,4,..,n si se tiene
Y = X1+X2+X3+…+Xn entonces :
𝑛 𝑛 2
𝜇𝑌 = 𝑖=1 𝜇𝑖 y varianza 𝜎 2 = 𝑖=1 𝜎
𝑛 𝑛 2
Es decir: YN( 𝑖=1 𝜇𝑖 , 𝑖=1 𝜎 )
PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN
NORMAL
𝑋1 +𝑋2
EJEMPLO.- Sea Y= − 𝑋3 donde Xi(i=1,2,3) son
2
variables aleatorias Normales independientes con :
1= 20 2=16 3=25; Var(x1)= 5 Var(x2)=11 Var(x3)=5
a) ¿Cuál es la distribución de probabilidad de Y?
b) Calcular P[Y>0]
Primero Establecemos que se trata de una distribución
Normal : Xi N(i, 𝜎𝑖2 ) , Xi son independientes.
a) Y es una combinación lineal de la Xi por lo tanto tiene
una distribución normal con:
PROPIEDAD REPRODUCTIVA DE LA
DISTRIBUCIÓN NORMAL
E(Y)= y y Var(Y)= 𝜎𝑌2
Donde:
𝑋1 +𝑋2 1
y=E(y)= − 𝑋3 = 𝐸 𝑋1 + 𝐸 𝑋2 - 𝐸 𝑋3
2 2
1 1
= 𝜇1 + 𝜇2 - 𝜇3 == 20 + 16 - 25 = 7
2 2
2 𝑋1 +𝑋2 1
𝜎𝑌 =Var(Y)=Var − 𝑋3 = 𝑉𝑎𝑟 𝑋1 + 𝑉𝑎𝑟 𝑋2 -
22 4
1 1
Var 𝑋3 = [𝜎12 + 𝜎22 ]+ 𝜎32 = [5+11]+5=9
4 4
PROPIEDAD REPRODUCTIVA DE LA
DISTRIBUCIÓN NORMAL
𝑌−𝜇𝑦 0− −7
b) P[Y>0]=P >
𝜎𝑦 3
7
= P[Z> ]=0,50-(2,33)
3
=0,50-0,4901=0,0099=0,99%
TEOREMA CENTRAL DEL LIMITE
Este teorema justifica la importancia de la distribución
normal.
Sean X1,X2,X3,…Xn , una sucesión de variables aleatorias
independientes con:
E(Xi)=i y Var(Xi)= 2i (ambos finitos)
Si Yn = X1+X2+X3+…+Xn ,entonces bajo ciertas condiciones
generales la variable Zn definida por:
𝑛 𝑛
𝑖=1 𝑋𝑖 − 𝑖=1 𝜇𝑖
Zn=
𝑛 2
𝑖=1 𝜎 𝑖
TEOREMA CENTRAL DEL LIMITE
Tiene una distribución N(0,1) cuando n es grande , es decir si
Fn es la función de distribución de Zn se tiene:
lim 𝐹𝑛 𝑧 = ∅(𝑧)
𝑛→∞
Las condiciones generales son:
Los términos Xi tomados individualmente contribuyen con una
cantidad despreciable a la variación de la suma.
Observe que la variable aleatoria 𝑌𝑛 = 𝑛𝑖=1 𝑋𝑖 puede ser
aproximada por una variable aleatoria distribuida
normalmente, cualquiera que sea la distribución de las Xi
TEOREMA ESPECIAL CENTRAL DEL LIMITE
Sean X1,X2,X3,…Xn , una sucesión de variables aleatorias
independientes e idénticamente distribuidas con:
E(Xi)=i y Var(Xi)= 2i (ambos finitos)
Si Yn = X1+X2+X3+…+Xn ,entonces bajo ciertas
condiciones generales la variable aleatoria:
𝑛
𝑖=1 𝑋𝑖 −𝑛𝜇 𝑋𝑛 −𝜇
Zn= =
𝜎 𝑛 𝜎/ 𝑛
1 𝑛
Donde 𝑋= 𝑖=1 𝑋𝑖
𝑛
TEOREMA ESPECIAL CENTRAL DEL LIMITE
EJEMPLO: Las cajas entregadas por una fabrica tienen
un peso medio de 300 libras una desviación estándar
de 50 libras. ¿Cuál es la probabilidad de que 25 cajas
tomadas al asar y cargadas en un camión excedan de la
capacidad especificada del camión , que se sabe es de
8.200 libras?
Primero Definimos:
Xi= Variable aleatoria que representa el peso de la caja i
TEOREMA ESPECIAL CENTRAL DEL LIMITE
E(Xi)= 300 libras y 𝜎𝑋𝑖 =50 libras todo para cada i
SEGUNDO Se toman 25 cajas al azar, y sean X1,X2,X3,..,
X25 , los pesos de las cajas tomadas al azar, el peso total
de las 25 cajas es 25 𝑖=1 𝑋𝑖 = 𝑌25
TERCERO Se calcula P[Y25>8200]aplicando la ecuación:
𝑌25 −𝑛𝜇 8.200−25(300) 700
P[Y25>8200]=𝑃 > =P[Z25> ]
𝜎 𝑛 50 25 250
P[Z25>2,8]=0,50- (2,8)=0,5000-0,4974=0,0026
TEOREMA ESPECIAL CENTRAL DEL LIMITE
Tiene una distribución N(0,1) es decir para todo zR se
tiene:
lim 𝐹𝑍𝑛 𝑧 = lim 𝑃 𝑍𝑛 < 𝑧 = ∅(𝑧)
𝑛→∞ 𝑛→∞
Gracias a este teorema se puede aproximar las
distribuciones discretas como continuas a la distribución
normal bajo ciertas condiciones y cumpliendo algunos
ajustes de aproximación.
El ajuste que se realiza es el de corrección por
continuidad
APROXIMACIONES DE LAS DISTRIBUCIONES
BINOMIAL Y DE POISSON A LA NORMAL
El ajuste por continuidad se lo realiza respetando el teorema del
limite central y se presenta las consideraciones que se deben hacer
en el siguiente cuadro:

DISTRIBUCIONES CONDICIONES DE APROXIMACION FORMULA USADA PARA LA


APROXIMACION
𝑥
BINOMIAL • “p” cercano a ½ y n>10 𝑥−𝑛𝑝 −𝑝
Z= 𝑛𝑝𝑞 = 𝑛
• “np”> 5 y para p≤ ½ 𝑝𝑞/𝑛
• nq>5 y p>1/2 P[X=x]≈P[x-1/2≤X≤x+1/2]
1 1
𝑥+2−𝑛𝑝 𝑥−2−𝑛𝑝
=∅ −∅
𝑛𝑝𝑞 𝑛𝑝𝑞

POISSON • X1,X2,…Xn son variables 𝑋−𝑛 𝑋𝑛 −𝜆


Z= =
independientes de Poisson 𝑛 𝜆/𝑛
• Cada una debe tener como P[X=x]≈P[x-1/2≤X≤x+1/2]
parámetro a .
𝑥+2−𝑛 𝑥−2 −𝑛
1 1
• Entonces el parámetro de la
=∅ −∅
variable seria n 𝑛 𝑛
OTRAS DISTRIBUCIÓN IMPORTANTES
Las distribuciones Chi2, t studen y de Fhisher se las
explicara en el siguiente capitulo como parte de la
distribución muestral, el calculo de estimadores y el
análisis de hipótesis.
Estas distribuciones tiene su mejor aporte al proceso de
generación de intervalos de confianza en muestras
menores a 30 observaciones.