Вы находитесь на странице: 1из 78

ESTADÍSTICA I

Variables Aleatorias
Distribuciones de Probabilidad
Introducción

 Anteriormente vimos que los datos pueden


representarse mediante gráficos y
resumirse en términos de su valor central,
dispersión, cuartiles, etc.

 En la clase anterior aprendimos cómo


asignar probabilidades a los resultados de
un experimento aleatorio.
Introducción
 Si imaginamos que un experimento aleatorio
se repite muchas veces, esperaríamos que
los resultados acaben obedeciendo a sus
probabilidades.
 La probabilidad conforma un modelo para
experimentos o variables reales.
 Entonces...¿Por qué no hacer con el modelo
lo que ya hemos hecho con los datos que
describe?
Variable Aleatoria
Es una regla que Experimento aleatorio:
Seleccionar un trabajador de la
asigna un número a empresa
cada elemento del
espacio muestral, es
decir, a cada Sueldo
X
resultado posible de
R
un experimento
x=S/. 2000
aleatorio.
Variable aleatoria: ejemplo
Experimento: lanzar dos monedas.
Variable aleatoria: X=número de sellos observados

 Evento simple X
 CC 0
S
 CS 1
S  SC
 SS 2
S S
Ejemplo
Experimento aleatorio: Seleccionar al azar tres facturas
emitidas ayer y verificar si los montos facturados
fueron mayores a S/.500 (E) o no (F).
Variable aleatoria: X = Número de facturas
seleccionadas, emitidas por montos mayores a S/.500
EEE 3
FEE
Ω EFE
2
EEF
FFE
FEF
1
EFF
FFF 0
Rango de la variable aleatoria

 El rango de la variable aleatoria X es el conjunto


RX conformado por todos sus posibles valores.

 En el ejemplo anterior:

X = Número de facturas seleccionadas, emitidas


por montos mayores a S/.500

RX = {0, 1, 2, 3}
Tipos de variables aleatorias

La variable aleatoria X es discreta si su rango RX es


un conjunto finito o infinito numerable.
Ejemplos:
X = número de libros defectuosos en un lote de 100
unidades.
Y = número de veces que se debe llamar a cierta
central telefónica hasta ser atendido por primera vez.
W = número de accidentes de tránsito que ocurren
en la carretera Lima-Chimbote en un día.
Tipos de variables aleatorias

La variable aleatoria X es continua si su rango RX es un


intervalo.
Ejemplos:
X = Tiempo de vida útil, en horas, de cierto modelo de
teléfono celular
Y = Diámetro, en pulgadas, de cierto tipo de tuberías para
agua
W = Producción diaria de leche, en litros, de un establo
Z= Consumo mensual (kW.h) de energía eléctrica de una
empresa
.... y ahora,
¿cómo hacemos para calcular
probabilidades con las variables
aleatorias?
Asignación de probabilidades
 Ejemplo:
Experimento: Se lanza una moneda 3 veces
X= Número de caras que salieron en los 3
lanzamientos
= {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}
Rx= {0, 1, 2, 3}
P[X  0]  P({SSS})  1/8
P[X  1]  P({SSC, SCS, CSS})  3/8
P[X  2]  P({SCC, CSC, CCS})  3/8
P[X  3]  P({CCC})  1/8
Función de probabilidades de la v.a.
discreta

 Los valores de la variable aleatoria X y sus


probabilidades se resumen en la función de
probabilidades denotada por f(x).

X f(x)
Función de probabilidades de la v.a. X
 En el ejemplo anterior:
N° de caras: X 0 1 2 3
f(x) = P [X = x] 1/8 3/8 3/8 1/8

0.5

0.4 0.375 0.375

0.3
f(x)

0.2
0.125 0.125
0.1

0
0 1 2 3
Número de caras
Función de probabilidad de una variable
aleatoria discreta

Si f(x) es la función de probabilidad de la v.a.


dicreta X, entonces, debe cumplir:

i ) f ( x)  P[ X  x]  0 x  ,
ii )  f ( x )   P[ X
xi R X
i
xi R X
 xi ] 1

iii ) Si A  RX  P( X  A)   f ( x)
xA
Función de densidad de una variable
aleatoria continua
La función f(x), es función de densidad de probabilidad
de la v.a. continua X, si satisface:

i) La función de densidad es no negativa:

f ( x)  0 para todo x   (  = números reales).

ii) El área total encerrada por la curva f(x) y el eje X




es igual a uno:  
f ( x ) dx  1

iii) Las probabilidades se calculan como áreas debajo

Si A  , P[ x  A]   f ( x)dx
de la curva: A
Probabilidad para v.a. continuas
Para calcular probabilidades asociadas a resultados de una
variable aleatoria continua X, se usa su función de densidad f(x)
b
P[a  X  b]   a
f ( x)dx

P[a  X  b]
Observaciones
• Los valores de la función de densidad NO son probabilidades:
f(x) ≠ P(X=x)
•La probabilidad de que la variable continua X asuma un valor
particular es siempre igual a cero:
P(X=a) = 0 para cualquier valor a
• Para variables aleatorias continuas:

P[a  X  b]  P[a  X  b]  P[a  X  b]  P[a  X  b]

• Se cumple que:
P[a  X  b]  P[ X  b]  P[ X  a]
Distribución de probabilidad

La distribución de probabilidad f(x) de una


variable aleatoria X, es:
 La función de probabilidad de X,
si X es discreta.

 La función de densidad de probabilidad de


X, si X es continua.
Ejemplo

 Sea la variable aleatoria X = número de expedientes


rechazados por documentación incompleta, en un día.
A partir de información histórica se determina que la
distribución de probabilidad de X es:
x 0 1 2 3 4 5
P(X=x) 0.16 0.24 0.35 0.15 0.08 0.02

 Calcular la probabilidad de que en un día cualquiera:


a) sean rechazados mas de tres expedientes.
 b) sean rechazados a lo mas 2 expedientes.
Función de Distribución
Acumulada

La función de distribución acumulada de la variable


aleatoria X (discreta o continua), se define como:

F ( x)  P( X  x)
Función de Distribución Acumulada

1) Si X es una variable discreta con función de


probabilidad f(x),

F ( a )  P( X  a )   f ( x )
xa
2) Si X es una variable continua con función de
densidad de probabilidad f(x),

F (a)  P( X  a)   f ( x) dx
xa
Propiedades:
Función de Distribución Acumulada

Si F(x) es la función de distribución acumulada de la


variable aleatoria X, entonces:

1)
Si x1  x2  F ( x1 )  F ( x2 )
2)
P(a  X  b)  F (b)  F (a )
Medidas Resumen de variables
aleatorias
Tendencia central:
Media, valor esperado o esperanza
Dispersión:
Varianza y desviación estándar
Media o esperanza de X: μx
La media o esperanza de una variable aleatoria X
se define como:

  xP( X  x) , si X es discreta 

 xRX 

 X  E( X )   
  xf ( x) dx , si X es continua 

 xRx 

Rx representa el conjunto de valores de X.
Varianza:  2
x
Sea X una variable aleatoria con distribución de
probabilidades f(x). La varianza de X es:

 X  V ( X )  E (( X   X ) )
2 2

 X  V ( X )  E ( X )  ( E ( X ))
2 2 2

  ( x   x ) 2 P ( X  x) , si X es discreta 
 xRX 
x 
2

  ( x   X ) f ( x) dx , si X es continua 
2

 xRx 
Desviación Estándar:  X

La desviación estándar de la variable


aleatoria X es la raíz cuadrada de su
varianza:

X  X 2
Ejemplo
El número de licitaciones que gana al año una
empresa consultora, es una variable aleatoria X
con función de probabilidad:

x 0 1 2 3 4
P(X=x) 0.15 0.30 0.25 0.20 0.10

Encontrar la media y la desviación estándar


Solución:
De la función de probabilidad:
x 0 1 2 3 4
P(X=x) 0.15 0.30 0.25 0.20 0.10

4
E( X )   x P( X
x 0
 x ) 1.8
4
E( X 2 )   P( X  x)  4.7
x 2

x 0
 X  E ( X )  1.8
 X  E ( X )  ( E ( X ))  1.46
2 2 2

 X   X  1.2083
2

X
CVX   0.67
X
Ejercicio
La demanda semanal de un artículo que produce una
empresa es una v.a. cuyo modelo de probabilidad es:
Demanda 2,000 3,000 4,000 5,000
Probabilidad 0.3 0.4 0.2 0.1

a) ¿Cuántas unidades de dicho artículo debe producir


la compañía semanalmente, si decide programar
la producción tomando como base:

a1) la demanda más probable?


a2) la demanda esperada?
Solución:
a) a1)3000, a2)3100
Algunas Distribuciones de
Probabilidad Discretas Importantes

Distribuciones de
Probabilidad Discretas

Bernoulli Binomial Poisson


Experimento de Bernoulli

 Un experimento aleatorio de Bernoulli es


una prueba con sólo dos resultados
posibles: Éxito (E) o Fracaso (F)

 La probabilidad de éxito se denota por p


 La probabilidad de fracaso es: 1  p = q
Ejemplos
 Al plantar una semilla, esta puede:
Germinar (E), no germinar (F)
 Si una persona compra una rifa, esta puede:
Ganar (E), perder (F)
 El resultado de un test de paternidad puede
ser:
Positivo (E), negativo (F)
 Si un postulante a la Universidad rinde un examen de
admisión, este puede:
Ingresar (E), no ingresar (F)
Variable aleatoria Bernoulli
X~Ber(p)

Espacio muestral: Ω = {F, E}


Asignando números a cada resultado del
experimento aleatorio:
Éxito  1
Fracaso  0

Podríamos definir este experimento mediante una v.a.


discreta X que toma los valores X=0 en el caso de
fracaso y X=1 en el caso de éxito.
Rango de X: Rx = {0, 1}
Variable aleatoria Bernoulli
X~Ber(p)

La función de probabilidad de X es:


P(X = x) = px (1-p)1-x con x = 0, 1
E(X) = p
Var(X) = 1 – p = q

x 0 1
f(x) = P [X = x] 1-p p
Ejemplo
Inspeccionar un artículo al azar de un lote y ver si es
defectuoso. La probabilidad de que el artículo salga defectuoso
es 0.6

X~Ber(0.6), Rx={0, 1}

Calculando la función de probabilidad:


P(X=x)
P(X = 0) = 0.60 (0.4)1= 0.4
P(X = 1) = 0.61 (0.4)0= 0.6

x
Distribución Binomial
Todo experimento aleatorio que tenga las características
abajo diremos que sigue el modelo de la distribución
Binomial:
 En cada prueba del experimento sólo hay dos resultados
posibles: E (éxito) y F (fracaso)
 El resultado obtenido en cada prueba es independiente
de los resultados obtenidos anteriormente.
 La probabilidad p de éxito E es constante, no varía de
una prueba a otra.
 El experimento consta de n ensayos independientes de
Bernoulli.
variable aleatoria Binomial
X~B(n,p)
 La v. a. Binomial es una v.a. discreta definida como:
 X = número de éxitos obtenidos en n ensayos
independientes de Bernoulli con probabilidad de
éxito p.
 Rx= {0, 1, 2, …, n}
 La función de Probabilidad de la v.a. Binomial es:
P(X=x)= Probabilidad de obtener x éxitos

n x n x n!
P( X  x)    p (1  p)  p x (1  p) n x
 x x!(n  x)!
Ejemplos

Número de artículos defectuosos en un lote de 500


n = 500 Éxito: artículo defectuoso P(éxito) = 0.001
 Número de clientes que compran una póliza de seguro de vida de los
20 visitados
n = 20 Éxito: cliente compra la póliza P(éxito) = 0.20
Número de solicitudes de crédito hipotecario aprobadas de 15
evaluadas
n = 15 Éxito: crédito aprobado P(éxito) = 0.68
variable aleatoria Binomial
X~B(n,p)

Distribución binomial para n = 5 y


distintos valores de p, B(5, p)
Ejemplo 1:
Si se selecciona al azar a una familia con 4
hijos, ¿Cuál es la probabilidad de exactamente
2 sean niñas?
n x n x
p(x)    p ( 1  p)
 x
p  0.5; n  4; x  2
 4
 
p( 2 )    ( 0.5 ) ( 1-0.5 )
2 4- 2

 2
 0.375
Cálculo de probabilidades de una V.A
Binomial usando Excel

 Probabilidades puntuales y acumuladas


Ejemplo 2:
Si una décima parte de las personas pertenece al grupo
sanguíneo A+,
a)¿cuál es la probabilidad de que entre 100 personas
seleccionadas al azar, exactamente 8 pertenezcan a este
grupo?
b)¿cuál es la probabilidad de por lo menos 2 personas
pertenezcan a este grupo?

n x
p(x)    p ( 1  p)n  x
 x
p  0.1; n  100; x  8
100 
p( 8 )    ( 0.1 )8( 1-0.1 )92  0.1148
 8 
 Cálculo en Excel
Media, Varianza de la v.a. Binomial
Distribución de Poisson
X~P()
 Esta distribución fue descubierta por Siméon Denis Poisson
(1781–1840)
 En este tipo de experimentos los éxitos buscados son
expresados por unidad de área, tiempo, pieza, etc.
 La v.a. de Poisson se define como:
X = # de ocurrencias de un evento (éxitos) en un
intervalo específico de tiempo o espacio
Distribución de Poisson
X~P()
Ejemplos:
a) # de llamadas telefónicas que llegan a una central por hora, minuto,
etc.
b) # de siniestros por mes registrados en una compañía de seguros
c) # de defectos de una tela por m2
d) # de aviones que aterrizan en un aeropuerto por día, hora, minuto,
etc.
e) # de bacterias por cm2 de cultivo
f) # de llegadas de embarcaciones a un puerto por hora, día, mes, etc.
Observación:
En esta distribución el número de éxitos que ocurren por unidad de
tiempo, área o producto es totalmente aleatorio y cada intervalo de
tiempo es independiente de otro intervalo dado, así como cada área es
independiente de otra área dada y cada producto es independiente de
otro producto dado.
Distribución de Poisson
Se dice que la v.a. discreta X tiene ley de prob. de
Poisson con parámetro  o X ~ P( ) si su f.p es :

e  k
f (k )  P[ X  k ]  , k  0, 1, 2,...., etc
k!
Donde:
• e es la base del logaritmo natural (e = 2.71828...),
• k! es el factorial de k
•  (0) = número medio o esperado de eventos por unidad
de tiempo (área, producto, etc.)
• Si X~P(), entonces, μ= , σ2 = 
Ejemplo
Si un banco recibe en promedio 6 cheques sin fondo por
día, ¿cuál es la probabilidad de que reciba cuatro
cheques sin fondo en un día dado?
 Solución:
 X = número de cheques sin fondo que llegan al banco en
un día cualquiera
 Rx = {0, 1, 2, 3, …, etc.}
  = 6 cheques sin fondo por día

 P(X=4,  = 6 )= (2.718)-6 (64 ) = 0.1339


4!
Calculando probabilidades con Excel

Usar en el Excel la función

POISSON(4,6,0)
Algunas Distribuciones de
Probabilidad Continuas Importantes

Distribuciones de
Probabilidad Continuas

Normal t
Distribución
Normal

Carl Gauss (1777-1855)


La Distribución Normal
X~N(µ, σ )
2

 La Distribución Normal o de Gauss es la distribución


teórica continua más importante
 Simétrica y en forma de campana
 Media, Mediana y Moda son iguales
 Su función de densidad es:

, -∞<x<+∞

 ∏=3.14159; ℮=2.71828
 μ: Media poblacional; σ2 : varianza
La Distribución Normal
X~N(µ, σ2)
Áreas bajo la
curva normal
15.85% 15.85%
68.3%
X
1 1
Áreas bajo la
curva normal
15.85% 15.85%
68.3%
X
1 1

2.25% 2.25%
95.5%
X
2 2
Áreas bajo la
curva normal
15.85% 15.85%
68.3%
X
1 1

2.25% 2.25%
95.5%
X
2 2

0.15% 99.7% 0.15%


X
3 3
La Distribución Normal
X~N(µ, σ2)
Existen infinitas Distribuciones Normales

Variando los parámetros μ y , obtendremos


diferentes Distribuciones Normales
Distribuciones normales con
igual , diferente 

=1
=5
= 10
X
 = 50
Distribuciones normales con
diferente , Igual 

=5 =5 =5

 = 15  =25  = 40 X
Distribuciones normales con
diferente , diferente 

=1
= 3
 = 10

 = 15  =25  = 40 X
Calculando Probabilidades
Probabilidad es el área
debajo de la curva
¡¡Usaremos Excel!!
P c  X  d   ?

f(X)

X
c d
Probabilidades Normales en
EXCEL
Sea X~N(µ, σ2), para calcular P(X ≤ k), hacemos lo siguiente:
 Insertar función.
 Seleccionar función DISTR.NORM
 Argumentos de la función:
 X: k
 Media: µ
 Desv_estándar: σ
 Acumulado: VERDADERO (también funciona si escribe 1)
Probabilidades Normales con
EXCEL

Si X~N(5, 102) calcular P(X ≤6.2)


P(X ≤6.2)=F(6.2)=0.5478

Distribución Normal
Usar en el Excel la función
  10
DISTR.NORM(6.2,5,10,1)

6.2 X
 5
Probabilidades Normal con EXCEL

X~N(15,9) Si X~N(, 2) calcular:

P(X ≤ k) = Distr.norm (k, , , 1)


P( X > k) = 1- P(X ≤ k)
= 1- Distr.norm (k, , , 1)
15 18.4 X
P(a<X<b)= Distr.norm (b, , , 1) -

x  Distr.norm (a, , , 1)
14.2-10
 0.84
 5
P(15 ≤ X ≤ 18.4) = Distr.norm(18.4, 15, 3, 1) – Distr.norm(15, 15, 3,1)
= 0,8715 – 0.5 = 0.3715
Otra probabilidad que podemos calcular:
P(X≥8)= ???
P(X≥8)= 1-P(X<8)
=1-F(8)=1-0.6179=0.382

Distribución N(5, 102) Usar en el Excel la función


  10 DISTR.NORM(8,5,10,1)

Y a 1 restarle esta probabilidad

8 X
 5
Cálculo del valor x para una
probabilidad dada
10
 5
área = 0.10
área = 0.90

 = 10 k X

En una distribución N(10,25), para una cola de


10% a la derecha, ¿cuál será el valor de k?
k = Distr.norm.inv (0.90,10,5) = 16.41
Ejercicio 1
Si el puntaje de los postulantes en un examen
de ingreso se modela con una distribución normal
con una media de 1200 puntos y una desviación
estándar de 300 puntos.
a) Encontrar la probabilidad de que el puntaje
de un postulante cualquiera sea de por lo menos
1300.
b) ¿Cuál debería ser el puntaje mínimo para
ingresar si se quiere admitir al 15% de los
postulantes con mejores puntajes?
Ejercicio 2
La cantidad de liquido contenido en botellas de bebidas
gaseosas de 2 litros se distribuye normalmente con una media
de 2 litros y una desviación estándar de 0.04 litros. Las botellas
que contienen menos del 95% de contenido especificado, son
causa de que los productores sean penalizados por el
departamento de protección y defensa del consumidor. Las
botellas que tienen un contenido neto superior a 2.06 litros,
causan derrame cuando se abren.
a) Defina la variable aleatoria correspondiente e identifique sus

parámetros.
b)¿Qué porcentaje de las botellas tendrán problemas de
derrame al abrirse?
c)¿Qué porcentaje de las botellas tienen un contenido que

causaría que los productores sean penalizados?


La Distribución Normal Estándar
Z~N(0, 1)

 Una variable aleatoria que tiene distribución


Normal con media μ = 0 y varianza σ2 = 1
se llama variable aleatoria normal estándar.
 Es usual que a la variable normal estándar
se le denote con la letra Z, así:
Z ~ N(0,1) es una variable normal estándar
Probabilidades Normal
Estándar con EXCEL

P(-0.21≤Z≤0.21)= 0.5832-0.4168= 0.1664

Usar en el Excel la función

DISTR.NORM.ESTAND(0.21)

DISTR.NORM.ESTAND(-0.21)
Encontrando los valores Z para
Probabilidades conocidas
Cual es el valor de Z
para una Probabilidad = Usar en el Excel la función
0.6217?
DISTR.NORM.ESTAND.INV
Z  0 Z 1 FINV(0.6217)= 0.31
.6217

0
Z  .31
La Distribución t de Student
X~tn
Características:
 La distribución t, a semejanza de la distribución normal,
tiene media cero, forma de campana y es simétrica
respecto a su media
 No hay una distribución t, sino una "familia" de
distribuciones t, todas con la misma media cero, pero con
su respectiva desviación estándar diferente de acuerdo con
el tamaño de la muestra n. Existe una distribución t para
una muestra de 20, otra para una muestra de 25, y así
sucesivamente
 Media y Varianza:
μ= 0 y σ2 = n , n2
n-2
La Distribución t de Student
X~tn
n ∞
Normal Estándar

Forma de
campana n=13
Simétrica
Colas mas n= 5
pesadas

Z
t
0
Valores tabulados de la
Distribución t de Student
La tabla de la distribución t contiene las
distribuciones de probabilidades para distintos
grados de libertad.

0 t(α , n)
Resumen
 Variables aleatorias: discretas, continuas
 Distribuciones de probabilidad
 Función de distribución
 Esperanza y Varianza de variables aleatorias, propiedades
 Variables aleatorias discretas: Bernoulli, Binomial, Poisson
 Variables aleatorias continuas: Normal, t
 Descripción y cálculo de probabilidades de una distribución
Normal y Normal Estándar
 Ejercicios