You are on page 1of 25

MODELADO EN POLITICA PUBLICA Y GESTION

Mdulo de Estadstica
Profesor: Javier Riascos O.

Propiedades de la
probabilidad
1) 0 P(A) 1,
2) P(A) = 0,
3) P(A) = 1,
4)

evento A.
si evento A no ocurre .
si evento A siempre ocurre con certeza.

Si A1, A2, A3 , son mutuamente excluyentes


(i.e., P(Ai Aj) = 0, para todo i j ), entonces:
P(A B C ) = P(A) + P(B) + P(C)+

5) Si A1, A2, A3 , son mutuamente excluyentes y exhaustivos, i.e.,


entonces,
P(A B C ) = 1

Independencia estadstica
A, B, C, son eventos s-independientes si la
probabilidad de que ocurran juntos es igual al
producto de las probabilidades individuales:
P(A B C )

= P(A) P(B) P(C)

Probabilidad conjunta
de A, B, C,

Probabilidades marginales o
individuales.

P(A , B, C, )

5) Si dos enventos A, B no son mutuamente excluyentes entonces:

P(A B) = P(A) + P(B) P(A,B)


Ejemplo 1
Probabilidad de que una carta de una baraja sea de corazones o sea
una reina:
P(Carta sea de o Carta sea una reina) =
P(Carta sea de ) + P(Carta sea una reina) P(Carta sea la reina de ) =
13/25 + 4/52 1/52 = 4/13

Probabilidad condicional
Es la probabilidad de que ocurra A sabiendo que ha ocurrido B,
denotada como P(A | B), y se lee:
probabilidad condicional de A, condicionada al evento B o
probabilidad condicional de A, dado B
P(A | B) = P(A , B) / P(B);
P(B | A) = P(A , B) / P(A);

si P(B)>0
si P(A)>0

Ejemplo 2:
Tema de investigacin en el doctorado (Energa,
Educacin, Salud), entre hombres y mujeres:
Cul es la probabilidad de que alguien escogido al azar y que realice
su tema de investigacin en Energa, sea hombre?

Variables aleatorias y su
distribucin de probabilidad
Variables aleatorias discretas
Funcin de masa de probabilidad (pmf):

Ejemplo:
X: Nmero de caras en dos lanzamientos de una moneda
(figura)

P()

P(X)

CC

1/4

1/4

CS

1/4

SC

1/4

SS

1/4

1/2
1/4

Variables aleatorias continuas


La probabilidad de una v. a. continua siempre est en un intervalo
(no tiene sentido un valor nico).
Funcin de densidad de probabilidad (pdf)
fX es una pdf de la v.a. X si, para todo x1, x2 en R cumple:

Propiedades:
1) Representa el rea bajo la curva de fX (x) entre x1, x2
2) El rea bajo la curva de fX (x) en todo el dominio es igual a 1:

Variables aleatorias continuas


Ejemplo
fX (x) = x2/9, 0 x 3.

P(0<x<1) =?

Funcin acumulada de probabilidad (CDF)


FX (x) = P(X x)
v.a. discreta:
v.a. continua:

Ejemplo
PDF's y CDF's del numero de caras obtenidas en 4 lanzamientos de una
moneda
Nmero de
caras (X)
0
1
2
3
4

Valor de X
0X<1
1X<2
2X<3
3X<4
4X<5

PDF
1/16
4/16
6/16
4/16
1/16

Valor de X
X0
X1
X2
X3
X4

CDF
1/16
5/16
11/16
15/16
1

FUNCIONES DE PROBABILIDAD
MULTIVARIADA
Ejemplo: Una tienda vende impresoras y PCs durante 200 das. Se
registra el nmero de das (frecuencia absoluta) en que se venden
determinado nmero de PCs (X) e impresoras (Y).
1) Hallar la pmf y CDF de la distribucin de probabilidad conjunta.
f X,Y (x,y)
FX,Y (x,y)
2) Hallar las distribuciones marginales.
fX (x) = y f X,Y (x,y)
fY (y) = x f X,Y (x,y)
En el caso continuo:

Distribucin de probabilidad
condicional
Se refiere a la pdf (pmf) o CDF asociada a la probabilidad condicional
de la v.a. X dada Y, f X|Y (x) , o de la v.a. Y dada X, f Y|X (y).

Caractersticas de las distribuciones


de probabilidad
1) Valor esperado X= E[X]. (Primer momento)
Mide la tendencia promedio de la v.a.

2) Varianza var [X]. (Segundo momento central)


Mide la dispersin de la distribucin de la v.a.

3) Desviacin estndar X =var[X]1/2


En unidades de la v.a. X
4) Coeficiente de variacin
Es una medida de la variacin relativa (es una medida
adimensional).
V = 100 X /X
5) Covarianza cov(X,Y)
Es una medida del grado de correlacin lineal entre dos v.a.s.
cov(X,Y) = E[(X- X)(Y - Y)]

6) Coeficiente de correlacin
= cov(X,Y)/XY
Propiedades:
* -1
* Es adimensional
* Si dos v.as son s-independent, su covarianza (y su coef. de
correlacin) es cero. El inverso no es verdadero necesariamente
(ej.: relacin no lineal).
7) Skewness S
S= E[(X X)3] / X3
8) Kurtosis K
S= E[(X X)4] / var[X]2

Figuras..

Muestreo aleatorio
-

Generalmente no se conoce la distribucin de la variable aleatoria X (e.g., el universo es muy


grande, no se tienen recursos para censar toda la poblacin, no se tienen suficientes datos,
etc.).

Una muestra aleatoria, de tamao n, de una variable aleatoria X, con distribucin terica FX,
son n variables aleatorias, X1, X2,, Xn, independientes e igualmente distribuidas (iid), con
distribucin comn FX.

Una realizacin de la muestra son los valores particulares x1, x2,, xn, observados para las
variables X1, X2,, Xn.

Como consecuencia, la funcin de distribucin conjunta de X1, X2,, Xn es:


F X1, X2,, Xn (x1, x2,, xn) = FX (x1) FX (x2) FX (xn)

A partir de la muestra aleatoria se pueden estimar las caractersticas de la distribucin real


(e.g., valor esperado, varianza, etc.)

1) Promedio muestral

2) Varianza muestral

(estimador de E[X]):

(estimador de var[X]):

3) Covarianza muestral Sample cov(X,Y) (estimador de cov(X,Y)):

4) Coeficiente de correlacin muestral r (estimador de ):

Ejemplos de distribuciones de
probabilidad de v.a. continuas
La distribucin normal
X ~ N(X, X2)
Parmetros:
pdf

Fuente: Wikipedia

Media X

Desviacin estndar X

Si X ~ N(X, X2), Y ~ N(Y, Y2), y son independientes, entonces

X+Y ~ N(X+Y, X2+Y2)


aX+bY ~ N(aX+bY, a2X2 +b2Y2)
La media es la combinacin lineal de las medias y la varianza es la
combinacin lineal de las varianzas (con coeficientes al cuadrado)

La distribucin normal estndar:

Se cumple que: Z ~ N(, ), su CDF se denota por (z)


P(X < x) = P(Z< x-X/X ) = (x-X/X )

Ejemplo
Una universidad espera recibir, para el siguiente ao escolar, 16.000 solicitudes de
ingreso para el primer ao de licenciatura. Se supone que las calificaciones
obtenidas por los aspirantes en la prueba selectiva siguen una distribucin N(950,
1002). Si la universidad decide admitir al 25% de todos los aspirantes que obtengan
las calificaciones ms altas en la prueba selectiva, cul es la mnima calificacin
que es necesario obtener en esa prueba para ser admitido por la universidad?
Solucin
Sea X:=calificacin obtenida, entonces X~N(950,1002). Nos interesa calcular a
tal que:
P(X > a) = P(Z > (a-950)/ ) = 0.25

con Z = N(0,1).
Con las tablas de la distribucin normal estndar se encuentra que (a-950)/es
aprox. 0.675, luego:
a=1017.5.

Teorema del lmite central


Sea , X1, X2,, Xn, un conjunto de v.a. iid de una distribucin con media X
y varianza X20. Entonces, si n es suficientemente grande, la v.a.
correspondiente a su promedio muestral,

tiene aproximadamente una distribucin normal con media X y varianza


X2/n. Es decir,

Nota:
Si X1, X2,, Xn se distribuyen c/u N( X , X2), el teorema se cumple para todo
n.

Ejemplo
Sea X el nmero de millas por galn alcanzados por los carros de una marca particular. Si nos
dicen que X~N(20,4), cul es la probabilidad de que, de una muestra aleatoria de n=25 carros,
el promedio de millas por galn sea:
1) Mayor que 21 millas.
2) Menor que 18 millas.
3) Entre 19 y 21 millas.

Solucin
La v.a. del promedio

sigue una distribucin normal con:


Media = X = 20 y Varianza = X2 /n = 4/25.

Se define la v.a. normal estndar:


Entonces, queremos encontrar:
1)
2)
3)

La distribucin t (o t-Student)
Si se utiliza la varianza muestral SX2, en vez de la varianza real X2
de la v.a. X, entonces el promedio muestral estandarizado (de
una muestra de tamao n) se distribuye t-student de grado df =n-1.

Comparando
con la normal
estndar

Fuente: Wikipedia

Ejemplo
Para los aos 1967 a 1990 el Test de Aptitud Escolar arroj los siguientes datos para el
promedio y la varianza:

Verbal

Hombres

Mujeres

Media

440.42

434.50

Varianz
a

142.08

303.39

Media
500.0
453.67
Matemtic
Varianz
46.61
83.88
as
Una muestra aleatoria de los resultados
de 10 hombres del test verbal dio como resultado un
a
promedio muestral de 440.60 y una varianza muestral de 137.60. Cul es la probabilidad
de obtener ese resultado o mayor?.

Solucin

Este valor de t sigue una distribucin t-student con 9 grados de libertad (df=9). De acuerdo
a la tabla, para obtener un valor t mayor o igual a 0.0485, la probabilidad est por encima de
P=0.4 (la tabla no tiene suficiente resolucin). Utilizando R, da un valor de P=0.48.