Академический Документы
Профессиональный Документы
Культура Документы
Recinto de Ro Piedras
Facultad de Administracin de Empresas Instituto de Estadstica
INTRODUCCION
En negocios hay muchas situaciones donde sujetos en estudio pueden ser separados en dos o ms grupos bien definidos. Estos sujetos pueden ser personas personas, ciudades ciudades, universidades universidades, pases u otros otros. El propsito del Anlisis Discriminante es construir un clasificador basado en datos multivariados, pertenecientes a grupos bien conocidos por el investigador, para ser usado en clasificacin de nuevos sujetos y puedan ser localizados en alguno de estos grupos en estudio. Segn las caractersticas (multivariadas) de los nuevos sujetos, podremos dar respuesta a casos tales como: 1.- Comprar, este cliente nuestro producto, o no? 2 - Devolver, 2. Devolver este cliente el crdito crdito, o no? 3.- Se adaptar, este candidato al puesto de trabajo, o no?
Cada punto representa un sujeto, en el p de p p-dimensiones espacio Clasificar estos nuevos objetos, en una de estas dos poblaciones
Jos Vega, PhD 3
Regin 1: R1
clasificador
Regin 2:
R2
CONCEPTOS
R1 : Regin donde los sujetos son clasificados como perteneciente a 1 R2 : Regin donde los sujetos son clasificados como perteneciente a 2 : Espacio muestral, R1 R2 = R1 R2 =
x = ( x1 , x2 , x3 , L , x p ) )'
f i (x )
p1 = P (x 1 )
REGIONES DE CLASIFICACIN
R1 : c(1 | 2) p2 f1 (x ) f 2 (x ) c(2 | 1) p1
c(1 | 2) p2 f1 (x ) < f 2 (x ) c(2 | 1) p1
R2 :
c(1 | 2) c(2 | 1) = 1 y
p2 = 1 p1
Regiones de clasificacin
R1 : D(x ) 0 R2 : D(x ) < 0
Jos Vega, PhD
Es la funcin discriminante
D( x ) = ln f1 (x ) f 2 (x )
6
f (x ) =
(2 )
p 2
1 exp (x )' 1 (x ) 2
11 12 22 21 = M M p1 p 2 L 1p L 2p L M L pp
vector de medias
M p
1 2
Matriz de covarianzas
p = 1: univariada
f (x ) = 1 2
2 1 x exp 2
p = 2: bivariada
f1 (x ) = f 2 (x ) =
(2 ) (2 )
p 2
1 2
1
p 2 1 2
Regiones de clasificacin
Es la funcin discriminante
R1 : D(x ) 0
R2 : D(x ) < 0
D(x ) = ln
f1 (x ) f 2 (x )
1 1 1 x' 1 2 x + 2
1 1 1 x' 1 2 x + 2
+
(
' 1
' 1
1 1
1 '2 2 x k 0
1 1
1 '2 2 x k < 0
donde :
Jos Vega, PhD
1 1 ln 2 2
1 ' 1 1 1 1 1 '2 2 2 2
)
9
x0
(2)
10
P( 1 | x 0 ) =
f1 (x 0 ) f1 (x 0 ) + f 2 (x 0 )
= 1 +
f 2 (x 0 ) f1 (x 0 )
1 1 + exp[ D(x 0 )]
Regla de clasificacin
Si
P( 1 | x 0 ) > P( 2 | x 0 )
x0
se clasifica en
de otro modo en
11
ESTIMACION (1)
En el caso de aplicacin, los parmetros 1 , 2 , 1 y 2 son desconocidos. La funcin discriminante se construye con una muestra de cada poblacin muestra de poblacin 1
x11 x12 L x1p x x L x 21 22 2p X = M M M x x L x np n1 n2
muestra de poblacin 2
y11 y12 L y1p y y L y 21 22 2p Y = M M M y m1 ym2 L ymp
1 S x
1 x
2 2
Sy y
12
ESTIMACION (2)
En discriminante lineal se supone que: 1 = 2 La matriz de covarianza comn:
S=
REGIONES DE CLASIFICACION
R1 : D(x) = ( x y )' S 1x R2 1 (x y )' S 1 ( x + y ) 0 2 1 : D(x) = (x y )' S 1x ( x y )' S 1 (x + y ) < 0 2
CLASIFICACION Un nuevo sujeto representado por: Ser clasificado en: 1 Ser clasificado en: 2
Jos Vega, PhD
x 0 = ( x1 , x2 , x3 , L , x p )'
si si
Variables discriminantes: Ingreso: ingreso anual de la persona Inversin: cantidad total invertido en bonos y acciones
14
15
MATRIZ DE COVARIANZAS COMUN Ingreso Inversin Ingreso 14812033021 6123163684 Inversin 6123163684 7663422105
TOTAL 57 27 84
16
D ( x) = 0
0 00006586* Ingreso 0 0.00006586* 0.0003527348* 0003527348* Inversion + 8.92316 8 92316 = 0 Inversin = 0.1867125* Ingreso g + 25297.08
17
clasificador
18
19
P( 1 | x 0 ) =
Se cumple que:
P( 1 | x 0 ) > P( 2 | x 0 )
20
1 si
2 si
D13 (x 0 ) 0
D23 (x 0 ) 0
3 si i
D13 (x 0 ) < 0
D23 (x 0 ) < 0
P ( i | x 0 ) , i = 1, 2, 3
MATRIZ DE COVARIANZAS COMUN X1 X2 X3 503920787.2 -6095139.5 -414582.4 -6095139.5 1016284.4 28703.1 -414582.4 28703.1 4432.8 1403197.0 82864.9 19.3 -689418.9 58951.3 2743.5 -229036851.2 13996125.6 1045238.9 X4 X5 X6 1.40e+06 -689418.9 -229036851 8.29e+04 58951.3 13996126 1.93e+01 2743.5 1045239 8.30e+04 3038.1 3234841 3.04e+03 11217.5 1787913 3.23e+06 1787912.9 1117937215
X1 X2 X3 X4 X5 X6
23
24
FUNCION DISCRIMINANTE
El clasificador consta de tres funciones:
D12 (x)
D12 (x)
0.0002646156 0.0103142274 0.5711362115 0.0583431022 -0.0544522169 -0.0001594750 -57.25612
D13 (x)
-0.0007530045 0.0145923633 0.5000922141 -0.0060218883 -0.2357332707 0.0001415569 -25.52921
D23 (x)
-0.0010176201 0.0042781359 -0.0710439974 -0.0643649905 -0.1812810538 0.0003010319 31.72691
25
26
27
BIBLIOGRAFIA
Albright S., Winston W., Zappe C. (2000). Managerial Statistics, Duxbury M di K Mardia K., K Kent tJ J., Bibb Bibby J J. (1979) (1979). M Multivariate lti i t A Analysis, l i A Academic d i P Press
28