Академический Документы
Профессиональный Документы
Культура Документы
3: Anlise Previa
Datos: materia prima de todo mtodo estatstico
Son os valores que toman as variables
Datos Multivariantes
p variables
p > 2
n individuos
n: nmero de observacins ou tama!o da mostra.
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Datos ori)inais
X=
x
11
x
21
x
p1
x
12
x
22
x
p2
x
1n
x
2n
x
pn
|
Matrices de datos
B=X
t
X matriz cos momentos mostrais de orde 2
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Datos en desviacin respecto da media
X
d
=
x
11
x
1
x
21
x
2
x
p1
x
p
x
12
x
1
x
22
x
2
x
p2
x
p
x
1n
x
1
x
2n
x
2
x
pn
x
p
|
Matrices de datos
1
n
L=
1
n
X
d
t
X
d
=V matriz de varianzas-covarianzas
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Datos tipi*icados: +ariable tipi*icada:
X
s
=
x
11
X
1
S
1
x
21
X
2
S
2
x
p1
X
p
S
p
x
12
X
1
S
1
x
22
X
2
S
2
x
p2
X
p
S
p
x
n1
X
1
S
n
x
n2
X
2
S
2
x
pn
X
p
S
p
|
Matrices de datos
x
ki
X
k
S
k
R=
1
n
X
s
t
X
s
matriz de correlacions
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
+ariable: p = w
1
(
1
+ w
2
(
2
+ ... + w
p
(
p
,bservacin: -
.
= w
1
x
1j
+ w
2
x
2j
+ ... + w
p
x
pj
Matricialmente: y = Xw
#ombinacin li!al de variables
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Media mostral:
#ombinacin li!al de variables
Y=w
1
X
1
+w
2
X
2
++w
p
X
p
=
X
t
w
X
t
w=
X
1
X
2
X
p
|
w
1
w
2
w
p
|
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Varianza mostral:
#ombinacin li!al de variables
S
y
2
=
1
n
y
d
t
y
d
=w
t
V w
T.3: Anlise Previa
y
d
=X
d
w=
y
1
Y
y
2
y
n
Y
|
x
11
x
1
x
21
x
2
x
p1
x
p
x
12
x
1
x
22
x
2
x
p2
x
p
x
1n
x
1
x
2n
x
2
x
pn
x
p
|
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Media mostral: i / 01 21 .... 1 p
+arian2a mostral: i / 01 21 .... 1 p
Covarianza: i,k = 1, 2, .... , p
Correlacin: i,j = 1, 2, .... , p
'statstica Descriptiva
S
ik
=
j=1
n
(
x
ij
x
i
) (
x
kj
x
k
)
n
r
ij
=
Sij
S
i
S
j
x
i
=
j =1
n
x
ij
n
S
ii
=S
i
2
=
j =1
n
(
x
ij
x
i
)
2
n
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
x=
x
1
x
2
x
p
|
Medidas de centrali2acin: centroide
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
L= X
d
t
X
d
V=
1
n
L=
S
1
2
S
12
S
1p
S
21
S
2
2
S
2p
S
p1
S
p2
S
p
2
|
Medidas de variabilidade:
matri2 de +arian2as 3#ovarian2as
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Varianza Xeralizada=determinante(S)=\
1
... \
p
Medidas de variabilidade:
Medidas 4lobais
T.3: Anlise Previa
VarianzaTotal=Traza(S)=\
1
+...+\
p
\
1,
... , \
p
autovalores de S
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Coeficiente de correlacin lial:
R=
1
n
X
s
t
X
s
=
1 r
12
r
1p
r
21
1 r
2p
r
p1
r
p2
1
|
r
ki
=
S
ki
S
k
S
i
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Medidas de dependencia li!al:
entre pares de variables
P=
1 r
12.3...p
r
1p.2... ( p1)
r
21.3...p
1 r
2p
r
p1.2...( p1)
r
p2.13... ( p1)
1
|
Medidas de dependencia li!al:
correlacin parcial
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
R
j.1,2 , ... , p
2
=
variabilidadeexplicada polaregresin
variabilidade total
T.3: Anlise Previa
Coeficiente de determinacin mltiple:
Medidas de dependencia li!al:
entre cada variable e o resto
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
p
2
=1R
Medidas de dependencia li!al:
4lobalmente
T.3: Anlise Previa
Propiedades:
3 5 1
3
2
/ 5 Tdalas variables incorreladas
3
2
/ 0 ')isten combinacins li!ais entre variables
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
f
(
x
1,
x
2,
, x
p
)
= f ( X)=2
p
2
2
1
2
e
1
2
( X)
t
2
1
( X)
$ormal multivariante
T.3: Anlise Previa
Sendo o vector de esperanzas
a matriz de varianzas-covarianzas
(X
1
, X
2,
... , X
p
) ~ N( , ):
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
=
X
1
|
E
X
2
|
X
p
|
|
=
p
|
$ormal multivariante
2=E
( X) ( X) |
t
=
u
1
2
u
12
S
1p
u
21
u
2
2
u
2p
u
p1
u
p2
u
p
2
|
T.3: Anlise Previa
vector de esperanzas
a matriz de varianzas-covarianzas
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
=
X
1
|
E
X
2
|
|
=
2
|
$ormal bivariante
2=
u
1
2
u
12
u
21
u
2
2
|
(X
1
, X
2
) ~ N(, ):
f ( x
1,
x
2
)=(2)
1
2
1
2
e
1
2
(
x
1
1
x
2
2
)
2
1
(
x
1
1
x
2
2
)
$ormal unidimensional:
T.3: Anlise Previa
f ( x
1,
x
2
)=(2)
1
2
u
1
e
1
2
( x)
2
u
2
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
=
X
1
|
E
X
2
|
|
=
2
|
$ormal bivariante
2=
u
1
2
u
12
u
21
u
2
2
|
(X
1
, X
2
) ~ N(, ):
f ( x
1,
x
2
)=(2)
1
e
1
2
(
x
1
1
x
2
2
)
2
1
(
x
1
1
x
2
2
)
p
ki
=
u
ki
u
k
u
i
Dado 6ue: 'ntn:
2=
(
u
1
2
p
21
u
1
u
2
p
12
u
2
u
1
u
2
2
)
T.3: Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
7/87
1
1 7
2
,
... 1 7
p
) ~ Normal Multivariante
$ormal multivariante: Propiedades
T.3: Anlise Previa
- Combinacins liais de elementos de X ~ distribucin normal multivariante.
- Subconuntos de compoentes de X ~ distribucin normal multivariante.
- !istribucin condicional das compoentes ~ distribucin normal multivariante.
- Covarian"a entre d#as compoentes $ % independencia entre esas compoentes
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
T.3: Anlise Previa
,b)ectivo: Obter unha impresin inicial dos datos
Anlise Previa
T"#$%#A& '&TAT(&T%#A&
Anlise Multivariante
Deteccin de atpicos
Aparecen frecuentemente: