Вы находитесь на странице: 1из 32

ANLISIS DE ENCUESTAS

TCNICAS

MULTIVARIANTES
1. Introduccin
2 Clasificacin de las tcnicas
2.
3. Etapas de anlisis
4. Supuestos bsicos
5. Valores p
perdidos y anmalos

introduccin

D fi i i
Definicin.
-

Conjunto de mtodos estadsticos cuya finalidad es analizar


simultneamente
i lt
t conjuntos
j t
d datos
de
d t
multivariantes:
lti
i t
h
hay
varias variables medidas para cada caso.

Permiten un mejor entendimiento del fenmeno objeto de


estudio, obteniendo informacin que los mtodos univariantes
y bivariantes son incapaces
p
de conseguir.
g

Objetivos.
Objetivos
-

Proporcionar mtodos para estudiar datos multivariantes


que el anlisis estadstico uni y bidimensional es incapaz de
conseguir.

Ayudar al investigador a tomar decisiones ptimas en el


contexto en el que se encuentre teniendo en cuenta la
informacin disponible por el conjunto de datos analizado.

clasificacin

3 grupos:
-

Mtodos de dependencia

Mtodos de interdependencia

Mtodos estructurales

Mtodos de dependencia:
-

Suponen que las variables analizadas estn divididas en dos


grupos: las variables dependientes y las variables
independientes.
independientes

El objetivo consiste en determinar si el conjunto de variables


independientes
afecta
al
conjunto
de
variables
dependientes y de qu forma.

clasificacin

Mt d de
Mtodos
d interdependencia:
i t d
d
i
-

No distinguen entre variables dependientes e independientes


y su objetivo
bj ti
consiste
i t en identificar
id tifi
qu
variables
i bl
estn
t
relacionadas, cmo lo estn y por qu.

Mtodos estructurales:
-

Suponen que las variables estn divididas en dos grupos: el


de las variables dependientes y el de las independientes.

El objetivo es analizar como las variables independientes


afectan a las variables dependientes y las relaciones de
las variables de los dos grupos entre s.
s

Regresin

clasificacin

Supervivencia
Mtrica

MANOVA
Correlacin cannica

Dependencia

Discriminante
No mtrica

Regresin logstica
C j i t
Conjoint

Componentes
Co
po e tes p
principales
c pa es
Factorial
Mtrica

Cluster
Escalas multidimensionales

Interdependencia
C
Correspondencias
d
i
Modelos log-lineales
No mtrica

Cluster
Escalas multidimensionales

Modelos estructurales

clasificacin

La
L investigacin
i
ti
i responde
d a un problema
bl
de
d dependencia
d
d
i
entre variables o de interdependencia de las mismas?

Cmo estn medidas las variables: mtricas o no mtricas?

Si es un p
problema de dependencias,
p
,
cuntas variables dependientes existen?

clasificacin

Anlisis de dependencias
varias
relaciones

una
relacin

1 variable
dependiente

dependencia
mtrica

ecuaciones
estructurales

regresin
mltiple

> 1 variable
dependiente

dependencia
no mtrica

anlisis
discriminante

dependencia
mtrica

dependencia
no mtrica

independencia

independencia

no mtrica

mtrica

Regresin
logstica

MANOVA

correlacin
cannica

clasificacin

R
Regresin
i lineal
li
l mltiple:
lti l
-

Relacin entre 1 variable dependiente mtrica y varias


variables
i bl independientes
i d
di t mtricas
t i
o no mtricas.
t i
Y1 (X1, X2, X3, .... Xm)

Por ejemplo: Determinar si existe o no relacin entre el


resultado neto y la superficie, dimensin e inversin
inicial.

Y si el resultado neto est codificado en Prdidas = 0, y


Ganancias = 2?

clasificacin

Anlisis
A
li i discriminante.
di
i i
t Proporciona
P
i
reglas
l de
d clasificacin
l ifi
i
ptimas de nuevas observaciones de las que se desconoce
su g
grupo
p de p
procedencia basndose en la informacin
proporcionada los valores que en ella toman las variables
independientes.

Modelos de regresin logstica. Se utilizan como una


alternativa al anlisis discriminante cuando no hay
normalidad.

Anlisis de correlacin cannica:


Y1 (X1, X2, X3, .... Xm)

clasificacin

regresin, discriminante y logistica

((Y1, Y2, Y3, .... Ym) ((X1, X2, X3, .... Xm) correlacin cannica

Asociacin lineal entre un conjunto de variables dependientes y otro


de variables independientes.
-

Si la dependencia es no mtrica

Si la dependencia es mtrica slo si la independencia


tambin lo es

Por ejemplo:
-

Determinar si existe o no relacin entre el resultado neto y la


produccin de contaminantes de una explotacin con la
p
, dimensin e inversin inicial. Corr. cannica
superficie,

Determinar la misma relacin pero con el gnero del ganadero


y el tipo de explotacin (intensivo, extensivo) MANOVA

clasificacin

E
Ecuaciones
i
estructurales:
t
t
l

Varias relaciones: estructuras de la covarianza y anlisis


factorial confirmatorio
Y1 (X11, X12, X13, .... X1m)
Y2 (X21, X22, X23, .... X2m)
Y3 (X31, X32, X33, .... X3m)

clasificacin

A li i de
Anlisis
d interdependencia.
i t d
d
i
-

Las variables no se pueden separar en dependientes e


i d
independientes.
di t

Objetivo: determinar cmo y por qu las variables estn


correlacionadas.

clasificacin

Anlisis de interdependencias
Relacin
entre
variables

Mtricas

componentes
principales

Relacin
entre
casos

Relacin
entre
objetos
j

anlisis
cluster

escalamiento
multidimensional

No mtricas

anlisis
factorial

anlisis
correspondencias

clasificacin

A li i de
Anlisis
d componentes
t principales.
i i l
-

Tcnica de reduccin de datos.

Objetivo: construir combinaciones lineales de las variables


iniciales que expliquen la mayor parte de la informacin
contenida en esas variables.
variables

Esas
combinaciones
se
denominan
Componentes
Principales estn incorrelacionados y cada componente
Principales,
sucesivo explica menos varianza.

Por ejemplo: para comparar 10 explotaciones, es mejor


utilizar 5 Componentes Principales que 150 variables

clasificacin

Anlisis factorial.
-

Tcnica de reduccin de datos.

Objetivo: establecer qu causas latentes (factores) causan la


correlacin entre las variables observadas.

Por ejemplo: el desarrollo de un animal no se puede medir


directamente, pero s es posible medir algunos de sus
i di d
indicadores:
-

El peso y su incremento

La alzada y sus incrementos (cruz, palomillas, etc.)

g
regiones
g
corporales
p
y su
Las dimensiones de algunas
relacin respecto a otras

El anlisis factorial establecera que el factor


desarrollo explica todas estas variables y cmo
se relaciona cada variable con el factor

clasificacin

A li i de
Anlisis
d correspondencias.
d
i
-

Permite visualizar grficamente tablas de contingencia.

Por ejemplo: Si existe relacin entre la formacin del


ganadero y el tipo de gestin
-

Formacin: sin formacin, primaria, bachillerato,


universidad, formacin profesional, mdulos, escuela
de capataces o sus combinaciones

Tipo de gestin: ninguna, asesor fiscal, veterinario


clnico
clnico,
agrnomo
agrnomo,
veterinario asesor o sus
combinaciones

clasificacin

A li i de
Anlisis
d escalamiento
l i t multidimensional.
ltidi
i
l
-

Permite aflorar los criterios que utilizan los individuos para


considerar
id
que distintos
di ti t
objetos
bj t
son parecidos
id
o
distintos.

Por ejemplo: Estudios de preferencia del jamn curado

clasificacin

A li i de
Anlisis
d conglomerados
l
d (cluster).
( l t )
-

A diferencia del factorial que agrupa variables, pretende


agrupar observaciones.
b
i

De tal modo que las observaciones dentro de los grupos


sean parecidas respecto a las variables utilizadas para
agrupar.

Y que las observaciones entre los grupos sean lo ms


diferentes posibles respecto a las mismas variables.

Por ejemplo, para hacer grupos de animales en un programa


de mejora gentica, o de explotaciones de cara a optimizar su
gestin.
gestin

etapas del anlisis

Proceso de aplicacin de la tcnica multivariante.

1 Definir el problema que se est investigando (modelo


1.
conceptual)
-

Anlisis conceptual de su objeto de estudio

Identificar las relaciones fundamentales que se van a


abordar

Eleccin de la tcnica a aplicar

Proceso de aplicacin de la tcnica multivariante.

etapas del anlisis

Por ejemplo:
Analizar la gestin de los sectores ecolgicos

Relaciones entre las variables y los casos:


-

AF/ACP + ANOVA

Correlacin cannica

D
Dependencia
d
i de
d una variable
i bl y las
l dems:
d
-

Regresin logstica

AF/ACP + Discriminante

etapas del anlisis

2 Desarrollo del plan de anlisis


2.
-

Tamao muestral mnimo para la tcnica concreta

L escalas
Las
l de
d las
l variables
i bl a analizar
li
son correctas
t

3. Condiciones de aplicabilidad de la tcnica elegida

4. Desarrollo de la tcnica, incorporando o eliminando


variables segn
g la bondad de ajuste
j

etapas del anlisis

5. Interpretacin de los resultados


-

Interpretar el modelo global

Analizar las variables individuales: cargas factoriales,


coeficientes, varianzas, etc.

La interpretacin retroalimenta al paso 4

6. Validacin del modelo. Tcnicas de diagnstico que


permitan generalizar los resultados a la poblacin.
poblacin

supuestos bsicos

C di i
Condiciones
d aplicabilidad.
de
li bilid d
-

Normalidad

Homocedasticidad

Linealidad

Independencia

supuestos bsicos

Anlisis multivariante de la normalidad.


-

Existen pocos contrastes (Mardia-curtosis y Mardiaapuntalamiento) y no se conoce bien su distribucin

Tambin el grfico chi-cuadrado:


-

( )
Se calculan las distancias de Mahanalobis (D)

Su cuadrado se ordenan de menor a mayor (D2)

En cada distancia se calcula su percentil (j-0,5)/n


(j 0 5)/n

Se calculan los valores X2 de los percentiles de una


distribucin X2 con p grados de libertad (p=nmero de
variables estudiadas)

Se representan D2 y X2

Con Statgraphics se utiliza Multivariate Control Chart

La variable o variables
transformar o eliminar

problemticas

se

pueden

supuestos bsicos

H
Homoscedasticidad
d ti id d (univariante):
( i
i t )
-

Contraste de Levene (hiptesis nula: la varianza de la


variable
i bl X es igual
i
l en todos
t d los
l niveles
i l que forma
f
l variable
la
i bl
Z)

Homoscedasticidad (multivariante):
-

Contraste M de Box
-

Es muy sensible (se recomienda que p<0,001)

Es necesaria normalidad multivariante para el contraste

Por ejemplo:

supuestos bsicos

Estudiar
E
t di
sii los
l
ganaderos
d
son conscientes
i t
d que la
de
l
produccin intensiva perjudica el medio ambiente

O por ell contrario,


t i
l
los
ganaderos
d
i t
intensivos
i
l son
lo
porque no son conscientes de esto

Si esto es as,
as los ganaderos intensivos estaran
significativamente ms en desacuerdo con la afirmacin
que los extensivos
q

Por ejemplo:
-

supuestos bsicos

E t es un problema
Esto
bl
d anlisis
de
li i discriminante:
di
i i
t
-

Una variable dependiente no mtrica (intensivo o


extensivo)
t
i )

Varias variables independientes mtricas:


-

Y1: Opinin (1 a 5): la g.intensiva perjudica el m.


ambiente

Y2: Opinin (1 a 5): no permitir g.intensiva en


espacios protegidos y naturales

Y3: Opinin (1 a 5): reducir ayudas a g.intensiva U.E.

Y4: Opinin (1 a 5): debe informarse ms sobre los


efectos de la g. Intensiva a la opinin pblica

Por ejemplo:

supuestos bsicos

Debe
D
b comprobarse
b
l hiptesis
la
hi t i nula,
l
que la
l matriz
t i de
d
varianzas-covarianzas de las variables Y es la misma para los
niveles de X (intensivo-extensivo).
(
)

Contraste M de Box.

supuestos bsicos

Linealidad:
-

Fundamental en todas las tcnicas que se centren en el


anlisis de las matrices de correlaciones o de covarianzas

Porque el coeficiente de correlacin de Pearson slo puede


captar relaciones lineales

Para la regresin lineal mltiple se analizan los residuos

grficos de dispersin
p
Para el resto de los casos: g
bivariante

Por ejemplo:
consumo inc. Peso inc. Dim.

Digest

Consumo MS ((kg/animal)
g
)

0,87
,

0,91
,

-0,66
,

Incremento de Peso

0,87

0,79

0,81

Incremento de Dimetro

0 91
0,91

0 79
0,79

0 92
0,92

Digestibilidad MS (%)

-0,66

0,81

0,92

supuestos bsicos

consumo

inc Peso
inc.

inc Dim.
inc.
Dim

40

40

30

30

20

20

10

10

Digestibilidad
100
80
60

Consumo

20

40

I Peso
Inc
P

20
0
0

60

40

40

20

40

60

40

40

30

30

20

20

10

10

20

40

60

30
20
10
0
0

20

40

60

100

40

80

30

60

20

20

40

60

20

40

60

20

40

60

40

Inc Diam

30
20

40

10

20

10
0

0
0

Diges

20

40

60

20

40

60

100

40

40

80

30

30

20

20

10

10

60
40
20

0
0

20

40

60

0
0

20

40

60

20

40

60

supuestos bsicos

I d
Independencia:
d
i
-

Los valores que toman las variables en un caso no estn


i fl id por los
influidos
l valores
l
que toman
t
en otro
t caso

Si no se est seguro de esto, habra que incrementar el


nivel de significacin de los contrastes 10 veces (de
p<0,05 a p<0,005)

La independencia se asegura en el diseo experimental

Вам также может понравиться