Вы находитесь на странице: 1из 13

TEMA 1 ESTADISTICA DESCRIPTIVA

MULTIVARIANTE

5. ESTADSTICA DESCRIPTIVA MULTIVARIANTE

Cuando se estudian diferentes variables sobre varios individuos


interesa conocer las relaciones entre ellas

Hojas de clculo: individuos en las filas y en las columnas las


variables

Variable multidimensional: Resultado de realizar varias mediciones


sobre un mismo individuo o sobre el mismo resultado de un
experimento

Notacin vectorial (X1, X2, X3, , Xd), d = nmero de variables

EJEMPLO: Anlisis de P, K, Ni y Mo en muestras de arroz de dos


variedades ( A y B), dos tipos (P: polished , U: unpolished), recogidas
en la estacin seca (D) o hmeda (W)

d = 7 variables
X1 = variedad, X2 = tipo, X3 = estacin (cualitativas nominales)
X4 = [P], X5 = [K], X6 = [Ni], X7 = [Mo] (cuantitativas continuas)

1
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

Distribuciones bidimensionales de frecuencias:


Se trata de estudiar las frecuencias de los pares
posibles de dos variables X e Y

Estudio conjunto de dos variables X e Y


valores distintos de X: x1, x2, , xk
valores distintos de Y: y1, y2, , yl

Muestra de datos
n individuos
(x1, y1), .., (xn, yn)

TABLAS DE CONTINGENCIA

y1 y2 ...... yl

x1 n11 n12 ...... n1l


x2 n21 n22 ...... n2l
.. .. .. ..
.. .. .. ..
. . . .
xk nk1 nk2 ...... nkl

Tabla de correlacin o de doble entrada

El tamao de la muestra se calcula sumando todas las frecuencias: n = n ij


i, j

2
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

EJEMPLO: Distribucin conjunta para las variables

X = [SO2] en el aire en g/m3, k=3

Y = nivel de cloroplastos por clula , l=3

n=600 muestras

Nivel de
cloroplastos
Alto Normal Bajo
[SO2]
>25 30 40 130
10-25 50 100 50
<10 70 110 20

DISTRIBUCIONES MARGINALES DE FRECUENCIAS


Distribucin marginal de X

y1 y2 ..... yl ni.
x1 n11 n12 ..... n1l n1.
x2 n21 n22 ..... n2l n2.
.. .. .. .. ..
.. .. .. .. ..
. . . . .
xk nk1 nk2 ..... nkl nk.
n.j n.1 n.2 ..... n.l n

Distribucin marginal de Y
Marginal de X: Describe como se distribuye X en la poblacin total, al margen de Y
Marginal de Y: Describe como se distribuye Y al margen de la variable X

3
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

EJEMPLO: FRECUENCIAS MARGINALES n=600 muestras

FRECUENCIAS MARGINALES ABSOLUTAS


Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 30 40 130 200
10-25 50 100 50 200
<10 70 110 20 200
150 250 200 600

FRECUENCIAS MARGINALES RELATIVAS


Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25
10-25
<10
1
El clculo se hara dividiendo todos los valores entre n (600)

DISTRIBUCIONES CONDICIONALES DE FRECUENCIAS

PERMITEN ESTUDIAR LA INFLUENCIA DE UNA VARIABLE


SOBRE OTRA

Condicional de X dado Y= yj: expresa cmo se distribuye X en la subpoblacin que


cumple la condicin de presentar el valor Y=yj

Condicional de Y dado X = xi: expresa cmo se distribuye Y en la subpoblacin que


cumple la condicin de presentar el valor X=xi

Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 30 40 130 200
10-25 50 100 50 200
<10 70 110 20 200
150 250 200 600

4
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

DISTRIBUCIONES CONDICIONADAS DE FRECUENCIAS


Condicional de X dado Y= yj: expresa cmo se distribuye X en la subpoblacin que
cumple la condicin de presentar el valor Y=yj

DISTRIBUCIONES CONDICIONADAS DE [SO2] A CLOROPLASTOS


Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 30 40 130 200
10-25 50 100 50 200
<10 70 110 20 200
150 250 200 600
Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 0.20 0.16 0.65 0.333
10-25 0.33 0.40 0.25 0.333
<10 0.47 0.44 0.10 0.333
1 1 1 1
Se calcula dividiendo los valores entre las frecuencias marginales

Condicional de Y dado X = xi: expresa cmo se distribuye Y en la subpoblacin que


cumple la condicin de presentar el valor X=xi

Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 30 40 130 200
10-25 50 100 50 200
<10 70 110 20 200
150 250 200 600

DISTRIBUCIONES CONDICIONADAS DE CLOROPLASTOS A [SO2]


Nivel de cloroplastos

Alto Normal Bajo


[SO2]
>25 1
10-25 1
<10 1
1

5
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

DIAGRAMA DE DISPERSIN
VISUALIZAR LA RELACIN ENTRE DOS VARIABLES

Observaciones para dos variables (x1,y1),.(xn,yn) y se representan los puntos en el


plano (NUBE DE PUNTOS)

ANLISIS ANLISIS
UNIVARIANTE MULTIVARIANTE

Medida de
posicin MEDIA VECTOR DE MEDIAS

Medida de
MATRIZ DE
dispersin VARIANZA COVARIANZAS

6
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

VECTOR DE MEDIAS
Observaciones para dos variables (x1,y1),.(xn,yn)

VECTOR DE MEDIAS:

Cada componente del vector de medias se mide en las unidades de la


variable correspondiente
Vector de medias: CENTRO DE GRAVEDAD DE LOS DATOS

(2550.9 , 1886.3 , 0.634)

Vector de medias (3 variables)

Vector de medias

7
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

COVARIANZA ENTRE DOS VARIABLES


Observaciones para dos variables (x1,y1),.(xn,yn)

n n
1 1
== ( xi x )2 = ( yi y )2
2 2
s X
n

i=1
sY
n

i=1

n
1
COVARIANZA
ENTRE X E Y:
s XY = ( x i x )( y i y )
n i=1

Refleja la ORIENTACIN CRECIENTE O DECRECIENTE en el diagrama


de dispersin
Unidades: las de las variables correspondientes
Para una muestra con pocos individuos se divide entre n-1

Sumandos +
en la
Sumandos - covarianza
en la
covarianza

Sumandos -
Sumandos + en la
en la covarianza
covarianza

Diagrama de dispersin con relacin creciente de X e Y

8
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

VALORES DE LA COVARIANZA

xi x

yj y
y y
SXY > 0 SXY < 0
RELACIN DIRECTA RELACIN INVERSA

x x

y y

SXY = 0 SXY = 0
x x

INDEPENDENCIA ESTADSTICA

Dos variables X e Y se dice que son INDEPENDIENTES cuando el


conocimiento de una de ella no aporta informacin sobre los valores que
tomar la otra
SI DOS VARIABLES SON INDEPENDIENTES LA COVARIANZA ES 0
Pero que la covarianza sea 0, no significa que las dos variables sean
independientes

SXY = 0
x

9
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

COEFICIENTE DE CORRELACIN LINEAL


El valor de la covarianza se ve afectada por los cambios de escala de
las variables (por ejemplo si cambiamos las unidades), por eso se calcula:

DONDE

El coeficiente de correlacin (r) no tiene unidades: ADIMENSIONAL


Slo cuantifica relaciones lineales
Sus valores estn entre -1 y 1 (MS FCIL DE INTERPRETAR)

Covarianza de [K] y [P] = 603102 ppm2

Coeficiente de correlacin = 0,954

10
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

COEFICIENTE DE CORRELACIN

r = 0,6 r = 0,96 r=0

Relacin no lineal

r=0 r = - 0,75 r1

COEFICIENTES DE CORRELACIN Y DE DETERMINACIN

r = 0,724 RECTA DE REGRESIN DE Y SOBRE X


3000

r2 = 0,524
Y= aX + b
2000

Y: [Pb]
1000
(g/Kg)

0
20 30 40 50 60

X: Longitud mejilln (mm)

r2 mide la proporcin de la variabilidad de Y que es explicada a travs


de la recta de regresin

11
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

MATRIZ DE COVARIANZAS

Para una variable bidimensional (X, Y)

Para una variable multidimensional general (X1, X2,Xd)

Matriz cuadrada de orden


dxd con las varianzas en
la diagonal, y simtrica

EJEMPLO (Problema del arroz):

MATRIZ DE COVARIANZAS:

MATRIZ CORRELACIONES:

La matriz de correlaciones coincide con la matriz de covarianzas de las variables


estandarizadas

12
TEMA 1 ESTADISTICA DESCRIPTIVA
MULTIVARIANTE

BIBLIOGRAFA
Crujeiras, R.M., Faraldo, P.: Manual de Estadstica bsica para ciencias
de la salud, Universidad de Santiago de Compostela, 2010

Miller, J.N.; Miller, J.C.: "Statistics and chemometrics for analytical


chemistry, 6th Ed.", Prentice Hall, 2010

Ramis Ramos, G.; Garca lvarez-Coque, M.C.: "Quimiometra", Sntesis,


2001

Walpole R.E. y col.: Probabilidad y estadstica para ingeniera y


ciencias, Pearson, Mjico, 2012

Massart, D.L. , Vandeginste, B.G.M. , Buydens, L.M.C. , De Jong, S. ,


Handbook of Chemometrics and Qualimetrics: Part A, Elsevier, 1998

Gonick, L. y Smith, W.: La estadstica en caricaturas, Ed. Zendrera,


Barcelona, 1993

13

Вам также может понравиться