Академический Документы
Профессиональный Документы
Культура Документы
Multivariable de Datos
RKWard
Qu es multivariado?
El mundo es un sistema complejo: se requieren
mltiples mediciones para un anlisis completo.
Por ejemplo el clima:
Presin
atmosfrica
Temperatura
Velocidad
del viento
Anlisis
multivariable
Investigacin de mercado.
Control de calidad en general.
Optimizacin de procesos de control.
Investigacin y desarrollo.
1. Kessler, W. (2007). Multivariate datenanalyse: fr die pharma, bio-und
Prozessanalytik. John Wiley & Sons.
Grficas de dispersin
Relaciona dos variables, una en
cada eje.
ttps://www.mathsisfun.com/data/scatter-xy-plots.html (1-10-2016)
Modelos de
correlacin
o ms dimensiones
https://www.curveexpert.net/gallery-graphexpert-pro/ (1-10-2016)
Clasificadores:
Redes neuronales
Algoritmos
genticos
K-means
Histogramas comparables
Anlisis visual para comparar de manera general frecuencias o
densidades.
Debemos asegurarnos que los eje X y Y correspondan para la
misma magnitud en todas las grficas.
http://siddhumehta.blogspot.mx/2011/06/custom-visualizations-in-ssrs-for.htm
Grficas de reja
No hay una definicin particular, pero contienen tpicamente
cruzan variables e intersectan en una grfica de dispersin.
Grficas de estrella
Cada observacin consiste de un punto de donde parten
rayos.
La distancia de los rayos representa los valores
medidos para cada caso.
Grficas de Andrew
Produce una curva donde involucra todas las variables
de inters:
Grficas de componentes
independientes
Obtienen los componentes principales de una serie de datos.
De la misma manera que x1, en la grfica de Andrew, el
primer componente contiene mayor informacin que los
restantes.
Cada componente principal es asociado con una cantidad
denominada eigenvalor, relacionado a la cantidad de
informacin de cada componente principal.
17%
62%
Pruebas de significancia
multivariada
Prueba T2 de Hotelling.
Prueba de Lambda de Wilk
(MANOVA de una va).
Caso a estudiar
Datos: https://www.crcpress.com/Essentials-of-Multivariate-DataAnalysis/Spencer/p/book/9781466584785
n=48
n=52
N=100
Variables a
estudiar:
Presin sistlica
Presin
diastlica
Frecuencia
cardiaca
H0: T
H0: F
H0: T
NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR H1
Vector de medias
Varianza
Matriz de covarianzas
Covarianza
Prueba T2 de Hotelling
Prueba para comparar dos vectores de
medias. Equivalente a la t-Student en
anlisis univariado.
Supuestos:
Los casos de los datos deben ser independientes unos
de otros: Seleccin aleatoria, no casos emparentados.
Distribucin normal: Cada variable a analizar debe
pasar la prueba de normalidad (ejemplo: Shapiro-Wilk).
Las matrices de covarianza de las dos poblaciones
Si:
Por lo tanto:
Entonces:
Donde:
p = 3 (nmero de variables)
Por lo tanto:
Spencer, N. H. (2013). Essentials of multivariate
data analysis. CRC Press.
5. Obtener el valor de p:
= 3, (52+48-3-1)
df = 3, 96
p-value0.21
https://graphpad.com/quickcalcs/PValue1.cfm (4-10-2016)
Varianza:
Donde:
n: nmero de casos
p: nmero de variables a ser
examinadas
m: nmero de grupos
Covarianza:
Grados de libertad
Caso a estudiar:
Datos: https://www.crcpress.com/Essentials-of-Multivariate-DataAnalysis/Spencer/p/book/9781466584785
Grupos:
Variables a estudiar:
Nunca fumaron
N=100
Ex-fumadores
Fumadores
ocasionales
Fumadores
activos
Presin
sistlica
Presin
diastlica
Frecuencia
cardiaca
Matrices de covarianza:
df= 3(41)= 9
obtenemos p-value
df = 9
https://graphpad.com/quickcalcs/PValue1.cfm (4-10-2016)
Se rechaza H .
http://www.sthda.com/english/wiki/principal-c
omponent-analysis-the-basics-you-should-readr-software-and-data-mining
(5-10-2016)
Practicidades
de PCA
http://www.sthda.com/english/wiki/principal-c
omponent-analysis-the-basics-you-should-readr-software-and-data-mining
(5-10-2016)
Ecuaciones de los CP
Las variables originales x1, x2, xp.
PCA produce p componentes independientes (y 1, y2, yp).
bij son simples coeficientes llamados eigenvectores.
Con 2 o 3 CP es posible explicar el 80% de la variabilidad
total de los datos.
Peacock, J., & Peacock, P. (2011). Oxford handbook of medical statistics. Oxford
University Press.
Caso a estudiar:
Largo y ancho del spalo contra largo y ancho
del ptalo
n=150
http://www.sthda.com/english/wiki/principal-c
omponent-analysis-the-basics-you-should-readr-software-and-data-mining
(5-10-2016)
http://www.sthda.com/english/wiki/principa
omponent-analysis-the-basics-you-shouldr-software-and-data-mining
(5-10-2016)
http://www.sthda.com/english/wiki/principal
omponent-analysis-the-basics-you-should-re
r-software-and-data-mining
(5-10-2016)
http://www.sthda.com/english/wiki/principal
omponent-analysis-the-basics-you-should-re
r-software-and-data-mining
(5-10-2016)
5.2:
5.4:
http://www.sthda.com/english/wiki/principalomponent-analysis-the-basics-you-should-re
r-software-and-data-mining
(5-10-2016)
https://cran.r-project.org/web/packages/ggfortify/vignettes/plot_pca.html (5-102016)
Muchas gracias