Академический Документы
Профессиональный Документы
Культура Документы
topológico de datos
en R. (phom)
Grupo de Interés Local de Madrid – 26 de Noviembre.
Alfonso de Uña del Brío.
Análisis topológico de datos
Objetivo:
Aplicar la topología algebraica para obtener técnicas y herramientas que nos
permitan estudiar las propiedades topológicas y geométricas de un conjunto de
datos.
Paradigma análisis topológico de los datos
Se
Retornamos a estudian
los datos Propiedades topológicas
ATD como herramienta
• A partir de un conjunto de datos queremos obtener información sobre que estructura forma en el
espacio.
Está basado en como nuestro cerebro infiere la información del mundo que nos
rodea.
Ejemplo: el ojo como aparato óptico es bastante malo es gracias a nuestro cerebro
que a partir de las formas vagas que nos llegan infiere el mundo tal y como lo
entendemos (visualización en 3d).
Concepto Matemático: Homología persistente
Homología persistente:
Descripción matemática:
La teoría de la homología persistente crea la homología simplicial desde el algebra
topológica, donde la homología simplicial define un conjunto de invariantes
topológicos de complejos simpliciales con los que se puede describir las
características topológicas de las formas…
Gunnar Carlsson, Topology and data, Bulletin of the American Mathematical Society 46 (2009), noº2, 255–308.
Homología de persistencia
Version: 1.0.3
Depends: Rcpp (≥ 0.9.7)
LinkingTo: Rcpp
Published: 2014-02-09
Author: Andrew Tausz
Maintainer: Andrew Tausz <atausz at stanford.edu>
License: BSD_3_clause + file LICENSE
Paquete “pHom”
Función que genera los intervalos de cada clase en cada dimensión hasta los límites que nos
interese, solo se le puede pasar le valor máximo de la filtración (épsilon - radio).
Dos modos de filtración (rips y …)
Nos devuelve una matriz con tres columnas con dimensión inicio y fin
Ejemplo
library(phom)
x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
#diagrama de persistencia
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")
Ejemplo: Diagrama de persistencia
library(phom)
N <- 50
x1 <- rnorm(N) * 0.1
y1 <- rnorm(N) * 0.1
X1 <- t(as.matrix(rbind(x1, y1)))
x2 <- rnorm(N) * 0.1 + 0.5
y2 <- rnorm(N) * 0.1 + 0.5
X2 <- t(as.matrix(rbind(x2, y2)))
x <- cbind(x1, x2)
y <- cbind(y1, y2)
X <- as.matrix(rbind(X1, X2))
max_dim <- 0
max_f <- 0.8
intervals <- pHom(X, max_dim, max_f, metric =
"manhattan")
Ejemplo de Código de barras
https://dreamtolearn.com/ryan/data_analytics_viz/50
Interpretación del código de barras
Una vez obtenido un código de barras…
¿Y ahora qué?
Tenemos que interpretar el código de barras en nuestro estudio.
¿Qué significa tener agujeros de dimensión dos en nuestros datos?
Interpretar las diferencias topológicas de diferentes espacios.
Interpretar las modificaciones de las propiedades en el tiempo con nuestro conjunto de
datos.
http://www.ams.org/journals/bull/2008-45-01/S0273-0979-07-
01191-3/S0273-0979-07-01191-3.pdf
BARCODES
Interpretación biológica en el espacio biológico
Interpretación biológica en el espacio biológico
http://cran.r-project.org/web/packages/phom/vignettes/phom.pdf
Barcodes: The persistent topology of data
http://www.math.upenn.edu/~ghrist/preprints/barcodes.pdf
Bibliografía