Вы находитесь на странице: 1из 1

Proposta de Otimizao do Algoritmo de Fora Bruta para a Identificao de Motifs Jhonny Marcos Acordi Mertz, Andr Gustavo Maletzke,

Huei Diana Lee1,2, Feng Chung Wu1,2


Laboratrio de Bioinformtica LABI, UNIOESTE, Foz do Iguau, PR 2 Servio de Coloproctologia, DMAD, FCM, UNICAMP, Campinas, SP

Objetivos
Realizar um apresentado em do algoritmo identificao de (ST). estudo complementar ao [1] e propor uma otimizao Fora Bruta (FB) para motifs em Sries Temporais

Resultados
No grfico da Figura 1 possvel observar a relao existente entre o tamanho da ST e o custo em minutos para a execuo do FB.

Mtodos/Procedimentos
A identificao de padres morfolgicos (motifs), mediante o FB requer grande esforo computacional, com complexidade quadrtica em relao ao tamanho da ST [2]. No entanto, esse mtodo amplamente utilizado, pois apresenta alta preciso, e consiste em procurar subsequncias de tamanho m em uma ST de tamanho n, para m << n. Para isso, cada subsequncia de tamanho m comparada com as subsequncias restantes da ST [1]. A similaridade entre subsequncias determinada pela distncia euclidiana. Para a avaliao do FB foram extradas subsries de 1000 at 6500 com incrementos de 500 observaes da ST de Eletroencefalograma (EEG). Aps, para cada subsrie foram inseridas, aleatoriamente, duas ocorrncias de uma subsequncia com 250 observaes representando um motif artificial. Para diminuir a casualidade, o processo de insero foi repetido dez vezes. Os experimentos foram realizados em um computador com CPU Intel Core 2 Duo 2.20 GHz, 4 GB de RAM, sistema operacional Windows XP Service Pack 3 e implementados na linguagem de programao R [3]. Com o intuito de melhorar o desempenho do FB prope-se a utilizao do conceito de diviso e conquista, segmentando a busca por motifs em subproblemas, os quais sero resolvidos em paralelo, usufruindo com maior completude dos recursos de hardware. Para dar suporte a essa proposta sero utilizados pacotes do R tais como multicore e doSMP [3].

Figura 1: Tempo mdio de execuo do FB.

Concluses
Embora o FB apresente elevado custo computacional, espera-se que a proposta de paralelismo permita reduzir o tempo de execuo, possibilitando sua utilizao em problemas reais. Como trabalhos futuros, sero desenvolvidos a proposta de paralelismo do FB e o mesmo ser aplicado a dados mdicos, especificamente a dados de manometria anorretal.

Referncias Bibliogrficas
[1] Mertz JMA, Maletzke AG, Lee HD, Wu FC. Estudo do Comportamento do Algoritmo de Fora Bruta na identificao de motifs. In XX EAIC Encontro Anual de Iniciao Cientfica, 2011. (Aceito para publicao). [2] Chiu B, Keogh E, Lonardi S. Probabilistic discovery of time series motifs. In 9th International Conference on Knowledge Discovery and Data Mining, p.493-498, 2003. [3] R Development Core Team. R: a language and environment for statistical computing. Disponvel em: www.r-project.org. Acessado em 31 ago 2011.

ST proveniente da base de dados UCR Time Series Classification/Clustering.

Вам также может понравиться