Вы находитесь на странице: 1из 4

Relatório de estudos do WEKA

Gabriel Moraes de Oliveira


O presente relatório visa apresentar os primeiros testes realizados com a bibliotéca
WEKA. Em testes exploratórios iniciais da biblioteca Weka, teve-se como objetivo
processar uma base de dados sobre três tipos de flores em diferentes algoritmos. Esta
base de dados se encontra em um arquivo com a terminação ARFF, cujo qual é a
terminação padrão dos datasets do WEKA.
Os testes foram feitos de dois modos, através da API gráfica do WEKA e através da
implementação de códigos em JAVA importando a bibliotéca.
Na API gráfica, deparou-se com interface inicial.

Figura 1 – Interface inicial do WEKA

Das opções da API gráfica do WEKA somente fora explorado e utilizado a opção
Workbench. Nesta opção, pode-se trabalhar com os algoritmos.

Figura 2 – Interface do Workbench

Nesta interface, tem-se como primeira opção e já selecionado o “preprocess”, é neste que
será feito o pré-processamento dos dados que se encontram na base de dados ARFF. Em
um dos botões desta interface há a opção “open file”, esta irá abrir outra jframe onde
poderá ser carregado qualquer arquivo do formato ARFF, para o exemplo desta
experimentação, usou-se o arquivo iris.arff que vem junto ao WEKA, este arquivo se
encontra no diretório /weka-3.8/data/ junto a outras base de dados.
Pré-processando o arquivo podemos visualizar alterações na interface do WEKA.

Figura 3 – Interface do workbench com dados pré-processados

Na interface do workbench com os dados pré-processados, pode-se identificar algumas


alterações com informações sobre estes dados, sendo as que mais se destacaram a lista
de atributos que são as características que devem ser aprendidas, os gráficos que até o
presente momento não foram compreendidos em sua plenitude, porém suspeita-se que
indicam alguma relação entre o atributo selecionado sobre outro atributo e por fim a zona
acima dos gráficos que se referem a propriedades do atributo selecionado.
Após esta etapa de pré-processamento, encaminha-se para a seleção dos algoritmos
para realizar os testes.

Figura 4 – Interface dos algoritmos


Para esta experimentação fora selecionado método de classificação, o algoritmo baseado
em árvores J47 e o algoritmo baseado em funções Multilayerperceptron. Antes deste teste
fora realizada uma pesquisa bibliográfica em artigos sobre os algoritmos do WEKA, desta
forma, para este exemplo, usou-se um percentual de treino de 70% dos dados da base
(DAMASCENO, 2010).
O primeiro algoritmo testado fora o J47, este algoritmo foi usado para classificar as
informações que ele posuia em sua base de dados, onde obteve um percentual de
95.55% de classificações corretas e 4.44% de classificações incorretas.

Figura 5 – Dados processados pelo J47

O segundo algoritmo usado fora o Multilayerperceptron, cujo qual obteve um percentual


de 97.77% de classificações corretas e 2.22% de classificações incorretas.

Figura 6 – Dados processados pelo Multilayerperceptron

Após os dois testes feitos na API gráfica, fora feito uma implementação em JAVA usando
o algoritmo Multilayerperceptron.
Figura 7 – Uso do algoritmo através de implementação JAVA

O código inicia-se com o instanciamento do datasource que aponta para onde está o
arquivo com a base de dados. Após instanciar este, instancia-se o algoritmo e usa-se a
função buildClassifier passando por parâmetro a base de dados para que se faça a
ligação entre o algoritmo e a base de dados. Como teste se criou um novo objeto e nele
foi setado valores dentro das propriedades permitidas dos atributos e por fim, mostrou-se
na tela a probabilidade de cada opção de flor.
Foram 150 exemplos processados e o resultado obtido não está de acordo com a
realidade. Os dados inseridos eram exatamente iguais um exemplo da base de dados,
onde o resultado deveria ser iris-setosa, porém apareceu maior probabilidade de ser iris-
virginica.

Figura 8 – Resultados do algoritmo multilayerperceptron

Вам также может понравиться