Вы находитесь на странице: 1из 8

Induo de rvores de Deciso

Belo Horizonte 2012

Sumrio 1. Introduo ..................................................................................................................... 3 2. 3. 4. 5. 6. 7. Induo de rvores de Deciso. .................................................................................. 3 Tipos de arvores de deciso ........................................................................................ 4 Algoritmo do tipo poda. ............................................................................................... 6 Algoritmo ID3 ................................................................................................................ 7 Concluso........................................................................................................................7 Referncias......................................................................................................................7

1. INTRODUO
Devido ao grande nmero de informao disponvel hoje no mundo, as empresas necessitam de ferramentas que as auxiliem para tratar este mundo de dados de um modo que o mesmo possa trazer uma informao alinhada e estruturada ao negocio da empresa a fim de gerar benefcios de renda e organizao. Como as empresas conseguiro extrair os dados necessrios e mais importantes para o seu negcio? Existe uma ferramenta muito utilizada para tratamentos de dados, o BI (Bussines Inteligence) que opera essencialmente em minerao de dados e trata a demanda de informaes de um modo que seja direto e objetivo para os interesses da organizao. No presente trabalho ser apresentada uma tcnica de minerao de dados conhecida como Induo de Arvores de deciso, utilizada em estatsticas, minerao de dados e em outras ocasies conforme a necessidade do cliente.

2. INDUO DE RVORES DE DECISO.


Em conformidade com o documento digital disponvel em maxwell2012, Uma rvore de deciso uma rvore em que cada n ramo (Crculo) representa uma escolha entre vrias alternativas, e cada n folha (Retngulo) representa uma classificao ou deciso.

Figura 2.1 -rvore de Deciso, (MAXWELL, 2012). Deste modelo podem-se extrair trs regras de diagnstico: se A = V1 implica diagnostico D1; se A=V2 E B=V3 Implica D2; e se A=V2 e B=V4 Implica Diagnostico D1. 3

A filosofia de funcionamento de qualquer algoritmo baseado em rvores de deciso bastante simples. Na verdade, embora contendo por vezes diferenas importantes na forma de efetuar este ou aquele passo, qualquer algoritmo desta categoria se baseia na estratgia de dividir para conquistar (MANUEL, 1994).

De acordo comManuel 1994, a filosofia de uma arvorede deciso constitui-se em subdividir o problema principal em outros menores ate que se chegue a uma soluo para cada um dos problemas mais simples, chegando a um nvel quase indivisvel do problema. Sendo, um dos problemas a grande possibilidade existente para um mesmo problema.

3. TIPOS DE ARVORES DE DECISO


De acordo com a Wikipdia, 2012,existem dois tipos de rvores de deciso mais utilizados na minerao de dados atualmente: rvore de classificao:anlise quando o resultado previsto a classe qual o dado pertence. rvore de regresso anlise: quando o resultado previsto pode ser considerado um nmero real (por exemplo, o preo de uma casa, ou o comprimento de um paciente de permanncia num hospital).

De acordo com o documento digital disponvel online em Nstec 2012, Na Fig.3.1, mostrado um exemplo ilustrativo de uma rvore de deciso para o diagnstico de um paciente. Cada elipse e um teste em um atributo para um dado conjunto de dados de pacientes. Cada retngulo representa uma classe, ou seja, o diagnstico. Para diagnosticar (classificar) um paciente, basta comear pela raiz, seguindo cada teste at que umafolha seja alcanada.

Figura 3.1 Exemplo dervore de Deciso, (NSTEC, 2012).

Uma arvore de deciso simples para o diagnstico de um paciente. E fcil perceber que a arvore pode ser representada como um conjunto de regras. Cada regra tem seu incio na raiz da rvore e caminha at uma de suas folhas. Por exemplo, a rvore mostrada na Fig.3.1, de acordo com o documento digital disponvel em professor 2012,pode ser lida como: if paciente se sente bem = sim then classe = saudvel else if paciente tem dor = nothen if temperatura do paciente 37 then classe = saudvel else {temperatura do paciente > 37} classe = doente endif else {paciente tem dor = sim} Classe = doente endif endif

Como as regras que representam uma rvore de deciso so disjuntas, isto , apenas uma nica regra dispara quando um novo exemplo classicado, uma forma alternativa de representar tais regras consiste em escrever uma regra separadamente para cada n folha, iniciando pelaraizconsequentemente, nenhum else realmente necessrio: 5

if paciente se sente bem = sim then classe = saudvel end if if paciente se sente bem = noand paciente tem dor = no and temperatura do paciente 37 then classe = saudvel end if if paciente se sente bem = noand paciente tem dor = no and temperatura do paciente > 37 then classe = doente endif if paciente se sente bem = noand paciente tem dor = sim then classe = doente end if

4. ALGORITMO DO TIPO PODA


Em conformidade com Gama 2012, este algoritmo tem por funo percorrer toda a rvore em profundidade, porem em cada n de deciso o mesmo calcula uma estimativa pessimista do erro do n, apso algoritmo soma as estimativas dos erros dos ns descendentes e caso a estimativa do erro no n menor ou igual a soma das estimavas dos ns descendentes o n transformado em folha.

5. ALGORITMO ID3
A famlia ID3 de algoritmos de deciso de induo de rvores usa a teoria da informao para decidir qual atributo partilhado por um conjunto de instncias para dividir os dados a seguir. Os atributos so escolhidos repetidamente desta forma at uma rvore de deciso completa que classifica cada entrada obtido. Se os dados so ruidosos, alguns dos exemplos originais podem ser classificados erroneamente. Pode ser possvel que podar a rvore de deciso, a fim de reduzir os erros de classificao, na presena de dados ruidosos. A velocidade deste algoritmo de aprendizagem razoavelmente elevada, como a velocidade do sistema de 6

classificao

resultante

da

rvore

de

deciso.

Capacidade

Generalizao pode ser razovel tambm(WILSON, 2012).

Segundo Wilson 2012, o algoritmo ID3 usa a teoria da informao para dividir os dados. O que torna esse algoritmo de aprendizagem eficiente em velocidade de execuo e de boa generalizao.

6. CONCLUSO

Conclui-se que a tcnica de Induo de rvores de Deciso pode se utilizada com afinco de aumentar o mximo possvels possibilidades de decises corretas de acordo com as variveis do problema ou do da anlise que est sendo feita. Pode ser utilizado em uma grande base de dados, porm a construo das rvores pode ser feita atravs de algoritmos indutivos ou pode ser elaboradas lgicas conforme o problema apresentado, com a possibilidade de at adiantar possveis problemas e evit-los at como prever novas investidas que auxiliaro a organizao em alguma tomada de deciso.

7. REFERENCIAS
CSE.School of computer Science and engineering.Disponvel em:

<http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html>. Acesso em: 03 Maro 2012. GAMA, Joo. rvores de deciso. Disponvel em:<http://www.ccog.up.pt/~jgama/Aulas_ECD/arv.pdf>. Acesso em: 03 Maro 2012.

MANUEL,

Jos.

rvore

de

deciso.

Disponvel

em:<http://www.uninova.pt/~jmf/Documentos%20pdf/Tese%20Mestrado/Tese%20Mestrado. pdf>. Acesso em: 04 Maro 2012.

MARIA,

Carolina.

Sistemas

inteligentes.

Disponvel

em:<http://dcm.ffclrp.usp.br/~augusto/publications/2003-sistemas-inteligentes-cap5.pdf>. Acesso em: 05 Maro 2012.

MAXWELL.rvore

de

deciso.

Disponvel

em:<http://www.maxwell.lambda.ele.puc7

rio.br/3710/3710_4.PDF>. Acesso em: 05 Maro 2012.

NSTEC. Inteligncia computacional. Disponvel em:<http://nstec.com.br/IA/aulas/aula5.pdf>. Acesso em: 05 Maro 2012. PROFESSOR. Arvores de Deciso. Disponvel

em:<http://professor.ufabc.edu.br/~ronaldo.prati/MachineLearning/AM-I-ArvoresDecisao.pdf>. Acesso em: 05 Maro 2012.

WIKIPEDIA.Decisiontreelearning.

Disponvel

em:<http://en.wikipedia.org/wiki/Decision_tree_learning - 2012>. Acesso em: 02 Maro 2012.

WILSON, Bill. Introduction of decision trees.Disponvelem:<http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html >. Acesso em: 03 Maro 2012.

Вам также может понравиться