Академический Документы
Профессиональный Документы
Культура Документы
Sumrio 1. Introduo ..................................................................................................................... 3 2. 3. 4. 5. 6. 7. Induo de rvores de Deciso. .................................................................................. 3 Tipos de arvores de deciso ........................................................................................ 4 Algoritmo do tipo poda. ............................................................................................... 6 Algoritmo ID3 ................................................................................................................ 7 Concluso........................................................................................................................7 Referncias......................................................................................................................7
1. INTRODUO
Devido ao grande nmero de informao disponvel hoje no mundo, as empresas necessitam de ferramentas que as auxiliem para tratar este mundo de dados de um modo que o mesmo possa trazer uma informao alinhada e estruturada ao negocio da empresa a fim de gerar benefcios de renda e organizao. Como as empresas conseguiro extrair os dados necessrios e mais importantes para o seu negcio? Existe uma ferramenta muito utilizada para tratamentos de dados, o BI (Bussines Inteligence) que opera essencialmente em minerao de dados e trata a demanda de informaes de um modo que seja direto e objetivo para os interesses da organizao. No presente trabalho ser apresentada uma tcnica de minerao de dados conhecida como Induo de Arvores de deciso, utilizada em estatsticas, minerao de dados e em outras ocasies conforme a necessidade do cliente.
Figura 2.1 -rvore de Deciso, (MAXWELL, 2012). Deste modelo podem-se extrair trs regras de diagnstico: se A = V1 implica diagnostico D1; se A=V2 E B=V3 Implica D2; e se A=V2 e B=V4 Implica Diagnostico D1. 3
A filosofia de funcionamento de qualquer algoritmo baseado em rvores de deciso bastante simples. Na verdade, embora contendo por vezes diferenas importantes na forma de efetuar este ou aquele passo, qualquer algoritmo desta categoria se baseia na estratgia de dividir para conquistar (MANUEL, 1994).
De acordo comManuel 1994, a filosofia de uma arvorede deciso constitui-se em subdividir o problema principal em outros menores ate que se chegue a uma soluo para cada um dos problemas mais simples, chegando a um nvel quase indivisvel do problema. Sendo, um dos problemas a grande possibilidade existente para um mesmo problema.
De acordo com o documento digital disponvel online em Nstec 2012, Na Fig.3.1, mostrado um exemplo ilustrativo de uma rvore de deciso para o diagnstico de um paciente. Cada elipse e um teste em um atributo para um dado conjunto de dados de pacientes. Cada retngulo representa uma classe, ou seja, o diagnstico. Para diagnosticar (classificar) um paciente, basta comear pela raiz, seguindo cada teste at que umafolha seja alcanada.
Uma arvore de deciso simples para o diagnstico de um paciente. E fcil perceber que a arvore pode ser representada como um conjunto de regras. Cada regra tem seu incio na raiz da rvore e caminha at uma de suas folhas. Por exemplo, a rvore mostrada na Fig.3.1, de acordo com o documento digital disponvel em professor 2012,pode ser lida como: if paciente se sente bem = sim then classe = saudvel else if paciente tem dor = nothen if temperatura do paciente 37 then classe = saudvel else {temperatura do paciente > 37} classe = doente endif else {paciente tem dor = sim} Classe = doente endif endif
Como as regras que representam uma rvore de deciso so disjuntas, isto , apenas uma nica regra dispara quando um novo exemplo classicado, uma forma alternativa de representar tais regras consiste em escrever uma regra separadamente para cada n folha, iniciando pelaraizconsequentemente, nenhum else realmente necessrio: 5
if paciente se sente bem = sim then classe = saudvel end if if paciente se sente bem = noand paciente tem dor = no and temperatura do paciente 37 then classe = saudvel end if if paciente se sente bem = noand paciente tem dor = no and temperatura do paciente > 37 then classe = doente endif if paciente se sente bem = noand paciente tem dor = sim then classe = doente end if
5. ALGORITMO ID3
A famlia ID3 de algoritmos de deciso de induo de rvores usa a teoria da informao para decidir qual atributo partilhado por um conjunto de instncias para dividir os dados a seguir. Os atributos so escolhidos repetidamente desta forma at uma rvore de deciso completa que classifica cada entrada obtido. Se os dados so ruidosos, alguns dos exemplos originais podem ser classificados erroneamente. Pode ser possvel que podar a rvore de deciso, a fim de reduzir os erros de classificao, na presena de dados ruidosos. A velocidade deste algoritmo de aprendizagem razoavelmente elevada, como a velocidade do sistema de 6
classificao
resultante
da
rvore
de
deciso.
Capacidade
Segundo Wilson 2012, o algoritmo ID3 usa a teoria da informao para dividir os dados. O que torna esse algoritmo de aprendizagem eficiente em velocidade de execuo e de boa generalizao.
6. CONCLUSO
Conclui-se que a tcnica de Induo de rvores de Deciso pode se utilizada com afinco de aumentar o mximo possvels possibilidades de decises corretas de acordo com as variveis do problema ou do da anlise que est sendo feita. Pode ser utilizado em uma grande base de dados, porm a construo das rvores pode ser feita atravs de algoritmos indutivos ou pode ser elaboradas lgicas conforme o problema apresentado, com a possibilidade de at adiantar possveis problemas e evit-los at como prever novas investidas que auxiliaro a organizao em alguma tomada de deciso.
7. REFERENCIAS
CSE.School of computer Science and engineering.Disponvel em:
<http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html>. Acesso em: 03 Maro 2012. GAMA, Joo. rvores de deciso. Disponvel em:<http://www.ccog.up.pt/~jgama/Aulas_ECD/arv.pdf>. Acesso em: 03 Maro 2012.
MANUEL,
Jos.
rvore
de
deciso.
Disponvel
MARIA,
Carolina.
Sistemas
inteligentes.
Disponvel
MAXWELL.rvore
de
deciso.
Disponvel
em:<http://www.maxwell.lambda.ele.puc7
NSTEC. Inteligncia computacional. Disponvel em:<http://nstec.com.br/IA/aulas/aula5.pdf>. Acesso em: 05 Maro 2012. PROFESSOR. Arvores de Deciso. Disponvel
WIKIPEDIA.Decisiontreelearning.
Disponvel
WILSON, Bill. Introduction of decision trees.Disponvelem:<http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html >. Acesso em: 03 Maro 2012.