Вы находитесь на странице: 1из 8

Classificador de Estágio de

Câncer de Próstata
Jefferson Vinícius da Fonseca e Silva
Programa de Pós-Graduação em Modelagem Matemática Computacional
Centro Federal de Educação Tecnológica – CEFET -MG
Av. Amazonas, 7675, Nova Gameleira, Belo Horizonte, Brasil
jeffersonvinicius@hotmail.com
Motivação
• Descrição do problema
Tendo com referência um sistema fuzzy para predizer a evolução do câncer de próstata
proposto por Castanho-2005, foram testados 3 algorimos de ML(Regressão Logística,Suport
Vector Machine e Decision Tree) para classificar se o câncer está no Estagio I da doença ou
não.

• Importância do problema
O câncer de próstata é, atualmente o segundo tipo com a maior incidência entre a
população masculina no Brasil. A classificação de qual estágio a doença com dados clínicos
pode auxiliar o médico a indicar um tratamento mais adequado de uma forma mais rápida,
uma vez que quanto mais rápido se trata maior será as chances de cura. Castanho-2005

• Pq o problema é difícil
A maioria do conhecimento médico em sintomas, doenças, terapias e na relação entre eles
é intrinsecamente inserta. As medidas são imprecisas, as categorias linguísticas são
caracterizadas por limites vagos ou imprecisos a co-ocorrência de sintomas e doenças é
estatisticamente incerta e dados médicos são frequentemente incompletos. Castanho-2005
Modelo Fuzzy de Referência
Contribuição
• Qual o objetivo da sua solução?
Complementar o modelo fuzzy de Castanho-2005,pois, por se tratar de um sistema
especialista este não passou por um treinamento de dados reais sendo baseado
apenas no conhecimento dos especialistas.

• Detalhe a sua solução


Foram utilizadas as mesmas entradas e saída proposta no modelo fuzzy, limitando a
saída em uma resposta binária.
Metodologia
• Como o problema foi modelado
É um classificador binário, foi utilizado a biblioteca scikit-learning do Phyton.
• Quais features foram usadas?
Entradas : Estadiamento Clínico, Escore de Gleason e Nível de PSA no diagnóstico.
Como saída: Estágio da Doença.
• Quais algoritmos foram usados?
Regressão Logística, SVM e Decision Tree
• Quais as métricas de avaliação?
Acurácia, Precisão, Score ROC e Matriz Confusão
• Quais datasets foram utilizados?
Para o experimento foi selecionada uma base de dados de um estudo disponível no GitHub que versou
sobre a predição de sobrevivência após 7 anos de diagnóstico positivo. Esta base possui 15.385
amostras contando com vários dados relativos ao câncer de próstata, dos quais foram utilizados o
gleason-score(Escore de Gleason), t-score (Estado Clínico) e psa-diagnosis(Nível de PSA) como dados de
entrada e stage(Estágio da Doença) como saída, por serem as mesas variáveis utilizadas no modelo fuzzy
de referência
Resultados
Algoritmo Acurácia Precisão Score ROC
Regressão
0,9752 0,8431 0,9790
Logística
SVM 0,9971 0,9524 0,9996
Decision Tree 0,9942 0,9485 0,9796
Confusion Matrix
Regressão Logística SVM
p n Total p n Total
Valor p' 2628 8 2636 Valor p' 2631 5 2636
Atual n' 60 43 103 Atual n' 3 100 103
Total 2688 51 2739 Total 2634 105 2739
Decision Tree
p n Total
Valor p' 2631 5 2636
Atual n' 11 92 103
Total 2642 97 2739
Conclusão
• O que vc aprendeu neste trabalho?
O conhecimento aprofundado do problema a ser resolvido e o funcionamento dos
algoritmos é fundamental para a uma melhor resposta, pois cada caso possui suas
particularidades e peculiaridades.
Uma base de dados forte e concisa tende a melhorar o resultado encontrado.

• Se alguém fosse continuar de onde vc parou,


qual sua sugestão de continuação do
trabalho?
Encontrar um classificador que classifique os cinco estágios da doênça.
Referências
• CASTANHO, M. J. P. Construção e avaliação de um modelo matemático
para predizer a evolução 106 do câncer de próstata e descrever seu
crescimento utilizando a teoria dos conjuntos fuzzy, Tese 107 (Doutorado
em Engenharia Elétrica). Universidade Estadual de Campinas UNICAMP,
2005.
• Partin AW, Kattan MW, Subong EN, et al. Combination of prostate-specific
antigen, clinical stage, 111 and Gleason score to predict pathological stage
of localized prostate cancer. A multi-institutional 112 update. JAMA.
1997;277:1445–1451.