Академический Документы
Профессиональный Документы
Культура Документы
Contatos
E-mail/gtalk: alexandrecordel@gmail.com
greinaldo@fbv.edu.br
Site: http://www.alexandrecordel.com.br/fbv
Histria
Diferentes valores de K
K=1
K=2
K=3
Algumas questes
Vantagens e Desvantagens
Performance
Sensvel a rudos
Exemplo
Compra-computador
ID
IDADE
RENDA
ESTUDANTE
CREDITO
CLASSE
30
Alta
No
Bom
No
30
Alta
Sim
Bom
No
31...40
Alta
No
Bom
Sim
> 40
Mdia
No
Bom
Sim
> 40
Baixa
Sim
Bom
Sim
> 40
Baixa
Sim
Excelente
No
31...40
Baixa
Sim
Excelente
Sim
30
Mdia
No
Bom
No
30
Baixa
Sim
Bom
Sim
10
> 40
Mdia
Sim
Bom
Sim
11
30
Mdia
Sim
Excelente
Sim
12
31...40
Mdia
No
Excelente
Sim
13
31...40
Alta
Sim
Bom
Sim
14
> 40
Mdia
No
Excelente
No
X = ( 30, Mdia,Sim,Bom)
Exemplo
Distncia
VALOR
d(X,1)
1,41
d(X,2)
d(X,3)
1,73
d(X,4)
1,41
d(X,5)
1,41
d(X,6)
1,73
d(X,7)
1,73
d(X,8)
d(X,9)
d(X,10)
d(X,11)
d(X,12)
1,73
d(X,13)
1,41
d(X,14)
1,73
Exemplo
K=5
X1 = ( 30
X2 = ( 30
Mdia
No Bom)
Classe = No
X3 = ( 30
Baixa
Sim Bom)
Classe = Sim
X4 = ( > 40
Mdia
Sim Bom)
Classe = Sim
X5 = ( 30
Mdia
Sim Exc. )
Clase = Sim
Classe = No
Acurcia de
Classificadores
Como medir ?
Holdout
Mtodo Holdout
Considera-se um banco de dados de amostras
Divide-se em 2 partes : D1 e D2
D1 2 vezes maior do que D2
Acurcia= nmero de tuplas de D2 bem classificadas
dividido pelo total de tuplas de D2
Subamostragem Randmica
Variao do mtodo Holdout
Mtodo Holdout repetido k vezes
Acurcia geral = mdia das acurcias em cada
rodada
Cross-Validation
Variantes do Cross-validation
Leave-one-out
Caso especial de k-fold cross validation
Cada Di tem um nico elemento
Em cada iterao somente 1 tupla utilizada para
teste.
Cross-validation estratificada
As folhas D1, ... , Dk so tais que a distribuio
das classes em cada folha aproximadamente igual
distribuio nos dados iniciais.
Ex: se em D a proporo de tuplas das classes C1 e
C2 de 2 para 1 ento esta proporo mantida
em cada folha Di.
Bootstrap
.632 Bootstrap
.632 Bootstrap
Referncias
Machine Learning. Tom Mitchell. McGraw-Hill.1997.