EFC1 IA353 1s2016

Prof. Fernando J.
Von Zuben
DCA/FEEC/Unicamp
IA353 Exerccios de Fixao de Conceitos

EFC 1 1s2016
Questo 1) (1,0 pontos) Data de entrega: 30/03/2016
Apresente todos os passos at a obteno das derivadas parciais da funo J() em
relao aos pesos v ji e wkj , com i, j e k quaisquer, na rede neural MLP apresentada
abaixo, a qual tem mltiplas sadas, num total de r sadas. O vetor contm todos os
pesos sinpticos da rede neural, ordenados de forma arbitrria, mas fixa.
n

m
1 N r
1 N r
2
J slk slk slk wkj f v ji xli wk 0
2 l 1 k 1
2 l 1 k 1
j 1
i 0
Obter
J
J
, com j=1,,n e i=0,,m, e obter
, com k=1,,r e j=0,,n.
wkj
v ji
Nota: Est sendo considerado que xl0 = 1, l=1,...,N.
v10
v11
+
yl1
1
1
xl1
v1m
w11
v20
w12
^s
l1
^s
lr
yl2
v21
+
w1n
v2m
xlm
w10
wr0
wr1
wr2
vn0
yln
vn1
+
wrn
vnm

Aplicao de redes neurais MLP a um problema de classificao de padres
multirtulo denominado [Emotions], fornecido pelo professor e com dados extrados
de [http://mulan.sourceforge.net/datasets-mlc.html]. (1) Explicar o que um problema
de classificao de padres multirtulo (multilabel classification) e apontar quais so
as principais abordagens da literatura. (2) Descrever as principais caractersticas do
conjunto de dados [Emotions]. (3) Explicar os critrios de desempenho Hamming loss,
Accuracy per label, Precision, Recall, F-measure, F1-example, F1-macro e F1-micro.
Prof. Fernando J. Von Zuben

DCA/FEEC/Unicamp
Para os casos especficos de Precision e Recall e supondo um problema de

classificao binria, use a figura a seguir para explicar graficamente esses critrios
de desempenho. (4) Rodar o programa [calc-corr.m], fornecido pelo professor, para
calcular a mdia do valor absoluto da correlao entre cada uma das 72 entradas e as 6
sadas desejadas. Reportar e comentar os resultados obtidos. Comentrio 1: Nos dados
fornecidos pelo professor, as 25 entradas com menor correlao mdia foram
eliminadas dos conjuntos de treinamento e validao a serem utilizados. Comentrio
2: O toolbox fornecido pelo professor separa o conjunto de dados em Treinamento e
Validao e estabelece o critrio de parada com base no erro de classificao
(Hamming loss) na validao. (5) Usar algum critrio para definir um valor adequado
para o nmero n de neurnios na camada intermediria. (6) Comparar o desempenho
de um nico classificador com outras propostas da literatura (usar ao menos Hamming
loss e Accuracy per label) e com o desempenho dos 6 classificadores independentes
(usar ao menos Accuracy per label) (o programa [analysis.m] do toolbox fornecido
pelo professor fornece alguns ndices).
Material sugerido para consulta:

LUACES, O.; DEZ, J.; BARRANQUERO, J.; DEL COZ, J.J.; BAHAMONDE, A. Binary
relevance efficacy for multilabel classification, Progress in Artificial
Intelligence, vol. 1, no. 4, pp. 303-313, 2012. (Comentrio: Contm conceitos
pertinentes s atividades da Questo 2)
MADJAROV, G.; KOCEV, D.; GJORGJEVIKJ, D.; DZEROSKI, S. An extensive
experimental comparison of methods for multi-label learning, Pattern
Recognition, vol. 45, no. 9, pp. 3084-3104, 2012. (Comentrio: Leitura
introdutria aos principais mtodos)
READ, J.; PFAHRINGER, B.; HOLMES, G.; FRANK, E. Classifier chains for multi-label
classification, Machine learning, vol. 85, no. 3, pp. 333-359, 2011.
(Comentrio: Leitura mais avanada)
TROHIDIS, K.; TSOUMAKAS, G.; KALLIRIS, G.; VLAHAVAS, I. Multi-label classification
of music into emotions, Proceedings of the International Society for Music
Information Retrieval Conference (ISMIR2008). (Comentrio: Contm
resultados pertinentes s atividades da Questo 2)
WANG, S.; WANG, J.; WANG, Z.; JI, Q. Enhancing multi-label classification by
modeling dependencies among labels, Pattern Recognition, vol. 47, no. 10, pp.
3405-3413, 2014. (Comentrio: Leitura mais avanada)
Observao 1: Os dados de treinamento e validao para a Questo 2 esto sendo
fornecidos com e sem pr-processamento. Com pr-processamento, todas as entradas
excursionam no intervalo [1,+1]. Sem pr-processamento, as entradas excursionam
em
intervalos
arbitrrios,
conforme
o
original
encontrado
em
[http://mulan.sourceforge.net/datasets-mlc.html].
2
Prof. Fernando J. Von Zuben

DCA/FEEC/Unicamp
Observao 2: Os programas para treinamento de redes MLP so fornecidos

juntamente com este roteiro. Eles requerem o ambiente Matlab para a sua execuo.
Comparao entre preditores lineares e no-lineares para a srie temporal de casos
confirmados de dengue, a cada semana, na cidade de So Paulo, no perodo de 2000 a
2014, sendo que esses dados foram disponibilizados pelo SUS (Sistema nico de
Sade). O preditor linear deve ser um modelo auto-regressivo e o preditor no-linear
deve ser uma rede neural MLP com 10 neurnios na camada intermediria. Use o
programa [calc_cor.m] para obter a correlao entre o valor a ser predito e 20 valores
passados da srie temporal e constate que utilizar os 5 valores consecutivos mais
recentes uma escolha aceitvel. Divida o conjunto de dados em 10 pastas e
considere 9 delas para treinamento e a que sobrou para validao. Faa isso 10 vezes,
de modo que todas as pastas sejam empregadas ao menos uma vez para validao.
Apresente o desempenho mdio obtido pelas 10 MLPs treinadas. Em seguida,
componha as 10 MLPs num ensemble. Trabalhe com (1) a mdia, (2) OLS (ordinary
least square) e (3) LASSO (http://www.di.ens.fr/~mschmidt/Software/lasso.html)
para combinar as sadas das 10 redes neurais. Apresente os resultados comparativos.
Faa o mesmo para uma rede neural extreme learning machine (ELM) e para o
preditor linear auto-regressivo, sendo que para esses dois casos empregue ridge
regression para obter cada preditor, obtendo o parmetro de regularizao no conjunto
de valores candidatos {0,224,223,...,2+24,2+25}.
Tabela 1 Reorganizao dos valores da srie temporal para produzir os dados de entrada-sada.
sk p
s k p 1
sk 1
xk
s1
s2
sp
s p 1
s2
s3
s p 1
s p2
sN p
s N p 1
sN 1
sN
ap
a p 1
a1
Parte desses dados disponveis para treinamento sero separados para validao e
teste.
Formulao para o preditor linear: xk b1sk 1 b2 sk 2 ... bp sk p bp 1 .
Coeficientes do preditor linear: b b1 b2 b p b p 1 T .

Problema regularizado a ser resolvido para o preditor linear:
2
2
b arg minp1 Ab y c b
onde A a1 a p
1 . A soluo assume a forma:
b AT A cI AT y .

EFC1 IA353 1s2016

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

EFC1 IA353 1s2016

Загружено:

Авторское право:

Доступные форматы

Prof. Fernando J.

IA353 Exerccios de Fixao de Conceitos

Nota: Est sendo considerado que xl0 = 1, l=1,...,N.

Questo 2) (2,0 pontos) Data de entrega: 08/04/2016

Prof. Fernando J. Von Zuben

Para os casos especficos de Precision e Recall e supondo um problema de

Material sugerido para consulta:

Prof. Fernando J. Von Zuben

Observao 2: Os programas para treinamento de redes MLP so fornecidos

Coeficientes do preditor linear: b b1 b2 b p b p 1 T .

1 . A soluo assume a forma:

Вам также может понравиться