Академический Документы
Профессиональный Документы
Культура Документы
Olivier Bousquet
Centre de Mathematiques Appliquees
Ecole Polytechnique, Palaiseau
Probleme dapprentissage
Formalisation
Reconnaissance de formes
Categorisation de textes
Classification de-mails
Classification de pages web
Diagnostic medical
Trouver une frontiere de decision qui separe lespace en deux regions (pas
forcement connexes).
Probleme doptimisation
Critere: erreur constatee sur les donnees (Erreur empirique)
Espace de recherche: ensemble parametre de fonctions par exemple
Probleme mal pose (solution non unique)
Garanties ?
O. Bousquet: Introduction aux SVM Orsay, 15 Novembre 2001
10
Illustration
Sur et sous-apprentissage
Principe general
Construction dun classifieur a valeurs reelles
Decoupage du probleme en deux sous-problemes
1. Transformation non-lineaire des entrees
2. Choix dune separation lineaire optimale
Hyperplan optimal
Optimal
Valide
Definition geometrique
Proprietes
Modele lineaire
f (x) = w x + b
Definition de lhyperplan (frontiere de decision)
wx+b=0
La distance dun point au plan est donnee par
|w x + b|
d(x) =
kwk
Maximiser la marge revient a minimiser kwk sous contraintes
Probleme primal
i, yi(w.xi + b) 1
Probleme dual
Proprietes
n
X
w = iyixi
i=1
Seuls les i correspondant aux points les plus proches sont non-nuls. On parle
de vecteurs de support.
Fonction de decision
Xn
f (x) = iyixi x + b
i=1
Probleme dual
Espace intermediaire
Au lieu de chercher un hyperplan dan lespace des entrees, on passe dabord dans
un espace de representation intermediaire (feature space) de grande dimension.
: Rd F
x 7 (x)
On doit donc resoudre
Pn 1
P
max i=1 i 2 i,j ij yiyj (xi) (xj )
i, 0 i C
Pn
i=1 i yi = 0
et la solution a la forme
n
X
f (x) = iyi(xi) (x) + b
i=1
Proprietes
Exemple
Soit x = (x1, x2) et (x) = (x21, 2x1x2, x22). Dans lespace intermediaire, le
produit scalaire donne
2 2
(x) (x0) = x21x01 + 2x1x2x01x02 + x22x02
= (x1x01 + x2x02)2
= (x x0)2
On peut donc calculer (x) (x0) sans calculer .
Exemple
Conditions de Mercer
Une fonction k(., .) symetrique est un noyau si pour tous les xi possibles,
(k(xi, xj ))i,j est une matrice definie positive.
Dans ce cas, il existe un espace F et une fonction tels que
k(x, x0) = (x) (x0)
Difficile a verifier
Ne donne pas dindication pour la construction de noyaux
Ne permet pas de savoir comment est
En pratique, on combine des noyaux simples pour en obtenir de plus com-
plexes.
Exemples de noyaux
Lineaire
k(x, x0) = x x0
Polynomial
k(x, x0) = (x x0)d ou (c + x x0)d
Gaussien
0 2 /
k(x, x0) = ekxx k
Laplacien
0
k(x, x0) = ekxx k1/
Vecteurs de support
Exemples
Si les donnees sont sous forme vectorielle, on peut utiliser un noyau classique.
On peut aussi contruire un noyau specifique qui travaille plus directement sur
la representation initiale (structure).
Images 2D: choix dune resolution et dune discretisation des couleurs
vecteur des valeurs des pixels
coefficients dune transformee en ondelettes
histogramme des couleurs
Textes: choix dun dictionnaire (suppression des mots simples)
Sac de mots: vecteur des occurences
Autres attributs (liens, position des mots...)
Exemples
Sequences dADN
Fenetres de taille fixe (sous-sequence) et representation binaire (un bit par
valeur possible)
... A T A G C A ...
1 0 1 0 0 1
0 1 0 0 0 0 (1,0,0,0,0,1,0,0,1,0,0,0,0,0,1,0,0,0,0,1,1,0,0,0)
0 0 0 1 0 0
0 0 0 0 1 0
Coefficients dun modele probabiliste generateur
Complexite
Methodes de decomposition
Elements de reponse
Regularisation
Noyaux
Generalisation
Marge - Parcimonie
Page du seminaire/GT:
http://www.math.u-psud.fr/~blanchard/gtsvm/index.html
References bibliographiques
Un lien utile:
http://www.kernel-machines.org
Programmes, articles en ligne, tutoriels...