Вы находитесь на странице: 1из 9

A aprendizagem de mquina um sub-campo da inteligncia artificial dedicado ao desenvolvimento de algoritmos e tcnicas que permitam ao computador aprender, isto , que

e permitam ao computador aperfeioar seu desempenho em alguma tarefa. Algumas partes da aprendizagem de mquina esto intimamente ligadas minerao de dados e estatstica. Sua pesquisa foca nas propriedades dos mtodos estatsticos, assim como sua complexidade computacional. Sua aplicao prtica inclui o processamento de linguagem natural, motores de busca, diagnsticos mdicos, bioinformtica, reconhecimento de fala, reconhecimento de escrita, viso computacion al e locomoo de robs e sistemas de previso.discrinao de vozes patolgicas De uma forma geral, pode-se dividir as estratgias de aprendizado de mquina em aprendizado supervisionado e aprendizado no-supervisionado [14],[38]. No caso de aprendizado supervisionado os dados, tambm denominados de exemplos ou instncias, so rotulados em classes diretamente vinculadas ao problema estudado. Pode-se ento, ter uma noo concreta do desenvolvimento do classificador ou indutor da hiptese de predio baseada no desempenho alcanado nos dados disponveis para treinamento, ou seja, no chamado conjunto de treinamento. baseando-se em propriedades geomtricas dos dados. Estes agregamentos, denominados clusters, representam uma distribuio dos dados onde espera que se obtenham informaes relevantes para discriminar e categorizar os grupos detectados na amostra tratada. Atualmente, estratgias conhecidas como semi-supervisionadas vem sendo utilizadas, visando aproveitar propriedades relativas aos dois modelos de forma efetiva [2],[21].

Justificativa tcnica de aprendizado de mquina denominada classificador SVM (Support Vector Machines)-cita r tecnica supervisionada ou Mquinas de Vetores Suporte [9], em virtude de ser considerado bastante robusto e eficiente quando utilizada com a parametrizao tima, apresentando bons resultados em aplicaes consideradas complexas [22]. Alm disto, possui um desenvolvimento terico matemtico bem embasado. Outras ferramentas de aprendizado supervisionado e no-supervisionado sero tambm utilizadas sendo prontamente justificado o motivo de suas incluses como componentes dos sistemas de mltiplos classificadores apresentados. Especificamente, tais justificativas so relacionada s a caractersticas complementares ao classificador SVM apresentadas pelos demais classificadores individuais. citar que SVM tem sido recentemente usada para discriminao de vozes patolgicas....

Aprendizado de mquina uma rea da Inteligncia Artificial onde procura-se o desenvolvimento de sistemas que baseados em procedimentos automticos, tem como objetivo obter um ganho de desempenho na tarefa executada com a experincia

adquirida com a manipulao de dados relativos ao problema tratado [25].

Fundamentao terica As maquinas de vetor de suporte (SVM, do ingl^es support vector machine) s~ao uma classe de maquinas de aprendizagem proposta por Vladimir Vapnik (CORTES; VAPNIK, 1995) que se utiliza de aprendizagem supervisionada e pode ser utilizada tanto p ara a classi

cac~ao de padr~oes quanto para problemas de regress~ao linear. A sua derivac~ao e b aseada fortemente nos conceitos da teoria estatstica da aprendizagem (VAPNIK, 1998), tambe m conhecida como teoria VC (em homenagem a seus criadores Vapnik e Chervonenkis), que determina as propriedades necessarias para que uma maquina de aprendizagem seja ca paz de generalizar bem para dados desconhecidos. A ideia principal deste tipo de rede e construir um hiperplano como superfcie de decis~ao de tal forma que a margem de separac~ao entre os exemplos positivos e ne gativos seja maxima (HAYKIN, 2001), como ilustrado pela Figura 9, para o caso de um probl ema de classi

cac~ao. Estabelecida sobre a teoria do metodo de minimizac~ao estrutural de risco, a SVM se mostra especialmente resistente tambem ao problema de over-

tting, atingindo frequentemente um\alto desempenho de generalizac~ao na soluc~ao de probl emas de previs~ao em series temporais" (CAO, 2002) e, tambem, na classi

cac~ao de padr~oes. Figura 9: Hiperplano - SVM para classi

cac~ao O projeto da maquina depende diretamente da extrac~ao de um subconjunto dos dados de treinamento que representem caractersticas estaveis dos dados, chamados de vetor es de suporte, atraves de um algoritmo. Para cada padr~ao de entrada e calculado um nu cleo 47 do produto interno entre essa entrada e cada vetor de suporte, que funcionam com o unidades ocultas da rede. Dependendo de como esse nucleo interno e gerado, podemos contruir diferentes maquinas de aprendizagem (polinomial, func~ao de base radial), que se caracterizam por superfcies de decis~ao n~ao-lineares proprias. Assim, podemos dize r que a maquina de vetor de suporte e uma rede alimentada adiante com uma unica camada oculta de unidades n~ao-lineares, formada pelos vetores de suporte extrados pelo a lgoritmo.

Tendo em mente que os vetores de suporte s~ao apenas uma frac~ao do espaco de entr ada, e necessario enfatizar que o proprio algoritmo de

ne a quantidade otima de nos ocultos da rede, liberando o usuario da escolha deste par^ametro. Seu treinamento equivale a soluc~ao de um problema de otimizac~ao quadratica, de maneira que a resposta encontrada pela maquina e sempre unica e globalmente otima, resolvendo um problema recorrente em outros tipos de redes neurais, como o perce ptron de multiplas camadas: a obtenc~ao de falsas respostas devido aos mnimos locais da super fcie de erro. 2.2.3.2 Mquinas de Vetor de Suporte para Regresso Segundo Cortes e Vapnik (1995), a maquina de vetor de suporte conceitualmente implementa a seguinte ideia: vetores de entrada s~ao mapeados n~ao-linearmente pa ra um espaco de caractersticas de alta dimensionalidade, onde uma superfcie de decis~ao lin ear e construda. Propriedades especiais da superfcie de decis~ao garantem alta habilidade de generalizac~ao para a maquina de aprendizagem. Segundo Smola e Sch olkopf (2004), na regress~ao "-SV (comumente chamada de "-SVR) desenvolvida por Vapnik (1995), o objetivo da maquina de suporte e encontra r uma func~ao f(x) que tenha no maximo um desvio " dos valores desejados di para tod os os dados de treinamento e, ao mesmo tempo, seja a mais suave possvel. A rede execu ta essa regress~ao atraves da minimizac~ao do risco, onde o risco e dado pela func~ao d e perda insensvel a " de Vapnik (que sera descrita adiante). Considerando um conjunto de dados G = f(xi; di)gn i , onde xi e o vetor de entrada, di e o valor desejado e n o total de padr~oes, a maquina de vetor de suporte aprox ima a func~ao utilizando a seguinte equac~ao: y = f(x) = w(x) + b (2.32) Onde (x) e o espaco de caractersticas de alta dimensionalidade mapeado n~ao4 8 linearmente a partir dos dados de entrada x. Os coe

cientes w e b s~ao estimados atraves da minimizac~ao da func~ao de custo 2.33: RSVMs(C) = C 1 n Xn i=1 L"(di; yi) + 1 2 jjwjj2 (2.33) Sendo L"(di; yi) a func~ao de perda dada por: L"(d; y) = 8< : jd ?? yj ?? " se jd ?? yj " 0 caso contrario (2.34) A func~ao de perda 2.34 da ao modelo a vantagem da escolha de pontos de dados esparsos para a representac~ao da func~ao de decis~ao, resultando na escolha dos v etores de suporte apenas quando o seu valor torna-se diferente de 0. O segundo termo da equac~ao (2.33), dado por 1 2 jjwjj2, e o termo de regulariza

Вам также может понравиться