Академический Документы
Профессиональный Документы
Культура Документы
Leonardo Alves de Paula e Silva CMP135 - Arquiteturas Especiais Prof. Philippe O. A. Navaux 07/01/2002
Introduo
Introduo Especicaes e Medidas de desempenho Classicao Estudos de caso Aplicaes Concluses Bibliograa
Introduo
Mesmo o mais rpido processador no pode prover resposta e aprendizado em tempo-real para redes com um nmero razovel de neurnios e sinapses. Lindsey em [2]. von Neuman geralmente utilizado para neurosimulaes, mas algumas aplicaes como experimentos em fsica de alta energia necessitam implementaes em hardware
Especicaes
Especicaes da rede neural: Arquitetura da Rede Neural (Feedfoward multi-layer, radial basis functions (RBF), etc.) Nmero de entradas e sadas Nmero de neurnios Nmero de sinapses por neurnio Nmero de camadas
Especicaes
Especicaes do hardware: Tecnologia utilizada (analgica, digital, hbrida ou tica) Preciso (em nmero de bits) das entradas e sadas dos pesos dos acumuladores
Medidas de Desempenho
Medidas de desempenho: Connection-Per-Second (CPS): dene a taxa de operaes de multiplicao e acumulao de valores durante o processamento; mede o quo rpido um rede realiza a fase de recall, i.e. mapeamento do entrada para sada; Connection-Update-Per-Second (CUPS): indica a taxa de mudana dos pesos durante o processo de aprendizagem; mede o quo rpido a rede consegue aprender.
Medidas de Desempenho
No existe um consenso entre os testes de benchmark para redes neurais a no ser o tempo de aprendizagem do NETtalk (rede neural do tipo backpropagation que traduz um texto em fonemas) o qual citado em [2, 3] .
Classicao
Neurohardware
Specialpurpose
Custom design
chips technologies
Coprocessors
Figure 1:
Estudos de Casos
Tabela 1: Neurocomputadores encontrados comercialmente (os resultados de desempenho no foram obtidos utilizando um mesmo benchmark, devendo ser tomados como sendo relativos, como sugere a fonte [2]).
Estudos de Casos
Produto SYNAPSE CNAPS RAP SAIC Balboa Lneuro WSI ETANN Boltzmann Arq./tecnologia systolic SIMD SPMD PC+board PC-board transputer board digital analgico hbrido
Table 1:
Estudos de Casos
Tabela 2: Alguns neurochips/neurocomputadores encontrados comercialmente classicados seguindo a taxonomia de Serbedzija para hardware dedicado (special-purpose)
Estudos de Casos
Estudos de Casos
Estudos de Casos:
SYNAPSE System:
Processor arrays
Produzido pela Siemens Dos mais populares e de uso geral Baseados em arquitetura sistlica bidimensional Projetado para acelerar operaes de matrizes e procura do mximo valor Composto por 8 processadores MA16 e 2 MC6804 CICS para propsitos de controle Um nico mdulo pode processar 4 padres de 16 elementos cada (16-bits) com 16 valores a uma taxa de 800 multiplicaes/acumulaes/sec a 50Mhz
Estudos de Casos:
Processor arrays
CNAPS (Coprocessing Node Architecture for Parallel Systems): Desenvolvida por pela Adaptative Solutions SIMD 64 processadores por chip conectados em uma estrutura de vetor unidimensional Barramento de broadcast conecta os processadores a um sequenciador comum de instruo microcodicada Para o aprendizado on-chip, cada chip tem como manter 128k pesos de 16 bits
Estudos de Casos:
Processor arrays
CNAPS (Coprocessing Node Architecture for Parallel Systems): Pode ter at 512 conectados a um host workstation Ferramentas de desenvolvimento proprietria
Estudos de Casos:
Processor arrays
Figure 3: CNAPS.
Estudos de Casos:
Processor arrays
Estudos de Casos:
Processor arrays
RAP (Ring Array Processor): Desenvolvido no ICSI Berkeley Estruturado em anel de DSPs (Digital Signal Processor ) Cada DSP tem memria local de 256kbytes de RAM esttica e 4Mbytes de RAM dinmica. At 4 DSPs por placa
Estudos de Casos:
Processor arrays
RAP (Ring Array Processor): Processamento disparado por intermdio de um host workstation Processamento SPMD Mapeamento de conjunto de neurnios em um DSP Apropriado para aplicaes conexionistas
Estudos de Casos:
SAIC SIGMA-1:
Co-processors
Processador comporta at 3M elementos de processamento virtual e conexes Linguagem OO (ANSpec) e biblioteca para rede neural (ANSim)
Estudos de Casos:
Balboa 869:
Co-processors
Para PC e Sun Processador Intel i860 especializado para executar o pacote ExploreNet
Estudos de Casos:
Co-processors
Lneuro (LEP neuromimetic circuit ): Produzido pela Philips Os processadores so integrados em blocos e conectados em transputers Combina MIMD do transputer com SIMD dos processadores
Estudos de Casos:
WSI:
Special-purpose
Produzido pela Hitachi Tecnologia Digital 576 neurnios e 36K pesos Integrado em chips de 5 polegadas usando 0.8 m CMOS
Estudos de Casos:
Special-purpose
ETANN (Electrically Trainable Analog Neural Network ): Produzido pela Intel Tecnologia analgica 64 neurnios e 10K pesos Processamento disparado por intermdio de um PC host
Estudos de Casos:
Special-purpose
Estudos de Casos:
Special-purpose
Estudos de Casos:
Special-purpose
Tecnologica hbrida (digital e analgica) 336 neurnios de 1 bit e 28k pesos de 5 bits
Aplicaes
OCR (Optical Character Recognition)
Aplicaes
High Energy Physics: Experimentos em fsica de alta energia envolvem colises de partculas sub-atmicas como prtons e eltrons em aceleradores de partculas. A exploso ocorrem quando as partculas se chocam formando partcluas ainda menores, as quais so de grande interesse (pelo menos para os fsicos!) como os quarks. A maioria das colises no produzem nada interessante.
Aplicaes
A freqncia de coliso excede centenas de MHz, exigindo um ltro online sosticado para rejeitar eventos que no tenham interesse e guardar apenas os interessantes. O Fermilab Tevatron perto de Chicago tem (tinha?) um equipamento para realizar esta classicao que emprega o Intel ETANN. O Max Planck Institute em Hamburgo, o equipamento de classicao utiliza 10 placas Adaptative Solutions CNAPS VME executando 10 redes neurais diferentes.
Concluso
Hardware dedicado atinge maior desempenho segundo publicao na IEEE Micro de junho de 1994 j que implementam um modelo especco de rede neural diretamente no circuito. O uso combinado de tecnologias digital e analgica produzem neurochips que atingem taxas de Giga CUPS na fase de aprendizado e de Tera CPS na fase de recall.
Concluso
A diculdade em desenvolver neurohardware est na relativa imaturidade da pesquisa em redes neurais, onde os modelos j criados continuam sendo modicados e novos modelos vo sendo rapidamente desenvolvidos [2]. O neurocomputador do futuro poder consistir de um nmero modular de componentes abrangendo do hardware convencional at circuitos altamente especializados, dispositivos ticos e moleculares [2].
References
[1] Valeriu Beiu. Handbook of Neural Computation, chapter E1.4. IOP Publishing Ltd and Oxford University Press, 1997. Captulos disponibilizados em formato PDF: http://www.iop.org/Books/CIL/HNC/index.html . [2] Clark S. Lindsey. Neural networks in hardware: Architectures, products and applications. Disponvel em http://www.particle.kth.se/~lindsey/HardwareNNWCourse/home.html . Notas de aula. ltima atualizao: 26/08/2002. Visitado em 19/12/2002. [3] Clark S. Lindsey, Bruce Denby, and Thomas Lindblad. Articial neural networks in high energy physics. Disponvel em http://neuralnets.web.cern.ch/NeuralNets/nnwInHepHard.html . ltima atualizao: 13/11/1998. Visitado em 15/12/2002.
References
[1] Clark S. Lindsey and Thomas Lindblad. Review of hardware neural networks: A users perspective. Disponvel em http://www.particle.kth.se/%7Elindsey/elba2html/elba2html.html . ltima atualizao: 06/03/1998. Visitado em 16/12/2002. [2] Nikola B. Serbedzija. Simulating articial neural networks on parallel architectures. Computer, 29(3):5663, 1996.