Вы находитесь на странице: 1из 7

676 Morgon Quim.

Nova
Quim. Nova, Vol. 24, No. 5, 676-682, 2001. Divulgao

COMPUTAO EM QUMICA TERICA: INFORMAES TCNICAS #

Nelson Henrique Morgon*


Departamento de Fsico-Qumica, Instituto de Qumica, Universidade Estadual de Campinas, CP 6154, 13083-970 Campinas - SP

Recebido em 4/7/00; aceito em 29/11/00

COMPUTATION IN THEORETICAL CHEMISTRY: TECHNICAL INFORMATIONS. The purpose of


this work is to demonstrate the usefulness of low cost high performance computers. It is presented
technics and software packages used by computational chemists. Access to high-performance computing
power remains crucial for many computational quantum chemistry. So, this work introduces the concept
of PC cluster, an economical computing plataform.

Keywords: computers; PC cluster; theoretical chemistry.

INTRODUO do conhecimento tecnolgico. E, o que pode igualar os


povos destas naes a capacidade intelectual de
Considerando-se que a qumica por excelncia uma cincia aprendizado de seus membros.
experimental, do ponto de vista do qumica terico, a frase a Pretende-se, deste modo, fornecer subsdios iniciais para uma
seguir antecipa em aproximadamente 100 anos a expresso anlise de que, no existe limitao de ordem financeira, dentro de
puramente matemtica H ( )
! = E! dada por E. Schroedinger um mnimo aceitvel, que impea atravs de material disponvel
(1926) na descrio da estrutura eletrnica de sistemas e no mercado, a pesquisadores, principalmente iniciantes e de insti-
interaes moleculares. tuies de ensino e pesquisa no to abonadas, a aquisio de
equipamentos e o desenvolvimento e execuo de projetos de pes-
Quanto mais as cincias fsicas progridem, mais elas ten- quisa na rea de qumica terica computacional, com qualidade.
dem a entrar no domnio da Matemtica, que um tipo de A qumica terica, basicamente compreendida em quntica
centro para onde elas convergem. Ns podemos julgar o (mtodos ab initio, semi-emprico, funcional de densidade, ...)
grau de perfeio que a cincia tem alcanado, pela faci- e clssica (mecnica dinmica - determinstico e monte carlo -
lidade com que ela pode ser submetida a CLCULO.- A. estocstico; ...) tem-se tornado bastante popular nas ltimas
Quetelet (1828). dcadas. S a ttulo de informao, considerando-se os nme-
No entanto, M. Planck, um dos fundadores da Mecnica ros de trabalhos tericos na ltima dcada de dois dos princi-
Quntica que propiciou o desenvolvimento da Eq. de Schroedinger, pais eventos para os qumicos tericos no pas, a Reunio
assinala que: Anual da Sociedade Brasileira de Qumica (RASBQ) e o
Experimentos so os nicos meios de conhecimento a nossa Simpsio Brasileiro de Qumica Terica (SBQT) observa-se
disposio, o resto poesia, imaginao.- M. Planck (1901). pela Tabela 1 que, neste perodo, o nmero de trabalhos nestes
encontros tem aumentado significativamente, proporcional
Esta aparente contradio permite assinalar uma das gran-
claro, ao aumento do nmero de participantes nestes eventos.
des virtudes atuais da qumica terica, a de atuar como ferra-
menta de apoio na anlise e interpretao de dados experimen-
tais, atravs de informaes que muitas vezes no so poss- Tabela 1. Nmero de trabalhos em Qumica Terica (a) da Reu-
veis de serem obtidas diretamente dos experimentos 1-4, ou na nio da SBQ e SBQT.
previso de propriedades diversas.
Na primeira parte do trabalho apresentado um panorama Ano No de Trabalhos
suscinto da qumica terica (de estrutura eletrnica e mecnica RASBQ(b) SBQT(c)
clssica), enfatizando aplicaes e evoluo. Posteriormente,
sero abordados aspectos tcnicos relacionados a computadores 1.991(d) - 124
como instrumento de trabalho utilizados pelos qumicos teri- 1.992(d) - -
cos, destacando-se informaes bsicas de seus principais com- 1.993(d) 22 189
ponentes e a descrio de alguns programas de clculos e sis- 1.994(d) 24 -
tema operacional, enfatizando-se o carter gratuito dos mes- 1.995(d) 37 216
mos. Finalmente, ser apresentada a idia de computao de 1.996(d) 35 -
alto desempenho a baixo custo, trazendo informaes recentes 1.997(d) 25 300
sobre construo de cluster e aspectos relacionados a eles. 1.998(d) 23 -
No se objetiva citaes to brilhantes quanto as preceden- 1.999(d) 32 386
tes, mas to somente que ao final do trabalho tenha ficado 2.000(d) 44 -
algo, sob o ponto de vista do autor, como: (a)
Fonte: Livros de Resumo; (b)Especificamente na Seo de
O que diferencia uma nao tecnologicamente desen- Qumica Terica, embora existam outras sees que utilizem
volvida, de uma em desenvolvimento a propriedade clculos tericos; (c) Encontro Bianual; (d) Nos anos anteriores a
1.993, os trabalhos de Qumica Terica na RASBQ constavam
na Seo de Fsico-Qumica.
#
Parcialmente apresentado no curso Qumica Computacional
da 23 a Reunio Anual da Sociedade Brasileira de Qumica,
Poos de Caldas, MG, Maio/2000. Para explicar o porqu deste aumento, alguns fatores tm
* contribudo, como:
e-mail: morgon@iqm.unicamp.br - http://canario.iqm.unicamp.br
Vol. 24, No. 5 Computao em Qumica Terica: Informaes Tcnicas 677

1. o crescimento da comunidade cientfica; Qumica Orgnica - no estudo de estabilidade relativa de


2. a popularizao de pacotes computacionais de qumica teri- ismeros; na caracterizao de intermedirios, teis no estabe-
ca, como por exemplo a srie de programas Gaussian 5; lecimento e entendimento de mecanismos de reao; no estudo
3. a implementao de algoritmos matemticos e mtodos teri- de aromaticidade de compostos; na obteno e anlise de es-
cos mais eficientes; e pectros de RMN;
4. equipamentos (computadores e perifricos) com melhor Qumica Inorgnica - no uso da teoria do campo ligante -
desempenho em processamento e transmisso de dados, e a mtodo quntico aproximado; na utilizao do estudo de ons
custos menores. de complexos de metais de transio; em catlises homognea
Estes fatores refletem principalmente na qualidade dos resultados e heterognea; em processos de adsoro;
calculados de propriedades moleculares (comparveis preciso
Qumica Analtica - no uso de mtodos espectroscpicos de
qumica) e na possibilidade de estender os clculos a sistemas de
anlise (freqncias e intensidades de espectros); no estudo de
interesse qumico (experimental), destacando-se aqueles sistemas de
compostos de interesse ambiental; e em
tamanho mdio, principalmente empregando metodologias de alto
nvel (ab initio e funcional de densidade). Isto fato atualmente, Bioqumica - na anlise conformacional de grandes sistemas
visto que muitos dos trabalhos apresentados nestes encontros so moleculares de importncia biolgica (macromolculas, prote-
frutos de colaborao entre tericos e experimentais. nas, enzimas); no estudo da interao enzima-substrato; em pro-
Um resumo da evoluo e desenvolvimento computacional de cessos sob efeito de solventes. Especificamente no caso da bio-
mtodos de qumica quntica utilizados no estudo de proprieda- qumica, a potencialidade nesta rea muito grande, como por
des de estrutura eletrnica de tomos e molculas foi apresenta- exemplo no planejamento racional de frmacos. Enfim, o espec-
do com bastante propriedade recentemente nesta revista6. tro de aplicaes transcende os exemplos enumerados acima.
No caso da implementao de mtodos, os dois exemplos a H ainda um novo cenrio surgindo com o aparecimento de
seguir so marcantes. O primeiro refere-se Teoria de Pertur- uma nova estratgia de clculos, fruto do casamento entre
bao (MPn), fundamentada nos trabalhos de Mller e Plesset7 mtodos de Qumica Quntica (estrutura eletrnica) e Mecni-
da dcada de 30, mas que apenas a partir da dcada de 70 teve ca/Dinmica Molecular, conhecida por: Quantum Mechanics/
clculos de energias e gradientes implementados eficientemen- Molecular Mechanics - QM/MM, ou mtodos hbridos. As
te nos programas computacionais. O segundo exemplo, mais vantagens de uns sanando desvantagens de outros, por exem-
recente, trata-se da Teoria do Funcional de Densidade, formu- plo, sabido que mtodos de mecnica molecular falham na
lada a partir dos trabalhos de Kohn, Hohenberg e Sham 8,9, que descrio de propriedades onde h a necessidade explcita da
se tornou popular a partir de meados da dcada de 8010, ou participao de eltrons, como na quebra e formao de liga-
seja 20 anos depois. E, com relao a algoritmos mais eficien- es qumicas, mas so extremamente teis em sistemas mole-
tes destacam-se implementaes de clculo direto de integrais culares grandes, para os quais existam parmetros 20. Assim,
eletrnicas, mtodos de otimizao global, de integrao num- uma possibilidade descrever partes do sistema por um ou
rica (DFT), clculos analticos de gradientes de energia, da outro mtodo, mas isto ser objeto de um outro trabalho.
matriz hessiana (freqncia e intensidades), busca na superfcie A discusso a seguir aborda aspectos da evoluo
de energia potencial de estado de transio, entre outros. tecnolgica, que propiciou esta difuso de pesquisa na rea
No caso dos equipamentos, o entendimento fica claro consi- terica, porm tendo como princpio apresentar, do ponto de
derando-se a prpria evoluo histrica do processo. De acordo vista tcnico, um estudo que possibilite a criao de um ambi-
com Clementi11, a primeira gerao de computadores (1946- ente computacional. Isto ser feito atravs de informaes e
1955) comea com o computador ENIAC e termina com o mo- ferramentas teis para iniciantes e para quem se aventura na
delo IBM-704 (a primeira mquina comercial) capaz da proeza em rea de clculos tericos. A principal caracterstica que este
obter desempenho de aproximadamente 5 kFlop/s12,13. Ainda, trabalho ambiciona, a de dar informaes para a construo
segundo Clementi, deve-se estar agora na stima gerao (199X- deste ambiente, e que seja um ambiente de alto desempenho
2010), cuja principal caracterstica a de ser definida por computacional a um baixo custo financeiro, assim toda a nfa-
mquinas multiprocessadas14, que alcanam desempenho de se ser dada, de modo a que o interessado gaste somente na
TFlop/s15,16 ou seja, isto equivale a uma evoluo em Flop/s da aquisio de equipamentos (dentro da tica de menor custo), e
ordem de 200 milhes de vezes (num perodo de meio sculo), que toda a infraestrutura de software seja sem nenhum custo
usando-se como parmetro o que h de equipamento mais avan- adicional. Deste modo, quem o pblico-alvo deste trabalho?
ado. No entanto, mesmo computadores pessoais conseguem a) jovens pesquisadores; b) pesquisadores de instituies com
processamento bastante significativo, na faixa de MFlop/s 17. Al- limitados oramentos destinados pesquisa; e c) aqueles que
guns projetos cientficos esto comeando a pensar em computa- optam por no ficar dependentes de pacotes comerciais.
dores PetaFlop/s, so mquinas que iro necessitar de um nme- Um primeiro passo so os computadores pessoais,
ro expressivo de processadores trabalhando em paralelo num conectados rede mundial, esquematizado na Figura 1. So
mesmo problema18,19. equipamentos de baixo custo, na faixa de R$ 2.000,00 a
Um outro avano que disseminou o uso de clculos tericos R$ 5.000,00 e que podem desempenhar uma variedade de
foi o surgimento da Internet, marcante principalmente por faci- tarefas: clculos para uma grande diversidade de sistemas e
litar: a) a divulgao de conhecimento muito rpido; b) consul- propriedades (em grandes sistemas, mtodos de Mecnica
tas on line de bancos de dados; e c) acesso a revistas cientficas. Clssica - Mecnica/Dinmica Molecular e Monte Carlo; para
Graas aos avanos citados acima, observa-se uma forte sistemas intermedirios e/ou baixa preciso, mtodos semi-
interao entre qumicos tericos e experimentais, e com uma empricos e/ou Hartree-Fock com conjuntos de funes de
freqncia crescente o surgimento, em bancadas dos laborat- base modestos, e para pequenos sistemas - alguns tomos,
rios, de estaes de trabalho e computadores pessoais voltados possvel clculos mais precisos com correlao eletrnica e
exclusivamente para clculos tericos. Aplicaes rotineiras conjuntos de base estendidos). Podem ser utilizados tambm
podem ser encontradas, nas diversas reas da Qumica, como: para edio e preparao de artigos, projetos, relatrios cien-
Fsico-Qumica - no clculo de propriedades termodinmicas tficos, produo de material didtico (textos, hipertextos, gr-
de gases; na interpretao de espectro molecular; na determina- ficos, imagens) e conectados internet, que permite, entre
o de propriedades estruturais (comprimentos e ngulos de li- tantas outras utilidades, acessar bibliotecas virtuais (Web of
gao); na obteno de diferenas de energias conformacionais Science21, ProBE22 e SciELO 23), o que possibilita a constante
e de barreiras de energias rotacionais; na caracterizao de esta- atualizao e aquisio tanto de conhecimento cientfico quan-
dos de transio e estimativa de constantes de velocidade; to de novos softwares.
678 Morgon Quim. Nova

10. Pacotes Grficos para edio e visualizao de estruturas e


propriedades moleculares:
* molden41, programa de pr- e ps-processamento grfico, utili-
zado na visualizao de estrutura eletrnica e edio de estrutu-
ras moleculares. Capaz de permitir a visualizao de orbitais
moleculares, densidades eletrnica, potencial eletrosttico, en-
tre outras propriedades e potencialidades. Na Figura 2 tem-se
uma amostra do editor de estruturas moleculares.

Figura 1. Equipamento de uso pessoal como infraestrutura m-


nima necessria para desenvolver pesquisas em qumica
computacional.

Abaixo esto alguns aplicativos com descries bsicas e


informaes tcnicas, bastante teis para o qumico terico.
1. Equipamento computacional (caractersticas mnimas neces-
srias): PC com processador (a partir de 200MHz), poden-
do ser simples ou dual, do tipo Intel (Pentium Pro, II, III
e IV), Cyrix, AMD (Duron, Athlon K7), ...; placa de rede
(10Mb/s) para acesso internet; disco (5GB) IDE ou SCSI
com controladora (melhor desempenho), memria RAM
(128MB) e placa de vdeo (2MB) para aplicaes envol-
vendo visualizao grfica, monitor e impressora.
2. Sistema Operacional: UNIX24, trata-se de um sistema conce-
bido a partir do projeto MULTICS (MULTiplexed Information
Figura 2. Editor e visualizador de estruturas moleculares do
and Computing Service) e desenvolvido por Massachussets
pacote Molden.
Institute of Technology (MIT), Bell Labs e General Eletric
(GE), na dcada de 60. Origina-se como um sistema
operacional experimental e especfico para computador Outros pacotes grficos de edio e visualizao molecular so:
GE635. Foi criado para ser flexvel e interativo, posterior- * rasmol42, manipula com bastante rapidez e qualidade de
mente Ken Thompson e Dennis Ritche alteraram o complexo imagem grfica, estruturas com muitos tomos, por exem-
sistema operacional inicial e criaram um sistema de arquivos plo, protenas, como mostra a Figura 3. L diversos forma-
simples denominado UNICS (UNIplexed Information and tos de dados, principalmente pdb (Protein Data Bank).
Computing Service) - UNIX. Como caractersticas gerais, des- * garlic43
taca-se por ser multiusurio e multitarefa, possuir sistema de
arquivos (e a prpria concepo de arquivo), ter facilidade em * qmol44
ser usado em rede e possuir um conjunto de utilitrios. Existe * xcrysden45, programa de visualizao de estrutura e densi-
uma grande variedade de verses comerciais (AIX, Ultrix, dade molecular e cristalina
Sun-OS, Convex, SGI, Cray, OSF) e de domnio pblico
(FreeBSD25,26 e LINUX27,28).
3. Compiladores para fortran, C, C++: GNU (gcc, g77),
egcs, f2c 29.
4. Editores de texto cientfico: latex30, um conjunto de macros
para TeX, um sistema de processamento de texto de alta
qualidade voltado para a produo de documentos tcnicos e
cientficos. Vale salientar que revistas cientficas internacio-
nais31,32 aceitam artigos preparados com LaTeX, dispondo
de etilos prprios facilmente implementados.
5. Construtores de estruturas e gerao de figuras: xfig33
6. Visualizadores de imagens e textos: xv34, gv35, xdvi, ...
7. Web Pages: latex2html36, conversor de alta qualidade de
documentos preparados em LaTeX para HTML e de gran-
de utilidade na preparao de material tcnico, cientfico e
educacional a ser disponibilizado em rede.
8. Conversor de formatos de arquivos: babel37, um progra-
ma voltado para interconverter inmeros formatos muito
usados em modelagem molecular. Por exemplo, arquivos
em coordenadas cartesianas (xyz) para matriz-Z.
9. Pacotes Grficos:
* gnuplot38, pacote grfico iterativo que plota funes, con-
juntos de dados em 2D e superfcies (3D);
* xmgr39, pacote para plotar em 2D usado em sistema X
Figura 3. Estrutura da protena crambin encontrada em semen-
Window e que utiliza interface OSF/Motif. tes e composta por 45 grupos, 752 tomos e 1003 ligaes, vi-
* glace40, sucessor do xmgr. sualizada pelo pacote grfico Rasmol.
Vol. 24, No. 5 Computao em Qumica Terica: Informaes Tcnicas 679

11. Pacotes de programas de clculo terico:


* Gamess46: pacote geral de qumica quntica para clculos
ab initio, funcional de densidade e semi-emprico (MNDO,
AM1 e PM3).
* Deft47: um software de mecnica quntica computacional,
baseado na teoria do funcional de densidade. Utiliza funcio-
nais de densidade do tipo gaussianos.
* Molfdir48: cdigo de qumica quntica que faz clculos de
sistemas moleculares multi-eletrnicos usando formalismo
de Fock-Dirac e clculos adicionais de correlao.
* Moldy49, um programa de propsitos gerais, voltado para
simulao de dinmica molecular. suficientemente flex-
vel, devendo ser til para uma grande faixa de clculos de
simulao de sistemas atmicos, inicos e moleculares.
* Dalton50: programa de qumica quntica, cujo forte est
nas reas de propriedades eltricas e magnticas e no estu-
do de superfcies de energia potencial para ambas as inves-
tigaes esttica e dinmica.
* Dirac51: cdigo para clculos moleculares relativsticos
baseados no hamiltoniano Dirac-Coulomb.
* Tinker52 pacote de modelagem molecular. concebido
para ser um sistema de uso fcil e flexvel empregado em Figura 5. Densidade eletrnica para C 2 H 4 , calculada pelo
mecnica e dinmica molecular. Gamess e visualizada pelo Molden.

12. Outros aplicativos.


Existe uma grande quantidade de aplicativos. Para obter
outros programas e informaes adicionais consultar: http://
sal.engnux.ufsc.br/index.shtml.
Como exemplo de aplicao geral, fez-se um clculo de
estrutura eletrnica ab initio para a molcula de C2H4, usan-
do-se o progama Gamess. A partir da funo de onda obtida
a nvel HF/4-31G, possvel, usando o programa Molden,
visualizar algumas propriedades eletrnicas deste sistema. Nas
Figuras 4, 5 e 6 esto, respectivamente, as imagens do orbital
molecular correspondente ligao dupla, do contorno da dis-
tribuio eletrnica total sobre a molcula e do potencial
eletrosttico (e as cargas) derivado da anlise populacional
de Mlliken.

Figura 6. Potencial eletrosttico para C 2H 4 , calculado pelo


Molden a partir da anlise populacional obtida pelo Gamess.

As vantagens da internet so bem conhecidas, e algumas j


foram enumeradas e comentadas anteriormente, no entanto um
conceito particular da conexo em rede entre computadores e
que ser abordado a seguir, envolve o processo de transfern-
cia de dados entre computadores "prximos". Este procedimen-
to permite a criao de um ambiente com mais de um
processador trabalhando em paralelo numa determinada tarefa.
Tais equipamentos so denominados de clusters. So mqui-
nas com grande poder de processamento criando um ambiente
de alto desempenho em computao paralela 14.
Com o desempenho e o baixo custo atualmente dos PCs e
a disponibilidade de conexo por ethernet (fastethernet:
100Mbit/s ou gigaethernet: 1000Mbit/s), tornou-se possvel
Figura 4. Orbital Molecular para C 2H 4 , obtido pelo Gamess e combin-los e construir ambientes de computao paralela de
visualizado pelo Molden. alto desempenho, da ordem de GFlop/s, a um custo reduzido,
680 Morgon Quim. Nova

se comparado a mquinas multiprocessadas comerciais. Com qumica computacional tem implementao paralela disponvel,
verses livres de UNIX e pacotes de software de domnio principalmente para mquinas com memria distribuda (como
pblico, nenhum sistema de computao paralela, disponvel os clusters). Eles trabalham tanto em ambiente seqencial quan-
comercialmente, pode competir com o preo de tais equipa- to em paralelo, como por exemplo, o pacote Gamess46. Eles
mentos. O argumento contrrio a esta concepo de arquite- utilizam-se de bibliotecas especficas envolvidas nas trocas (en-
tura, freqentemente apontado como a no existncia de vio e recebimento) de mensagens entre os processadores na rede
um centro de suporte quando um problema surgir, mas existe (conexo local) . As mais populares so: mpich57 e pvm58. So
uma grande variedade de informaes disponveis em sites de aplicativos que tambm permitem o desenvolvimento de progra-
ftp, web e newgroups53, que auxiliam. Alm do aspecto da mas paralelos.
formao de recursos humanos, isto , permite a educao de
estudantes e a criao de uma cultura em ambiente de proces-
samento de alto desempenho 54.
Deste modo, tem se tornado muito populares os clusters de
PCs ao redor do mundo, com dezenas e centenas de
processadores e com inmeras aplicaes teis em qumica
computacional 55. Uma verso modesta foi construda no IQ/
UNICAMP em 1.997, usando 4 unidades, sendo cada uma
composta por Pentium Pro 200 MHz, com 128 MB de mem-
ria RAM e 1GB de disco SCSI, placa Ethernet 100 Mbit/s e
conectados via rede atravs de um hub de 8 portas. Equipa-
mentos com no mnimo 16 processadores, so uma classe es-
pecial de cluster denominados Beowulf56. Eles tm se tornado
muito populares em muitos centros de pesquisa no exterior
como uma opo barata e de alta performance.
A conexo dos processadores pode ser feita por hubs ou
switches, e placas de rede ethernet (Gigabit Ethernet e
FastEthernet), que so relativamente de baixo custo, compara-
das a outras tecnologias como fibra tica (Fiber Distributed
Data Interface - FDDI) e ATM (Asynchronous Transfer Mode).
A principal diferena entre hubs e switches est em como as
mensagens so distribudas entre os processadores. No caso do
hub, para uma mensagem ser enviada a partir de um dado Figura 7. Cluster de PCs.
processador para um outro processador, feito um broadcast
para todos os computadores da rede, ao passo que com switch, De um modo geral, na estrutura descrita pela Figura 7, todo
as mensagens so trocadas em canais exclusivos estabelecidos o sistema de gerenciamento de contas de usurios e localizao
pelos dois processadores, em questo. Isto permite s switches de programas e arquivos, feita por um computador mais ro-
suportarem comunicao denominada full duplex, ou seja, elas busto (o servidor). Isto simplifica muito a manuteno e atua-
tm a habilidade em dobrar a velocidade de cada link, por lizao dos programas e o prprio gerenciamento e controle do
exemplo de 100Mb/s a 200Mb/s. Hoje existe uma grande va- ambiente. Alm de uma substancial economia no armazenamen-
riedade de switches disponveis, contendo de 8 a 100 portas, to de dados. As reas comuns so propagadas do servidor via
que podem alcanar desempenho na transferncia de dados da sistema de arquivos para os processadores (clientes) (Network
ordem de Gigabit/s. Elas tm-se tornado to baratas que no File System - NFS).
existem motivos para construir clusters interconectando-se os Na Tabela 2 esto colocados os tempos de processamento para
processadores usando hubs ou outra conexo. os clculos de otimizao de geometria e freqncia vibracional
Clusters de PCs em rede podem ser usados para processa- harmnica, para o sistema formamida solvatada por trs molcu-
mento de mltiplos clculos em seqencial e podem tambm dar las de gua (representadas por EFP - effective fragment potentials),
suporte para processamento em paralelo. Na Figura 7 tem-se um como mostra a Figura 8, no nvel HF e otimizao de geometria
exemplo esquemtico de um ambiente para execuo de progra- a MP2, usando-se conjuntos de funes de base de Dunning,
mas em processamento paralelo. A maioria dos programas de DH(p,d). Apenas como comparao foram feitos testes usando

Tabela 2. Anlise do tempo de processamento (em s) nos clculos de otimizao de geometria e freqncia vibracional harmnica
para o sistema formamida solvatada por trs molculas de gua (descritas por EFP), usando-se metodologias HF e otimizao de
geometria a MP2, com conjuntos de funes de base DH(p,d). Os clculos foram feitos em ambintes de cluster de PCs e de
estaes de trabalho do CENAPAD/SP.
Mtodo Clculo No de PCs(a) CENAPAD/SP (b),(c)
1 4 Thin66 Thin120 PWR3
HF Otimizao 5.758,3 (1.411,3) 1.547,2 3.066,5 966,4 1.065,5
Freqncia 3.695,5 (829,4) 1.001,0 1.825,0 592,5 656,7
MP2 Otimizao 8.002,0 (5.160,3) 4.215,1 8.545,3 2.553,2 3.005,3
(a)
Pentium Pro 200@MHz (em parnteses, AMD Athlon(tm) 700@MHz) com 128MB de memria (RAM) e 1GB de disco local. Os
processadores esto em uma rede ethernet de 100Mb/s; (b)Thin66: 4 IBM RISC/6000-370 66@MHz com 256MB RAM e 2GB de
disco cada. Thin120: 4 IBM RISC/6000-Power2 Super 120@MHz com 512MB RAM e 4,5GB de disco cada. Interface SPS - 150Mb/s
bi-direcional. PWR3: 1 CPU PowerPC 630 200@MHz (com 2 processadores) com 256MB de memria RAM, 4MB de cache L2 e
6GB de disco e Interface de rede Fast Ethernet (100Mb/s) 59; (c)O CENAPAD/SP possui mquinas mais rpidas, como: IBM RISC/
6000-Power2 Super 160@MHz com 1GB RAM e 9GB de disco conectados por interface SPS - 150Mb/s bi-direcional e SILVER -
1 CPU com 4 processadores 200@MHz com 2GMB de memria RAM, e 40GB SSA de disco no usadas no teste (ver texto).
Vol. 24, No. 5 Computao em Qumica Terica: Informaes Tcnicas 681

PC e cluster de PCs do IQ/UNICAMP e estaes de trabalho b) usando-se mtodos correlacionados (usados para
disponveis no Centro Nacional de Processamento de Alto De- minimizar os efeitos da aproximao do mtodo HFR), alm da
sempenho em So Paulo (CENAPAD/SP)59. etapa precedente, h a necessidade de calcular um grande n-
mero de configuraes, geradas como funo do nmero de
orbitais necessrios na construo da funo de onda; e
c) j para os mtodos de Mecnica, Dinmica ou Simula-
o de Monte Carlo, o que existe um grande nmero de
molculas componentes do sistema e/ou so sistemas macro-
moleculares;
Assim,
o que limita o uso de clculos tericos, no o sistema
estudado ou a metodologia empregada, mas o equipamen-
to disponvel.

CONCLUSO

Com este trabalho procurou-se apresentar alternativas de


baixo custo, bom desempenho de processamento e um rotei-
ro bsico inicial, para quem pretende utilizar-se de clculos
tericos como mecanismo de apoio ao entendimento de as-
pectos relacionados estrutura eletrnica e molecular de sis-
Figura 8. Estrutura molecular para a formamida solvatada por temas qumicos.
trs molculas de gua. Os equipamentos podem ser desde um PC, at um cluster. O
custo para a construo do cluster de PCs, depende apenas do
nmero de unidades (cada uma em torno de R$ 2.000,00 e
Analisando-se os resultados da Tabela 2 observa-se que R$ 5.000,00, variando-se o tipo e quantidade de disco,
otimizao de geometria e freqncia usando-se mtodo HF processador e memria, placas de rede e de vdeo, ...) e da
tem taxa de paralelizao bastante alta da ordem de 93%, en- conexo destes processadores que pode ser feita por hubs ou
quanto otimizao com MP2 esta taxa fica abaixo de 50%. A switches, que so relativamente de baixo custo (de R$ 1.000,00
quantidade de memria influencia o desempenho de processa- e R$ 2.000,00 dependendo tambm do nmero de portas).
mento, pois comparando-se o ambiente Thin120 (120@MHz e Comparativamente aos custos de aquisio de estaes de traba-
512MB) com os 4 processadores PPro (200@MHz e 128MB) lho, os valores seriam dependentes de outros fatores, como mar-
observa-se que o primeiro tem um desempenho superior. Ou- ca (fabricante), modelo, suporte tcnico, sistema operacional, bi-
tras anlises podem ser feitas a partir da Tabela 2, como pro- bliotecas matemticas, compiladores, etc.
cessamento do tipo SPMD (mquinas com mais de 1 CPU) 14, As grandes vantagens de equipamentos como os apresenta-
tipo de interface de rede, memria cache, discos, etc. Verses dos neste manuscrito o de serem uma alternativa de baixo
mais novas de processadores, como AMD Athlon(tm) - custo e bom desempenho e propiciar a formao de recursos
700@MHz, apresentam desempenho prximo ao de 4 humanos em atividades outras, que no a de meros executores
processadores PPro 200@MHz. Embora, no se pretenda ana- de programas. E por desvantagem, se se considerar isto des-
lisar exclusivamente custos de PCs x Estaes de Trabalho, um vantagem, o da manuteno, instalao de pacotes, etc.
dado interessante refere-se disponibilidade das mquinas.
Testes envolvendo mquinas mais rpidas do CENAPAD/SP AGRADECIMENTOS
(como as denominadas por Thin160 e SILVER, ver Tabela 2)
no foram possveis de serem feitos, pois os Jobs submetidos O autor gostaria de agradecer ao Instituto de Qumica da
ficaram nas filas de submisso por vrios dias, inviabilizando- UNICAMP pelas facilidades computacionais e ao Conselho
se a anlise. Isto um dado interessante, pois com o cluster de Nacional de Desenvolvimento Cientfico (CNPq) pelo suporte
PCs tem-se uma maior exclusividade. financeiro. Um agradecimento especial aos Profs. Pedro
De um modo geral, a preocupao em fornecer informaes Vazquez e Rogrio Custdio do IQ-UNICAMP pelas informa-
tcnicas a respeito de processamento computacional para os es e discusses relacionadas a sistemas operacionais, redes e
qumicos tericos deve-se ao fato dos mesmos serem respon- programas de clculos tericos.
sveis por grande demanda de tempo de processamento. Para
se ter uma idia do que isto representa, o CENAPAD/SP tem REFERNCIAS
aproximadamente 180 usurios cadastrados atualmente, sendo
que os Qumicos representam 40% destes usurios e no entan- 1. Morgon, N. H.; Custdio, R.; Riveros, J. M.; Chem. Phys.
to, so responsveis por 80% do tempo de processamento Lett. 1995, 235, 436.
disponibilizado pelo Centro. Isto representa algo em torno de 2. Morgon, N. H.; Argenton, A. B.; Silva, M. L. P.; Riveros,
10 GFlop/s. J. M.; J. Amer. Chem. Soc. 1997, 119, 1708.
Por que a necessidade de tanta demanda computacional ? 3. Morgon, N. H.; Riveros, J. M.; J. Chem. Phys. A 1999,
Basicamente pela natureza dos clculos envolvidos. Consi- 102, 10399.
dere-se os seguintes aspectos bsicos nos exemplos ilustrativos 4. Morgon, N. H.; Xavier, L. A.; Riveros, J. M.; Int. J.
de clculos tericos: Mass Spectrom. 2000, 196, 363.
a) usando-se o mtodo Hartree-Fock-Roothaan (mtodo bas- 5. Frisch, M. J. et al. Gaussian/94 - Revision D.2,
tante utilizado na soluo aproximada da Equao de Gaussian Inc.Pittsburgh PA, 1994.
Schroedinger), tem-se a necessidade de clculo de um grande 6. Freitas, L. C. G.; Quim. Nova 1999, 22, 293.
nmero de integrais de 1 e 2 eltrons, oriundos de um grande 7. Mller, C.; Plesset, M. S.; Phys. Rev. 1934, 46, 618.
nmero de funes de base usadas na construo dos orbitais 8. Hohenberg, P.; Kohn, W.; Phys. Rev. 1964, 136, B864.
atmicos, combinados na formao dos orbitais moleculares. 9. Kohn, W.; Sham, L. J.; Phys. Rev. 1965, 140, A1133.
E, este nmero aumenta significativamente com o aumento do 10. Morgon, N. H.; Custdio, R.; Quim. Nova 1995, 18, 44.
nmero de tomos; 11. Clementi, E.; Int. J. Quantum Chem. 1992, 42, 547.
682 Morgon Quim. Nova

12. 5000 operaes de ponto flutuante por segundo, uma gran- 39. Turner, P. J. Xmgr: ACE/gr um pacote para plotar em
deza que mede a velocidade do processador em executar 2D em sistema X Window, que utiliza interface Motif,
qualquer operao que envolva nmeros fracionrios. http://plasma-gate.weizmann.ac.il/Xmgr.
13. McDaniel, G., Ed.; The IBM Dictionary of Computing; 40. Turner, P. J.; Stambulchik, E. Grace um conjunto de
McGraw-Hill: , Tenth ed.; 1993. ferramenta WYSIWYG para grficos 2D em sistema X
14. Morgon, N. H.; Quim. Nova 1995, 18, 481. Window com interface OSF/Motif. o sucessor do
15. 1 Tera = 1012. xmgr, http://plasma-gate.weizmann.ac.il/Grace.
16. TOP500: Site dos 500 sistemas computacionais de mai- 41. Schaftenaar, G. Molden - Programa para pr e ps pro-
or desempenho, http://www.top500.org. cessamento de estruturas moleculares e eletrnicas,
17. Benchmarks: Standard Performance Evaluation Corporation CAOS/CAMM Center, Holanda, http://www.caos.kun.nl/
- SPEC; centro para avaliao de desempenho schaft/molden.
computacional, http://www.specbench.org. 42. Sayle, R. Rasmol: programa para visualizao grfica
18. National Science Foundation, http://www.nsf.gov. molecular, http://www.umass.edu/microbio/rasmol.
19. Taubes, G.; Discover 1997, 18, 76. 43. Zucic, D. Garlic: programa de visualizao molecular,
20. Coelho, L. W.; Junqueira, G. M. A.; Herrera, J. O. M.; Ma- http://pref.etfos.hr/garlic.
chado, S. D.; Machado, B. D.; Quim. Nova 1999, 22, 396. 44. Gans, J. Qmol: programa para visualizao de estrutura
21. A Web of Science (WoS) uma base de dados produzida molecular e animao de trajetrias moleculares, http://
pelo Institute for Scientific Information (ISI), com informa- lancelot.bio.cornell.edu/jason/qmol.html.
es sobre artigos publicados, http://webofscience.fapesp.br. 45. Kokalj, A. XCrysDen: programa de visualizao de es-
22. ProBE (Programa Biblioteca Eletrnica da Fapesp) pro- trutura e densidade molecular e cristalina, http://www-
cura contribuir para o desenvolvimento da pesquisa, por k3.ijs.si/kokalj/xc/XCrySDen.html.
meio da aquisio de revistas eletrnicas com textos com- 46. Schmidt, M. W.; Baldridge, K. K.; Boatz, J. A.; Elbert, S.
pletos, http://www.probe.br. T.; Gordon, M. S.; Jensen, J. H.; Koseki, S.; Matsunaga, N.;
23. O Scientific Electronic Library Online - SciELO uma Nguyen, K. A.; Su, S. J.; Windus, T. L.; Dupuis, M.;
biblioteca eletrnica virtual que cobre uma coleo sele- Montgomery, J. A. GAMESS: programa ab initio de estru-
cionada de revistas cientficas brasileiras, http:// tura eletrnica, 1993 http://www.msg.ameslab.gov/
www.scielo.br. GAMESS/GAMESS.html.
24. Salus, P. A.; A quarter century of UNIX; Addison-Wesley 47. St-Amant, A. DeFT um software de mecnica quntica
Publishing Company, Inc.: New York, 1994. computacional, baseado na teoria do funcional de densi-
25. Hubbard, J. K. FreeBSD, um avanado sistema dade, http://www.chem.uottawa.ca/DeFT.html.
operacional BSD UNIX para computadores PC-compat- 48. Visscher, L.; Visser, O.; Aerts, P. J. C.; Merenga, H.;
veis, desenvolvido e mantido por um grande nmero de Nieuwpoort, W. C.; Comput. Phys. Commun. 1994, 81, http:/
colaboradores, http://www.freebsd.org. /theochem.chem.rug.nl/~broer/Molfdir/Molfdir.html.
26. Brandi, E. Um guia FreeBSD - Primeiros Passos pode 49. Refson, K. Moldy, um programa de simulao de din-
ser encontrado em: http://freebsd.ag.com.br/. mica molecular, bastante flexvel e til numa grande faixa
27. Torvalds, L. Linux um sistema operacional gratuito de clculos de simulao para sistemas atmicos, inicos e
baseado em Unix, originalmente criado por Linus moleculares, http://www.earth.ox.ac.uk/~keith/moldy.html.
Torvalds, http://www.linux.org. 50. Helgaker, T.; et. ali., Dalton, programa de qumica
28. Existem vrias verses de LINUX, como: Red Hat, quntica para clculo de propriedades moleculares com
Debian, S.u.S.E. e Slackware, algumas sendo comerciais. funes de onda SCF, MP2 ou MCSCF, http://
29. GNU project. Compiladores: fortran, C, C++, http:// www.kjemi.uio.no/software/dalton.
gcc.gnu.org/. 51. Saue, T.; Enevoldsen, T.; Helgaker, T.; Jensen, H. J. A.;
30. Lamport, L. LaTeX: conjunto de macros para TeX (siste- Laerdahl, J.; Thyssen, J.; Visscher, L. Dirac, programa
ma de preparao de documentos de alta qualidade, fre- de estrutura eletrnica completamente relativstico, http:/
qentemente usado pela comunidade cientfica e tcnica), /dirac.chem.sdu.dk.
http://www.latex-project.org. 52. Ponder, J. W. Tinker, conjunto de softwares para mode-
31. Editora Elsevier, http://www.elsevier.nl/homepage/ lagem molecular, http://dasher.wustl.edu/tinker.
authors. 53. Lindheim, J. The Beowulf Project at CACR, http://
32. The Journal of Chemical Physics, revista do Instituto Vazquez, P. A. M.; Morgon, N. H.; 17a Reunio Anual
Americano de Fsica, http://www.aip.org/pubservs/ da SBQ, Caxambu, MG, 1994.
compuscript.html. 54. Vazquez, P. A. M.; Morgon, N. H.; 17a Reunio Anual
33. Autor original: Supoj Sutanthavibul, xfig: construo da SBQ, Caxambu, MG, 1994.
iterativa de figuras sob X11, ftp://ftp.x.org/contrib/ 55. Tirado-Rives, J.; Jorgensen, W. L.; J. Comput. Chem.
applications/drawing_tools/xfig. 1996, 17, 1385.
34. Bradley, J. xv: visualizador iterativo de imagens para 56. Sterling, T.; Becker, D. The Beowulf Project, http://
sistema X Window, ftp.cis.upenn.edu. www.beowulf.org/.
35. Plass, J. gv: pr-visualizador de PostScript e PDF, http:/ 57. MPICH implementao portvel de bibliotecas MPI -
/wwwthep.physik.uni-mainz.de/~plass/gv. interface padro de message-passing, Argonne National
36. Drakos, N. LaTeX2HTML: tradutor de LaTeX para for- Laboratory, http://www-unix.mcs.anl.gov/mpi/mpich.
mato HTML, http://saftsack.fs.uni-bayreuth.de/~latex2ht. 58. PVM - Parallel Virtual Machine, pacote de software
37. Walters, P.; Stahl, M. Babel: conversor de formatos de para trocas de mensagens numa rede heterognea de
arquivos, http://www.eyesopen.com/babel.html. computadores, Oak Ridge National Laboratory, http://
38. Williams, T.; Kelley, C. GnuPLOT: programa iterativo www.epm.ornl.gov/pvm/.
para construo de grficos em 2D e superfcies, http:// 59. CENAPAD/SP - Centro Nacional de Processamento de Alto
www.gnuplot.org. Desempenho em So Paulo, http://www.cenapad.unicamp.br.

Вам также может понравиться