Вы находитесь на странице: 1из 48

Gerenciamento

Eletrônico
de Documentos GED

document imaging

www.laserfiche.com
Copyright © 2001 pela Compulink Management Center, Inc.
Todos os direitos reservados.

Laserfiche é uma marca registrada pela Compulink Management Center, Inc.


Todas as marcas mencionadas neste manual são de propriedade de sua respec-
tivas empresas. Nenhuma parte desta publicação poderá ser reproduzida, foto-
copiada, armazenada em algum sistema de pesquisa ou transmitido sem o con-
sentimento por escrito do publicador.

LaserFiche Document Imaging


Uma Divisão da Compulink Management Center, Inc.
3545 Long Beach Blvd.
Long Beach, CA 90807
USA

Gerenciamento de Documentos Eletrônicos


Publicado por LaserFiche
Primeira edição em Português Outubro de 2001
Impresso no Brasil.
Venda Proibida
Conteúdo
Introdução....................................................................................................................................................................... 1

O que é Gerenciamento de Documentos Eletrônicos - GED ........................................................ 2


Trazendo documentos ...................................................... 3
Arquivando documentos................................................... 5
Indexando documentos .................................................... 8
Recuperando documentos................................................ 10
Controlando acesso ........................................................... 11

Benefícios de Gerenciamento de Documentos Eletrônicos ............................................................ 12

Implementando Gerenciamento de Documentos Eletrônicos...................................................... 13


Avaliando suas necessidades ............................................ 13
Avançando de projeto piloto a solução empresarial... 13
Instalação .............................................................................. 13
Treinamento.......................................................................... 14
Assuntos Legais ................................................................... 15
Suporte e Manutenção ..................................................... 16

Características adicionais ....................................................................................................................................... 17


Facilidade de uso.................................................................. 17
Anotações .......................................................................... 17
Imprimir / Fax / e-mail........................................................ 17
Opções de procura usando texto.................................... 18
Internet/ Intranet................................................................. 19
Segurança............................................................................... 19
Portabilidade e CDs ........................................................... 20
Terceirização de Escanerização......................................... 21
Recuperação pós Desastre................................................ 22
Processamento em Lote..................................................... 22
Código de Barras................................................................. 22
Zona OCR ........................................................................... 23
Workflow .............................................................................. 23
Escalabilidade......................................................................... 24
Compatibilidade de Sistemas............................................. 24
Sistemas de Rede................................................................. 25
Arquitetura Cliente/Servidor............................................. 25
Formato de Arquivo Não Proprietários......................... 26
Conteúdo
Perguntas Mais Frequentes .................................................................................................................................. 27
Geral...................................................................................... 27
Escanerização / Importação / Armazenamento............ 28
Visualização / Impressão / Exportação........................... 31
OCR: Reconhecimento de Caracter Óptico................ 32
COLD: Computer Output to Laser Disc...................... 33

Glossário de Termos ................................................................................................................................................... 34

Sobre o Autor ................................................................................................................................................................. 43


Introdução
"Tenho feito buscas que poderiam provavelmente ocupar-me por três dias de trabalho em dez minutos.
Nossos arquivos são tesouros históricos, este é um dos motivos que nós usamos LaserFiche e pessoas utilizam
nossos documentos históricos para pesquisas. Nós queremos arquivar os materiais originais sem risco de
deteriorização."
Linda Butler, City Clerk
Flagstaff, AZ

Papel Documentos Eletrônicos devem:

Nós todos necessitamos dele para fazer nosso • Gerenciar milhares de registros e recuperar o
trabalho mas papel acumula-se rapidamente. que você necessita em segundos.
Nossos arquivos engordam rapidamente, • Fácil de utilizar, idenpendente se você é a pes
arquivos e sistemas de alimentação facilitam a soa que necessita do documento ou se você é
busca de documentos. Gerentes de registros o gerente de sistemas.
organizam, arquivam e recuperam nossa • Permitir que você compartilhe documentos
informação mas o montante de papel contin- com colegas enquanto protege informações
ua crescendo. Arquivos de papel são fre- confidenciais.
quentemente difíceis de encontrar • Permitir que você envie e-mails ou envie
faxes dos documentos com um clique do
Documentos podem não estar na pasta apro- mouse.
priada ou podem estar "emprestados" para • Prover um fácil acesso para compartilhar
alguém ou ainda perdidos na mesa de outra documentos com outros escritórios ou
pessoa. Estudos mostram que profissionais levando-os consigo.
frequentemente perdem até 500 horas por • Adaptar-se com a maneira que você trabalha
ano apenas procurando documentos. sem forçar mudanças.

Esses dias se foram. Gerenciamento Desde 1987, nós da LaserFiche temos dedicado
Eletrônico de Documentos oferecem uma horas incontáveis para construir o Sistema de
melhor maneira de gerenciar registros sem Gerenciamento Eletrônico de Documentos.
dependência.. Desenvolvido por experiência, nós criamos esse
guia para explicar o que Sistema de
Gerenciamento de Documentos Eletrônicos é, o
que encontrar nele e como fazer de armazena-
mento e recuperação de documentos um
processo simples e transparente.

1
O que é Gerenciador de
Documentos Eletrônicos?
GED é a conversão de documentos em papel Como a Internet explodiu em popularidade por
para imagens eletrônicas em seu computador. motivo do rápido acesso que provem às infor-
Uma vez em seu computador esses documentos mações armazenadas em web pages, sistemas
podem ser recuperados em segundos. Todas GED provem um imenso valor pelo seu rápido
organizações geram um enorme volume de acesso a informações armazenadas entre docu-
papéis e documentos eletrônicos. Nós temos mentos de organizações.
desenvolvido nosso próprio jeito de arquivar
documentos importantes. Todos sabem a frus- GED constroe pontos fortes em documentos de
tração de não ser capaz de encontrar um docu- papéis: Arquivos são escanerizados ou eletroni-
mento certo quando ele é muito necessário. camente convertidos e uma alta resolução de
Métodos tradicionais de arquivamento de papel fotografia é armazenada em um disco rígido ou
e registros eletrônicos requerem um grande óptico. Eletrônico “cartões de índices” podem
esforço para gerenciar, distribuir e encontrar anexar informações para um documento como
esses documentos. Proporcional ao número de autor, número de referência ou data de criação.
arquivos que cresce, o tempo e esforços Arquivos podem ainda ser visualizados, impres-
necessários para gerenciá-los também aumentam. sos, compartilhados e armazenados e as ima-
gens adicionam uma enorme vantagem ofer-
GED revoluciona o arquivamento de infor- encedo aos documentos um conteúdo ativo.
mação e provém meios de rapidamente recu-
perar e compartilhar todos documentos em seu Não mais apenas imprimir uma página, docu-
sistema. Todos os sistemas GED devem possuir mentos textos são “lidos” por tecnologia de
os seguintes cinco componentes básicos: reconhecimento de caracteres ópticos, Optical
Character Recognition (OCR). Um sistema
• Ferramentas de escanerizar para trazer os
deve permitir que você recupere arquivos
documentos para o sistema
procurando por qualquer palavra ou frase no
• Métodos de arquivamento e armazenamento texto, por localização de pastas ou por infor-
de documentos mações em “cartões de índice”. Quais docu-
• Ferramentas de recuperação para encontrar mentos podem ser acessados e lidos e quais
documentos ações e modificações pode-se executar nesses
documentos, depende do nível de segurança de
• Controle de acesso para prover documentos acesso o qual deve ser controlado pelo sistema
para pessoas autorizadas GED.

2
Selecionar o adequado sistema GED pode ser acelerando assim o processo de escaneamen-
uma tarefa excitante. Existem vários aspectos a to.Scannrs sem ADF são primariamente desig-
considerar para assegurar que adaptar-se-á às nados para imagens gráficas e requerem que
necessidades de sua organização. Seguem as cada página seja colocada manualmente, uma
descrições dos cinco componentes básicos em o por uma.
quê deve ser avaliado na escolha de seu sistema.

Trazendo os
Documentos
Scanner com ADF

Existem três métodos primários para trazer


arquivos de documentos para um sistema GED: Scaners podem suportar uma variedade de
tamanho de papéis, de cartões de visita à desen-
• Escanear arquivos de papel hos de engenharia. A maioria dos departamen-
• Conversão, criando arquivos de imagens inal tos apenas necessitam escanear documentos até
teráveis tamanho (8” x 14”). Para organizações ou
departamentos que utilizam blueprints, planos
• Importação, criando versões modificáveis de
e desenhos arquitetônicos, existem os scaners de
documentos eletrônicos
largo formato que suportam documentos e-
sized ( 34” x 44”). Em geral, quanto maior o
Escaneando tamanho de papel que o scanner pode suportar,
Escanear um documento produz uma imagem mais caro ele custa. Outras opções como colori-
que pode ser armazenada em um computador. dos ou escalas de cinza, utilizado para
Quando escolher um scanner, é importante fotografias, podem aumentar o preço do scanner.
considerar o total do orçamento e o tamanho e
volume de documentos a serem escanerizados. A velocidade do scanner é outro fator a consid-
A capacidade de utilizar uma grande variedade erar. Scanners para GED podem suportar de 10
de scanners é uma das características de um à 200 páginas por minuto. São disponíveis em
bom sistema de imagem. modo simples e/ou duplo. Scanner de modo
duplo (duplex) permitem que os dois lados do
Um scanner para sistemas GED deve possuir documento sejam escanerizados ao mesmo
ADF (Automatic Document Feeder), alimenta- tempo em uma única passada pelo scanner.
dor de documentos automático. Esse dispositi- Como as outras opções, alta velocidade de scan-
vo permite que uma pilha de papéis seja coloca- ners também aumentam o preço do scanner.
do na bandeja do scanner e automaticamente Algumas vezes é mais barato comprar dois scan-
alimentar o scanner página por página, ners de 20 páginas por minuto do que um scan-

3
ner de 40 páginas por minuto. Essa opção é umento. Essas imagens são usualmente
apenas compatível com sistemas GED que armazenadas com arquivo de qualidade TIFF
suportam múltiplas estações de escaneamento. (Taggeg Image File Format). O processo de con-
versão também gera um completo arquivo de
Se existe um enorme número de documentos a texto enquanto mantém o formato visual do
escanear, por exemplo, milhares de páginas, arquivo original. Esse arquivo de texto também
pode ser mais prático e econômico utilizar um pode ser usado para indexação de texto do doc-
serviço terceirizado de escaneamento. Para umento para auxiliar em pesquisas e recuper-
suportar essa opção, o sistema GED deve aco- ações futuras.
modar facilmente a sincronização entre as
páginas escanerizadas, o serviço terceirizado e Converter documentos eletrônicos desconges-
as páginas escanerizadas dentro da organiza- tiona o uso do scanner e economiza papel e
ção. O volume de dados que contém imagens e recursos de impressão além de produzir uma
informações de índice necessitam ser modu- imagem clara do que scannear documentos de
lares e facilmente portáteis. Isso assegura que os papel. Esse método é o melhor para arquivos
documentos escanerizados pelo serviço tercei- permanentes.
rizado podem ser incorporados no sistema “ao
vivo” sem interrupções de sistema e sem inter-
rupções e/ou reindexação do trabalho exis-
tente. Essa opção é frequentemente referida
como “volume portáteis” .

Se uma organização tem vários escritórios e


necessita compartilhar os documentos escaner-
Convertendo documentos em imagens
izados um por um, volumes portáteis tem a
capacidade e a maneira de facilmente distribuir
arquivos.
Importando
Importar também é conhecido EDM –
Conversão Eletronic Document Management, é o segundo
melhor método para trazer documentos
Converter documentos é um processo de trans- eletrônicos como documentos do Office, gráfi-
formar documentos do processador de textos cos, clips de audio ou filmes para um sistema
ou planilhas eletrônicas para um permanente GED. Arquivos podem ser clicados e arrastados
formato de imagem para ser armazenado com para um sistemas GED mas são modificáveis e
um sistema de imagem. Aplicações Windows mantém seu formato nativo. Esses arquivos
como Microsoft Word, Excel ou Autodesk podem ser visualizados no seu formato original
AutocadCAD podem “imprimir” arquivos sendo inicializados pela aplicação original ou
existêntes em uma imagem inalterável do doc- utilizando pelo próprio sistema GED .

4
to não proprietáriodo. A indústria de informáti-
ca avança mais rapidamente do que armazenar
imagens de documentos ou arquivos de textos,
um formato proprietário pode deixar uma
organização refém das aplicações proprietárias
em capricho a uma única empresa.

Nesse momento, existem cinco opções


primárias de armazenamento;
• Mídia magnética (Discos Rígidos)
• Armazenamento Óptico-magnético
Importando arquivos
• Discos compactos
• DVDs
• WORM
Arquivando documentos
As vantagens e desvantagens de cada uma são
Uma vez que os documentos foram trazidos descritas a seguir.
para o sistema, eles devem ser arquivados.
Sistemas GED devem incluir mudanças tec-
nológicas, aumento de volumes de documentos Mídias Magnéticas (Discos Rígidos)
e testes de tempo. A necessidade e orçamento A cada vez mais aumentam a velocidade de
para armazenamento de imagens são melhores resposta ao acesso na recuperação de documen-
determinadas por organizações individuais tos e uma grande redução do preço fazem que
envolvidas. as mídias magnéticas, tanto como os discos rígi-
dos isolados ou um sistema RAID (Redundant
Um bom sistema GED deve ser capaz de utilizar Array of Independent Disks) são uma escolha
qualquer dispositivo de armazenamento atual- popular.
mente disponível, e os que estarão sendo lança-
dos futuramente, para manter uma longa Sistemas RAID significam o agrupamento de
duração para armazenamento de documentos. vários discos rígidos de mesmo tamanho e
Isso permite que você selecione o equipamento modelo configurados para que apareçam como
que melhor adaptar-se com sua necessidade, um único disco no armazenamento de grandes
tanto agora como no futuro. volumes. Esse sistema protege dados contra per-
Para assegurar a habilidade de leitura no futuro, das provendo redundância de dados entre os
se um sistema GED não é utilizado para arqui- discos e tolerante a falhas de hardware contra os
vo digital, os arquivos devem ser em um forma- possíveis problemas em discos. Esses disposi-

5
tivos não possuem um custo alto e podem ser
agrupados para armazenar grandes volumes de
documentos e prover um rápido acesso.

A desvantagem dessa opção é que enquanto não


são caros ainda possuem a possibilidade de con-
ter problemas de hardware como falhas mecâni-
cas. Arquivos de dados também são facilmente
deletados, então operações de backup desses Disquete Óptico Magnético
dados é fator muito importante para assegurar
os dados pois podem ser restaurados.
OM drivers incluem conveniência, custo
modesto e confiabilidade. Arquivos de dados
Armazenamento Óptico podem ser completamente apagados. Com a
baixa do custo dos discos rígidos , a populari-
Magnético
dade dos OM cairam. Os discos OM podem
Anos anos atrás , as mídias Ópticas Magnéticas serem instalados em jukeboxes que suportam
(OM) como disquetes e discos foram uma centenas de discos.
solução popular para fazer backup de arquivos
pessoais de um computador. Como o termo diz
por si só, um dispositivo OM utiliza tecnologias Discos Compactos
tanto óptica como magnética que obtém ultra e
alta densidade. Um típico OM é um pouco São pequenos discos plásticos usados para
maior que o convencional disquete de 3.5’’ que armazenar informações digitalmente.
podem armazenar até 1.44 Mb de dados, um Desenvolvidos inicialmente para sistemas de
OM pode armazenar até 100Mb até alguns giga- audio e como uma alternativa para registros
bytes (Gb). fonográficos , CDs são atualmente também uti-
lizados para armazenar dados de sistemas
Um sistema OM arquiva os dados em alta den- provenientes de computadores. Informações
sidade utilizando laser e combinação entre digitais são gravadas no CD codificando como
leitura e gravação magnética. Ambos, laser e uma série de microscópicos pontos na superfí-
magnético são utilizados para adicionar os cie reflexiva do alunínio do disco. O disco é
dados no disquete. O laser aquece a superfície coberto com um plástico transparente que é
do disquete e então pode ser facilmente magne- executado em um equipamento que utiliza uma
tizado. Dados podem ser deletados e/ou sobre- interface laser para ler as estampas dos pontos
gravados sem limite de vezes, como um conven- na área de superfície dos discos. Os CDs não
cional disquete de 3.5’’. têm a habilidade de gravar no processo de exe-
cução quando acessados. Formatos padrões de
CDs incluem CD-ROM (Compact Disc-Read

6
Only Memory), um CD gravável, CD (CD computadores e informações em negócios com
Recordable) que permite a gravação uma única um único sinal. Irão substituir os CDs, fitas de
vez e ainda CD-RW (CD Rewritable) que per- videos e talvez os cartuchos de jogos.
mitem várias gravações em um mesmo CD.
CDs oferecem um seguro e confiável meio que DVDs têm a capacidade de arquivar mais dados
provém um termo longo de armazenamento de do que o espaço físico em um CD. Como um
imagens, em alguns casos até 100 anos. CDs uti- CD ou DVD, permite acesso randômico em
lizam especificações ISO-9600 que significa que qualquer parte do disco sem a necessidade de
os dados podem ser lidos em várias plataformas passar para a frente ou para trás como uma fita
de computadores como por exemplo PCs, . Como um OM , um DVD nunca encosta a
MACs.... midia no momento do acesso, no caso de músi-
A desvantagem básica dessa solução é o limite ca é tocada por um feixe de raio laser, sendo
de armazenamento é a capacidade do CD e assim não produzem arranhos ou gastos na
podem ser acessados pelos dispositivos de CD- midia se você persistir acessando o mesmo
Roms, Torres de CD e jukeboxes até 500 discos dado. A superfície plástica é sensível a toque de
fazendo disso um método conveniente para dedos , poeira e sujeira. Cuide deles com os
armazenamento de grandes números de docu- mesmos cuidados dos CDs mas sem tratamen-
mentos. tos especiais. Isso significa que DVDs podem ser
executados milhões de vezes e continuam a rep-
resentar a melhor opção de longa duração para
um seguro armazenamento de documentos
GED.

As desvantagens dessa opção são os altos custos


e o diferente padrão entre unidades de DVDs e
unidades de CD-ROMs como no caso dos
videos VHS e Beta , diferentes empresas estão
usando diferentes formatos para gravar DVDs.
Torre de disco compacto

DVDs
DVD significa Digital Video Disc ou Digital
Versatile Disc que é a próxima geração de te-
cnologia de armazenamento em discos ópticos.
É essencialmente maior, mais rápido e podem
armazenar maiores volumes de informações
que os CDs e ainda capacidade para vídeo e
Discos Digitais
audio. DVD apontam para diversão e lazer,

7
WORM Indexando Documentos
WORM significa , Write Once Read Many , ou seja,
Grave uma vez e leia várias. É uma tecnologia de Quando documentos em papéis são recebidos
disco óptico que permite que grave dados em em um escritório, eles devem ser organizados
um disco apenas uma vez. Os dados são perma- para serem utilizados. Eles são normalmente
nentes e podem ser lidos inúmeras vezes. Esse etiquetados, organizados, indexados, grampea-
formato de mídia requer um especial dispositi- dos e localizados em pastas em armários. Sem
vo de hardware e software para executá-lo. esses passos nada poderia ser encontrado em
Diferente dos CD-ROMS eles apenas podem ser um local de trabalho. Documentos eletrônicos
lidos em drivers compatíveis. Não existe muita não são diferentes. Um sistema GED deve
aceitação, embora tenham encontrado um prover diferentes métodos de organizar as infor-
pequeno mercado de arquivo de mídia. Por mações para um uso futuro. Não importando
motivo de um limitado número de empresas qual o tipo de combinação de metodologia de
que provém, materiais e suporte para tecnologia indexação é utilizada, necessita ser fácil de usar
WORM não é altamente recomendado. e de fácil entendimento por pessoas que recu-
peram os documentos bem como por aqueles
que armazenam os mesmos.

Existem várias idéias de como introduzir a


metodologia para adicionar os documentos no
sistema GED. Em geral quanto mais um sistema
GED puder adaptar-se no sistema atual da
empresa, menor será as mudanças internas e a
necessidade de treinos.

Existem três maneiras primárias para organizar


documentos em sistemas GED:
Disquete WORM • Arquivos de índices
• Indexação de texto
• Estrutura de pastas

8
Arquivos de índices idiomas é requerido, um sistema GED deverá
suportar OCR e indexação em texto nos mes-
Indexando documentos utilizando campos e
mos idiomas em questão.
palavras-chaves é um método tradicional uti-
lizado com papel que traduz muito bem aos sis-
Para previnir trabalho extra , um bom sistema
temas eletrônicos. Um sistema GED deve per-
GED deve permitir o OCR e indexação de texto
mitir usuários a customizar modelos de índices,
automático sem requerer envolvimento
criar vários modelos e ter diferentes tipos de
humano
índices de dados com cada um desses modelos
como data e caracteres numéricos e alfabéticos.
Campos de indexação podem ser usados para
criar categorias de documentos, rastrear data de Estrutura de pastas
criação e/ou retenção , descrição do documento Com campos indexados e texto completo inde-
entre usuários. Em adição um sistema GED xado, um sistema GED deve prover um método
deve permitir características de caixas de opções visual para localizar documentos. Na maioria
para acelerar a entrada de dados nos campos e dos escritórios, arquivos são localizados procu-
ter ferramentas disponíveis para auxiliar a rando por pastas ou em gavetas específicas. Um
entrada automática de dados nos índices de sistema GED deve ter a habilidade de eletroni-
informação.. camente recriar esse sistema através de vários
níveis de pastas

Indexação de textos – Full-text A flexibilidade da estrutura de pastas facilita o


Provendo indexação de texto, sistemas GED preenchimento dos documentos eletrônicos e
eliminam o tempo necessário para pessoas faz do sistema de GED mais eficiente.
qualificadas ler e manualmente indexar docu-
mentos usando palavras-chaves. Para fazer isso,
o software deve ter a capacidade de executar
OCR, Optical Character Recognition . Esse
processo “lê” uma página escanerizada e então
indexa cada palavra. Isso reduz dramaticamente
os custos de indexação enquanto provém
capacidades de pesquisa. Com as indexações de
texto completo você pode localizar os docu-
mentos utilizando qualquer palavra mesmo
quando a(s) palavra(s) não estão contidas em
um índice de palavras.
Tipicamente , quando um computador utiliza
OCR, o documento utiliza como padrão o Exemplo de estrutura de pasta/arquivo
idioma Inglês. Se a utilização de diferentes

9
Recuperando Como isso, utilizar um nome de documento e
pastas para localizar e encontrar um documen-
Documentos to pode auxiliar e ser intuitivo mas nem sempre
é o melhor método. As vezes uma pessoa irá
Recuperação de documentos é onde um potente saber exatamente quais documentos ela necessi-
sistema de indexação é pago. Usuários necessi- ta, mas não em que pasta eles estão e/ou o nome
tam utilizar ferramentas para encontrar docu- do documento.
mentos entre sistemas baseados no que eles
conhecem. Em alguns casos, isso significa Utilizando as informações de campos de index-
procurando através de pastas, em outros casos ação para encontrar um documento em parti-
isso pode significar conduzir buscas em campos cular pode ser útil. Um sistema com caracterís-
de indexação. Se tudo que se sabe sobre o docu- ticas completas irá possuir campos de modelos
mento que se quer buscar é uma palavra que ele definidos pelo usuário. Campos de indexação
contém, uma indexação de texto completa irá para encontrar um específico documento pode
auxiliar a encontrar esse arquivo relevante. ser útil. Campos de indexação permitem
Entretanto, o método de recuperação deve ser usuários a combinar milhões de registros em
simples e de fácil utilização. segundos para encontrar seus documentos.
Claro que uma pessoa necessitará conhecer
Usuários que são familiarizados com documen- como o documento foi categorizado e a que
tos textos devem ser capaz de utilizar as infor- campos de modelo foram associados a ele.
mações para encontrar o que eles necessitam.
Alguns sistemas podem apenas encontrar pági- Para maximizar a eficácia da busca, um sistema
nas baseadas em palavras chaves. Esse método de busca inteligente deve ser capaz de combinar
não é sempre o melhor porque a pessoa que buscas pelos modelos com textos completos
seleciona as palavras chaves não necessaria- com os nomes dos documentos e a localização
mente é a mesma pessoa que faz a busca. Para nas pastas. Um bom sistema GED faz a recuperação
ser totalmente útil , um sistema GED deve uti- de documentos relevantes rápida, fácil e eficiente.
lizar recuperação de texto completo.

10
Controlando Acesso CDs , notebooks e/ou documentos via e-mail.
Sistemas GED sem essa flexibilidade limitam as
O componente final e obrigatório de um sis- habilidades para o usuário.
tema GED é o controle de acesso. Em muitos
ambientes de computadores, diferentes pessoas Em adição, compartilhar documentos através
utilizam diferentes tipos de computadores em da Internet e Intranet permitem aos admi-
diferentes localidades para buscar informações. nistradores de sistema a desenvolverem um sis-
Um sistema GED completo deve prover a esses tema GED através da rede corporativa e/ou para
diferentes usuários apropriados níveis de acesso, o público. Usuários devem ser capazes de bus-
sem compromoter confidencialidade e/ou segu- car, recuperar e visualizar documentos com um
rança. Para fazer isso, um sistema deve possuir Web Browser. Documentos acessados pelo
duas características fundamentais: browser remove as limitações de localizações e
de plataformas de computadores como
• Ampla disponibilidade
(Windows, Macintosh , Unix , etc)
• Segurança adequada
Segurança Adequada
Ampla disponibilidade As organizações utilizam sistemas GED para
Um sistema GED deve oferecer diferentes cam- arquivar uma enorme variedade de documen-
inhos para acessar arquivos. Um amplo nível de tos, tanto público como privados, um sistema
acesso economiza recursos financeiros, capital de controle de acesso necessita estar presente.
intelectual e sistema de rede. O método mais Um adequado sistema de seguranca deve per-
comum de acessar é pelo computador do mitir ao administrador do sistema controlar em
usuário. Todo sistema GED deve prover uma que pastas e documentos os usuários podem
interface cliente-servidor que permita escane- visualizar, que ações podem executar nesses
rização, indexação e recuperação de documen- documentos (editar, copiar, deletar, etc). Esse
tos. Sem essa interface básica, o sistema não sistema deve controlar acesso as pastas, docu-
pode funcionar. mentos e até imagens com tarjas e textos de uma
maneira simples. A habilidade de desenvolver
Para prover ampla disponibilidade e flexibili- GED para uma grande variedade de usuários
dade de acesso, sistemas GED hoje em dia requer um robusto sistema de segurança combi-
devem combinar as necessidades dos escritórios nado com a interface do usuário.
com suas diversas utilidades e lotações remotas.
Sistemas GED não são mais um processo dentro Um bom sistema de acesso irá fazer um sistema
do escritório. Muitos usuários requerem porta- GED disponível para todas as pessoas auto-
bilidade para trocar documentos com outros rizadas tanto em um escritório como em uma
colegas e com outros escritórios em outra loca- localidade remota pela web, tudo sem compro-
lidade. Isso é frequentemente feito através de meter a segurança do sistema.

11
Benefícios de Gerenciamento de
Documentos Eletrônicos
Milhões de organizações ao redor do mundo sistemas GED, auxilia a proteger documentos
utilizam GED todos os dias ao invés de sistemas em papel de serem sobre carregados e mantém
de papéis. GED oferece um número de benefí- os documentos em um formato não proprietário.
cios sob papel e microfilmes • Compartilhe arquivos facilmente –
sistemas de GED fazem o compartilhamento
• Recuperação Rápida – permite que você de documentos facilitado entre colegas de
encontre documentos rapidamente sem trabalho e cliente pela mesma rede de
deixar a sua mesa de trabalho. Papel e micro- computadores, por um CD ou pela WEB.
filme são lentos porque usuários devem ir até Documentos de papel normalmente
os arquivos e acessá-los manualmente. requerem uma fotocópia para serem
• Indexação Flexível – pode indexar docu- compartilhados e microfilmes requerem
mentos em várias diferentes maneiras simul- conversões para papéis.
taneamente. Indexar papel e microfilme em • Melhora de Segurança – GED pode
mais de uma maneira é inoportuno, caro e prover melhor e mais flexibilidade de controle
consome tempo. sobre documentos. Controles de segurança
• Busca em texto- full text – GED podem nas
recuperar arquivos por qualquer palavra no pastas, documento individual, nível de
documento , recurso impossível com papel e palavras e/ou para diferentes grupos ou
microfilme. indivíduos. Em contraste, todos documentos
de papéis arquivados em um armário
• Sem perda de arquivos – documentos
possuem o mesmo nível de segurança.
escanerizados mantém-se nas suas pastas
quando são visualizados, nenhum é perdido • Economize Espaço – GED irá ajudar a
ou não localizado. Ainda mais , modelos de recuperar valioso espaço físico no escritório
índice e buscas no texto completo podem tirando as pilhas de papéis.
localizar documentos se eles foram acidental- • Recuperação de desastres – GED provém
mente movimentados. Perdas de documentos um fácil caminho para fazer um backup dos
são caras e consomem tempo para repor. documentos que podem ser localizados fora
• Arquivo Digital – O risco de perda ou do escritório. Papéis são caros e é uma cara
danificação de papel para documento maneira de fazer cópia de documentos
eletrônico e reduzido com um sistema GED. também sendo vulneráveis a incêndios,
Mantendo as versões de arquivos em enchentes e roubos.

12
Implementando Gerenciamento
de Documentos Eletrônicos
Avaliando suas Avançando de Projeto
necessidades Piloto a Solução
Quando decidir para um sistema GED, existe um Empresarial
número de questões a considerar.
Muitas vezes, escritórios encontram a melhor
• Quantos documentos devem ser armazenados, maneira de iniciar um projeto piloto envolvendo
considerando tanto o número de documentos um ou mais departamentos antes de expandir o
existentes como os documentos adicionados sistema por toda a empresa. Muitas empresas
manualmente? Essa informação determina iniciam com Departamentos de Documentação
quanto espaço de armazenamento é necessário, mas GED pode ser implementado em qualquer
a configuração de hardware e o custo do sistema. departamento que seja necessário. Projetos pilo-
• Quantos usuários irão utilizar o sistema ao tos permitem as organizações desenvolver com-
mesmo tempo? Isso determina os custos de pletamente e testar os procedimentos de ima-
softwares preliminares e o tamanho do servidor. gens antes de compromoter-se com uma solução
empresarial.
• Quais departamentos irão utilizar o sistema e o
que o público terá acesso? Isso determina quais
características de especificação e níveis de Instalação
segurança que serão necessários O primeiro passo de uma instalação deve ser a
• Quais os problemas sérios devem absolutamente inspeção do local pelo revendendor do software
ser resolvidos, e quais ítens devem serem para determinar o equipamento necessário e os
encaminhados para especificar características e problemas de conectividade de redes. Instalar
níveis de segurança necessários hardware envolve em desempacotar, conectar e
configurar todos os componentes como insta-
• Você necessita de uma solução padrão ou
lando os sistemas operacionais e drivers. Isso
customizada? Isso determina o número de
também inclue testar os equipamentos para
consultores, instalações, treinos, configurações e
assegurar a funcionalidade adequada do hard-
suporte que serão necessários.
ware e as conectividades de rede.
• Que tipo de rede esta sendo atualmente Depois de testar hardware, a instalação de soft-
utilizada, NT, NLM, LAN ou outras, irá ware consiste em instalar o sistema GED no
manter-se? Isso determina restrições, servidor e nas estações clientes e testar.
configurações de sistemas e atualizações de Geralmente o revendedor irá executar essas
estações de trabalho. atividades.
13
Treinamento eletrônico. Os gerentes de atividades como
registros de documentos necessitam entender a
Programa de treinamento deve direcionar dife- diferença nessa atividade entre papel e eletrôni-
rentes níveis de usuários e diferentes preocu- co , decisões de retenções de tempos, armazena-
pações. mento e metodologias de trabalho devem ser
definidas antes de iniciar o trabalho. A duração
do treinamento depende da complexidade do
Usuário Final
sistema.
Isso envolve ensinar usuários finais os mecanis-
mos do sistema. Esse treino deve ser no local de Operação Prática Supervisionada
trabalho. Cada grupo de usuários devem rece-
ber instruções necessárias para assegurar con- Isso envolve a supervisão do escritório utilizan-
forto com o novo sistema GED. O tempo de do personalizadamente. Isso permite aumentar
treinamento necessário irá depender do nível o conforto com o sistema e a fazer as perguntas
dos usuários em utilizar aplicações Windows, o diretamente ao técnico. Essa forma de treino é
sistema GED facilita o uso das nova mudanças um excelente caminho de fazer as pessoas con-
para procedimentos existentes fornecendo uma fortáveis com o novo sistema.
operação amigável e poucas mudanças nos pro-
cedimentos. A maioria dos usuários aprendem
muito rápido. É aconselhado classes com até 10
usuários e que os participantes não sejam inter-
rompidos.

Administração do Sistema
Para assegurar que o sistema GED funciona
tranquilamente é importante treinar alguns
indivíduos como adminstrar o sistema. O
treinamento no próprio ambiente de trabalho é
o mais recomendado porque aumenta a fami-
liaridade com detalhes específicos do sistema
GED.

Implementação de Consultoria
Esse envolve aqueles que são responsáveis por
gerenciamento de registros e documentos que
desenvolvem estratégias para traduzir os docu-
mentos existêntes em papel para sistema

14
Assuntos Legais • O sistema possui confiáveis controles para
prever e detectar deteriorização de registros
Como sistemas GED são triviais hoje em dia, • Existir um sistema de indexação que permite
várias leis reconhecem valor em arquivos de localizar registros
documentos eletrônicos. Muitas agências de
governo, afirmam que documentos originários • Permite imprimir os documentos
de papéis podem ser destruídos uma vez que: • O sistema deve permitir regerências cruzadas
entre outros sistemas de registros.
• Registros devem ser arquivados em um
formato que não permite alteração como CD, • O sistema deve possuir documentação
DVD ou WORM explicativa de como o produto funciona e
como pode ser configurado.
• O sistema tenha controles sensatos para
assegurar integridade, precisão e confiabili- A legalidade dos sistemas de GED variam de
dade. cada agência federal, estado, país e departamen-
• O sistema deve prover algum tipo de to envolvido. Organizações devem consultar
auditoria para detectar criações , adições , advogados para especificar os estatutos de go-
deleções de registros. verno para sua área.
• Uma completa e precisa transferência de
arquivos pode ser feita.

15
Suporte pode incluir qualquer uma das
Suporte e Manutenção seguintes:
• Atualização de softwares
Como manter um carro funcionando tranqui-
lamente, sistemas GED requerem suporte exter- • Linha telefônica “Hotline”
no. Revendas devem oferecer diversos tipos e • Acesso remoto via dial-up no seu sistema
níveis de suporte de atualizações de softwares a
manutenções em clientes. Vários fatores afetam • Software patches disponíveis via FTP
o nível de suporte que a organização necessita: • Boletins técnicos regularmente publicados
• Tamanho do sistema comprado • Visitas de manutenções em clientes
• Quantidade do sistema em uso • Adicional e avançadas sessões de treinos
• Sistemas de missões críticas que devem ser • Suporte de hardware
operacionais 24 horas por dia em 7 dias da
semana Quando comprar hardware como servidores,
• Pessoa certificada com um nível de dispositivos de armazenamento e estações de
experiência em sistema GED trabalho, empresas devem escolher revendas
com boa reputação para serviço e suporte.
• Acesso a Internet Enquanto o custo inicial pode ser mais alto, os
• Mudanças na rede e/ou infraestrutura da benefícios incluem menos tempo com equipa-
organização mentos sem uso por problemas e maior con-
sistência na precisão de sua funcionalidade.
• Mudanças entre pessoas

16
Características Adicionais
Sistemas GED devem prover o básico em • Adicionar tarjas (preto e/ou branco) nas
escanerização, recuperação e visualização. imagens e preservar a integridade do
Embora um sistema GED seja designado para documento original
vários usuários e/ou muitos documentos terão • Adicionar imagens como “confidencial”,
necessidades mais rigorosas. Essa sessão discute “importante” , “enviado via fax” nos
esses requerimentos e várias maneiras de abor- documentos denotando aprovação ou
dá-los. rejeição
• Adicionar notas que contenham comentários
adicionais.
Facilidade de uso
Uma das mais importantes características de Todas anotações devem ser sobre-postas e não
sucesso de um sistema GED é a facilidade de podem mudar a imagem original. Deste modo,
uso. Um sistema apenas será utilizado se a um documento pode ser impresso com ou sem
inclusão de documentos for fácil e simples. Os as anotações. E mais importante ainda, de um
melhores sistemas são flexíveis, possui interface ponto de vista legal, um documento arquivado
gráfica intuitiva e adapta-se com a maneira que em um sisteama GED pode oferecer frequente-
as pessoas já trabalham . mente cópias atualizadas dos documentos sem
alterar sua forma original.

Anotações Imprimir/ Fax / E-mail


Anotações provém informações adicionais
sobre um documento sem alterar sua imagem Sistemas de GED devem prover caminhos para
original. Registros de papéis são geralmente obter informação do sistema. Imprimir, enviar
anotados selecionando , adicionando men- faxes e e-mails são algumas maneiras de fazer
sagens, tarjas ou notas e registros de imagens isso. Para maximizar sua utilização, sistemas
podem suportar essas anotações. A segurança GED devem suportar as mais comuns impres-
de um sistema GED deve controlar quem pode soras e faxes e ainda serem capazes de imprimir
visualizar anotações como seleções, notas e imagens, textos e anotações.
quem pode ler através das tarjas.
Com o crescimento em popularidade da
As anotações típicas de um sistema GED Internet, mais pessoas usam e-mail para se
incluem: comumicarem e enviarem informação.
Organizações terão uma grande economia se
• Selecionar imagens e textos em várias cores e transmitirem seus documentos via e-mail ao
enfatizar palavras e sessões
17
invés de fax ou serviços de correio. Sistemas Wildcards
GED deveriam ter uma opção que permitisse
Wildcards são caracteres, como * (asterisco) e ?
facilmente o envio de imagens para qualquer
(interrogação), que podem ser usados em um
sistema de correio eletrônico compatível com
texto completo ou no índice de busca de
MAPI (Mail Application Program Interface), e
palavras-chave para compensar por erros de
que fosse lido por quem não possui GED.
escrita, ou quando a escrita é incerta. O aste-
risco representa qualquer caracter ou caracteres,
enquanto que a interrogação representa um
único caracter. Por exemplo, procurando por
Opções De Procura “b*m”, você acharia as palavras “bem”, “bom”,
“bombom”. Procurando por “b?m” apenas
Usando Texto encontrará as palavras “bem”e “bom”.
Para maximizar a eficácia da procura de texto,
existem várias opções de ajuda. Essas opções Operadores Booleanos
consideram possíveis erros de OCR, oferecem
Quando uma busca de texto for realizada, nor-
ferramentas para restringir a busca, provê linhas
malmente vários documentos irão correspon-
de contexto para as palavras procuradas, e facili-
der aos critérios de busca. Os operadores
tam a busca da palavra quando o documento é
booleanos (E, OU, e NÃO) ajudam a ajustar a
visto.
busca e reduzem o número de documentos não
relacionados. Por exemplo, para encontrar do-
Lógica “Fuzzy” cumentos relacionados ao Ministério da
A procura de um texto assume que as palavras Educação, a busca seria “Ministério E
procuradas foram escritas corretamente e o Educação”.
OCR está correto. Infelizmente, as pessoas
erram na escrita e não existe um pacote de OCR Buscas por Aproximação
100% perfeito. A lógica “Fuzzy” compensa esses
erros através da procura de variações na forma Buscas por aproximação podem ser usadas para
como a palavra é escrita. Um sistema GED deve limitar os resultdos da busca. São utilizadas para
permitir que o usuário controle a quantidade de encontrar palavras que ocorrem dentro de um
“fuzzines” da busca através da escolha do certo número de palavras, sentenças ou pará-
número de letras que podem estar erradas na grafos. Por exemplo, para achar documentos
palavra ou qual o percentual uma palavra pode relacionados a processos contra tabaco, mas não
estar errada. Por exemplo, uma busca utilizando sobre plantação de tabaco ou processamento de
a lógica “fuzzy” da palavra “caneta” poderia tabaco, usuários poderiam procurar por “taba-
achar a palavra “caneta”, “careta”, “gaveta”. co” dentro de uma sentença que tenha “proces-
sos”.

18
Linhas de Contexto Segurança
Até buscas específicas geralmente resultam em A segurança de um sistema de GED é um ponto
vários documentos possíveis. Além de prover crítico para uma implementação de sucesso.
usuários com uma lista de documentos que Enquanto que segurança pode não ser a
atendem aos critérios de busca, algums sistemas primeira preocupação para uma instalação
GED apresentam linhas de contexto que departamental, ela se torna mais importante à
mostram como cada ocorrência da palavra é medida que o sistema se expande e permite o
usada em cada documento encontrado. As li- acesso a diferentes departamentos e acesso
nhas de contexto permitem ao usuário encon- público aos arquivos. Um GED deve prover
trar o documento apropriado sem a necessidade segurança em vários níveis, permitindo que
de ver todos os documentos na lista de resultados. cada instalação utilize o método que melhor se
adaptar às suas necessidades. A segurança do
Highlight de palavras encontradas sistema deve ser capaz de realizar esse nível de
segurança e ser simples de administrar.
Uma vez que o documento foi selecionado, as
palavras de busca precisam ser localizadas den-
tro dele. Para ajudar esse encontro, alguns sis- Direitos de Acesso
temas de GED mostram a página apropriada do Um sistema GED deve permitir que organiza-
documento e ressaltam a palavra de busca no ções controlem o acesso às pastas e documentos
texto e em imagens. Dessa forma fica fácil para individuais, tanto no nível de grupo quanto
o usuário encontrar imediatamente a parte do individual. A utilização de grupos e direitos
documento que o interessa e ampliá-la, ao invés adquiridos permite aos administradores rapida-
de ter que procurar pelo documento inteiro. mente assinalar privilégios de leitura, enquanto
que a segurança a nível de usuário permite que
usuários específicos como gerentes vejam docu-
Internet/Intranet mentos que o resto do grupo não vê. Por exem-
plo, o departamento de Polícia pode ter acesso
Um GED deve ser capaz de prover uma forma
aos próprios arquivos e aos do de
simples the publicar informações na Internet ou
Planejamento, mas o departamento de
Intranet. Isso permite que organizações com-
Planejamento pode apenas ver os próprios
partilhem informações com outros departa-
arquivos.
mentos, escritórios remotos, clientes ou para o
público. Sistemas na WEB devem ser totalmente
aptos à buscas de palavras e também suportar Direito a Funções
protocolos de segurança como sistemas de rede. Um sistema GED deve também permitir que a
Idealmente, um sistema GED não requer organização controle o direito às funções em
HTML ou códigos complexos para publicação relação às pastas e documentos individuais, em
de páginas na WEB. ambos os grupos e a nível individual. Enquanto

19
que direitos de acesso controlam quais pastas ou quer lugar, de tal forma que possam ler os do-
documentos um usuário pode ver, direito a cumentos em um outro computador.
funções controla as ações que o usuário pode
exercer em um documento, tais como adicionar, Quando as pessoas viajam a negócios, fre-
editar, copiar ou apagar arquivos. Por exemplo, quentemente é necessário trazer os documentos
enquanto departamentos diferentes podem ter nas viagens. Carregar vários documentos em
privilégios de leitura de minutas da Prefeitura, papel é praticamente impossível, e assim infor-
apenas os funcionários da prefeitura podem mações importantes são deixadas para trás.
modificar esses arquivos. Com um sistema que suporta volumes
portáveis, documentos podem ser copiados
Tarjamento de texto para outros locais. Pastas contendo documentos
relevantes podem ser transferidas para outros
O tarjamento de texto (em preto ou branco) bancos de dados rápida e facilmente utilizando
permite que a segurança seja controlada a nível CDs que permitem a procura de documentos, e
de palavras. Um sistema GED deve oferecer a podem armazenar até 12.000 páginas cada.
habilidade de bloquear imagens ou textos. A
habilidade do usuário de ver textos bloqueados
irá depender do seu acesso de sergurança. Por
exemplo, relatórios de crime podem estar
disponíveis para múltiplos departamentos, mas
apenas o departamento de polícia é capaz de ver
informações de identificação como nomes.

Auditoria
Como um nível adicional de segurança, um sis- Discos Ópticos pesam muito menos
tema GED deve oferecer a habilidade de rastrear que arquivos em papel.
quem está usando o sistema, quais documentos
estão sendo lidos, quais ações estão sendo apli- Se um sistema GED não fornecer esse tipo de
cadas aos documentos, e quando essas ações portabilidade, usuários desse sistema vão achar
aconteceram. A habilidade de auditoria é espe- difícil trazer seus documentos em viagens, além
cialmente importante quando documentos são de transferir arquivos entre escritórios distintos.
confidenciais e quando existem vários usuários. Pastas transitórias e volumes portáteis ajudam
usuários a transferir seus documentos para ou-
tros escritórios ou clientes, rápida e facilmente.
Portabilidade e CDs
Sistemas GED podem permitir que usuários
carreguem documentos importantes para qual-

20
Pastas Transitórias Para ser mais eficiente um sistema de GED de-
Para usuários que possuem uma cópia do sis- veria oferecer Royalty-free na publicação do CD
tema de GED em seu laptop ou escritório remo- e prover um visualizador que permita as pessoas
to, vários sistemas permitem a usuários simples- que não possuem um sistema GED de pesqui-
mente mover as pastas apropriadas para uma sar os documentos dentro do CD distribuido.
pasta transitória e transferir essa pasta para o
laptop ou sistema remoto.
Terceirização de
Volumes Portáteis
Escanerização
Volumes portáteis são como enorme pastas
transitórias e permitem atualizações constantes
para compartilhamento do banco de dados de Algumas vezes organizações acham mais rápido
imagens em diferentes localizações. Essa habili- ou mais eficiente financeiramente ter um
dade é proveitosa para organizações que uti- bureau de serviços realizando a conversão dos
lizam um bureau de serviços ou para aquelas documentos para meio digital. Geralmente, o
com vários escritórios. Em vários sistemas de sistema GED é mantido pela organização e o
imagem de grande escala, os arquivos de docu- bureau de serviço entrega regularmente CDs
mentos são armazenados em múltiplos drivers contendo os documentos escanerizados. Além
ou volumes na rede. Volumes portáteis per- do armazenamento das imagens e informação
mitem que volumes inteiros contendo imagens sobre os textos, esses CDs devem também car-
de documentos e texto sejam transferidos em regar dados descrevendo os nomes dos docu-
mentos, campos de indexação, pastas, etc.
massa para outros bancos de dados.
Caso a organização modifique os documentos
existentes e crie novos ao mesmo tempo, não é
Distribuição de Documentos possível simplesmente sobrepor o banco de
A maioria das organizações precisa comparti- dados com o novo providenciado pelo bureau
lhar documentos com seus parceiros de negó- de serviços.
cios ou clients. Com um sistema de papel,
muitas cópias deverão ser impressas, talvez O sistema GED deve ser capaz de fundir os
recuperadas e então enviadas. Um sistema de novos dados do bureau de serviços com os
GED permite à organização copiar com rapidez dados existentes da organização. Volumes
o arquivo desejado em um CD e então enviá-lo, portáteis fazem isso automaticamente.
economizando no custo de impressão e de
postagem.

21
Recuperação pós de indexar palavras-chave e movê-los para as
pastas apropriadas. O sistema deve permitir que
Desastre as páginas sejam rearranjadas, retiradas ou adi-
cionadas a um documento para corrigir qual-
Desastres podem ocorrer a qualquer momento quer engano que possa haver ocorrido na orga-
e danificar ou destruir os documentos de uma nização do arquivo
organização. Para ajudar na recuperação após
um desastre, é aconselhado manter cópias de
segurança dos documentos com a ajuda de um Código de Barras
sistema GED. Volumes portáteis que permitam
a recriação de um sistema do zero podem sim-
Em operações de alto volume de escanerização,
plificar esta tarefa.
separar e indexar documentos automatica-
mente utilizando código de barras pode salvar
tempo e dinheiro. O código de barras pode ser
Processamento em Lote usado para indexar documentos através da
extração de campos de um banco de dados
Organizações que lidam com vários arquivos de externo, através do preenchimento de campos
Organizações que lidam com vários arquivos de com valores pré-assinalados, ou através da asso-
imagens diariamente irão rapidamente enten- ciação de certos documentos a um particular
der a importância do processamento em lote. índice de fichas. O código de barras pode até
Quando há necessidade de trazer um largo funcionar como marcadores que indiquem o
número de documentos para dentro do GED, é começo de um documento, automatizando a
ineficiente processar um a um individualmente. separação entre documentos. Enquanto que o
Um sistema GED deve permitir que os docu- código de barras requer alguma preparação do
mentos sejam trazidos de uma vez só para o sis- banco de dados, os benefícios podem ser
tema para aumentar a velocidade do processo. enormes. Por exemplo, em 2.000 registros de
votos, 500 indagações e 2.500 páginas de minu-
A lentidão do sistema durante a escanerização tas legislativas tem de ser escanerizadas, marcas
ou conversão de documentos individuais devi- de código de barras podem ser colocadas em
do ao recomeçar/parar do processo, pode ser cada documento. O sistema então poderá ler
evitado se os documentos forem trazidos para o cada marca, determinando o início de cada do-
GED como um único grande lote. Uma vez que cumento, assinalando o tipo correto de índice
todas as imagens tenham sido trazidas, o sis- de fichas para cada documento, e preenchendo
tema deve permitir aos usuários facilmente informações das fichas.
agrupá-las nos documentos apropriados antes

22
Zona OCR comunicação é estabelecida com o servidor de
e-mail existente para o envio de notificação do
evento para o recipiente. O Workflow deve
Organizações que processam os mesmos for- incluir uma série de tabelas condicionais que
mulários repetidamente podem desejar utilizar incluam o uso de recibo de retorno e de
a zona de OCR para salvar tempo e memória de respostas pré-estabelecidas. Se uma tabela con-
sistema. A zona de OCR economiza tempo pela sicional for usada, o servidor de imagens deve
automação da indexação de documentos, enviar uma mensagem lembrete ou uma 2a.
através da leitura de certas regiões (ou zonas) de mensagem para um recipiente alternativo. Essas
um documento e depois colocando o texto no tabelas adicionais ajudam a eliminar gargalos e
campo de índice apropriado. A quantidade de otimizar processos de negócios.
espaço para armazenamento necessário tam-
bém é reduzido porque apenas as respostas que Um componente essential em um sistema de
foram entradas são indexadas e processadas workflow é a automação de documentos.
pelo OCR. Um Workflow de documentos baseado em
regras requer que a informação se movimente
Para minimizar erros, o sistema deve permitir em um sistema hierárquico sem intervenção
ao usuário setar um percentual mínimo de nível externa. O Workflow deve ser capaz de auto-
de acuracidade para o OCR. Se qualquer porção maticamente mover, copiar ou eliminar docu-
do formulário não atender ao padrão, o sistema mentos dentro do banco de dados de imagem,
deve notificar o usuário, e um membro da orga- baseado em uma série de regras pré-determi-
nização poderá ler o formulário e entrar o nadas. O administrador de sistemas usa a lista
campo correto de informação manualmente. de regras para estabelecer os protocolos de
roteamento e condições.

Workflow Qualquer ambiente de escritório pode ser con-


siderado ideal e prático, quando se trata de
automação de escritório e distribuição de tra-
Workflow pode aumentar os benefícios de um
balho. O sucesso de qualquer Workflow não está
sistema GED através do roteamento de docu-
na habilidade de seguir as características exatas
mentos para várias pessoas. Enquanto essa fun-
de roteamento ou relátorios gerados de um sis-
cionalidade adicional pode não ser válida
tema totalmente automatizado, mas em geren-
durante uma fase piloto, ela se torna fundamen-
ciar as exceções às regras que aparecem. Um sis-
tal a medida que o sistem expande. O Workflow
tema de workflow eficiente deve prover acesso
deve notificar automaticamente usuários
completo para o roteamento de documentos e
específicos de eventos específicos do sistema,
informações através da sua estrutura de pastas e
baseado em uma lista criada pelo administrador
sistema de segurança. Utilizando o acesso de
do sistema. Uma vez que o evento é detectado, a
segurança como a chave para implementação de

23
sistemas permite ao Administrador de Sistemas Compatibilidade de
facilmente modificar os direitos de acesso da
forma necessária para acomodar o que ocorre Sistemas
realmente em um ambiente de trabalho dinâmi-
co. Um sistema de workflow deve oferecer aos Compatibilidade é a habilidade de um sistema
administradores a simplicidade de copiar e de GED trabalhar com computadores e sis-
arrastar, uma interface GUI simples e uma temas de rede existentes. Para maximizar a
estrutura de pasta fácil de entender. probabilidade dessa compatibilidade com os
sistemas existentes, um sistema GED deve:
Aplicações de workflow devem ser compatíveis
com ODBC para conectar o banco de dados de • Trabalhar com sistemas operacionais
imagem a banco externos de terceiros e apli- existentes como servidores Novell ou
cações customizadas para criar um workflow Windows NT, e Windows desktop.
completamente funcional. Como um compo-
nente final, o workflow deve prover uma segu- • Comunicar-se usando protocolos de rede
rança adequada através de relatórios da função populares como IPX/SPX ou TCP/IP
de auditoria. • Usar uma arquitetura aberta e um banco de
dados não-proprietário
• Usar uma arquitetura cliente/servidor com
Escalabilidade compressão/descompressão de imagens do
lado do cliente e procura e indexação do lado
do servidor para minimizar o volume de
A escalabilidade do sistema determina quanto
trafégo na sua rede.
o sistema GED irá crescer com as necessidades
de sua organização. Para uma escalabilidade • Armazenar arquivos em formatos padrão de
completa, o sistema deve ter os seguintes atri- indústria.
butos:
• Suportar até 1000 usuários concorrentes
• Armazenar pelo menos 100 milhões de
páginas por banco de dados
• Arquitetura de sistema robusta
• Armazenar informação através de múltiplos
drivers ou servidores
• Suporte a múltiplos bancos de dados
• Expansão para Web
• Publicar informação para CD ou DVD

24
Sistemas de Rede Arquitetura
Cliente/Servidor
Em qualquer escritório documentos são utiliza-
dos para transmitir informações entre as pes-
soas. Para um sistema GED ser realmente uti- Aplicações de imagens consomem recursos
lizado em um ambiente de escritório, documen- computacionais: os arquivos são enormes e os
tos devem ser acessíveis para qualquer um que bancos de dados devem lidar com um grande
tenha autorização. É importante para um sis- número de registros. Com uma arquitetura
tema GED ter um repositório central de reg- cliente/servidor de verdade, tarefas como inde-
istros acessível de qualquer PC. Armazenar do- xação, OCR e buscas são distribuídas entre o
cumentos em PC individuais prejudica o fluxo cliente ( a estação de trabalho – PC) e o servidor
de informação entre trabalhadores e desperdiça para otimização da performance. Algumas tare-
tempo valioso e energia. fas possuem uma performance melhor no
cliente, enquanto outras são mais eficientes se
Sistemas de rede também podem suportar cer- realizadas no servidor. Aonde tarefas específicas
tas funções de imagens mais eficientemente que serão realizadas depende do sistema GED.
PCs individuais. Por exemplo, o Quando usuários de um sistema cliente/servi-
Reconhecimento de Caracter Óptico (OCR) de dor querem procurar em um banco de dados, o
uma imagem requer um grande poder com- PC cliente envia uma requisição ao servidor. O
putacional. Leva em torno de 10 segundos para servidor então procura no banco de dados cen-
uma tipica estação de trabalho para OCR cada tral e envia uma “resposta” de volta ao cliente. A
página de um documento. Em uma instalação corrupção de dados por problemas na rede é
GED de rede, um lote de documentos podem eliminada porque os arquivos nunca deixam o
ser OCR através de processamento paralelo com servidor. O tráfego da rede é minimizado
múltiplas estações de trabalho. porque o servidor apenas envia os documentos
requisitados de volta para estação de PC.
Por exemplo, uma organização pode escanerizar
600 páginas de um documento em um dia típi- Além do mais, funções como OCR, exibição de
co. Com uma única estação de trabalho tentan- imagens e busca requerem um poder computa-
do OCR todos os documentos, pode levar até cional extensivo. A arquitetura cliente/servidor
100 minutos para o computador “ler” todas as se torna um requerimento quando um certo
páginas. Se um servidor com o dobro de veloci- número de pessoas necessitam acessar docu-
dade tentar OCR os documentos, poderá levar mentos de um sistema GED. Mesmo que uma
apenas 50 minutos. Entretanto, se cinco instalação comece com um projeto piloto de
estações de trabalho forem usadas para OCR apenas um usuário, é importante garantir que o
esses documentos, a tarefa pode ser finalizada sistema será capaz de suportar um crescimento
em 10 minutos futuro.

25
Buscas podem ser realizadas mais rapidamente e melhoria no gerenciamento de registros sig-
no servidor, que é normalmente mais poderoso nifica que muitos escritórios necessitam encon-
que uma estação individual. No entanto, pelo trar um solucão GED hoje.
tradicional “compartilhamento de arquivos” de
sistemas GED, uma cópia do banco de dados é Para endereçar essas preocupações, sistemas
enviada através da rede para o PC, e esse perfor- GED devem usar formatos de texto e imagem
ma as buscas. Esse método leva a: (a)corrupção não-proprietários. Com os exemplos de proces-
dos dados devido à problemas na rede; (b) sadores de texto mostram, documentos salvos
aumento do tráfego na rede, por exemplo, o em WordStar, WordPerfect antigo ou até o anti-
banco de dados possui 800MB em tamanho; e go MS Word já são dificeís de ler. Sendo que
(c) tempo de busca depende da velocidade da cada empresa de processadores de palavras uti-
estação PC. Sistemas de compartilhamento de liza formatos proprietários para seus documen-
arquivos podem ser mais baratos para começar, tos, adquirir o mais recente software para ler um
mas suas limitações restringem expansão futura formato antigo pode ser frustrante ou uma tare-
e flexibilidade. fa cara. O mesmo se aplica no mundo das ima-
gens.
Network
Desktops Os formatos não-proprietários disponíveis para
armazenar informação de documentos são
poucos, mas estáveis. ASCII tem sido um
Financeiro
Servidores padrão para informação de texto desde 1963 e
Administraçáo se tornou um bloco de construção básico para
praticamente qualquer programa envolvendo
Marketing texto. TIFF tem sido usado como um padrão,
Exemplo de um sistema Cliente-Servidor um formato gráfico não-proprietário desde
1981. É usado amplamente para transmitir
informação de documento através de sistemas
Formatos de Arquivo de imagens, máquinas de fax e software, e por
projetistas.
Não Proprietários
Dado que os padrões ASCII e TIFF tem prevale-
Preocupação com a capacidade de leitura futu- cido desde então, compradores de sistemas se
ra faz com que vários gerentes de registros he- sentem confortáveis, e não importa qual novo
sitem em implementar um sistema GED. Com paradigma apareça no futuro, os desenvolve-
as rápidas mudanças na indústria de computa- dores de um novo formato terão um interesse
dores, é difícil prever o que acontecerá com os único em prover a conversão para esses
computadores em dez ou vinte anos. padrões.Com formatos de documento propri-
Entretanto, a necessidade de recuperação rápida etário, não há essa garantia.

26
Perguntas Mais Frequentes
P: O que é ICR (Reconhecimento
Geral Inteligente de Caracter)?
R: ICR é o reconhecimento de um texto escrito
P: O que é um “documento?”
a mão e também é conhecido como reconheci-
R. Um documento pode ter de uma a várias mento de escrita a mão. Textos escritos a mão
páginas, e pode incluir imagens e/ou texto, além são mais difíceis para o computador reconhecer
de anotações, e fichas (cartão de índice) e os resultados possuem uma taxa de erros
maior do que os textos impressos.
Reconhecimento de ICR geralmente atua me-
P: Eu posso editar ou alterar imagens? lhor em texto confinado, o que significa letras
impressas em blocos com uma letra em cada
R: Um sistema de imagens não deve prover
caixa. Um reconhecimento preciso de uma
nenhuma ferramenta para edição ou alteração
escrita a mão requer que a ferramenta de ICR
de imagens. Isso é importante pois muitos
seja treinada para reconhecer o estilo de escrita
usuários consideram que imagens não devem
de cada usuário.
ser tocadas e que qualquer alteração irá indeter-
minar a integridade do sistema. Além do mais, o
sistema deve prover uma auditoria para manter
P: O que é OMR (Reconhecimento de
registros de quais usuários acessaram quais do-
Marca Óptica)?
cumentos e quando.
R: OMR, também chamado de Reconhecimento
sensível a marcas, é o reconhecimento de mar-
P: Sistemas de imagem suportam cas comumente usados em formulários, como
auditoria? múltipla escolha, círculos, e bolhas. OMR pode
ser uma parte importante do sistema para orga-
R: A auditoria de um sistema de imagem deve nizações que processam muitos formulários
gravar o nome de um usuário, data, hora, nome padrão. Pesquisa de consumidor é um exemplo
do documento e a ação quando o usuário aces- do OMR em ação.
sar o banco de dados ou documento. Vários
níveis de detalhes de registros de auditoria e
acompanhamento de atividades devem estar P: Qual é o formato padrão usado para
disponíveis. O sistema deve ter capacidade de armazenar imagens?
selecionar esses registros por classificação e fil-
R: Imagens em preto e branco são mais comu-
tragem.
mente armazenadas em arquivos padrão TIFF
usando CCITT compressão grupo 4 (duas
dimensões). Escala em cinza e imagens colori-

27
das são frequentemente armazenadas em P: Há necessidade de placa gráfica ou
arquivos TIFF com compressão JPEG. monitor especial?
R: A maioria dos sistemas trabalha com qualquer
P: Quais os tipos de sistemas operacionais placa gráfica compatível com Windows e moni-
são normalmente suportados? tor VGA (ou melhor), e é recomendável que se
R: A maioria dos sistemas GED possuem apli- use um monitor de pelo menos 15” com res-
cações cliente que podem rodar aplicações em olução de 800 x 600 dpi pelo menos.
Windows 95, 98 e Windows NT. Sistemas de
Internet/Intranet podem rodar em plataformas
adicionais, como Macintosh, Unix, dentre outras.
Escanerização/
P: Quanto espaço em disco um sistema Importação/
GED tipicamente requer?
R: O software no cliente normalmente requer
Armazenamento
cerca de 20MB de espaço livre em disco para
instalar. O Software no servidor requer apenas P: Quais os fabricantes de scanners para
cerca de 5MB de espaço livre em disco no servi- GED?
dor, e 15MB para o banco de dados. Espaço adi- R: Alguns dos top fornecedores de scanner
cional pode ser neessário para o banco de dados incluem Ricoh, Fujitsu, Panasonic, Bell &
real. Howell, Canon, Hewlett Packard e Avision.
Scanners para sistemas de GED possuem alimen-
P: E se o meu banco de dados for muito tadores de alta velocidade para escanerizar
grande para caber em um volume de grandes quantidades de documentos.
dados?
R: Um sistema GED irá permitir que dados e P: Quais são as interfaces de hardwares e
imagens sejam armazenados através de múlti- softwares para scanners mais comuns?
plos volumes com cada volume residindo em R: Driver ISIS para scanner da Pixel Translations e
um diretório diferente ou em um drive, disk Kofax Image Controls (http://www.kofax.com) são
array, CD ou MO diferente. as interfaces de scanner mais comuns. Muitos scan-
ners conectados a uma placa Adaptec SCSI ou à
P: Quanto de RAM um sistema GED placa Kofax de processamento de imagem TWAIN
necessita? não é geralmente uma boa interface de scanner para
R: O software no cliente geralmente requer de alta velocidade e alto volume de escaneamento.
16 a 20MB de RAM para rodar, com requeri- Enquanto que a maioria dos scanners incluem o
mentos maiores para escanerização e OCR. A driver TWAIN, cada driver é escrito por uma com-
maioria dos sistemas recomenda ter 64MB ou panhia diferente e trabalha um pouco distinta. Se
mais. um scanner suporta uma interface TWAIN apenas,
ele é provavelmente desenhado para um baixo vo-
lume de escaneamento e editoração, não para GED.
28
P: Como eu posso escanerizar cheques? P: E arquivos coloridos ou fotografias?
R: Várias empresas, incluindo Visionshape, fa- R: Sistemas GED devem suportar imagens em
bricam escaners especialmente desenhados para preto e branco, cinza e colorida. Arquivos co-
cheques que lêem o número MICR codificado loridos podem ser escanerizados com um scan-
magneticamente na parte de baixo do cheque. ner colorido, importados ou convertidos para o
Se voce não tem um desses scanners, a maioria sistema GED. Fotografias tendem a escanear
dos cheques pode ser escanerizado com um melhor em escala cinza, uma técnica de cópia
scanner regular para GED e pela função OCR com “pixel decimation” que ocorre quando a
normalmente, apesar de que os números MICR imagem é mostrada em uma tela com baixa re-
não serão lidos. solução. As bordas dos caracteres podem se
tornar irregulares com pontos insuficientes. A
escala cinza simplesmente preenche esses pon-
P: Como eu posso escanerizar tos marginais com cinza para melhorar a
documentos de formato grande? imagem, fazendo com que apareçam fáceis de
R: Vários fornecedores, incluindo Contex, Océ ler. Sendo que é apenas uma melhoria na visu-
and Calcomp, fabricam scanners especifica- alização, não há melhoria no OCR ou na quali-
mente projetados para documentos de formato dade de impressão.
grande, até tamanho E(34"x 44")e A-0 (33"x
46.8"). Se você não tem um desses, o documen- P: Como eu posso escanerizar
to pode ser reduzido em tamanho através de documentos de dois lados?
uma copiadora e depois escanerizado com um R: Um sistema GED deve prover dois modos
escaner normal, ou enviando para um bureau diferentes de se fazer isso. Ele deve suportar
de serviços que tenha scanner para formato scanner duplex, que simultaneamente escane-
grande. riza ambos os lados da página. Com um scanner
simplex, o usuário deve poder escanerizar todas
as páginas da frente, virar os documentos e
P: Qual resolução de imagem eu devo
escanerizar o verso da página, e o sistema deve
usar?
automaticamente colocar as páginas na ordem
R: A maioria dos sistemas GED podem supor- correta.
tar documentos escanerizados em várias re-
soluções, de 50 a 600 dpi (ou mais), dependen- P: Posso escanerizar páginas landscape e
do do seu scanner. Dependendo do propósito e portrait juntas em um lote apenas?
do tamanho da página, a maioria dos documen-
R: A maioria dos sistemas permite que você
tos são escanerizados em preto e branco com
troque a orientação das páginas à medida que
200, 240 ou 300 dpi.
você escaneriza ou após a escanerização. Muitos
sistemas também incluem a opção de checar
automaticamente e corrigir a orientação das
páginas.

29
P: Como imagens “enviesadas” são gerado pelo OCR. Após a compressão, uma
tratadas? imagem típica requer 50KB, apesar de poder
variar de 16KB a 150KB, dependendo do
R: Imagens enviesadas (curvas ou inclinadas)
tamanho do papel, resolução e complexidade da
podem afetar a precisão do processo OCR, de
página. Um texto OCRizado tipicamente requer
forma que sistemas GED incluem software que
2KB de espaço por página.
reconhecem imagens enviesadas e as compen-
sam. Isso é particularmente importante quando
escanerizando cortes pressionados em um scan-
P: E se o meu banco de dados for muito
ner flat bed ou quando escanerizando docu-
grande para caber em uma localidade?
mentos através de um ADF (alimentador de
documento automático) usado ou projetado R: Vários sistemas GED permitem que imagens
probremente. sejam armazenadas através de múltiplos vo-
lumes com cada volume residindo em um
diretório diferente ou em um drive, disk array,
P: Quais formatos de arquivos a maioria CD ou MO diferente.
dos sistemas importa?
R: A maioria dos sistemas pode importar texto
ASCII em 20 ou mais formatos gráficos, P: Qual é a diferença entre CD ou
incluindo TIFF 4, TIFF 3, TIFF Raw, TIFF LZW, jukeboxes/changer de DVD e torres?
PCX, BMP, CALS, JPEG, GIF, PICT, PNG e EPS R: Em um jukebox/changer, existe mais slots e
visualização de imagem. A maioria dos sistemas discos do que drivers. Mecanismos de robôs
converte arquivos gráficos em preto e branco automaticamente colocam o disco correto em
para o formato Grupo 4 TIFF durante a impor- um dos drivers quando o disco é necessitado.
tação, e imagens cinzas/coloridas para TIFF Em uma torre, vários drivers de CDs ou DVDs
JPEG. estão empilhados juntos em uma única
unidade, e cada disco está sempre em um drive.
Torres provêm um rápido acesso ao dado, mas
P: Quanto espaço de armazenamento eu custam muito mais por disco e não carregam
necessito? muitos discos. Jukeboxes/changers custam
R: Documentos escanerizados tipicamente menos por disco e podem carregar até 500 dis-
requerem cerca de um gigabyte para cada cos, mas são mais lentos devido ao consumo de
17.000 páginas, assumindo papel tamanho tempo na troca de discos nos drivers.
carta, resolução 300 dpi, e escanerização em
preto e branco. Isso inclui o espaço para o texto

30
Visualização /Impressão / P: Eu vou precisar de um monitar especial
para visualização de imagens?
Exportação R: Não, a maioria dos sistemas roda perfeita-
mente bem em monitores padrão VGA e me-
P: Posso ver combinações de imagens, lhores. Um display de 15”usando uma contro-
textos e campos de indexação lado a ladora Super VGA pode ser considerado o míni-
lado? mo display prático para um usuário adhoc do
R A maioria dos sistemas GED permite que a sistema. Usuários frequentes devem usar um
tela de visualização seja configurada para monitor de 17”, e usuários cujo trabalho é
mostrar qualquer uma das duas a qualquer escanerizar e rever documentos com imagens o
hora: texto, imagens, campos de indexação, tempo todo podem considerar um monotor de
imagens pequenas ou dicumentos com várias 19”ou 21”.
páginas ou nada. O tipo de fonte e o tamanho
do texto pode ser alterado para servir à necessi-
P: Qual a vantagem de um monitor
dades individuais.
grande para usuários com poder?
R: Para pessoas que usam um sistem GED
P: Posso abrir e visualizar mais de um intensivamente, o tamanho da tela pode ser um
documento ao mesmo tempo? fator crítico. Se os usuários quiserem mover
R: A maioria dos sistemas GED permite a visu- entre as páginas com a facilidade do papel, eles
alização de vários documentos , sendo a tem que ser capazes de ver a página inteira de
memória disponível a única limitação para o uma vez de tal modo que o texto seja visível. Se
número de documentos abertos ao mesmo uma página de 8 ¿”x11”é o tamanho dominante
tempo. de papel, então um monitor se 21”capa de
mostrar 1600 x 1200 será ótimo. Usando um
monitor padrão VGA de 14” irá necessitar
P: Como posso fazer uma nova sequência movimentar pelo documento para visualizar a
de páginas? imagem toda no seu tamanho normal.
R: Se as páginas estão fora de ordem e necessi-
tam ser re-sequenciadas, a maioria dos sistemas
permite vistas das páginas de um tamanho
peuqeno (”Thumbnails”) para serem simples-
mente arrastadas pra a posição requerida. Da
mesma forma, páginas individuais podem ser
selecionadas e apagadas, suheitas ao controle de
acesso de segura’nca apropriados e privilégios.

31
P: O que é importante além do tamanho OCR: Reconhecimento
do monitor?
R: A resolução da tela e a velocidade de varredu-
de Caracter Óptico
ra do monitor também são importantes.
Geralmente, quanto maior o tamanho do mo- P: O que é OCR?
nitor e maior sua resolução, mais difícil será R: OCR significa Reconhecimento de Caracter
obter a maior velocidade de varredura que é Óptico, é como um computador que converte
requerida para sustentar a visualização sem que palavras de uma imagem escanerizada sem
a tela cintile. O melhor ponto inicial para a capacidade de busca em um texto com capaci-
menor cintilação de tela é geralmente conside- dades de busca. OCR é normalmente necessário
rada a taxa de varredura horizontal de 72MHz para se usar indexação de texto e buscas, e deve
em um monitor de 21”. A taxa de varredura estar incluído em um sistema GED.
máxima é uma função do monitor e da contro- Ferramentas OCR podem geralmente reco-
ladora gráfica. nhecer textos digitados ou impressos, não
escritos à mão..

P: Eu vou precisar de uma impressora


especial para imagens ou texto que P: O quanto o OCR é preciso?
utilizaram o OCR?
R: A precisão em uma página recém impressa a
R: Geralmente não. A maioria dos sistemas laser é tipicamente melhor que 99.6%.
GED suporta a maioria das impressoras com- A precisão em documentos enviados por fax,
patíveis com Windows, mas se recomenda que sujos ou degradados será naturalmente menor,
utilize uma impressaora laser com no mínima mas a maioria dos sistemas GED possuem tec-
4MB de memória RAM. Se voce etá usando um nologia de limpeza de imagem que pode melho-
sistema instalado na rede e imprimindo um alto rar a precisão do OCR.
volume de páginas em uma impressora de rede,
voce pode considerar instalar uma impressora
laser localmente ou no seu próprio segmento de
P: Eu terei que corrigir os erros de OCR?
rede para minimizar o tráfego da rede durante
impressões pesadas de várias páginas R: Não se o sistema GED suportar lógica
“fuzzy”, que encontrará palavras mesmo se a
ferramenta OCR tiver feito alguns enganos.
P: Em quais formatos posso exportar
documentos?
R: A maioria dos sistemas GED pode exportar
imagens para vários formatos gráficos incluin-
do TIFF 3,TIFF 4,TIFF Raw,BMP,GIF,CALS e
JPEG,e C.

32
P: Qual a velocidade do processo de OCR? COLD: Computer
R: A performance do OCR e processos de Output to Laser Disc
indexação é totalmente dependente de fatores
tais como a velocidade e configuração do sis-
tema e do conteúdo da imagem. Um Pentium P: Qual a diferença entre COLD e GED?
133MHz geralmente necessita aproximada- R: GED realiza a escanerização, compressão,
mente de 6 segundos por página, enquanto que armazenamento, indexação, funções de OCR,
um Pentium II 450MHz levará cerca de 2 a 3 busca e recuperação de milhões de páginas de
segundos por página. documentos em papel ou documentos eletrôni-
cos armazenados como imagens permanentes.
COLD realiza armazenamento, indexação,
P: Qual a diferença entre OCR e busca e impressão de relatórios de enormes
indexação? arquivos de texto gerados por mainframes,
mini-computadores e aplicações de sistemas
R: OCR é processo de conversão de imagens
antigos em grande volumes de impressão.
escanerizadas para texto, e indexação é o
COLD armazena arquivos de texto enormes e
processo de fazer o arquivo texto resultante fácil
extrai chaves de indexação em disco rígidos,
e rápido de ser pesquisado..
cartuchos ópticos ou CD-ROM ao invés de
imprimir toda a informação em papel ou
armazená-la em microfilme.
P: Um texto que utilizou OCR pode ser
exportado e reutilizado em um
processador de palavras? P: Quantos campos de indexação pode
um servidor COLD extrair de cada
R: Sim, você pode copiar textos entre o sistema relatório?
GED e uma aplicação Windows, ou você pode
exportar arquivos de textos inteiros (todas as R: O número de campos de indexação é nor-
páginas de um documento) para um diretório e malmente ilimitado. Entretanto, o maior
abrí-lo com seu processador de textos favorito. número de campos extraídos de cada relatório,
mais lento o processo de extração irá rodar e
maiores serão os arquivos de indexação.
P: Posso corrigir manualmente erros de
OCR?
R: A maioria dos sistemas permite que os
usuários corrijam os erros de OCR dentro do
sistema. Entretanto, com capacidades de busca
da lógica fuzzy, isso normalmente é
desnecessário.

33
Glossário de Termos
ADF Arquitetura Cliente-Servidor vs
Alimentador automático de documento. Esse é o Compartilhamento de Arquivos
meio pelo qual um scanner alimenta um docu-
mento de papel. Duas arquiteturas comuns de aplicações de soft-
ware encontradas em rede de computadores. No
Anotações compartilhamento de arquivos, todas as buscas
São as mudanças ou adições realizadas em um ocorrem na estação de trabalho, enquanto que o
documento utilizando notas adesivas, um mar- banco de dados de documentos reside no servi-
cador, ou outra ferramenta eletrônica. Imagens dor. Na arquitetura cliente-servidor, processos
ou textos em um documento podem ser mar- intensivos de CPU (tais como buscas e inde-
cadas em cores diferentes, carimbadas (por xação) são realizados no servidor, enquanto que
exemplo “CONFIDENCIAL”ou “FAX), ou ter a visualização da imagem e o OCR ocorrem no
notas adesivas eletrônicas anexadas. Anotações cliente. Aplicações de compartilhamento de
devem ser sobrepostas e não alteram o docu- arquivos são fáceis de desenvolver, mas tendem
mento original. a gerar um tremendo tráfego de dados na rede.
Além disso, há a exposição do banco de dados à
corrupção devido às interrupções nas estações
de trabalho. Aplicações cliente-servidor são
mais difíceis de desenvolver, mas reduzem dra-
maticamente o tráfego de dados na rede e iso-
lam o banco de dados de interrupções nas
estações de trabalho.

ASCII - American Standard


Exemplos de carimbos, anotações e Computer Information
highlight Interchange
Usado para definir o texto para computador
Armazenamento Óptico que foi criado como um conjunto de 255 cara-
Magnético cteres. ASCII tem sido usado como um padrão,
Um drive que combina tecnologia laser e mag- um formato de texto não-proprietário desde
nética para criar armazenamento apagável de 1983.
alta capacidade.

34
Bitmap/Bitmapped CD-R
Veja Raster/Rasterized Abreviação para CD Regravável. Significa um
CD que pode ser escrito (ou gravado) apenas
uma vez. Pode ser copiado para distribuição de
BMP um grande volume de dados. CD-Rs podem ser
Um formato nativo do Windows para lidos em qualquer driver de CD, em um com-
armazenar imagens chamadas “bitmaps”. putador isolado ou em uma rede. Isso torna o
intercâmbio entre os sistemas mais fácil.

Browser de Pastas
Um sistema usado para organizar documentos
CD-ROM
(geralmente hierárquico or “empilhado”). Por Compact Disc Read Only Memory. Gravado em
exemplo, o programa de Gerenciamento de grande escala e não em um gravador de CD (CD
Arquivos no Microsoft Windows é um tipo de writer), é uma mídia de armazenamento em
Browser de Pastas que mostra os diretórios no disco óptico popular para armazer arquivos de
seu disco. computador, assim como gravação de músicas
digitais.

Caching (de Imagens) Código de Barras


Armazenamento temporário de arquivos de Um modelo de linhas verticais que é lido por um
imagem em um disco rígido para uma posterior laser ou um scanner óptico, e que corresponde a
transferência para um armazenamento perma- um registro em um banco de dados. Como um
nente, como um óptico ou jukebox de CD. componente adicional de um sistema GED, essa
característica foi desenhada para aumentar a
Campo Chave velocidade na qual um documento pode ser
Campos de banco de dados usados para busca e armazenado.
recuperação de documentos. Sinônimo para
campo de indexação.
COLD
Computer Output to Laser Disk. Processo de
Campos de Indexação programação que gera registros eletrônicos e
Campos de banco de dados usados para catego- relatórios impressos em em disco laser ao invés
rizar e organizar documentos. Frequentemente de uma impressora. Pode ser usado no lugar do
definidos pelo usuário, esses campos podem ser COM (Computer Output to Microfilm) ou
usados para buscas. impressão de relatórios em formulários contínuos.

35
COM Discos Ópticos
Computer Output to Microfilm. Um processo Mídia de computador similar ao disco com-
que gera registros eletrônicos e relatórios de pacto que não pode ser escrito. Um disco óptico
computador em microfilmes. usa laser para ler o dado armazenado.

CPU Dithering
Central Processing Unit (Unidade de O processo de conversão da cor cinza em duas
Processamento Central). É o “cérebro” do com- densidades de pontos preto, geralmente com o
putador.. propósito de impressão ou armazenamento de
imagens coloridas ou acinzentadas em imagens
branco e preto.
De-shading
Remoção de áreas de sombras para reconheci-
mento da imagem mais fácil pelo OCR. Um Drag-and-Drop
software de-shading tipicamente procura por O movimento de objetos na tela do computador
áreas com um padrão regular ou pequenos pon- (monitor) quando arrastados com o mouse.
tos.

Drive de CD-ROM
De-skewing O movimento de objetos na tela do computador
O processo de endireitar imagens enviesadas Um drive de computador que lê discos com-
(descentralizadas). De-skewing é uma das me- pactos.
lhorias de imagem que pode aumentar a pre-
cisão do OCR. Documentos muitas vezes ficam
enviesadas quando enviados por fax ou escane- Drive Óptico Apagável
rizados.
Um tipo de drive óptico que usa discos ópticos
apagáveis.
De-speckling
Remoção de salpicos isolados de um arquivo de
imagem. Geralmente ocorre quando um docu-
mento é enviado por fax ou escanerizado.

36
Drivers de Scanner ISIS e nando a visualização mais fácil. Uma visualiza-
ção em escala de cinza utiliza sombreamento
TWAIN
em cinza para preencher os vazios ou furos que
Digital Video Disc or Digital Versatile Disc. Um
ocorrem quando a imagem é visualizada em
Aplicações especializadas usadas para comuni-
uma tela de computador. Também conhecido
cação entre escaners e computadores. Drivers
como escala acinzentada.
TWAIN foram desenvolvidos para edição de
fotos e publicação. Eles tratam imagens em
cores e em escala em cinza muito bem, mas não Escalabilidade
suportam escanerização em alta velocidade. Capacidade de expansão de um sistema sem
Drivers ISIS foram desenvolvidos para escane- requerer maiores reconfigurações ou reentrada
rização de imagens em alta velocidade. Foram de dados. Múltiplos servidores ou armazena-
desenhados para rápida escanerização de ima- mento podem ser adicionados facilmente.
gens em preto e branco através do ADF. Nos
últimos anos, a diferença entre eles tem dimi-
nuído e drivers ISIS agora incluem suporte a Fichas
cores e em escala em cinza, enquanto drivers Conjunto de campos de índices para documen-
TWAIN agora suportam ADF. tos.

Formato ISO 9660 CD


DVD O Formato da Organização de Padrões
Digital Video Disc or Digital Versatile Disc. Um Internacionais para criação de CD-ROMs que
disco de plástico, como um CD, aonde o dado podem ser lidos no mundo todo.
pode ser escrito e lido. DVDs são mais rápidos,
podem armazenar mais informações e supor-
tam mais formatos que os CDs. GED (Gerenciamento Eletrônico
de Documentos)
Software usado para armazenar, gerenciar, recu-
EDM – Eletronic Document perar e distribuir documentos rapidamente e
Management facilmente no computador.
Software de Imagem que gerencia documentos
eletrônicos
Gerenciamento Hierárquico de
Armazenamento
Escala de cinza Um software que transfere automaticamente
Uma opção para visualizar um imagem em arquivos on-line para mídia de armazenamento
preto e branco de um modo aperfeiçoado, tor- “near-line”, geralmente com base na frequência
de uso dos arquivos.

37
GIF Interface de Video Scanner
Padrão CompuServer para arquivos de imagem. Um tipo de dispositivo usado para conectar
scanners com computadores. Scanners com essa
interface requerem uma placa de controlde
Gigabyte desenhada pela Kofax, Xionics ou Dunord.
Um bilhão de bytes. Também expresso como
mil megabytes. Em termos de capacidade de IPX/SPX
arquivamento de imagem, um gigabyte equivale Protocolo de comunicação usado pela rede
aproximadamente a 17.000 páginas no formato Novell.
de 81/2”x11” escanerizadas a 300 dpi,
armazenadas como imagens TIFF Grupo IV.
JPEG
Um formato de compressão de imagem usado
para armazenar fotografias coloridas e imagens.
Gravação (CDs ou DVDs)
Gravação ou escrita de dados em um CD ou
DVD. Jukebox
Um dispositivo de armazenamento de discos
ópticos e os carrega em um drive.
Habilitador de Imagem
Uma função do software que cria conexões
entre aplicações existentes e imagens Jukebox Óptico
armazenadas. Veja “Jukebox.”

Lógica Booleana
ICR O uso dos termos “E”, “OU” e “NÃO” durante
Reconhecimento Inteligente de Caracteres. Um buscas de palavras ou textos. Usado para ampli-
processo que reconhece textos escritos a mão e ar ou restringer o escopo da busca.
impressos como caracteres alfanuméricos.

Lógica “Fuzzy”
Interface de Scanner SCSI Um procedimento de procura para uma palavra
O dispositivo usado para conectar um scanner a exata ou similar ao critério de busca, compen-
um computador. sando erros de escrita e interpretação da função
OCR.

38
MAPI Off-Line
Mail Application Program Interface. Esse soft- Arquivo de documentos armazenados em dis-
ware padrão de Windows tornou-se uma inter- cos ópticos ou discos compactos que não estão
face de e-mail popular e é usado pelo MS conectados ou instalados no computador, e
Exchange, GroupWise e outros pacotes de e- requerem intervenção humana para serem aces-
mail. sados.

Módulo Carregável NetWare On-Line


(NLM) Documentos armazenados em um disco rígido
Aplicação que roda como parte de um sistema ou disco magnético em um computador e que
operacional de rede (NOS – network operating estão disponíveis imediatamente.
system) de um servidor Novell Netware.

Pastas Transitórias
Mudança de Fase Um método para simplificar o transporte de um
Método de armazenamento de informação em grupo de documentos de um computador para
discos ópticos regraváveis. outro.

Near-Line Pixel
Documentos armazenados em discos ópticos Um único ponto em uma imagem fotográfica.
ou discos compactos que se encontram o juke- Pode ser preto e branco, cinza ou colorido.
box ou no trocador de CD, e podem ser recu-
perados sem intervenção humana.
Placa de Processamento de
Imagem (IPC)
NT Uma placa localizada no computador, scanner ou
Network Technology. Se refere ao servidor impressora que facilita a aquisição e visualização
Microsoft Windows NT e software de estação de imagens. A função primária da maioria dos
de trabalho. IPCs é a rápida compressão de descompressão de
arquivos de imagem.

OCR
Optical Character Recognition. Um processo
de software que reconhece textos impressos
como caracteres alfanuméricos.

39
Processador de Formulários Publicação na Internet
Uma aplicação de imagem especializada em for- Software de imagem especializado que permite
mulários pré-impressos. Sistemas de processa- que um grande volume de documentos em
mento de formulários geralmente usam ferra- papel seja publicado na Internet ou Intranet.
mentas OCR de ponta (ou várias) e elaboram Esses arquivos podem ser disponibilizados para
rotinas de validação de dados para extração de outros departamentos, colegas de outras locali-
formulários escritos a mão ou com qualidade dades ou público geral para busca, visualização
muito ruim. Esse tipo de aplicação de imagem ou impressão.
possui vários desafios, sendo que muitos docu-
mentos escanerizados não foram desenhados RAID
para sistemas GED ou OCR. Redundant Array of Independent Disks.Uma
coleção de discos rígidos que atua como uma
unidade única. Arquivos em drives RAID
Processamento em lote podem ser duplicados (“espelhados”) para
O nome da técnica usada para a entrada de uma preservar os dados. Sistemas RAID podem vari-
enorme quantidade de informação de uma única ar em níveis de redundância, sendo: sem
vez, é processo oposto entrada individual de redundância - nível único, disco sem-espe-
dados. lhamento - nivel 0, dois discos que se espelham
um no outro - nivel 1, até o nível 5, o mais
comum.
Procura e indexação de textos
Possibilita a recuperação de documentos
através de uma palavra ou frase. Todas as Raster/Rasterized
palavras no documento são indexados em uma Um método de representação de imagem com
lista mestre de palavras com apontadores para uma grade (ou “mapa”) de pontos ou pixels.
os documentos e páginas onde cada ocorrência Formatos típicos de arquivos raster são GIF,
da palavra ou frase aparecem. JPEG, TIFF, PCX, BMP, etc ..

Publicação em CD Região (de uma imagem)


Uma alternativa para copiar um grande volume Uma área de um arquivo de imagem que é sele-
de documentos em papel. Esse método envolve cionado para um processamento específico.
acoplar imagens e textos de um documento em Também chamado de zona.
um software de visualização em CDs. Algumas
vezes softwares de busca são incluídos nos CDs
para melhorar as capacidades de busca.

40
Scanner Taxa de Compressão
Um dispositivo de entrada normalmente usado É a relação entre o tamanho de um arquivo
para converter documentos em papel em ima- comprimido e o de um não comprimido. Por
gens de computador. Scanner também pode exemplo, uma taxa de compressão de 20:1 sig-
escanerizar microfilmes e microfichas. nifica que um arquivo de 1MB não comprimido
tem o tamanho de 50KB quando comprimido.

Scanners Duplex v. Scanner


Double-Sided TCP/IP
Scanner duplex automaticamente escanerizam Protocolo de comunicação de redes. Esse é o
ambos os lados de uma página de dois lados protocolo usado pela Internet.
simultaneamente, produzindo duas imagens de
uma vez. Scanner Double-Sided utilizam um
único scanner para escanerizar páginas de dois Thumbnails
lados, escanerizando uma pilha ordenada de Versão pequena de uma imagem usada para
papéis, depois virando e escanerizando o outro uma vista geral rápida ou ter-se uma idéia do
lado. que a imagem aparenta.

Scanner Flatbed TIFF


Scanner com superfície plana que permite Tagged Image File Format. Um formato gráfico
escanerizar livros e outros documentos. raster de imagem não-proprietário que possue
vários formatos de compressão. TIFF tem sido
usado desde 1981.
SCSI - Small Computer Systems
Interface.
Um padrão para conectar periféricos a com- TIFF Grupo III (compressão)
putadores. Um SCSI permite que até 7 disposi- Um formato de compressão unidimenional de
tivos sejam conectados por cabos. O atual armazenamento de imagens em branco e preto
padrão SCSI é o SCSI II, também conhecido que é utilizado pela maioria de máquinas de fax.
como SCSI rápido..

TIFF Grupo IV (compressão)


SQL Um formato de compressão bidimensional de
Structured Query Language. Um padrão popu- armazenamento de imagens em branco e preto.
lar para rodar buscas em banco de dados Tipicamente compressa em uma taxa de 20-1
(queries) e relatórios. para documentos padrão.

41
Volumes Portáteis ZIP
Uma característica que facilita a movimentação Um formato padrão de compressão de arquivos
de um grande volume de documentos sem a que permite rápido e fácil armazenamento para
necessidade de copiar múltiplos arquivos. transporte.
Volumes portáteis permitem que CDs individu-
ais sejam facilmente reagrupados, destacados e
reatados a diferentes bancos de dados para uma Zona OCR
maior troca de informações. Uma característica adicional de um sistema
GED que preenche ficha de documentos através
da leitura de certas regiões ou zonas de um do-
Workflow, Ad Hoc cumento, e depois coloca o texto no campo de
Um processo manual simples através do qual indexação do documento.
documentos podem ser transportados em um
sistema GED de multi-usuários baseado nas
necessidades reais.

Workflow, Baseado em regras


Uma série programada de passos automatizados
que direcionam documentos para vários
usuários em um sistema GED

WORM Disks
Write Once Read Many Disks. Uma mídia po-
pular dos anos 80 para armazenamento de
arquivos. Reconhecido como o primeiro disco
óptico, é usado para armazenar arquivos de
dados que não podem ser alterados. Discos
WORM são criados por PCs isolados e não
podem ser usados em rede, como os CD-Rs.

42
Sobre o Autor
LaserFiche desenvolveu esse guia para prover • Tempo, para concentrar sem interrupção até
uma idéia geral sobre sistemas de obter a solução de um problema.
Gerenciamento Eletrônico de Documentos
(GED). Nós identificamos a necessidade de um A experiência de trabahlo diretamente com
recurso que fosse certo para pessoas que estão profissionais de gerenciamento de arquivos
aprendendo sobre sistemas de imagem, aqueles ensinou muito a LaserFiche sobre o que fun-
que estão se preparando para comprar um sis- ciona, o que funciona melhor, e o que funciona
tema, e para todas as pessoas que estiverem melhor ainda. Diferentemente de empresas que
interessadas nesta tecnologia. possuem conhecimento apenas na tecnologia,
LaserFiche combina o seu conhecimento em sis-
Desde 1987 LaserFiche tem sido pioneira em temas com a capacidade da tecnologia para criar
sistemas de armazenamento e recuperação de um ambiente de trabalho melhor.
um alto volume de documentos. O sistema GED
da LaserFiche tem ajudado a gerenciar docu- LaserFiche é uma divisão da CompuLink
mentos em mais de 15,000 escolas, escritórios Management Center,Inc. Compulink é certifica-
de advocacia, empresas de seguro e outros tipos da em WBE e MBE, e possue uma história de
de negócios ao redor do mundo, incluindo mi- sucesso em assistir organizações a estabelecer
lhares de municípios, estados e agências federais. sistemas de gerenciamento eletrônico de docu-
O principal recurso da LaserFiche é o grupo de mentos.
profissionais excepcionalmente competentes e
experientes, com um vasto conhecimento tanto LaserFiche agradece a oportunidade de respon-
teórico como prático dos aspectos da der em detalhes qualquer questões sobre GED e
automação de escritório. Nossos analistas e pro- de demonstrar o sistema LaserFiche.
gramadores já possuiam experiência prévia na
indústria e nos negócios nas áreas de desen-
LaserFiche Document Imaging
volvimento de programas, consultoria e
3545 Long Beach Blvd.
soluções customizadas. Para cada projeto,
Long Beach, CA 90807
LaserFiche empenha-se para oferecer:
USA.
• Objetividade, competência e imparcialidade
• Experiência, através da análise e soluções
similares de problemas para outras (310) 793-1888
organizações. (800) 985-8533
• Entendimento, das complexidade e (310) 793-8531 fax
relacionamento entre seres humanos. www.laserfiche.com

43
– Notas –

Вам также может понравиться