Вы находитесь на странице: 1из 43

Guia para digitalizao de documentos Verso 2.

Embrapa Informao Tecnolgica Fevereiro 2006

Verso de 2001, Grupo de trabalho. Anna Christina Aun de Azevedo Nascimento Cristiane Vieira Peres Maria Jos de Oliveira Karla Igns Corvino Silva

Verso de 2006 Reviso de Anna Christina Aun de Azevedo Nascimento


Empresa Brasileira de Pesquisa Agropecuria Embrapa SCT Fevereiro de 2006. Braslia, DF

Introduo
Em 2001, a Embrapa Informao Tecnolgica, por meio de sua Gerncia de Organizao da Informao tomou a iniciativa de desenvolver um Guia Geral de Digitalizao de Documentos visando orientar as atividades de digitalizao dos documentos da Empresa. Alm disso, o Guia tambm teve como propsito a preservao de originais que materializavam as atividades do capital intelectual da Embrapa, ao mesmo tempo que proporcionava maior disseminao de seus contedos. Em dezembro de 2005 a nova verso comeou a ser produzida com o objetivo de revisar e atualizar o documento original. A Embrapa Informao Tecnolgica novamente financiou o Guia de Digitalizao cumprindo a sua funo de estimular e orientar as Unidades da Embrapa no processo de organizao da informao, assim como integr-las e torn-las parte de uma grande rede de fornecedores de informaes digitais. recomendvel que esse Guia seja utilizado para ajudar o desenvolvimento do planejamento e implementao de digitalizao de materiais. Recentemente tem-se verificado a importncia de se aplicar tcnicas e padres de forma inteligente e consistente nos procedimentos relacionados a desenvolvimento e publicao de contedos digitais. O uso de padres, alm de adicionar longevidade e escalabilidade ao ciclo de vida dos materiais, tambm possibilita a um pblico ainda maior do que o originalmente pensado a descobrir e usar os recursos de informao. Um dos objetivos desse Guia de Digitalizao mostrar a importncia de se pensar na questo da sustentabilidade dos programas. Ao adotar prticas que possibilitam

beneficiando dos contedos digitais e fazendo novas combinaes e criando novos recursos. A padronizao assegura a qualidade, consistncia e segurana dos recursos, e faz com que eles sejam compatveis com os recursos de outras projetos. Iniciativas que utilizam essa abordagem promovem escalabilidade e

podem ser mantidas e gerenciadas com o mximo benefcio para todos. Resumindo, uma boa prtica de digitalizao de materiais pode ser avaliada pela sua capacidade de maximizar a utilizao desses recursos enquanto minimiza o custo de sua manuteno e uso.

Finalidade
O propsito deste documento oferecer orientaes bsicas e prover recomendaes mnimas necessrias digitalizao de materiais em formatos de texto, fotografia, mapas e ilustraes. Este guia no deve ser considerado como o melhor padro disponvel para digitalizao, mas sim como um recurso de orientao para a captura de imagem, apresentao, armazenagem e preservao de originais. Alm disso, o guia fornecer aos autores de materiais, tcnicos e dirigentes da empresa, orientaes necessrias para que eles possam avaliar se determinada estratgia de digitalizao proposta adequada ou no ao seus objetivos e materiais. Apesar deste documento no ter a inteno de ser a ltima palavra no assunto, ele pode ser utilizado como uma referncia para aqueles que esto iniciando procedimentos de digitalizao e publicao de seus recursos de informao. Este guia contempla principalmente orientaes que propem: Aumentar a interoperabilidade entre os diversos repositrios de contedos digitais.

Assegurar a acessibilidade aos recursos atravs do uso de padres e formatos amplamente aceitos.

Possibilitar o uso dos materiais por diversos pblicos. Incorporar procedimentos que estimulam a preservao dos materiais originais. As tecnologias esto constantemente mudando e se aperfeioando,

Princpios gerais
Escanear na maior resoluo possvel apropriada para a natureza do material original. Escanear em nvel de qualidade apropriado para evitar o re-trabalho e remanuseio dos originais no futuro. Criar e armazenar um arquivo mestre que poder ser utilizado para produzir arquivos de imagens derivadas que atendam a uma variedade de necessidades atuais e futuras. Preferir sistemas no-proprietrios. Utilizar formatos de arquivos e tcnicas de compresso em conformidade aos padres mais amplamente utilizados pelas comunidades que utilizam as informaes da EMBRAPA. Criar cpias de segurana de todos os arquivos em mdias estveis. Criar metadados significativos para os arquivos de imagens ou colees. Armazenar a mdia em ambiente apropriado. Documentar estratgias de migrao para transferncia de dados atravs das geraes de tecnologia.

Tpicos do Guia de Digitalizao


Introduo.................................................................................................. .3 Finalidade............................4 Princpios gerais ........................................................................................6 Planejamento........................................................................ .......... ............9 Fases do planejamento ... ..................................................... .......... .......... 10 Formas gerenciais de produo digital........................................................ 11 Na prpria Instituio ............................................................ .................... 11 Terceirizao ......................................................................................... 12 Audincia alvo........................................................................................... 13 As demandas e necessidades.................................................................... 14 A seleo de materiais......................................................... ....................15 Caractersticas do material original ............................16 Propriedades fsicas dos materiais ........................................................... 17 Objetivos da digitalizao........................................................................... 18 Direitos autorais ........................................................................................ 19 Equipamento............................................................................................. 19 Computador ............................................................................................... 20 Monitor ........................................................................................................20 Gravador de CD-DVD ................................................................................ 21 Porta de transferncia de alta velocidade .................................................. 21 Scanners ................................................................................................... 21 Resoluo.................................................................................................. 21 Profundidade de cores ............................................................................. . 22 rea de escaneamento .............................................................................. 22 Tempo de digitalizao .............................................................................. 22 Usabilidade .................................................................................................23 Cmeras digitais ...................................................................................... 23 Software..................................................................................................... 24 Criao de arquivos digitais .................................................................. 25 Arquivo mestre.......................................................................................... 26

Arquivo de imagens derivadas ................................................................. 26 Tipos de escaneamento........................................................................... 27 Digitalizao de documentos.................................................................. 28 Recomendaes para texto ...................................................................... 29 Recomendaes para Fotografias............................................................. 30 Recomendaes para Mapas..................................................................... 31 Recomendaes para Material grfico....................................................... 31 Recomendaes para imagens de diferentes funcionalidades ................. 32 Controle de qualidade ............................................................................. 33 Denominao dos arquivos......................................................................34 Armazenagem.......................... 35 Disco rgido ............. 36 CDs............. 36 DVDs............. 36 Metadados e Objetos digitais.................................................................. 37 Anexo I Fontes complementares de informao................................................ Escaneamento........................................................................................... Metadados ............. Outras fontes de informao.....................................................................

38 38 38 39

Anexo II Glossrio................................................................................................... 41

Planejamento
A iniciativa de digitalizar contedo requer um planejamento cuidadoso antes

projeto de digitalizao pode identificar mais facilmente a equipe de profissionais de que ele precisa, assim como estabelecer um modelo efetivo para o desenvolvimento do trabalho. Este Guia contem informaes sobre uma srie de aspectos tcnicos, mas sua maior contribuio espera-se estar na apresentao de questes mais fundamentais e de como elas esto relacionadas.

Fases do planejamento A audincia alvo A identificao da audincia deve ser a sua primeira preocupao, assim como as respostas s perguntas Quem precisa desse trabalho? Quem se beneficiar dele?. Seleo do material As informaes obtidas do levantamento inicial sobre a audincia influenciaro a etapa de seleo dos materiais que sero digitalizados. Nesta fase, voc tambm dever pensar sobre medidas relacionadas a direitos autorais, e sobre como os materiais digitalizados sero distribudos: quais as tecnologias que sero utilizadas, se o acesso aos contedos sero abertos ou controlados, e como voc poder alcanar o seu publico alvo. Estabelecendo padres A utilizao de padres, sempre que possvel, aumenta a longevidade, portabilidade e interoperabilidade do seu contedo. importante que voc conhea os padres que se aplicam ao tipo de digitalizao que voc est pretendendo. Seleo de equipamentos A seleo de equipamentos deve ser tomada considerando a funcionalidade requerida e as suas prioridades. Um exemplo disso poderia ser manter os custos baixos mais importante do que conseguir o melhor padro de captura de imagem. Equipe de trabalho A questo sobre metodologia e procedimentos est intimamente relacionada com a deciso sobre pessoal e, portanto, influenciar as decises acerca de Quem dever fazer o trabalho? Voc dever identificar o perfil dos profissionais necessrios e estabelecer as tarefas que espera que sejam

10

cumpridas. Nessa fase voc poder concluir que precisar de colaboradores externos junto a sua equipe.

Formas gerenciais de produo digital


As imagens digitalizadas podem ser produzidas sob duas condies: Na prpria instituio Nesta categoria enquadram-se as produes realizadas no mesmo ambiente detentor dos documentos a serem digitalizados ou na prpria instituio. Esta modalidade oferece vantagens e desvantagens, conforme pode ser observado abaixo. Vantagens da produo na prpria em presa:

Adquirir experincia no processo de digitalizao de imagens (projeto de administrao, familiaridade com a tecnologia, etc.).

Controlar o processo de digitalizao de imagem desde a manipulao dos originais at o armazenamento.

Ajustar os requerimentos necessrios quanto qualidade, acesso e escaneamento da imagem medida que se progride no processo.

Acompanhar diretamente o processo de digitalizao de imagens que melhor satisfaz as necessidades da Empresa e dos usurios.

Desvantagens da produo na prpria em

presa:

Requerer, inicialmente e durante o projeto, um grande investimento financeiro em equipamento e pessoal.

11

Necessitar mais tempo para a implementao do processo, da infraestrutura tcnica, e de gerao de imagens.

Exigir grande investimento para uma produo limitada. Necessitar de especialistas para consultoria, contratos e custos de manuteno,treinamento de pessoal, etc.

Desconhecer padres e prticas melhores.

Terceirizao Caso a Unidade no tenha condies ou no pretenda digitalizar suas imagens in loco, dever considerar as seguintes vantagens e desvantagens na terceirizao da atividade: Vantagens de terceirizar: Pagar pelo custo somente da digitalizao da imagem, no pelo equipamento ou equipe. Alto nvel de produo. Ter especialistas no assunto. Correr menos risco de perdas. Descartar custos relacionados com a obsolescncia da tecnologia, falhas, tempo de inatividade do sistema, necessidade de treinamento de mo-de-obra, etc.

Desvantagens de terceirizar: Menor controle sobre o processo de digitalizao de imagem e controle de qualidade. Necessitar o estabelecimento de contrato complexo, descrevendo todas as especificaes necessrias, direitos e deveres de ambas as partes.

12

Divergncia na comunicao entre vendedor e consumidor, dificultando o estabelecimento de padres de negociao e medio da qualidade do servio.

Necessitar transporte, manuseio e armazenamento dos originais por equipe da empresa de terceirizao.

Possvel inexperincia do prestadorpx

O material no formato digital me ajudar a atender melhor as necessidades dessas comunidades de usurios?

A digitalizao de materiais me ajudar a criar novas audincias para os meus materiais?

As demandas e necessidades do pblico alvo As necessidades do pblico da empresa, tambm devem guiar as decises do projeto de digitalizao. Apesar de ser difcil prever como ser o uso do

ambiente eletrnico no futuro, o que se sabe hoje sobre os hbitos dos usurios pode ser usado como referncia. O conhecimento do perfil dos usurios, e suas preferncias para acessar informao podem indicar vrios aspectos a serem atendidos, limitaes e possibilidades de desenvolvimento. Considere as seguintes questes sobre o seu pblico: Qual o tamanho do pblico alvo? Qual a distribuio geogrfica? H necessidade por acesso descentralizado (de diferentes instituies ou de casa)? O seu pblico necessita de ferramentas especiais ou condies especiais para utilizar os recursos digitais? H vrios grupos diferentes de usurios que precisaro de diferentes formas e nveis de acesso? Se voc ainda no tem suficiente informao sobre o seu pblico para responder essas questes, voc precisar de uma estratgia para colet-las e avaliar se os recursos digitais atendem as demandas atuais e futuras desses usurios. A digitalizao tambm pode ser utilizada para trazer novos pblicos e ajudar a expandir contedos especializados para um publico maior. Contedos

14

digitais podem reforar a educao continuada, e ajudar a promover a incluso social e cultural abrindo acesso para grupos menos favorecidos socialmente. O nvel de tecnologia que o pblico alvo utiliza para acessar informao digital tambm deve ser considerado como um fator importante na hora de selecionar os materiais e as metodologias para digitalizao. Se os usurios no tm comprimento de banda suficiente para baixar ou visualizar arquivos grandes como o de imagens, por exemplo, este material corre o risco de no ser disseminado com sucesso. Por outro lado, os seus usurios podem ter uma expectativa de sua empresa que ela ainda no est pronta para corresponder. Voc precisar ento decidir quais so as demandas mais importantes a serem atendidas, e traar estratgias para desenvolv-las.

A seleo de materiais
H uma srie de questes que devem ser consideradas ao decidir sobre o material que dever ser digitalizado, tais como as metas e caractersticas da instituio, o perfil e necessidades dos usurios, e as caractersticas dos prprios materiais. A seguir, algumas questes importantes que devem ser respondidas para a seleo de materiais: Qual o propsito de digitalizar material e quais os critrios que sero utilizados para selecion-los? Quais sero os usurios desses recursos? Quais so suas necessidades? Os materiais selecionados iro requerer cuidados especiais no manuseio?

15

Quais as caractersticas dos materiais e como elas podem afetar o processo de digitalizao?

Caractersticas do material original As colees de documentos, imagens, vdeos, e outros formatos de informao so componentes importantes do capital intelectual de uma empresa como a Embrapa. Um bom programa de digitalizao comea com um levantamento das diversas formas de material da instituio e sua relao com as demandas de seus pblicos. O planejamento para digitalizao dever basear-se nos requerimentos obtidos das anlises dos recursos analgicos e de suas caractersticas fsicas, e no a partir dos recursos tecnolgicos disponveis. A anlise dever incluir uma avaliao do material original, suas condies, caractersticas, e o seu valor educacional, cultural, histrico e cientfico. Questes que dev em ser respondidas antes da seleo de material par digitalizao: Qual a relevncia intelectual do material no formato analgico? original? H outro exemplar na instituio em melhores condies? O contedo est completo ou est faltando alguma parte? A informao est atualizada? A informao est correta? O material um interesse efmero dos dias de hoje, ou ele ainda ser de interesse com o passar do tempo? a

16

A digitalizao tambm pode aumentar o valor intelectual de seus materiais quando permite novas possibilidades educacionais, como por exemplo: Oferecendo cpias digitais de boa qualidade disponveis para acesso em diferentes instituies, e em diferentes pases; Permitindo o acesso997997ual de l7 Tms pases;

Propriedades fsicas dos materiais Tipo e categoria do recurso ( um livro impresso, texto escrito a mo, programa de TV em VHS, um original ou uma reproduo?) Data (quantos anos tem? Sabe quando foi feito? ) Tamanho e dimenses fsicas ( um livro de tamanho regular? uniforme? Qual o tamanho em cm? Qual a durao da fita de vdeo em horas/minutos/segundos?) Tipo de mdia (papel, Madeira, couro, vdeo cassete magntico; combinao de materiais?) Formato (disco de 78 rpm, fita cassete analgica, DAT (Digital Audio Tape), Betacam SP tape, NTSC ou PAL formato de vdeo) Estrutura do material (o material encadernado?) Condies de preservao (qual o estado de conservao? Dever ser preservado? Requer manuseio especial?)

Objetivos da digitalizao Alm dos passos j listados (examinar o valor intelectual dos recursos, como isto poder ser melhorado com a digitalizao, e considerar os atributos fsicos dos seus materiais), outros princpios podem ajud-lo a priorizar o processo de seleo. Abaixo, esto as principais razes para justificar uma iniciativa de digitalizao na instituio. Melhorar o acesso; Ajudar na preservao dos materiais originais reduzindo seu manuseio; Facilitar atividades de pesquisa;

18

Atender as necessidades do pblico; Complementar outras iniciativas de digitalizao, de dentro e fora da instituio.

Direitos autorais Assim que voc identificar o material que dever ser digitalizado comece a cuidar dos aspectos relacionados a propriedade intelectual. Se o material que voc quer digitalizar de domnio publico, ou se a empresa possui os direitos autorais e controla os direitos para digitalizao, ento voc provavelmente poder prosseguir sem impedimentos. Se os materiais que voc quer digitalizar no so de domnio pblico, e voc no controla os direitos autorais, ser preciso identificar o detentor desses direitos e solicitar permisso para digitalizar e publicar o material em questo. Mesmo que voc j saiba quem o detentor dos direitos, e mesmo que voc j tenha permisso para uso do material para certos propsitos, voc ainda ter que se certificar que a sua permisso cobre a digitalizao e publicao em meio digital.

Equipamento
O processo de digitalizao exige, antes de sua implementao, a busca de informaes bsicas que orientem a escolha de mquinas e equipamentos diferenciados, que possam atender tanto a tarefa de escanear como a de armazenar, organizar, visualizar e editar informaes. A escolha do equipamento depende, sobretudo, do tipo de material que ser escaneado, assim com a inteno de uso das imagens digitais.

19

Um dos grandes desafios de quem decide realizar um projeto de digitalizao est relacionado com a rapidez com que hardware e software se tornam obsoletos. Portanto, as decises sobre mquinas devem considerar as implicaes que as mudanas tecnolgicas podem ter no ciclo de vida dos materiais digitais. A escolha do equipamento depende, sobretudo, do tipo de material que ser escaneado assim como a inteno de uso das imagens digitais. A seguir, os tens bsicos para a digitalizao de documentos:

Computador muito importante selecionar o tipo adequado de computador para o processo de digitalizao. Os principais componentes que devem ser

considerados para a escolha do computador so: memria, velocidade do processador, o tamanho do espao para armazenagem, e portas de transferncia de dados. Principais componentes para a escolha do computador: Computador com o mximo de memria (RAM) possvel. Quanto mais memria mais capacidade para o computador processar informaes. Computador com processador otimizado para manipulao de imagens. Computador com capacidade para conexes do tipo USB ou IEEE1394. Gravador de CD e DVD.

Monitor Um monitor de alta qualidade, com tela acima de 17 polegadas, alta resoluo, alta velocidade, sem tremulaes e com suporte para vdeo RAM que possa produzir imagens representativas do original digitalizado fundamental para a manipulao e editorao de imagens.

20

Gravador de CD-DVD A aquisio de um gravador de CD-ROM ser necessria quando a Unidade optar pela armazenagem das imagens digitalizadas em CDs. Para salvar as imagens em CD-ROM necessrio que o equipamento adquirido esteja de acordo com as normas ISO e que suporte uma variedade de formatos.

Porta de transferncia de alta velocidade

(USB 2.0 ou Fi

de amostragens da imagem capturada. Entretanto, existem limites para essa tcnica, que pode produzir imagens com menor nvel de detalhes. Profundidade de cores Trata-se do nmero de cores que cada ponto captado pelo scanner pode ter: preto e branco (1 bit), 256 cores ou escala de cinzas (8 bits), e True Color (24 bits). Quanto maior a profundidade de cores maior a quantidade de informaes capturada pelo scanner, e portanto, maior a similaridade entre a cpia e o original. rea de escaneamento A rea de digitalizao do scanner, normalmente delimitada pela superfcie de vidro do equipamento, costuma variar pouco de um modelo para outro. Em geral todos os scanners so capazes de digitalizar documentos com a largura mxima de uma folha tamanho carta e o comprimento de uma folha formato A4. Tampas removveis facilitam a digitalizao de objetos de grande espessura, como livros e revistas. A capacidade de aceitar acessrios extra, tais como alimentador de folhas avulsas, so oferecidos como opcionais em alguns modelos mais sofisticados. Para escanear slides, diapositivos, negativos ou transparncias, o ideal que se utilize um scanner prprio para esse tipo de material. Tempo de digitalizao Uma caracterstica normalmente associada ao desempenho de um scanner o tempo que o equipamento demora para digitalizar um documento. Isso pode ser influenciado por vrios fatores, entre eles, a resoluo desejada, o nmero de passadas do carro do sensor e as caractersticas do programa de digitalizao.

22

Usabilidade Algumas interfaces so bastante simples, limitando-se a definir cor, resoluo, e rea de digitalizao; outras apresentam interfaces complexas com vrias opes de tratamento de imagem no prprio programa. A complexidade da interface pode transformar a digitalizao num complicado processo de captura e tratamento de imagem, que toma tempo, processamento do computador, e, em muitos casos, a pacincia do usurio.

Cmeras digitais Embora sejam equipamentos que exigem altos investimentos, as cmeras digitais manuais disponveis atualmente no mercado no so boas para escaneamento de grandes arquivos, com exceo das cmeras digitais de alta resoluo (Kontron, Zeutschel, Leica) usadas por grandes instituies e empresas no ramo comercial de imagens. As cmeras digitais de alta resoluo no tm nenhuma limitao para o escaneamento e podem capturar numa resoluo extremamente alta. Porm elas tm requerimentos especficos sobre iluminao, e exigem um alto nvel de habilidade do operador. As vantagens dessas cmeras esto no grande potencial para escanear materiais de tamanho grande, todos os formatos de mdia, materiais encadernados, e o baixo risco na operao com os materiais frgeis. As cmeras digitais no usam filme para capturar imagens. As fotografias so armazenadas numa mdia interna ou em cartes de memria. A capacidade varia de 4MB a 512MB e est aumentando cada vez mais com o progresso da tecnologia. Os cartes de memria guardam um nmero razovel de imagens, dependendo da resoluo escolhida e da capacidade do carto. Se voc utilizar o formato TIFF de imagens, ento os arquivos sero grandes, e logo esgotaro a capacidade do carto. Portanto, voc dever optar por transferir as imagens diretamente para o seu computador, antes de tirar novas fotografias. 23

Software H dois tipos de software necessrios para a digitalizao de imagens. Um deles o software de escaneamento que vem com o scanner; o outro, o software de edio de imagens, normalmente aplicado aps a captura da imagem. Alguns softwares, como o Adobe Photoshop, podem servir tanto como software de escaneamento como de edio de imagem. O software de escaneamento geralmente limitado quanto a

funcionalidade. Deve-se escolher um software de escaneamento que tenha pelo menos a funcionalidade de salvar os arquivos de imagens em formatos padres, tais como TIFF, JPG, GIF etc. Essa funcionalidade ajuda na produo e permite ampla opo de imagens para distribuio em diferentes mdias. Os tipos de software que convertem arquivos de imagens de um formato para outro tambm sero teis. Para produzir imagens com qualidade adequada, importante investir em software de edio de imagens. Normalmente esses software so usados para limpar a imagem, removendo imperfeies, pontos, manchas etc., e para correo, tais como ajuste do nvel de brilho e contraste. Um software de edio de imagem deve ter, entre outras, as seguintes funes: cortar, inclinar, virar, ajustar nvel de brilho e contraste; realar a imagem; controlar o zoom; acomodar diferentes formatos de arquivos; fornecer controle para gama, preto-e-branco e cores (RGB e CMYK); fornecer um histograma; e possibilitar ao usurio criar e salvar situaes customizadas. A escolha do software de edio baseada no nvel de manipulao de imagens desejado e no nvel de especializao dos indivduos que vo utiliz-lo. Alguns softwares de edio de imagens, como o Adobe Photoshop, so muito avanados e podem requerer algum tempo e treinamento para a aprendizagem.

24

Outros softwares mais bsicos permitem somente operaes limitadas, como cortar e girar e, portanto, so de fcil domnio. Alm de considerar a capacidade e a facilidade de uso de um software de edio de imagens, certifique-se de que a tecnologia utiliza

Evitar a duplicao ou o re-trabalho no processo de digitalizao de imagens, diante da evoluo tecnolgica das mquinas e equipamentos.

Os padres apresentados no pretendem ser considerados como verdadeiros, mas guiar a captura, apresentao e armazenamento de imagens, portanto os documentos de caractersticas diferentes das aqui apresentadas devem receber tratamento diferenciado.

Arquivo mestre Trata-se de arquivos de imagens digitais que contm o mximo de atributos das imagens originais. O arquivo mestre deve ser de alta qualidade, visto que preserva o contedo informacional do original, possibilitando variados usos e formatos alternativos para atendimento s vrias demandas, evitando re-trabalho de digitalizao. A cpia mestra no deve ser editada nem compactada. Os arquivos de imagens mestras so muito grandes para serem armazenados on-line. Uma alternativa armazenar esses arquivos em CD ou DVD.

Arquivo de imagens derivadas Arquivos derivados so criados a partir da imagem digital mestra e so usados geralmente para acesso na Web. Arquivos derivados incluem imagens de acesso, dimensionadas para a tela de um monitor mdio, e suas respectivas miniaturas. So geralmente armazenadas on-line.

26

Tabela 1. Caractersticas dos diversos arquivos de imagens.

Tipos de escaneamento

Existem trs tipos de escaneamento: preto-e-branco, em escala de cinzas e colorido. As caractersticas desses 3 tipos so descritas abaixo. Preto-e-branco (Bitonal) Um bit por pixel representando preto-ebranco. O escaneamento bitonal mais apropriado para documentos de alto contraste como textos impressos. Escala de Cinza (Grayscale) Mltiplos bits por pixels representando tons de cinza. A escala de cinza prpria para documentos de tons contnuos, como fotografias em preto-e-branco.

27

Cores (True Colors) Mltiplos bits por pixel representando cores. Escaneamento em cores apropriado para informaes coloridas. documentos com

Esses trs tipos de escaneamento requerem algumas decises subjetivas. Por exemplo, um documento datilografado em preto-e-branco pode ter anotaes em tinta vermelha. Embora o escaneamento bitonal seja freqentemente usado para textos, o escaneamento em cores pode ser preferido neste caso, dependendo de como a imagem ser usada. Manuscritos e documentos impressos antigos podem ter melhor tratamento se escaneados nas cores contnuas da escala de cinza ou cores, para assegurar a reproduo das nuances, as condies do papel e outras marcas nele gravadas.

Digitalizao de documentos As recomendaes tcnicas contidas neste guia foram direcionadas para os seguintes tipos de documentos: Impressos (Texto impresso, fotocpias, documentos datilografados ou impressos a laser que possam conter esboos, ilustraes, manuscritos etc. Podem ser includas nesta categoria as fotografias em preto-ebranco e coloridas). Fotografias (Negativos de filme e transparncias). Mapas Material grfico (Esboos, ilustraes artsticas, litografias, aquarelas etc).

A profundidade de tons ser determinada pela natureza do material escaneado, e pela funcionalidade do scanner utilizado. Os formatos de arquivos sugeridos no so proprietrios e combinam com o padro da indstria.

28

Dependendo do formato do arquivo, podem ocorrer perdas na compactao da imagem. Compactao com baixos nveis de perdas resulta num arquivo similar imagem original; na compactao com perdas, certa quantidade de informao descartada durante o processo. Embora a informao descartada seja invisvel aos olhos humanos

Nota: Alm dos formatos anteriormente mencionados para texto, pode-se adotar o seguinte formato alternativo. PDF (Portable Document Format) da Adobe um formato de arquivo alternativo para criao e exibio de arquivos de textos na Web. Requer o software Adobe Acrobat para criao e manipulao de arquivos. O download do Adobe Acrobat Viewer grtis e a verso permite aos usurios visualizar os documentos em seus computadores. Para maiores informaes, veja http://www.adobe.com.br
Tabela 3. Recomendaes para Fotografias

Nota: Para produzir imagens escaneadas de alta qualidade recomenda-se o uso do negativo da fotografia. Outra considerao relaciona-se deciso de escanear em preto-ebranco ou cores, as fotografias em spia. Recomenda-se escane-las em cores para criar uma imagem melhor, embora isto aumente muito o tamanho do arquivo.

30

Tabela 4. Recomendaes para Mapas

Tabela 5. Recomendaes para Material grfico

A tabela a seguir resume as informaes sobre imagens mestras, de acesso e miniaturas relacionadas com o tipo de material escaneado.

31

Tabela 6. Recomendaes para digitalizar imagens de diferentes funcionalidades.

32

Controle de qualidade

Falta de nitidez/definio excessiva Presena de artefatos digitais (linhas atravs da figura) Padres de moire (ondulaes ou redemoinhos) Imagem no aparada Imagem de cabea para baixo ou invertida Imagem distorcida ou no centralizada Equilbrio de cores incorreto Imagem fosca ou sem variao de cor Curva negativa na tabela de verificao Recorte de valores em preto-e-branco (em um histograma)

Denominao dos arquivos

necessrio considerar a nomenclatura que ser usada para nomear os arquivos antes de comear o processo de digitalizao. O nome do arquivo deve ser um conjunto de informaes que identifique unicamente aquela imagem. O nome do arquivo deve incluir o nome da coleo ou Unidade assim como o nmero da imagem, mais a extenso apropriada (.gif, .jpg, .tif). Os nomes dos arquivos no devem ter mais de 8 caracteres e no devem incluir espaos ou smbolos tais como ? , /, ou # etc.

34

Armazenagem
Digitalizar recursos requer a criao de uma infra-estrutura significativa para arquivar material digital. Entre outros componentes dessa infra-estrutura deve haver um robusto repositrio digital, um sistema de controle de qualidade e administrao de acessos. Existem vrias opes para armazenagem de material digital, e as mais comuns so: a utilizao de discos rgidos internos, discos ticos, e discos de rede. Discos rgidos internos de computadores so relativamente rpidos e capazes, mas como so diariamente utilizados h sempre o risco de falha, infeco de vrus e outros problemas. preciso estar constantemente providenciando algum tipo de backup em outro formato de armazenagem. Discos ticos (que incluem CD-R e DVD-R) so removveis e de razovel durabilidade, apesar de terem capacidade limitada (640 Mb para CD-R, 6 GB para DVD-R). Cada uma dessas opes ideal para alguns propsitos e inadequada para outros. Portanto, quando decidir por um formato de armazenagem, voc deve considerar primeiramente o tipo de demanda do seu projeto. Se o propsito for backup e preservao essencial que a mdia de armazenagem seja removvel e durvel. Dependendo da quantidade de informao que voc precisa guardar, provvel que tambm seja necessrio uma grande capacidade. Para projetos menores, ou projetos que lidam com pequenos arquivos, a armazenagem em CDROM ou DVD devem ser suficientes.

A Tabela 7 mostra as vantagens e desvantagens dos diversos tipos de mdias de armazenagem.

35

Tabela 7. Tipos de mdia para armazenagem

Se o material destina-se a acesso on-line, h necessidade de adicionar equipamento extra para integrar o meio de armazenagem s redes. Para que uma coleo digital seja acessada via Web, faz-se necessrio os servios de manuteno de rede e suporte, e de uma equipe treinada. O procedimento mais comum para projetos digitais armazenar as imagens mestre off-line em CD-ROMs, e disponibilizar as verses de acesso e as miniaturas on-line 24 horas. Imagens mestras podem ser vistas mediante solicitao, pessoalmente ou por meio de emprstimo de CDs.

36

Metadados e Objetos digitais

Metadado significa informaes sobre os dados, informaes criadas sobre o material e a verso digital, o registro de sua identidade, criao, uso, e estrutura. O propsito do metadado facilitar a pesquisa, o uso, a administrao e reutilizao de material digital. Os oo347

s4o4e eoo 3ds3mnes l tt

ANEXO I FONTES COMPLEMENTARES DE INFORMAO

Escaneamento www.scantips.com/ Um bom site com informaes prticas sobre escaneamento. Especialmente para avaliar caractersitcas de scanners. www.tasi.ac.uk/advice/creating/creating.html Contm revises avanadas sobre scanners e cmeras digitais. www.flatbed-scanner-review.org/ Avalia scanners de alta resoluo em termos de sua habilidade para escanear slides e negativos. www.imaging-resource.com/ Informaes sobre cmeras digitais.

Metadados Adrienne Muir, Copyright and Licensing for Digital Preservation, http://www.cilip.org.uk/update/issues/jun03/article2june.html Dublin Core initiative for administrative metadata http://metadata.net/admin/draft-iannella-admin-01.txt Data Dictionary for Administrative Metadata for Audio, Image, Text, and Video Content to Support the Revision of Extension Schemas for METS http://lcweb.loc.gov/rr/mopic/avprot/extension2.html Dublin Core Metadata Initiative http://dublincore.org/usage/terms/dc/current-elements/ Harvard University Librarys Digital Repository Services (DRS) User Manual for Data Loading, Version 2.04 http://hul.harvard.edu/ois/systems/drs/drs_load_manual.pdf June M. Besek, Copyright Issues Relevant to the Creation of a Digital Archive: A Preliminary Assessment, January 2003 38

http://www.clir.org/pubs/reports/pub112/contents.html Karen Coyle, Rights Expression Languages, A Report to the Library of Congress, February 2004, http://www.loc.gov/standards/Coylereport_final1single.pdf Making of America 2 (MOA2) Digital Object Standard: Metadata, Content, and Encoding http://www.cdlib.org/about/publications/CDLObjectStd-2001.pdf

NARAs Lifecycle Data Requirements Guide (LCDRG), January 2002, http://www.nara-atwork.gov/archives_and_records_mgmt /archives_and_activities/ accessioning_processing_description/ lifecycle/

Official EAD site at the Library of Congress http://lcweb.loc.gov/ead/ Research Library Groups Best Practices Guidelines for EAD http://www.rlg.org/rlgead/eadguides.html

Metadata Encoding and Transmission Standard (METS) rights extension schema http://www.loc.gov/standards/rights/METSRights.xsd Peter B. Hirtle, Archives or Assets? http://techreports.library.cornell.edu:8081/Dienst/UI/1.0/Display/cul.lib/2003-2

Outras fontes de informao Moving Theory into Practice, Cornell University Library, http://www.library.cornell.edu/preservation/tutorial/ HANDBOOK FOR DIGITAL PROJECTS: A Management Tool for Preservation and Access, Northeast Document Conservation Center, http://www.nedcc.org/digital/dighome.htm Guides to Quality in Visual Resource Imaging, Digital Library Federation and Research Libraries Group, July 2000, http://www.rlg.org/visguides Project Management Outlines NDLP Project Planning Checklist, Library of Congress, http://lcweb2.loc.gov/ammem/prjplan.html

39

Considerations for Project Management, by Stephen Chapman, HANDBOOK FOR DIGITAL PROJECTS: A Management Tool for Preservation and Access, Northeast Document Conservation Center, available at http://www.nedcc.org/digital/dighome.htm Planning an Imaging Project, by Linda Serenson Colet, Guides to Quality in Visual Resource Imaging, Digital Library Federation and Research Libraries Group, http://www.rlg.org/visguides/visguide1.html

40

ANEXO II GLOSSRIO

Backup Uma cpia exata de um programa, disco ou arquivo de dados, feita para fins de arquivamento ou para salvaguardar arquivos importantes na eventualidade de que a cpia ativa (original) seja danificada ou destruda. Poare pelo us22.38t3.31cnicas12 0

GIF - Grafic Image File Format Formato de baixa resoluo, adequado para apresentaes em telas. GIF (e JPEG) so os formatos mais usados para imagens em miniatura. O formato GIF reconhecido pela maioria das plataformas, programas de Internet e software de edio de imagens. Hard copy Cpia impressa em papel, filme ou outro meio permanente. Imagem derivada Imagem criada a partir de outra imagem atravs de algum tipo de processo automtico, geralmente com perda de informao. Entre as tcnicas usadas para criar imagens derivadas, esto: criao de exemplar em menor resoluo; uso de tcnicas de compactao com perda de informao; e alterao da imagem com utilizao de tcnicas de processamento. Interferncia Noise Marca no identificvel e que no corresponde ao documento original que surge durante o processo de escaneamento ou transferncia de dados. Intranet Rede projetada para o processamento de informaes em uma empresa ou organizao. JPEG Joint Photographic Experts Group Formato adequado para apresentao impressa e em tela. JPEG reconhecido pela maioria das plataformas de computador, programas de Internet e software de imagens. Links Conectar dois elementos de uma estrutura de dados usando variveis de ndice de ponteiros. Metadado significa informaes sobre os dados, informaes criadas sobre o material e a verso digital, o registro de sua identidade, criao, uso, e estrutura. Moire Distoro ondulada ou oscilao visvel em uma imagem que apresentada ou impressa com uma resoluo inadequada. Off line Programa ou dispositivo computacional que no capaz de se comunicar com um computador ou ser controlado por ele. On-line Programa ou dispositivo de computador que est ativado e pronto para operao, capaz de se comunicar com um computador ou ser controlado por ele. Um ou mais computadores conectados a uma rede. Pixel Termo reduzido de picture element. Cada pixel pode representar um nmero de diferentes tons e cores, dependendo do espao de armazenagem designado para ele. Muitas vezes o termo pixels per inch (ppi) preferido por descrever mais acuradamente a imagem digital.

42

Plug in 1. Pequeno programa que se associa a uma aplicao maior para ampliar sua funcionalidade. 2. Componente de software que se associa ao Netscape Navigator. Scanner Dispositivo ptico de entrada que usa sensores de luz para capturar uma imagem no papel ou algum outro meio. A imagem traduzida em sinais digitais que podem ser processados por softwares de reconhecimento de caracteres pticos (OCR) ou softwares grficos. TIFF - Tagged Image File Format Esse formato permite manter um alto nvel de detalhe da imagem. indicado como formato para os arquivos de imagens mestre. Twain um protocolo padro de comunicao para enviar instrues para hardware (como o scanner) e receber dados de volta ( como a imagem) Website Stio da Web. Zoom Ampliar. A ampliao de uma poro selecionada de uma imagem grfica ou documento de modo que preencha toda a tela. A ampliao um recurso dos programas de desenho geomtrico, processadores de textos e de planilhas que permite ao usurio selecionar uma pequena parte da tela, ampliar a imagem e fazer alteraes na parte ampliada, com uma riqueza maior de detalhes.

43

Вам также может понравиться