You are on page 1of 8

Área

Gestão

Sub área O direito autoral e a preservação digital em unidades de informação

DA DIGITALIZAÇÃO DE SUMÁRIOS À POLÍTICA DE PRESERVAÇÃO DIGITAL

Magda De Conto Bibliotecária Consultora na Área Jurídica Rua Visconde do Herval, 766, Menino Deus – Porto Alegre/RS BRASIL – magdadeconto@yahoo.com.br

2

DA DIGITALIZAÇÃO DE SUMÁRIOS À POLÍTICA DE PRESERVAÇÃO DIGITAL

Resumo

Magda De Conto*

Relata experiência de um escritório de advocacia na digitalização dos sumários das obras de sua biblioteca visando pesquisa direta em texto e sua política de preservação digital. Apresenta o primeiro estágio do projeto: escolha do mecanismo indexador e de busca, estudo da lei dos direitos autorais e cita padrões adotados. Descreve o segundo estágio atualmente em implantação, o do desenvolvimento de uma política de preservação digital e uso de metadados para identificar o objeto digital. O projeto prevê ainda o terceiro estágio, de estudo e implementação de novas práticas relacionadas à preservação física, lógica e intelectual dos objetos digitais.

Palavras-chave: Digitalização. Objeto digital. Preservação digital. Metadados.

1 Introdução

A área jurídica possui várias peculiaridades que a distingue de outras áreas na busca pela informação. Uma delas é a necessidade de se pesquisar no inteiro teor do documento. Poucas são as ferramentas e sistemas capazes de realizar tal tarefa. A maioria dos softwares disponíveis para bibliotecas realiza uma busca nos registros bibliográficos, disponibilizando o conteúdo do documento para consulta através de links. Sendo assim, na maioria das vezes o usuário se vê obrigado a fazer nova busca, agora no conteúdo do texto linkado, utilizando o localizador de programas como o do Adobe ou do Word, por exemplo, caso os arquivos tenham sido digitalizados em pdf ou texto.

_______________

*Bibliotecária Consultora na Área Jurídica, com experiência em implantação de softwares e colocação de banco de dados na Internet. E - mail: magdadeconto@yahoo.com.br

3

No intuito de melhorar esta dinâmica, a bibliotecária responsável pelos livros no escritório de advocacia realizou um levantamento de softwares disponíveis no mercado que pudessem pesquisar diretamente no texto, pois o objetivo do trabalho era o de digitalizar os sumários dos livros existentes no escritório em formato texto para que a pesquisa pudesse ser feita diretamente no conteúdo do sumário, eliminando-se assim, uma etapa no processo de busca. O software também deveria de alguma forma estruturar a informação e ser de baixo custo.

2 Primeiro estágio

2.1 A procura de mecanismos de busca

No final de 2005, além da escolha do scanner e programas complementares que facilitassem a digitalização dos documentos, houve análise de alguns softwares conhecidos como Search Engines. Estes softwares montam um sistema de indexação e busca para arquivos do computador do usuário, rede ou web. Na grande maioria os resultados são apresentados numa tela de fácil entendimento e operacionalidade, ou no próprio navegador (Internet Explorer, Mozilla, Opera, Firefox, Netscape). Alguns indexam automaticamente os arquivos digitalizados, outros somente se ativada a tarefa; permitem configurações como uso de operadores booleanos, aceitam uma infinidade de formatos de arquivos (html, rtf, pdf, txt, xml, ppt, asp, php, xml, gif, jpg,), são de fácil manuseio e rápidos na resposta. Search Maker Pro, Google Search, Copernic Desktop Search, Windows Desktop Search, foram alguns dos programas analisados que rodavam em ambiente Windows. Além destes, foram encontrados mecanismos de indexação e busca para ambiente Linux, como o Kat Desktop Search Engine, o Beagle e Spotlight, este último para ambiente Mac Os. Como a rede existente no escritório baseia-se no Windows, buscou-se um software compatível com o sistema operacional, que pudesse ser acessado através

4

da rede, que possibilitasse configuração da página de pesquisa, controle dos links gerados, que aceitasse os formatos de texto, pois havia a necessidade de se alterar o conteúdo digitalizado acrescentando referência do material e localização, e que permitisse trabalhar com metadados. O software adotado foi o Search Maker Pro. Este software além de indexar as páginas digitalizadas, ou seja, converter em links relativos, gera o índice de forma dinâmica, utilizando JavaScript.

2.2 Direito autoral

Outro ponto pesquisado foi a questão do direito autoral. Segundo artigo 46 da Lei 9.610/98 que altera, atualiza e consolida a legislação sobre direitos autorais e regulamenta dentre outras coisas a cópia no Brasil, é permitida a reprodução de

pequenos trechos da obra, para fins privados, sem o intuito de lucro. O entendimento de “pequeno trecho”, segundo Carboni (2007) é de cerca de 15 % a 20 % da obra e que não contenha a “essência do texto”. O sumário dá ao leitor a idéia do que a obra contém, mas não de sua essência. Existem na biblioteca do escritório cerca de 2.000 sumários, e por mais detalhados que sejam, não chegam a 5% da obra. São acrescentadas também ao texto digitalizado informações que identificam o trecho copiado, a própria referência do livro. O sumário não constitui em si o conteúdo da obra, sendo então, possível sua cópia. A Lei 9.610/98 em seu artigo 8º, inciso VI, afirma que “Não são objeto de

proteção como direitos autorais de que trata esta Lei: ...

os

nomes e títulos isolados” .

Além disso, a digitalização do sumário não prejudica o mercado editorial e não causa prejuízos aos interesses legítimos do autor. O direito moral do autor citado no art. 24, de ter seu nome citado, é preservado. O conteúdo digitalizado somente é visualizado em tela, esta prática não configura violação de direitos autorais segundo informações obtidas no Seminário Gestão da Informação Jurídica em Espaços Digitais, ocorrido em Brasília (2007).

5

2.3 Adoção de Padrões

Uma das primeiras medidas que foram tomadas logo após a instalação do software foi a padronização das rotinas de digitalização, principalmente na forma como o conteúdo iria ser disponibilizado a fim de tornar a informação um objeto digital, ou seja, um “arquivo digital contendo informações organizadas, passíveis de proteção de propriedade intelectual ou patrimonial.” (PAVANI, 2005). Estas medidas também envolviam utilização de fontes não proprietárias, definição do formato de arquivo a ser utilizado, leiaute da página digitalizada, referenciação completa do livro e não só dos elementos essenciaIs segundo a norma de referências bibliográficas NBR 6023:2002.

3 Segundo Estágio

3.1 Preservação digital

Logo no início do trabalho percebeu-se a necessidade de perenizar as informações digitalizadas a fim de que continuassem a ser consultadas através de

outros softwares caso o programa adotado não estivesse mais disponível ou mesmo a tecnologia que dá suporte. Considerou-se que para implantar medidas para preservação digital seria necessária a adoção de métodos e tecnologias que

protegessem e garantissem sua manutenção (

Arellano,
Arellano,

2004, p.17) e que integrariam

a preservação física, lógica e intelectual dos objetos digitais. A preservação física está focada no suporte onde a informação está armazenada: disco rígido, discos óticos, fitas DAT, fitas VHS. No escritório os dados são primeiramente digitalizados em rtf, posteriormente convertidos para html e armazenados no servidor do escritório. Há rotina de geração de cópias de segurança periódicas para Cd-Rom, sendo que uma cópia de segurança atualizada é mantida em outro prédio.

6

Já a preservação lógica preocupa-se com a atualização da tecnologia. Há buscas constantes pela atualização do software adotado e por novos softwares que possam substituir e ampliar as possibilidades de armazenamento e preservação. Com relação a isso, Pavani (2005) comenta que “é importante a possibilidade de migrar de tempos em tempos o conteúdo para um outro ambiente”. Com o atual sistema e organização de arquivos, qualquer que seja mecanismo de busca, há possibilidade de migração e conversão de arquivos. Também se faz a procura por novo hardware a fim de manter vigente os dados para leitura. A preservação intelectual está relacionada aos mecanismos que garantem autenticidade e integridade da informação. Neste sentido, há dupla revisão do que foi digitalizado, consulta ao catálogo de autoridades visando a integridade e qualidade dos dados. Não se aplica aqui o uso de assinaturas digitais, marca d’ água ou criptografia .

3.2 Metadados

Os objetos digitais são identificados através de metadados. Estes são dados estruturados, informações sobre estes objetos: língua, título, descrição, relação com outros objetos, propriedade intelectual. Estes dados facilitam a preservação da informação a longo prazo e acesso contínuo. O Search Maker disponibiliza o Dublin Core – Dublin Core Metadata Element Set, um conjunto de 15 (quinze) elementos para descrição, armazenados como parte integrante do objeto que descrevem, inseridos no arquivo html através da tag <meta name>.

6 Já a preservação lógica preocupa-se com a atualização da tecnologia. Há buscas constantes pela atualização

Figura 1. Campos disponíveis do Dublin Core no Search Maker

7

  • 4 Terceiro Estágio

A terceira fase será implementada ainda no ano de 2007. Dentre as atividades está o planejamento da preservação a longo prazo através da pesquisa de softwares que melhoram a cópia digital, retirando manchas de tinta, amarelados do papel; da análise do PDF-Archive – tags, etiquetas para o armazenamento arquivístico de documentos eletrônicos (PDF-A), e da disponibilização destes sumários na BdJur – Biblioteca Digital Jurídica do Superior Tribunal de Justiça – STJ, onde os arquivos receberão novos tratamentos, tendo em vista sua publicação para o público em geral, numa colaboração para o desenvolvimento desta biblioteca digital da área jurídica.

  • 5 Conclusão

O objetivo

do

trabalho que era

o

de

digitalizar os sumários a fim de

disponibilizar uma pesquisa rápida mas ao mesmo tempo com alto grau de especificidade foi alcançado. Verifica-se a necessidade de se manter a política de preservação digital, já que o escritório está num ritmo cada vez mais acelerado de produção de arquivos eletrônicos A disponibilização destes sumários na Biblioteca Digital Jurídica do STJ vem contribuir para o aperfeiçoamento do trabalho.

  • 6 Bibliografia consultada

ARELLANO, Miguel Angel. Preservação de documentos digitais. Ciência da Informação, Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004.

BRASIL. Lei n. 9.610 de 19 de fevereiro de 1998. Altera, atualiza e consolida a legislação sobre direitos autorais e dá outras providências. Diário Oficial da União. Brasília, DF, 20 fev. 1998.

8

CARBONI, Guilherme. Direitos autorais em espaços digitais. In: SEMINÁRIO GESTÃO DA INFORMAÇÃO JURÍDICA EM ESPAÇOS DIGITAIS, 1, 2007, Brasília, DF. [Anotações]. Brasília: STF, 2007.

HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Disponível em: <http://www.uky.edu/~kiernan/DL/ hedstrom.html> Acesso em: 25 de mar. 2007.

LIMA, Gladys Machado Pereira Santos Lima; CUNHA, Maria Rosângela da. Preservação digital na Marinha do Brasil. In: WORKSHOP EM BIBLIOTECAS DIGITAIS, 1, 2005, Uberlândia, MG. [Biblioteca digital brasileira da Computação] Disponível em: <http://www.lbd.dcc.ufmg.br:8080/colecoes/wdl/2005/Preservacao DigitalMBcr.pdf>. Acesso em: 12 de mar. 2007.

PAVANI, Ana. Curso de ETDs: Electronic Theses e Dissertations [palestra]. Porto Alegre, 2005.

SARAMAGO, M.L. Metadados para preservação digital e aplicação do modelo

OAIS.

Acesso em: 03 de mar. 2007.

SHEARCH Maker Pro. Disponível em: <http://www.searchmakerpro.com>. Acesso em: 07 mar. 2007.

SEMINÁRIO GESTÃO DA INFORMAÇÃO JURÍDICA EM ESPAÇOS DIGITAIS, 1, 2007, Brasília, DF. [Palestras]. Disponível em: <http://www.stf.gov.br/sijed/ palestras.asp>. Acesso em: 22 fev. 2007.

SULLIVAN, Susan. PDF Worldwide collaboration to preserve electronic documents. Iso Focus, Boston, p. 17-20, mar. 2006.

Abstract

This

article explains about the

experience of a legal profession office in the

digitization of the summaries of the books, seeking direct research in text and its politics of digital preservation. It presents the first stage of the project: choose of the index mechanism and search engine, implication of the law of the copyrights and it mentions adopted patterns. It describes the second stage now in implantation:

development politics of digital preservation and metadados, used to identify the digital object. The project still foresees the third stage, of study and implementation of new related practices the physical, logic and intellectual preservation of the digital objects.