You are on page 1of 106

Gesto de Documentos Eletrnicos:

autenticidade, acesso a longo prazo e


manuteno da cadeia de custdia

Prof. Dr. Daniel Flores


UFSM

Assembleia Legislativa do Estado de So Paulo, 09 de novembro de 2015


Para citar este material do Grupo CNPq-UFSM
Ged/A - Documentos Arquivsticos Digitais

Referncias:
FLORES, Daniel. Gesto de Documentos Eletrnicos: autenticidade, acesso a
longo prazo e manuteno da cadeia de custdia. So Paulo - SP: Prof. Dr. Daniel
Flores, 2015. 105 slides, color, Padro Slides Google Drive/Docs 4x3. Material
elaborado pelo Prof. Dr. Daniel Flores/Lder do Grupo de Pesquisa CNPq-UFSM
Ged/A - Documentos Arquivsticos Digitais para a Palestra Proferida na Assembleia
Legislativa do Estado de So Paulo - ALESP em 09 de novembro de 2015. Disponvel
em: <http://documentosdigitais.blogspot.com>. Acesso em: 09 novembro 2015.

Citao com autor includo no texto:


Flores (2015)

Citao com autor no includo no texto:


(FLORES, 2015)
Os marcos dos Arquivos
Fonte: Dissertao de ROCCO, Brenda Couto de Brito.
A autenticidade e o acesso longo prazo dos
Documentos Contemporneos (marcos):

Complexidade e Especificidade do Documento


Arquivstico Digital;
2011 e-ARQ Brasil (Gesto de Documentos - Arquivos
Corrente e Intermedirio) - CONARQ;
ISO 16.363: 2011 (Auditoria e Certificao de
Repositrios);
2014 RDC-Arq (Repositrios Arquivsticos Digitais
Confiveis);
Diplomtica Contempornea: Autenticidade com o
Documento, Fixidez, Forma Fixa, Contedo Estvel
...;
Diplomtica Contempornea

Diplomtica Especial (Duranti-Rosely, Bellotto) -


Diplomtica Digital, Arquivstica;
Tipologia, Forma Documental + Atividade (conjunto
orgnico);
Forma Fixa e Contedo Estvel;
Variabilidade Limitada;
Forma Documental Manifestada ou Armazenada;
Cincia autnoma, independente, retro-alimentada;

Como ser visto na abordagem de cada especificidade


do RDC-Arq para a garantia da Autenticidade;
LAI - Lei 12.527/2011

O que a Lei de Acesso Informao?


A Lei n 12.527/2011, conhecida como Lei de Acesso Informao - LAI,
regulamenta o direito, previsto na Constituio, de qualquer pessoa solicitar e
receber dos rgos e entidades pblicos, de todos os entes e Poderes,
informaes pblicas por eles produzidas ou custodiadas.
O que so informaes?
De acordo com o art. 4, inciso I, da Lei n 12.527/2011, informaes so
dados, processados ou no, que podem ser utilizados para produo e
transmisso de conhecimento, registrados em qualquer suporte ou formato.
Quais so os prazos para resposta dos pedidos apresentados com base
na da Lei de Acesso Informao?
Se a informao estiver disponvel, ela deve ser entregue imediatamente ao
solicitante. Caso no seja possvel conceder o acesso imediato, o rgo ou
entidade tem at 20 (vinte) dias para atender ao pedido, prazo que pode ser
prorrogado por mais 10 (dez) dias, se houver justificativa expressa.
Transparncia Ativa
Transformando a Transparncia Passiva em Ativa
com Documentos Arquivsticos
A Lei de Acesso Informao estabelece que rgos e entidades pblicas
devem divulgar, independentemente de solicitaes, informaes de interesse geral
ou coletivo, salvo aquelas cuja confidencialidade esteja prevista no texto legal. Isto
dever ser feito atravs de todos os meios disponveis e obrigatoriamente em sites da
internet (somente os municpios com populao de at 10.000 habitantes ficam
dispensados da divulgao obrigatria na internet). Entre as informaes a serem
disponibilizadas, devero constar, no mnimo:
registro das competncias e estrutura organizacional, endereos e telefones
das unidades e horrios de atendimento ao pblico;
registros de quaisquer repasses ou transferncias de recursos financeiros;
registros das despesas;
informaes concernentes a procedimentos licitatrios, inclusive aos
respectivos editais e resultados, bem como a todos os contratos celebrados;
dados gerais para acompanhamento de programas, aes, projetos e obras;
respostas a perguntas mais frequentes da sociedade.
Com o acesso prvio informao, o cidado no precisa acionar os rgos e
entidades pblicas, gerando benefcios tanto para ele, quanto economia de tempo e
recursos para a Administrao.
Manuteno da Cadeia de Custdia

A manuteno da cadeia de custdia deve ser feita atravs de


Ambientes Autnticos, sejam os SIGADs (e-ARQ Brasil) nas fases
corrente e intermediria, e os RDC-Arq (Repositrios Digitais
Confiveis Arquivsticos) na fase permanente. O e-ARQ Brasil,
contempla a Gesto Documental, e aps o trmino da fase da
Gesto de Documentos, com a alterao da cadeia de custdia,
passamos para a fase de AAP - Administrao de Arquivos
Permanentes, atravs dos RDC-Arqs (Resoluo n
39/CTDE/CONARQ), contemplando Arranjo, Descrio,
Digitalizao, Difuso e Acesso de Documentos de carter
permanente, e no mais permitindo aes ou operaes tpicas da
Gesto de Documentos como a Avaliao, etc.
FLORES, 2014
Ciclo de vida dos documentos, as 3 idades, Lei 8.159 (Lei de Arquivos), a 12.527, a LAI de
acesso informao, Princpios Arquivsticos, Normas, Metodologias, sua epistemologia, etc
Destinao
Final o PERMANENTE
CORRENTE INTERMEDIRIO Recolhimento/ (3 idade documental)
(1 idade documental) (2 idade documental) Preservao valor secundrio
Permanente
TTD

No permanente
estratgico, fundamental:
Gesto considerando o e-ARQ Ocorre aqui uma Resoluo n 39/2014
Sistema: SIGAD alterao da: Conarq, OAIS, TRAC,
Um ou vrios sistemas, e pode conter sistemas de GED CADEIA DE METS, PREMIS
como ferramentas, garantindo controle do ciclo de vida, CUSTDIA Plano de Classificao
o cumprimento da destinao prevista e a (Quadro de Arranjo),
mas
manuteno da autenticidade e da relao orgnica.
sem Navegao multinvel,
INTERRUPO Acesso e Difuso AtoM
Pode utilizar
Repositrios

Repositrio Arquivstico
Repositrio Arquivstico Digital Confivel:
Digital Confivel:
Corrente e Intermedirio
Permanente
Cadeia de custdia ininterrupta: linha contnua de custodiadores de documentos arquivsticos (desde o seu
produtor at o seu legtimo sucessor) pela qual se assegura que esses documentos so os mesmos desde o
incio, no sofreram nenhum processo de alterao e, portanto, so autnticos.
Res. 37 Conarq, Diretrizes para a
Presuno da Autenticidade de DADs
Autenticidade: qualidade de um documento ser exatamente aquele
que foi produzido, no tendo sofrido alterao, corrompimento e
adulterao. A autenticidade composta de identidade e integridade.
Identidade o conjunto dos atributos de um documento
arquivstico que o caracterizam como nico e o diferenciam de outros
documentos arquivsticos (ex.: data, autor, destinatrio, assunto, nmero
identificador, nmero de protocolo).
Integridade a capacidade de um documento arquivstico
transmitir exatamente a mensagem que levou sua produo (sem
sofrer alteraes de forma e contedo) de maneira a atingir seus
objetivos.
Identidade e integridade so constatadas luz do contexto
(jurdico-administrativo, de provenincia, de procedimentos, documental
e tecnolgico) no qual o documento arquivstico foi produzido e usado
ao longo do tempo.
DAD - Documento Arquivstico Digital
que apresenta Complexidade, Especificidade e
Fragilidade
Documento produzido ou recebido por uma pessoa
fsica ou jurdica, no decorrer das suas atividades,
explicitado no PCD e necessita ser mantido autntico e
retido para ao ou referncia, composto por informao
registrada em um suporte qualquer, codificada em dgitos
binrios, acessvel e interpretvel por meio de sistema
computacional.

Informao + suporte > indivisvel, orgnico, binrio,


requer: autenticidade (identidade + integridade)
identidade (atributos / metadados e-ARQ)
integridade (Forma fixa, contedo estvel)
SUPORTE dos Documentos no Digital

O Suporte assume PAPEL fundamental e


imprescindvel na autenticidade de DADs pois:
indissocivel;
nas migraes/estratgias de preservao, o
PREMIS documenta e gerencia;
os repositrios cuidam da Fixidez,
Documentao, Trilha de Auditoria, Metadados
de Autenticidade;
elemento de anlise forense para a
Diplomtica (Vide Ubuntu FDTK);
e-ARQ Brasil

Modelo de Requisitos para


Sistemas Informatizados de Gesto
Arquivstica de Documentos,
elaborado pela Cmara Tcnica de
Documentos Eletrnicos do
Conselho Nacional de Arquivos.
Sistemas pesquisados pelo Grupo CNPq:
contemplao e-ARQ Brasil (Gesto)

Nuxeo DM
KnowledgeTree
Agorum Core
Alfresco
Archivista Box
Maarch
Owl Intranet
Archivist ToolKit
Outros SIs que foram estudados ou esto em
tratativas: contemplao e-ARQ Brasil (Gesto)

SIE - Sistemas de Informaes para o Ensino (Dirio de


Classe, Afastamentos, Resolues e Portarias; Licitaes)
- UFSM;
SEI - Sistema Eletrnico de Informaes - Tribunal
Regional Federal 4a. Regio;
SIPAC - Sistema Integrado de Patrimnio, Administrao
e Contratos - SIGED - UFRN;
SPED - Sistema de Protocolo Eletrnico - Portal do
Software Pblico;
SIGADAer;
LightBASE - Portal do Software Pblico; integrado ao
GoldenDOC - Framework Gesto Documental (Adm.
Pblica) - Portal Software Pblico;
Preservao Digital
Estratgias de Preservao Digital

- RODRIGUES (2003);
- FERREIRA (2006).

Preservao de tecnologia; Normalizao;


Refrescamento; Migrao a pedido;
Emulao; Migrao distribuda;
Migrao/converso; Encapsulamento;
Migrao para suportes A pedra de Rosetta digital;
analgicos; Software Livre;
Atualizao de verses; Reprografia/
Converso para formatos Microfilmagem.
concorrentes;
Repositrios Arquivsticos Digitais

Diferente de um banco de dados com objetos digitais


inseridos;
Tem mecanismos prprios de preservao digital;
Considera os requisitos arquivsticos;
Navegao multinvel;
Fixidez (PREMIS), estratgias de preservao digital
embutidas, etc.;
o RDC-Arq um conceito da CTDE/Conarq, temos
aplicaes em Software Livre como o RODA e
Archivematica, mas tambm pode ser uma implementao a
partir de um Repositrio Digital que no tenha os requisitos
arquivsticos, como o DSpace, Fedora, Eprints, etc.
Repositrio arquivstico digital

Um repositrio digital de documentos


arquivsticos um repositrio digital que
armazena e gerencia esses documentos, seja
nas fases corrente e intermediria, seja na fase
permanente. Como tal, esse repositrio deve:

gerenciar os documentos e metadados de acordo com


as prticas e normas da Arquivologia, especificamente
relacionadas gesto documental, descrio
arquivstica multinvel e preservao;
resguardar as caractersticas do documento arquivstico,
em especial a autenticidade (identidade e integridade)
e a relao orgnica entre os documentos.
Repositrio Digital Confivel (Cert./Audit.)
TRAC, Nestor, Magenta, Drambora, etc.
Uma forma de atestar a confiabilidade de
um repositrio digital junto comunidade-alvo
se d por meio da sua certificao por
terceiros. Para esse fim, o RLG/OCLC em
parceria com o National Archives and Records
Administration NARA publicou em 2007, o
documento TRAC - Trustworthy Repository
Audit & Certification: Criteria and Checklist
critrios e um checklist a serem tomados
como referncia para a certificao de
repositrios digitais confiveis. Esse
documento serviu de base para a elaborao
da norma ISO 16363: 2012, que lista os
critrios que um repositrio digital confivel
deve atender.
OAIS

O modelo de referncia Open Archival Information


System OAIS um esquema conceitual que
disciplina e orienta um sistema de arquivo dedicado
preservao e manuteno do acesso a informaes
digitais por longo prazo.

ABNT - NBR 15.472/2007 (SAAI SISTEMA ABERTO


DE ARQUIVAMENTO DE INFORMAO).
OAIS constitudo por pessoas e sistemas com a
responsabilidade de preservar a informao e torn-
la disponvel.
O modelo aborda questes fundamentais relativas preservao de
longo prazo de materiais digitais, independentemente da rea de
aplicao (arquivo, biblioteca, museu, etc.). O Modelo OAIS toma por
base o conceito de informao que no caso de repositrios para
documentos arquivsticos, deve ser entendido como documentos de
arquivo.
Entidades externas:
1. Produtor: papel desempenhado por pessoas ou sistemas que
fornecem a informao a ser preservada - Submisso - SIP;
2. Administrador: papel desempenhado por aqueles que estabelecem
as polticas gerais que governam o repositrio - Arquivamento - AIP;
3. Consumidor: papel desempenhado por pessoas ou sistemas que
interagem com os servios OAIS para acessar a informao preservada
desejada - Acesso e Difuso - DIP;
Pacotes

SIP Pacote de Submisso de Informao


Entregue pelo Produtor a um OAIS para construo de um ou
mais AIP.
AIP Pacote de Arquivamento de Informao
Pacote de informao que ser objeto de preservao.
DIP Pacote de Disseminao de Informao
Pacote de Informao derivado de um ou mais AIP, recebido
pelo Consumidor em resposta a uma requisio dirigida ao
OAIS.
AIC Coleo de Arquivamento de Informao
Conjunto de dados e colees de objetos digitais divididos em
vrios AIP's.
O Archivematica (RDC-Arq)

O Archivematica um sistema de preservao digital


gratuito e de cdigo aberto (em Software Livre) projetado
para manter o acesso a longo prazo para a memria digital.
O Archivematica desenvolvido e empacotado com o
gerenciador de contedo AtoM (ICA-AtoM), sistema baseado
na Web para acesso aos seus objetos digitais promovendo
descrio, difuso e acesso de Documentos Arquivsticos.
(FLORES, D., 2015)
O Archivematica
Baseado em padres
O Archivematica usa um padro de design de micro-
servios para fornecer um conjunto integrado de ferramentas
de software que permite ao usurio processar objetos digitais,
de ingerir para o acesso em conformidade com o modelo
funcional ISO-OAIS. O Usurio monitora e controla os micro-
servios atravs de um painel baseado na web.
O Archivematica usa Mets, Premis (eventos, agentes,
direitos e restries), Dublin Core, da Biblioteca do Congresso
especificao BagIt e outros padres e prticas para fornecer
pacotes de arquivamento confiveis, autnticos, confiveis e
interoperveis (AIP) para o armazenamento em prtica o seu
melhor repositrio preferido.
O Archivematica
Compatvel com centenas de formatos

No Registro da Poltica de Formatos (FPR), o


Archivematica implementa suas polticas de formato padro
com base em uma anlise das caractersticas significativas
de formatos de arquivo. A FPR tambm oferece um quadro
editvel, flexvel para a identificao formato, extrao de
pacote, transcrio e normalizao para a preservao e
acesso. A instituio pode atualizar as ferramentas, regras
e comandos em seu FPR local a partir do servidor FPR.
Tambm pode adicionar suas prprias polticas locais sua
FPR interna. O FPR integrado com o PRONOM.
Formatos para uso no AtoM
Imagem udio Vdeo Vdeo
8SVX AVS Apple Computer QuickDraw
PDF AVS BFI Quicktime Graphisc SMC
AC-3
BMP CamStudio CSCD RealVideo RV10
Apple Lossless
GIF ATRAC3 Cinepak RL2
PNG Cook Codec Creative YUV (CYUV) Smacker video
JPEG EA ADPCM DNxHD Snow
V.Flash PTX FLAC
Intel Music Coder
Flash Screen Video Sorenson SVQ1
SGI Monkeys Audio FFV1 Sorenson SVQ3
Sun Rasterfile MP2 H.261 Theora
FLIC MP3 H.263 Asus V1
TIFF Nellymoser Asao Codec in Flash
QDM2
H.264/MPEG-4 AVC Asus V2
RealAudio 1.0 Huffyuv VMware VMnc
RealAudio 2.0 id Software RoQ Video On2 VP3
Shorten Intel Indeo 2 On2 VP5
Truespeech
Intel Indeo 3 On2 VP6
TTA
TXD LOCO Westwood Studios VQA
Vorbis Mimic[3] Microsoft WMV v 7, 8 and 9
WavPack MJPEG Wing Commander/Xan Video
Windows Media Audio 1
MPEG-4 Part 2
Windows Media Audio 2
ICA-AtoM
ICA-AtoM (3 Momentos)

1. ICA-AtoM para Descrio Arquivstica;


2. AtoM para Acesso, Difuso e Descrio;
3. AtoM interconexo ao Archivematica (RDC-Arq)
para a Garantia da Autenticidade, Acesso a
Longo Prazo, Estratgias de Preservao e
Manuteno da Cadeia de Custdia = Arquivo
Permanente Digital.
ICA-AtoM
Como Descrio
1. ICA-AtoM

ICA-AtoM um software de descrio arquivstica Web baseado


nos padres do CIA.
'AtoM' = 'Access to Memory'.
O ICA-AtoM (Conselho Internacional de Arquivos - Acesso
Memria) um aplicativo para web destinado a apoiar as atividades de
descrio arquivstica em conformidade com os padres do Conselho
Internacional de Arquivos. 'AtoM' um acrnimo para 'Access to
Memory'. O CIA e os colaboradores do projeto ICA-AtoM esto
disponibilizando esse aplicativo como um software livre, de forma que
as instituies arquivsticas tenham acesso a um sistema gratuito,
multilinge, fcil de usar e que as permita disponibilizar online
informaes acerca de seus acervos. As normas de descrio
arquivstica, ISAD(G), ISAAR (CPF), ISDF e ISDIAH so contempladas
por essa ferramenta.
ICA-AtoM
ICA-AtoM ou Atom 2.x
ICA-AtoM o acrnimo de
Access to Memory. O projeto de
software ICA-AtoM resulta de um
esforo de colaborao entre o ICA
e alguns parceiros e patrocinadores
(a UNESCO, a Escola de Arquivos
de Amsterdam, o Banco Mundial, a
Direo dos Arquivos da Frana, o
Projeto Alouette Canad e o Centro
de Documentao dos Emirados
rabes Unidos). Destaques: - Total
conformidade s normas do ICA; -
Apoio para outras normas
relacionadas, incluindo EAD, EAC,
METS, MODS, Dublin Core; -
Aplicao concebida inteiramente
para ambiente web; - Interfaces
multilingues; - Catlogo multi-
institucional; - Interfaces com
repositrios digitais. Requer Wamp
ou Lamp.
ICA-AtoM (AtoM)

Software Livre;
Grande comunidade;
Diversas instituies j utilizando;
Exportao e Importao pelo pesquisador,
historiador, socilogo, filsofo, etc.
Conectado com Repositrios Digitais;
Melhores prticas;
Normas internacionais;
Suporte;
Escalabilidade.
Plataformas

ICA-AtoM 1.x: AtoM 2.x


16 releases;
accesstomemory.org
ica-atom.org
ICA-AtoM
Acesso, Difuso e Descrio
2. AtoM

Gerenciador de contedo AtoM (ICA-AtoM), sistema


baseado na Web para acesso aos seus objetos digitais
promovendo descrio, difuso e acesso de
Documentos Arquivsticos.
Multinvel, Normalizado e com possibilidade de
Autenticidade referenciada ao Archivematica.
Exemplos de ICA-AtoM
Ciclo de vida dos documentos, as 3 idades, Lei 8.159 (Lei de Arquivos), a 12.527, a LAI de
acesso informao, Princpios Arquivsticos, Normas, Metodologias, sua epistemologia, etc
Destinao
Final o PERMANENTE
CORRENTE INTERMEDIRIO Recolhimento/ (3 idade documental)
(1 idade documental) (2 idade documental) Preservao valor secundrio
Permanente
TTD

No permanente
estratgico, fundamental:
Gesto considerando o e-ARQ Ocorre aqui uma Resoluo n 39/2014
Sistema: SIGAD alterao da: Conarq, OAIS, TRAC,
Um ou vrios sistemas, e pode conter sistemas de GED CADEIA DE METS, PREMIS
como ferramentas, garantindo controle do ciclo de vida, CUSTDIA Plano de Classificao
o cumprimento da destinao prevista e a (Quadro de Arranjo),
mas
manuteno da autenticidade e da relao orgnica.
sem Navegao multinvel,
INTERRUPO Acesso e Difuso AtoM
Pode utilizar
Repositrios

Repositrio Arquivstico
Repositrio Arquivstico Digital Confivel:
Digital Confivel:
Corrente e Intermedirio
Permanente
Cadeia de custdia ininterrupta: linha contnua de custodiadores de documentos arquivsticos (desde o seu
produtor at o seu legitimo sucessor) pela qual se assegura que esses documentos so os mesmos desde o
incio, no sofreram nenhum processo de alterao e, portanto, so autnticos.
Fluxograma dos Pacotes SIP/AIP/DIP
Repositrio Arquivstico Digital Confivel:

Empacotamento dos
SIPs: - Ao receber o pacote SIP, submete-o aos:
- micro-servios: anti-virus, validao, formatos,
Direto do SIGAD metadados, etc
ou - para ento gerar o Pacote de Armazenamento, o AIP;
Memorandos, Ofcios, e-mails,
Submetido
Fotografias, etc. Passa permanentemente por: Pacote AIP
+ - Polticas de Preservao;
Metadados - Estratgias de Preservao;
(.CSV Excel - Dublin Core, - Atualizao de Formatos:
METS) - FPR (PREMIS); gerado

Pacote DIP
do
f i r ma
n
Co so FLORES, Daniel (2015)
u
Dif
para o ICA-
AtoM

Acesso e Difuso dos Documentos Arquivsticos


Descritos, normalizados via Web.
Presuno de autenticidade:
mantendo a Cadeia de Custdia
com o RDC-Arq:
Como garantir a presuno de autenticidade,
mantendo a Cadeia de Custdia com o RDC-Arq:

Documentos de SIGAD, aps findar a fase de


Gesto de Documentos, no momento do
recolhimento;
Documentos digitalizados;
e-mails;
Fotografias;
Websites/Portais;
etc.

J que, o DAD COMPLEXO e ESPECFICO !!


Documentos do SIGAD
Sistema Informatizado de Gesto Arquivstica de
Documentos (e-ARQ Brasil).

Exclusivamente GESTO, nas fases corrente e


intermediria.
SIGAD

O empacotamento do SIP feito pelo SIGAD;


Os metadados so .METS;
A identidade vem pelos metadados e-ARQ (ex.: nmero
identificador, nmero de protocolo, data, autor, destinatrio,
assunto, etc.);
A integridade:
vem pela Forma Fixa, que deve ser gerada pelo SIGAD,
seja PDF-A, seja, um Recordset com o query, ou sistema,
ou regra de negcio, etc;
vem pelo contedo estvel, tambm garantido pelo SIGAD,
desde preservao, metadados, forma/formato, etc.;
O SIGAD deve armazenar o SIP diretamente no Repositrio,
ou no Storage Service (Source Transfer), ou gerar BagIT;
Dirio de Classe Nato Digital
que perde sua autenticidade
A portaria 92 do AN, no seu cdigo 125.33 da TTD no fala
em imprimir;
BagIt

BagIt uma especificao para empacotar diretrios de


arquivos, hierarquicamente, para armazenamento a longo
prazo ou para a transferncia entre ambientes de
armazenamento. Sua caracterstica mais importante que
ele gera e registra checksums (somas de verificao de
bytes) para cada arquivo armazenado em uma bag, o que
torna muito fcil de verificar a integridade dos arquivos
depois que eles foram movidos. O Archivematica armazena
os seus AIPs como um Bag, assim como ingere Bags
criadas por outros sistemas.
BagIt

Bag-Pacote-UFSM/
|-- data
| \-- 27613-h
| \-- images
| \-- q172.png
| \-- q172.txt
|-- manifest-md5.txt
| 49afbd86a1ca9f34b677a3f09655eae9 data/27613-h/images/q172.png
| 408ad21d50cef31da4df6d9ed81b01a7 data/27613-h/images/q172.txt
\-- bagit.txt
BagIt-Version: 0.97
Tag-File-Character-Encoding: UTF-8

A instituio que quiser elaborar seus pacotes, tem disponvel cdigo no


GitHub:
Archive::BagIt: Perl, BagIt Library: Java, BagIt gem: Ruby, bagit: Python,
pybagit: Python, BagIt GUI: JRuby, BagItPHP: PHP.
Documentos digitalizados
Documentos Digitalizados

Haver uma declarao de autenticidade, mas,


nunca sero ORIGINAIS;
No sero Nato Digitais;
Se permanentes, no podero ser eliminados os
originais (Lei), ou analgicos, ou qumicos, etc.;
A originalidade e a autenticidade referencial, e
estar vinculada ao original, confere com o
original;
Metadados .CSV, Dublin Core, ou e-PMG;
E-mails
e-mails
(mensagens de correio eletrnico - DAD)
O e-mail no deve ser impresso;
Nem gerado PDF ou PDF-A;
Seu valor legal est ligado a manuteno de sua cadeia
de custdia ininterrupta, no sistema de produo at o
RDC-Arq;
Tem de se garantir a presuno de autenticidade;
Num ambiente controlado e seguro;
a negociao tem de ser feita do sistema de gesto de
e-mails para o SIGAD ou RDC-Arq;
Na ausncia do SIGAD, o RDC-Arq pode garantir a
Autenticidade do e-mail - DAD;
e-mail Institucional que armazena
Documentos Arquivsticos
Princpios arquivsticos como o de territorialidade;
No pode garantir a integridade, nem a identidade;
Fixidez acaba comprometida;
Autenticidade;
Preservao de E-mail
Requisitos Funcionais
Formato de preservao
Formatos fechados proprietrios, como PST deve ser convertidos para formatos
abertos;
Formato de preservao deveria ser de texto ou XML;
Mensagens de e-mail, calendrios, contatos e outras entidades relacionadas devem
ser normalizadas para o formato de preservao;
Formato de preservao deve preservar as caractersticas significativas das
mensagens de e-mail
Formato de preservao dever ser capaz de ser visualizado como um formato de
acesso ou deve ser capaz de gerar um formato de acesso;
Anexos
Anexos devem ser convertidos para formatos de preservao e acesso;
Anexos convertidos devem manter links para os e-mails aos quais estavam ligados;
Formato do Acesso
Formato de acesso deve ser legvel e deve ser reconhecvel como e-mail;
Formato de acesso deve permitir uma navegao simples e intuitiva entre as
mensagens, anexos, caixas de e-mail, contatos e calendrios;
Formato de acesso deve permitir uma navegao nas cpias de acesso normalizadas
dos anexos.
Preservao de E-mail
Formatos
EML
EML, que significa 'E-mail', a extenso dos arquivos de mensagens salvas
do Outlook Express - MS.
MBOX
"A famlia mbox refere-se a quatro formatos, mas apenas semi-compatveis
para armazenamento de uma ou mais mensagens de e-mail e anexos. Os
quatro formatos: - Mboxo, mboxrd, mboxcl e mboxcl2 - so originrios de
diferentes verses do Unix. Cada arquivo mbox representa um conjunto de
mensagens ordenados sequencialmente em uma pasta.
Maildir
Este formato estreou com o servidor qmail em meados da dcada de 1990.
Cada mailbox um diretrio e cada mensagem um arquivo. Isso melhora a
eficincia porque os e-mails individuais podem ser modificados, eliminados e
adicionados sem afetar a caixa de correio ou outros e-mails, e torna mais
seguro para uso em sistemas de arquivos (informticos/rede), como o NFS.
Preservao de E-mail
Ferramentas

Readpst, Download: http://www.five-ten-sg.


com/libpst/packages/, converte PST (MS Outlook) para
mbox e outros formatos.
OfflineImap conecta contas IMAP e salva o contedo
localmente como Backup maildir.
md2mb.py um script python que converte o formato
maildir para o mbox.
Fotografias
Fotografias, etc.

Na ausncia do SIGAD, RDC-Arq, preparando pacotes


SIP j na produo;
e-ARQ, o documento nasce classificado;
se tem pauta, a mesma j classificada;
Resoluo 41 Conarq - Classificao PGAD;
o DAD - fotografia nasce ao produtor descarregar do
carto e declarar como DAD, no na cmera ou carto;
embora a fotografia tenha presuno de forma fixa,
temos formatos como o .NEF e .RAW em que fica
comprometida;
Metadados, alm dos da cmera, EXIF, e-ARQ (METS)
e NOBRADE (CSV).
Websites, Portais
Preservao de Websites - DAD
Captura / Recolhimento RDC-Arq
Ferramentas para criar o Pacote SIP:
Heritrix web archiver (Java);
wget (1.14);
WARC software library (Python);
warc-explorer, (Java WARC archives);
ArchiveFS, (Monta Sistema de Arquivos WARC archives);
WSDK, (Manipular WARC archives);
WebArchivePlayer <https://github.
com/ikreymer/webarchiveplayer>;
WebRecorder.io <https://webrecorder.io/>.
Salva nos formatos: WARC ou ARC:
O Web ARChive (WARC) especifica um mtodo para combinar mltiplus
recursos digitais em um archive file agregado (pena no ser o BagIT).
superior em caractersticas ao ARC_IA do Internet Archive. Acomoda
metadados atribudos, duplicaes, etc.
METS - METADADA ENCODING AND
TRANSMISSION STANDART (Padro de Codificao e
Transmisso de Metadados) - http://www.loc.gov/standards/mets
Empacotamento de objetos digitais que permite organizar, em um nico arquivo
compactado, tanto dados quanto metadados descritivos, administrativos e
estruturais;
O METS mantido pela Biblioteca do Congresso Americano. utilizado
basicamente como formato de intercmbio entre repositrios ou como formato de
gesto de dados/informao de objetos digitais;
Implementaes OAIS (Open Archival Information System) utilizam o METS para
estruturar os pacotes: SIP (Submission Information Package), AIP (Archival
Information Package) e DIP (Dissemination Information Package);
Alguns repositrios digitais utilizam o METS para intercmbio de objetos, como
DSPACE com a exportao de objetos digitais para o formato METS e o FEDORA
na exportao quanto na importao de objetos digitais.
A estrutura METS definida por um modelo descrito em um XML:
obrigatoriamente um cabealho (header) e at seis sees: dmdSec Seo de
Metadados Descritivos; amdSec Seo de Metadados Administrativos; fileSec
Seo de Arquivo; structMap - Mapa Estrutural; structLink Vinculao de Mapa
Estrutural e behaviorSec Seo de Comportamento.
Arquivo METS
Arquivo .CSV
PREMIS: Preservation Metadata - Especificao que
apresenta conjunto bsico de elementos de metadados
de preservao
Visa apoiar sistemas que gerenciam objetos digitais. Tem ampla aplicao
pela comunidade de preservao digital, e seu principal documento de
referencia o PREMIS Data Dictionary. The Preservation Metadata:
Implementation Strategies Working Group. Seus metadados:
- Contribuem para a viabilidade, disponibilidade, clareza, autenticidade e identidade de objetos
no contexto da preservao digital.
- Representam as informaes sobre os documentos digitais que a maioria dos repositrios
precisa saber para preservar esses documentos ao longo do tempo.
- Prestam especial ateno aos metadados rigorosamente definidos, com base em diretrizes
para a criao, gesto e uso, voltados para fluxos de trabalho automatizados.
- So tecnicamente neutros, ou seja, no assumem o uso em particular de qualquer tecnologia
de preservao, estratgias, sistemas de armazenamento, gerenciamento de metadados etc.
Inclui um modelo de esquema em XML, que permite incorporar o Dicionario
de Dados em sistemas de gesto de objetos digitais. Mantida pelo Network
Development and MARC Standards Office da Biblioteca do Congresso dos
EUA - Library of Congress.
Assinaturas Digitais no RDC-Arq

Os RDC-Arqs podem adotar assinaturas digitais nos 3


casos abaixo:
Para submisso ao repositrio, autor ou submissor;
Para disseminao (DIP) a partir do repositrio para
fonte de prova em um ambiente externo;
Para seu armazenamento no RDC-Arq, o prprio RDC-
Arq pode armazenar objetos assinados digitalmente,
lembrando que converses ou algumas outras estratgias
de preservao digital, quebram assinaturas, exceto as
PADES no PDF-A(3).

(PREMIS verso 3 - Cap. da Fixidez e Autenticidade)


Uso do ICA-AtoM para Documentos nas
idades correntes e intermedirias

Corrente e Intermediria, antes usvamos os


recursos de Rights, agora com o PREMIS, e tanto para
Documentos que tem destinao final: Eliminao.

Assim o AtoM (ICA-AtoM) se aproximou muito mais


da Gesto de Documentos e componente
fundamental como RDC-Arq para um:
PROGRAMA DE GESTO ARQUIVSTICA DE
DOCUMENTOS - PGAD
(SIGAD+Archivematica+ICA-AtoM);
Sistema de Dupla Checagem para Excluso
(Archivematica)

Arquivo Permanente Digital -


Archivematica, solicitao
feita pelo Arquivista -
Administrador.
Sistema de Dupla Checagem para Excluso
(Archivematica)
Administrador do Storage Service (Servidor na Porta
8000) - rea de TI, CPD, Informtica:
O historiador/pesquisador dever checar a
autenticidade das fontes primrias DIGITAIS
Mesmo em Digitalizaes, a Declarao de
Autenticidade

Com a Digitalizao e uma Declarao de


Autenticidade - Autenticao, estes pacotes
vo para o ICA-AtoM;
Diplomaticamente o original nunca poder
ser eliminado, pois a autenticao apenas
confere com o ORIGINAL;
Porm o Acesso Autenticado;
Nem na Microfilmagem permitida a
eliminao de documentos permanentes.
Consideraes finais
A autenticidade requer a Manuteno da cadeia de custdia, que deve ser
feita atravs de Ambientes Autnticos: SIGAD (e-ARQ Brasil) e RDC-Arq
(Repositrios Arquivsticos Digitais Confiveis);
Gesto Documental = e-ARQ Brasil - SIGAD;
aps o trmino da fase da Gesto de Documentos, com a alterao da
cadeia de custdia,
Muda o epistema (o documento deve sair do SIGAD, do ambiente que
permite eliminar, tramitar, etc), assume a administrao de Arquivos
Permanentes = RDC-Arq (hoje Archivematica+AtoM ou RODA,
etc.);
sem interrupo, em ambientes autnticos, controlados, seguros, OAIS,
via pacotes e metadados que garantam a identidade;
O SUPORTE, assume protagonismo na Autencidade dos DADs, atravs da
fixidez, da trilha de auditoria, metadados PREMIS, no RDC-Arq e nas
estratgias de preservao digital, corrobora para a integridade;
Consideraes finais

ICA-AtoM para Descrio Arquivstica;


AtoM para Acesso, Difuso e Descrio;
AtoM interconexo ao Archivematica (RDC-Arq) para a
Garantia da Autenticidade, Acesso a Longo Prazo,
Estratgias de Preservao e Manuteno da Cadeia de
Custdia = Arquivo Permanente Digital;
Programa de Gesto Arquivstica de Documentos -
PGAD (SIGAD + Archivematica + ICA-AtoM);
Obrigado

Prof. Dr. Daniel Flores


Lder dos Grupos de Pesquisa CNPq - UFSM: Ged/A e
Patrimnio Documental Arquivstico
Membro da Cmara Tcnica de Documentos Eletrnicos - CTDE-
CONARQ
http://documentosdigitais.blogspot.com
http://facebook.com/dfloresbr