Академический Документы
Профессиональный Документы
Культура Документы
ndice
captulo 1 Prlogo ........................................................................................................................ Introduccin a la gestin documental........................................................................... > Sistemas de digitalizacin (OCR) o reconocimiento de caracteres ........................ > Workflow de procesos de negocio........................................................................ BPEL: La integracin de los procesos de negocio............................................. El certificado digital en la gestin de la seguridad. ....................................................... > La firma electrnica en los procesos de negocio .................................................. > Custodia de documentos digitales........................................................................ > E-archivo - Digitalizacin certificada ...................................................................... Por qu implantar un sistema de gestin documental certificada .............................. 3 3 7 8 10 12 14 16 17 20
captulo 2
captulo 3
COPYRIGHT El copyright de este documento es propiedad de Camerfirma. No est permitido su reproduccin total o parcial ni su uso con otras organizaciones para ningn otro propsito, excepto autorizacin previa por escrito.
Prlogo
Cada vez ms la gestin documental se est convirtiendo en una necesidad imprescindible para empresas, organismos e instituciones. La posibilidad de mantener disponible la informacin de una manera inmediata resulta fundamental, pero cada vez ms estn surgiendo nuevas necesidades que hacen de la seguridad un requisito indispensable en estas herramientas de gestin: Autenticidad e integridad de la documentacin a lo largo del tiempo. Las principales necesidades de estas herramientas se ven representadas en gastos en locales y almacenes, infraestructuras para garantizar el estado de conservacin, tiempo dedicado a la organizacin y bsqueda de documentos, duplicados, gastos de fotocopias, fax, etc. Aunque lo que no se ha tenido en cuenta hasta ahora es la autenticidad e integridad de los documentos almacenados a travs de este tipo de aplicaciones, as como el acceso seguro a las mismas, aqu es donde los certificados digitales tienen mucho que decir y que aportar a este tipo de soluciones. La mayora de las organizaciones necesitan acceder y consultar de forma frecuente la informacin archivada. En otros es la importancia de los documentos o el volumen de informacin lo que estimula a buscar nuevas soluciones innovadoras que ofrezcan ventajas y valor aadido sobre los sistemas tradicionales de archivo y almacenamiento. La firma electrnica incorporada en parte de los procesos de gestin documental posibilita, aparte de garantizar la seguridad de los documentos almacenados, la fecha de almacenamiento y la autora. Esto podra permitir eliminar los originales a travs de procesos de digitalizacin certificada o al menos garantizar la integridad y autenticidad de los documentos digitalizados. Incluso podra garantizarse la confidencialidad de los archivos y documentos almacenados gracias a los certificados digitales de Camerfirma de cifrado.
>> La firma electrnica incorporada en los procesos de gestin documental posibilita, aparte de garantizar la seguridad de los documentos almacenados, la fecha fehaciente y la autora
La necesidad de garantizar el acceso a los sistemas de gestin documental por parte de las personas adecuadas obliga a adaptar las aplicaciones empresariales al empleo de certificados digitales de vinculacin empresarial o de atributos que permitan conocer con exactitud las personas que acceden as como su cargo y empresa, dotndole al sistema de garantas de autenticacin de doble factor1.
1 Sistema de identificacin de doble factor algo que tenemos (clave criptogrfica privada) y algo que sabemos (PIN de activacin de la clave).
>> Un sistema de gestin documental es un sistema utilizado para la bsqueda y almacenamiento de documentos electrnicos y/o de imgenes de documentos soportados en papel
Un sistema de gestin documental tiene que tener en cuenta los siguientes aspectos: almacenamiento, recuperacin, clasificacin, seguridad, retencin, distribucin, creacin y autenticacin. > Almacenamiento. Grupo de dispositivos de hardware o software dedicados a guardar datos. Hay dos clases, almacenamiento primario, que son los que usa la CPU directamente (memoria principal, memoria cach, etc.) y el almacenamiento secundario, a los cuales la CPU no accede directamente, como son los discos magnticos, pticos, cintas magnticas, tambores magnticos, etc. Por tanto, habr que tener en cuenta cuestiones como: Dnde guardaremos nuestros documentos? Qu espacio ocupan?, etc. > Recuperacin. En la recuperacin intervienen dispositivos hardware y software que se dedican a administrar y buscar la informacin o datos. Se debe tener en cuenta: Cmo puede la gente encontrar documentos necesarios? Cunto tiempo se puede pasar buscndolo? Qu opciones tecnolgicas estn disponibles para la recuperacin? > Clasificacin. Se debe definir un conjunto de mecanismos de control apropiados y las medidas de proteccin especiales. Los datos que conforman la estructura de los sistemas y la informacin obtenida de los mismos, deben ser clasificados y administrados indicando la necesidad, prioridad y grados de proteccin, considerando grados de sensibilidad y criticidad. Algunos datos e informacin pueden requerir un nivel adicional de proteccin o tratamiento especial, como por ejemplo accesos no autorizados o daos a la informacin. > Seguridad. Teniendo en cuenta la definicin o clasificacin realizada, habr que definir la seguridad en el tratamiento y acceso a la informacin por parte de los usuarios Cmo evitamos la perdida de documentos? Cmo evitar la violacin de la informacin? Se puede garantizar la integridad? Quin puede realizar la destruccin de documentos? Cmo mantenemos la informacin delicada oculta? > Retencin. Existen documentos que bien por ley o por confidencialidad han de ser conservados a lo largo del tiempo durante una duracin determinada Cmo decidimos qu documentos conservar? Cunto tiempo deben ser guardados? Cul es el procedimiento de eliminacin una vez cumplido el plazo? > Distribucin. Ha de existir un medio electrnico a travs del cual podamos ser capaces de distribuir los documentos o la informacin en base a la clasificacin realizada, a las medidas de seguridad implantadas y al modo de autenticacin establecido. Podrn existir permisos que habr que obtener para poder acceder a determinada informacin, por tanto definiremos: Cmo distribuimos documentos a la gente que la necesita? Cunto podemos tardar para distribuir los documentos? Y el canal de comunicacin seleccionado? > Workflow. Si los documentos necesitan pasar de una persona a otra, habr que definir cules son las reglas para el flujo de estos documentos, las reglas de aprobacin, de aceptacin, etc. Todo este procedimiento deber estar reglado y deber ser integrado en las aplicaciones Web que permitan el tratamiento electrnico de las operaciones para que los procedimientos sean 100% electrnicos.
> Creacin y firma. Puede ser que ms de una persona est implicada tanto en la creacin de un documento o procedimiento como en su modificacin. Habr que tener en cuenta, por tanto, las acciones colaborativas, el control o gestin de las distintas versiones, etc. Dentro del procedimiento de generacin puede ser necesaria la firma electrnica, tanto de manera unitaria como a travs de firmas mltiples dentro del proceso de Workflow. > Autenticacin. Cmo proporcionamos los requisitos necesarios para la validacin legal acerca de la originalidad de los documentos (autenticidad, integridad y no repudio) y cumplimos sus estndares para la autentificacin? Se dispone de una evidencia legal en cuanto a formatos de firma de larga duracin que incorporen un sellado de tiempo que garantice la fecha de firma y la firma?
>> Los sistemas OCR consiguen extraer de una imagen los caracteres que componen un texto para almacenarlos (metadatos) en un formato con el cual puedan interactuar otros programas y sistemas de gestin. Existen soluciones avanzadas de reconocimiento inteligente y autocorreccin
Principales objetivos de un sistema de Workflow: > Reflejar, mecanizar y automatizar los mtodos y organizacin en el sistema de informacin. > Establecer los mecanismos de control y seguimiento de los procedimientos organizativos. > Independizar el mtodo y flujo de trabajo de las personas que lo ejecutan. > Facilitar la movilidad del personal. > Soportar procesos de reingeniera de negocio. > Agilizar el proceso de intercambio de informacin y agilizar la toma de decisiones de una organizacin, empresa o institucin.
>> La automatizacin de los procesos reduce errores, asegurando que los mismos se comportan siempre de la misma manera y dando elementos que permiten visualizar el estado de los mismos. A travs de la informacin se obtiene de la ejecucin diaria de los procesos se pueden identificar posibles ineficiencias en los mismos (por ejemplo, la existencia de cuellos de botella) y de esta forma optimizarlos
10
11
advertir alguna falla y definir un proceso compensatorio si corresponde. El proceso compensatorio es muy importante porque, durante un proceso de negocios, un servicio externo puede ser llamado y dicho servicio completar y har los cambios necesarios en caso de que el estado siguiente del proceso falle, realizndose otras transacciones para solucionar el problema eventual. Lo anterior se debe a que BPEL es suficiente para definir cualquier flujo de procesos con una lgica, de manera que los procesos de negocios puedan implementarse a partir de dicha definicin. En resumen, BPEL puede tener un alto impacto en solucionar la compleja integracin tecnolgica de las empresas, contribuir a definir procesos con mayor dinamismo y de acuerdo a la lgica de cada negocio, monitorear procesos y obtener, como consecuencia de lo anterior, un mximo aprovechamiento de la infraestructura de TI, una mayor flexibilidad y escalabilidad de los sistemas y, por sobre todo, una importante proteccin de la inversin en tecnologa, ya que se basa en estndares.
12
>> Podemos emplear la firma electrnica para garantizar la integridad de los ficheros, documentos, transacciones y validaciones
13
Cifrado: Otro aspecto importante que nos ofrecen los certificados digitales es la posibilidad de cifrar informacin. El cifrado de informacin es un proceso delicado y con alto riesgo, ya que si no somos cuidadosos podemos perder fcilmente la informacin cifrada. Se utiliza la clave pblica asociada al certificado para cifrarlos, luego necesitaremos la clave privada para recuperarlos y, por lo tanto, es fundamental tener acceso a esta en todo momento, para lo cual realizaremos copias de seguridad. Es altamente recomendable usar un certificado expresamente emitido para este uso y disponer de una autoridad de certificacin que custodie las claves y permita recuperar dichas claves de cifrado.
14
2.1
Un proceso de negocio debe permitir que los diferentes participantes puedan interactuar y gestionar toda la informacin y documentacin intercambiada de forma electrnica. Para ello se debera permitir la autenticacin y firma electrnica mediante el uso de certificados digitales. La incorporacin de la firma electrnica y la encriptacin en cualquier estado del proceso (generacin, tramitacin y conservacin) evita la necesidad de impresin para su firma antes de continuar con el siguiente estado. Los documentos firmados almacenados debern garantizar una validez de larga duracin. Para ello es importante utilizar estndares, como es el estndar de firma electrnica XML Signature Advanced (XADES), con las diferentes extensiones que dotarn al archivo electrnico de una total validez a lo largo del tiempo, tales como XADES-T, mediante la aplicacin del timestamping y XADES-C, consulta de la CRL (OCSP). La operacin de firma electrnica de los documentos debe permite la firma on-line de cualquier tipo de archivo (PDF, WORD, XML, AVI, AUDIO) sin tener que realizar ninguna operacin de conversin, ya que como hemos contado un sistema de gestin documental es aquel que permite el almacenamiento de objetos de informacin de uso corporativo, como pueden ser ficheros ofimticos, reports de las propias aplicaciones de gestin empresarial, imgenes, sonidos, video, e-mail, faxes, etc. El servicio de Time Stamping o sellado de tiempos permite visar cualquier tipo de archivo informtico. De este modo, el usuario puede acreditar el da y la hora en que un archivo informtico fue recibido o enviado incorporando la firma digital. El servicio de Time Stamping est basado en la tecnologa PKI. Esta tecnologa se fundamenta en la existencia de dos claves nicas (pblica y privada) y un certificado digital, en este caso, emitido por Camerfirma. Este es un archivo informtico que vincula la informacin a una fecha y una hora. Esta vinculacin se produce a travs de un sistema seguro de tiempo sincronizado con la Escala de Tiempo Universal (UTC). El aumento de uso de documentos electrnicos y la necesidad de establecer relaciones entre un documento y su tiempo de generacin, modificacin, firma, etc., lleva a la necesidad de crear evidencias de la posesin de esos datos en un momento determinado. Es muy importante la utilizacin de ciertas funciones matemticas (funciones hash), para desligar la emisin del sello temporal de la naturaleza especfica del documento electrnico, de modo que se obtiene una representacin o "resumen" de dicho documento, a partir del cual en ningn caso, es posible obtener el documento original o cualquier informacin sobre el mismo. De esta forma, al sellar esta representacin resumida del documento, realmente se est sellando el documento original, adems se consiguen otros servicios como la confidencialidad de la informacin.
>> Para el almacenamiento temporal de documentos digitales resulta fundamental incorporar la firma electrnica y el sello de tiempo a esos archivos para garantizar la vigencia de esos documentos y su posterior validez
15
Adems, para el almacenamiento temporal de documentos digitales resulta fundamental incorporar el sello de tiempo a esos archivos para garantizar la vigencia de esos documentos y su posterior validez. El Time Stamping o sellado de tiempo es el complemento ideal a la seguridad que ofrecen los certificados digitales. Mediante la aplicacin del sellado de tiempo garantizamos el momento exacto en el tiempo en que la firma de un documento se produjo. De este modo, el sellado de tiempo se convierte en un elemento imprescindible en determinados procedimientos, que exigen en la mayora de las ocasiones la constatacin de la fecha y hora exactas en la que el acto jurdico tuvo lugar. Actualmente el servicio de sincronizacin de tiempos de Camerfirma est compuesto por tres fuentes distintas: > NTP del ROA (Real Observatorio de la Armada, que establece el tiempo de referencia en Espaa). > GPS sincronizado con tres satlites. Precisin milisegundos. > Sincronizacin de tiempos va Radio DCF77 con la estacin transmisora en Mainflingen (Frankfurt). La precisin 10 mseg. El sistema calcula el tiempo en base a estas tres fuentes. El reloj del ordenador se controla de acuerdo con los algoritmos de seleccin y sincronizacin de la RFC1305 (NTP v3). Camerfirma es la entidad emisora de sellos digitales de tiempo de esta infraestructura de clave pblica -PKI- Time-Stamping Authority (TSA). El empleo de este tipo de formatos de firma incorporando el sellado de tiempo permite garantizar la autenticidad, no repudio, confidencialidad y conservacin a largo plazo, as como la reproduccin futura de los documentos. Adems se deben incorporar, en caso de que los documentos sean impresos, las marcas grficas PDF417, que contendrn las firmas electrnicas del documento, disponiendo de un documento fsico con validez jurdica. A continuacin se muestra un ejemplo de cmo podra quedar un documento impreso con dos firmas electrnicas:
16
17
>> Tras la digitalizacin hay que firmar el documento. Un proceso complementario es la aplicacin de sistemas OCR (reconocimiento de caracteres ptico) que permite extraer las palabras del documento, con lo que se facilita la bsqueda posterior. En este caso, se utiliza una modalidad de firma denominada firma completa que incluye informacin del momento de la verificacin de validez del certificado y de la respuesta de Camerfirma al consultar sobre dicha vigencia, Time Stamp + validacin
A travs del sistema de reconocimiento de caracteres (OCR), una vez digitalizados los documentos y llevada a cabo la recuperacin de metadatos de los documentos digitalizados, a travs de plantillas, ser firmada electrnicamente la imagen generada y por otro lado, mediante el sistema OCR de los datos que conformarn los metadatos del documento, a travs de la plantilla, se firmarn tambin electrnicamente. Con esta informacin se construir automticamente el mensaje SOAP, que realizar la llamada al Webservice del archivo, que publicar dicho documento en el sistema de custodia documental o e-archivo. Todo este proceso puede ser realizado de forma automtica una vez que el usuario deje los documentos en la bandeja del escner y ponga en marcha el sistema.
Sistema Cliente
XMLDSIG XADES
Batch Server
OCR XML con metadatos
18
Existen casos en que los sistemas OCR, como ya hemos comentado, deben apoyarse en soluciones que permitan poder obtener la informacin de datos manuscritos, a travs del puo y letra de los usuarios. Para ello, se utilizan sistemas DDP - Librera de reconocimiento. Se trata de un Sistema de Reconocimiento ptico de Caracteres con Correccin de Errores. El sistema est compuesto de dos ncleos bsicos: el motor OCR (Reconocimiento de Caracteres) y el motor ML (Modelado de Lenguaje o Corrector Ortogrfico). De manera resumida, el proceso global consiste en, dado un formulario y su especificacin de campos, se produce una salida final del sistema que consiste en, para cada hoja de un formulario, la serie de cadenas de texto asociadas a cada campo a reconocer, cada una de ellas acompaada de un ndice de fiabilidad del reconocimiento. Dado que los formularios pueden constar de una o ms pginas, y que tambin puede aparecer una pgina que no se corresponda con ninguna de las del formulario, la primera etapa en el proceso de reconocimiento de todo formulario es la de identificar el nmero de pgina que corresponde a la imagen en proceso. Gracias a unas marcas de identificacin definidas en la especificacin del formulario para cada una de las pginas, el sistema es capaz de realizar esta tarea. Mediante cuatro marcas de registrado definidas en la especificacin de formulario para cada una de las pginas, el sistema es capaz de alinear aquellas imgenes que se correspondan con alguna de las especificadas en el formulario. De esta forma, se resuelven los problemas de desplazamientos, rotaciones y deformaciones que presentan cada una de las imgenes adquiridas respecto a la imagen que se utiliz en la especificacin de formulario como plantilla.
Entradas GUI
EJECUCIN DE TRABAJOS
Adquisicin TRATAMIENTO DE EVENTOS Identificacin de pgina
MODELO REGISTRADO
Correccin ASCEE
MODELOS ML
ESPECIFICACIN FORMULARIO
SCRIPTS DE VALIDACIN
19
El motor OCR que incorpora el sistema permite reconocer caracteres manuscritos aislados. Gracias a la especificacin de formulario y al registrado de la imagen realizado en la etapa anterior, es posible recortar exactamente las zonas de la imagen (celdas) que contienen los caracteres pertenecientes a los campos de inters. Para cada imagen procedente de una celda, se obtiene un carcter reconocido con cierta probabilidad. La concatenacin de las celdas de un campo proporciona la cadena resultado de la etapa de OCR para ese campo del formulario. Las cadenas resultantes de la etapa de OCR no son siempre las que finalmente ofrece el sistema, sino que normalmente se aplica un proceso de verificacin y/o correccin de cadenas. Se dispone de dos alternativas para llevar a cabo esta correccin: los modelos de lenguaje y los guiones de validacin. Modelos de lenguaje Este mdulo realiza una verificacin o correccin (segn el caso) de errores implementado mediante un Anlisis Sintctico Corrector de Errores Estocstico de acuerdo a un modelo de lenguaje representado como un Modelo de Estados Finitos. Durante la especificacin de un formulario se asigna a cada campo el modelo correspondiente en funcin del contenido del mismo: nombre, apellidos o direccin, por ejemplo. Guiones de validacin Este mdulo realiza una verificacin del contenido del campo en funcin de alguna regla simple que pueda ser especificada mediante un guin de validacin. Por ejemplo, un NIF puede ser fcilmente validado ya que la letra final depende del resto de caracteres del mismo. Tambin existe la posibilidad de validar un campo contra una tabla. Por ejemplo, es posible comprobar si la cadena reconocida en la etapa de OCR se encuentra en la tabla asignada para validar dicho campo.
20
Cmara Oficial de Comercio e Industria de Madrid rea de Innovacin y competitividad C/ Ribera del Loira, 56-58 28042 Madrid Tel.: 91 538 35 00 www.camaramadrid.es
Cofinanciado por la Consejera de Economa y Consumo y el Ministerio de Industria, Turismo y Comercio. www.planavanza.es