Вы находитесь на странице: 1из 93

C/ Sancho de vila, 52, 6. 3.

08018 - Barcelona
Tel. 902 88 77 71 | www.cometatech.com



















Libro blanco:
Gestin Documental Open Source




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 2 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
NDICE
1 INTRODUCCIN ____________________________________________________________________ 5
1.1 Cometa Technologies ____________________________________________________________________________________ 5
1.2 Smile _________________________________________________________________________________________________ 5
1.3 Este libro blanco ________________________________________________________________________________________ 6
1.4 Resumen ______________________________________________________________________________________________ 7
1.5 Algunas referencias de Cometa ____________________________________________________________________________ 8
1.6 Algunas referencias _____________________________________________________________________________________ 10
1.6.1 Gestin documental _________________________________________________________________________________ 10
1.6.2 Pginas web ______________________________________________________________________________________ 10
1.6.3 Portales, Intranets y Sistemas de informacin_____________________________________________________________ 10
1.6.4 Comercio electrnico ________________________________________________________________________________ 10
1.6.5 ERP & Sistema de apoyo a las decisiones _______________________________________________________________ 10
1.6.6 Infraestructura y Alojamiento __________________________________________________________________________ 10
1.7 El Open Source en la empresa ____________________________________________________________________________ 11
1.7.1 Gestin documental de cdigo cerrado __________________________________________________________________ 11
1.7.2 La eleccin del Open Source __________________________________________________________________________ 12
2 GENERALIDADES __________________________________________________________________ 14
2.1 Por qu es necesaria una solucin de gestin documental? ____________________________________________________ 14
2.2 Presentacin de los conceptos ____________________________________________________________________________ 15
2.2.1 Documento electrnico ______________________________________________________________________________ 15
2.2.2 Contenido _________________________________________________________________________________________ 15
2.2.3 Gestin documental _________________________________________________________________________________ 16
2.2.4 Gestin de contenido web ____________________________________________________________________________ 16
2.2.5 Gestin de contenido ________________________________________________________________________________ 16
2.2.6 Gestin de contenido multimedia_______________________________________________________________________ 17
2.2.7 Workflow (BPM) ____________________________________________________________________________________ 18
2.2.8 Archivo Record Management (RM) ___________________________________________________________________ 18
2.2.9 Trabajo colaborativo ________________________________________________________________________________ 18
2.2.10 Motor de bsqueda ________________________________________________________________________________ 19
2.3 De la GD al ECM _______________________________________________________________________________________ 19
2.3.1 El permetro de la GD _______________________________________________________________________________ 19
2.3.2 El concepto de ECM ________________________________________________________________________________ 21
2.3.3 Evolucin de las herramientas: ________________________________________________________________________ 22
2.3.4 Traslacin de mtodos _______________________________________________________________________________ 22
2.4 Retos principales de la GD _______________________________________________________________________________ 23
2.4.1 Estructuracin de los metadatos _______________________________________________________________________ 25
2.4.2 Repositorio o cuadro de clasificacin ___________________________________________________________________ 25
2.4.3 Consideracin del ciclo de vida ________________________________________________________________________ 26
2.4.4 Digitalizacin ______________________________________________________________________________________ 26
3 LAS SOLUCIONES DE GESTIN DOCUMENTAL _________________________________________ 27
3.1 Alfresco ______________________________________________________________________________________________ 27
3.2 Nuxeo _______________________________________________________________________________________________ 30
3.3 Exo DMS _____________________________________________________________________________________________ 32
3.4 Knowledge Tree _______________________________________________________________________________________ 33
3.5 Jahia ________________________________________________________________________________________________ 35




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 3 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3.6 Otras soluciones _______________________________________________________________________________________ 37
3.6.1 Maarch ___________________________________________________________________________________________ 37
3.6.2 Freedom __________________________________________________________________________________________ 39
3.6.3 Quotero __________________________________________________________________________________________ 40
3.6.4 LogicalDOC _______________________________________________________________________________________ 41
4 LAS FUNCIONALIDADES _____________________________________________________________ 43
4.1 Metadatos ____________________________________________________________________________________________ 43
4.1.1 Tipos de documentos ________________________________________________________________________________ 43
4.1.2 Estructura de reseas _______________________________________________________________________________ 44
4.1.3 Funciones relativas a los tipos de informacin ____________________________________________________________ 44
4.1.4 Indexacin manual __________________________________________________________________________________ 45
4.1.4.1 Interfaz de introduccin de datos ___________________________________________________________________ 45
4.1.5 Tabla de referencia _________________________________________________________________________________ 45
4.1.6 Indexacin automtica _______________________________________________________________________________ 46
4.1.6.1 Extraccin de metadatos _________________________________________________________________________ 46
4.1.7 Induccin de metadatos ______________________________________________________________________________ 46
4.2 Gestin de versiones ____________________________________________________________________________________ 48
4.2.1 Reserva (check-in/ check-out) _________________________________________________________________________ 48
4.2.2 Incremento de versiones _____________________________________________________________________________ 49
4.3 Repositorio de clasificacin _______________________________________________________________________________ 50
4.3.1 Tipos de repositorios ________________________________________________________________________________ 51
4.3.1.1 Lxico ________________________________________________________________________________________ 51
4.3.1.2 Plan de clasificacin _____________________________________________________________________________ 51
4.3.1.3 Tesauro ______________________________________________________________________________________ 51
4.3.1.4 Cuadro de gestin ______________________________________________________________________________ 52
4.3.1.5 Ontologa _____________________________________________________________________________________ 52
4.3.2 Uso de los repositorios ______________________________________________________________________________ 53
4.3.2.1 Restitucin de contenidos ________________________________________________________________________ 53
4.3.2.2 Gestin de varios repositorios _____________________________________________________________________ 54
4.3.2.3 Gestin de sinnimos ____________________________________________________________________________ 54
4.3.2.4 Herramienta de bsqueda ________________________________________________________________________ 54
4.3.2.4.1 Ampliacin de consultas ____________________________________________________________________ 54
4.3.2.4.2 Sugerencia para el usuario __________________________________________________________________ 55
4.3.2.4.3 Representacin en clster ___________________________________________________________________ 55
4.4 Motor de bsqueda _____________________________________________________________________________________ 57
4.4.1 Funciones bsicas __________________________________________________________________________________ 57
4.4.2 Funciones avanzadas _______________________________________________________________________________ 58
4.5 Integracin de la GED ___________________________________________________________________________________ 60
4.5.1 Espacio de almacenamiento __________________________________________________________________________ 61
4.5.2 Acceso desde programas ofimticos ____________________________________________________________________ 61
4.6 Digitalizacin __________________________________________________________________________________________ 63
4.6.1 Gestin del escner y pre-indexacin ___________________________________________________________________ 63
4.6.2 Reconocimiento automtico___________________________________________________________________________ 64
4.7 Gestin de permisos ____________________________________________________________________________________ 66
4.7.1 Niveles de gestin __________________________________________________________________________________ 66
4.7.2 Gestin de perfiles __________________________________________________________________________________ 66
4.7.3 Directorio y SSO ___________________________________________________________________________________ 67
4.8 Funciones de colaboracin _______________________________________________________________________________ 67
4.9 Workflow _____________________________________________________________________________________________ 69




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 4 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.9.1 Workflow documental ________________________________________________________________________________ 70
4.9.2 Workflow profesional o BPM __________________________________________________________________________ 70
4.9.3 Representacin de workflow __________________________________________________________________________ 71
4.9.4 Implantacin en la GED ______________________________________________________________________________ 71
4.9.5 Panel de control y seguimiento ________________________________________________________________________ 71
4.10 Reglas de gestin _____________________________________________________________________________________ 73
4.10.1 Funciones de gestin _______________________________________________________________________________ 73
4.10.2 Motor de reglas ___________________________________________________________________________________ 73
4.11 Gestin del ciclo de vida ________________________________________________________________________________ 75
4.11.1 Poltica de conservacin ____________________________________________________________________________ 75
4.11.2 Almacenamiento __________________________________________________________________________________ 75
4.11.3 Formato de archivo ________________________________________________________________________________ 76
4.11.4 Funciones relacionadas con el formato _________________________________________________________________ 76
4.11.5 Formatos abiertos _________________________________________________________________________________ 77
4.11.6 Formatos de conservacin ___________________________________________________________________________ 78
4.11.7 Almacenamiento digital de valor probatorio ______________________________________________________________ 78
4.12 Importacin/Exportacin ________________________________________________________________________________ 79
4.12.1 Importacin/exportacin masivas _____________________________________________________________________ 79
4.12.2 Exportacin a soporte fsico__________________________________________________________________________ 80
4.13 Gestin de correos electrnicos __________________________________________________________________________ 81
4.13.1 Seleccin de correos electrnicos para archivar __________________________________________________________ 81
4.13.2 Gestin de correos electrnicos ______________________________________________________________________ 81
4.14 Gestin de carpetas ___________________________________________________________________________________ 83
4.14.1 Conceptos relativos a la gestin de carpetas __________________________________________________________ 83
4.14.2 Las herramientas de la gestin de carpetas _____________________________________________________________ 84
4.14.3 La puesta en comn de informacin ___________________________________________________________________ 85
4.14.4 La gestin de carpetas ______________________________________________________________________________ 85
4.14.5 La clasificacin ____________________________________________________________________________________ 85
4.14.6 Trazabilidad ______________________________________________________________________________________ 85
4.15 Integracin tcnica ____________________________________________________________________________________ 87
4.15.1 Configuracin de la interfaz __________________________________________________________________________ 87
4.15.2 Integracin de las aplicaciones _______________________________________________________________________ 88
4.15.3 Los servicios Web _________________________________________________________________________________ 89
4.15.4 Servicios Web SOAP _______________________________________________________________________________ 89
4.15.5 Servicios Web REST _______________________________________________________________________________ 89
4.15.6 CMIS para Content Management Interoperability Services __________________________________________________ 89
4.15.7 Interfaces simplificadas _____________________________________________________________________________ 89
4.15.8 Portlets en un portal ________________________________________________________________________________ 90
4.15.9 Modo SaaS ______________________________________________________________________________________ 91
5 RESUMEN _________________________________________________________________________ 92





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 5 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
1 INTRODUCCIN
1.1 COMETA TECHNOLOGIES
La misin de Cometa es ser el partner referente de nuestros clientes para proyectos de comunicacin y
gestin empresarial basados en herramientas Open Source y tecnologas estndares.

Cometa nace en el ao 2000 fruto de un spin-off del Centro de Servicios Informticos de la Universidad La
Salle, de Barcelona.

Durante 10 aos Cometa se ha ido especializando en diferentes mbitos de negocio basados en
herramientas y tecnologas muy diversas, todas basadas Open Source y estndares.

Los directivos de Cometa siempre han participado en diversas iniciativas no lucrativas orientadas a impulsar
el tejido empresarial mediante la aplicacin de tecnologas abiertas y estndares.

En el ao 2005 Cometa se instala en el 22@, distrito de innovacin tecnolgica impulsada por el
Ayuntamiento de Barcelona.

En el ao 2007 Cometa participa en el proyecto de consultora RoadMap de software libre de la
Generalitat de Catalunya, permitiendo asesorar al gobierno en trminos de qu metodologas de trabajo
adoptar y con qu herramientas trabajar en el mbito Open Source.

En el ao 2009, totalmente consolidados en el mercado nacional, Cometa llega a un acuerdo para
integrarse en el grupo Smile, lder en Europa en integracin de herramientas Open Source. Con este
acuerdo Cometa consolida definitivamente su proyecto empresarial y da un importante impulso a su plan de
crecimiento y mejora de los servicios.
1.2 SMILE
Smile es una empresa de ingenieros especializados en la creacin de soluciones Open Source y en la
integracin de sistemas basados en el Open Source. Smile es miembro de APRIL, la asociacin para la
promocin y la defensa del software libre.

Smile cuenta con 290 colaboradores en Francia y 320 en otros lugares del mundo (septiembre de 2009), lo
que la convierte en la primera empresa en Francia especializada en el Open Source.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 6 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Desde el ao 2000, Smile realiza un seguimiento activo de la tecnologa que le permite descubrir los
productos ms prometedores de Open Source, calificarlos y evaluarlos para proponer a sus clientes los
productos ms logrados, potentes y duraderos.

Este procedimiento ha dado lugar a una amplia gama de libros blancos sobre diferentes sectores. La
gestin del contenido (2004), los portales (2005), la inteligencia empresarial (2006), los frameworks PHP
(2007), la virtualizacin (2007), la gestin electrnica de documentos (2008) y los ERPs (2008). Entre las
obras publicadas en 2009 podemos destacar tambin Las VPN Open Source y Firewall y Control de los
flujos Open Source, en el marco de la coleccin Sistema e infraestructura.

Cada una de estas obras presenta una seleccin de las mejores soluciones Open Source en el campo en
cuestin, sus respectivas caractersticas y feedbacks de uso.

Mientras las soluciones Open Source slidas vayan ganando terreno en nuevos campos, Smile seguir
proponiendo a sus clientes informacin para que puedan aprovecharlas sin correr riesgos. Smile se muestra
en el panorama informtico francs como el proveedor integrador de calidad para acompaar a las
empresas ms grandes en la adopcin de las mejores soluciones de Open Source.

1.3 ESTE LIBRO BLANCO
El objetivo de este libro es presentar nuestro enfoque sobre la gestin documental respecto a la gestin de
contenidos y ayudarle en la eleccin de la solucin software para sus proyectos.

De este modo, le proponemos un anlisis de las respuestas ofrecidas por una seleccin de soluciones
Open Source a problemas concretos as como informacin sobre los mtodos para orientarle en la
puesta en marcha de su proyecto.

No se trata de un simple repertorio de soluciones ni de un enfoque terico a la gestin de contenidos
documental, sino de un cotejo de la realidad de las necesidades con el mercado de los SGD (Sistemas de
Gestin Documental) Open Source.

Las soluciones Open Source responden con eficacia a un gran nmero de necesidades. El know-how
exclusivamente documental sigue siendo, por delante de las herramientas, el principal reto de los proyectos
de Gestin Documental o de Gestin de Contenidos Empresariales (ECM).
En lnea con los otros libros publicados por Cometa, esta obra trata de reunir:
Un enfoque general de las nociones subyacentes de la gestin documental, fundamento
metodolgico de los proyectos de SGD.
Una descripcin de las principales funcionalidades esperadas en este tipo de proyectos




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 7 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
y de sus retos.
Una lista de las principales soluciones Open Source de gestin documental.
Una presentacin de las mejores herramientas, una evaluacin de sus puntos fuertes,
de sus lmites y de su madurez.

Este libro blanco es el resultado de los feedbacks de experiencias colectivas. Nos encantara conocer su
opinin sobre este tema.

1.4 RESUMEN
El objetivo de la gestin documental consiste en ofrecer un modo de gestin segura, trazable, organizada y
colaborativa de los documentos de las organizaciones.

La eleccin del Open Source permite disfrutar de productos de calidad que responden a las necesidades
reales de los usuarios y con las libertades que el Open Source nos ofrecen.

A da de hoy, las soluciones de GD y de ECM se distinguen principalmente por los objetos digitales que
procesan y las funciones que incorporan. La GD se limita a los documentos digitales, a menudo ofimticos,
mientras que la ECM incluye todos los contenidos digitales de la empresa, incluidas las imgenes, el
contenido de pginas web o documentos (archivos) generados por los sistemas de gestin de las
empresas.

En este sector, el Open Source alcanz la madurez a mediados de la primera dcada de 2000 y,
actualmente, ofrece soluciones estables, con un alto nivel funcional y tcnico y cada vez mejor adaptadas a
los mercados.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 8 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
1.5 ALGUNAS REFERENCIAS DE COMETA





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 9 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
















Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 10 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
1.6 ALGUNAS REFERENCIAS
1.6.1 Gestin documental
Serimax, Goservices, Pierre Audoin Consultant, Alstom Power services, NetasQ, Packetis,
CS informatique, Corep, SNCF - Direccin del material, Mazars, EDF R&D y nuclear, Consejo Regional
de Picardie, Leroy Merlin, Primagaz, Renault F1, INRIA, Centro de informacin de la juventud (CIDJ),
Unin de la Cooperacin Forestal Francesa, Ministerio belga de la Comunidad Francesa, INRIA,
APAVE Sur de Europa, UCFF, Volia Propret, Ecureuil Gestion.

1.6.2 Pginas web
EMI Music, Saln de la Agricultura, Mazars, Areva, Socit Gnrale, Gtes de France, Patrice Pichet,
Groupama, Eco-Emballage, CFnews, CEA, Prisma Pub, Volia, NRJ, JCDecaux, 01-Informatique,
Spie, PSA, Boiron, Larousse, Dassault-Systmes, Accin contra el Hambre, BNP Paribas, Air Pays de
Loire, Forum des Images, IFP, BHV, ZeMedical, Gallimard, Cheval Mag, Afssaps, CNIL
1.6.3 Portales, Intranets y Sistemas de informacin
HEC, Bouygues Telecom, Prisma, Veolia, Arjowiggins, INA, Primagaz, Croix Rouge, Eurosport, Invivo,
Faceo, Castillo de Versailles, Eurosport, Ipsos, VSC Technologies, Sanef, Explorimmo, Bureau Veritas,
Rgion Centre, Dassault Systmes, Fondation dAuteuil, PagesJaunes Annonces

1.6.4 Comercio electrnico
De Dietrich, Adenclassifieds, Macif, Furet du Nord, Gtes de France, Camif Collectivit, GPdis,
Longchamp, Projectif, ETS, Bain & Spa, Yves Rocher, Bouygues Immobilier, Nestl, Stanhome, AVF
Primdical, CCI, Pompiers de France, Comisara para la Energa Atmica

1.6.5 ERP & Sistema de apoyo a las decisiones
Groupe Accueil, Anevia, Projectif, Xinek, Companeo, Advans, Point P, Le Figaro, Bureau Veritas,
Mindscape, Loyalty Experts, Cecim, Espace Loggia, Nouvelles Frontires, La Poste,
HomeCineSolutions, Vocatis, Skyrock, Lafarge, France Domicile, Polyexpert, Cadremploi, Cmonjob,
Meilleurmobile.com

1.6.6 Infraestructura y Alojamiento
Agencia Nacional de Cheques de Vacaciones, Pierre Audoin Consultants, Rexel, Motor Presse, OSEO,
Sport24, Eco-EmBallage, Institut Mutualiste Montsouris, ETS, Ionis, Osmoz, SIDEL, Cadremploi,
SETRAG, Instituto Francs del Petrleo, Mutualit Franaise...





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 11 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
1.7 EL OPEN SOURCE EN LA EMPRESA
1.7.1 Gestin documental de cdigo cerrado
Existe un gran nmero de soluciones que ofrecen conjuntos de funcionalidades y dan respuesta a los
problemas que plantea la gestin documental.

Entre los programas de cdigo propietario ms conocidos, podemos encontrar Documentum de EMC,
FileNet de IBM, SharePoint de Microsoft, Open Text de la empresa del mismo nombre, Autonomy que
compr Interwoven o Ever Team del grupo Ever. La mayora de las anteriores son soluciones de alta
gama presentes en el mercado de la gestin de contenidos desde hace ms de una dcada y que han
ido incluyendo a lo largo del tiempo un gran nmero de funcionalidades que van mucho ms all de la
simple gestin documental. Son soluciones relativamente pesadas, en algunos casos desfasadas y
adaptadas a los problemas complejos de las empresas muy grandes.

Desde hace unos aos, el mercado de software propietario de gestin documental est siguiendo la
misma tendencia que el de las herramientas de gestin de contenido web. Las soluciones que
perduran son las dedicadas a nichos de mercado que incluyen un importante know-how de la profesin
o los que cuentan con un posicionamiento de gama muy alta y precios elevados, asociado a un
prestigio que les permite seguir captando clientes.

En el fondo, hay que tener en cuenta que lo nico que gua a un fabricante son los intereses
convergentes con los de sus clientes. Es cierto que se mueve en un mercado con competencia y su
producto debe ser mejor que el de sus competidores pero, una vez adquiere una buena posicin, el
fabricante puede plantarse el siguiente anlisis:
Su producto debe estar abierto, pero no demasiado, para conservar el control del cliente
(vendor lock-in)
Su producto debe ser eficiente, pero no demasiado, ya que el incremento del nmero de
servidores conlleva un aumento del nmero de licencias vendidas.
Su producto debe ser potente, pero complejo, ya que debe seguir vendiendo prestaciones
de servicio y de soporte.
Su producto debe ser til pero, sobre todo, debe ser atractivo. De hecho, a veces, los
decisores desconocen la realidad del producto y uno que est bien presentado pero al que
no se le incorporen modificaciones o que no responda de forma precisa a las expectativas
funcionales puede constituir la mejor alternativa, a pesar de que finalmente el valor aadido
sea escaso.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 12 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
No por ello queremos decir que los fabricantes propietarios sean tan maquiavlicos como para hacer
sus productos peores a propsito, sino que su prioridad estratgica no se centra en estas
caractersticas.
El anlisis Magic Quadrant for Enterprise Content Management de 2009
1
muestra varias tendencias
importantes de la oferta de ECM.
Por un lado, el mercado de gestin de contenidos sigue creciendo, mientras que el nmero
de mercados informticos se reduce.
Por otro lado, cada vez se tiene una mayor percepcin de la gestin de contenido como un
elemento esencial del valor aadido de las empresas. Como consecuencia de lo anterior,
las soluciones que gestionan activos digitales (digital assets) deben estar mejor integradas
en su sistema de informacin, los equipos internos deben manejarlas mejor y su
mantenimiento debe ser menos caro.
Y esto es lo que impulsa a las soluciones Open Source.

1.7.2 La eleccin del Open Source
El Open Source gana cada ao nuevos sectores de aplicacin, dentro de una dinmica extraordinaria.
Han aparecido nuevos actores y los fabricantes de Open Source y la validez de su modelo de negocio
ha quedado hoy en da ms que demostrada. Las ofertas son cada vez ms maduras y suponen
alternativas reales a las soluciones anteriores, las soluciones propietarias.

Veamos cules son los criterios de eleccin ligados al carcter Open Source de las soluciones.

Los beneficios econmicos se encuentran entre las primeras razones para escoger soluciones Open
Source. Aunque poner en marcha una solucin Open Source no sea gratis, a la larga, su implantacin
permite un aumento del nivel competitivo. Muchos estudios confirman que el coste total de los
proyectos Open Source es significativamente inferior a largo plazo. Las ganancias observadas
pueden oscilar entre el 20% y el 80%, segn el grado de madurez del Open Source en el sector
en cuestin.

Por supuesto, el precio de la licencia de las soluciones propietarias es el primer factor mencionado:
supone una inversin inicial importante, incluso antes de saber si es el sistema adecuado. Esto se ve
acentuado por el precio de las prestaciones, que suele ser ms bajo en el sector Open Source, ya que
la apertura del producto facilita la difusin del conocimiento. Finalmente, el coste de posesin
(mantenimiento, actualizaciones) tambin suele ser menor.


1
http://www.gartner.com




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 13 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

Su evolucin no depende de su rentabilidad ni de estrategias de marketing. Siempre y cuando una
comunidad se interese por un producto, ste seguir vivo.

La difusin del know-how asociada a su puesta en marcha est garantizada por las barreras
prcticamente inexistentes para su adquisicin (descarga y documentacin libres y accesibles).

La estandarizacin, el respeto de las normas y estndares y la apertura forman parte de las
inquietudes de los desarrolladores de Open Source, que no intentan volver al pasado sino introducir
soluciones eficientes.

La posibilidad de realizar modificaciones en las fuentes es fundamental desde un punto de vista terico
pero arriesgada desde un enfoque prctico. Por lo tanto, no hay que valorar la apertura en estos
trminos, sino ms bien en la capacidad de aceptar extensiones o de interactuar con otras
aplicaciones.

La durabilidad: la libre disposicin de los fuentes es una garanta fundamental de durabilidad. Es
necesario aqu subrayar que no es imprescindible que el cliente las controle.

En cuestiones de durabilidad, lo peor que le puede pasar a una solucin Open Source es que las
comunidades pierdan el inters por ella, generalmente al decantarse por otra solucin ms
prometedora. Por lo tanto, es posible que un da sea necesario cambiar de producto. Pero este
fenmeno es lento y los usuarios tienen tiempo para organizar su migracin.

En el caso de los fabricantes Open Source, cabe destacar que, incluso si no funciona bien, siempre
existe la posibilidad de que una comunidad retome el control del producto y de sus evoluciones. ste
es el principio de las licencias Open Source.

De este modo, conforme las soluciones se hacen ms maduras, el coste deja de ser el primer criterio
de eleccin. Son las otras, y no stas, las cualidades que ms destacamos.







Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 14 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
2 GENERALIDADES
2.1 POR QU ES NECESARIA UNA SOLUCIN DE GESTIN DOCUMENTAL?
La decisin de utilizar una solucin de gestin documental se toma a menudo tras una crisis o una situacin
tensa causada por la gestin de la informacin, una situacin que requiere el establecimiento de una
organizacin ms estructurada, de una trazabilidad o una mejor usabilidad. La informtica suele ser el
mejor modo de ofrecer una respuesta adaptada.

Las crisis pueden tener diferentes manifestaciones: la imposibilidad de crear un dossier completo de un
cliente en un plazo razonable, de encontrar la ltima versin de un documento electrnico en el que se han
invertido das de trabajo... Aunque pueda resultar insidiosa en nuestra era digital, la crisis ms frecuente
es, posiblemente, la prdida por disolucin. Disolucin de informacin importante en un conjunto
demasiado grande. Hay una prdida de conocimiento o de memoria a nivel corporativo.

Y las tensiones vienen causadas por dificultades crnicas en el uso de documentos o por el tiempo perdido.
El tiempo perdido en bsquedas suele ser el factor ms nombrado. La reutilizacin de documentos
existentes tambin es problemtica cuando se intercambian muchos documentos en la empresa y la
eficacia del trabajo puede verse mermada por la falta de organizacin, de trazabilidad o simplemente de
visibilidad en la organizacin documental. En este caso nos encontramos con una prdida de
productividad.

Cabe destacar tambin que la gestin documental forma parte de los procesos de calidad (ISO 9001,
14001 especialmente) y, aunque para su obtencin no es necesario el uso de programas de gestin
documental, permiten aprovechar plenamente la aplicacin de las normas en materia de gestin
documental, ms all de los estrictos criterios de calidad.

Con este tipo de aplicaciones puede resultar difcil calcular la repercusin que se tiene sobre la inversin.
Depende de la evaluacin de criterios cuyo anlisis ms detallado se basa en la comparacin entre el antes
y el despus, son criterios que suelen ser difciles de determinar en cifras. No obstante, es un mtodo
esencial para demostrar el posible inters de un proyecto y, a menudo, encontramos estndares de sentido
comn o contextuales altamente satisfactorios.

Siempre que sea posible, es interesante evaluar datos objetivos y fijar objetivos de mejora para este tipo de
aplicaciones. Estos pueden ser, por ejemplo: el tiempo de gestin de los correos, en caso de una GD de
correspondencia; el porcentaje de cumplimiento de normas y procedimientos, en caso de una GD en el
mbito de la calidad; el tiempo de gestin de la renovacin de contratos para una base de datos de




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 15 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
contratos o el porcentaje de repeticiones de una misma imagen en la organizacin para una aplicacin de
gestin de archivos multimedia...
2.2 PRESENTACIN DE LOS CONCEPTOS
Queremos definir aqu la situacin actual de la gestin documental respecto a cierto nmero de conceptos.

Los conceptos que abajo se presentan no son una lista exhaustiva del sector de la gestin documental pero
consideramos que son necesarios para entender correctamente nuestras explicaciones.

2.2.1 Documento electrnico
El concepto de documento, aunque no plantea problemas en el mundo material, debe precisarse ms
al hacer referencia a documentos electrnicos, a archivos.

Nuestro enfoque de la gestin documental toma la definicin que da la norma ISO: Un documento es
el conjunto formado por un soporte de informacin y los datos registrados en el mismo, de forma
generalmente permanente y legible por el hombre o por una mquina.

En el caso de los documentos electrnicos, el soporte es un formato de archivo. El archivo se crea,
modifica y es visible a travs de una aplicacin. Por ejemplo, un documento .doc se crea, modifica y
es legible mediante el programa Microsoft Word. Las informaciones son los datos informticos incluidos
en el sobre del archivo.

Veremos ms adelante cmo las aplicaciones de GD introducen la nocin de objeto documental, que
rene conceptualmente al archivo y sus metadatos.

2.2.2 Contenido
El trmino contenido se utiliza para designar a un componente informativo coherente. El objeto
documental, tal y como se ha indicado arriba, es un contenido. El trmino se aplica a cualquier
informacin digital que tenga sentido.

Casi siempre, los contenidos estn estructurados, es decir, formados por un conjunto de campos
de informacin. En este caso hablamos de contenidos documentales o estructurados.

A veces, es complicado distinguir entre un conjunto de contenidos y un documento electrnico.
Muchas veces es el contexto de uso y los procesos realizados los que permiten distinguir la




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 16 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
naturaleza de la informacin y el campo funcional en cuestin y definir el mejor tipo de herramienta
para gestionarla.

Podemos citar algunos ejemplos de lo que puede considerarse un documento y/o contenido para
ilustrar nuestra declaracin: una noticia breve en una pgina de actualidad, una revista de artculos de
prensa, una imagen y su leyenda, una ficha descriptiva de un producto, una resea de un documento,
un catlogo de productos en formato PDF, un mdulo documental en formato SCORM...

2.2.3 Gestin documental
Objetivo: ocuparse del almacenamiento, puesta en comn y restitucin de documentos electrnicos.
En la mayora de los casos suele tratarse de sistemas que gestionan archivos que incluyen un fondo (el
contenido informativo) y una forma (el sobre de presentacin).

Prioridad: gestin de documentos electrnicos.

Orientacin: almacenamiento, puesta en comn, bsqueda.

Trminos encontrados: GD - Gestin Documental, EDM(S) - Electronic Document Management
(System), DMS Document Management System.

2.2.4 Gestin de contenido web
Objetivo: gestionar la redaccin, la aceptacin y la publicacin en lnea de contenidos destinados a
pginas web.

Prioridad: publicacin en lnea de informacin.

Orientacin: difusin, publicacin de contenidos estructurados y/o editoriales, contribucin.

Trminos encontrados: WCM - Web Content Management, CMS Content Management System,
trmino a veces empleado para hacer referencia a la gestin de contenido web.


2.2.5 Gestin de contenido
Objetivo: permitir la gestin de contenidos digitales, a travs de funciones de diseo, difusin, uso,
bsqueda y archivo.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 17 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Podemos considerar la gestin de contenido como un superconjunto de la GD y la WCM. Las
soluciones de gestin de contenido suelen incluir aspectos de proceso de workflow (BPM Business
Process Management) y de trabajo colaborativo (groupware).

Prioridad: la gestin de contenido empresarial (ECM) es el concepto ms reciente de la gestin de
informacin digital ya que hace referencia, al mismo tiempo, a la informacin estructurada y no
estructurada, a lo largo de todas las etapas del ciclo de vida de los contenidos digitales.

Orientacin: gestin de contenidos en un sentido amplio, es decir, integracin de herramientas de GD,
de WCM, a veces incluso de portal.

Trminos encontrados: CMS Content Management System, ECM Entreprise Content
Management, BPM Business Process Management, EIM - Enterprise Information Management.

Debemos destacar que, a veces, podemos encontrar el trmino gestin de contenido en un sentido
ms limitado, refirindose a la gestin de contenido web (para sitios de internet) por la unin
histrica con los CMS, precursores de este tipo de herramientas.

2.2.6 Gestin de contenido multimedia
Objetivo: gestionar las caractersticas especficas de los activos multimedia digitales (los Digital
Assets, en ingls): Imgenes, msica y vdeo.

Prioridad: contenidos de imgenes y sonidos, navegacin y bsqueda en el repositorio, gestin
especfica de los derechos de autor.

Orientacin: metadatos, navegacin, bsqueda, DRM (Gestin de derechos digitales), gestin de
volmenes importantes.

Trminos encontrados: DAM Digital Asset Management o Gestin de Recursos Digitales

Se trata de una rama dentro de la GD. Comparten muchas funcionalidades respecto a la
categorizacin, la gestin de derechos y los ciclos de vida. Pero, aunque los metadatos especficos de
la gestin de derechos de autor pueden gestionarse con cualquier herramienta de GD, algunas
funcionalidades especficas son propias de la DAM, tales como la manipulacin de imgenes, la
gestin de derechos de autor, la extraccin de vietas o la cesta de seleccin.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 18 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
2.2.7 Workflow (BPM)
Objetivo: permite dar forma y fluidez a los procesos, mediante el encadenamiento de tareas
individuales de diferentes actores.

Prioridad: gestin de procesos y formularios. El BPM da respuesta a la necesidad de interacciones
formales entre los actores de actividad de la organizacin, ya se traten de personas o de sistemas, ya
que los procesos a veces suelen requerir la interaccin de ambos.

Orientacin: gestin de tareas asignadas a perfiles de usuario. No obstante, suele ser la herramienta
que permite orquestar webservices generados por diferentes aplicaciones para organizar acciones
individuales con el objetivo de obtener un resultado complejo.

No debemos olvidar la existencia de herramientas especializadas segn los objetos que gestionan
como, por ejemplo, el Docflow para documentos.

Trminos encontrados: BPM Business Process Management, gestin de formularios, workflow,
flujos de trabajo, ciclo de vida.

2.2.8 Archivo Record Management (RM)
Objetivo: permitir gestionar las fases de vida de los documentos tras su periodo de utilidad (el periodo
de vigencia administrativa).

Prioridad: la conservacin de los almacenamientos (documentos) de archivos.

Orientacin: el conjunto de procesos de gestin archivstica que permiten garantizar la inclusin, la
seguridad, la fiabilidad y la perennidad de los archivos de la organizacin.

Debemos indicar aqu que las aplicaciones de RM estn cada vez ms presentes en aplicaciones de
GD. De hecho, se ha demostrado que el archivado se realiza mejor cuando se gestiona desde la
creacin del archivo (carpeta, documento...).

Trminos encontrados: SAE sistema electrnico de archivo, RM Record Management, archivo,
archivstica, gestin del ciclo de vida, cuadro de clasificacin

2.2.9 Trabajo colaborativo




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 19 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Objetivo: facilitar el trabajo de los grupos de personas mediante herramientas exclusivas de
comunicacin o de interaccin en tiempo real o diferido (por ejemplo: correo electrnico, agenda
compartida).

Prioridad: facilitar el trabajo en equipo.

Orientacin: puesta en comn de la informacin operativa.
Trminos encontrados: groupware trabajo en equipo, Chat (mensajera instantnea), Blog (modo
de comunicacin personal a travs de publicaciones temticas), Wiki (modo de puesta en comn de
informacin mediante la edicin conjunta de pginas), Agenda compartida, Google Wave (herramienta
a caballo entre el correo, el chat, el blog y el wiki).

2.2.10 Motor de bsqueda
Objetivo: permitir volver a encontrar una informacin existente.

Prioridad: indexacin o consulta de bases de contenido.

Orientacin: el objetivo es permitir a los usuarios encontrar una informacin. Las herramientas de
bsqueda se centran, por un lado, en la indexacin de esos contenidos o en el uso de ndices externos
en el caso de los metamotores y, por otro lado, en las herramientas de aumento de la relevancia
(adecuacin de lo buscado a los resultados que arroja el motor).

Trminos encontrados: Motor de bsqueda, Search Engine, SEO (Search engine optimisation),
Findability, Metamotor, Crawler, Operador de bsqueda
2.3 DE LA GD AL ECM
Desde hace unos aos, observamos como el trmino ECM va desplazando a las siglas DMS y GD.
Ms all de las modas, este paso de la gestin documental a la gestin de contenido empresarial
refleja cierta realidad actual.

2.3.1 El permetro de la GD
La Gestin Documental trata documentos digitales. A este respecto, una solucin de GD puede incluir:
herramientas: de digitalizacin, de almacenamiento, de circulacin, de difusin y de
bsqueda, principalmente.
especificidades para profesionales: aplicacin de procedimientos de calidad, gestin del




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 20 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
ciclo de vida, reglas de gestin, interaccin con aplicaciones profesionales, entre otras.
especificidades para profesionales: transformacin de formato de archivos,
previsualizacin de archivos multimedia, pginas web, contenidos estructurados, grupo de
trabajo...
Ya no hay casi ninguna aplicacin de GD pura: casi siempre suelen incluir funciones prestadas en
sectores nombrados arriba o de sectores especficos en determinadas profesiones.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 21 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
2.3.2 El concepto de ECM
La gestin de contenido empresarial se parece a las soluciones de software que proponen funciones
para gestionar todos los contenidos digitales de una organizacin.

Por lo tanto, se encargan de extraer (adquirir, capturar) las informaciones electrnicas (estructuradas o
documentales) para gestionarlas (almacenarlas, editarlas, difundirlas) respondiendo a las exigencias de
los usuarios (ergonoma, funcionalidad) y a los procesos de la organizacin (seguridad, fiabilidad,
proceso).


En este grfico se muestra la relacin existente entre los sectores de la GD, la WCM y la ECM y la
relacin de estos frente a determinados sectores anlogos.

Sealemos, por ltimo, que la nocin de portal de empresa suele asociarse a la de ECM.
Aunque las intersecciones sean dbiles desde un punto de vista funcional, el aspecto globalizador
de las soluciones de ECM no debe ocultar el objetivo diferente de las dos herramientas. Exponer las
herramientas (servicios) de la organizacin (portal) frente a gestionar contenidos de la organizacin.

No hay que olvidar que la posibilidad de que una solucin ECM o GD se integre en un portal es una
cualidad importante. Especialmente cuando el servicio informtico de su empresa no desea aadir
en una nica aplicacin todas las soluciones de acceso a la informacin.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 22 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
2.3.3 Evolucin de las herramientas:
Antes, las soluciones de GD estaban orientadas hacia la gestin de archivos, posteriormente hacia la
gestin de documentos especficos con una tipologa cada vez ms amplia (correos, formularios,
imgenes, vdeos...). Su evolucin natural les lleva a integrarse cada vez ms en los procesos de
gestin documental, especialmente, mediante una mejor gestin del contexto de edicin o de la
estructura de los archivos documento (MS Word, Open Office, PDF...) que permitir, en un futuro, tratar
documentos como una inclusin de contenidos.

La evolucin de la cobertura funcional de las soluciones de GD tiende a solucionar los diferentes
problemas que se les planteaban a los usuarios. Por una parte, integrando la gestin de contenidos
estructurados paralelamente a la de contenidos documentales (suele hablarse de contenido semi-
estructurado) y, por otra parte, permitiendo realizar acciones colaborativas ms avanzadas.

El ECM abarca el permetro de la GED y lo expande hasta otros contenidos empresariales, en concreto
los contenidos web (WCM), e incluso de los contenidos gestionados por otras aplicaciones que
incluyen contenidos. En este caso hablamos de federacin.

2.3.4 Traslacin de mtodos
La evolucin en la gestin de contenidos sigue dos lgicas muy diferenciadas: por un lado, una
ampliacin de los contenidos gestionados y, por otro lado, una adaptacin de los mtodos de gestin
de estos contenidos, derivados de la gestin documental.

De hecho, observamos que un gran nmero de mtodos de ECM provienen de la GD. Un contenido
suele considerarse un archivo (o un conjunto de archivos) y las acciones que realizamos son similares
a las que un usuario est acostumbrado a hacer con documentos.

Son dos factores los que explican esta traslacin de mtodos entre GD y ECM: las soluciones de
ECM suelen provenir de fabricantes de GD, pero es principalmente la transposicin del paradigma del
documento en formato papel a los contenidos electrnicos lo que permite a los usuarios sortear
parcialmente la complejidad de los contenidos electrnicos.

Hemos observado que a los usuarios les parece ms sencillo gestionar un contenido visto como un
conjunto coherente que como fragmentos de algo sin forma, cuyo aspecto (forma) es difcil de
comprender.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 23 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Es decir: es ms sencillo comprender y manipular un sitio web que varios contenidos (por ejemplo, tres
imgenes, un banner y varios bloques de texto) que una vez ordenados en la pantalla forman una
pgina web.
2.4 RETOS PRINCIPALES DE LA GD
La gestin documental (GD) es un trabajo principalmente organizativo, al contrario que la gestin de
contenido Web (WCM) que responde esencialmente a problemas tcnicos.

Las herramientas de gestin de contenido Web estn orientadas hacia la difusin de contenidos
estructurados: su formato, publicacin, facilidad para acceder el gran pblico, etc. Sin embargo, las
herramientas de gestin documental se centran en los procesos de gestin iniciales, como la posibilidad
de realizar una indexacin rica o de integrar nuevas reglas de proceso (workflow, transformacin, alertas
sujetas a condiciones), entre otras.


Por lo tanto, la instalacin de una solucin de GED requiere una importante implicacin por parte de los
futuros usuarios.

Queremos subrayar que el xito de las aplicaciones GD se basa principalmente en el correcto uso de
algunas herramientas y principios que se describen a continuacin.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 24 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

La ergonoma de la aplicacin debe adaptarse al uso de una aplicacin de gestin, utilizada por un nmero
importante de personas, al igual que una aplicacin de mensajera o correo electrnico, por ejemplo.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 25 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
2.4.1 Estructuracin de los metadatos
La gestin de documentos electrnicos tiende a parecer una gestin a ciegas. Al no haber formatos
abiertos (ver ms adelante), el documento-archivo se convierte en un objeto opaco y al que slo se
puede acceder desde la aplicacin en la que se ha creado, por lo que la aplicacin GD slo muestra
inicialmente su nombre (nombre del archivo) y su tipo (tipo MIME).

Los metadatos son la informacin asociada a los documentos gestionados. Sirven para calificar los
documentos, dotarlos de informacin complementaria utilizable. El metadato puede utilizarse
directamente como informacin pero, sobre todo, es la base de las funciones de bsqueda o de
procesos selectivos aplicados a los documentos.

Para contar con funciones avanzadas, un sistema de GD debe permitir asociar a los documentos
informaciones estructuradas utilizables. Y ste es el reto de los metadatos.

Los metadatos tpicos incluyen, entre otros, el ttulo, el autor, la descripcin, el idioma y la fecha de
publicacin.

Existen nomenclaturas estndares de metadatos, en especial el Dublin Core, que define los 15 campos
principales de metadatos. Algunas profesiones cuentan con sus propios estndares (msica,
arquitectura, salud o archivstica, por ejemplo).

Para responder de la mejor forma posible a las necesidades de los usuarios, las soluciones deben
gestionar varios conjuntos (o sets) de metadatos segn los tipos de documentos y prever un gran
abanico de tipos de metadatos, informacin textual (campo de texto), lista de valores de tablas de
referencias, fecha o nmero en base a los cuales se podrn calcular reglas de gestin...

2.4.2 Repositorio o cuadro de clasificacin
La mayora de las soluciones de gestin de contenido incluyen uno o varios repositorios de
clasificacin.
En cuanto se habla de organizacin profesional, de recursos especficos y de procedimientos de
gestin documental, es indispensable contar con una estructura que haga las veces de columna
vertebral del sistema de gestin documental: ste es el objetivo del repositorio de clasificacin. Es una
de las herramientas ms importantes. El uso que se realice de esta herramienta es un factor importante
a la hora de escoger una solucin.

Las herramientas pueden estar ms o menos elaboradas, pero todas permiten, como mnimo, definir
un plan o un cuadro de clasificacin, es decir, un diagrama jerrquico en el cual se clasifican los
documentos. Las herramientas pueden permitir incluso gestionar vocabularios especficos con




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 26 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
sinnimos, vnculos de proximidad semntica, multi-jerarqua y traduccin de trminos. En este caso
hablaremos de tesauro o de ontologa.

Un repositorio de clasificacin ofrece diferentes funciones: indexacin, vocabularios comunes
(glosarios), bsqueda avanzada (teniendo en cuenta sinnimos y proximidad semntica, por ejemplo),
o navegacin facetada.

2.4.3 Consideracin del ciclo de vida
Para optimizar la gestin de los recursos documentales, hay que gestionar su ciclo de vida, que se
extiende desde su creacin hasta ms all de su utilidad operacional.

Un documento se crea ejecutando un conjunto de procesos antes de poder utilizarse. Por ejemplo, un
contrato se redacta, modifica, valida, imprime, firma y despus se enva, a menudo en formato papel.
El ciclo de vida incluye todas estas fases, desde su elaboracin hasta su archivo definitivo o su
destruccin.

La gestin del ciclo de vida de los documentos electrnicos debe realizarse, como mnimo, con tanta
minuciosidad, como la de los documentos en formato papel. De hecho, por la facilidad que tienen de
ser duplicados, enviados y almacenados, su nmero es mucho ms importante. Y esto conlleva
diferentes problemas, que van desde la dificultad de trazabilidad entre versiones, la capacidad para
encontrar una informacin precisa o el volumen de almacenamiento.

2.4.4 Digitalizacin
Las soluciones de GD pueden gestionar diferentes tipos de documentos, ya provengan de aplicaciones
ofimticas o de procesos de digitalizacin.

La digitalizacin o desmaterializacin consiste en la transformacin de un documento de un soporte
material a datos electrnicos. Puede tratarse, por ejemplo, de la digitalizacin de un documento papel
para convertirlo en un documento ofimtico, o del paso de un conjunto de formularios a una base de
datos, de la transformacin de una pelcula o una grabacin sonora a un archivo multimedia.

Hace ya muchos aos que est en el aire el objetivo papel cero, pero todo el mundo est de acuerdo
en que es poco probable que se elimine por completo el uso del papel. Sin embargo, la digitalizacin
permite aprovechar las ventajas digitales en todos los contenidos desmaterializados.

Algunas organizaciones la realizan y sus proyectos de gestin de informacin se orientan al todo en
uno que les permite accesos y modos de gestin unificados para todos los contenidos, ya sean fsicos
o digitales.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 27 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3 LAS SOLUCIONES DE GESTIN DOCUMENTAL
3.1 ALFRESCO
Alfresco
2
es un fabricante ingls, creado en 2005 por antiguos dirigentes de Documentum y Business
Objects. A da de hoy, la sociedad est presente en Inglaterra, Francia y Estados Unidos y Espaa.

Mediante una solucin J2EE, ofrecen todas las funcionalidades que los clientes buscan: metadatos, tipos de
documentos, workflow documental y avanzado, gestin de categoras, herramientas de colaboracin,
bsqueda, gestin de varias bases independientes, gestin de contenido Web.

La herramienta destaca por diferentes aportaciones:
Una orientacin claramente colaborativa tanto a nivel de funciones como de interfaces.
Una arquitectura funcional y tcnica de buena calidad que le permite ser la opcin de GD de
grandes organizaciones. Alfresco es muy abierto y los desarrollos se realizan mediante APIs
(application programming Interface) y herramientas, muchas y bien documentadas, de
diferentes niveles: desde el simple script a componentes Java, pasando por web services.
Las reglas de gestin, a las que los usuarios pueden acceder directamente, permiten pasar una
parte de las configuraciones a los gestores y no a desarrolladores ni administradores.
Un componente de gestin de contenidos web, paralelo a la gestin documental Este mdulo
est dedicado a la gestin de contenidos web y no a su distribucin en servidores remotos.


2
http://www.alfresco.com




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 28 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

las facilidades de integracin con la estacin de trabajo.
un mdulo de Record Management, es decir, de gestin de archivos, basado en la norma
americana DoD 5015.02
un framework de diseo de interfaz: SURF
mdulos tcnicos avanzados, tales como el load balancing o la gestin de varias instancias en
una nica instalacin.
una visibilidad significativa en la escena internacional gracias a sus estrategias de comunicacin,
su actividad de marketing y su gran nmero de clientes.

Alfresco est disponible en dos versiones: Una versin Community, gratuita, con licencia GPL y una
versin Enterprise, que requiere una suscripcin anual de pago y permite disponer de garanta del
fabricante as como a las actualizaciones intermedias. El precio de esta suscripcin vara en funcin de
diferentes factores: el nivel de servicio de soporte demandado (SLA), los mdulos instalados y el nmero de
procesadores utilizados.

Esta solucin cuenta con una importante dinmica de desarrollo, as como con una comunidad de usuarios
y de desarrolladores considerable. Cabe destacar la existencia de la pgina Alfresco Forge
3
, que recoge un
gran nmero de plug-ins.

La versin 3.2, disponible desde enero de 2010, incluye muchas mejoras, entre las que destacamos:
Reestructuracin de la interfaz de colaboracin Alfresco Share, en el framework SURF
Mejora del mdulo WCM, en trminos de rendimiento y de funcionalidad
Una mejora de la integracin de los correos electrnicos. Ofrece la posibilidad de
asignar correos directamente a cada objeto del servidor de Alfresco, para almacenar
contenido o comentar un documento, por ejemplo, y adems para consultar un buzn
IMAP directamente.
Inclusin de un mdulo de Record Management (RM) y de funcin de Information Life
Cycle (ILM) para la gestin de la vida de los documentos. Este mdulo cuenta con el
certificado del DOD (Departamento de Defensa americano)


3
http://forge.alfresco.com/




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 29 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
La compatibilidad de Alfresco con el Cloud de Amazon (EC2), especialmente con
facilidades de gestin con las funciones multiempresa (bases cerradas en una nica
instalacin)
La integracin de una primera implementacin CMIS (la futura norma de
interoperabilidad de los sistemas de GED)
Integracin del protocolo de comunicacin Sharepoint (WSS), que permite el uso de la
GED en calidad de depsito documental directamente desde las aplicaciones de MS
Office




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 30 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3.2 NUXEO
Nuxeo
4
es una empresa francesa que ofrece una solucin de GD Open Source desde 2001. La primera
solucin de Nuxeo, que recibe el nombre de CPS, se desarroll en Zope/Python. Nuxeo Enterprise
Plateform es el resultado de su migracin a Java, desde 2007.A da de hoy, la sociedad est presente en
Francia y en Estados Unidos.

Se trata de una solucin completa de gestin de contenido empresarial, en entorno Java J2EE: metadatos,
tipos de documentos, workflow avanzado, gestin de categoras, funciones de colaboracin, bsqueda,
gestin de contenido complejo (web, multiarchivos, estructurados), gestin multi-bases.


Son varios los elementos que distinguen a esta herramienta:
su editor de temas, totalmente grfico, que permite personalizar la interfaz
el concepto de relaciones que permite crear vnculos entre contenidos. El tipo es recproco y
permite unir tanto elementos internos de Nuxeo como externos (URL), por ejemplo, es la
traduccin de/ est traducido de o tiene como documento adjunto/es el documento adjunto de


4
http://www.nuxeo.com




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 31 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
su interfaz estndar, que puede utilizarse directamente en proyectos de GD, es sencilla y cuenta
con una ergonoma satisfactoria (pinchar y arrastrar, presentacin en pestaas)
la gestin de vocabularios, que permiten a un administrador funcional administrar las listas de
valores en cualquier aplicacin
el concepto de seccin de publicacin, que permite separar totalmente el espacio de trabajo de
los usuarios de la parte que se muestra a los diferentes pblicos
una arquitectura totalmente modular que facilita el desarrollo, el mantenimiento y la reutilizacin de
funcionalidades adicionales. La calidad tcnica de la solucin permite que puedan utilizarla tanto
pequeas estructuras como grandes grupos internacionales, e incluso ser integrada como mdulo
de gestin documental en otros proyectos.
el motor de notificacin de Nuxeo, que es potente (activacin de alertas en muchos elementos) y
extensible (por correo, RSS...)
la herramienta Nuxeo Studio, para una configuracin ms sencilla, ver abajo.

La versin 5.3, publicada en octubre de 2009, incluye un lote de mejoras muy importante, tanto en
cuestiones tcnicas, como ergonmicas e incluso de marketing:

la inclusin de una tecnologa de widgets (gadgets web) con la integracin de Opensocial
un framework de creacin de sitios Web documentales basados en Nuxeo Gracias a ste, se
pueden gestionar contenidos, como una GED y tener informes, como en un CMS. La integracin
con CMS (en particular con eZ Publish a finales de 2009) permite avanzar en la lgica de
separacin de la gestin y de la publicacin de contenidos
la introduccin de herramientas colaborativas de wiki (prximamente, de Blog) directamente en la
interfaz estndar
la gestin de correos: permite crear repertorios que recogen automticamente los correos de una
cuenta seleccionada
un herramienta, muy potente, de anotacin de documentos Office que responde a las expectativas
de los usuarios en trminos de facilidad de uso
la integracin del protocolo de comunicacin Sharepoint (WSS), que permite el uso de la GED en
calidad de depsito documental, directamente desde las aplicaciones de MS Office
la sincronizacin entre bases documentales (con SyncML) que permite gestionar la difusin de una
parte de la base documental
una versin de Nuxeo dedicada al DAM, para la Digital Asset Management (Gestin de Recursos




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 32 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Digitales), que integra una interfaz adaptada, herramientas de gestin de formatos de vdeo y
funciones para la gestin de imgenes
Nuxeo Studio, disponible mediante suscripcin, es una herramienta de configuracin grfica que
permite configurar un gran nmero de opciones, tales como los tipos de documentos, la definicin
de los ciclos de vida, algunos elementos grficos de las interfaces o incluso la configuracin bsica
de un proyecto de Nuxeo
una herramienta de gestin de correo, que aparecer en el primer trimestre de 2010, adaptada a la
gestin de flujos de correo entrante y saliente y que tiene en cuenta las caractersticas especficas
de tratamiento (gestin de bandejas), de procedimiento (workflow) y de adaptaciones ergonmicas
La implantacin de una versin intermedia del estndar CMIS
Se est ultimando el modo Off-line (realizado con Smile) para la consulta de la base documental en equipos
que no estn conectados al servidor de Nuxeo.
3.3 EXO DMS
Exo es un fabricante francs creado en 2003 por el francs Benjamin Mestralet, gracias a la financiacin del
DoD (Ministerio de Defensa americano). Actualmente, la empresa est presente en Francia, Vietnam,
Ucrania y Tnez.

La aplicacin inicial de portal de integracin no tard en pasar al paquete eXo Platform, con muchos
mdulos o elementos tcnicos, para dar respuesta de forma integrada a las necesidades de una ECM
moderna. Cabe citar aqu la gestin de un portal de integracin (eXo Portal), la gestin de contenido web
(eXo WCM), la gestin documental (eXo DMS - de Document Management System), la gestin de
workflows y, especialmente, la integracin del proyecto Bonita e incluso de un WebOS, una especie de
portal en forma de estacin de trabajo destinado a ofrecer una solucin de oficina virtual.

El fabricante ha creado diferentes paquetes de productos, nombremos aqu a eXO Collaboration Suite con
correo, agenda de direcciones, calendario y servicio de mensajera instantnea o eXo Knowledge Suite con
la herramienta de FAQ y foro.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 33 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

Dentro de esta suite, eXo DMS ocupa un lugar central ya que se trata del mdulo destinado a almacenar
todos los archivos. En este libro blanco, solo comentaremos ese mdulo por su pertenencia a un conjunto
ms vasto.

La aplicacin eXo DMS ofrece caractersticas muy interesantes, entre las que cabe destacar:
una interfaz estndar que incluye de origen las facilidades del explorador de Windows: hacer clic y
arrastrar, accesos directos del teclado, visualizacin mltiple...
la base de contenido (JCR) global para todos los contenidos (Web y documentos) puede utilizarse a
travs de Webdav, FTP y CIFS
la integracin ofimtica bastante avanzada, con un plug-in especfico para MS Office y una
integracin de Open Office
la posibilidad de personalizar las interfaces de los usuarios en funcin de sus perfiles. De hecho,
eXo DMS, al igual que todas las aplicaciones eXo, se basa en eXo Portal, una aplicacin de gestin
de portal.

Son dos caractersticas importantes las que diferencian la solucin de eXo DMS de otras soluciones de
ECM o de GED descritas en el presente libro:
Se trata de una parte de un conjunto ms amplio y su uso fuera del contexto eXo Platform no es tan
interesante
Se trata de una aplicacin orientada a la tcnica, y no funcional. Es necesaria su integracin o uso
en el marco de un paquete del fabricante para apreciar su calidad y aprovecharla plenamente.
Por estas razones, hemos decidido no incluirla sistemticamente en los cuadros comparativos de
soluciones, ya que su inclusin fuera del paquete eXo Platform hace que la comparacin no sea equitativa.
3.4 KNOWLEDGE TREE
Knowledge Tree
5
es una solucin de GED desarrollada por la sociedad sudafricana JamWarehouse.

Knowledge Tree cuenta con un completo conjunto de funcionalidades y varios mdulos que permiten la
correcta integracin en un entorno ofimtico.



5
http://www.knowledgetree.com/




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 34 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
La versin Open Source de Knowledge Tree incluye todas las utilidades esenciales, pero hay determinados
mdulos, especialmente aquellos relativos a la integracin en un equipo de trabajo (hot folder, navegacin,
integracin con MS Office, aplicacin de gestin de escneres) que estn sujetos al pago de una licencia.
En la pgina web del fabricante, puede consultarse una comparacin explcita de las diferentes versiones.


En general, la aplicacin es correcta y permite contar con una GD simple y eficaz. Destacamos varios
puntos positivos:
una interfaz estndar depurada y operacional desde el primer momento
una bsqueda muy avanzada que ofrecer una respuesta satisfactoria a las bsquedas complejas,
en concreto, en trminos de cruce de criterios
funciones de administracin, accesibles para cualquier administrador, cuente o no con
competencias tcnicas particulares, en toda la configuracin: creacin de tipos de documentos
modos de navegacin virtual por defecto, en concreto, por tipo de documento
la ergonoma del mdulo integrado en MS Office, que permite, al contrario que los otros programas
de la competencia, gestionar los metadatos desde aplicaciones ofimticas

La versin 3.7, probada en el marco de este libro blanco, propone varios adelantos importantes:
gestin de una gama completa de tipos de metadatos, especialmente la fecha, que no estaba
incluida en la versin anterior
reestructuracin tcnica al mejorar considerablemente el rendimiento de la solucin, principalmente
gracias a su colaboracin con Zend.
la integracin de dos protocolos recientes: CMIS, que permite hacer bsquedas en Knowledge Tree
mediante webservices normalizados, y Open Search, que permite hacer bsquedas y obtener
respuestas de su motor de bsqueda a travs de mtodos normalizados





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 35 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Cabe destacar tambin la incorporacin de nuevas lenguas en la versin comunitaria: espaol, portugus y
francs
3.5 JAHIA
Jahia es una solucin integrada de portal web y de gestin de contenidos que propone el fabricante con el
mismo nombre. Se ofrece en dos formas diferentes: Community Edition y Enterprise Edition. La primera es
totalmente Open Source, con licencia GPL v2, la segunda requiere el pago de una licencia e incluye
funciones destinadas a las empresas.

Esta solucin responde a las necesidades de gestin de contenido Web y documental, as como a una parte
de las necesidades de portal (agregacin), especialmente con la norma JSR 168.

Jahia tambin permite gestionar un repositorio de archivos de la norma JCR (JSR 170) que pueden estar
vinculados con diferentes contenidos web, y todo ello con una buena integracin en el entorno ofimtico
gracias al uso de Webdav, CIFS y SMB.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 36 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
No obstante, las funcionalidades de GD propiamente dichas estn poco avanzadas, por lo que el inters de
stas reside principalmente en el uso que puede hacerse de los contenidos documentales en un sitio web.


La publicacin de la versin 6 a mediados de 2009 marc un punto de inflexin para Jahia tanto por
cuestiones de modelo econmico, al pasar de una licencia abierta pero propietaria a un modelo mucho ms
Open Source, como por los avances introducidos en la nueva versin.

En la versin 6 se introdujeron cambios importantes, especialmente respecto a la gestin documental:
posibilidad de acceder mediante CIFS, SMB y FTP a los archivos de la mediateca
mejora de las funciones de bsqueda en los documentos, posibilidad de registrar las bsquedas
interfaz de gestin de archivos ms clara y ms ergonmica (haciendo clic con el botn derecho)
posibilidad de vincular recursos documentales externos a Jahia directamente en la mediateca

Jahia sigue siendo una solucin orientada ms hacia la gestin de contenidos web La gestin de archivos
(documentos) se desarrolla principalmente desde esta perspectiva. Jahia sigue siendo un medio excelente
para publicar en lnea contenido documental. A veces es necesario conectarlo a una GED empresarial para
responder a los problemas de gestin documental.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 37 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3.6 OTRAS SOLUCIONES
En el sector del Open Source existen muchas ms soluciones de GED. Su calidad es heterognea y, en
general, suelen ser comparativamente demasiado limitadas para ser viables en un contexto empresarial y
para que las recomendemos.
No obstante, estas soluciones podran corresponder a necesidades muy especficas o a contextos
tecnolgicos particulares. Por ejemplo, aqu podemos citar a Freedom, por su capacidad de generar
aplicaciones profesionales o Quotero por su desarrollo en .Net.

Dentro de las soluciones que les recomendamos que eviten, podemos citar a: DocMgr, OpenGED,
myDMS y eDMS cuya perdurabilidad o nivel funcional son demasiado bajos.

3.6.1 Maarch
Maarch
6
, es una solucin de PHP desarrollada por la sociedad francesa Maerys. La oferta incluye
varias aplicaciones basadas en el framework Maarch: Entreprise 1.0, de GD Maarch 2.7, Letter Box y
Archive in motion.

Letter Box interacta con un escner y permite gestionar el ciclo de vida del correo en la empresa:
trabaja conjuntamente con la herramienta de digitalizacin, recepcin, validacin, tratamiento de la
respuesta y herramienta de bsqueda. Se entrega con un conjunto de funciones y una interfaz
totalmente orientada a la gestin de correo.


6
http://www.maarch.org/




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 38 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.


Archive in motion es una aplicacin dedicada a la gestin de archivos en formato electrnico y
fsico
Maarch Entreprise permite almacenar diferentes tipos de documentos e incorpora las funciones
necesarias para una GED empresarial

Esta solucin, aunque es todava reciente, tiene puntos muy interesantes, especialmente, gracias a la
relacin vertical propuesta por el fabricante, la gestin del correo y de archivos.

Cabe destacar que la comunidad que utiliza esta solucin es reducida y se concentra esencialmente en
torno a su fabricante.

Por ltimo, consideramos que la orientacin framework PHP de la versin 3 cubre algunas deficiencias del
PHP. Esta orientacin permite contar con una solucin de diseo de aplicacin documental para la
empresa.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 39 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3.6.2 Freedom
Freedom es una herramienta de GD desarrollada y comercializada por la empresa francesa Anakeen.
Esta solucin est orientada hacia la gestin de contenidos y al diseo de aplicaciones especializadas
para determinadas profesiones, a travs de mltiples opciones de configuracin.

Actualmente, la versin 3.0 est disponible en beta 2. Por lo tanto, la evaluacin de esta versin es
parcial.

A pesar de presentar una interfaz sencilla, la herramienta es bastante completa: rico en tipos de
metadatos, tipos de documentos, gestin de versiones, bsqueda, plano de clasificacin, composicin
de documentos, calendario, agenda...



Freedom ECM presenta tambin algunos problemas: interfaces poco intuitivas y una configuracin
compleja para el diseo y el desarrollo. No obstante, estos factores estn mejorados en la versin 3.0.

Por ltimo, conviene aadir que la comunidad que utiliza esta solucin es pequea, se encuentra
exclusivamente en Francia y tiene pocas referencias y el fabricante muestra un nmero de socios-
integradores reducido.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 40 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
3.6.3 Quotero
Es una solucin reciente en .Net, la v1.0 se lanz en marzo de 2009 por parte de la sociedad de
servicio y de edicin: Core-techs.

Esta aplicacin, aunque est lejos de ofrecer lo que se espera de una aplicacin de GD moderna,
presenta una base tecnolgica interesante.

La oferta se centra en tres componentes: el servidor documental, la interfaz web de consulta y el cliente
pesado. La versin Open Source ofrece exclusivamente las funciones bsicas, por lo que algunos
componentes requieren el pago de una licencia comercial.


Entre las funcionalidades ms interesantes, destacamos las siguientes: indexacin y bsqueda en
texto completo, reserva (check-in / check-out), alertas por correo electrnico y RSS, workflows
documentales con jBPM, vnculos entre documentos y configuracin grfica de los metadatos.

En la versin comercial encontramos funciones interesantes, tales como:
la apertura y modificacin de documentos desde MS Office y Open Office,
arrastrar & colocar documentos desde Windows y Linux mediante una aplicacin cliente.

El fabricante y nico integrador gestiona la comunidad que utiliza esta versin. El carcter Open
Source de la solucin tiene un inters limitado.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 41 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Por lo tanto, el nico inters de la solucin de Quotero es la tecnologa en la que est desarrollada
(.Net). En el resto de los factores, las otras soluciones ofrecen una respuesta ms satisfactoria que
sta.

3.6.4 LogicalDOC
LogicalDOC
7
, antes Contineo, es una herramienta de gestin documental, editada por la sociedad
italiana Logical Objects y por algunos desarrolladores independientes.
La solucin se comercializa en diferentes formatos, la primera, Open Source y la segunda es una
versin propietaria y aade algunas funciones
8
y permite recurrir al soporte del fabricante.

Entre las funcionalidades propuestas, podemos citar: la gestin de versiones, el envo de documentos
por correo electrnico o por vnculo generado, integracin de un webmail, gestin de los idiomas de los
documentos y discusiones.


As, LogicaDoc ofrece las funcionalidades esenciales de una herramienta de GED y algunas
funciones interesantes tales como la gestin de derechos grficos mediante las casillas de una
tabla.

Pero el uso de la versin Open Source es limitado ya que:
no incluye opciones ofimticas, lo que denota el carcter poco colaborativo de la
solucin,
no tiene funciones de importacin / exportacin


7
http://www.logicaldoc.com/

8
Aqu se puede consultar una comparacin de las versiones:
http://www.logicaldoc.com/en/products/compare-products.html




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 42 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
la autentificacin en un directorio empresarial slo est disponible en la versin de pago
la arquitectura documental es muy simple, lo que limita en gran medida su extensibilidad

La versin de pago introduce mdulos que completan la versin Open Source con algunas
funciones interesantes, a veces indispensables:
el reconocimiento ptico de caracteres (OCR) e integracin para herramientas de
digitalizacin
la utilizacin de formatos de AutoCAD y MS Office recientes
un workflow documental, configurable mediante una interfaz grfica
funciones de trazabilidad (auditora)
la posibilidad de incluir correos como documentos directamente en el servidor

Por todo ello, el uso de LogicaDoc se reduce a necesidades simples y muy orientadas hacia algunos de
los puntos fuertes de la solucin. La dimensin Open Source se utiliza ms aqu como reclamo de
marketing que como modelo econmico.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 43 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4 LAS FUNCIONALIDADES
Vamos a presentar en este captulo las principales funcionalidades de las soluciones de gestin documental
e indicaremos la posicin que ocupan respecto a stas cada una de las herramientas anteriormente citadas.

El objetivo no es describir exclusivamente la funcin sino tambin su repercusin en el marco de un
proyecto.

Actualmente, las mejores aplicaciones de GD Open Source estn muy avanzadas e integran un gran
nmero de funciones adicionales a las de la GD. Adems, algunas aplicaciones de otros sectores incluyen
funciones de GD, en estrecha relacin con las funciones requeridas para ese sector.

Los creadores de soluciones se basan en las experiencias adquiridas en diferentes sectores:
documentacin, motor de bsqueda, ofimtica, digitalizacin, representacin de procesos... Las funciones
incluidas con mayor frecuencia en las soluciones de gestin documental son: la colaboracin, la gestin de
contenidos estructurados y el workflow.

Como las soluciones incluyen las funciones esenciales, nos vamos a centrar en su optimizacin,
sofisticacin y disponibilidad de funciones de alto nivel para elegir la solucin que mejor se adapte a cada
contexto.
4.1 METADATOS
La indexacin es una funcin central de las herramientas de GD que consiste principalmente en adjuntar
metadatos a los documentos.

4.1.1 Tipos de documentos
Cada tipo de documento puede definirse por un conjunto de metadatos. De este modo, cada
documento tendr metadatos propios y se le podrn asociar reglas de gestin basadas en dichos
metadatos.

Cabe destacar aqu que puede ser interesante indexar varios archivos con un nico conjunto de
metadatos. La relacin entre la resea descriptiva y los archivos almacenados debera ser flexible para
permitir tener desde cero a n archivos adjuntos a una misma resea.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 44 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.1.2 Estructura de reseas
Llamamos resea al conjunto de metadatos asociados a un documento. El contenido de esta resea
suele introducirse mediante un formulario.

Es esencial que el grado de minuciosidad de la definicin de los documentos pueda adaptarse a cada
proyecto. Hay que encontrar un punto medio entre riqueza de informacin, la explotacin que se har
de sta y la cantidad de trabajo o de desarrollo que representa la alimentacin de los metadatos.

De hecho, en un documento estndar puede no merecer la pena introducir 15 metadatos y, algunos
casos, pueden requerir dos conjuntos de metadatos importantes.

La estructura de las reseas de los tipos de documentos debe:
permitir una indexacin pertinente que refleje con precisin los documentos
descritos y que los usuarios deben alimentar
cubrir toda la informacin til para su explotacin tanto en las bsquedas como en
los procesos y tratamientos aplicados a los documentos como alertas, trazabilidad,
visualizacin...

Hay que tener cuidado en no caer en la sobreindexacin (demasiados metadatos por tipo de
documento) o en la indexacin libre (nmero insuficiente de parmetros) que pueden conllevar costes
de indexacin demasiado elevados respecto al valor aadido o errores en la explotacin que puede
hacerse de los metadatos (ruido o silencio en las bsquedas)

4.1.3 Funciones relativas a los tipos de informacin
Son funciones que permiten dar mayor fiabilidad a la indexacin y realizar procesos documentales
propios de un tipo de documento en concreto, por ejemplo:
campos polivalentes, es decir, que permiten introducir varios valores
reglas de coherencia de un campo y entre campos: por ejemplo, un formato de
fecha para un da, un nmero positivo para un precio...
campos calculados que permitan hacer que el valor de un campo dependa de otro o
varios valores o condiciones
conexiones entre documentos y tipos de estas asociaciones, por ejemplo, un
correo que tiene como anexo o un contrato relativo a un expediente concreto.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 45 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
La definicin y la estructuracin de los tipos de documento son una fase fundamental en la puesta en
marcha de una GD. Y no debe ser minusvalorada.

4.1.4 Indexacin manual
4.1.4.1 Interfaz de introduccin de datos
La resea (o ficha) que describe un documento suele ser el primer punto de contacto con los usuarios.
Se trata del formulario que requerir ms atencin del colaborador, ya que deber introducir la
informacin.

Para ello, y con el objetivo de mejorar la ergonoma, la fiabilidad y la productividad, las soluciones GD
deben ofrecer diferentes facilidades, directamente o mediante una integracin ligera, por ejemplo:
copiar/pegar entre documentos electrnicos y metadatos. Esto es particularmente til cuando el
documento electrnico se ha generado por una digitalizacin y puede verse en la misma pantalla
que la resea de indexacin.
ayuda a la introduccin de datos, cuando sea posible:
o listas de control que den mayor fiabilidad al fondo (semntica) y a la forma (ortografa) de la
introduccin de datos
o casillas para marcar o botones de radio para las elecciones mltiples
o cuadros de dilogo adaptados a las tablas de valores de referencia (listas de elecciones
posibles) Esto puede ir desde una simple lista desplegable a interfaces con herramientas
de bsqueda con opcin de completar automticamente o herramientas de navegacin
(abecedario, jerrquica) en los valores de referencia
sugerencias para un campo dado.

4.1.5 Tabla de referencia
El objetivo es proponer, lo antes posible, listas de valores para limitar las preguntas que puede
plantarse el usuario y dar mayor fiabilidad a la introduccin de datos y, de ese modo, mejorar el uso de
los metadatos.

Entre las tablas de referencia, encontramos:
los cuadros de clasificacin
las listas de valores enriquecidos por la introduccin de datos o valores fijos, por
ejemplo, nombres de autores de documentos que ya estn en el sistema o la lista
de servicios de una organizacin




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 46 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
El objetivo de estas tablas es ayudar a la introduccin de datos y poner lmites y controles durante la
introduccin.

4.1.6 Indexacin automtica
4.1.6.1 Extraccin de metadatos
Existen varias maneras de extraer metadatos.

Recuperacin de informacin
Cada archivo informtico est automticamente dotado de informacin proveniente del sistema de
gestin de archivos, que puede ser til como metadato: el nombre del archivo, las fechas de creacin y
de modificacin, su tamao, su localizacin, etc.

Las soluciones de GD proponen recuperar parte de esta informacin. Del mismo modo, es posible, en
particular para la recuperacin del historial, trabajarla pare crear una indexacin por palabra clave; por
ejemplo, descomponiendo la localizacin o la estructura de un nombre mediante una sucesin de
trminos que servirn para la indexacin.

Extraccin de datos estructurados
La estructura de algunos formatos de archivos es legible. ste es el caso, principalmente, de muchos
formatos abiertos, ODF, por ejemplo, pero tambin para los formatos MS Office, a travs de sus
propiedades.
Cuando estas estructuras son conocidas y estn documentadas, es posible utilizar sistemas para
extraer la informacin pertinente directamente desde el archivo y utilizarla para alimentar una ficha de
indexacin.

4.1.7 Induccin de metadatos
Las soluciones ms elaboradas permiten determinar automticamente los metadatos ms adecuados
para indexar un documento.

Este tipo de induccin de metadatos suele realizarse mediante:
herramientas de reconocimiento, que encuentran en un documento las cadenas de
caracteres presentes en un repositorio con el fin de permitir al usuario aadirlas a
la resea
herramientas estadsticas, que analizan las cadenas de caracteres que ms
aparecen y, por lo tanto, las ms representativas
herramientas semnticas, capaces de extraer automticamente las palabras y




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 47 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
expresiones ms pertinentes, incluso pudiendo reconocer si se trata de una
palabra clave, de una fecha, de un ttulo, etc.

Estos enfoques suelen combinarse.
Las herramientas ms evolucionadas permiten tener en cuenta grandes cantidades de informacin muy
rpidamente, a costa de una prdida de la eficacia de indexacin con respecto a la manual.
En Alfresco, los tipos de documentos se gestionan mediante una combinacin de aspectos. Un aspecto
contiene un conjunto de metadatos caracterizados por defecto, con o sin restricciones, pudindose
aplicar a cualquier documento. La inclusin de un aspecto y la introduccin de metadatos pueden ser
manuales o bien automticas basndose en el contenido del archivo, su nombre, su ubicacin o sus
propiedades. Un aspecto tambin puede modificar el comportamiento de un documento en el repositorio:
las funciones de auditora y la gestin de versiones se activan mediante el aspecto correspondiente. Los
aspectos se aaden por configuracin XML.

eXo DMS propone una gestin avanzada de metadatos. Se pueden gestionar varios tipos de objetos, as
como tambin los ms complejos. En particular, esta gestin puede emplear taxonomas. La
estructuracin de los metadatos puede gestionarse directamente en la interfaz de eXo DMS.

FreeDom permite crear familias de documentos y cada una con un conjunto propio de metadatos.
Existen numerosos tipos de metadatos y las restricciones se definen mediante el cdigo PHP. La
introduccin de datos sigue siendo manual.

Del mismo modo, Jahia permite tener varios tipos de contenidos, portadores de metadatos diferentes. La
naturaleza de los metadatos de contenidos Web y los relativos a los documentos son considerablemente
diferentes. La introduccin de informacin es manual, a travs de la interfaz web, y puede automatizarse
para los archivos PDF y MP3.

Knowledge Tree permite al administrador crear diferentes tipos de documentos y conjuntos de
metadatos desde la interfaz web de administracin. La introduccin de metadatos se hace de forma
manual, pero es posible personalizar filtros para automatizar algunas extracciones.

LogicaDoc utiliza plantillas para diferenciar los documentos. Estas plantillas se definen mediante la
interfaz grfica. La introduccin de metadatos se realiza de forma manual.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 48 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Maarch permite crear diferentes tipos de documentos. La introduccin de datos es manual. sta puede
optimizarse a travs de diferentes procesos, en particular, mediante las reglas de posicin del
documento en el diagrama arbreo.

Nuxeo utiliza el concepto de faceta para aadir nuevos tipos de documentos. Asimismo, este concepto
incluye otras caractersticas ms funcionales de los documentos, como es la posibilidad de contener
otros documentos; un ejemplo de ello, es el caso del seguimiento de versiones. La introduccin de
metadatos puede ser manual o automtica utilizando las caractersticas o el contenido de los archivos.
Los nuevos tipos de documentos se crean a partir de esquemas XML (XSD), al igual que las pantallas de
introduccin o de restitucin, y se aaden a la arquitectura de la solucin incorporando nuevos plug-ins
(extensiones). Nuxeo Studio, servicio asociado al soporte del fabricante, permite disponer de una interfaz
grfica para estos parmetros.
4.2 GESTIN DE VERSIONES
GED aporta un gran beneficio para la gestin de versiones de un documento.

De hecho, en un contexto de trabajo en grupo, y lo que es ms importante, en los intercambios de correos
electrnicos mltiples, no tarda en volverse complejo conocer con certeza la ltima versin de un
documento o la versin aplicable.

La gestin de versiones permite, al mismo tiempo, seguir la evolucin de un documento y, mediante un
sistema de reserva (check-in/check-out), garantizar que un usuario pueda manipular un documento y
modificarlo en la base documental sin que existan modificaciones simultneas.

4.2.1 Reserva (check-in/ check-out)
El check-in/check-out puede funcionar tcnicamente de diferentes maneras, pero siempre debe
garantizar que el usuario que haga una reserva bloquee el documento hasta que se cumpla una
condicin. Normalmente esta condicin es el check-in. Del mismo modo, se puede programar para que
un check-out se libere automticamente despus de un cierto plazo.

Desde un punto de vista tcnico, el check-out puede realizarse automticamente una vez que el
usuario abra un documento y el check-in cuando lo cierre; pero la reserva de un documento puede
implicar tambin que el usuario lo exporte del sistema al modificarlo y, por lo tanto, que se necesite un
sistema declarativo por parte del usuario.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 49 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.2.2 Incremento de versiones
En general, el incremento de versiones es un contador automtico que concede un nmero secuencial
a las versiones sucesivas de un documento.

Del mismo modo, existen mtodos de clculo del incremento ms elaborados; por ejemplo, para tener
en cuenta las versiones menores/mayores, o las reglas profesionales preestablecidas que definen la
construccin de los nmeros de versin.

En cualquier caso, el historial de versiones se conserva y debe poder visualizarse una versin anterior
del documento. Cada modificacin debe dar lugar a una nueva versin. Estos dos puntos son
esenciales para la trazabilidad global del sistema de gestin documental.

Deben poder aplicarse reglas particulares de gestin con respecto a las condiciones de creacin de
versiones; por ejemplo, la creacin de una versin mayor, el tiempo transcurrido desde la ltima
versin mayor o la identificacin de las evoluciones entre dos versiones.


Alfresco, Nuxeo, eXo DMS y Knowledge Tree proponen funciones avanzadas de reserva y de
gestin de versiones: la distincin entre versiones menor y mayor, los comentarios de versin e incluso
la reserva automtica durante la edicin en lnea de un documento.

FreedDom y LogicaDoc tambin proponen la reserva y gestin de versiones, sin embargo, las
posibilidades, en particular las de determinacin de parmetros, estn menos avanzadas que en
otras soluciones.

Jahia propone estas funcionalidades, pero nicamente para los contenidos web. No tiene gestin de
versiones para los documentos.

Maarch no propone este tipo de funcionalidades.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 50 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.3 REPOSITORIO DE CLASIFICACIN
Un repositorio de clasificacin es, ante todo, un conjunto estructurado de palabras clave o de expresiones.
Tambin se les conoce como vocabularios especializados.
Las soluciones de GED ofrecen implantaciones de distintos grados de profundidad, tanto en trminos de
complejidad de los repositorios (jerarqua, enlaces escritos, etc.) como en trminos de usos potenciales.
La escalabilidad de las soluciones es especialmente interesante, ya que ofrece la posibilidad de
ampliar el modelo de repositorio segn las necesidades (ver Su utilidad es especfica para el mbito
de los archivos y la conservacin de archivos vitales, es decir, la gestin de registros.

, pgina 522).




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 51 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.3.1 Tipos de repositorios
4.3.1.1 Lxico
Se trata de una lista de trminos tiles en un contexto determinado, generalmente organizada en orden
alfabtico. En ocasiones es posible aadir una definicin.

4.3.1.2 Plan de clasificacin
Un plan de clasificacin es un conjunto de trminos jerarquizados en base a una relacin lgica entre
s.

Se trata de un repositorio que se utiliza para realizar clasificaciones fsicas (en papel o de otro tipo).

A menudo, podemos encontrar citas o cdigos asignados a cada trmino. El uso tradicional del plan de
clasificacin consiste en ordenar fsicamente los documentos mediante la asignacin a cada uno de
ellos de un nico trmino del plan de clasificacin.

En un uso electrnico, es posible asignar varios trminos del plan de clasificacin a un nico
documento, obteniendo as varias claves para encontrarlo. Se trata, por lo tanto, de una
categorizacin mltiple.

4.3.1.3 Tesauro
Adems de la estructura lgica y jerrquica del plan de clasificacin, el tesauro introduce varios
conceptos que permiten enriquecer el uso del repositorio de documentos. El tesauro es un conjunto de
trminos bien definidos, en el que nos basamos en un campo de aplicacin determinado.

Un tesauro est compuesto por las relaciones entre los trminos llamados descriptores, definidos por
varias normas ISO. Estos son algunos de los ms comunes:

trmino genrico, que es el equivalente al padre en la jerarqua. Un trmino
puede tener varios padres
trmino especfico, que es el equivalente a un hijo en la jerarqua.
trmino se utiliza para, que corresponde a los sinnimos que elegimos no utilizar
en el repositorio, pero que podran utilizarse en lugar del descriptor elegido
trmino prximo (ver tambin), que define los enlaces cruzados entre los
trminos descriptores, debido a su proximidad semntica




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 52 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.3.1.4 Cuadro de gestin
En trminos de GED, el cuadro de gestin se utiliza para establecer las polticas de conservacin, es
decir, las normas que regirn la conservacin de documentos electrnicos.

El cuadro de gestin se crea generalmente mediante un plan de clasificacin.

Un cuadro de gestin asocia a cada trmino varias informaciones:
el periodo de conservacin: opcionalmente un perodo operativo (en la oficina) y
obligatoriamente un perodo de archivo
la salida final al final del perodo de archivo
los textos de referencia que justifican el perodo de conservacin, los
procedimientos de calidad, las leyes, normas, etc. para permitir la revisin

La principal utilidad de esta herramienta es que permite asociar perodos y condiciones de
conservacin a cada elemento del corpus documental (documento o dossier), segn una clasificacin.
Esta herramienta es esencial para la aplicacin de las normas de conservacin.

Su utilidad es especfica para el mbito de los archivos y la conservacin de archivos vitales, es decir,
la gestin de registros.

4.3.1.5 Ontologa
Las ontologas funcionan segn el mismo principio que los tesauros, es decir, mediante el
establecimiento de relaciones entre los trminos. Se trata de un tipo de repositorio ampliable, es
decir, cuya propia estructura puede evolucionar.

Dos ejemplos de vnculos: tiene como proveedor a / es proveedor de, es la filial de / es la
empresa matriz de.

Esta herramienta no se incluye en las soluciones de GED, sin embargo, algunas permiten su aplicacin
mediante la estructuracin XML de su repositorio de clasificacin.

A diferencia de lo que ocurre con los tesauros, no existe ninguna predeterminacin ni limitacin de los
tipos de relaciones. Por lo tanto, es posible crear tantas relaciones como deseemos entre los trminos
y asociarles restricciones y normas de inferencia.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 53 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Su uso es todava muy limitado en la actualidad y se basa fundamentalmente en los RDF (Resource
Description Framework), modelo de representacin de ontologa, estandarizado por el W3C.

El concepto de ontologas es uno de los fundamentos de la Web semntica, la evolucin prevista por
Tim Berners Lee que hace a la Web ms inteligente al permitir a los equipos hacer slo asociaciones
relevantes entre los contenidos.

En el contexto de una aplicacin documental, el desarrollo de la(s) ontologa(s) permite proporcionar
herramientas extremadamente potentes y adaptables al mismo tiempo al corpus de documentos
gestionado y a los perfiles de usuario.

Una ontologa puede, por ejemplo, definir las relaciones de profesiones que puede explotar un motor
de bsqueda, en funcin del perfil de usuario o de la ptica de la bsqueda. Tambin podran ayudar
a definir los planes de clasificacin contextuales en funcin de los parmetros que indican qu enlaces
de ontologa se utilizan.

4.3.2 Uso de los repositorios
Veamos algunos posibles usos.

El principal objetivo de los repositorios de clasificacin es facilitar el uso de la base de documentos,
especialmente mediante la reduccin del ruido y el silencio en la investigacin u otros tipos de
operaciones del GED.

4.3.2.1 Restitucin de contenidos
El diagrama arbreo de navegacin permite al usuario ubicar un documento en base a una lgica
jerrquica o incluso varias lgicas jerrquicas diferentes.

Hablamos entonces de facetas. A modo de ejemplo, es como si se ofrecieran al usuario los mismos
objetos (el fondo documental) desde diferentes puntos de vista (facetas).

Por lo tanto, si un contenido se referencia, se clasifica de acuerdo a /Europa/Francia/Pars, pero
tambin de acuerdo a /Instituciones/Restaurantes/De tres estrellas, el usuario puede llegar a este
contenido con una navegacin que siga la lgica (o faceta) geogrfica o la lgica (o faceta)
gastronmica.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 54 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Este enfoque es muy til, ya que proporciona a cada usuario una visin y una explotacin de la base
de documentos que corresponde a su uso.
4.3.2.2 Gestin de varios repositorios
En un contexto profesional, a veces es necesario presentar la misma informacin a pblicos diferentes.
Hace falta dominar varios conjuntos de vocabularios controlados como, por ejemplo, una lista de
palabras clave y una lista de unidades organizativas.

La gestin de varios repositorios obliga a gestionar determinados casos difciles, como los homnimos,
los enlaces entre repositorios... La mayora de aplicaciones de GED estudiadas tienen un nico
repositorio de clasificacin compleja (o ninguno), por lo que es importante comprobar que es posible la
convivencia de mltiples repositorios si es necesario.

4.3.2.3 Gestin de sinnimos
El objetivo es poder gestionar los sinnimos y los acrnimos, as como hacer que su uso sea lo ms
transparente posible para el usuario.

Las funciones ms tiles son:
un fcil enriquecimiento de la base de sinnimos, posiblemente realizado por los propios
usuarios
uso automtico de sinnimos cuando se busca un trmino principal (ver
, ms adelante
deteccin automtica y sustitucin de los sinnimos por el trmino elegido durante la
indexacin, para homogeneizarla

4.3.2.4 Herramienta de bsqueda
El motor de bsqueda puede utilizar las relaciones de los repositorios de distintos modos.

4.3.2.4.1 Ampliacin de consultas
Un posible aprovechamiento de repositorios enriquecidos es permitir definir el entorno semntico de un
trmino. De esta forma, algunos motores de bsqueda son capaces de ampliar la bsqueda de
forma automtica utilizando las relaciones indicadas en el repositorio.

Por ejemplo, si se indica automticamente con un O booleano que una bsqueda sobre el trmino
coche tambin se referir a todo aquello donde aparezca automvil y carro, etc. De esta forma,




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 55 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
se mostrarn todos los documentos que contienen esas palabras en los resultados de bsqueda
(reduccin del silencio).

El motor tambin puede ampliar la consulta por proximidad semntica, por ejemplo, entre pescadores,
barco, pescado, etc.

Los ampliadores de consultas tambin pueden basarse en los analizadores sintcticos o semnticos,
que construyen automticamente diccionarios de la correspondencia a partir del anlisis de los
documentos indexados.

4.3.2.4.2 Sugerencia para el usuario
El anlisis de las palabras clave del repositorio localizadas en las fichas de respuestas a una consulta
ofrece otra oportunidad de explotar los repositorios existentes.

Por ejemplo, proporcionando al usuario trminos similares a los que se encuentran con mayor
frecuencia en los resultados de su bsqueda.

Este tipo de uso suele ser ms til cuando se utiliza un motor sintctico o semntico para llevar a cabo
estas asociaciones de palabras clave.

4.3.2.4.3 Representacin en clster
El objetivo en este caso es organizar un conjunto de documentos en un diagrama arbreo de palabras
clave relacionadas con estos documentos.

Cuando la agrupacin se realiza desde una lista predeterminada de valores en uno o varios campos,
hablamos de categorizacin.

El trmino clster suele reservarse a las soluciones que proponen un clculo dinmico basado en el
anlisis de trminos presentes en los propios documentos.

Este tipo de funcin se utiliza para representar los resultados de bsqueda en forma de un diagrama
arbreo estructurado por reas temticas o por sector, por ejemplo. As, el usuario podr ver
inmediatamente los temas representados en los documentos encontrados y podr, si fuera necesario,
afinar su consulta aadiendo o excluyendo determinadas palabras del clster.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 56 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Alfresco ofrece un plan de clasificacin en forma de jerarqua de categoras. Alfresco ofrece
tambin la posibilidad de mostrar el contenido del repositorio de clasificacin mediante un diagrama
arbreo de categoras.
eXo DMS ofrece la posibilidad de explotar su gestin de taxonoma para clasificar los documentos.
La clasificacin de los documentos es, por otro lado, muy similar a la de un sistema de archivos.

Freedom utiliza un plan de clasificacin que se puede explorar a travs de un diagrama arbreo.
Tambin es posible realizar bsquedas en este plan de clasificacin.

Jahia permite disponer del plan de clasificacin. Este ltimo puede utilizarse para indexar los
documentos cuando se asocian a contenidos.

Knowledge Tree permite crear tanto lxicos como planes de clasificacin. La navegacin facetada
se genera automticamente para determinados tipos de contenido.

LogicaDoc utiliza un lxico que puede explorarse letra por letra para encontrar los documentos
asociados.

Maarch ofrece la posibilidad de crear tipos de documentos sobre los cuales es posible realizar
bsquedas.

Nuxeo ofrece un potente sistema de gestin de repositorio (los vocabularios) que permite
estructurar todos los repositorios. Se utilizan principalmente para la indexacin de documentos, la
introduccin de enlaces entre documentos o la navegacin facetada.

Quotero ofrece un plan de clasificacin navegable. Es posible realizar bsquedas dentro de este
plan de clasificacin.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 57 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.4 MOTOR DE BSQUEDA
Por supuesto, se trata de un elemento esencial en las aplicaciones de gestin de la informacin.

En las soluciones de GED existen tres tendencias no exclusivas:
Integracin de un motor de bsqueda, las soluciones de cdigo abierto suelen incluir
Lucene, el motor de referencia en el mundo del cdigo abierto
Explotacin de la bsqueda en la base de datos, esto puede limitar las funciones
disponibles (especialmente la lematizacin, el truncamiento, etc.)
Apertura hacia las soluciones de bsqueda del mercado (propietario) a travs de
conectores

Por tanto, es necesario saber cmo queremos realizar las bsquedas, especialmente en trminos de
funciones y del alcance de la bsqueda.

4.4.1 Funciones bsicas
Como mnimo, el motor de bsqueda de una GED debe:
indexar las fichas de documentos, es decir, todos los metadatos de un documento
indexar los documentos electrnicos en texto completo (o full text), es decir, teniendo en cuenta el
contenido de los archivos electrnicos, para todos aquellos que incluyen contenido de texto
filtrar los resultados de bsqueda segn los permisos que el usuario tiene para su lectura, es decir,
sugerirle nicamente los documentos que tiene derecho a leer
permitir realizar bsquedas tanto en el documento completo como en uno o varios campos
especficos de metadatos.
permitir el uso de tablas de referencia en las interfaces de bsqueda
permitir las bsquedas usando varios criterios relacionados con operadores booleanos (AND, OR,
NOT) y parntesis
permitir mezclar los enfoques documentales, sobre los metadatos y el texto completo
autorizar el truncamiento central y a la derecha, de manera implcita o mediante la utilizacin de
caracteres comodn para reemplazar uno o varios caracteres (normalmente el asterisco * o el
smbolo ?)




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 58 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
permitir personalizar las pginas de bsqueda, si es posible varias pginas diferentes, para
responder satisfactoriamente a las expectativas del usuario

4.4.2 Funciones avanzadas
A menudo, se plantea el uso de motores desarrollados ya que ofrecen la posibilidad de aprovechar
caractersticas avanzadas tales como:

permitir guardar los resultados en forma de cesta, por ejemplo, para que los usuarios puedan
crear una seleccin
permitir guardar las estrategias de bsqueda, es decir, los criterios utilizados para la bsqueda, para
poder simplemente reiniciarlas
volver a buscar sucesivamente para afinar una consulta con respecto a los resultados de la
bsqueda anterior
ampliar una bsqueda, con respecto a los sinnimos, por ejemplo
unificar la bsqueda en varias bases de documentos
automatizar las aproximaciones, sugerencias de ortografa y la lematizacin (es decir, la bsqueda
en las races de las palabras)
permitir la bsqueda en lenguaje natural o bsqueda por ejemplo, es decir, deducir la ecuacin de la
bsqueda de una frase o un texto interpretado por el motor
sugerir resultados aproximados de la bsqueda por diversos medios:

o explcitos, a travs de enlaces entre documentos especificados en la indexacin de
cada uno
o implcitos, , relaciones derivadas de clculos estadsticos o semnticos

detectar automticamente entidades con nombre, es decir, los nombres propios (personas,
lugares) y sus relaciones
La funcin de bsqueda es fundamental para los proyectos de GED y suele ser el beneficio mayor
para los usuarios, siempre que se adapte a sus necesidades especficas.

Entre las necesidades mencionadas con ms frecuencia se encuentran, por ejemplo: la navegacin por
diagrama arbreo, la bsqueda en intervalo de fechas, la bsqueda simple (para los fanticos de




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 59 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Google), la bsqueda por referencia, la bsqueda unificada, que abarca tanto a GED como a otras
aplicaciones.

Por tanto, es esencial analizar las expectativas de los usuarios para definir sus necesidades de
investigacin. Es ste un buen punto de partida para la construccin de la arquitectura (estructura de
datos y ergonoma) de la aplicacin de destino.

Todas las herramientas ofrecen una funcin de bsqueda como mnimo en los metadatos.
Alfresco utiliza el motor Lucene para indexar su contenido, documentos y metadatos. Esta integracin
permite disponer originalmente de una potente solucin altamente configurable. Es posible personalizar
la pantalla de bsqueda avanzada de la interfaz estndar y tambin se pueden guardar las estrategias
de bsqueda.

eXo DMS ofrece una funcin de bsqueda completa en el contenido de los archivos y los metadatos.
La configuracin permite definir sinnimos y un primer nivel de configuracin de Lucene.

Freedom permite realizar bsquedas y guardarlas. La herramienta prev construir ventanas de
bsqueda exclusivas e informes, que son la presentacin de los resultados de la consulta.

Jahia tambin permite realizar bsquedas completas en todos los documentos ofimticos o los
metadatos gracias a la integracin de Lucence. Por lo tanto, las funciones del motor son potentes y
altamente configurables.

Knowledge Tree cuenta con un motor de bsqueda simple y potente, que ofrece muchas opciones
tiles (historial de bsqueda, bsqueda por tipo de contenido, por localizacin, etc.). Pero la
caracterstica ms interesante se encuentra en la interfaz de bsqueda avanzada, que permite ejecutar
fcilmente bsquedas extremadamente complejas cruzando potencialmente el conjunto de criterios de
la base de documentos.

LogicaDoc slo tiene en cuenta los tipos de documentos ms simples en su versin comunitaria. No
obstante, las funciones de bsqueda presentan dos caractersticas interesantes: la ventana de
bsqueda avanzada es altamente configurable por el usuario y la solucin ofrece la posibilidad de
realizar bsquedas de documentos por similitud (basada en la frecuencia de palabras).





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 60 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Maarch incluye por defecto un mdulo de bsqueda relativamente pequeo, pero que abarca los
aspectos fundamentales, es decir, la bsqueda en metadatos y documentos ofimticos.

Nuxeo utiliza por defecto el motor de la base de datos. Tambin es posible conectar Lucene, Solr o
cualquier otro motor. Las funciones de la interfaz estndar son numerosas, pero limitadas a las
funciones de bsqueda de la base de datos subyacente.

Quotero ofrece un configurador grfico de tipo de documentos con metadatos personalizados.

Las funciones de bsqueda ms avanzadas no estn disponibles de forma original y requieren una
integracin o una configuracin.

Entre los motores que no son de cdigo abierto que proporcionan un valor aadido significativo, sobre
todo en el plano semntico, destacan herramientas como Sinequa, Antidot, Exalead, Polyspot
Autonomy o Fast.
4.5 INTEGRACIN DE LA GED
Como la aplicacin de GED est enfocada en gran medida a la produccin de documentos ofimticos, es
crucial la integracin de la GED en las aplicaciones de la estacin de trabajo del usuario.

En este contexto, la ergonoma, la eficiencia del trabajo y la fluidez a la hora de pasar la GED a las
aplicaciones que utilizan documentos digitales sern criterios esenciales para determinar la aceptacin de la
herramienta y, por lo tanto, para el xito del proyecto.

Existen dos niveles principales de integracin y la eleccin de uno de ellos tiene un impacto tanto en la
complejidad del entorno tcnico como en la calidad de la ergonoma.

Todas las soluciones presentadas ofrecen una interfaz Web para interactuar con la GED.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 61 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.5.1 Espacio de almacenamiento
La GED puede considerarse como un espacio de almacenamiento, similar al uso de una unidad de red:
posibilidad de gestin de carpetas, de navegacin entre distintos niveles o incluso el desplazamiento
de un elemento directamente mediante arrastrar y soltar desde el equipo del usuario.

El principal inters de este enfoque es que el cambio para los usuarios es menor, en comparacin con
los servidores sencillos de archivos a los que estn acostumbrados, lo cual facilita la aceptacin de la
herramienta de GED. El efecto negativo inmediato es la prdida de elementos tales como los
metadatos o la interfaz de bsqueda. Por lo tanto, este enfoque es el que ms suele completarse con
una interfaz Web u ofimtica para la GED que ofrece estas funciones.

Se propone el uso de un repositorio de documentos en el entorno habitual de los usuarios, teniendo en
cuenta la gestin de las autorizaciones de la GED, pero no aprovecha completamente la aplicacin de
gestin documental subyacente.

Tecnolgicamente, este enfoque se hace posible a travs de interfaces como Webdav, CIFS, WSS
(Microsoft) o incluso FTP. Se trata de tecnologas implantadas como una superposicin de una base de
datos de documentos y que permiten el acceso a la GED por medio de las herramientas estndar del
cliente.

4.5.2 Acceso desde programas ofimticos
Se trata de permitir el acceso a la aplicacin de documentos desde aplicaciones asociadas a los
documentos (por ejemplo, MS Office, OpenOffice, AutoCAD, Photoshop, etc.) para optimizar el flujo de
los procesos de creacin o modificacin de documentos.

Los usuarios quieren poder realizar tareas habituales desde su herramienta ofimtica: abrir, indexar,
guardar en la base de documentos o ver el progreso de un flujo de trabajo.

El punto clave de este enfoque es su carcter poco intrusivo respecto a las costumbres de los usuarios,
en las fases de trabajo ms frecuentes, al tiempo que proporciona un enriquecimiento sin precedentes
en un sistema de archivos tradicional.

Como este enfoque no est implantado por una aplicacin de documentos, requiere una inversin
significativa.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 62 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Nota: la apertura por parte de Microsoft del cdigo de su protocolo WSS, utilizado entre SharePoint y
MS Office, ha permitido la integracin de numerosas aplicaciones de GED. Esto permite utilizar MS
Office y Windows como si estuvieran en relacin con un servidor de Sharepoint, es decir, integrar a
travs de los paneles el paquete ofimtico y la instalacin de una unidad de red en Windows.

Una vez completada la implementacin, estos complementos permiten disponer de las siguientes
funciones: abrir, editar, reservar, acceder a las versiones, acceder a los flujos de trabajo y navegar en
los distintos espacios.

Alfresco lleva tiempo siendo pionero en el mbito de la integracin ofimtica, especialmente al
proporcionar acceso a la base por medio de una red compartida (CIFS), el acceso FTP o la integracin
con Microsoft Office con un mdulo especfico. La integracin de WSS ya est operativa y sustituye a
todas estas funciones aportando numerosas ventajas.

eXo DMS proporciona un acceso Webdav, CIFS y FTP a su repositorio de contenido. Existen dos
mdulos que pueden ser instalados en las estaciones de trabajo que permiten la integracin con los
paquetes MS Office y Open Office.

Freedom ofrece un acceso Webdav al repositorio.
Jahia propone una integracin limitada en la estacin de trabajo, a travs de la navegacin de la
biblioteca de medios desde el Explorador de Windows. No tiene en cuenta la gestin de versiones ni el
concepto de reserva.

Knowledge Tree dispone de un acceso Webdav y mdulos complementarios (de cdigo cerrado) que
permiten una buena integracin en Windows (exploracin del repositorio a travs de un navegador
exclusivo y concepto de hot folder), MS Office (edicin de documentos) y Outlook (indexacin de
correo electrnico). Estas extensiones son exclusivas de la versin comercial.

LogicaDoc ofrece un acceso Webdav al repositorio. La solucin tambin propone una funcin
interesante de posicionamiento de documentos en equipos de red remotos. Este posicionamiento
incluye la autentificacin en el equipo e incluso la adicin de la plantilla y la etiqueta por defecto para
los documentos referenciados.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 63 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Maarch no ofrece originalmente la integracin en el equipo de trabajo del usuario. Sin embargo, en
Maarch LetterBox estn disponibles las funciones de integracin con los escneres para una rpida
visualizacin de la interfaz de documentos digitalizados de Maarch.

Nuxeo ofrece una interfaz de Webdav y WSS para el acceso a los documentos. La integracin de WSS
est ya operativa y permite disponer de un gran nmero de funciones clsicas en lo que a integracin
ofimtica respecta. Tambin es posible aadir documentos mediante arrastrar y soltar entre el equipo
y la interfaz Web. Por ltimo, Nuxeo permite, a travs del complemento LiveEdit, automatizar el
proceso de modificacin en lnea desde la interfaz Web de MS Office y Open Office.

Quotero ofrece una integracin de Webdav. Tambin ha anunciado la integracin de MS Office y
OpenOffice, as como el acceso a travs de un cliente enriquecido que no hemos podido probar.

4.6 DIGITALIZACIN
Las aplicaciones de gestin de documentos, por lo general, no admiten la digitalizacin ni los procesos
asociados (aquellos cubiertos por soluciones exclusivas). Tratan a las fases iniciales desde la conversin
del soporte, hasta la introduccin del documento en la GED. La aplicacin de documentos retoma la
iniciativa en los procesos principales, en especial la indexacin, una vez que el archivo se ha introducido.
Las funciones descritas a continuacin estn dentro del mbito de la gestin de documentos, pero las
soluciones de GED, por lo general, no las tienen en cuenta directamente.
4.6.1 Gestin del escner y pre-indexacin
En una cadena de desmaterializacin, sta es la primera funcin que debe tenerse en cuenta.

Generalmente, la digitalizacin se lleva a cabo a travs de una aplicacin instalada en el equipo
conectado al escner, pero tambin puede realizarse a travs de una interfaz Web.

Con el objetivo de facilitar al mximo el proceso que incluye la digitalizacin y la introduccin de los
primeros metadatos del documento (a este proceso se le conoce como pre-indexacin), nos hemos
esforzado en optimizar la interfaz que se le ofrece al operador para digitalizar y pre-indexar los
documentos en la GED.

Aunque a menudo los operadores la perciben como una carga, esta primera fase es crucial para el
valor aadido global de la aplicacin de desmaterializacin.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 64 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

De hecho, es en este punto cuando se introducen los metadatos explcitos (fecha de la digitalizacin,
remitente, destinatario, el importe total de una factura, etc.). Su exactitud y su exhaustividad
determinarn, en gran medida, la eficacia de los procesos posteriores y, por lo tanto, el valor aadido
del sistema.

Estos procesos pueden mejorarse mediante los procesos de gestin de lotes y la introduccin del
reconocimiento automtico.

4.6.2 Reconocimiento automtico
Existen varias categoras de herramientas de reconocimiento automtico. Su objetivo siempre es
retranscribir la informacin procedente del medio fsico (papel) en su equivalente electrnico,
minimizando las prdidas, los errores y la intervencin humana.

Estas herramientas dependen en gran medida de la calidad de la digitalizacin: inclinacin, definicin,
visibilidad de la trama del papel, etc. Por lo tanto, cuando se prev un reconocimiento automtico,
deben tenerse en cuenta estas consideraciones con mayor precisin.

A continuacin se presenta una lista de los acrnimos del mbito del reconocimiento automtico:

OCR: Reconocimiento ptico de caracteres (Optical Character Recognition).
Los OCR buenos alcanzan un porcentaje de reconocimiento del documento
digitalizado superior al 95% y consiguen dar formato a las tablas, reconocen los
estilos, etc.
ICR: Reconocimiento inteligente de caracteres (Intelligent Character Recognition).

Dedicado al reconocimiento de la escritura cursiva (manuscrito), este tipo de
aplicacin la utilizan, sobre todo, los bancos para el control de los cheques.
LAD: Lectura Automtica de Documentos.
Para la adquisicin de datos estructurados en una base de datos en relacin con
los campos identificados previamente.
RAD: Reconocimiento Automtico de Documentos.
El objetivo es orientar los documentos hacia el proceso adecuado de
reconocimiento (ms arriba). Esto permite, en especial, aplicar normas especficas
en funcin del tipo de documento reconocido.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 65 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Estas herramientas, basadas en algoritmos complejos, dependen en gran medida de la calidad del
reconocimiento, as como del uso de diccionarios lingsticos y recursos especializados. Las mejores
utilizan conceptos de aprendizaje y sugerencias de reconocimiento por asociacin.

La integracin de estas funciones en una GED consiste, generalmente, en aadir una aplicacin
exclusiva y disear un inyector (o conector) para introducir en la GED el resultado de los flujos
digitalizados.

Es importante destacar que no existe una solucin de reconocimiento automtico de cdigo abierto
totalmente satisfactoria.

Alfresco interacta con Kofax Ascent Capture, una solucin comercial de gestin de escneres y de
reconocimiento automtico de contenido.

LogicaDoc ofrece este tipo de integracin en su versin comercial.

eXo DMS propone una integracin con Kofax a travs de Webdav.

Freedom no ofrece este tipo de integracin.

Knowledge Tree incorpora, en su edicin comercial, una herramienta especfica que permite tanto la
gestin del escner como el OCR. Esta herramienta es una simple cadena de digitalizacin que
permite gestionar el escner, realizar manipulaciones simples del archivo generado e indexar el archivo
en la GED.

Maarch propone una interfaz estndar con Kofax Ascent Capture o directamente al escner Fujitsu
ScanSnap. Se ofrece una cadena de digitalizacin completa y perfectamente adaptada a la gestin del
correo en el software vertical exclusivo: LetterBox.

Nuxeo dispone de puntos de extensin para la integracin con soluciones de digitalizacin, en
especial, en el contexto de su software especializado de gestin de correo, cuyo lanzamiento est
previsto para el primer semestre de 2010: Nuxeo Correspondance.
Jahia no ofrece de serie este tipo de integracin.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 66 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.7 GESTIN DE PERMISOS
En la GED, como en la mayora de las aplicaciones de gestin que puedan ser utilizadas por varios
usuarios, la gestin de los permisos es una piedra angular.

La gestin de permisos suele basarse en la asociacin de autorizaciones a elementos de la base
documental. Estas autorizaciones permiten definir un conjunto de permisos para un usuario o un grupo de
usuarios

4.7.1 Niveles de gestin
La gestin de los derechos debe ser lo suficientemente fina, como mnimo por nudo de jerarqua
(repertorio en un sistema de archivos) y, si es posible, por cada documento individualmente. Algunos
sistemas ofrecen una gestin a nivel de metadatos, para gestionar los problemas de confidencialidad
extremamente delicados. La gestin de permisos tambin tiene en cuenta las posibles acciones en
funcin del papel (perfil) de cada usuario (ver el prrafo siguiente).

La gestin de permisos o autorizaciones para los usuarios debe poder regularse finamente y de forma
descentralizada, es decir, los que tienen la capacidad de administrarlos son los gestores de la GED y
no los tcnicos. Esta gestin permite definir cmo se aplica la nocin de confidencialidad en la GED.

4.7.2 Gestin de perfiles
Un usuario puede contar con varios perfiles, en funcin de su pertenencia a un servicio, a un nivel
jerrquico, pero tambin por su papel en un proceso transversal, por ejemplo, al trabajar en la pgina
web, en el expediente de un cliente...

La gestin de los usuarios puede estar sujeta tambin a autorizaciones, lo que permite disponer de
administradores locales, encargados de la gestin de los permisos delegada en una seccin de la base
documental.

Siempre que sea posible, es preferible basarse en una metadefinicin de permisos marcada desde el
directorio de la empresa. Esto se traduce en el uso de grupos del directorio central en el sistema de
GED. Lo ideal sera que en la GED slo se gestionara la asignacin de permisos a grupos sobre
objetos documentales, todo ello de forma totalmente impersonal ya que la gestin de individuos debe
estar delegada al directorio de la empresa.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 67 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.7.3 Directorio y SSO
Las aplicaciones documentales pueden basarse en directorios de tipo LADP o AD y dispositivos de
Single Sign-On (SSO) para la gestin de la identidad de sus usuarios.

Las posibilidades que ofrecen las diferentes soluciones se diferencian principalmente por la capacidad
de sincronizacin con el directorio, la capacidad de actuar conjunta y rpidamente con los sistemas de
SSO del mercado o por la posibilidad de crear usuarios para la GED, fuera del directorio.

Todas las soluciones que aqu se presentan ofrecen la posibilidad de interactuar con un directorio.
Todas ellas ofrecen una gestin de permisos lo suficientemente precisa.

Alfresco, eXo DMS, Nuxeo y Jahia admiten la configuracin de un sistema SSO y la autentificacin
vinculada a varios directorios.

Alfresco tambin ofrece la posibilidad de disponer de una base de usuarios secundarios en el contexto
de su interfaz Share, con el fin de poder invitar a usuarios externos

eXo DMS permite definir los permisos a muchos niveles: contenidos, elementos de la interfaz,
determinadas funciones, etc. Estos comportamientos los hereda en gran parte del componente de
portal sobre el que se basa eXo DMS.

Freedom, LogicaDoc y Maarch admiten la autentificacin mediante un directorio LDAP.

Knowledge Tree ofrece, adems del modelo estndar, un modo de gestin dinmica de permisos,
basado en los metadatos de los documentos.
Nuxeo tambin permite la definicin de permisos negativos, es decir, la retirada puntual de permisos.

4.8 FUNCIONES DE COLABORACIN
La GED rene la documentacin de la empresa y proporciona un repositorio nico para los documentos,
especialmente los ofimticos. Por lo tanto, las funciones de colaboracin van mucho ms all del uso de
una herramienta bsica como el correo electrnico.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 68 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Existen varios conceptos en la edicin colaborativa de documentos cuando un usuario desea editar un
documento presente en la GED:

Reserva explcita: Se crea una copia de trabajo que el usuario puede editar desde su
propio equipo. El original, ubicado en la GED, seguir teniendo un acceso de slo
lectura. A este principio se le conoce con el nombre de check-out o reserva. Una vez
se ha modificado el documento, el usuario carga la nueva versin y libera su reserva.
Se cambiar el nmero de versin del documento (el nmero de versin aumenta) y
volver a permitir su acceso libre: A esto se le conoce como check-in o liberacin de
reserva
Modificacin en lnea: El usuario que desee modificar el documento, lleva a cabo dicha
modificacin en lnea, es decir, sobre la versin del servidor. Aunque el documento se
abra en su equipo, ste estar reservado y, por lo tanto, tendr derechos de acceso de
slo lectura. Una vez que el usuario cierre el documento en su equipo, la reserva queda
liberada. Este proceso es ms cmodo para el usuario, pero tiene sus lmites, ya que
requiere que est constantemente en lnea
Modificacin concurrente: Los usuarios editan el documento en tiempo real desde sus
equipos. Si varios usuarios han abierto el documento simultneamente, la GED gestiona
la edicin concurrente sealando las diferencias y solicitando una intervencin. Esta
prctica es excepcional, ya que el formato de documento ofimtico no se presta
demasiado para este tipo de edicin
Tambin se podrn encontrar otras funciones como: alertas sobre los cambios, envo de correo desde la
GED, comentarios y debate sobre los documentos y vista previa.


Las principales funciones del aspecto de colaboracin son la reserva y el control de versiones.

Alfresco permite realizar ediciones de forma colaborativa mediante la reserva, la modificacin en lnea o la
integracin con MS Office. Alfresco incluye de serie herramientas de alertas configurables por el
administrador. Por ltimo, Alfresco ofrece un framework de desarrollo de interfaces: Alfresco SURF. Share,
la interfaz basada en SURF propuesta por el fabricante, permite disponer de un generador de sitios de
colaboracin. Share tambin incorpora herramientas de administracin de contenido, como un wiki, un foro,
un blog y un calendario compartido compatible con iCal. Cada usuario tiene un panel de control donde
puede encontrar toda la informacin pertinente para los sitios en los que participa.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 69 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
eXo DMS ofrece algunas caractersticas de colaboracin integradas y directamente utilizables. eXo dispone
de un software especializado dedicado a la colaboracin que ofrece un conjunto de herramientas tales como
calendario, correo, foro, etc.

Knowledge Tree ofrece funciones de reserva y de integracin con MS Office en su versin comercial. Cabe
destacar que la integracin con Office se basa en una integracin muy ergonmica con el equipo del
usuario. Esta solucin tambin puede crear documentos de Word y Excel directamente desde la interfaz
Web de la GED.

Nuxeo permite realizar ediciones de forma colaborativa mediante la reserva, la modificacin en lnea, la
integracin con MS Office o mediante el mdulo LiveEdit, si se instala en los equipos clientes. Tambin es
posible abrir un documento directamente en la GED, sin necesidad de crearlo previamente en su equipo.
Nuxeo tambin ofrece de serie herramientas de alerta configurables por el administrador o por el usuario.
Por ltimo Nuxeo desarrolla un framework de interfaz llamado WebEngine que permite disponer de una
interfaz alternativa (una especie de mini sitio Web) en una parte del repositorio de Nuxeo.

Maarch no ofrece este tipo de funcin. Esto es indicativo de la vocacin de Maarch, que no est diseado
para gestionar los aspectos colaborativos de la gestin de documentos, sino ms bien los flujos entrantes,
salientes y los archivos.
4.9 WORKFLOW
En el marco de las soluciones de gestin de contenido se establecen dos tipos de workflows (procesos). Se
trata de una de las fronteras entre el campo de la GED y el de la ECM. Efectivamente, en las soluciones de
GED encontramos workflows aplicados a los documentos. En las soluciones de ECM encontramos tambin
procedimientos automatizados ajenos a cualquier contexto documental: hablamos entonces de BPM o de
workflow profesional.

Existen diferentes niveles de procesos de gestin dependiendo de las soluciones:
Workflow documental, por ejemplo: validacin, aprobacin, difusin de documento
Workflow profesional, por ejemplo: instruccin de carpeta, tratamiento de datos,
desmaterializacin de formulario





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 70 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.9.1 Workflow documental
Se trata de hacer que los documentos sigan un circuito de validacin, a menudo para publicarlos o
archivarlos; a veces encontramos el trmino Docflow. Diferentes mtodos se ponen en marcha
mediante las herramientas.

El workflow se basa generalmente en las funciones estndar de las herramientas: la gestin de los
permisos, envo de correo electrnico, desplazamiento de archivos

Las herramientas que permiten crear workflows bajo demanda pueden basarse en una gestin de
reglas subyacente a la aplicacin. Esto permite aadir, yuxtaponer diferentes funciones, a partir de
reglas simples y unirlas unas con otras.

Tambin puede tratarse de desarrollos simples y a menudo poco configurables, sobre todo, en lo
referente al nmero de etapas, de notificaciones o de resultados del workflow.

4.9.2 Workflow profesional o BPM
El objetivo es permitir la desmaterializacin de los procedimientos, ya tengan relacin o no con los
documentos. Las herramientas utilizadas son motores de workflow, es decir, aplicaciones destinadas a
la configuracin y ejecucin de procesos.

Las aplicaciones documentales, cuando incluyen una gestin de procesos elaborada, integran un
elemento Open Source para motorizarla.

Existen numerosos proyectos de motor de workflow Open Source de calidad, casi siempre en
tecnologa Java. Son herramientas relativamente complejas entre las que citaremos Intalio, Bonita,
jBPM, Processmaker, Orchestra o OSWorkflow.

Al igual que para una solucin de gestin documental Open Source, en este caso conviene:
plantearse la cuestin de su perdurabilidad, segn criterios de comunidad, de
usuarios, de nivel funcional...
asegurarse de que la implantacin del motor de BPM en la GED es de buena
calidad especialmente en trminos de gestin de los usuarios (cuando es comn),
de persistencia de los datos o de diseo de los procesos comparndolo con su
interaccin con las funciones documentales.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 71 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.9.3 Representacin de workflow
Existen varios mtodos de representacin de procesos.

Los motores ms elaborados se basan en una representacin grfica de los workflows para realizar su
configuracin, mientras que la modelizacin subyacente suele estar en XML. La transcripcin en el
motor puede ser ms o menos rica, yendo desde la simple interpretacin de las etapas hasta la
posibilidad de personalizar grficamente alertas, condiciones, interacciones con otra aplicacin, e
incluso procesos especficos (scripts).

4.9.4 Implantacin en la GED
La integracin del motor de workflow en la herramienta de gestin documental puede ser mayor o
menor, sobre todo en lo referente a la gestin de permisos y roles, la interaccin entre los objetos
documentales (documento, carpeta) y los objetos de workflow (procesos, etapas), y las interfaces de
las dos herramientas.

La integracin de las interfaces que se ofrecen a los usuarios suele ocultar la interfaz del workflow y
proporciona al usuario la impresin de estar utilizando una nica aplicacin.

La gestin de los permisos debe ser transversal entre GED y BPM. Los usuarios tienen roles dentro de
los procesos, pueden ser los destinatarios de ciertas tareas en funcin de los procesos. Paralelamente,
los usuarios disfrutan de permisos en la base documental y estn, por lo tanto, autorizados para
realizar acciones en algunos objetos documentales. Por lo tanto, la integracin de un motor de
workflow debe captar bien esta relacin para evitar situaciones en las que un usuario sea el
destinatario de una tarea pero, por ejemplo, no disponga de las autorizaciones para llevarla a cabo.

4.9.5 Panel de control y seguimiento
Uno de los objetivos del BPM consiste en permitir el seguimiento y la trazabilidad de los procesos.

Por lo tanto todas las funciones de log y su explotacin deben ser objeto de una atencin particul ar
en el momento de elegir la instalacin de la solucin de BPM en la GED.

Como mnimo, cada usuario debe poder visualizar sus tareas en curso. Para profundizar algo ms, los
indicadores tambin deben incluir: la lista de tareas de los subordinados jerrquicos, el histrico de las
tareas realizadas, la lista de tareas de los grupos a los que el usuario pertenece, estadsticas de
utilizacin a nivel del individuo, del grupo...





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 72 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Estas informaciones se presentan a menudo en la interfaz de la GED sin que sea necesario contar con
una tercera interfaz, excepto cuando la solucin de BPM se utiliza para "motorizar" procesos no
relacionados con la gestin documental. En ese caso, puede ser ms recomendable agrupar todas las
tareas en un panel de control externo a la GED.

Alfresco dispone de una herramienta muy completa basada en un motor de workflow (jBPM). Est
bien integrada en la aplicacin y permite llevar a cabo workflows profesionales. Adems, Alfresco
dispone de una herramienta de diseo de workflow simple basada en el uso de su motor de reglas
integrado. Este segundo tipo de workflow puede ser generado por un usuario funcional.

eXo DMS incluye Bonita como motor encargado de la modelizacin y automatizacin de los workflows
documentales. Bonita tambin se utiliza en el paquete eXo para controlar diferentes procesos. Se trata
de la herramienta de BPM ms completa de todas las integradas en las soluciones que presentamos
aqu.

Jahia incorpora un servidor BPM en las versiones Profesional y Empresa.

Knowledge Tree utiliza el motor ProcessMaker. Aunque no es tan completo como jBPM, su
configuracin es ms fcil y su integracin, hecha en forma de mdulo, es satisfactoria. Los procesos
son principalmente documentales.

LogicaDoc ofrece, en su versin empresa, un sistema de workflow documental configurable
grficamente.

Maarch cuenta con un sistema de workflow mediante desarrollo PHP. Cabe destacar que ofrece una
representacin grfica del flujo del workflow.

Nuxeo dispone de una herramienta muy completa basada en un motor de workflow (jBPM). La
instalacin bsica ofrecida es muy personalizable y permite llevar a cabo diferentes tipos de workflow
profesional.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 73 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.10 REGLAS DE GESTIN
4.10.1 Funciones de gestin
Gestionar documentos conlleva contar con funciones que permitan tener en cuenta las reglas de
gestin inherentes a las profesiones correspondientes. Con relacin a los documentos esto se traduce
principalmente por acciones en: la adquisicin, las notificaciones, la conservacin, las
transformaciones

Encontraremos, dependiendo de las aplicaciones, diversas funciones como por ejemplo:
conversin a PDF de documentos ofimticos
clculo de un nmero de crono para mostrar una etiqueta de documento segn el
metadato
difusin de informacin en funcin de diferentes criterios: una estrategia de
bsqueda registrada previamente, una palabra clave, la validacin de un
documento o de un conjunto de documentos
notificacin por correo electrnico, por flujo RSS, en un panel de control
definicin de los formatos de visualizacin de las fichas de indexacin, por ejemplo:
por perfil del usuario, segn las pticas profesionales o por tipo de documento,
todo ello para poner de relieve los campos ms pertinentes para cada uno
asignacin condicional de metadatos a un documento, por ejemplo, en funcin de la
persona que lo indexa o la carpeta a la que pertenece
manipulacin de la imagen, desde un punto de vista mediateca. Esto permite evitar
la extraccin de la imagen fuera de la aplicacin para acciones simples:
reencuadre, rotacin, equilibrio de color, entre otros
intercambio colaborativo en un documento o una carpeta, por ejemplo, a travs de
funciones tipo foro o mediante anotaciones hechas en un documento

4.10.2 Motor de reglas
Siguiendo el mismo concepto que las funciones de gestin ya mencionadas, las herramientas se basan
en un motor de reglas y permiten configurar acciones ms complejas y combinar unas reglas con otras.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 74 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Estas reglas constituyen un encadenamiento de acciones unitarias, por ejemplo, copia, transformacin,
alimentacin de un metadato, envo de correos electrnicos Dichas reglas tambin pueden ser ms
complejas y reflejar necesidades profesionales.

Adems, suele ser ms fcil crear nuevas funciones en un motor de reglas, stas son de hecho el
reflejo de una arquitectura ampliable, construida para permitir aadir otros modos de funcionamiento
que no estaban previstos inicialmente.

Las aplicaciones PHP y Java destacan aqu especialmente: las primeras cuentan con su mayor rapidez
de desarrollo, las segundas con una arquitectura tcnica ampliable para facilitar la incorporacin de
nuevas funciones.

Alfresco dispone de un gran nmero de funciones de gestin. stas tienen adems gran posibilidad de
ampliacin, ya sea por medio de plug-ins existentes o mediante desarrollos. Alfresco tambin incorpora
un motor de reglas. Algunas de stas pueden manipularse a travs de la interfaz Web estndar lo que
facilita su uso.

eXo DMS no incluye ningn motor de reglas. Sin embargo, la solucin integra una amplia oferta de
herramientas tcnicas que permiten incluir reglas profesionales.

Knowledge Tree incluye pocas funciones especficas de gestin. Existen sin embargo numerosos
mdulos que permiten la integracin con otras aplicaciones o la incorporacin de otras funciones en la
interfaz. Algunos de estos mdulos existen en la versin comercial.

LogicaDoc no incluye ningn motor de reglas pero permite abonarse a las modificaciones de un
documento o de un directorio o descomprimir automticamente el contenido de un fichero zip.

Maarch no incluye ningn motor de reglas. Sin embargo, la solucin implanta numerosas reglas de
gestin para llevar a cabo procesos particulares, especialmente en el vertical de gestin de correo
Letterbox o en lo referente a las funciones de gestin de archivos fsicos.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 75 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Nuxeo dispone de numerosas funciones de gestin que suelen considerarse casi sistemticamente
mdulos. Esto hace que la aplicacin en su conjunto sea muy flexible y modulable. Nuxeo tambin
ofrece un motor de reglas, pero ste no surge en la interfaz sino que es nicamente una poderosa
herramienta a disposicin de los desarrolladores. La herramienta Nuxeo Studio incluir prximamente
la manipulacin del motor de reglas, lo que implicar que los administradores funcionales lo empezarn
a usar.
4.11 GESTIN DEL CICLO DE VIDA
4.11.1 Poltica de conservacin
La conservacin, preservacin y seguridad de la informacin entran, cada vez ms, dentro de los
proyectos de gestin documental a medida que las empresas toman conciencia del valor de los
documentos que manejan a diario.

Las polticas de conservacin existen desde hace mucho tiempo en el campo del papel fsico, pero
llevan poco tiempo aplicndose a los datos electrnicos.

Las disciplinas que abarcan funciones relacionadas con el almacenamiento son las que permiten
responder a las cuestiones relativas a la poltica de conservacin, se habla de archivstica o de
Record Management, en el mundo anglosajn. Suele considerarse que el Record Management
est ms adaptado al campo digital, en la medida en que tiene en cuenta una sub-seleccin del
conjunto de los documentos que se archivan; sub-seleccin correspondiente a documentos vitales,
es decir, necesarios para la actividad de la organizacin.

La definicin de una poltica de conservacin en una aplicacin de gestin documental permite:
definir conjuntos de contenidos, con relacin a tipos o criterios de indexacin
unir cada uno de esos conjuntos a acciones de conservacin, procesos de
destruccin, duracin, formato y soporte de conservacin

4.11.2 Almacenamiento
El almacenamiento puede entenderse de diferentes modos en funcin del contexto de la aplicacin. Del
simple tag archivo en los elementos considerados como archivados, hasta la puesta fuera de lnea
(off-line) de los contenidos en soportes pticos, por ejemplo.

La necesidad y la complejidad del hecho de tener en cuenta el almacenamiento digital van a aumentar
con el volumen y la enorme importancia de las informaciones gestionadas.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 76 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

Por lo tanto, las aplicaciones integrarn funciones que permitan:
gestionar informaciones de conservacin
gestionar los formatos de archivos dentro de la GED en funcin de su perdurabilidad
activar automticamente procesos de almacenamiento
elegir entre realizar o no bsquedas en los elementos archivados
Se aplicarn diferentes tipos de procesos para dar respuesta a los problemas de perdurabilidad, de
finalizacin, de fiabilidad y de trazabilidad de los archivos.

Entre las posibles funciones citaremos:
congelar los elementos archivados, por ejemplo, calculando las huellas
criptogrficas (firma digital) para garantizar su inalterabilidad
hacer validar el almacenamiento (el volcado en archivo) de un conjunto de
documentos, en trminos de fecha y de responsabilidad
gestionar los soportes de almacenamiento de contenidos y de sus metadatos para
conservarlos en soportes adaptados [larga duracin, acceso frecuente]

4.11.3 Formato de archivo
El formato de los archivos gestionados en una aplicacin documental reviste particular importancia.

Contrariamente a los documentos en formato papel, cuya uniformidad permite soslayar la mayora de
las cuestiones relacionadas con el soporte de la informacin, el formato de los contenidos digitales (el
archivo) reviste algunas caractersticas muy importantes.

4.11.4 Funciones relacionadas con el formato
La mayor parte de las aplicaciones de GED pueden almacenar cualquier tipo de archivo, aunque
algunas funciones slo se encuentran disponibles para determinados formatos.

La bsqueda en el texto completo, es decir, dentro de los propios archivos.
Efectivamente, a menudo los formatos documentales son todava cerrados y opacos.
Sin embargo, existe cada vez ms la posibilidad de extraer de ellos el contenido textual
que podr ser indexado y, por lo tanto, encontrado por los motores de bsqueda. Los




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 77 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
formatos ms habituales (PDF, MS Office, HTML) figuran casi siempre entre los
reconocidos. La cuestin se plantea para los formatos especiales: DWG AutoCAD o
MP3 (para los tags textuales), por ejemplo.

La previsualizacin, es decir, la posibilidad de visualizar un archivo sin abrirlo con su
aplicacin correspondiente. Este concepto es especialmente til para archivos muy
pesados (imgenes, vdeos), ya que la aplicacin permite visualizar rpidamente parte
del contenido sin descargarlo ntegramente.


La extraccin de informacin y especialmente de metadatos. Efectivamente, la
mayora de los formatos de archivo utilizan un modo especfico de gestionar los
metadatos que comportan. Conocer estos modos o recurrir a una normalizacin (open
document, JPEG o TIFF, por ejemplo) permite facilitar la recuperacin de los
metadatos introducidos a travs de las aplicaciones o los materiales que generaron los
archivos

La lista que se muestra a continuacin no es exhaustiva.

4.11.5 Formatos abiertos
Los formatos abiertos y/o normalizados son una cuestin de actualidad debido al aumento de la
potencia de la estandarizacin de los formatos ofimticos. De hecho, este fenmeno que observamos
desde hace varios aos en los campos tcnicos, donde la necesidad de interoperabilidad es muy
grande, se ha convertido en el punto de convergencia de numerosos proyectos.

Existen dos retos principales para un proyecto de GED:
El primero consiste en disponer de un formato abierto, documentado, libre (no sujeto
a una patente o a un permiso de utilizacin) y muy extendido que garantice la
perdurabilidad de los archivos.
El segundo es disponer de un formato cuya estructura sea conocida, lo que
permite la manipulacin del contenido (la edicin). Esto permite ofrecer funciones de
manipulacin del contenido mismo del archivo: transformaciones, combinaciones e
incluso aadir datos en el propio archivo (la referencia en la GED o un ndice).





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 78 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.11.6 Formatos de conservacin
Como los documentos almacenados en el sistema documental deben a menudo conservarse durante
varios aos (ms de 5 aos) su conservacin debe incluir la preservacin, es decir, que debern como
mnimo ser legibles.

La problemtica de la conservacin abarca cada vez ms a los documentos electrnicos en la medida
en que estos ya sustituyen al papel, mientras que hace slo algunos aos nicamente lo
complementaban.

Los formatos de archivos, adems de garantizar la legibilidad de los documentos durante ms de diez
aos son, aunque sean formatos simples y muy extendidos, las normas de hecho, como por ejemplo:
los archivos de texto (.txt) cuyos archivos XML son unos de los ms habituales y tiles para datos
estructurados, ya sean los formatos normalizados a nivel internacional como el PDF/A (ISO 19005-
1:2005), el PDF/E (ISO 24517-1 en proceso) o el ODF (ISO/IEC 26300:2006 - Open Document
Format).

En el caso en el que estos documentos lleven incorporadas firmas electrnicas, los problemas son
ms complejos (descrito a continuacin).

4.11.7 Almacenamiento digital de valor probatorio
A las cuestiones de almacenamiento se aaden los problemas sobre el almacenamiento legal o de
valor probatorio, es decir, la conservacin en formato electrnico de documentos que pueden servir
como prueba.

Este aspecto del almacenamiento no lo cubre directamente, por lo general, la solucin de GED, pero s
lo hacen las funciones adicionales que gestionan las firmas electrnicas, las relaciones con terceros de
confianza y la trazabilidad de la conservacin.

Para la creacin de un almacenamiento legal es necesario garantizar:
La integridad: los archivos no deben haber sido modificados
La integridad: una firma nominativa y verificable
La trazabilidad: la vida de cada documento debe conocerse sin error posible,
principalmente a travs del fechado certificado y contiguo (sin discontinuidad)
La posibilidad de ser auditado: el sistema debe poder ser verificado para
comprobar que estos procesos no pueden alterarse





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 79 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Alfresco ofrece la gestin del ciclo de vida desde dos enfoques: Por un lado, un mdulo de Records
Management certificado DoD 5015-2, es decir, por el Departamento de Defensa estadounidense, que
permite principalmente gestionar un plan de clasificacin del almacenamiento. Y por otro lado, un
mdulo de gestin del ciclo de vida (ILM-information life cycle) destinado a la gestin de soportes de
almacenamiento de contenidos en funcin, especialmente, de sus caractersticas de conservacin. Se
trata de dos mdulos complementarios a la versin comercial.

eXo DMS ofrece funciones de gestin para el ciclo de publicacin de contenidos, principalmente bajo la
ptica de difusin Web.

Maarch incluye numerosas funciones relacionadas con la gestin de archivos teniendo en cuenta los
archivos fsicos (archivador) y la creacin de bases autnomas de archivos en CDROM. Se trata, en
este caso, de una funcin histrica de la solucin. Queremos indicar, sin embargo, que este enfoque
es poco adecuado a la hora de llevar una poltica de conservacin compleja.

Nuxeo ofrece la gestin del ciclo de vida de los contenidos y su poltica de conservacin por medio de
funciones estndar: metadatos, plan de clasificacin y ciclo de vida de los contenidos. Cabe sealar
que estas funciones no son especficas de un mdulo de almacenamiento sino que son transversales
en la aplicacin.

Las otras soluciones no incluyen funciones especficas para la gestin del ciclo de vida o del
almacenamiento.
4.12 IMPORTACIN/EXPORTACIN
Las funciones de importacin y exportacin son fundamentales en una solucin de GED ya que,
efectivamente, permiten introducir/extraer los contenidos de una solucin a otra y, por lo tanto, seguir
controlando la eleccin de sus herramientas.

4.12.1 Importacin/exportacin masivas
El objetivo aqu es permitir introducir o extraer rpidamente un gran nmero de documentos. Estas
funciones permiten tener en cuenta los metadatos y ficheros y, si es posible, la gestin de los permisos.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 80 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Las mejores soluciones propondrn herramientas especficas o APIs de nivel bajo que permiten
interactuar con la base documental para: introducir o extraer contenidos, aadir o modificar metadatos
o permisos asociados a los contenidos.

4.12.2 Exportacin a soporte fsico
Se aplican, en este caso, dos enfoques diferentes:

La exportacin definitiva, sobre todo con fines de almacenamiento, que consiste en sacar
algunos documentos y sus metadatos a soportes de larga duracin, a menudo ms lentos que los
discos duros de los servidores (discos pticos, cintas DAT...). En una situacin perfecta, la GED
conserva la memoria de los documentos as extrados, de manera que permite bsquedas sobre los
metadatos.
La exportacin con fines de consulta fuera de lnea. Consiste en exportar una parte de la base
documental a la estacin de trabajo del usuario o a un soporte digital dotado de su propia interfaz de
consulta.

Alfresco permite importar y exportar espacios enteros del repositorio en forma de archivo e incluyendo
los metadatos y las reglas y permisos en formato XML. Alfresco tambin gestiona, mediante su mdulo
WCM que se ocupa de los contenidos para sitios Web, la publicacin de contenidos en servidores
remotos.

eXo DMS ofrece funciones y rutinas tcnicas de importacin-exportacin a nivel de su implantacin del
JCR (base de contenido).

Jahia cuenta con un mdulo de importacin-exportacin del conjunto de datos (contenidos y permisos
en XML y sus archivos vinculados).

Knowledge Tree puede importar el contenido de un archivo zip adjuntando los metadatos comunes y
exportar una seleccin de archivos.

Maarch permite gestionar la importacin y exportacin de datos a travs de un mdulo disponible
mediante licencia comercial.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 81 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Nuxeo dispone de un mdulo que realiza operaciones de importacin y exportacin de documentos y
metadatos, incluyendo los permisos. Estas funciones pueden ser controladas por una interfaz de
pedido en lnea, la Nuxeo Shell. Nuxeo tambin permite realizar una rplica automtica de los
contenidos entre varias bases Nuxeo. Por ltimo, la solucin ofrece a los usuarios la exportacin de
una seleccin de documentos en formato zip.

4.13 GESTIN DE CORREOS ELECTRNICOS
La gestin de los correos electrnicos es una funcin muy solicitada en gestin documental, para que esos
elementos de informacin participen en la memoria colectiva y tambin por razones reglamentarias
(Sarbanes-Oxley o Ble II imponen reglas de conservacin de correos electrnicos).

Los problemas de gestin del conocimiento conllevan tener que compartir y capitalizar las informaciones,
incluso cuando su grado de formalizacin es dbil, como suele ocurrir con los correos electrnicos.
Almacenarlos y compartirlos facilita el trabajo en equipo. Cada vez ms se imponen los controles, ya sean
los reglamentarios o los de calidad. Esto lleva a las organizaciones a conservar todos los intercambios con
sus trabajadores y sus socios comerciales.

La mutualizacin ms o menos automtica de los correos electrnicos puede resultar, por lo tanto, una
solucin a todos estos problemas.

4.13.1 Seleccin de correos electrnicos para archivar
El proceso de almacenamiento de un correo electrnico difcilmente puede ser totalmente automtico,
corriendo el riesgo de almacenar una gran cantidad de correos basura (spam), de mensajes sin inters
o incluso de mensajes privados (que deben quedarse fuera de los mecanismos de mutualizacin).

Por lo tanto, las soluciones de GED deben ofrecer procesos de seleccin para el almacenamiento de
correos electrnicos. Esto puede hacerse mediante la integracin de un plug-in en el gestor de correo
(Mozilla, Outlook) o mediante la integracin de la importacin automtica de correos electrnicos
enviados a una direccin electrnica especfica, como por ejemplo:
almacenamiento_ged@suorganizacion.com

4.13.2 Gestin de correos electrnicos
La gestin de los correos electrnicos plantea varios problemas, tcnicos y metodolgicos a la vez.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 82 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Por un lado, no existe homogeneidad en cuanto al nmero o al formato de los documentos adjuntos. El
formato de los propios correos electrnicos es variable (HTML o texto, incluso formatos propietarios
dependiendo del cliente de mensajera utilizado). Adems, los intercambios por correo electrnico a
menudo se hacen entre ms de dos interlocutores y el almacenamiento de un correo electrnico en
varios ejemplares dara lugar a repeticiones intiles.

No se trata, en este caso, ms que de una muestra de las cuestiones que se plantean en la gestin del
correo electrnico.

Por lo tanto, la GED deber ofrecer soluciones, especialmente para:
gestionar los formatos de conservacin de correos electrnicos y de los documentos
adjuntos con el fin de garantizar una ptima restitucin.
detectar las repeticiones para evitar almacenamientos mltiples y proponer
procesos de trabajo colaborativo, por ejemplo, cuando se intercambia un
documento adjunto modificado ligeramente en correos electrnicos sucesivos
indexar el contenido de los correos electrnicos y de los documentos adjuntos y
gestionar los vnculos entre estos diferentes contenidos.

Alfresco permite gestionar los correos electrnicos mediante un simple arrastrar-soltar desde
Outlook. Las informaciones bsicas (remitente, destinatarios, asunto) se extraen automticamente. El
contenido del correo electrnico y de los documentos adjuntos est disponible mediante bsqueda de
texto ntegro. En Alfresco, cada documento o carpeta dispone de su propia direccin de correo
electrnico, de manera que se le puede remitir un correo electrnico. El comportamiento puede
configurarse: de este modo, una carpeta va a almacenar el correo electrnico y los documentos
adjuntos, un documento puede recibir una anotacin correspondiente al contenido del correo
electrnico...

eXo DMS no tiene en cuenta directamente la gestin del correo electrnico. Sin embargo en el paquete
eXo existe una herramienta destinada a este uso y que se basa en el mismo almacenamiento de eXo
DMS.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 83 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Nuxeo permite gestionar los correos electrnicos mediante un simple arrastrar-soltar desde Outlook.
El contenido del correo electrnico y de los documentos adjuntos est disponible mediante bsqueda
de texto ntegro. Nuxeo tambin ofrece un tipo de carpeta correo electrnico a la que se puede
vincular un buzn de mensajera y que permitir recuperar automticamente todos los mensajes de
este buzn dentro de Nuxeo. Los usos son mltiples y facilitan especialmente el uso del buzn de
correos electrnicos compartidos, lo que los hace estar disponibles en la base documental.

Knowledge Tree, en su versin comercial, dispone de una buena integracin en Outlook. Es posible
archivar los correos electrnicos cuyos metadatos se extraen automticamente, pero tambin se
pueden adjuntar los archivos del repositorio cuando se enva un correo electrnico.

El resto de las herramientas no ofrecen estas funciones.
4.14 GESTIN DE CARPETAS
4.14.1 Conceptos relativos a la gestin de carpetas
Al igual que la gestin de archivos en una estacin de trabajo, sucesora de la gestin de documentos
en papel en los archivadores, la ergonoma de las soluciones de GED en materia de gestin de
carpetas tambin se enfoca desde la lgica del usuario. Aqu, una carpeta no es un simple directorio
sino un conjunto de documentos unidos por una finalidad comn.

Sin embargo, el concepto de carpeta es fluctuante y conviene precisar las tres acepciones que le
vamos a asignar:
Bajo la ptica profesional habitual, la carpeta es un conjunto de documentos
cuyo agrupamiento proporciona coherencia y a partir del cual los usuarios llevarn
a cabo sus tareas - la carpeta proyecto o carpeta de instruccin, por ejemplo.
Bajo la ptica documental, la carpeta rene documentos con caractersticas
comunes: un tema o un metadato, por ejemplo - carpeta de los artculos de la
prensa del da o el anlisis financiero de una empresa, por ejemplo
Desde la ptica del sistema de informacin, la carpeta agrupa digitalmente
informaciones procedentes de distintos elementos del sistema de informacin para
facilitar su explotacin - la carpeta clientes, por ejemplo

Estos enfoques pueden ser complementarios.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 84 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Existen dos diferencias fundamentales entre las carpetas en formato papel y las electrnicas:
El formato digital permite el multiposicionamiento. Un mismo documento puede estar
presente en varias carpetas y ser utilizado por varios usuarios con enfoques profesionales
diferentes
El formato digital evita la duplicacin y desmembracin de las carpetas. Una misma
carpeta puede ser compartida por varias entidades, geogrfica o funcionalmente distintas,
permitiendo a cada una manipular sus contenidos sin que sea necesaria la creacin de
varias carpetas hijas. Efectivamente, compartir una parte del patrimonio de informacin
suele conllevar la duplicacin de carpetas que siguen su propia evolucin.

4.14.2 Las herramientas de la gestin de carpetas
Entre las herramientas de GED podemos encontrar varios medios importantes que llevan a cabo
esta gestin, como por ejemplo: las informaciones de carpeta, indicadas por los metadatos y las
tareas asociadas a una carpeta casi siempre en el marco de un workflow.

Otras funciones pueden adaptarse a un sistema de GED o ser desarrolladas como mdulos con
entidad propia.
Agrupamos a continuacin las funciones ms frecuentes:





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 85 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.14.3 La puesta en comn de informacin
definicin de metainformaciones por carpeta
posibilidad de estructurar una carpeta agrupando documentos por medio de sus metadatos
o de subcarpetas
vnculos entre carpetas (jerarqua, temtica, reglamentacin, tipo de negocio, tipo de
cliente...)
gestin de permisos de los usuarios (inicializacin, agente tratante, supervisor,
administrador) y sus respectivas prerrogativas en cada parte (v. estructuracin de las
mencionadas carpetas a continuacin)

4.14.4 La gestin de carpetas
con activadores automticos; por ejemplo, para el almacenamiento o para las alertas en el
marco de un procedimiento o tambin al recibir un documento.
interaccin entre documentos y datos de una tercera aplicacin de gestin o de una base de
datos (principalmente para formularios)
aplicacin de reglas en los subconjuntos de documentos que constituyen una carpeta
comprobacin de la finalizacin de la carpeta con relacin a las listas conocidas
posibilidad de generar documentos a partir de modelos y de condiciones o caractersticas
de la carpeta, como por ejemplo un formulario o una lista de correo
gestin del workflow de tratamiento para automatizar las transiciones y permitir un
seguimiento automtico de la instruccin

4.14.5 La clasificacin
La relacin entre los documentos fsicos y digitales puede ser importante en el caso de
documentos en formato papel que tengan carcter jurdico
Identificacin de la carpeta: reglas de constitucin, regla para crear nombres,
nomenclatura

4.14.6 Trazabilidad
De cualquier accin en cualquier carpeta debe poder hacerse un seguimiento para permitir las
auditoras de tratamiento de carpetas




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 86 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.

Alfresco permite gestionar carpetas combinando directorio, metadatos, reglas de gestin y
funciones de auditora. La visin por facetas permite ofrecer vistas distintas a los diferentes actores
de los procesos de la empresa. Los conceptos de vista personalizada en la visualizacin de cada
carpeta permiten aadir fcilmente informaciones o herramientas de gestin simple de carpetas
(registro o estado del proceso, por ejemplo)

eXo DMS gestiona carpetas como si fueran un tipo de contenidos, es decir, que pueden disponer de
metadatos y de todas las funciones asociadas. Aunque no se ha implantado ninguna funcin
especfica, han previsto todo lo necesario para poder desarrollarla bajo peticin.

Freedom permite gestionar las carpetas y portafolios virtuales para clasificar los documentos.

Jahia permite gestionar carpetas dinmicas en funcin de metadatos, pero no incorpora
inicialmente reglas de gestin.

Maarch permite gestionar carpetas dinmicas que corresponden a peticiones personalizadas y
atribuirlas a los usuarios en funcin de su rol. Este comportamiento nace en la aplicacin Letterbox
que ofrece una avanzada gestin de carpetas de correo.

Nuxeo gestiona el concepto de carpeta y aporta otro concepto de seccin que permite posicionar
cada contenido en una carpeta y en tantas secciones como se desee. En la prctica se combinar
directorio, metadatos, reglas de gestin y de auditora. La visin por facetas permite ofrecer vistas
distintas a los diferentes actores de los procesos de la empresa. El concepto de seccin permite una
abstraccin adicional, transversal e independiente de los metadatos.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 87 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.15 INTEGRACIN TCNICA
En materia de integracin tcnica, las herramientas de GED pueden considerarse desde diferentes puntos
de vista. Por un lado, pueden considerarse aplicaciones en s mismas, sin vnculos reales con el sistema de
informacin aparte de la gestin de los usuarios y de la ergonoma que se les ofrece. O tambin pueden ser
consideradas como un elemento de un sistema ms global en el que sirven de almacenamiento centralizado
para el conjunto de archivos de una organizacin.

4.15.1 Configuracin de la interfaz
Una herramienta de GED, aunque sea muy completa, puede que ofrezca una interfaz que no sea
conveniente para los usuarios a los que va dirigida. Aunque con las soluciones Open Source siempre
se pueden hacer adaptaciones directamente en el cdigo de la propia aplicacin, se corre el riesgo de
hacer ms complejas las actualizaciones. Algunas soluciones dan respuesta a este problema
permitiendo modificar su interfaz a travs de la configuracin o de herramientas destinadas para ello.

Alfresco dispone de dos interfaces relativamente monolticas y un framework de desarrollo. La interfaz
Alfresco UI ofrece en versin estndar un gran nmero de funciones, muchas de ellas adaptables
mediante configuracin XML: asistentes y acciones disponibles y tambin algunos comportamientos.
Las evoluciones pueden reunirse en forma de un mdulo o siendo desarrolladas desde vista
personalizada como elemento adicional a la interfaz estndar, lo que permite aplicarlas fcilmente
cuando se actualicen. Share, la segunda interfaz, est creada en el framework de referencia de SURF.
Share est totalmente orientada al trabajo colaborativo. Cabe sealar que las dos interfaces estndar
comparten el principio de una pgina de inicio totalmente configurable por el usuario. En la comunidad
Alfresco existen otras interfaces ms o menos maduras.

eXo DMS est creado sobre el portal eXo, solucin que se encarga del diseo de portales Web. Por
ello, todos los elementos de la interfaz de eXo DMS son personalizables y ampliables. Sin embargo, la
interfaz ofrecida inicialmente es bastante tcnica y requiere una adaptacin. Recordemos, hecho
asumible por el perfil semitcnico que lo suele usar.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 88 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
Jahia ofrece una interfaz inicial de utilizacin muy sencilla. Dada su orientacin hacia la publicacin de
contenidos, la interfaz inicial correspondiente es la del back-office. La interfaz de restitucin ofrece una
gran flexibilidad en la adaptacin a las necesidades de los usuarios. En este caso, est dentro de una
lgica de diseo de interfaz especfica. Cabe sealar que el modo insite editing para aadir
componentes directamente en las pginas de los sitios generados ofrece una gran flexibilidad de
restitucin.

Knowledge Tree permite modificar fcilmente el texto de los diferentes mensajes de su interfaz pero
no est prevista ninguna herramienta especfica de manipulacin de la interfaz ms all de la pgina de
inicio. Por lo tanto, las adaptaciones suelen realizarse en el propio cdigo de la interfaz.

LogicaDoc propone algunas opciones de interfaz pero no dispone de una herramienta especfica para
su diseo. Las adaptaciones se realizan por el uso de temas o skins.

Freedom y Maarch no cuentan con herramientas especficas que permitan modificar la interfaz ms
all de las configuraciones funcionales propuestas. Por tanto, las adaptaciones se realizan en el cdigo
de la interfaz.

Nuxeo dispone de una interfaz estndar completa y ergonmica, as como de un fabricante de temas
que permite configurar algunos aspectos de forma interactiva. Para las modificaciones ms avanzadas,
toda la interfaz (funcional y grficamente) est creada sobre un sistema de plug-in que permite recoger
las modificaciones desarrolladas para facilitar su aplicacin en versiones posteriores. Nuxeo Studio
permite tambin dar una gran flexibilidad a la configuracin de algunos elementos de interfaz: pgina
de inicio, logotipo, pantallas de entrada, de modificacin y de bsqueda avanzada. Cabe sealar que la
pgina de inicio es totalmente configurable por el usuario a travs de la utilizacin del gadget Open
social.


4.15.2 Integracin de las aplicaciones
La integracin permite a las aplicaciones de gestin de contenido integrarse, conversar con otras
aplicaciones casi siempre productoras o usuarias de contenidos.

Con este fin, se ofrecen varios estndares y tecnologas.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 89 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.15.3 Los servicios Web
Los servicios REST y SOAP son dos formatos de intercambio y de exposicin de funciones
profesionales utilizados en la creacin de API Web.

4.15.4 Servicios Web SOAP
Especificacin que utiliza el lenguaje XML en el formato estndar SOAP (Simple Object Access
Protocol). Los Servicios Web permiten realizar intercambios entre un cliente y un servidor mediante el
protocolo http. Los Servicios Web ponen a su disposicin un conjunto de puntos de entrada
profesionales (Endpoint) descritos en un contrato en formato estndar WSDL (Web Services
Description Language).

4.15.5 Servicios Web REST
Ms simples y eficientes que la especificacin SOAP, los servicios REST (Representacional State
Transfer) se limitan al uso del protocolo HTTP para las entradas-salidas. No estn obligadas a utilizar
XML como lenguaje y sus intercambios entre cliente y servidor son menos verbales que los de SOAP,
por lo que son ms eficientes.

4.15.6 CMIS para Content Management Interoperability Services
Se trata de una norma emergente, probablemente una de las ms prometedoras desde el JCR o el
Webdav, para homogeneizar los accesos a una gestin de contenido, especialmente documental. Esta
norma consiste en proponer un acceso tcnico homogneo a las herramientas de gestin de los
contenidos propuestos por esta interfaz. En otras palabras, esto permite que una aplicacin como eZ
Publish (CMS destinado a la concepcin de sitios Web) pueda explotar los contenidos almacenados en
una de las bases siguientes: Alfresco, Nuxeo o Knowledge Tree de forma agnstica.

4.15.7 Interfaces simplificadas
Otra forma simple de integrar la herramienta de GED en el sistema de informacin es ofrecer una o
varias interfaces usuarias simplificadas y limitadas a un uso preciso. Citaremos los siguientes casos de
utilizacin: la insercin en un portal o una aplicacin profesional, por ejemplo.

Las soluciones que ofrecen frameworks de diseo de interfaz son las que mejor responden a esta
necesidad.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 90 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.15.8 Portlets en un portal
La herramienta puede proporcionar una serie de portlets, componentes que se instalan en un portal
J2EE y que dan acceso directo a ciertas funcionalidades.

Algunas aplicaciones de GED ofrecen inicialmente la portletizacin (inclusin de portlet estndar) de
algunos componentes o pginas (panel de control, bsqueda o navegacin, por ejemplo).

Para obtener informacin ms detallada sobre este tema puede consultar el libro blanco Portail de
Open Source disponible en lengua francesa en la pgina www.smiel.fr.

Alfresco dispone de un amplio abanico de API: servicios web, RES y tambin webscripts para la
realizacin de interfaces simplificadas basadas en HTML y JavaScript.

eXo DMS es una solucin que se encarga de la integracin. Como hemos visto anteriormente, su uso
es pertinente principalmente en el marco del paquete eXo Platform. Efectivamente, eXo DMS se
comporta como una interfaz de gestin de los contenidos explotados por los otros elementos de la
plataforma. Por lo tanto, eXo DMS dispone de todos los elementos necesarios para ser integrado,
elementos que estn muy orientados hacia los otros componentes del paquete eXo.

Jahia, por su funcin de portal J2EE, ofrece pocas funciones para acceder y manipular sus propios
contenidos. Se posiciona ms bien como un agregador. Es posible recuperar los contenidos en XML
mediante servicios web y los archivos mediante su direccin Webdav.

Knowledge Tree dispone de servicios web.

LogicaDoc ofrece algunos servicios web.

Freedom y Maarch no ofrecen prcticamente posibilidades de interaccin en estndar.

Nuxeo cuenta con un conjunto de servicios web, tecnologas de EJB, SOAP y REST remotos, as
como un sistema de plug-ins que permite ampliar fcilmente las funcionalidades de la herramienta. La
disponibilidad de la interfaz cliente pesado de Eclipse RCP facilita el desarrollo de la aplicacin en la
estacin de trabajo en la que se necesitan tratamientos pesados.




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 91 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
4.15.9 Modo SaaS
En el ao 2009 surgieron numerosas soluciones en modo SaaS -Software as a Service. Las
aplicaciones de gestin de contenido, especialmente de GED, no han escapado a esta tendencia y
hemos visto la eclosin del traslado de diferentes soluciones de GED, sobre todo de Open Source, a
Cloud.

Este modo permite entender los proyectos de GED desde un nuevo ngulo viendo la aplicacin como
un servicio y ya no como una solucin, el despliegue es ms simple ya que est industrializado,
muchas veces a travs del propio fabricante. La contrapartida es que los desarrollos suelen ser ms
limitados.

Este tipo de oferta an sigue vindose como una forma de lanzar rpidamente un proyecto, ya que
puede ponerse en marcha una infraestructura completa en unas horas, o como primera fase de un
proyecto ms ambicioso sirvindose de la accin de Cloud como proyecto piloto para su validacin.

Alfresco ofrece una mquina Amazon EC2 machine Amazon EC2 para sus versiones comunidad y
empresa (limitada a 30 das).

Nuxeo propone un servicio de alquiler de instancia empaquetado en la plataforma de Amazone EC2.

Knowledge Tree ofrece la versin KnowledgeTreeLive KnowledgeTreeLive alojada tambin en
Amazone EC2. Esta versin ofrece sobre todo plug-ins comerciales especficos como la integracin
con Zoho, solucin de ofimtica en lnea.

Cometa propone con estas ofertas un enfoque de despliegue rpido destinado a crear rpidamente
prototipos o aplicaciones simples para que sus clientes los utilicen habitualmente.





Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 92 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
5 RESUMEN
La gestin documental en las organizaciones tiene como finalidad la gestin de una informacin
operacional, casi siempre vital. Se trata, en muchos casos, de una pieza estratgica del sistema de
informacin, como mnimo tan importante como el viejo servidor de archivos que existe en la inmensa
mayora de las organizaciones y cuya prdida sera catastrfica.

Los proyectos de gestin documental son completos ya que anan aspectos tcnicos y funcionales. Es
mucho lo que las empresas se juegan en la gestin documental, por lo que necesitan tener garantizado el
xito.

El carcter Open Source de las soluciones ofrece estas importantes ventajas: una solucin potente y
perdurable, numerosos prestatarios y un fabricante que puede proporcionar soporte y una garanta de
continuidad del servicio, ver nuestro libro blanco sobre el tema. Los fabricantes de Open Source disponen
de ofertas orientadas en dos sentidos: la garanta (soporte y mantenimiento) y la puesta a disposicin de
funciones avanzadas.

Algunos podrn lamentar que haya que pagar por el uso de las soluciones Open Source y, efectivamente,
para una solucin autnticamente Open Source, esto no es obligatorio. Sin embargo, las soluciones GED
de Open Source son productos de fabricante que no provienen de grandes fundaciones ni son comunitarias,
y evidentemente, el fabricante debe tener una fuente de ingresos que garantice el desarrollo de su producto.

El carcter Open Source ofrece, en primer lugar, la posibilidad de realizar un prototipo de proyecto o de
equipar un primer permetro piloto a un coste muy bajo, ya que la suscripcin no es un permiso de
utilizacin y, por lo tanto, no es obligatoria. Esto permite tambin un permetro funcional mejorado mediante
las contribuciones de la comunidad, es decir, de los usuarios, y que responden a las necesidades de los
usuarios.

Pero cuando su uso est relacionado con el core-business o sea primordial, ser preferible recurrir al
soporte contractual del fabricante y a las funcionalidades de la versin para empresas.

Como ya sabr tras una atenta lectura, tres productos se distinguen por su calidad y sus buenas
condiciones para realizar proyectos de GED: Alfresco, Nuxeo y Knowledge Tree, y otros dos que
corresponden a tipologas de proyecto algo diferentes, eXo DMS y Jahia.

Aunque no disponen de las mismas funcionalidades, estos programas rivalizan en cuanto a sus funciones
avanzadas, quedando cubierta por cada uno la base funcional indispensable. Todos disponen de un nivel




Ttulo Gestin Documental, Soluciones Open Source Pgina Pgina 93 de 93

Copyright Cometa Technologies Smile Group Soluciones Open Source Queda prohibida cualquier publicacin sin autorizacin.
de soporte muy bueno, tanto por parte de su fabricante, como de una red de integrantes importante y de su
comunidad. La eleccin se har, por tanto, entre las funcionalidades avanzadas, las cuestiones de
arquitectura tcnica y/o un modelo econmico que permita optimizar el valor de cada proyecto.

Cuando los proyectos de gestin documental tienen componentes Web y/o portales, podr inclinarse hacia
herramientas que disponen de funciones de GED, como Jahia, eXoPlatform o eZ Publish. Cabe sealar,
sin embargo, los mdulos WCM de Alfresco o el Webengine de Nuxeo que aportarn, a partir de ahora,
respuestas interesantes a las problemticas Web.

Nuestro objetivo era no slo presentar las soluciones sino tambin nuestra visin de la gestin documental.
Esperamos haberles aclarado estas cuestiones y quedamos a su disposicin para poner nuestra
experiencia al servicio de sus proyectos.

Вам также может понравиться