You are on page 1of 37

Multilinguale Informations- und Retrievalsysteme

Dr. Ulrich Kampffmeyer, PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


VOI Verband Optische Informationssysteme, Rodorf bei Darmstadt
Vorsitzender des Vorstandes
PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH
Wachenheim, Hamburg, Darmstadt

Abstract
This paper on multilingual information and retrieval systems with optical mass
storage describes the technical principles of software design. The different layers
and modules from the user interface via transformation modules, thesaurus modules
and fulltext interpretation to database management are explained in detail. Three
examples of multilingual document imaging systems are presented:
- HYPARCHIV

multilingual standard optical filing software for Microsoft


Windows and Novell Netware;

- wfBase

multilingual press and commerce information system base on


four ISDN-knots in Switzerland;

- HEMIS

multilingual information system for CD-ROM distribution on


environmental institutions, projects and programmes of the
UN Environmental Programme UNEP/HEM.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 1 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Gliederung

Seite

1.

Bedeutung multilingualer Softwaresysteme mit optischen Speichern fr


den
europischen
Wirtschaftsraum
3

2.

Software-Design
4
2.1. Struktur und allgemeine Anforderungen
Software
4
2.2 Benutzeroberflche
7

und

an multilinguale

Anwendung

2.3 Transformationsmodule
11
2.4 Auswahllisten
13
2.5 Thesauri
15
2.6 Volltextinterpretation
20
3.

Anwendungsbeispiele
23
3.1 HYPARCHIV
23
3.2 wfBase
26
3.3 HEMIS
29

4.

Ausblick
34

Seite 2 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Bedeutung multilingualer Softwaresysteme mit optischen Speichern fr den europischen Wirtschaftsraum

Europa 1993 ist ein vielbenutztes Schlagwort. Auch nach ffnung der Grenzen und
Beseitigung der Handelshemmnisse bleiben sprachliche und kulturelle Barrieren
bestehen. Diese betreffen alle unternehmen und Organisationen, die in verschiede nen Lndern ttig sind.
Die Sprachbarriere betrifft nicht nur die reine Sprachverstehen- und Sprach-bersetzungsebene, sondern schliet mehrere Ebenen unterschiedlicher Interpretation,
Bedeutung in verschiedenen Zusammenhngen und Umsetzung in Fachnomenklatur
ein. Im Wirtschaftsleben ist nicht die Umsetzung in die Umgangssprache sondern
die Einhaltung "ungeschriebener" Gesetze der Fachsprache ausschlaggebend.
Neben den unterschiedlichen sprachlichen Anforderungen sind Umrechnungen von
Maen und Whrungen, Umstellungen von Formaten (Datum, Adresse, Schreibweisen) etc. erforderlich.
Multilinguale Software ist berall dort erforderlich, wo auf gleiche Information unab hngig von der Art der Quelle zurckgegriffen werden mu. Dies betrifft insbeson dere
- Handelsunternehmen
- Dienstleistungsunternehmen
- internationale Behrden und Organisationen
- Produktionsunternehmen mit Sublieferanten in
unterschiedlichen Lndern
- Kommunikationsunternehmen
- Banken
- Versicherungen
- Kontrollinstitutionen
(Flugsicherung / Polizei / Katastrophenschutz / Umweltdaten)
- etc.
Vielerorts wird die englische Sprache als Standard fr die Kommunikation erachtet.
Die Benutzung einer Fremdsprache kann jedoch zu Fehlinterpretationen fhren,
wenn die genaue Bedeutung von Begriffen und Zusammenhngen nicht bekannt ist.
Umgangssprachkenntnisse sind hier nicht ausreichend. Je komplexer Software und
die zugrunde liegenden Informationen werden, desto komfortabler und umfassender
mu die Untersttzung durch das Programm werden. Dies betrifft insbesondere
Anforderungen an die Gestaltung der Benutzeroberflche, Mitteilungen zur
gegenwrtigen Aktion, Zustands-meldungen, kontextsensitive Hinweise (besonders
bei Fehlbedienung oder kritischen Programmverzweigungen) sowie Hilfetexte.
Letztere mssen als Index wie auch kontextsensitiv zur Verfgung stehen.
Moderne "Windows"-orientierte Programme verfgen in der Regel ber diese Eigen schaften. Wie die meisten Programme sind sie jedoch nur in einer Benutzersprache
gehalten.
ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 3 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Standardsoftware wird heute hauptschlich von wenigen groen Softwarehusern in


den USA hergestellt. Dies bedeutet,da Software und Dokumentation zunchst in
Englisch oder in amerikanischem Englisch vorliegen. Von dieser Ursprungsversion
ausgehend werden verschiedene nationale Versionen erstellt. In Abhngigkeit von
der Bedeutung eines Marktes liegen diese mehr oder weniger verzgert in unterschiedlichen Release-Stnden vor. In einem solchen Standardprogramm sind hufig
die Bildschirm-darstellungen, zugehrige Texte etc. im Hauptteil des Programms
enthalten. Dies macht eine bersetzung mit Anpassung der Darstellung und zustz lichen Tests sehr aufwendig.
Auch wenn auf die gleichen Daten zugegriffen werden kann, ist ein Wechsel der
Benutzersprache whrend der Laufzeit nicht mglich, sondern das anderssprachige
Programm mu zeitaufwendig komplett geladen werden. Auch verfgen die meisten
Standardprograme ber keine integrierte Datenbank oder Ressourcen-ManagementKomponente, die die Verwaltung der verschiedenen Sprach- und Funktionsmodule,
sogar deren Erstellung und Pflege erleichtern wrden.
Herkmmliche Standardsoftware ist daher bereits aus Design-Gesichtpunkten nicht
multilingual ausgelegt. Der vorliegende Artikel beschftigt sich mit multilingualen
Informationssystemen, die auf einer Datenbank basieren.

2 Software-Design
Multilingualitt mu ebenso wie das modulare Zuladen von Programmteilen oder
Funktionen bereits beim Entwurf eines Programms bercksichtigt werden. Die nachtrgliche Umstellung einer vorhandenen Software ist kaum mglich. In einem
solchen Fall eis ein komplettes Redesign unter Einsatz moderner Tools sinnvoller.

2.1. Struktur und allgemeine Anforderungen an multilinguale Software


Multilinguale Software folgt folgenden Designkriterien (Abb. 1):
a

Modulares Design mit klarer logischer und programmtechnischer Trennung der


verschiedenen Ebenen (Benutzerschnittstelle, Hauptprogramm, Ressourcen,
Transformations-Module, Datenbank, etc.) Die Interaktion wird ber Nachrichten (Messages) und globale Variablen gesteuert.

Keine Textkomponente darf in ausfhrenden Programmteilen enthalten, sondern mu ber Variable referenziert sein. Die Umschaltung von einer Sprache
zur anderen erfolgt ber ein globale Variable.

Die Texte werden strukturiert in Ressource-Libraries (Bibliotheken) gehalten


und werden ber Variablen aufgerufen. Diese Bibliotheken mssen einfach zu
pflegen und die Texte zur Laufzeit aufrufbar sowie in der Applikation ladbar
sein.

Alle Teile einer Anwendung mssen ber definierte Schnittstellen verfgen.


Dies betrifft insbesondere die Benutzerschnittstelle, die eigentliche Applikation
und das Betriebssystem sowie die Zusatzmodule der Applikation.

Seite 4 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Applikation, Benutzerschnittstelle und Betriebssystem mssen variable Textfeldlngen und -positionen untersttzen. Diese knnen in Abhngigkeit der
gewhlten Sprache unterschiedlich sein.

Applikation, Betriebssystem, Bildschirm- und Druckertreiber sowie die Datenbank mssen unterschiedliche Fonts, Zeichenstze, Sortierungen, Datumsformate, etc. untersttzen. Voraussetzung ist die Eignung des Betriebssystems.

Multilingual Software - Design Principles


Modular design with clear separation
of user interface, operating system and application (database)
Every text component has to be referenced by a key variable in the application
Resource libraries easy to link and to maintain (i.E. text editor)
Defined interfaces between the user interfaces, operating system
and application modules
Variable textfield positions and field-lengths in the user interface modules
of the application
Support of different sets of fonts, language specific characters,
keyboard layouts, date formats etc. by the underlying operating system
Abb. 1: Designkriterien multilingualer Software

Die multilinguale Anwendung gliedert sich dementsprechend in verschiedene


Module und Ebenen, die miteinander kommunizieren (Abb. 2). Das eigentliche
Anwendungsprogramm, das Teil der Datenbankanwendung sein kann, steuert ber
Nachrichten und globale Variable die Wahl einer Sprache, deren Anzeige (und
Druck) sowie die eigentlichen Recherche- und Umwandlungsfunktionen.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 5 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Principles of Language Display during Runtime


Transformation
Modules

Screen

Language Resources

Text

Field

Thesauri

German

Please select ...

English

Selection
Lists

French
LX

Spanish
LX

Screen

Application

Resource

Database

LX
Data

The language selector (Lx) in the application defines which


resource is used for display and how the information in the
datafield is represented
Abb. 2:

Sprachanzeige whrend der Laufzeit des multilingualen Programmes

Die Variable "Lx" fr "Language Resource" bestimmt, welche Texte angezeigt und
welche Transformationsmodule und Auswahllisten benutzt werden, um eine Eingabe
oder eine Recherche in der angewhlten Sprache zu steuern. Die Information in der
Datenbank selbst wird nicht verndert, nur Anzeige und Ausdruck werden umgesetzt.
Die verschieden Schichten einer multi-lingualen Anwendung sind auf Abb. 3 darge stellt.

Layers and Modules of Multi-Lingual Software


User interface

User interface (Application)

(Windows, Presentation Manager, X-Windows, etc.)


Language
Resources

Transformation
Modules

Selection
Lists

Application

IRS Information Resources Management

Seite 6 von 37

Thesauri

Language
Interpreter

Operating
System

Database

Driver
ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Abb. 3:

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Schichten (1-4) und Module multilingualer Software

Schicht 1 beinhaltet im wesentlichen die Darstellung der Informationen, Schicht 2


dient zur Transformation der angezeigten Informationen von einer Sprache in eine
andere, Schicht 3 verwaltet die Zugriffsinformationen und dient zur Recherche,
Schicht 4 verwaltet die "Dokumente" (Datenstze, Bilder, Grafiken etc.) auf opti schen Speichermedien. Auf die letztgenannte Schicht 4, das IRS Information
Resources Management Programm soll in diesem Artikel nicht nher eingegangen
werden (vergleiche hierzu Kampffmeyer, Ulrich; "Kombinierte WORM- und magnetooptische Massenspeicher und vorgangsorientierte Informationsverarbeitungssysteme", GI Gesellschaft fr Informatik, Arbeitskreis "Datenbanken", Tagung am
19.2.1990, Universitt Oldenburg, 1990). Die einzelnen Ebenen und die darin ent haltenen Komponenten werden im Folgenden erlutert.

2.2 Benutzeroberflche und Anwendung


Die Benutzeroberflche ist in starkem Mae von dem darunterliegenden Betriebssystem abhngig. Viele Betriebssysteme werden den Anforderungen fr multilinguale Software nicht gerecht, da sie zur Laufzeit nicht umkonfigurierbar sind und
keine internationalen Zeichenstze sowie Formate untersttzen. Fr multilinguale
Anwendungen sind Betriebssysteme mit einer grafischen Benutzeroberflche wie
Microsoft Windows, OS/2 Presentation Manager oder Oberflchen, die auf
XWindows basieren (OSF Motif, OpenLook u.a.) gut geeignet. Sie gestatten die
Kontrolle der Bildschirmanzeige weitgehend unabhngig vom eigentlichen Betriebs system.
Es ist grundstzlich zwischen
a)

der Standard-Windows-Oberflche und

b)

der auf Basis dieser Oberflche realisierten anwendungsspezifischen


Benutzeroberflche zu unterscheiden. Letztere benutzt die Mittel, die von der
Standardoberflche bereitgestellt werden, um die Funktionen der Applikation
darzustellen.

Eine grafische Oberflche bietet zahlreiche Vorteile: Vom verringerten Lernaufwand,


integrierte Hilfefunktionen bis zur einfachen Benutzerfhrung, die wahlweise ber
Mausaktionen, Anwahl aus Menleisten oder Tastaturkombinationen steuerbar ist.
Ein besonderer Vorteil von Windows-Oberflchen ist die frei skalierbare Gre von
Fenstern und anderen Anzeigen.
Es ist wenig sinnvoll fr multilinguale Anwendungen alle Anzeigen in der Applikation
mit einer eigenen Benutzeroberflche zu realisieren, da dies die Zahl der einsetz baren Bildschirm- und Druckertreiber einschrnkt. Die Benutzeroberflche der
Applikation sollte soweit mglich auf Standardroutinen der Windows-Oberflche
zurckgreifen.
ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 7 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

An die Benutzeroberflche (Standard-Windows und Anwendungsoberflche) sind


folgende Anforderungen zu stellen (Abb. 4 und 5):
a)

Umschaltbarkeit der Tastaturbelegung whrend der Laufzeit gesteuert durch


die Applikation

b)

Umschaltbarkeit der Bildschirmdarstellung whrend der Laufzeit gesteuert


durch die Applikation

c)

Anzeigemglichkeit von spezielle Zeichenstzen (z.B. Deutsch: , , , ;


Franzsisch: , , , ; Spanisch: ; Dnisch: , , ; Ungarisch: , , ;
Griechisch: , , ; etc.)

d)

Umschaltbarkeit von Formaten whrend der Laufzeit (z.B. Datum, Whrung,


Zeit, etc.)

e)

Automatische Anpassung der Anzeige am Bildschirm in Bezug auf unterschied liche Textlngen, Sonderzeichen, Fonts, etc. Die Anpassung mu in Abhngigkeit der verfgbaren Bildschirmauflsung durchfhrbar sein.

f)

Sprachabhngige, kontextsensitive Hilfe in Abhngigkeitder Position auf dem


Bildschirm, des aktuellen Programmzustandes und der durchgefhrten oder
durchfhrbaren Aktion.

g)

Zuladbare Module whrend der Laufzeit, ohne das Programm zu verlassen.

Operating System and User Interface


Requirements for European Software
The operating system and Window Interface must support several features
to enable switching the language during runtime
Change of keyboard setting and screen display during runtime via external program
Enhanced keyboard setting with special characters:
European languages ( , , , , , , etc. ).
Support and change during runtime of date and time formates
Graphic Interface with virtual Window architecture to allow different sizes
of screens and fields while changing the language
Context-sensitive help in relation to the actual position of the cursor
Abb. 4:

Betriebssystem und Benutzerschnittstelle

Seite 8 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

User Interface (application)


Requirements
The user interface has to support several functions to enable change of
language during runtime
Object oriented software
Change of screens, settings and styles during runtime
Dynamic positioning of fields
Automatic adaption of different field lengths
Controllable by the application program
Loadable modules during runtime for messages, windows and helptexts
Dynamic data and message interchange with operation system and user interface,
application program and database
Abb. 5:

Benutzerschnittstelle

Wichtigstes Merkmal einer multilingualen Anwendung ist die Umschaltbarkeit


whrend der Programmausfhrung, ohne da ein anderes Programm geladen und
gestartet werden mu und ohne da sich der Bildschirmaufbau und angezeigten
Informationen (inhaltlich) ndern (Abb. 4).
Die einzelnen Textkomponenten werden in separaten Dateien gehalten, sog.
"Resource Libraries" (Abb. 2). Diese werden zur Laufzeit in Abhngigkeit der
Sprachenwahlvariable "L x" geladen.
Vorausbedingung fr die Benutzung von Sprachressourcen ist, da alle Texte in
einem Programm, die angezeigt oder gedruckt werden sollen, durch eine eindeutige
Schlsselvariable mit der zugehrigen Bibliothek referenziert sind (Abb. 2).
"Resource Libraries" werden bentigt fr:
a)

alle statischen Textanzeigen auf einem Bildschirmformular ("Statische" Anzeigen sind Texte wie Beschriftungen, die sich erst beim Wechsel des Bildschirmformulars ndern). Dies sind Texte, die in der Regel mit einem bestimmten
Bildschirmformular fest verbunden sind.

b)

dynamische Textanzeigen auf dem Bildschirmformular, die sich in Abhngigkeit


des Zustandes verndern oder einblenden (Messages). Hierzu gehrt auch
das "Ausgrauen" von nicht aktiven oder auswhlbaren Funktionen auf dem
Bildschirmformular (Schaltflchen) und in Menauswahllisten.

c)

Hilftexte, die automatisch erscheinen oder interaktiv abgerufen werden


(Helptexts).

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 9 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

d)

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Fehlermeldungen, Systemmeldungen und andere Hinweismeldungen, die


aktionsbezogen erscheinen.

Language Resources
Requirements
Language resources are used for displaying texts related to the unique keys in
the application
Loadable modules for each language
Every entry in the language resource is referenced by a unique key
which may be used by different applications and the database itself
Language resources are needed for
Every text on a entry or search screen form
Every message
Every helptext
Icons adapted for each country
Editor or tools for translation support
Abb. 6: Sprachressourcen

Viele Anwendungen benutzen Icons (Sinnbilder) und Schaltflchen zur vereinfachten


Anwahl von Funktionen. Sind sie mit Texten versehen oder durch Buchstaben (als
Abkrzung) gekennzeichnet, so mssen auch diese Icons bei einem Sprachwechsel
umgeschaltet werden. Es empfiehlt sich daher, auch die Sinnbilder in eigenen
Ressourcen-Bibliotheken zu halten und nicht direkt im Programm zu verwalten.
Gleiches gilt auch fr Icons mit Grafiken, wenn die Grafik Dinge zeigt, die in einem
anderen Sprachraum oder Land, nicht mit der gezeigten Funktion des Icons
verknpft werden.
Objektorientierte Programmiersprachen und Datenbanken untersttzen hufig die
Benutzung von ladbaren Ressourcen und sind deshalb herkmmlichen Tools vorzuziehen.
Fr die Erstellung der eigentlichen Anwendung, die sich auf eine Programmiersprache oder eine Datenbankprogrammiersprache sttzen kann, ist die Wahl des
geeigneten Tools wichtig. Die Anwendung stellt die bergreifende und integrative
Komponente im gesamten System dar (vgl. Abb. 2 und Abb. 7). Die Applikation
beinhaltet nicht nur die blichen Algorithmen zur Datenverarbeitung und Module fr
Ein- und Ausgabe, sondern ebenfalls die Steuerung und Auswahl der Sprachressourcen (Transformationsmodule, Auswahllisten, Thesauri, Hilfetexte, Mitteilungen und Hinweistexte, Bildschirmaufbau und -anzeige, etc.).
Seite 10 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Application
Characteristics
Numeric keys for every text entry related to the screen display and database fields
Direct control of database and user interface
Object oriented message driven program
Transformatters, selection lists, thesauri, language interpretors and
language resources as loadable modules
Database as loadable module or server-client-communication via SQL
Abb. 7:

Anwendungskomponente

Objektorientierte Programme mit einem "Message"- Konzept, wie es z.B. Microsoft


Windows beinhaltet, erlauben die stndige Kontrolle ber die verwendeten Ressourcen und den Zustand der Bildschirmanzeigenzeige. Fr die Kontrolle der Module auf
Ebene 2 (vgl. Abb. 3) sollte eine direkte Kommunikation aufgebaut werden. Fr die
Kommunikation mit der Datenbank, in der die eigentlichen Information verwaltet und
gehalten wird, kann SQL als standardisierte Kommunikationsschnittstelle benutzt
werden. Alle Module der Schichten 2, 3 und 4 (vgl. Abb. 3) sollten whrend der
Laufzeit direkt aufrufbar oder zuladbar sein.

2.3 Transformationsmodule
Die numerischen Informationen in der Datenbank werden in einem Format abgelegt,
da bei Bedarf fr eine bestimmte zugeladene Sprachressource gewandelt wird.
Diese Wandlung wird ebenfalls durch die Variable "L x" gesteuert (Abb. 2). Transformationsmodule sind wesentlich einfacher als Textbersetzer zu realisieren, da sie
nach genauen Regeln und nur mit numerischen Werten arbeiten (Abb. 8).

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 11 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Transformation Modules
Types
Transformation modules are used for the display transfomation
of numeric values of the database

Abb. 8:

Transformation of date formates

(supported by operating system)

Transformation of time formates

(supported by operating system)

Transformation of addresses

(position of postal codes, etc. )

Transformation of units of measure

(litre to gallon, km to mile, etc. )

Transformation of international standardized


nomenclature

(country and city names, etc. )

Transformation of user-defined values

(see selection lists, etc. )

Transformationsmodule

Die wichtigsten Standard-Transformationsmodule sind:


a)

Datumsformatumwandlung
Dieses Modul wandelt die Anzeige zwischen amerikanischen (Monat-Tag, Jahr)
und europischen (Tag-Monat-Jahr) Format um. Diese Funktion wird hufig
direkt vom Betriebssystem untersttzt und erlaubt auch die volle oder
abgekrzte Verwendung des Monatnamens. Das Transformationsmodul sollte
auch fr die Umwandlung von Datumsformaten vor dem Jahr 2000 auf das
neue Jahrtausend hin ausgelegt sein. Dies ist wichtig fr alle Datenbestnde
mit Aufbewahrungspflichten von 7 Jahren und mehr. Das Datum-TransferModul mu ebenfalls fr die richtige Sortierung bei der Anzeige sorgen.

b)

Zeitformatumwandlung
hnliches wie fr die Datumsformate gilt fr die Transformation von Zeiten und
deren Anzeige. Fr international agierende Unternehmen empfiehlt sich die
Speicherung von Zeitdaten im "coordinated universal time"-Format (UTC).
Datum- und Zeittransformationsmodule knnen so ausgelegt werden, da sie
prfen, ob die interne Zeiteinstellung des Systems korrekt ist (das aktuelle
Datum/Zeit mu immer jnger sein als das zuletzt gespeicherte Dokument;
Abgleich mit Standard-Arbeitszeiten und Werktagen; etc., um gegebenenfalls
des Ausfall der Systemzeit festzustellen und zu melden).

c)

Adressen-Transformation
Die Adressenformat-Transformation betrifft mehr den Ausdruck als die Anzeige
am Bildschirm. Postanschriften sind in Europa nicht standardisiert und
benutzen unterschiedliche Reihenfolgen von Strae, Hausnummer und Post-

Seite 12 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

leitzahlen. Das Transformationsmodul erkennt, welches Land bei einem


Anschreiben gewhlt ist und stellt fr den Druck das richtige Adressformat ein.
d)

Transformation von Werten


Fr international ttige Handels- und Produktionsunternehmungen stellt die
Transformation von Ma-, Entfernungs- und anderen Werten eine wichtige
Anforderung dar. Dies soll an einem Beispiel erlutert werden:
In der Minerallindustrie werden tglich groe Mengen unterschiedlicher lsorten und lprodukte transportiert und zwischengelagert. Je nach Art, Gewicht
und Temperatur ndern sich Werte sowie davon abhngig Zoll- und Steuerstze. Besonders bei grenzberschreitendem Verkehr ist daher eine Umwandlung in die landesblichen Einheiten erforderlich.
Zu den wichtigsten umrechenbaren Werten gehren Whrungen sowie Entfernungs-, Gewichts- und Hohlmae.

EDI-Daten
Der standardisierte elektronische Datenaustausch (EDI - Electronic Data
Interchange), z.B. EDIFACT, erlaubt die Abwicklung kompletter Geschftstransaktionen auf elektronischem Wege. Hierbei entstehen keine Papieroriginale mehr. Die Daten sind digital zu archivieren. Fr die Anzeige und den
Ausdruck werden EDI-Codes in Texte umgesetzt. Diese Umsetzung in Klartext
kann durch eine Sprachsteuervariable ebenfalls sprachabhngig gemacht werden. Bei EDI-Informationen ist zu bercksichtigen, mit welcher Version einer
bestimmten EDI-Anwendung die Daten zu transformieren sind.

Entsprechend verschiedener branchenspezifischer Anforderungen an eine Applikation knnen weitere Transformationsmodule hinzukommen. Hierzu gehren z.B. die
Umsetzung von Produktcodes in Klartext.
2.4 Auswahllisten
Grafische Oberflchen wie Microsoft Windows untersttzen einfache (single select)
und mehrfach (multiple select) Auswahllisten (Abb. 9). Bei den erstgenannten Auswahllisten kann aus der angezeigten Liste nur ein Eintrag markiert und bernommen
werden. Bei multiplen Auswahllisten knnen einer oder mehrere Eintrge markiert
und bernommen werden.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 13 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Selection Lists
Characteristics
Selection lists are an easy way to translate information
and to spare storage capacity
The list displays a text on the screen related to a database value
Every entry in a selection list refers to a value which is related to a database field
Every entry in the different language versions of a list refers to the same value
The database has to store only the numeric value of the entry
Selection lists can be used as single and multiple-choice lists
Selection lists help to standardize nomenclature in multinational and
multilingual organizations
Abb. 9:

Auswahllisten

Auswahllisten bieten bei Datenbankanwendungen eine Reihe von Vorteilen gegenber Standard-Texteingabefeldern:
a

Auswahllisten vermeiden Tippfehler.

Auswahllisten sorgen fr die Vereinheitlichung der Datenbank und stellen


sicher, da ein eingegebener Eintrag eindeutig wiedergefunden wird. Sie sor gen fr eine standardisierte Eingabe, bei der sich der Benutzer fr einen
bestimmten Begriff entscheiden mu.

Bei Auswahllisten wird in der Datenbank nur eine Referenzziffer zu einer Textressource gespeichert. Dies erfordert wenig Platz, kann in Abhngigkeit einer
Sprachanwahlvariable auf unterschiedliche Textressourcen verzweigen und
beschleunigt das Retrieval der Datenbank, da nur vordefinierte Ziffern und
keine Textsequenzen durchsucht werden mssen.

Multiple Auswahllisten erleichtern die Mehrfachzuordnung eines Dokumentes


und gestatten dem Anwender bei unsicherer Zuordnung zu nur einem Begriff
die zustzliche Anwahl weiterer verwandter Begriffe.

Fr multilinguale Anwendungen ist besonders die Option c) von Bedeutung. Sie


erlaubt durch die Verwendung von Referenznummern die Zuweisung zu mehreren
Listen in unterschiedlichen Sprachen. Weiterhin knnen die Referenznummern auch
fr den Zugriffschutz benutzt werden, indem nur zulssige Begriffe bei einer
Recherche angezeigt werden. Auswahllisten erleichtern auch die Erfassung von
Informationen durch Voreinstellungen fr hufig wiederkehrende Eintrge.
Auswahllisten knnen mit Standard-Texteditoren erstellt werden. Dies sollte jedoch
nur von bestimmten autorisierten Personen geschehen, da nderungen und besonSeite 14 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

ders Lschungen von Eintrgen Merkmalen (Eintrge in einer Auswahlliste) die


Datenbankkonsistenz gefhrden knnen. Bei verteilten Systemen und Ressourcen
ist die Einhaltung von strengen Update- und Pflegerichtlinien unerllich.
Auswahllisten mit kontrolliertem Wortschatz sind das geeignete Medium zur
Standardisierung der Nomenklatur in Unternehmen und zur Schaffung multilingualer
Softwaresysteme. Multilinguale Systeme sollten die freie Texteingabe nach Mglichkeit vermeiden und Auswahllisten - wo immer sinnvoll und einsetzbar - verwenden.
2.5 Thesauri
Der Begriff "Thesaurus" wird sehr unterschiedlich benutzt. Ursprnglich steht er fr
eine definierte Fachnomenklatur, die hierarchisch vom Grobem zum Feinen
heruntergebrochen ist. Die Begriffe sind in der Bedeutung von einander eindeutig
unterschieden und in mehreren Hierarchieebenen gegliedert, wobei mehrere
Begriffe auf einer unteren Hierarchieebene einem inhaltlich bergreifendem Begriff
auf der nchst hheren Ebene zugeordnet sind. Begriffe auf einer Ebene sollten
einen hnlichen Detaillierungsgrad haben.
In vielen aus den USA kommenden Textverarbeitungsprogrammen wird der Begriff
"Thesaurus" fr eine Hilfsfunktion zur Wahl geeigneter Synonyme benutzt. Diese Art
Thesaurus hat nichts mit der strukturierten Nomenklatur zu tun, wie sie z.B. durch
die International Standardization Organization (ISO) fr einfache und multilinguale
Thesauri festgelegt ist.

Thesauri
Thesauri offer a hierachical structured and crosslinked nomenclature
One field on the screen may be represented by a structured hierarchical thesaurus
Similar to a selection list, the thesaurus displays a text related to a database value
related with this text
The thesaurus offers navigation and interpretation tools
The Thesaurus is a database of itself which relates numeric values to texts
and provides additional structure by hierarchic order and crosslinks
The structure of thesauri is standardized by ISO
The same thesaurus may be used by different applications
Abb. 10: Thesauri

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 15 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Die hier behandelten Thesauri fr multilinguale Programmsysteme verhalten sich


nach auen hnlich wie Auswahllisten (Abb. 10; vgl. auch Abb. 9). Es wird zunchst
eine Liste mit den Oberbegriffen angezeigt (ISO Top Term; TT). Bei der Anwahl eines
Oberbegriffs wird eine zweite Auswahlliste mit den zugeordneten Unterbegriffen
angezeigt (ISO Narrower Term; NT). Wird hier ein Begriff ausgewhlt, so bildet
dieser den Oberbegriff (ISO Broader Term; BT) fr die nchste Ebene von
Unterbegriffen (vgl. Abb. 11). Diese strenge Hierarchie ist auf die wenigsten Sachgebiete voll anwendbar. Der ISO-Standard sieht deshalb auch sogenannte
"Crosslinks" vor. Diese setzen Begriffe auf unterschiedlichen Ebenen und Verzwei gungen unabhngig von der Position in der Hierarchie zueinander in Beziehung.
Dies lt sich mit einem Programmsystem einfacher als in gedruckter Form nachbilden.
Ein elektronischer Thesaurus wird programmintern ebenfalls durch Referenznummern abgebildet (vgl. Auswahllisten). Im Gegensatz zu Auswahllisten sind einem
Eintrag im Thesaurus zustzlich zum "unique Identifier" (eindeutige Schlsselnummer, die in der Datenbank gespeichert wird) die Anzeigeposition (auf welche
Ebene und Verzweigung in der hierarchischen Darstellung der Eintrag angezeigt
werden soll) und die Art (gegebenenfalls auch Art und Richtung) einer Verbindung
als Merkmale zugeordnet. Die Verbindungen erlauben die Zuordnung eines Begriffes
zu mehreren Oberbegriffen anderer Zweige wie auch die Zuordnung als Oberbegriff
zu verschiedenen Unterbegriffen in anderen Verzweigungen unabhngig von der
Position innerhalb der Hierarchie. Die Verwendung unterschied licher Links (unidirektional, bi-direktional, broad-to-narrow, narrow-to-broad, additional reference,
synonym, etc.) macht die Navigation in einem solchem System einfacher. Im Prinzip
stellt ein elektronischer Thesaurus eine eigene Datenbankanwendung dar, die
zwischen Benutzeroberflche und eigentlicher Datenbank geschaltetet ist.
In der Datenbankanwendung wird nur der "Unique Identifier" abgespeichert. Ist
dieser mit einem "Narrower Term" referenziert, knnen ber die Verbindungen und
die Position in der Hierarchie alle zum Begriff gehrigen Oberbegriffe und der "Top
Term" erschlossen werden.

Seite 16 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Thesauri
Hierarchy and Crosslinks
The Hierarchical View of the Thesaurus

Unique identifierPosition in hierarchical view

(Top Term, Broader Term, Narrower Term)


1

1000

1100

1200

1110

1120

1210

1220

1110

The Network Structure of the Thesaurus


(Crosslinks independent of the hierarchical position)
1

1000

1100

8
3

1200

1210

1220

1120

Abb. 11: Hierarchie und von virtuelle Verbindungen (Crosslinks)

Ein elektronischer Thesaurus wird intern als Netzwerk abgebildet (relationales


System), nach auen aber als Hierarchie prsentiert. Die Zusammenstellung einer
Liste von Begriffen ist daher nicht nur vom Oberbegriff, sondern auch von den Verbindungen und dem Weg, auf dem man zum Oberbegriff gelangt ist, abhngig. Im
Gegensatz zu Auswahllisten knnen Listenanzeigen eines elektronischen Thesaurus
je nach Situation unterschiedlich zusammengesetzt sein.
Neben der Navigationshilfe durch die Anzeige der Auswahllisten in Abhngigkeit
eines zuvor gewhlten Oberbegriffs kann ein Datenbank-gesttzter Thesaurus auch
in unterschiedlichen "Spezialisten"- und "Anfnger"-Modi benutzt werden. Bei der
Erfassung von Informationen ist ein "Spezialisten"-Modus sinnvoll, bei dem ein
Unterbegriff oder ein Krzel direkt eingegeben werden kann und die Datenbank
selbstttig die dazugehrigen Oberbegriffe ohne Durchlaufen der Hierarchie
ermittelt. Bei einer Recherche durch Benutzer, die keine Erfahrung mit
hierarchischen Auswahllisten oder mit dem sachlichen Inhalt des Thesaurus haben,
ist ein "Anfnger"-Modus sinnvoll, bei dem die Texteingabe des Benutzers analysiert,
auf einen "Match" im Thesaurus durchsucht wird und im Zweifelsfall durch
Hinzuziehung von Synonym-Listen und Hilfetexten eine Empfehlung zur
Wiederholung oder Konkretisierung der Anfrage angezeigt wird. Eine solche "Global
Search" kann auch ber weitere Felder oder andere zum Thesaurus gehrende
Ressourcen durchgefhrt werden.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 17 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Abb. 12 zeigt, wie mehrere "Scheiben" den eindeutigen Schlsselvariablen der


Thesaurus-Datenbank zugeordnet sind. Jede der Sprachscheiben enthlt auch alle
Informationen, wie die Begriffe hierarchisch und vernetzt angeordnet sind, da die
Ordnung von Sprache zu Sprache verschieden sein kann (Begriffsunschrfen,
feinere oder grbere Unterteilungen). Unabhngig von den Differenzen in der
Sprache mu aber immer die gleiche Information eindeutig auffindbar sein. Neben
dem eigentlichen Begriff (Main Keyword) sind deshalb auch Acronyme (Abkrzungen
aus den Anfangsbuchstaben von zusammengesetzten Begriffen oder Namen),
Homonyme (gleichlautende Begriffe unterschiedlichen Inhalts), Synonyme
(anderslautende Begriffe hnlichen oder gleichen Inhalts), Pluralformen des Begriffs,
etc. sowie eine erklrende Hilfe dem "Unique Identifier" zugeordnet. Bei einer
"Global Search" werden diese mitdurchsucht.
In einer solchen "Sprachscheibe" mu jedoch nicht unbedingt eine Fremdsprache
enthalten sein, es knnen auch unterschiedliche Ressourcen in einer Landessprache benutzt werden. Dies ist sinnvoll, wenn es sich um Fachinformationen
handelt. So kann z.B. in einer "Scheibe" die umgangssprachliche Information enthalten sein, die nur zwei bis drei Ebenen enthlt und Nicht-Fachspezialisten
zugnglich ist, und in einer zweiten "Scheibe" die Fachnomenklatur fein aufge gliedert in weiteren Ebenen, die nur dem Fachmann zur Verfgung steht. Damit lt
sich auch Umfang, Tiefe und Zugriff zur Information steuern.

Thesauri
"Slice"- Model of a Multilingual Thesaurus
German Language "Slice"

Unique
ID
A1
Unique
ID
A2
Unique
ID
A3

...
Unique
ID
An

IDs of preIDs of sucposition in


main key
synonyms, hohelp text
decessors
cessors
hierarchy
wordn
monyms etc.
IDs of preIDs of sucposition in
main key
synonyms, hohelp text
decessors
cessors
hierarchy
wordn
monyms etc.
IDs French Language "Slice"
dec
IDs of preIDs of sucposition in
main key
synonyms, hohelp text
decessors
cessors
hierarchy
wordn
monyms etc.
IDs IDs of preIDs of sucposition in
main key
synonyms, hohelp text
dec decessors
cessors
hierarchy
wordn
monyms etc.
IDs English Language "Slice"
dec
IDs of preIDs of sucposition in
main key
synonyms, hohelp text
decessors
cessors
hierarchy
wordn
monyms etc.
IDs IDs of preIDs of sucposition in
main key
synonyms, hohelp text
dec decessors
cessors
hierarchy
wordn
monyms etc.
IDs of preIDs of sucposition in
main key
synonyms, hohelp text
decessors
cessors
hierarchy
wordn
monyms etc.

...

...

IDs of predecessors

IDs of successors

position in
hierarchy

main key
wordn

synonyms, homonyms etc.

help text

Abb. 12: "Scheiben"-Struktur eines multilingualen Thesaurus

Seite 18 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Der Nutzen einer elektronischen Thesaurus-Datenbank neben der modularen


"Scheiben"-Struktur fr multilinguale Anwendungen ist vielfltig:
a

Standardisierter, kontrollierter Wortschatz sichert das eindeutige und voll stndige Wiederfinden aller korrekt erfaten Informationen.

Eingabefehler werden vermieden.

c)

Auswahllisten und Hilfefunktionen erleichtern die Navigation durch umfangreiche und tiefgegliederte Fachnomenklatur.

d)

Funktionen wie "Global Search" erlauben die Suche auch im Synonym-,


Homonym-, Acronym- und anderen Verweiseintrgen sowie im Hilfetext selbst.

e)

Aufbau und Struktur von Thesauri sind international standardisiert.

f)

Eine Thesaurus-Datenbank arbeitet als "Pre-Processor" und spart Zeit bei der
Suche in der eigentlichen Datenbank, da nur noch kurze, eindeutige
numerische Referenzen durchsucht und ausgewertet werden. Die Umsetzung
der Schlsselzahlen fr die Anzeige erfolgt wiederum durch den Thesaurus.

g)

Thesaurus-Datenbanken knnen auf PC-Rechnern in einem Netzwerk lokal


betrieben werden und entlasten damit als "Pre-Processor" die zentrale Datenbank und das Information Resources Management (IRS; siehe unten und Abb.
3).

Wird zustzlich zur Thesaurus-Datenbank und zur eigentlichen Datenbank eine


Verwaltungssoftware zur Ansteuerung optischer Systeme eingesetzt, so ergibt sich
eine dreistufige Datenbankhierarchie (vgl. Abb. 3 und Abb. 26):
a

Datenbank fr einen oder mehrere Thesauri (lokal oder zentral)

b)

Datenbank zur Verwaltung von Schlsselzahlen zu Auswahllisten und Thesauri


sowie von standard Datenbankeintrgen (numerisch, alphanumerisch, Datum,
Zeit, boolesche Variable, etc.)

c)

Information-Retrieval-and-Access-System (IRAS). In der Regel eine NonStandard-Datenbank zur Verwaltung nur einmal beschreibarer WORM-Medien,
wiederbeschreibarer optischer Speicher (Erasable, Rewritable, M/O) oder nur
lesbarer Speicher (CD-ROM).

Fr eine Thesaurus-Datenbank kann ebenso wie fr die eigentliche Anwendung eine


Standard-Datenbank eingesetzt werden (vorzugsweise eine relationale Datenbank).
Volltext-Datenbanken sind fr diese Art der Anwendung nicht geeignet (Abb. 13).

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 19 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Database
Characteristics
Standard relational database may be used to manage data
(except for language interpretation)
Support of optical disk information retrieval system for mass data management
Standard fulltext database are not usable
Abb. 13: Merkmale fr das Datenbanksystem

2.6 Volltextinterpretation
Die elektronische Interpretation und bersetzung von Volltext folgt gnzlich anderen
Strategien als die bisher beschriebenen Techniken. Transfomationsmodule, Auswahllisten und Thesauri lassen sich beliebig kombinieren und in einem System vereinigen, da sie alle nach der gleichen Regel arbeiten: numerische Kennziffern
werden nach festgelegten Regeln eindeutig in vordefinierte, kontrollierte Begriffe
oder andere Werte umgesetzt.
Ein System, das die Analyse von Volltext erlaubt, ist nur schwer mit den vorge nannten Modulen zu kombinieren. Es ist ein eigenstndiges komplexes Softwaresystem, das sich aus verschiedenen Komponenten zusammensetzt (Abb. 14 und
15):

Seite 20 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Language Interpreter
Characteristics
The language interpreter contains different modules which allow
translation and interpretation of fulltext databases.
Dictionaries provide information for the direct translation of nouns
(singular, plural, conjunctions, etc.)
Statistical modules support the interpretation of the noun inside a text
Linguistic modules support the interpretation of the grammatical context
Comparision modules combine the different strategies of interpretation
Presentation modules display the answer of a query in the chosen language
as translated fulltext
Inverted file and cache modules optimize access
Abb. 14: Merkmale eines Sprachinterpretationssystems

Language Interpreter
Structure
User Interface
Entry

Query
Display

Dictionaire
Modules

Statistic
Modules

Linguistic Presentation
Modules Modules

Comparision

Inverted File

Language
Interpreter

Database

Abb. 15: Struktur eines Sprachinterpretationssystems


ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 21 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Wrterbuchkomponenten beinhalten die einzelnen Worte in verschiedenen


Formen (Plural, Singular, Konjugation, Deklination, irregulre Verben, etc.) Das
Wrterbuch stellt in der Regel eine eigene Datenbankanwendung dar. Es ist
jedoch grundverschieden in Struktur, Aufbau und Inhalt des zuvor diskutierten
Thesaurus.

b)

Statistik-Module analysieren das Vorkommen und die Zusammensetzung von


Worten und Wortkombinationen.

c)

Linguistik- und Grammatik-Analyse-Module stellen den am schwierigsten zu


realisierenden Teil dar. Sie beinhalten alle Regeln und Vergleichsbeispiele fr
die Analyse der Syntax. Hierfr werden hufig Techniken der Mustererkennung
(Pattern Recognition) und Fuzzy Logic eingesetzt.

d)

Die Ergebnisse der drei Module a), b) und c) werden in einem Vergleichsmodul
zusammengefhrt, gewertet und interpretiert. Das Vergleichsmodul ist so konzipiert, da es Zwischenergebnisse eines Moduls zur Auswertung an ein anderes
Modul zurckgeben kann. So entsteht ein iterativer Proze mit einer relativ
hohen Erkennungsrate bei fachbezogenen Texten, fr die es spezielle
elektronische Wrterbcher mit der Fachnomenklatur gibt.

e)

Da herkmmliche Datenbanken aufgrund ihrer Architektur mit der zeitintensiven


Volltextauswertung wenig effektiv sind, werden hufig spezielle "Cache"- und
"Inverted File"-Module zwischengeschaltet.

f)

Prsentations- oder Darstellungsmodule sorgen fr die korrekte Wiedergabe


der bersetzten Texte am Bildschirm. Sie werden mit Informationen aus dem
Wrterbuchmodul, dem ausgewerteten Text aus der Datenbank und dem
"Inverted File"-System gespeist.

Das beschriebene Volltextinterpretationssystem kann zur Auswertung von KlartextAnfragen benutzt werden. In Abb. 15 ist der Bearbeitungsweg fr eine Anfrage
dargestellt. Bei der Umsetzung eines Textes aus der Datenbank werden die Module
in gleicher Weise von unten nach oben durchlaufen. Die vorgestellte Lsung stellt
nur eine mgliche Konfiguration dar. Da diese Technik sehr neu ist, werden auch
zahlreiche andere Anstze verfolgt. Der hier vorgestellte Ansatz hat den Vorzug, da
zugleich verschiedene Module mit unterschiedlichen Auswertungsstrategien durchlaufen werden. Jedes Modul kann zudem auf bestimmte Sprachen oder Fachnomenklaturen spezialisiert und bei Bedarf automatisch vom Vergleichsmodul zugeschaltet werden. Die Interpretation und bersetzung eines Textes ist sehr zeitaufwendig und in der Regel nur auf schnelle Dialog-Rechnern mglich. Komplexe
Systeme wie das beschriebene sollten nicht mit einfachen bersetzungshilfen
verwechselt werden.
Herkmmliche Volltextdatenbanken sind fr solche Systeme selten geeignet. Die
Strategie bei Standarddatenbanksoftware ist, Fllworte, Adjektive, Adverbien etc.
wegzulassen, um Speicherplatz zu sparen, sowie die Geschwindigkeit der Datenbank zu erhhen. Bei einem sprachinterpretierenden System werden jedoch alle
Informationen des Textes bentigt, da ansonsten keine zusammenhngende und
kontextbezogene bertragung mglich ist.

Seite 22 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Erste Erfolge mit dem Einsatz von "Language-Interpreter"-Datenbank-Systemen


wurden bei der UNO und der Europischen Kommission erzielt.
Die Wahl einer Strategie fr multilinguale Datenbankanwendungen ist heute noch
einfach:
a

Fr Dokument-orientierte (Faksimile) Systeme, Anwendungen mit kontrolliertem


Wortschatz und Systeme, die zu einer Standardisierung der Benutzung fhren
sollen, ist der Ansatz mit Transformations-, Auswahllisten- und ThesaurusModulen zu whlen.

b)

Fr Anwendungen im Volltextbereich, die nicht innerhalb der nchsten drei bis


vier Jahre in den Produktionsbetrieb gehen sollen, ist die Erprobung oder
Beschftigung mit dem hier beschriebenen Ansatz sinnvoll.

Kommerziell nutzbare, sofort einsatzfhige Standardsoftware existiert zur Zeit weder


fr a), noch fr b). Auch in Zukunft ist nicht mit "Off-the-shelf"-Lsungen zu rechnen,
da die Art der Anwendung und die zu verwendende Nomenklatur immer nderungen
erfordern wird.
Ideal ist jedoch nach Meinung des Verfassers ein Ansatz, wie er in Abb. 3 dargestellt
ist. Hier sind die verschiedenen Umsetzungs- und Interpretationskomponenten in
einer Schicht zusammengefat und arbeiten parallel. Sie verbinden die Benutzeroberflche mit der eigentlichen Datenbank. Ein solcher integrativer Ansatz verbindet
die Vorzge aller genannten Techniken, die in einer Anwendung nach Bedarf einzeln
oder kombiniert eingesetzt werden knnen.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 23 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

3. Anwendungsbeispiele
Anhand von drei Beispielen sollen multilinguale Informations- und Retrievalsysteme
anwendungsorientiert erlutert werden:

Application Examples
HYPARCHIV

Standard optical filing software


for Microsoft Windows in 9 languages

wf Base

Distributed press and commercial information system


in 4 languages based on ISDN-Knots
(wf, Switzerland)

HEMIS

Meta-database and information system for


environmental data;
Informations, programmes, methods, etc.
for CD-ROM-distribution
(UNEP/HEM, worldwide)

Abb. 16: Anwendungsbeispiele

HYPARCHIV

Standard "Document-Imaging"-Software fr Microsoft Windows

b)

wfBase

Presse- und Wirtschaftinformationen in einem verteilten


"Document-Imaging"-System

c)

HEMIS

Umweltinformationen auf CD-ROM

3.1 HYPARCHIV
HYPARCHIV ist ein vollstndig in Deutschland entworfenes und programmiertes
Archivierungssystem fr Faksimile-Dokumente und Dateien. HYPARCHIV wird als
Einzelplatz- und als Netzwerkversion in allen wichtigen europischen Sprachen
angeboten. Es untersttzt zahlreiche Scanner, Drucker, "Image-Boards" und
optische Speicher (WORM, M/O, Jukeboxen). Weitere Module erlauben die automatische Indizierung von Dateien (COLD), Faxversendung und Empfang, Datenaustausch mit externen Datenbanken, Dokumentenaustausch zwischen verschiedenen HYPARCHIV-Systemen und zustzliche Datensicherung (Kryptographische Kodierung). Zur einfachen Generierung von Anwendungen existiert ein
"WYSIWIG"-Editor.
Seite 24 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Die Auswahl der Beispiele aus einer Vielzahl anderer erfolgte auf Basis der vom Autor selbst
durchgefhrten Projekte. Als Marketing- und Sales-Manager sowie Systemberater der ACS
Systemberatung GmbH war der Verfasser von 1989 - 1992 fr Design, Entwicklung und Vermarktung
von HYPARCHIV, sowie in den Jahren 1990 - 1992 fr das Design und Projektmanagement von
wfBase verantwortlich. Seit 1990 betreut der Verfasser das HEMIS-Projekt.

HYPARCHIV

ACS Systemberatung GmbH, Germany

European standard for PC-based optical filing software


Optical filing software for Microsoft Windows 3.1
supporting various scanners, printers, optical disks and jukeboxes
Novell Netware 3.11
Server-client-architecture, object-oriented design
Triple Access: Hierarchy with icons, relational database and hyperlinks
Multi-lingual user interface, available in English, US-English (with icons for
Folders, Cabinets, etc.), French, German, Dutch, Swedish, Greek, Hungarian,
Spanish, Portuguese, etc.
User interface, messages and help switchable during runtime
Selections in different languages locally available, but not direct multi-lingual
database support (multi-lingual thesaurus available in1993 with new
server / client solution)
Abb. 17: Merkmale von HYPARCHIV

Das Programm besitzt eine grafische Benutzeroberflche, die Ordnungsmittel und


Funktionen ikonisiert darstellt. HYPARCHIV gestattet mehrere frei kombinierbare
Zugriffs- und Informationsverwaltungstechniken:
a

Hierarchische Ordnung mit Aktenschrnken, Ordnern, Mappen, etc.

b)

Datenbank, formulargesteuert mit "Query by Example" (QBE). HYPARCHIV


untersttzt mehrere Anwendungen gleichzeitig mit Umschalten der Datenbank
whrend der Laufzeit.

c)

Hyperlinks zur virtuellen Verbindung von Objekten (Notizen, Ordnungsmittel,


Dokumente und Dateien)

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 25 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

HYPARCHIV
Iconized Electronic Desktop

Abb. 18: Der grafische "elektronische Schreibtisch" von HYPARCHIV (angewhlte Sprache:
Deutsch)

HYPARCHIV untersttzt die Multilingualitt nur an der Benutzeroberflche: Menues,


Hilfetexte, Meldungen, Ikonen, Knpfe, Dokumentbeschriftungen, etc. werden
whrend der Laufzeit durch eine einfache Menu-Anwahl umgeschaltet. Der
"elektronische Schreibtisch" und der Zustand des Systems ndert sich nicht. Die
komplette Systemumschaltung dauert ca. 2 Sekunden inklusive Anpassung aller
Texte, Fenster und Ikonen auf dem Bildschirm. Fr Datenbankmasken (Bildschirmformular) knnen mit Einschrnkungen Arbeitsplatz-bezogen auch verschiedene
Auswahllisten hinterlegt werden, die auf die numerischen Schlssel des gleichen
Datenbankfeldes referenzieren. Dadurch ist eine eingeschrnkte Multilingualitt
auch fr die HYPARCHIV-Datenbank gegeben.

Seite 26 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Abb. 19 zeigt eine dreisprachige Pressearchivanwendung. Hier sind auf der Datenbankmaske die Texte in allen drei Sprachen angegeben. Die Schaltfelder
"Documentation", "Press review" und "Bibliography" verzweigen auf Untermasken.
Hinter den Feldern "Sachgebiet" und "Schlagworte" liegen Auswahllisten, die lokal in
jeweils einer der drei Sprachen vorgehalten werden. Alle anderen Feldinhalte
werden nicht bersetzt und erscheinen in der Eingabesprache.

HYPARCHIV
Trelingual database application form
The database form
contains several
multiple selection
lists in English,
French and German
and displays the
entries in the
selected language.
Other information is
available only in the
language of data
entry

Abb. 19: Dreisprachige Datenbankmaske einer Pressearchivanwendung fr HYPARCHIV

Von HYPARCHIV ist inzwischen auch eine Client-Server-Version mit einem multilingualen Thesaurus verfgbar. Die letztgenannte Version wird jedoch nicht als
Standardprodukt vertrieben. Die verfgbare Standardversion HYPARCHIV NET fr
Novell-Netzwerke wird in Europa bereits mehr als 200 mal eingesetzt. Von der
Einzelplatz- und der STARTER-Version wurden mehrere tausend verkauft.
HYPARCHIV hat sich damit zum europischen Standard fr Windows-basierte
"Optical-Filing"-Systeme entwickelt.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 27 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

3.2

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

wfBase

wfBase ist eine individuelle Applikation, die fr die Schweizer Wirtschaftsfrderung


(wf) entwickelt worden ist. wfBase befindet sich seit 1992 im Produktionsbetrieb.
Die Zentrale der Schweizer Wirtschaftsfrderung (wf) ist in Zrich. Auenstellen
befinden sich in Genf, Bern und Lugano. Vor der Einfhrung von wfBase wurden an
allen vier Orten Dossiers ber politische Ereignisse, Wirtschafts daten, etc.
unabhngig von einander gefhrt. Ziel von wfBase ist, allen internen Benutzern
Zugriff auf Presseartikel, Zeitschriften und selbst erzeugtes Schriftgut unabhngig
von der Eingabesprache zu ermglichen (vgl. Abb. 20 und 21).

wfBase

wf Schweitzer Wirtschaftsfrderung
Swiss Institute for Commercial Development
Zrich - Geneva - Bern - Lugano

The wf owns one of the largest archives on commercial and political topics in
Switzerland. It provides information to politicians, journalists and its commercial
members representing all major companies of Switzerland.
Optical filing system for press and commercial documents
(scanned and created via word processor, sreadsheet, etc. )
Distributed system linked via SwissNet 2 (ISDN)
Access for wf-employees and third-party partners via multilingual graphic
user interface (ISDN and telephone modem)
Database with 4-lingual thesaurus
Access to information independent of the language in which it was entered
Several mil ion documents stored on M/O-Jukeboxes (2 times 50 gigabyte)
Integrated bureau communication with textprocessing, spreadsheet, FAX,
library management, electronic mail, accounting, address database, etc.
Abb. 20: wfBase - Ausstattung und Merkmale

Seite 28 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

wfBase
Storage and Communications Layout
Zrich
Images, Files & Descriptors
Read / Write / Create

Harddisk Cache

wf-User

Lugano
Images, Files & Descriptors
Read / Create

Harddisk Cache

wf-User

Geneva
Images, Files & Descriptors
Read / Create

Harddisk Cache

wf-User

Bern
Images, Files & Descriptors
Read / Create

Abb. 21: wfBase -

Jukebox
External Use

Harddisk Cache

wf-User

Novell
Netware

Jukebox
Internal Use
Addresses
Library
Dossiers

DB Server
ISDN

Zrich

SwissNet 2

Archive - Server

Zrich
ISDN
SwissNet 2

Communications Server

Zrich
ISDN
SwissNet 2

ISDN

&

Telephone
Modem

External User
Harddisk Cache

Systemkonfiguration mit internen und externen Teilnehmern sowie Informationsverwaltung in zwei Jukeboxen (Zrich)

wfBase integriert unter seiner grafischen Oberflche auch andere Anwendungen


zustzlich zur Dokumentenverwaltung. Hierzu gehren Textverarbeitungs- und
Spreadsheet-Anwendungen, Adress- und Bibliotheksverwaltung, Abrechnung fr
externe Nutzer des Systems, elektronischer Faxeingang und -ausgang, elektronische Posteingangs- und Ausgangskrbe, etc. wfBase benutzt Module von
HYPARCHIV, ist im brigen aber eine eigenstndige Anwendung mit Client-ServerArchitektur und einer relationalen Datenbank auf einem OS/2-Server. Die
Arbeitspltze unter Microsoft Windows sind in einem Novell-Netzwerk
zusammengeschlossen. Auer den internen Nutzern knnen auch Dritte sich in
wfBase ber Modem einwhlen, Dokumente ("Subset") abfragen, lokal anzeigen und
drucken oder per Fax sich senden lassen.
Die vier Standorte der wf sind ber Hochleistungs-SwissNet2 (ISDN) miteinander
verbunden (vgl. Abb. 21). Dies erlaubt auch die bermittlung von komprimierten
gescannten Faksimiles. In zwei Jukeboxen sind neben gescannten Faksimiles auch
selbst erzeugte Dateien und eingegangene Faxmitteilungen gespeichert. Das
System ist weitgehend fehlertolerant und ausfallsicher ausgelegt.
Kernstck von wfBase ist die Datenbank mit einem viersprachigen Thesaurus fr die
Sachgebiets-Klassifikation (Deutsch, Franzsisch, Italienisch und Englisch). Der
Thesaurus beinhaltet ber 2.000 Sachgebiete, die hierarchisch und in einer LinkStruktur in vier Ebenen gegliedert sind.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 29 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

wfBase
Multilingual Thesaurus
The two images show dif erent views of the thesaurus for thematic
keywords (here in German). The thesaurus supports the user in navigation,
jump-functions, short-key-entries, synonym-retrieval and other techniques for
easy-to-use access.

Screen I
Screen I
aus Vortrag Online 92 aus Vortrag Online 92
Thesaurus-Maske
Sachgebiet

Thesaurus-Maske
Sachgebiet

fr Vortrag auf Folie


einkleben

fr Vortrag auf Folie


einkleben

Abb. 22: wfBase - multilingualer Thesaurus. Die Abbildung zeigt zwei Fenster der Bildschirmdarstellung des Thesaurus. Links ist angezeigt, wie von einem Oberbegriff auf eine Liste von
Unterbegriffen verzweigt wurde. Der Thesaurus beinhaltet die in den Dossiers erfaten
Sachgebiete

Neben dem Thesaurus existieren Auswahllisten fr andere Felder sowie Text- und
Dateneingabefelder. Mit der Datenbank knnen die Dokumente unabhngig von der
Sprache, in der sie erfat wurden, gefunden werden. Die Anzeige erfolgt jedoch in
derjenigen Sprache, in der das Dokument erzeugt wurde. In einem multilingualen
Staat wie der Schweiz ist die bersetzung des Inhaltes nicht erforderlich. Ziel von
wfBase ist vielmehr die Kommunikation zwischen den wf-Standorten zu verbessern,
Adress- und Dokumentenbestnde zu vereinheitlichen, Redundanzen abzubauen
und Dritten (Mitgliedern der wf-Trgerschaft) einen einfachen, Zeit- und Kostensparenden Zugriff zu erlauben.

Seite 30 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

3.3 HEMIS
Die Vereinten Nationen haben im Rahmen ihrer Umweltorganisation (United Nations
Environmental Programme - UNEP) eine Instituion zur Harmonisierung von Umweltmemethoden, -vorhaben, -projekten und -informationen gegrndet (UNEP/HEM Harmonization of Environmental Measurement). Im Mnchner Bro von UNEP/HEM
wird seit 1990 ein Projekt zur Schaffung eines Informations- und Meta-Daten banksystems durchgefhrt (HEMIS - HEM Informations System). HEMIS soll in
Bezug auf Umweltforschung, Umwelt-"Monitoring" und Umweltschutz einen berblick ber
a

Laufende Projekte im globalen und nationalen Umfang der UN, anderer inter nationaler und groer nationaler Organisationen im Umweltbereich,

b)

Institutionen, Forschungsschwerpunkte, Periodika und leitende Mitarbeiter,

c)

Methoden, Referenzmaterialien, etc.,

d)

Datenbanken, Datenformate, Datenqualitt, Zugang, etc.

geben (vgl. Abb. 27). Die in HEMIS enthaltenen Informationen sind Meta-Daten, die
aus den unterschiedlichsten Quellen kompiliert werden (vgl. Abb. 23 und Abb. 27).

HEMIS

UNITED NATIONS ENVIRONMENTAL PROGRAMME


HARMONIZATION OF ENVIRONMENTAL MEASUREMENT
UNEP / HEM, Nairobi / Munich

The UNEP / HEM Office harmonizes nomenclature, measurements and other


information used worldwide in environmental projects. This task wil be
supported in the future by the HEMIS meta-database and information system,
a multilingual CD-ROM using PC-system.
Multilingual thesauri for scientific nomenclature, countries, climates, etc.
with references, links, synonyms, homonyms, acronyms and wildcard-functionalitity
Harmonization of nomenclature by standardized access to Information
Hyperlinks, guided tours, global search facilities together with the thesaurus
enable easy access to the Information independent of the language of entry
CD-ROM based worldwide distribution
Abb. 23: HEMIS - Informations- und Meta-Datenbanksystem der UN Umweltorganisation UNEP/HEM

Ziel ist die Harmonisierung des Zugriffs auf heterogene Informationen unterschiedlicher Qualitt, verschiedenen Umfangs und aus diversen Quellen.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 31 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Das HEMIS hat zwei Systemkomponenten:


a

In Mnchen wird ein System installiert werden, mit dem alle Informationen
gesammelt, aufbereitet, inhaltlich erschlossen und verwaltet werden. Das
System soll in der Lage sein, aus seiner Datenbank heraus selektierte Berichte
(printouts) und CD-ROM-Datenbanken zu erstellen.

b)

Weltweite Distribution von Auszgen der HEMIS-Anwendung in Mnchen auf


CD-ROM in regelmigen, aktualisierten Editionen.

Beide System werden daher ber unterschiedliche Benutzeroberflchen, Datenbanken, etc. verfgen . Das System a) ist ein Produktionssystem, das im Wesentlichen nur von Mitarbeitern von UNEP/HEM genutzt wird. System b) soll helfen,
international ber Umweltvorhaben zu informieren, Parallelentwicklungen zu
vermeiden sowie Grundinformationen ber Projekte und Datenbanken zu liefern,
auch wenn die Informationen nicht in der Sprache des Benutzers vorliegen.
1

Die HEMIS-CD-ROM soll mglichst attraktiv gemacht werden, damit sie von vielen
benutzt wird und damit auch andere Institutionen, die nicht in das UN-Netz von
Organisationen eingebunden sind, Daten fr das System liefern (Abb. 24).

Harmonization and Distribution of Information via HEMIS


Examples of
sectoral / regional / specialized
sources of
environmental meta-data

Users

INFOTERRA

E M

I S

EARTHWATCH

Institutions

UNEP

ESA
Programmes

EEA-TF
WMO

Databases

Classification
Systems

UN
Methods/
Models

NGOs

Persons

GEMS
IAEA

High Level Data Model

Governments

Others

Abb. 24: Harmonisierung und Verteilung von Informationen mittels HEMIS. Daten auf Papier, Diskette oder CD werden in das stationre HEMIS eingelesen, selektiert und formatiert,
halbautomatisch oder manuell nach einer festgelegten Nomenklatur (Thesauri)
klassifiziert und anschlieend als gedruckte Berichte zu bestimmten Themen oder als
CD-ROM distribuiert. Die Grafik zeigt nur eine Auswahl der beteiligten Organisationen.

1HEMIS

befindet sich Ende 1992 im Design- und Prototypstadium. Nicht alle Komponenten sind
bisher realisiert.

Seite 32 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Hauptkomponente beider HEMIS-Systeme (stationr und CD-ROM) sind mehrere


elektronische Thesauri, die in der Struktur Abb. 11, 12 und 25 folgen.

The Internal Structure of the HEMIS Thesaurus


A

Unique
Identifier
(ID)

IDs of predecessors
(ISO TT, BT,
links)

IDs of followers Main descriptor Position of D


(ISO NT, links) for display in the in the hierarchy
hierarchy of the
thesaurus

Synonyms,
acronyms,
homonyms,
interpretations,
etc. of D

Explanation

Numeric

Numeric

Numeric

Numeric

Numeric

Alpha- numeric

One entry

Up to 64 entries Up to 255 entries One entry

One entry

Up to 255 entries One entry

8 digits

8 digits

8 digits

Sequence of
digits

Sequence of
digits

Up to 20
characters
(due to display
restrictions)

Up to 8 digits
(max. of 8
hierarchy
levels)

Up to 40
Up to 255
characters each characters
sequence of
texts

Internal
management

Internal
mangement

Bidirectional

Unidirectional

Retrievable via
hierarchical
selection list
and
global search

For screen
display
in the
hierarchical
thesaurus
only

Retrievable
via
global search

Unique
reference key
for the
descriptor
database

Alpha- numeric

Available
as context sensitive
help function

Abb. 25: Struktur der HEMIS-Thesauri fr geographische Einheiten, Klimazonen, Sachgebiete


und andere hierarchisch strukturierte Schlsselbegriffe. Erklrungen zu den einzelnen
Eintrgen der ersten Zeile siehe Abschnitt 2.5 sowie Abb. 12).

Die Thesauri und Auswahllisten sind Bestandteil beider HEMIS-Systeme. Im statio nren System dienen sie zur Verschlagwortung von Datenstzen, Dokumenten,
Grafiken, Bildern, etc. sowie zur Suche und Kompilation von Daten. Werden Daten
in zuvor vereinbarten Formaten auf Datentrger angeliefert, so kann die Verschlagwortung teilweise automatisch per Programm erfolgen. In der CD-ROM-Version
dienen Thesauri, Auswahllisten und alle anderen Eintrge nur zur Recherche und
Kompilation von Informationen.

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 33 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Die HEMIS-CD-ROM-Version hat einen mehrschichtigen modularen Aufbau (vgl.


Abb. 26).

HEMIS-System Layout with Multi-Lingual User-interfaces


Additional user interface in different languages

User Interface - (i.e. English)


Query by
example
Standard variables
(alphanumeric,
numeric etc)

Global
search

Thesauri
Selection lists

Numeric keys
related to thesauri and
selection lists

Descriptor database
(field oriented database)

Guided
tours

Links language
translator

Database
of
guided
tour
links

Hyperlinks
(part of
the
stored
objects)

Information retrieval and access system (IRAS)

Objects
Texts Images Datasets

Abb. 26: HEMIS-System-Layout mit multilingualer Benutzerfhrung und Recherche. Die erste
Schicht wird von Benutzerschnittstellen in mehreren Sprachen gebildet. Darunter liegen
verschiedene Module fr unterschiedliche Recherche- und Navigationsstrategien, die
ebenfalls sprachabhngig sind. Neben einer Datenbank verfgt HEMIS ber vorbereitete
"Guided Tours" und "Links". Die Informationen und Dokumente auf der CD-ROM werden
von einem IRAS (Information Retrieval and Access System) verwaltet.

Neben der Suche nach bestimmten Schlagworten oder Begriffen bietet HEMIS
zustzlich die Benutzung von zuvor zusammengestellten "Guided Tours" und individuelle "Links" als Navigationshilfen an. Eine bergreifende Suche ber die Daten bank ("Global Search") ist zwar zeitaufwendig, erlaubt jedoch die Benutzung des
Systems ohne Kenntnis, was sich inhaltlich hinter einem Feld der Recherchemaske
verbirgt. Die Benutzeroberflche kann zwischen verschiedenen ladbaren Sprachen
umgeschaltet werden. Gleiches gilt fr Thesauri, Auswahllisten, Links und Guided
Tours. Freie Texteintrge und gescannte Dokumente werden nicht gewandelt.
HEMIS soll eine erste Information liefern, die dann bei den angegebenen Institu tionen, Datenbanken oder Publikationen vertieft werden kann.

Seite 34 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Abb. 27 zeigt den vorgeschlagenen Startbildschirm des HEMIS-Prototypen mit den


Schaltflchen zum Einstieg in die Bildschirme der Hauptsachgebiete.

Start Screen of the HEMIS-Prototype


Institutions Programmes Databases

Institutions

Methods

Ref. Mat. Guided Tour Thesaurus Location

HEMIS
Environmental Information System

Programmes

Region

Guided Tours
Subject

Thesaurus

Databases

Location

Methods

Region

Ref. Material

Help
EXIT

Choose

Choisir

Whlen Sie

English

Francais

Deutsch

Abb. 27: Haupt- oder Start-Bildschirm von HEMIS (vorgeschlagene CD-ROM-Version)

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Seite 35 von 37

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

4. Ausblick
Multilinguale Informations- und Retrievalsysteme stehen erst am Beginn ihrer Entwicklung.

Conclusions
MultiLingual Information and Retrieval Software
The European Challenge for 1993
Multi-lingual software is a must for all companies and organizations working
in different European Coutries
The American software industry is presently unable to supply multilingual software This is a window of opportunity for European software companies
Multilingual software helps to bridge the national barriers within Europe
Multilingual software is intelligent object-oriented programming
using databases and information management systems as a framework
for huge masses of coded and non-coded information
Abb. 28: Zusammenfassung wichtiger Argumente fr multilinguale Software

Zusammenfassung (Abb. 28).


a

Multilinguale Software ist fr alle Europa- oder Welt-weit agierenden Unterneh men ntzlich, die sich nicht auf eine "Company Language" festlegen wollen.

b)

Multilinguale Software ist in Anstzen als Standardsoftware verfgbar (vgl.


HYPARCHIV, Abschnitt 3.1), mu in der Regel jedoch individuell angepat
werden (vgl. wfBase, Abschnitt 3.2 und HEMIS, Abschnitt 3.3).

c)

Multilinguale Retrievalsoftware kann zur Erschlieung groer Daten- und


Dokumentbestnde auf digitalen optischen Speichern eingesetzt werden.

d)

Multilinguale Thesauri frdern die Standardisierung bei der Klassifikation von


Dokumenten, erlauben einen eindeutigen und strukturierten Zugriff sowie
untersttzen die Recherche nach Dokumenten, die nicht in der Sprache des
Benutzers verfgbar sind.

e)

Multilinguale Volltextretrieval- und -bersetzungssysteme befinden sich im


Probeeinsatz. Zusammen mit anderen Techniken wie Thesauri werden sie in
Zukunft einfach zu benutzende Informationssysteme ermglichen.

f)

Multilinguale Software ist eine Marktchance fr europische Software- und


Systemhuser.

g)

Multilinguale Retrieval- und Informationssysteme knnen in fast allen Wirtschafts- und Verwaltungsbereichen, die grenz- und kulturbergreifend arbeiten,
sinnvoll eingesetzt werden.

Seite 36 von 37

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Dr. Ulrich Kampffmeyer


PROJECT CONSULT GmbH

ONLINE 93 Kongress IV
Copyright PROJECT CONSULT GmbH 1992-1993

Multilinguale Informations- und Retrievalsysteme


Technik und Anwendungsbeispiele

Seite 37 von 37