[Mirrored from: http://DODO.BSN.COM/BSN/BSn/Intros/SGML_gr.html]

SGML / ISO-Standard für Dokumentenverarbeitung
Patrick Thomas, Edward Zimmermann
April 1993
SGML ist ein international anerkannter Standard zur Plattform-unabhängigen Strukturierung von Dokumenten. In dieser Hinsicht besitzt SGML (Standard Generalized Markup Language) das Potential, unternehmensweites Dokumenten-Management ähnlich nachhaltig zu beeinflussen, wie der SQL-Standard zum Durchbruch für relationale Datenbanken wurde. Das kürzlich ins Leben gerufene SGML Open Konsortium vereinigt Firmen wie Frame Technologies, Fujitsu, Novell und Oracle in der Bestrebung, den Anwender von proprietären Dokumenten-Technologien zu befreien.

Von der International Standard Organization (ISO) als ISO/IEC 8879-Standard veröffentlicht, stellt SGML eine hersteller-unabhängige Beschreibungssprache für beliebig komplexe Dokumente dar. Aufgrund der Mächtigkeit der SGML-Konstrukte und der weitreichenden Unterstützung seitens der Softwarehersteller passen sich SGML-definierte Dokumente an heutige heterogene EDV-Strukturen an.

Nicht zuletzt deshalb haben sich bereits Industrieunternehmen wie Lufthansa, BMW und IBM sowie Verlage wie die Bibliographisches Institut & F.A. Brockhaus AG in Darmstadt dem SGML-Standard verschrieben. Diese und zahlreiche weitere Firmen suchen der unternehmensinternen Papierflut Einhalt zu gebieten und stellen die Erstellung, Überarbeitung und Verteilung von Handbüchern, Nachschlagewerken und Formularen auf SGML um. "SGML ist die formale Beschreibungssprache erster Wahl in Unternehmen, wo die Inhalte von Dokumentationen oder Publikationen durch ihren Umfang unübersichtlich sind, komplexe Strukturen aufweisen und häufig aktualisiert werden müssen".

Hierbei werden die Inhalte der Dokumente von der SGML-Beschreibung getrennt. Dies ermöglicht eine Hard- und Softwareunabhängige Verarbeitung von Dokumenten sowie den Aufbau flexibler SGML-Datenbanken. Zwar lassen sich kombinierte Text- und Graphik-Dokumente auch mit Standardprogrammen generieren. In diesen Fällen ist der Anwender jedoch an die Gestaltungsmöglichkeiten der aktuellen Softwareversion und an die generierten Dokumentenstrukturen gebunden. Offensichtlich ist der Inhalt eines Dokumentes langlebiger als Strukturdefinitionen, Font-Größen und Druckformat-Vorlagen, was eine Trennung dieser Komponenten nahelegt. Während SGML keine Aussage über die Repräsentation eines Dokumentes macht, stellt dieser ISO-Standard einen flexiblen Rahmen zur Strukturdefinition von Dokumenten bereit. SGML ist daher kein Ersatz für de facto Standards im Bereich der Satzsprachen wie TeX oder PostScript.

Dem bislang vornehmlich hinter den Kulissen propagierten SGML-Trend folgend, arbeiten führende Anbieter von Standardsoftware-Paketen wie Microsoft, WordPerfect, SunSoft und Netzwerkspezialisten wie Novell an Produkten, die SGML-Dokumente unterstützen. Obwohl Microsoft selbst seit längerem SGML-Konzepte wie beispielsweise bei der Erstellung der Cinemania CD-ROM anwendet, wurde erst kürzlich bekannt, daß an einer SGML-Version des Textverarbeitungsprogramms MS Word gearbeitet wird. Thomas Mühlmann, Program Manager für Textverarbeitungen bei Microsoft in Unterschleißheim, bestätigte gegenüber dem Handelsblatt, daß der Softwaregigant "an einem WinWord-Toolkit zur Konvertierung von SGML-Dokumenten" arbeitet. Laut Mühlmann wurde der Bereitstellung einer entsprechenden WinWord-Erweiterung aufgrund von Kundenanforderungen eine höhere Priorität zugewiesen und ist derzeit für Ende 1993 geplant.

WordPerfect vermarktet bereits ein Konvertierungsprogramm namens Intellitag, daß Textdokumente einer Vielzahl von Formaten analysiert und entsprechende SGML-Dokumente generieren kann. Hierzu wird die Textstruktur, wie sie von anderen Textverarbeitungsprogrammen definiert wurde, erkannt und Textblöcke wie Titel, Kapitel, Unterkapitel nach SGML-Definition markiert. Dies beinhaltet nicht etwa Informationen über den Repräsentationsaspekt eines Textdokumentes, wie Schriftgrößen oder Formatierungen, sondern ausschließlich über den Textaufbau.

Zusätzlichen Auftrieb zur Etablierung von SGML im Massenmarkt erhofft sich die Softwarebranche durch die am 14. April 1993 gegründete SGML Open Vereinigung. Charles Goldfarb, Mitglied des Beratergremiums der neugegründeten Initiative, postuliert die Notwendigkeit eines Umdenkens von einer Dokumenten-orientierten zu einer Inhalts-orientierten Sichtweise: "Das Dokument ist tot. Es war nie mehr als ein Notbehälter für Informationen", formuliert der Erfinder von SGML das Motto der von ihm gestarteten Bewegung. Produktivitätshemmende Beschäftigung mit Aspekten der Repräsentation von Inhalten sollte durch SGML obsolet werden und den Schwerpunkt auf die Inhalte, deren Aktualisierung und Verbreitung verlagern.

Für den Endanwender werden die technischen Finessen der SGML-Definition im wesentlichen transparent gehalten. Lese- und Druckvorgänge auf Dokumenten präsentieren sich dem Anwender wie die Arbeit mit anderen Dokumentformaten. Darüberhinaus ermöglicht die SGML-Strukturdefinition zusätzliche Funktionalitäten wie die Suchbeschränkung auf spezifische Teile eines Textes.

Bei der Erstellung von Dokumenten werden die Implikationen des unternehmensweiten SGML-Einsatzes offensichtlich. Für den Mitarbeiter am PC- oder Workstation-Arbeitsplatz stellen sich SGML-Dokumente als ein Werkzeug zur Konsistenzerhaltung und Refokussierung kreativer Arbeiten dar: Anstatt Dokumente zu erstellen, werden Inhalte in vorgefertige Strukturen eingebunden. In dieser Hinsicht entspricht SGML einer mächtigen Erweiterung abstrakter Formulardefinitionen.

Die hierarchische Struktur von Dokumenten wird, oft unter Einbeziehung von Corporate Identity (CI)-Grundsätzen, im Rahmen sogenannter DTD's (Document Type Definition) spezifiziert. Die Erstellung von unternehmensweit genutzten DTD-Strukturdefinitionen ist die Aufgabe von Expertenteams innerhalb der EDV-Abteilungen. Eine Änderung von Strukturgrundsätzen, denen sich die Dokumente eines Unternehmens unterwerfen müssen, ist somit dank SGML systemneutral und unternehmensweit sehr einfach durchzusetzen.

Wesentliche Anregungen für den Einsatz von SGML kamen aus den USA, wo bereits mehrere staatliche Behörden ihre Dokumentenverarbeitung anhand von SGML vereinheitlichen. Zu den umfangreichsten Implementierungen von SGML-Technologien gehört der Vorstoß des US-Verteidigungsministeriums (DoD), sämtliche technischen Unterlagen von Zulieferern in SGML-Form zu verlangen. Diese DoD-Initiative namens CALS (Computer Aided Aquisition and Logistic Support) stellt einen bedeutenden Schritt im Hinblick auf die Vereinheitlichung und Vereinfachung der Dokumentenverarbeitung einer der größten Behörden in den USA dar.


Patrick Thomas ist bei Fujitsu Personal Systems, Edward Zimmermann bei BSn Basis Systeme netzwerk.

BSn Basis Systeme netzwerk, Brecherspitzstr. 8, 81541 München, Germany