JurPC Web-Dok. 110/2001 - DOI 10.7328/jurpcb/200116476

Peter Ebenhoch *

Die Verwendung von XML für die strukturierte Informationsgestaltung von gerichtlichen Entscheidungen

JurPC Web-Dok. 110/2001, Abs. 1 - 16


Autorenprofil

Abstract

Der von Luhmann diagnostizierten "Ausdifferenzierung des Rechts" entspricht die Gestaltung von typisierten juristischen Dokumenttypen und Textsorten (z.B. Formularen), der zunehmenden elektronischen Vernetzung und der daraus erwachsenden Zunahme des Informationsaustausches entspricht der verstärkte Einsatz automatisierter Informations- und Dokumentverarbeitung durch strukturierte Datengestaltung. Der Entwicklung und Standardisierung (1986) von SGML, federführend betrieben vom Juristen und IBM Mitarbeiter Charles F. Goldfarb, lag primär ein statisches Verständnis von mit Textmarken versehenen Dokumenten zugrunde. Dieses führte bei praktischen Anwendungen zu einigen Nachteilen, wie zum Beispiel der Rigidität von Dokumenttypen, der Schwierigkeit des Editierens unvalidierter SGML-Dokumente, der Problematik des Dokumentaustausches und der Speicherung. Das neu entwickelte und seit 1998 auch standardisierte SGML-Subset XML ermöglicht nicht nur eine effektivere Anwendung des Grundgedankens strukturierter Dokumenterfassung, sondern auch zusammen mit anderen schon länger verabschiedeten (EDI, RDF) oder noch jungen Standards (ICE), die dynamische Verwendung strukturierter Information in vernetzten Umgebungen. Welche Möglichkeiten sich in Bezug auf die rechtsinformatische Umsetzung daraus schon ergeben haben und noch ergeben können, soll dieser Beitrag anhand einer exemplarischen DTD für gerichtliche Entscheidungen aufzeigen. Die beispielhaft eingebrachten Metadaten werden mit Hilfe von XSLT formatiert und ausgewertet, so daß kommunikative Anknüpfungspunkte und künftige Nutzungsmöglichkeiten für das elektronische Publizieren und Dokumentieren sichtbar werden. JurPC Web-Dok.
110/2001, Abs. 1

1. Gerichtsentscheidungen in XML

1.1. einfache Strukturierung

Medienneutrale Auszeichnung geht in der ("verlegerischen") Regel zunächst von einem Druckwerk aus. Die vorhandene typographische und visuelle Auszeichnung wird dabei in ein entsprechendes logisches Abbild übersetzt. Diese Bezugnahme ist auch notwendig, weil normalerweise - wohl auch weiterhin - die Anforderung besteht, die medienneutrale Datenrepräsentation nicht nur für elektronische CD-ROM oder Internet-Darstellungen zu verwenden, sondern vor allem auch, um eben Druckwerke zu erstellen. Die medienneutrale Speicherung stellt jedenfalls die nachfolgende flexible Ausgabe für jeden gewünschten Medientyp sicher. Sofern das Layout dem des schon bestehenden Print-Titels entsprechen soll, muß natürlich Vorsorge getragen werden, daß die druckvorbereitende Ausgabe die typographischen Auszeichnungen entsprechend umsetzen kann. Für manche Zwecke mag es dabei bleiben und genügen, aus dem medienneutralen Datenreservoir lediglich Druckwerke erzeugen zu können, die den eigenen typographischen Anforderungen entsprechen. In der Regel wird dies aber nicht genügen, da bei dieser Vorgangsweise die spezifischen Möglichkeiten der medienneutralen Datenformate in keiner Form ausgeschöpft werden: Es sollen in diesem Fall die eingebrachten Markierungen auch verwendet werden, um mehr als lediglich typographische Information, wie zum Beispiel Hyperlinks oder Versionsangaben zu nutzen bzw. zu generieren. Um diesen Zweck zu erreichen, müssen weitere Informationen in den Text eingebracht werden. Der Aufwand, aber auch die Informationsdichte steigen dadurch an, weitere Verwendungsmöglichkeiten der vormals statischen Information werden konzipier- und realisierbar. Bezogen auf ein juristisches Urteil können dadurch die vielfältigen enthaltenen Informationstypen und deren Verflechtungen nachgezeichnet und herausgearbeitet werden. Es lassen sich dadurch wesentlich komfortablere und effektivere Methoden des juristischen Suchens und Gestaltens informationstechnisch unterstützen. Abs. 2

1.2. komplexere Strukturierung

Eine derart tiefere Strukturierung und inhaltlich bezugnehmende Auszeichnung des Textes erlaubt es, den Inhalt weiter zu erschließen und zu modellieren. Während HTML die Bezeichnung der Textmarken vorgibt und den semantischen Spielraum sowie die Textauszeichnung auch quantitativ eingrenzt (so sind zum Beispiel lediglich die sechs Ebenen H1 bis H6 vorgesehen), erlaubt SGML und XML die beliebige individuelle Benennung von gewünschten Textmarken. Information kann dadurch wesentlich aussagekräftiger strukturiert werden, ohne jedoch auf die Möglichkeit automationsunterstützter Weiterverarbeitung verzichten zu müssen, im Gegenteil: Diese kann noch wesentlich effektiver betrieben werden. SGML in der seit 1998 standardisierten Form von XML bewirkt eine noch einfachere technische Umsetzung der von SGML bekannten Vorteile. Dies wurde in technischer Hinsicht -- unter anderem -- dadurch erreicht, daß auf die Möglichkeit der "Tag-Omission" verzichtet wurde. Abs. 3
1.2.1. SGML: "Tag-Omission"
"Tag-Omission" bezeichnet nach dem SGML-Standard die Möglichkeit, auf öffnende oder schließende Textmarken bei der Auszeichnung zu verzichten und dennoch validierbare, das heißt, einer DTD-entsprechende Dokumente erzeugen zu können. Was zunächst als Vorteil für den redaktionellen Prozeß angesehen werden konnte (nicht jede öffnende muß von einer nachfolgenden schließenden Klammer begleitet werden), ist historisch gesehen durch die Notwendigkeit entstanden, auf die engen Grenzen an Speicherplatz Rücksicht zu nehmen und so die Texte trotz der eingebrachten Textmarken kompakt zu halten. Von der - auch redaktionellen - Unsicherheit, welche Tag-Omission noch ein gültiges Inhaltsmodell abgibt, abgesehen, war eine unerwünschte Folgewirkung allerdings, daß die SGML-Parser diese fehlenden Auszeichnungen algorithmisch ergänzen mußten und daß die Komplexität und - auch der Preis - dieser Werkzeuge unverhältnismäßig anstieg. Abs. 4
1.2.2. XML: "well-formed"
XML erlaubt keine Tag-Omission, sodaß ein gültiges XML-Dokument insofern normalisiert sein muß und als "well-formed'' bezeichnet wird. Das heißt nichts anderes, als daß jede öffnende Markierung von einer schließenden gefolgt werden muß, und daß die Textmarken nur paarweise geschachtelt sein dürfen. Als solches stellt es schon ein XML-Dokument dar, zur sinnvollen Verwendung sollten aber die Strukturen mit Hilfe einer DTD bekannt sein, so daß es bezogen auf diese DTD auch validierbar ist(1). Abs. 5
1.2.3. weitergehende Strukturierung
Je weitergehend ein Dokument strukturiert wird, um so stärker müssen vorweg die gewünschten Möglichkeiten der Verarbeitung, der gesamte Prozeß der Informationsverarbeitung berücksichtigt werden. Umgekehrt formuliert: Je mehr automationsunterstützte Prozesse auf die Information zugreifen sollen, umso stärker muß dies in der weitergehenden Strukturierung der Informationen Berücksichtigung finden. Da diese Bedürfnisse selten losgelöst, sondern vielmehr in einer bestehenden Organisation und in Hinblick auf einen bestimmten Zweck erfolgen, müssen für eine korrekte Dokumentgestaltung auch diese Rahmenbedingungen, wie zB. eine organisationsbezogene Workflow-Information, einbezogen werden. Dadurch fallen der Dokumentinhalt und Metainformationen über das Dokument gewissermaßen zusammen, wobei das auf und mit den Dokumenten arbeitende System, zB. eine Dokumentverwaltung, für eine korrekte Behandlung der jeweiligen Information sorgt. Während es scheint, als wären in der aktuellen Gerichts- und Verwaltungspraxis das Dokument und Informationen über es eher getrennt -- sei es der "Akt", gewissermaßen als materialisierte Dokumentenhülle, oder die Dokumentenverwaltung, die nur anzeigt, wo sich das Dokument selber eigentlich befindet -- so zeigt es sich, daß zahlreiche Stempel und Notizen auf den Dokumenten selber gleichfalls Metainformationen darstellen (Geschäftszahlen, Datum, etc). Die Anwendung von XML erscheint deshalb hier als logische, informationstechnische Weiterführung und auch Formalisierung gängiger juristischer Gepflogenheiten. Abs. 6

2. Metadaten

2.1. Begriff

Metadaten integrieren nun auch diese Information (bzw. eigentlich eher "Exformation'') direkt in das Dokument selber. Während sie für die eigentliche Verwendung des Dokumentes (Lesen on- und offline und als Druckwerk) nicht ersichtlich gemacht werden, können sie für zusätzliche automationsunterstützte Funktionen als Anknüpfungspunkt verwendet werden. So lassen sich von bestimmten inhaltlichen Informationen abhängige und als Metainformationen ausgezeichnete verwaltungsinterne Workflow- und "Document-Assembling"-Prozesse danach ausrichten, weiters können sie zusätzliche juristische Suchinformationen beherbergen (die frühere "intellektuelle Beschlagwortung" von Dokumenten taucht hier unter anderem Namen wieder auf), sowie im Rahmen des Dokumenten- bzw. eigentlich Content-Managements zusammen mit einer (relationalen) Datenbank eine funktionale Einheit eingehen ("Klassifizierung" von Dokumenten) sowie sowohl die Zugriffsrechte (als Anknüpfungspunkt für Datenschutzgesichtspunkte) als auch - in einer ökonomischen Betrachtungsweise - das korrekte Verbuchen und Verrechnen des Aufrufs der Informationseinheit ("Micro-Pricing"). Während XML aufgrund seiner Einfachheit ("well-formed") auch die Abspeicherung in herkömmlichen relationalen Datenbanken erleichtert und so auch deren Stärken nutzbar gemacht werden (Robustheit, Performanz, Verbreitungsgrad), sind durch die starke Akzeptanz von XML in der Software-Industrie inzwischen auch kommerzielle XML-basierte Content-Management-Systeme verfügbar, die XML direkt ("nativ") einspeichern und ausgeben können(2). Abs. 7

2.2. Umsetzungsmöglichkeit

Metadaten selber können aber auch als eigenes Dokument zusammengefaßt werden, das über einen Link mit einer bestimmten ID direkt auf das eigentliche Dokument verweist. Während im Normalfall Metadaten mit Hilfe von XML/SGML als Attribut(3)abgelegt wird, können bei dieser Form der Speicherung Metadaten auch als normale Elemente aufscheinen. Aber auch herkömmliche Druckwerke enthalten Metainformationen: Gute juristische Bücher enthalten in der Regel umfangreiche Register, die die Geschäftszahlen von Gerichtsentscheidungen und Normzitate der einbezogenen Gesetzesstellen beinhalten. Abs. 8

2.3. Beispiele

2.3.1. Einbringen von Links auf Normzitate
Sofern man ein Druckwerk als Referenzpunkt nimmt, sind auch die Links in elektronischen Gesetzestexten Metainformation. Die Auszeichnung kann zB folgendermassen erfolgen:
<ENTSCHEIDUNGSGRUENDE><P>Die Klage ist begründet aus <VERWEIS TYP=GESETZ STELLE='BGB#823'>§ 823 I, II BGB</VERWEIS> i.V.m. <VERWEIS TYP=GESETZ STELLE='STGB\#186'>§§ 186 StGB</VERWEIS>, <VERWEIS TYP=GESETZ STELLE='BGB\#824'>824 BGB</VERWEIS> wegen Verletzung des allgemeinen Persönlichkeitsrechts sowie der Ehre des Klägers.</P>
[...]
<GESETZ><PARAGRAPH No='823'><BEZEICHNUNG>§ 832</BEZEICHNUNG>
<TEXT>...</TEXT>
</GESETZ>
Abs. 9
2.3.2. Einbringen von Metainformation bezüglich verwiesener Gerichtsentscheidungen
Linktypen können in Erweiterung zu HTML inhaltlich unterschieden werden. So lassen sich Verweise auf Gesetzesstellen von solchen auf andere Entscheidungen und Urteile unterscheiden.
<P>Wie in der Entscheidung des <VERWEIS TYP=ENTSCHEIDUNG GERICHT='BGH' DATUM='30011996' FUNDSTELLE='NJW, 1131'>BGH vom 30.01.1996, NJW 96, 1131 ff.</VERWEIS> ausgeführt, kann das Verbreiten einer von einem Dritten über einen anderen aufgestellten herabsetzenden Tatsachenbehauptung dann eine Persönlichkeitsrechtsverletzung darstellen, wenn derjenige, der die Behauptung wiedergibt, sich nicht ausreichend von ihr distanziert. [...] </P>
Abs. 10

3. Anwendungsbeispiele mit XSLT

XSL ist eigentlich das Formatierwerkzeug, das XML-Dokumenten ein äußeres Erscheinungsbild geben kann. Während das Pendant bezüglich SGML, DSSSL, erst 10 Jahre nach der Standardisierung von SGML verabschiedet werden konnte (1986 bis 1996), dürfte es mit XSL nicht so lange dauern, die Standardisierung des derzeit vorliegenden Entwurfes ist derzeit schon absehbar(4), die Unterstützung durch die Software-Industrie ist sehr groß. Verglichen mit einer schon vorhandenen Alternative, CSS (Cascading Stylesheets), die sich als Version 1 auch schon weitgehend etablieren konnte, ist XSL ungleich mächtiger und vielseitiger verwendbar. Beschlossen wurde unter anderem auch schon die Trennung von XSL in eine Transformations- und eine Formatierungssprache. XSL hat partiell schon in den Microsoft Internet-Explorer, Version 5, Eingang gefunden. Der Durchführung der Formatierung eines XML Dokumentes durch den Web-Browser als client steht die Verwendung von XSL auf seiten des Web-Servers gegenüber; zusätzlich kann XSL auch durch einen Batch-Aufruf als einfaches Konvertierungswerkzeug, das statische Ausgabedateien erzeugt, verwendet werden. Nachfolgend einige Beispiele zur HTML-Ausgabe mit Hilfe von XSLT. Abs. 11

3.1. Dynamisches Konvertieren nach HTML

Im Microsoft Internet-Explorer, Version 5, wurde der damalige XSL-Entwurf, leider allerdings mit einigen Besonderheiten, integriert. Das kann genutzt werden, um ein XML-Dokument in formatierter Weise anzuzeigen. XSL erlaubt es dabei ähnlich wie CSS, Elemente mit Formatierungsoptionen zu verknüpfen und auf diese abzubilden. Eine dynamisch generierte HTML-Anzeige eines XML-Dokumentes ist demnach mit Hilfe von XSL sehr einfach möglich. Der folgende Ausschnitt aus einem XSL-Stylesheet zeigt den grundlegenden Mechanismus, der im konkreten Fall den Inhalt des Elements <titel>, das innerhalb eines Elements <urteil> vorkommt, als HTML-Titel ausgibt:
<xsl:template match=/urteil/titel>
<title><xsl:apply-templates/></title>
</xsl:template>
Hier wird dem Element <titel> im XML-Bestand das <title>-Element von HTML zugewiesen.
Abs. 12

3.2. Bedingte farbliche Gestaltung von Textteilen

Die folgenden Beispiele verwenden das XSLT-Werkzeug XT von James Clark, das unter url http://www.jclark.comfrei verfügbar ist und gegenüber dem Internet Explorer XSL umfassender unterstützt und -- wohl auch weil James Clark selber an der Standardisierung mitarbeitet -- näher an der Spezifikation liegt. Dieser Ausschnitt aus einem XSL-Stylesheet zeigt, wie Verweise auf Gerichtsentscheidungen in einer anderen Farbe als die auf Gesetzesstellen angezeigt werden können: <xsl:template match='//verweis[@typ='entscheidung']>
<font color=green><xsl:value-of select='.'/></font>
</xsl:template>
Abs. 13

3.3. Herausfiltern von juristischen Metainformationen

Hier wird eine Liste von juristischen Metainformationen aus einem Urteil generiert. Extrahiert werden dabei die Namen der Parteien, das Datum und der Titel des Urteils, die verwiesenen Normen und Entscheidungen. XSL verfügt über zahlreiche Features bezüglich Sortieren, bedingte Abfrage, etc., sodaß hier noch beliebig nachgebessert werden könnte. In Verbindung mit dynamischem HTML (DHTML) lassen sich sogar ganze interaktive Interfaces gestalten, mit denen ein Urteil ausgewertet werden kann.
<xsl:template match='datum']>
<p>Datum: <xsl:value-of select='.'/></p>
</xsl:template>
<xsl:template match='text()'>
</xsl:template>
Das zweite Codestück "schluckt" gewissermaßen alle Elementinhalte, die nicht den Filterbedingungen entsprochen haben.
Abs. 14

4. Fazit

Die Verwendung von XML als flexibler Auszeichnungssprache befreit nicht nur vom alljährlichen Updatezwang bezüglich binärer Dokumentenformate und darauf basierender Applikationen, sondern ermöglicht durch die Verwendung von XSL als Formatierungs- und Konvertierungssprache die Einbindung von Metainformationen und dadurch die flexible Verwendung und Wiederverwendung von juristischen Informationen sowie die beliebig gestaltbare Einbindung in bestehende Organisationsstrukturen und Abläufe auf Basis eines technischen Standards. Durch die inhaltlich orientierte, aber formale Auszeichnung wird die Information gleichzeitig inhaltlich erschlossen und automationsunterstützt verarbeitbar gestaltet. Ohne manuellen Mehraufwand kann die dadurch medienneutrale Information in Dokumentenmanagement-Systemen gespeichert und in beliebigen Medienformaten (Print, Offline, Online) verfüg- und erschließbar gemacht werden. Abs. 15

5. Literatur

- Greenspun, Phil/Lauritsen, Marc: Making Way for Intelligence in Case Space, Fifth International Conference on Artificial Intelligence and Law (ACM), May 1995, College Park, Maryland, Seiten 96-103
- Lauritsen, Marc: Knowing Documents, International Conference on Artificial Intelligence and Law, Proceedings of the fourth international conference on Artificial intelligence and law, June 15 - 18, 1993, Amsterdam Netherlands, Seiten 184-191
- Bradley, Neil: The XML-companion, Addison Wesley Longman Ltd., Harlow, 1999
- Lobin, Henning: Informationsmodellierung in XML und SGML, Springer Verlag, Berlin Heidelberg New York, 2000
- Maler, Eve/El Andaloussi, Jeanne: Developing SMGL DTDs -- From Text to Model to Markup, Precentice Hall, New Jersey, 1996
JurPC Web-Dok.
110/2001, Abs. 16

Fußnoten:

(1) Irreführenderweise wird die Möglichkeit, ein XML-Dokument auch ohne DTD weiter zu verarbeiten, oft als Hauptvorteil von XML dargestellt. Dieses Feature hat jedenfalls auch seine Bedeutung für den einfachen Datenaustausch von strukturierten Dokumenten, für die effektive Bearbeitung ist aber eine als DTD formalisierte Darstellung der erlaubten Strukturen unumgänglich.
(2) In demonstrativer Aufzählung seien nur folgende kommerzielle Datenbanken genannt, die eine direkte XML-Unterstützung anbieten: IBM DB2, Oracle 8i, Software AG mit Tamino und Bolero.
(3) Attribute werden in XML direkt bei einem Element gespeichert und können so, wie der Name schon nahelegt, als Eigenschaft dieses Elements verstanden werden.
(4)Nachtrag vom 18.9.2000: Per 16.11.1999 wurde eine Recommendation bezüglich der Specification 1.0 von XSLT verabschiedet; siehe url http://www.w3c.org/TR/xslt
* Mag. Peter Ebenhoch, Jurist und Rechtsinformatiker, Spezialist für medienneutrales Publizieren (XML). Lehrbeauftragter an der Universität Wien, Donauuniversität Krems, Fachhochschule Eisenstadt. Gründer der epico Informationssysteme GmbH www.epico.at, die seit Anfang März mit www.legalo.at online ist.
[online seit: 09.04.2001]
Zitiervorschlag: Autor, Titel, JurPC Web-Dok., Abs.

Top 10

Klassiker

JurPC App