JurPC Web-Dok. 94/2005 - DOI 10.7328/jurpcb/200520893

Paul Tiedemann *

Multilinguale Juristische Datenbanken am Beispiel der IARLJ Database (www.iarlj.nl)

JurPC Web-Dok. 94/2005, Abs. 1 - 24


I n h a l t s ü b e r s i c h t
1.Die Globalisierung des Rechts und das Informationsproblem
2.Die Lösung: Multilinguale Datenbanken
3.Beispiel: Die IARLJ Database
3.1.   Die Nutzung
3.2.   Der Workflow
3.2.1   Die Auswahl der Entscheidungen
3.2.2   Aufbereitung der Datensätze
3.2.3   Eingabe der Datensätze
3.2.4   Freigabe der Datensätze
3.2.5   Die Pflege des Suchwort-Index

1. Die Globalisierung des Rechts und das Informationsproblem

Globalisierung findet bekanntlich auch im Recht statt. In immer mehr Rechtsgebieten wird von einem Rechtsanwalt erwartet, dass er in seinen an deutsche Behörden oder Gerichte adressierten Schriftsätzen auch ausländische Judikate zitiert. Auch die Richter kommen nicht umhin, ausländische Rechtsprechung zur Kenntnis zu nehmen, zu analysieren und sich damit auseinander zu setzen. Das gilt zunächst für sämtliche Materien, in denen nationale Rechtsgrundlagen auf der Umsetzung europäischen Gemeinschaftsrechts beruht. Es gilt aber auch und in einer noch umfassenderen Weise überall dort, wo weltweite völkerrechtliche Verträge eine Rolle spielen, wie dies etwa auf dem Gebiet des gewerblichen Rechtsschutzes oder des Patentrechts, aber auch des humanitären Völkerrechts oder des internationalen Flüchtlingsrechts der Fall ist. JurPC Web-Dok.
94/2005, Abs. 1
Die Kenntnisnahme ausländischer Rechtsprechung hängt heute noch sehr stark von den Zufälligkeiten der individuellen Sprachkenntnisse ab. Deshalb wird abgesehen von der österreichischen und schweizerischen Judikatur, für die sich das Sprachproblem nicht stellt, allenfalls jene Judikatur in nennenswertem Umfang zur Kenntnis genommen, die in englischer Sprache verfasst ist. Das führt jedoch zu einer verzerrten Wahrnehmung. Denn die rechtlichen Diskurse in anderen Sprachräumen bleibt abgeschattet. Abs. 2

2. Die Lösung: Multilinguale Datenbanken

Diesem Problem können multilinguale Datenbanken entgegenwirken. Eine solche Datenbank hat die International Association of Refugee Law Judges (IARLJ) in enger technischer Kooperation mit dem Deutschen EDV-Gerichtstag e.V. und dem Institut für Rechtsinformatik an der Universität des Saarlandes entwickelt. Es dürfte sich dabei um den ersten Versuch handeln, auch bei bescheidenen Sprachkenntnissen die Nutzung eines multilingualen Datenpools zu ermöglichen, der prinzipiell beliebig viele Sprachen umfassen kann. Das macht dieses Experiment auch für andere Anwendungsbereiche interessant. Der besondere Charme der IARLJ Datenbank liegt in dem Umstand, dass ihr Aufbau und ihre Pflege mit denkbar geringen finanziellen Mitteln auskommt. Freilich ist nicht zu leugnen, dass diese mangelnde finanzielle Ausstattung auch der Grund für die nicht zu übersehenden strukturellen Schwächen des Projekts ist. Dennoch ist es überraschend, wie viel man auch mit wenig Geld erreichen kann. Im Folgenden soll deshalb die IARLJ Datenbank und der hinter ihr stehende Workflow vorgestellt werden. Abs. 3

3. Beispiel: Die IARLJ Database

Die IARLJ ist eine internationale Richtervereinigung mit Sitz in Haarlem, Niederlande, welche sich dem grenzüberschreitenden Dialog unter jenen Richtern widmet, die mit dem Asyl- und Flüchtlingsrechts befasst sind. Die alle Mitglieder unabhängig von Sprache und Nationalität verbindende Gemeinsamkeit ist die Genfer Flüchtlingskonvention von 1951. Daneben spielen auch die internationalen Menschenrechtspakte von 1966 und die regionalen Menschenrechtskonventionen wie etwa die Europäische oder Amerikanische Menschenrechtskonvention eine wichtige Rolle. Ziel des Dialogs ist die Entwicklung gleicher Rechtsstandards auf einem hohen Niveau. Für diese Zielsetzung besteht im Flüchtlingsrecht um so mehr ein Bedürfnis, als es keinen obersten internationalen Gerichtshof gibt, der eine Vereinheitlichung der Judikatur zur Genfer Flüchtlingskonvention in allen Vertragsstaaten bewirken könnte. Eine gleiche und angemessene Anwendung dieses internationalen Vertragswerks kann deshalb nur dadurch herbeigeführt werden, dass die Rechtsanwender sich über die Anwendungs- und Auslegungspraxis im Ausland informieren, unterschiedliche Praxen zum Gegenstand eines juristisch-dogmatischen Dialogs machen, Kriterien der Kritik entwickeln und auf diese Weise zur Heranbildung gemeinsamer Standards und einer internationalen Dogmatik beitragen. Dieser Aufgabe widmet sich die IARLJ seit ihrer Gründung im Jahre 1995 vor allem durch die Veranstaltung weltweiter oder regionaler internationaler Tagungen, die der Begegnung der Asylrichter aus aller Welt dienen. Abs. 4
Schon bald ist jedoch deutlich zutage getreten, dass solche Tagungen allein den notwendigen Informationsfluss nicht ermöglichen können. Der Ruf nach einer internationalen Datenbank wurde laut, die es ermöglichen sollte, die multinationale Rechtsprechung zum Asyl- und Flüchtlingsrecht zu recherchieren und rechtsvergleichend zu analysieren. Der wohl erste Versuch in diese Richtung ging von dem amerikanischen Rechtsprofessor James C. Hathaway aus, der an seinem Institut an der Universität von Ann Arbor, Michigan eine entsprechende Datenbank aufbaut (Refugee Caselaw Site: http://www.refugeecaselaw.org/ [08.08.2005]) und dazu Rechtsprechung aus aller Welt sammelt, die entweder in die englische Sprache übersetzt wird oder jedenfalls mit Kurzinformationen in englischer Sprache versehen wird. Abgesehen davon, dass diese Datenbank von ihrem Bestand her deutlich einen Schwerpunkt im angelsächsischen Sprachraum hat, setzt auch die Recherche sehr gute Kenntnisse der englischen Sprache voraus. Der Benutzer muss insbesondere über die einschlägige Fachterminologie in seinem aktiven englischen Sprachschatz verfügen, um zu befriedigenden Resultaten zu gelangen. Ähnlich verhält es sich auch mit der Datenbank RefWorld, die das Hohe Flüchtlingskommissariat der Vereinten Nationen zur Verfügung stellt (http://www.unhcr.ch/cgi-bin/texis/vtx/rsd [08.08.2005]). Abs. 5
Innerhalb der IARLJ wurde seit dem Jahre 2003 das Bedürfnis formuliert, eine Datenbank zu entwickelt, die sehr leicht und kostenlos zugänglich sein sollte, um insbesondere auch den Richtern, Rechtsanwälten und nichtstaatlichen Flüchtlingsorganisationen in jenen Ländern ein nützliches Instrument in die Hand zu geben, die erst seit kurzem und mit geringen personalen und finanziellen Mitteln Flüchtlingsschutz gewähren. Insbesondere sollten die Anforderungen an die Fremdsprachenkenntnisse der Nutzer so gering wie möglich gehalten werden. Auf der Welt-Konferenz der Vereinigung, die im April 2005 in Stockholm stattfand, konnte die Datenbank in Anwesenheit eines Vertreters des Saarbrücker Instituts für Rechtsinformatik der Öffentlichkeit übergeben werden. Sie ist seitdem über die Website der IARLJ ( www.iarlj.nl) erreichbar. Abs. 6

3.1 Die Nutzung

Die Nutzung der Datenbank ist kostenlos und anonym. Man bedarf keines Logins. Über die Website der IARLJ erricht man die Startseite, auf der man zunächst die Sprache wählen muss, in der man recherchieren will. Im April 2005 ging die Datenbank mit den Sprachen Deutsch, Englisch, Französisch, Niederländisch und Polnisch an den Start. Inzwischen (August 2005) ist Slowenisch dazugekommen. Die Sprachen Ungarisch und Tschechisch sind in Vorbereitung. Bei der Implementierung neuer Sprachen geht man bewusst langsam vor, weil es gilt, hier noch Erfahrungen zu sammeln und den Workflow, aber auch die Technik entsprechend anzupassen. Abs. 7

Nach der Auswahl der Sprache erscheint die eigentliche Suchmaske in der ausgewählten Sprache. Die Suchmaske ermöglicht die Recherche nach Suchworten aus einem Suchwortindex und aus dem Volltext der Leitsätze, die mit der jeweiligen Entscheidung verknüpft sind. Darüber hinaus kann nach dem Entscheidungszeitraum und dem Land, aus dem die Entscheidung kommt, recherchiert werden. Die einzelnen Suchkriterien können miteinander verknüpft werden (soweit das sinnvoll ist). Abs. 8
Den vollen Datenbestand erschließt sich der Nutzer nur, wenn er sich bei der Auswahl der Suchbegriffe an die Liste der indizierten Suchworte hält, die ihm angeboten wird. Diese Liste enthält alle Worte in der jeweils ausgewählten Sprache. Der Nutzer bedarf also für diese Operation keinerlei Fremdsprachenkenntnisse. Indem er den ausgewählten Suchbegriff anklickt, fügt er automatisch die englische Übersetzung dieses Begriffs in die eigentliche Suchmaske ein. Mit dem Suchbefehl sucht die Datenbank darauf alle Entscheidungen, mit denen die englische Übersetzung des Suchbegriffs verbunden ist. Als Resultat wird eine Trefferliste ausgegeben, aus der sich das Entscheidungsland, der Name des Gerichts, Aktenzeichen und Entscheidungsdatum ersehen lässt sowie die Leitsätze in der Originalsprache der Entscheidung und in Englisch. Durch einen Klick auf das Aktenzeichen werden diese Angaben noch einmal in einem größeren Format dargestellt und die eigentliche Entscheidung in der Originalsprache als PDF-Datei zum Download angeboten. Abs. 9
Der Leitsatz enthält eine erste Information über den wesentlichen Inhalt der Entscheidung in der Originalsprache und in Englisch. An dieser Stelle werden vom Nutzer also gewisse Kenntnisse zumindest der englischen Sprache gefordert. Diese Kenntnisse beschränken sich aber auf eine rein passive Sprachkompetenz. Der Nutzer muss nicht aktiv Englisch sprechen können und er muss vor allem nicht über den aktiven englischen Wortschatz der für dieses Rechtsgebiet einschlägigen Terminologie verfügen. Diese verhältnismäßig geringen Anforderungen an die sprachliche Kompetenz tragen entscheidend dazu bei, dass ein großer Nutzerkreis von der Datenbank profitieren kann. Abs. 10
Die Leitsätze sollten so informativ sein, dass der Nutzer in vielen Fällen allein mit dieser Information schon auskommen kann. Hat er ein vertieftes Informationsbedürfnis, so muss er sich die Entscheidung aus der Originalsprache auf eigene Initiative übersetzen lassen. Da er jedenfalls schon weiß, dass diese Entscheidung sein Informationsbedürfnis befriedigen wird, lässt sich dieser Aufwand für ihn kalkulieren. Abs. 11

3.2 Der Workflow

3.2.1 Die Auswahl der Entscheidungen

Im Verhältnis zu der Datenbank und ihrer Administration gibt es in jedem Land, aus dem Entscheidungen in die Datenbank eingespeist werden, eine Kontaktperson. Ist in einem Land keine Kontaktperson bestimmt, dann kann aus diesem Land nicht nur keine Entscheidung in die Datenbank aufgenommen werden; die Datenbank wird auch nicht für die Sprache dieses Landes zur Verfügung gestellt, sofern nicht schon ein anderes Land eine Kontaktperson benannt hat, das die selbe Sprache spricht. Bisher haben alle Kontaktpersonen ihre Aufgabe ehrenamtlich und unentgeltlich übernommen. Abs. 12
Die Kontaktperson ist also die Schnittstelle zur Datenbank. Es bleibt der jeweiligen innerstaatlichen Organisation überlassen, wie die Kontaktperson zu ihrem Material kommt, ob sie also selbst die Auswahl der in die Datenbank einzustellenden Entscheidungen vornimmt oder ob ihr diese Entscheidungen zugeliefert werden, ohne dass sie selbst ein Auswahlermessen hat. In Deutschland haben sich dankenswerter Weise fast alle Oberverwaltungsgerichte sowie das Bundesverwaltungsgericht bereit erklärt, jeweils für ihr Gericht einen Beauftragten zu bestellen, der Entscheidungen aus seinem Hause sammelt und dann an die zentrale Kontaktperson für Deutschland weiterliefert.(1)Abs. 13

3.2.2 Aufbereitung der Datensätze

Die Kontaktperson hat die Datensätze in einer bestimmten Form aufzubereiten. Zunächst ist sicherzustellen, dass die eigentliche Entscheidung (Volltext) anonymisiert ist und in elektronischer Form als PDF-Datei vorliegt, die nach vorgegebenen Konventionen zu benennen ist. Daneben ist für jede Entscheidung mindestens ein Leitsatz zu formulieren. Die Leitsätze sollen den wesentlichen Inhalt der Entscheidung erfassen, soweit er für einen potentiellen Nutzer der Datenbank von Interesse ist. Dabei wird an den Nutzer aus einem anderen Staat gedacht. Das bedeutet, dass sich die Leitsätze nicht den höchst subtilen Verfahrensfragen widmen dürfen, die nur im Rahmen des nationalen Rechts des Sendestaates überhaupt verstanden werden können und für internationale Nutzer gänzlich ohne Interesse sind. Die Formulierung der Leitsätze liegt im Übrigen in der alleinigen Verantwortung der Kontaktpersonen. Eine Korrektur oder Überprüfung seitens einer zentralen Administration findet nicht statt. Allenfalls werden Anregungen und Verbesserungsvorschläge kommuniziert. Dazu besteht ein Bedürfnis, da die nationalen Stile beim Abfassen von Leitsätzen doch sehr unterschiedlich sind. Während in Deutschland, der Schweiz oder auch in den USA in kurzen Aussagesätzen der Kern der Entscheidung wiedergegeben wird, neigen Autoren aus anderen Ländern dazu, eher eine Geschichte zu erzählen, die von dem Richter x handelt, welcher mit der Geschichte y befasst war und dabei der Frage z nachgegangen ist. Nur wenn es glücklich läuft, wird dann auch noch mitgeteilt, zu welchem Ergebnis er dabei gekommen ist. Abs. 14
Neben den Leitsätzen hat die Kontaktperson der Entscheidung auch relevante Suchworte zuzuordnen. Das ist eine hohe Kunst, die in der Praxis erhebliche Schwierigkeiten macht. Um zu vermeiden, dass der Suchwortindex voller Synonyme ist und einen völlig unübersichtlichen Umfang annimmt, sind die Kontaktpersonen nämlich gehalten, den Entscheidungen nur solche Suchworte zuzuordnen, die bereits im Index enthalten sind. Nur dann, wenn sich trotz aller Sorgfalt bei der Auswahl für einen bestimmten Inhalt absolut kein passendes Wort im Index findet, darf ein neues Suchwort eingeführt werden. Abs. 15
Zur Aufbereitung der Datensätze gehört schließlich, dass die Kontaktperson für eine englische Übersetzung der Leitsätze zu sorgen hat. Das gilt auch für die Suchworte, sofern diese neu sind. In Deutschland wird die Übersetzungsarbeit von einem professionellen Übersetzungsbüro vorgenommen. Die damit verbundenen Kosten werden von Zuwendungen gedeckt, die die Deutsche Stiftung für internationale rechtliche Zusammenarbeit e.V. in Bonn der deutschen Kontaktperson zur Verfügung gestellt hat. Im ersten Jahr des Aufbaus der Datenbank (Juni 2004 bis Juni 2005) entstanden Kosten in Höhe von ca. 400  €. Dieser Kostenrahmen kann auch dadurch erreicht werden, dass das Übersetzungsbüro nicht ausschließlich auf einem finanziellen Entgelt besteht, sondern auch die Veröffentlichung seines Logos unter dem übersetzten Leitsatz in der Datenbank als Gegenleistung akzeptiert. Abs. 16

3.2.3 Eingabe der Datensätze

Die Kontaktperson übernimmt schließlich die Aufgabe, den Datensatz in die Datenbank einzuspeisen. Das geschieht über ein HTML-Formular, welches in der jeweiligen Muttersprache der Kontaktperson in einem passwortgeschützten Bereich der Datenbankoberfläche angeboten wird. In dieses Formular müssen zunächst die so genannten Metadaten eingegeben werden. Die Metadaten bestehen aus dem Land der Entscheidung, dem Namen des Gerichts, dem Aktenzeichen, dem Datum der Entscheidung und einer Angabe zur Rechtskraft (rechtskräftig, nicht rechtskräftig, aufgehoben durch ...). Ferner sind die Leitsätze in der Originalsprache und in der englischen Übersetzung und die Suchworte einzugeben, die mit der Entscheidung verknüpft werden sollen. Das Formular stellt zu diesem Zweck den gesamten Suchwortindex in der Sprache der Kontaktperson zur Verfügung. Durch Anklicken des Begriffs wird dieser in der Originalsprache und in der englischen Übersetzung in das Formular eingefügt. Nur wenn ein neuer Begriff mit der Entscheidung verknüpft werden soll, muss dieser und seine englische Übersetzung manuell eingegeben werden. In diesem Fall ist ein Checkbutton anzukreuzen, um zu markieren, dass es sich um ein neues Suchwort handelt. Schließlich ist das Formular noch mit der PDFDatei der eigentlichen Entscheidung zu verknüpfen und das Ganze an die Datenbank abzusenden. Abs. 17

3.2.4 Freigabe der Datensätze

Die über das vorgehend beschriebene Formular an den Datenbankrechner des Vereins Deutscher EDV-Gerichtstag geschickten Datensätze werden dort in einer XML Struktur erfasst und automatisch in die Datenbank eingestellt, aber noch nicht freigegeben. Sie sind deshalb nur auf der Administrationsebene sichtbar und werden hier als neu eingegebene Datensätze markiert. Die Datenbank generiert zugleich automatisch eine eMail, die die Metadaten, den Leitsatz und die Suchworte in einer XML-Struktur enthält, und sendet diese an die Administration der Datenbank. So erfährt die Administration vom Vorhandensein neuer Datensätze, ohne ständig selbst die Datenbank auf Neueingänge kontrollieren zu müssen. Abs. 18
Die Administration überprüft jetzt den Datensatz auf Vollständigkeit, kann ggf. noch Änderungen vornehmen und Rückfragen an den Einsender richten, dessen eMail-Adresse ebenfalls Bestandteil des Datensatzes ist. Wenn alles in Ordnung ist, wird der Datensatz durch einen Klick auf den entsprechenden Button freigegeben und ist von diesem Zeitpunkt an im Internet zu sehen. Abs. 19

3.2.5 Die Pflege des Suchwort-Index

Wenn der neu eingegebene Datensatz nur auf Suchworte referiert, die bereits vom Index erfasst sind, löst er keine weitere Administrationstätigkeit aus. Anders verhält es sich aber, wenn er neue Suchworte enthält. Die Pflege des Suchwortindex wird derzeit vollständig über WORD-Makros abgewickelt. Die Administration kopiert den Inhalt der eMail, die sie von der Datenbank erhalten hat, manuell in ein neues WORD-Dokument und startet dann ein Makro, welches analysiert, ob der Datensatz ausschließlich solche Suchworte enthält, die bereits in den Index aufgenommen sind, oder ob neue Suchworte vorliegen. Im letztgenannten Fall generiert das Makro Übersetzungslisten in allen Datenbanksprachen und fügt die neuen Suchworte und deren englische Übersetzung in die ersten beiden Spalten dieser Listen ein. Eine dritte Spalte bleibt leer. Diese Übersetzungslisten werden als WORD-Dateien abgespeichert und dann an die Kontaktpersonen der anderen Sprachen geschickt. Kommt der Datensatz aus Frankreich, so wird eine solche Übersetzungsliste also beispielsweise an die deutsche Kontaktperson geschickt, die auf der Basis des mitgeteilten Begriffs in der englischen Sprache und ggf. auch unter Berücksichtigung des Begriffs in der Originalsprache die deutsche Übersetzung in die dritte Spalte einfügt und die Liste an die Administration zurückschickt. Abs. 20
Diese Vorgehensweise ist zweifellos suboptimal, mangels finanzieller Mittel aber nicht zu ändern. Besser wäre es, wenn alle Übersetzungslisten an ein und dasselbe Übersetzungsbüro gingen, das damit sämtliche Sprachen betreuen würde, auf Kompatibilität achten und mit der Zeit eine genügende Kompetenz entwickeln könnte, um Übersetzungen für alle Sprachen auf gleich hohem Niveau zu gewährleisten. Abs. 21
Die vervollständigten und zurückgesandten Übersetzungslisten werden manuell in die Indexliste der jeweiligen Sprache übertragen. Ein WORD-Makro erstellt daraus einen neuen Suchwortindex in der jeweiligen Sprache und implementiert ihn in das Suchwort- und das Eingabeformular, welche dann noch in das Internet hochgeladen werden müssen. Abs. 22
Das Institut für Rechtsinformatik arbeitet derzeit an einer Möglichkeit, die Indexpflege zentral auf dem Datenbankrechner vornehmen zu lassen, so dass die Pflege mithilfe von WORD-Makros entfallen würde. Dadurch könnten sich neue Möglichkeiten ergeben, die Indexpflege zu optimieren. Abs. 23

4. Ausblick

Es ist beabsichtigt, an dieser Stelle über die weitere Entwicklung der IARLJ Datenbank und die damit gemachten Erfahrungen zu informieren. Der vorliegende Bericht soll also kontinuierlich fortgeschrieben werden. Die vorliegende Version 1 gibt den Stand vom 01.09.2005 wieder.
JurPC Web-Dok.
94/2005, Abs. 24

Fußnote:

(1) Eine Zusammenarbeit kam bisher mit dem VGH Kassel, dem OVG Münster, dem OVG Saarlouis und dem OVG Bremen nicht zustande.
* Dr. iur. Paul Tiedemann ist Richter am Verwaltungsgericht Frankfurt am Main und Lehrbeauftragter für Rechtsphilosophie an der Universität des Saarlandes. Er nimmt an seinem Gericht die Funktion des EDV- und Internet-Referenten war. Als Mitglied des Vorstandes (council) der International Association of Refugee Law Judges hat er das Konzept der IARLJ Database entworfen und betreut deren weitere Entwicklung.
Publikationen: siehe www.dr-tiedemann.de
Kontakt: pati@dr-tiedemann.de
[online seit: 26.08.2005 ]
Zitiervorschlag: Autor, Titel, JurPC Web-Dok., Abs.
Zitiervorschlag: Tiedemann, Paul, Multilinguale Juristische Datenbanken am Beispiel der IARLJ Database - JurPC-Web-Dok. 0094/2005