JurPC Web-Dok. /2000 - DOI 10.7328/jurpcb/200015219

Andrea Kowalski *

Neue deutsche Rechtschreibung light: Der Alta Vista Reformkonverter

JurPC Web-Dok. 167/1999, Abs. 1 - 14


Für diejenigen, die bisher weder Zeit noch Lust hatten sich mit der neuen deutschen Rechtschreibung zu befassen, bietet Alta Vista unter der Webadresse http://www.altavista.de/av/reform/recht vollmundig einen "Super Service" an. Bei Angabe der entsprechenden URL verspricht Alta Vista Webseiten vollautomatisch den Regeln der neuen Rechtschreibung anzupassen und alle vorgenommenen Änderungen fett zu markieren.JurPC Web-Dok.
167/1999, Abs. 1
Allen, die sich bereits mit dem Thema der automatischen Konvertierung beschäftigt haben, muss dies zunächst als erstaunlich selbstbewusstes (und großzügiges, da kostenloses) Angebot erscheinen. Die hierauf folgenden Einschränkungen verwundern deshalb nicht unbedingt.Abs. 2
Neue Schreibweisen werden nur dann vorgeschlagen, wenn die alte nicht mehr erlaubt ist (z.B. "nummerieren" statt wie bisher "numerieren"). Variantenschreibungen (wie "Delfin" neben bisher "Delphin") werden damit nicht berücksichtigt. Das stört vielleicht nicht weiter, da ja die alte Schreibweise in diesen Fällen weiterhin korrekt ist.Abs. 3
Dass aber obligatorische Änderungen bei Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung von der Konvertierung gänzlich ausgenommen werden, mindert den Nutzen des Reformkonverters doch ganz erheblich. Auch die Kommasetzung bleibt unberücksichtigt.Abs. 4
Es werden lediglich solche Änderungen vorgenommen, die unter die sogenannte Laut-Buchstaben-Zuordnung fallen. Hierzu gehört z.B. die Änderung von "daß" zu "dass" oder von "behende" zu "behände". Die mangelhafte Funktionalität des Reformkonverters läßt sich am besten an einer Reihe von Testsätzen demonstrieren. Die folgenden Sätze sind ein Auszug aus einem längeren Testtext. Von den in dieser Passage notwendigen 16 Änderungen hat der Reformkonverter lediglich die 5 fettmarkierten vorgenommen:Abs. 5
Im Winter war es das gleiche (neu: Gleiche): einer (neu: Einer) lief lieber Ski, die anderen lieber eis (neu: Eis).
Alles übrige (neu: Übrige) ließ sich klären, und niemand wollte den kürzeren (neu: Kürzeren) ziehen.
Im allgemeinen (neu: Allgemeinen) war es heute mittag (neu: Mittag) ruhig, aber am Sonntag abend (neu: Sonntagabend) waren alt und jung (neu: Alt und Jung) auf den Beinen.
Die Ladies (neu: Ladys) erschienen in großer Garderobe.
Die Gäste traten aus dem rauen (alt: rauhen) Novemberwetter in die Kirche, wo der Meßdiener (neu: Messdiener) wartete.
Die deutsche Schuhbändelproduktion (alt: Schuhbendelproduktion) ist am Erliegen.
Mach mal deine Bändel (alt: Bendel) zu.
Ich meine deine Schuhbändel (alt: Schuhbendel).
Der Gerd ist ein rauer (alt: rauher) Typ.
Der fängt sogar Grauhaie mit der bloßen Hand.
Abs. 6
Immerhin scheint der Reformkonverter über eine Morphologiekomponente zu verfügen, die komplexe Wörter (zumindest in unseren Beispielen) korrekt zerlegt. So wird nicht nur "Bendel" zu "Bändel" konvertiert, sondern beispielsweise auch "Schuhbendelfabrikation" zu "Schuhbändelfabrikation". Gleichzeitig wird trotz der Konvertierung von "rauh" zu "rau" nicht etwa der "Grauhai" zum "Grauai", ein Fehler, der manch einem einfach gestrickten Konvertierungsprogramm durchaus unterläuft, weil es statt nach echten Wortbestandteilen ("grau"+"Hai") nach bloßen Buchstabenketten sucht.Abs. 7
Die Testsätze machen aber deutlich, dass der Konverter auch seinen oben eingeschränkten Ansprüchen nicht gerecht wird. Selbst die obligatorischen Änderungen im Bereich Laut-Buchstaben-Zuordnung werden nicht zuverlässig erfaßt. Sowohl am "Messdiener" als auch an den "Ladys" ist der Konverter gescheitert. Hieran ist vermutlich ein zu kleines Wörterbuch schuld.Abs. 8
Unangenehm aufgefallen sind jedoch auch die nichtlinguistischen Probleme des Reformkonverters. So wird durch die Konvertierung teilweise die Formatierung zerstört. Beispielsweise wird nach Semikolon grundsätzlich der folgende Wortzwischenraum gelöscht und häufig werden auch Anführungsstriche getilgt. Noch gravierender: In Textpassagen, in denen ursprünglich durch Verwendung des Containers <PRE>...</PRE> die Formatierung durch den Browser ausgeschaltet werden soll, werden Zeilenumbrüche gelöscht, so dass aus einer Tabelle im Originaltext meterlange Zeilen werden können.Abs. 9
Auch die Frage, warum der Reformkonverter einen so beträchtlichen Teil der neuen Rechtschreibung außer Acht lässt, kann mit Blick auf die Beispielsätze verdeutlicht werden. Die Ansprüche an ein möglichst automatisches Konvertierungsprogramm sind alles andere als trivial. Einige Erfordernisse wurden bereits genannt: ein hinreichend großes Lexikon und eine darauf operierende Morphologie.Abs. 10
In vielen Fällen läßt sich jedoch auf der Wortebene überhaupt nicht entscheiden, ob es sich um einen Fall für die neue Rechtschreibung handelt oder nicht. Dafür ist sehr oft die Hinzuziehung des weiteren Kontextes notwendig. So muss "kürzeren" in "... niemand wollte den Kürzeren ziehen" neuerdings großgeschrieben werden. Wie bisher kleingeschrieben wird es jedoch in "Er nahm den längeren Weg, sie den kürzeren".Abs. 11
Um dies zu erkennen, benötigt ein Konvertierprogramm möglichst zuverlässige Heuristiken. Eine einfache Heuristik könnte in diesem Spezialfall z.B. die neue Großschreibung immer dann vorschlagen, wenn "Kürzeren" zusammen mit "ziehen" in einem Satz vorkommt. Dass das für eine automatische Konvertierung nicht ausreicht, ist klar. Auch für "Niemand wollte den kürzeren Mikadostab ziehen" würde dann ja fälschlicherweise die Konvertierung vorgenommen. Für die Beibehaltung der Kleinschreibung müßte die Heuristik idealerweise erkennen, dass das Adjektiv hier ein Attribut zum Nomen "Mikadostab" ist und deshalb weiterhin kleingeschrieben wird.Abs. 12
Ein wirklich zuverlässiges vollautomatisches Konvertierungsprogramm müßte also im Grunde eine Analyse der grammatischen Struktur von Sätzen vornehmen. Eine völlige Automatisierung der Konvertierung ist damit beim momentanen Stand der computerlinguistischen Forschung noch nicht in Sicht. Vernünftige Konvertierungsprogramme können daher nicht auf die Interaktion mit dem Benutzer verzichten. Vor allem daran, wie gut dieser Spagat zwischen Vollständigkeit (alle notwendigen Änderungen werden vorgenommen) und Automatisierung (möglichst selbstständige Konvertierung mit möglichst wenigen Falschvorschlägen) gelingt, bemißt sich die Qualität eines solchen Programms.Abs. 13
Bei der Konzeption des Alta Vista Reformkonverters wurde auf die Vollständigkeit offenbar sehr wenig Wert gelegt. Etwas polemisch formuliert ist der Reformkonverter nicht viel mehr als eine Art Makeup, das vor allem die Anzahl der "ß"s zu verringern hilft, und mit dem man im Grunde nur unwesentlich besser bedient ist, als mit der Suchen&Ersetzen-Funktion eines Textverarbeitungsprogramms.
JurPC Web-Dok.
167/1999, Abs. 14
* Andrea Kowalski ist wissenschaftliche Mitarbeiterin in der FR Computerlinguistik im Projekt Lima (Linguistische Analyse Mathematischer Texte) sowie Mitarbeiterin bei CLT-Sprachtechnologie GmbH (linguistische Beratung und Tests/Qualitätskontrolle).
[online seit: 04.10.99]
Zitiervorschlag: Autor, Titel, JurPC Web-Dok., Abs.

Top 10

Klassiker

JurPC App