JurPC Web-Dok. 67/1998 - DOI 10.7328/jurpcb/199813558

Götz Knoop *

Spracherkennungssysteme in der Anwaltskanzlei

JurPC Web-Dok. 67, Abs. 1 - 41


Autorenprofil

1. Vorbemerkung

Juristisch zu arbeiten bedeutet, mit Texten zu arbeiten. Hierbei bearbeitet der Jurist nicht nur fremde Texte, sondern in aller Regel erstellt er eigene Texte. Daher gehören die meisten Juristen zum Typus der Vieldiktierer. Das Diktieren von Texten ist, insbesondere in der anwaltlichen Berufspraxis und in der Arbeit der Richter, dauerhafte Alltagstätigkeit. So diktiert ein Rechtsanwalt Tag für Tag etwa 45 min. Diktierband.JurPC Web-Dok.
67/1998, Abs. 1
Alleine an diesem Umfang erkennt man, daß Spracherkennungssysteme vom Ansatz her für Juristen und insbesondere für Rechtsanwälte und Richter interessant sind. In der Anwaltskanzlei könnte erheblich rationeller gearbeitet werden, wenn die Erstellung von Texten automatisiert würde. Dies dürfte auch die nicht-juristischen Mitarbeiter einer Anwaltskanzlei erfreuen, da auch bei ihnen die reine Schreibarbeit nicht als besonders anspruchsvoll empfunden wird.Abs. 2
Ob und inwieweit in der Anwaltskanzlei der Einsatz von Spracherkennungssystemen sinnvoll ist, soll im folgenden Aufsatz untersucht werden. Dieser Aufsatz wird in drei Teilen veröffentlicht. In diesem Teil geht es um das Programm IBM Via Voice. In den anderen beiden Teilen wird auf das Programm Dragon Naturally Speaking und auf das System von Annotexteingegangen.Abs. 3
Nachdem auf dem EDV-Gerichtstagbereits mehrere Arbeitskreise mit dem Thema der Spracherkennung befaßt waren und die Spracherkennungssysteme jetzt eine kontinuierliche Erkennung leisten sollen, schien es an der Zeit, die Praxistauglichkeit dieser kontinuierlichen Erkennungssysteme in der Anwaltskanzlei zu untersuchen. Hierzu sollte nicht eine rein theoretische Betrachtung vorgenommen werden, sondern es sollte ein Praxistest stattfinden. Der Autor ist selbst als Rechtsanwalt tätig und konnte daher die drei Testkandidaten in seiner anwaltlichen Alltagstätigkeit einsetzen.Abs. 4
Die kontinuierliche Spracherkennung verspricht eine Erkennung, ohne daß der Anwender zwischen den Worten kleine Pausen einlegen muß. Hierdurch unterscheiden sich die aktuellen Systeme von ihren Vorgängerversionen. Bei diesen mußte der Anwender noch kleine Pausen zwischen den Wörtern einlegen und daher sehr mechanisch sprechen.Abs. 5

2. Testanforderungen

Wenn der Einsatz von Spracherkennungssystemen untersucht und bewertet werden soll, muß zunächst geklärt werden, wogegen die Spracherkennungssysteme antreten. Hier stellt man sich die Frage, welche anderen Möglichkeiten der Texterstellung für den Juristen denkbar sind.Abs. 6
Viele Anwälte diktieren bislang jeden Text mit Hilfe von Diktiergeräten ohne Rücksicht auf den Umfang und die Qualität des Textes. Sodann lassen sie alles von ihren Mitarbeitern verschriftlichen. Anschließend wird das Schriftstück ausgedruckt und dem Juristen vorgelegt. Im günstigsten Falle finden sich keinerlei Fehler und das Schreiben kann unterzeichnet werden. Soweit sich aber Fehler finden, korrigiert der Anwalt diese handschriftlich, die Mitarbeiter überarbeiten das Schriftstück, drucken es aus und legen es erneut vor, wobei sich dieser Vorgang durchaus mehrfach wiederholen kann.Abs. 7
Zu dieser Arbeitsweise neigen insbesondere ältere Kollegen, die den Umgang mit dem PC oder der Schreibmaschine in keiner Weise gewohnt sind.Abs. 8
  • Andere Anwälte schreiben grundsätzlich alles selbst. Hierzu gehören insbesondere die Kollegen, die sich gerade niedergelassen haben und aus Kostenersparnis auf Mitarbeiter verzichten müssen.
  • Wieder andere Kollegen entscheiden im Einzelfall, was sie diktieren und was sie selbst schreiben. So diktieren einige Kollegen die erste Erstellung eines Schreibens, lesen dann selbst am Monitor Korrektur und nehmen dort direkt Änderungen vor, bevor das Schreiben dann endgültig ausgedruckt wird.
Abs. 9
Gegen diese unterschiedlichen Möglichkeiten der Texterstellung treten die Spracherkennungssysteme an.Abs. 10
Wie oben dargestellt sind Juristen Vieldiktierer. Für den Test bedeutet dies, daß in erster Linie auf die Erkennungsleistung abgestellt wird. Die Hersteller der Diktiersysteme werben häufig damit, daß man mit ihren Systemen auch im Betriebssystem navigieren und z.B. einzelne Programme per gesprochenem Befehl starten kann. Deratige Funktionalität soll bei dem Test bewußt nur am Rande eine Beurteilung finden, da derartiges wohl kaum den Einsatz in der Anwaltskanzlei rechtfertigt.Abs. 11
Dies gilt jedoch nicht für die Programmbereiche, welche die Korrektur eines Textes unterstützen. Der Korrekturkomfort hängt sehr eng mit der eigentlichen Texterstellung und somit mit der Einsatzfähigkeit der Programme in der Anwaltskanzlei zusammen.Abs. 12

3. Testverfahren

Die Systeme wurden auf einem gewöhnlichen PC mit 64 MB Arbeitsspeicher, 200 MHZ MMX Pentium-Prozessor, einer 16-bit Soundblaster Soundkarte und Windows NT 4.0 als Betriebssystem getestet.Abs. 13
Nach der vollständigen Einrichtung wurde jedes System etwa 3 Wochen in der Kanzleiarbeit eingesetzt. Um neben der Erfahrung in der Kanzleiarbeit eine direkte Vergleichbarkeit der Systeme in diesen Test einfließen lassen zu können, wurden außerdem jedem System zwei Mustertexte diktiert. Hierbei wurden die Abweichungen des Systems vom Mustertext untersucht. Bei diesen Texten handelt es sich einerseits um einen Text ohne fachliche Besonderheiten (Millionen für One-Dollar-Man, Wirtschaftwoche Nr. 10/98 S. 54), andererseits um einen Text mit juristischer Ausrichtung (AG Duisburg vom 8.8.97, NJW 98,VIII).Abs. 14

3.1 Allgemeiner Mustertext

Der Standort Deutschland ist besser als sein internationaler Ruf. Regierung, Opposition und Wirtschaftsverbände haben auch schon einmütig den Grund dafür ausgemacht, daß ausländische Investoren einen großen Bogen um Deutschland schlagen: Für die Standortwerbung fehlt die koordinierende Hand.Abs. 15
Deshalb forderte der Wirtschaftsausschuß des Bundestages einen zentralen Ansprechpartner und eine neue Bundes-Agentur " Investieren in Deutschland ". Auch Wirtschaftsminister Günter Rexrodt will die Werbung bündeln und ein Standortbeauftragten berufen. Während er aber einen One-Dollar-Man sucht, möchte der Ausschuß zehn Millionen Mark jährlich locker-machen. Traumkandidat: der frühere Mercedes-Vorstand Helmut Werner. Mit Werner können sich sogar die Wirtschaftsförderer der Länder anfreunden, die sonst stets um ihre Zuständigkeit fürchten. " Der wäre ein richtiger Klopfer ", freut sich Klaus von Voigt, Chef der niedersächsischen Gesellschaft der Ipa. Nur einer weiß von all dem noch nichts: Traumkandidat Werner.Abs. 16

3.2 Juristischer Mustertext

(1) Wird eine Kapitalgesellschaft, die ihren bisherigen Geschäftsbetrieb eingestellt hat und nicht mehr über wirtschaftlich relevantes Vermögen verfügt, zur Gründung eines neuen Unternehmens verwendet (Mantelverwertung), so liegt hierin eine Umgehung der Vorschriften über die Kapitalaufbringung bei der Gründung. Die umgangenen Vorschriften über die Aufbringung des Stammkapitals und über deren registergerichtliche Kontrolle sind analog anzuwenden. (2) Kommt anläßlich einer Registeranmeldung der Verdacht auf eine Mantelverwertung auf, so muß das Registergericht versuchen, den Sachverhalt aufzuklären. Bei der Aufklärung haben die Beteiligten insbesondere durch Offenlegung der wirtschaftlichen Zusammenhänge mitzuwirken. Bestätigt sich der Verdacht, so ist die Eintragung davon abhängig zu machen, daß die Erfüllung der umgangen Gründungsvorschriften über das Stammkapital und die Mindesteinlagen nachgewiesen wird.Abs. 17

4. IBM Via-Voice Gold

Der erste Testkandidat ist das Programm IBM Via Voice Gold.Abs. 18

4.1 Installation / Vorbereitung

Die reine Installation dieses Programms war mit Hilfe der Installationsroutine unproblematisch.Abs. 19
Nachdem die Software auf der Festplatte eingerichtet war, erfolgte die Installation des Mikrofons. Hier stellt sich die Software selbständig auf die Qualität des Mikrofons und auf die Hintergrundgeräusche ein.Abs. 20
Nachdem dies erfolgt ist, kann der Anwender bereits mit dem Diktieren beginnen, muß aber mit einer sehr schlechten Erkennungsrate rechnen. Bevor mit der Arbeit ernsthaft begonnen wird, sollte man daher eine Sprachmusterregistrierung vornehmen. Indem der Anwender einen vorgegebenen Text liest, gibt er der Software Gelegenheit, sich auf seine Sprechgewohnheiten einzustellen. Hierbei handelt es sich um eine Trainingsphase von etwa 45- 60 Minuten Dauer. Danach soll das System laut Hersteller geeignet sein, die Spracheingaben des Anwenders weitgehend fehlerfrei zu erkennen.Abs. 21

4.2 Das eigentliche Diktieren

Hinsichtlich der Bedienbarkeit ist das System von IBM anwenderfreundlich. Es ermöglicht vier verschiedene Vorgehensweisen.Abs. 22
  1. Man kann in eine kleine Textverarbeitung "Speakpad" diktieren. Diese Textverarbeitung ist allenfalls mit Wordpad vergleichbar und kommt an eine professionelle Textverarbeitungen nicht heran.
  2. Daneben bietet das System die Möglichkeit, direkt in Winword hinein zu diktieren. Neben der vollen Funktionalität besteht auch aus Winword heraus die Möglichkeit, die Spracherkennungssoftware mittels Schalter zu steuern. Diese Schalter werden bei der Installation in Winword eingerichtet. So kann der Anwender direkt das Mikro aktivieren oder Erkennungsfehler korrigieren.
  3. Neben diesen Diktiermethoden kann man mit dem IBM System in beliebige Zielfenster diktieren. Mann kann also seine e-mail in T-Online diktieren. Hier muß man jedoch darauf verzichten, aus diesem Fenster heraus die Spracherkennungssoftware steuern zu können.
  4. Weiterhin können mit dem System von IBM auch Befehle an den Rechner gesprochen werden. So kann man auf Sprachbefehl Programme starten, beenden, oder die aktive Anwendung wechseln.
Abs. 23
Diese unterschiedlichen Möglichkeiten bieten dem Anwender eine komfortable Arbeitsumgebung. Die eigentliche Überzeugungskraft der Spracherkennung sollte jedoch in der Erkennungsrate liegen, also in der Frage, ob das System die gesprochenen Wörter exakt und ohne Fehler in geschriebenen Text umsetzt.Abs. 24
Hinsichtlich dieser Erkennungsrate ist leider festzustellen, daß das System bei weitem nicht fehlerfrei arbeitet. Diktiert man einen Text, so ist in nahezu jeder Zeile ein Fehler enthalten. Zur Verdeutlichung können Sie sich das Musterdiktat des oben genannten Urteils ansehen. Dieser Text wurde nicht korrigiert.Abs. 25
Die Fehler bestehen nie in falsch geschriebenen Worten, sondern immer darin, daß das System falsche Wörter schreibt, oder Worte im falschen Tempus.Abs. 26
Auffallend ist hierbei, daß das System nicht nur bei Texten mit speziellem juristischem Sprachwortschatz fehlerhaft arbeitet. Über eine solche Unzulänglichkeit könnte man bedingt nachvollziehen, da für die Software ein spezieller juristischer Sprachwortschatz vom Hersteller angekündigt ist, der zur Zeit der Testphase noch nicht vorlag. Jedoch auch bei Worten, die dem ganz allgemeinen Sprachwortschatz zuzuordnen sind, ist die Fehlerquote des Systems noch beachtlich.Abs. 27
IBM präsentiert in dem Pressematerial, welches dem Autor mit übersendet wurde, die Software mit einer Erkennungsquote von über 95%. Von dieser Erkennungsrate ist man im täglichen Gebrauch weit entfernt.Abs. 28
Selbst wenn die Erkennungsquote von 95% erreicht würde, muß man an der Praxistauglichkeit zweifeln. In einer durchschnittlichen Zeile mögen etwa 15 Worte stehen. Bei 95% werden von 20 Worten 19 korrekt und eines falsch erkannt, was bedeutet, daß alle 1,3 Zeilen ein Fehler zu finden ist.Abs. 29
Die tatsächliche Fehlerquote ist jedoch wesentlich höher. Sie ist so hoch, daß eine ganz erhebliche Überarbeitung der Texte notwendig wird. Unter Berücksichtigung der Tatsache, daß man sich bei Mustertexten noch auf die deutliche Aussprache konzentriert, was aber bei dem eigentlichen Diktat nicht mehr der Fall sein wird, ist die niedrige Erkennungsquote von etwa 70 % um so unerfreulicher. Schließlich will man sich primär auf den juristischen Inhalt konzentrieren und nicht auf die Aussprache.Abs. 30
Die Arbeit der Fehlerkorrektur kann – zumindest teilweise - vom Schreibpersonal übernommen werden. Mit dem Abspeichern der Textdateien besteht die Möglichkeit, auch das eigentliche Diktat abzuspeichern. Das Schreibpersonal kann sich somit zur Unterstützung der Korrektur Auszüge aus dem Diktat anhören. Damit das Spracherkennungssystem dazulernt, ist es jedoch notwendig, die Korrektur unter Zuhilfenahme eines bestimmten Prozedere vorzunehmen. Dazu muß das jeweilige Wort zunächst markiert werden, um dann mit dem Betätigen des Schalters "Fehler korrigieren" in ein Fenster zu gelangen, in welchem man erst die eigentliche Korrektur vornehmen kann. Hierbei können maximal drei Worte gleichzeitig bearbeitet werden.Abs. 31
Eine einfach Vornahme der Korrektur im Text führt zwar zu einem richtig geschriebenen Text, steigert die Erkennungsrate des Systems aber nicht.Abs. 32
Der notwendige Korrekturaufwand erreicht und übersteigt schnell den eigentlichen Erstellungsaufwand, welcher für das primäre Verschriftlichen des Textes erforderlich ist. Selbst wenn man berücksichtigt, daß das Schreibpersonal auch nicht fehlerfrei schreibt, scheinen zeit- und somit betriebswirtschaftliche Einsparungen mit Hilfe der Spracherkennung nur schwerlich möglich zu sein.Abs. 33
Hier sind andere Formen der Texterstellung eher geeignet, über die Vermeidung doppelter Schreibtätigkeit zu betriebswirtschaftlichen Einsparungen zu kommen. Hierbei könnte der Jurist beispielsweise nur die erste Erstellung diktieren und die Überarbeitungen selbst am Monitor vornehmen.Abs. 34
Wie oben bereits geschildert, wird das System (noch) ohne juristischen Fachwortschatz angeboten. Dieser Nachteil läßt sich teilweise kompensieren, wozu jedoch ein erheblicher zusätzlicher Arbeitsaufwand notwendig ist. Das System beinhaltet ein Hilfsprogramm, welches bestehende Texte daraufhin analysiert, ob in diesen Texten Wörter enthalten sind, die das System bislang noch nicht kennt. Soweit man bislang die Rechtschreibprüfung genutzt und entsprechende Wörterbücher erstellt hat, kann man diese mit dem genannten Hilfsprogramm analysieren. Anschließend muß der Anwender dem System aber die Aussprache der unbekannten Wörter vermitteln. Dies kann recht langwierig sein, soweit das System eine große Anzahl unbekannter Wörter gefunden hat.Abs. 35
Nebenbei sei noch bemerkt, daß die Speicherung der Sprachdaten zu sehr hohem Speicherbedarf führt. Ein kleiner Text von gerade einmal 461 Anschlägen benötigte zusammen mit den Daten der Spracherkennung 530 KB, also etwa 0,5 MB! Der erste Teil dieses Aufsatzes umfaßt unter Winword etwa 260 KB bei etwa 17000 Anschlägen und mehreren grafischen Darstellungen.Abs. 36
Deutlich besser ist die Spracherkennung, wenn es darum geht, per Spracheingabe Programme zu starten. Der Grund für die bessere Erkennung liegt auf der Hand. Die Anzahl der denkbaren Worte ist sehr gering. Alleine die Möglichkeit, per Spracheingabe Programme zu starten, rechtfertigt aber in keiner Weise Anschaffung und Einsatz eines solchen Systems.Abs. 37

4.3 Die Mustertexte

Hier nun die verschriftlichte Form der Mustertexte durch das Spracherkennungssystem IBM Via-Voice Gold ohne Korrektur.Abs. 38
4.3.1 Allgemeiner Mustertext
in der Standort Deutschland ist besser als sein internationales ruft Regierung, Opposition und Wirtschafts Verbände haben auch schon einmütig den Grund dafür ausgemacht, daß ausländische Investoren einen großen Bogen um Deutschland schlagen: für die Standort Werbung fehlt die Koordination vereint.Abs. 39
deshalb fordert der Wirtschafts Ausschuß des Bundestages einen zentralen Ansprechpartner und eine neue Bundes Agentur " investieren in Deutschland ". Auch Wirtschaftsminister Günter Rexrodt gewählt die Werbung Bündelung und ein Standort beauftragten berufen. Während er aber ein Uhren-Dollar-Menschen besucht, möchte der Ausschuß 10 Millionen Mark jährlich 9). Traum Kandidat: der frühere Mercedes Vorstand Helmut Berner. Mit ferner können sich sogar die Wirtschaftsförderung Rat der Länder an Freunden, die sonst stets ihre Zuständigkeit fürchten." der wäre ein wichtiger klopfen ", freut sich draußen vor Voigt, Chef der niedersächsischen Gesellschaft die PWA. Eine was man allerdings noch nichts: Tauben könne dann ferner.Abs. 40
4.3.2 Juristischer Mustertext
AG Duisburg: wirtschaftliche neuen Gründung könnten durch Mainzer Verwertung - Prüfung muß Recht des Register gerecht ist.(1) geht an Kapital Gesellschaft, die ihrem diesjährigen Geschäftsbetrieb eingestellt hat uns nicht mehr über wirtschaftlich relevante Vermögen verfügt, zur Gründung eines neuen Unternehmens verwendet (umwandelt Verwertung), sowie diktieren eine Umgehung der Vorschriften über die Kapital aufbringen. Bei der Gründung. Den Umgang der Vorschriften über die Aufhebung gute Stammkapital und über deren Register gerichtliche Kontrolle sind analog anzuwenden.(2) kommt anläßlich einer Register Anmeldung der Verdacht auf einen Mantel Verwertung auf, so muß das Register Gericht versuchen, den Sachverhalt aufzuklären. Bei der Aufklärung haben die Beteiligten insbesondere durch Offenlegung der wirtschaftlichen Zusammenhänge mit zu wirken. Bestehende sich der Verdacht, jetzt so ist die Eintragung davon abhängig zu machen, daß die Erfüllung der Umgang im Wohnungs Vorschriften über das Stammkapital und E-Mails des anfragen nachgewiesen wird.
JurPC Web-Dok.
67/1998, Abs. 41
* Götz Knoop ist Rechtsanwalt in Lippstadt.
[online seit: 15.05.98]
Zitiervorschlag: Autor, Titel, JurPC Web-Dok., Abs.

Top 10

Klassiker

JurPC App