JurPC Web-Dok. 111/1998 - DOI 10.7328/jurpcb/1998138108

Götz Knoop *

Spracherkennungssysteme (Teil 2)

JurPC Web-Dok. 111/1998, Abs. 1 – 21


Anmerkung der Redaktion: Der erste Teil des Beitrags befaßte sich mit der IBM Spracherkennungslösung "Via Voice Gold"; vgl. hierzu: JurPC Web-Dok. 67/1998, Abs. 1 - 41.

2. Dragon Naturally Speaking

Nachdem im vorigen Bericht das Programm von IBM "Via-Voice Gold" untersucht worden war, soll nun das System "Dragon Naturally Speaking" einem gründlichen Test unterzogen werden.JurPC Web-Dok.
111/1998, Abs. 1

2.1 Installation / Vorbereitung

Die Installation des Programms verlief auch bei diesem System ohne nennenswerte Schwierigkeiten. Die Einrichtung der Software auf der Festplatte wurde von dem Installationsprogramm ohne Probleme übernommen.Abs. 2
Nach erfolgreicher Installation läuft der "Audio Setup Assistent" automatisch an. Dieser überprüft bei seinem ersten Start, ob die Einrichtung der Hardware einwandfrei war, ob also Mikrofon und Lautsprecher in ausreichender Qualität funktionieren (vgl. Abb.) und erläutert, wie das Mikrofon (am Mund des Anwenders) zu positionieren ist.Abs. 3
Nach dieser ersten Einrichtung läuft auch bei dem System von Dragon eine Trainigsphase an. Hier werden dem Anwender vier verschiedene Texte zur Auswahl angeboten, von denen er dem System mindestens zwei Texte vorlesen muß (vgl. Abb.). Für diese Phase sollte der Anwender sich genügend Zeit lassen und etwa 45 Minuten kalkulieren. Er sollte sich vor allem ihn Ruhe darauf konzentrieren, die Texte so zu sprechen, wie er sie auch ihm gewöhnlichen Diktierablauf sprechen würde. Besonders deutliches Sprechen wäre also ebenso fehl am Platze, wie besonders schnelles Sprechen.Abs. 4
Nachdem das System diese Einrichtungsphase durchlaufen hat, ist es einsatzbereit und der Anwender kann sich an das eigentliche Diktieren heranwagen.Abs. 5

2.2 Das eigentliche Diktieren

Hinsichtlich der einzelnen Diktiermodi ist das System von Dragon nicht ganz so anwenderfreundlich wie das IBM-System. Es bestehen folgende Möglichkeiten:Abs. 6
1. Der Anwender kann mit Hilfe einer kleinen Textverarbeitung, welche als Bestandteil des Systems ausgeliefert wird, seine Texte erfassen. In diese Textverarbeitung ist die Steuerung der Spracheingabe vollständig integriert (vgl. Abb.). Hinsichtlich ihres Funktionsumfanges läßt diese Textverarbeitung jedoch zu wünschen übrig. Sie kann mit "Wordpad" verglichen werden, kommt also an die Office-Pakete bei weitem nicht heran.
2. Neben der Verwendung dieser kleinen Textverarbeitung besteht die Möglichkeit, mit Hilfe von Winword zu diktieren. Hierbei steht dem Anwender die volle Funktionsbreite von Winword zur Verfügung. Jedoch wird der Anwender bei dem ersten Start der Winwordschnittstelle darauf hingewiesen, daß die Erkennungsleistung bei der Nutzung von Winword im Einzelfall etwas geringer ausfallen kann, als bei der mitgelieferten Textverarbeitung.
Abs. 7
Damit der Anwender von Winword aus die Spracherkennung steuern kann, wird ihm in Winword ein zusätzliches Pulldown-Menü eingeblendet und eine Speedbuttonleiste. Da der Aufruf von Naturally Speaking etwas länger dauert, wird es nicht zusammen mit Winword gestartet, sondern erst über das Pulldown-Menü aktiviert (vgl. Abb.).Abs. 8
3. Das direkte Diktieren in beliebige Zielfenster ist mit diesem System leider nicht möglich. Ebenso ist es nicht möglich, Befehle an das Betriebssystem zu diktieren. Anders als bei IBM kann man daher z.B. seine E-Mail nicht direkt ins richtige Fenster diktieren; man muß zuerst in die Textverarbeitung diktieren, um sich dann mit der Zwischenablage zu behelfen.Abs. 9
Dieser Nachteil gegenüber dem System von IBM wird jedoch mit der guten Erkennungsrate mehr als ausgeglichen. War bei dem System von IBM noch jeder Satz fehlerhaft, schreibt das Dragon-System weitgehend korrekt. Einzelne Schwächen tauchen bei Komposita auf. Diese Komposita erkennt das System häufig als einzelne Worte. Statt "Allzweckmusiker" schreibt das System beispielsweise " all Zwecken Musiker ". Diese kleine Unzulänglichkeit ist in dem System offensichtlich auf den vorhandenen Wortschatz zurückzuführen.Abs. 10
Die im Test erreichte Erkennungsrate liegt mit etwa 91 % etwas unter der Quote, die der Hersteller mit 95% angibt. Bei der verbleibenden Fehlerqoute entfallen etwa 33% der Fehler auf Komposita, die das System nicht zusammen geschrieben hat.Abs. 11
Die Anwenderfreundlichkeit durch die hohe Erkennungsleistung wird von dem System außerdem mit der Möglichkeit gesteigert, die Steuerung der Software und der Textformatierung mit gesprochenen Befehlen zu unterstützen. Zu diesen Befehlen zählt zum Beispiel "Verbinde .......". Mit diesem Befehl können dann Komposita verbunden werden, die das System nicht zusammen geschrieben hat.
Zu diesen sprechbaren Befehlen liefert Dragon eine Kurzreferenz, so daß alle Befehle vom Anwender recht schnell erlernt werden können.
Abs. 12
Ebenso wie bei dem System von IBM ist auch bei diesem System die Korrektur der Texte notwendig, damit das System die Chance hat, dazu zu lernen.
Diese Korrektur kann – wie bei IBM – leider nicht nur durch die Korrektur in der Textverarbeitung erfolgen. Vielmehr muß die Korrektur mit Hilfe bestimmter Befehle vorgenommen werden, damit das System die Fehler auch erkennen und hinzu lernen kann.
Die Ansteuerung dieser Befehle ist jedoch deutlich einfacher als bei IBM.
Nach der Markierung eines (oder mehrerer) Wörter wird das Korrekturfenster mit der "Minus-Taste" des Zehner-Blocks oder mit dem Sprachbefehl "Korrigiere das" geöffnet (vgl. Abb.).
In diesem Fenster gibt der Anwender dem System dann die korrekte Schreibweise vor, wobei das System sofort alternative Schreibweisen vorschlägt.
Abs. 13
Mit dieser recht einfachen Korrekturfunktion scheint eine Reduzierung des Schreibaufwandes möglich zu sein. Die Korrekturarbeit erreicht angesichts der besseren Erkennungsleistung und des einfacher zu handhabenden Korrekturmodus nicht so schnell denn Aufwand, der beim Diktieren für die primäre Verschriftlichung anfällt.Abs. 14
Die Erkennungsrate des hier durchgeführten Testes dürfte sich außerdem noch steigern lassen, da auch dieses System noch nicht mit einem juristischen Fachwortschatz ausgestattet ist. Sobald dieser vorliegt, ist mit einer gesteigerten Erkennungsrate insbesondere für juristische Fachwörter zu rechnen.Abs. 15
Der Anwender kann hinsichtlich des noch fehlenden juristischen Fachwörterbuches auch selbst Hand anlegen und das Vokabular erweitern (vgl. Abb.). Der Anwender kann beispielsweise die Rechtschreibelexika von Winword auf Wörter überprüfen, die Dragon unbekannt sind (vgl. Abb.). Bei einer solchen Vorgehensweise wird der Wortschatz von Dragon um die Wörter der Rechtschreiblexika ergänzt. Gleiches Vorgehen ist mit den Schriftsätzen in einer Kanzlei oder den Mustertexten von Formularbüchern denkbar.Abs. 16
Vermißt wird an dem System sehr stark die Möglichkeit, die Texterstellung von der Textüberarbeitung sinnvoll trennen zu können.
Selbstverständlich kann der Anwalt einen Text mit Hilfe des Systems erstellen, ihn als Winword-Text abspeichern und diesen Text in Winword von seiner Mitarbeiterin überarbeiten lassen. Nur: Bei dieser Vorgehensweise lernt das System des Anwaltes nichts hinzu.
Bei IBM ist es möglich, mit der Winword-Datei zusammen auch die Sprachdaten abzuspeichern. So könnten auch die Sprachdateien auf den Rechner der Mitarbeiterin übertragen, dort bearbeitet und später zurückgelesen werden. Bei Dragon muß der Anwender auf eine solche Möglichkeit verzichten.
Soweit der Anwalt nicht alles selber korrigieren möchte, bleibt das selbstständige Hinzu-Lernen auf seinem Rechner graue Theorie.
Abs. 17
Der Anwender kann sich an dieser Stelle auch nicht mit dem Austausch der gesamten Sprachdateien behelfen, da er bei dem System nicht angeben kann, unter welchem Namen und an welchem Ort das System die Sprachdaten ablegt. Ihm bleibt also verborgen, welche Dateien er kopieren müßte, um die Sprachdaten von einem Rechner auf einen anderen zu übertragen.Abs. 18
Insgesamt scheint das System von Dragon aufgrund seiner Erkennungsrate tatsächlich schon für den Praxiseinsatz tauglich zu sein. Der Anwender muß zur Zeit noch ohne juristisches Fachvokabular zurecht kommen. Außerdem muß er – soweit er die Korrekturarbeiten nicht selbst vornehmen will – damit leben, daß sein System nichts hinzu lernt.Abs. 19

2.3 Die Mustertexte

2.3.1 Allgemeiner Mustertext
der Standorte Deutschland ist besser als sein internationaler Ruf. Regierung, Opposition und Wirtschaftsverbände haben auch schon einmütig in den Grund dafür ausgemacht, daß ausländische Investoren einen großen Bogen um Deutschland schlagen: für die Standorte Werbung fehlte die koordinierende Hand.
Deshalb forderte der Wirtschaftsausschuß des Bundestages ein zentralen Ansprechpartner und eine neue Bundes Agentur " investieren in Deutschland ". Auch Wirtschaftsminister Günter Rexrodt will die Werbung bündeln und ein Standorte beauftragten berufen. Während er aber einen morgen-Donna-Men besucht, möchte der A. 10 Millionen Mark jährlich locker machen. Traum Kandidaten: der frühere Mercedes Vorstand Helmut Werner. Mit Werner können sich sogar die Wirtschaftsförderer der Länder , die sonst stets und ihre Zuständigkeit befürchtet. " Der wäre ein wichtiger Knopf ", freut sich Klaus von Vogt, Chef der niedersächsischen Gesellschaft die TA. Nur einer weiß von alldem noch nichts: Traum Kandidat Werner.
Abs. 20
2.3.2 Juristischer Mustertext
AG Duisburg: wirtschaftliche Neugründung durch Mantel Verwertung - Prüfung Rechte des Registergericht es. (1) wird eine Kapitalgesellschaft, die ihren bisherigen Geschäftsbetrieb eingestellt hat und nicht mehr über wirtschaftlich verwandelt Vermögen verfügt, so Grundton eines neuen Unternehmens verwendet (Mantel Verwertung), so liegt hierin eine Umgehung der Vorschriften über die Kapital aufbringbar der Gründung. Die umgangen Vorschriften über die Aufregung des Stammkapitals und über deren Registergericht sicher Kontrolle sind analog anzuwenden. (2) kommt anläßlich einer Register an Meldung der Verdacht auf eine Mantel Verwertung auf, so mußte Registergericht besuchen, den Sachverhalte aufzuklären. Bei der Aufklärung kam die Beteiligten insbesondere durch Auferlegung der wirtschaftlichen Zusammenhänge mit zu wirken. Bestätigt sich der Verdacht, so ist die Eintragung davon abhängig zu machen, daß die Erfüllung der umgangen Gründung Vorschriften über das Stammkapital und die mindeste Einlagen nachgewiesen wird.
JurPC Web-Dok.
111/1998, Abs. 21
* Götz Knoop ist Rechtsanwalt in Lippstadt.
[online seit: 07.08.98]
Zitiervorschlag: Autor, Titel, JurPC Web-Dok., Abs.
Zitiervorschlag: Knoop, Götz, Spracherkennungssysteme (Teil 2) - JurPC-Web-Dok. 0111/1998