System zur automatischen Übersetzung von Gebärdensprache in Lautsprache
Die Kommunikation zwischen normalhörenden Personen und Gehörlosen gestaltet sich sehr schwierig und aufwändig. Zur Verständigung untereinander verwenden Gehörlose meist die Gebärdensprache. Diese kann als eine eigenständige Sprache mit einer wohldefinierten Struktur aufgefasst werden. Der Einsatz von Gebärden-sprachdolmetschern kann zur Überbrückung der Kommunikationsbarriere dienen. Problematisch dabei ist neben den hohen Kosten und der Wahrung der Privatsphäre vor allem die Verfügbarkeit von Übersetzern. Ein nützliches technisches Hilfsmittel könnten deshalb ein videobasiertes System darstellen, welches die Gebärdensprache in gesprochene Sprache - und umgekehrt - übersetzet. Die entsprechenden Komponenten eines unidirektionalen Systems zur Übersetzung von Gebärdensprache in Lautsprache sind in der Abbildung dargestellt.
Eine wichtige Systemaufgabe ist hierbei die robuste, sprecherunabhängige Erkennung von Gebärden und bedeutungstragenden nicht-manuellen Parametern, wie Gesichtsausdruck, Mundbild, Kopfhaltung, Blickrichtung und Ausrichtung des Oberkörpers. Die simultan ausgeführten nicht-manuellen Parameter dienen u.a. zur Bedeutungsunterscheidung, zum Ausdruck von Emotionen sowie zur Beschreibung von nicht durch Gebärden darstellbaren Adjektiven und Adverbien. Problematisch sind neben der Koartikulation von Gebärden auch die individuell unterschiedliche Geschwindigkeit und Genauigkeit der Gebärdenausführung, die zu detektierenden Pausenzeiten und die spezifisch unterschiedlich durchgeführte Übergangsbewegung von einer Gebärde in die folgende. Weiterhin müssen neben dem Fingeralphabet, welches zur Benennung von Eigennamen und Fremdwörtern verwendet wird, auch die verschiedenen Dialekte innerhalb der Deutschen Gebärdensprache berücksichtigt werden. Zudem können auch spontan neue, bildhafte Gebärden erzeugt werden. Solche produktiven Gebärden werden zum Beispiel zur Beschreibung von Formen oder Bewegungsabläufen verwendet. Dies allein lässt bereits erahnen, wie komplex sich die Aufgabe für ein Übersetzungssystem gestaltet und wie umfangreich das Vokabular des alltagstauglichen, intelligenten Systems sein muss. Für eine Transformation der Gebärdensprache in gesprochene Sprache ist die Interpretation der sprachlichen Äußerung sowie die Entwicklung eines Sprachmodells unter Berücksichtigung syntaktischen Regeln notwendig. Dazu muss unter anderem die aktuelle Gesprächssituation erfasst werden, um beispielsweise Indizierungen von Dingen sowie Kontextinformationen berücksichtigen zu können. Da eine konventionelle Gebärde mehrere Bedeutungen haben kann, könnte somit auch die Wahrscheinlichkeit einer sinnvollen und korrekten Übersetzung erhöht werden.
Für die Realisierung eines alltagstauglichen Systems ist demnach eine entsprechende Kombination von einem geeigneten Übersetzungssystem mit der statistischen Gebärdenspracherkennung notwendig. Bei Verwendung eines großen Vokabulars durch das Übersetzungssystem ist neben der Verwendung von Ganzwortmodellen für die sprecherunabhängige Gebärdenspracherkennung möglicherweise die Ermittlung der einzelnen bedeutungsunterscheidenden Parameter der Gebärdensprache sinnvoll. Durch die Verkettung der manuellen und nichtmanuellen Wortuntereinheiten könnte dann die entsprechende Bedeutung der Aussage effektiver ermittelt werden. Problematisch hierbei ist wiederum das häufig simultane Auftreten der kleinsten Einheiten der Gebärdensprache.
Die in Textform vorliegenden sprachlichen Äußerungen der gebärdenden Person kann nach erfolgter Erkennung und Übersetzung der hörenden Person direkt angezeigt, oder nach linguistisch-phonetischer Transkription und Synthese als Lautsprache ausgegeben werden. Entsprechende Synthesesysteme existieren bereits auf dem Markt. Trotz ständiger Weiterentwicklungen auf dem Gebiet der Übersetzung von Gebärdensprache in gesprochene Sprache sind bis heute wichtige Teilaufgaben für ein solches automatisches Übersetzungssystem noch nicht zufriedenstellend gelöst.

