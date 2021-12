Anzeige

Lagos. Je nachdem, welche Akzente auf seine Vokale kommen, kann das Wort „Ogun“ auf Yoruba „Krieg“ oder „Eigentum“ bedeuten. Oder „zwanzig“ oder „Stab“. Oder es könnte der Gott des Eisens gemeint sein. Wo Apps und Computerprogramme im Netz aus dem Englischen oder Spanischen sonst mit Leichtigkeit übersetzen oder gesprochene Sprache in Text umwandeln, stoßen sie hier schnell an ihre Grenzen. Das soll sich ändern, findet Vukosi Marivate.

„Wir kommen an den Punkt, an dem eine Maschine deine Sprache nicht versteht und es so ist, als ob sie nie existiert hätte“, beklagt der Forscher von der Universität in Pretoria in Südafrika das Randdasein von Sprachen, die weniger über den Globus verbreitetet sind oder nicht von wirtschaftsstarken Nationen genutzt werden. Marivate hat sich mit anderen afrikanischen Wissenschaftlerinnen und Wissenschaftlern zusammengetan, um Künstlicher Intelligenz (KI) bei solchen Sprachen auf die Sprünge zu helfen.

Viele Apps versagen im Alltagsgebrauch

„Die meisten Menschen wollen sich in ihrer eigenen Sprache auf der Informationsautobahn bewegen können“, erklärt Marivate. Er ist Gründungsmitglied von Masakhane, einem panafrikanischen Forschungsprojekt, das Dutzende Sprachen bei der Sprachverarbeitung der Künstlichen Intelligenz voranbringen soll. Es ist das größte einer Reihe solcher Projekte von den Anden bis Sri Lanka, mit denen das Anliegen von der Basis her vorangetrieben wird – und nicht von den Entwicklerinnen und Entwicklern der KI-Programme selbst.

Die Technologieriesen bieten ihre Produkte zwar in vielen Sprachen an, doch auch weitverbreitete sind nicht automatisch darunter oder nicht präzise genug erfasst. So versagen Apps immer wieder im Alltagsgebrauch. Mal fehlen die Nuancen im Vokabular, mal der richtige Akzent, der über die Übersetzung entscheidet. Eines der Forschungsprojekte von Masakhane zeigte beispielsweise auf, dass Übersetzungs-Tools beim Übertragen von Covid-19-Fragebögen aus dem Englischen in verschiedene afrikanische Sprachen überfordert waren.

Nicht genügend Daten und grobe Übersetzung in der Kolonialzeit

Ein Problem für die Programme ist, dass es in vielen Sprachen einfach nicht genug Online-Futter gibt, etwa im wissenschaftlichen oder medizinischen Bereich. Damit können die KI-Systeme nicht mit einem breiten Feld von Daten lernen, wie sie diese besser verstehen und verarbeiten können.

Einiges daran sei auch der Geschichte geschuldet, erklärt Marivate. „In der Geschichte des afrikanischen Kontinents und allgemein von kolonialisierten Ländern wurde Sprache, wenn sie übersetzt werden musste, auf eine sehr grobe Art und Weise übersetzt“, sagt der Forscher. „Man durfte nicht einfach einen allgemeinen Text in jeder beliebigen Sprache schreiben, weil die Kolonialmacht vielleicht fürchtete, dass die Menschen sich über Aufstände und Revolutionen austauschen und Bücher darüber schreiben könnten. Aber religiöse Texte waren erlaubt.“

Wenn Google Götter als Teufel übersetzt

Beispiele für missglückte Spracherfassung oder Übersetzungen finden sich immer wieder. So fühlten sich vor einigen Jahren Menschen, die Yoruba sprechen, vor den Kopf gestoßen, als eine Google-App ihre Gottheit Esu als „Teufel“ übersetzte. Sprachliche Fehler und Missverständnisse auf Facebook wurden gar mit politischen Unruhen in Verbindung gebracht und dafür verantwortlich gemacht, dass sich schädliche Falschinformationen über Corona-Impfstoffe verbreiten konnten. Eher banale Übersetzungspannen machen als Memes die Runde.

Google und Microsoft gehören zu den Konzernen, die zugesichert haben, sich um eine bessere Technologie für bislang zu wenig erfasste Sprachen zu bemühen. Und Computerexpertinnen und -experten bei Meta, dem früheren Facebook, verkündeten kürzlich einen Durchbruch auf dem Weg zu einem „universellen Übersetzer“, der auch mit solchen Sprachen besser funktionieren soll.

Betroffene wollen selbst handeln statt auf Industrieländer zu warten

Das sei zwar ein wichtiger Schritt, aber bisher könnten nur große Technologiefirmen und große KI-Labore in Industrieländern solche Modelle bauen, gibt David Ifeoluwa Adelani von der Universität des Saarlandes zu bedenken. Auch er ist Mitglied bei Masakhane, das eben diese Technologie im Blick hat, von der die Forschenden sagen, dass sie bisher „unsere Namen, unsere Kulturen, unsere Orte, unsere Geschichte nicht versteht“.

Es gebe zunehmend Zusammenschlüsse von Menschen, die Entwicklungen für ihre eigenen Sprachen vorantreiben wollten, statt darauf zu warten, dass Elite-Institutionen die Probleme lösten, sagt Damián Blasi von der Initiative Datenwissenschaft an der Universität Harvard. Als Mitautor einer kürzlich erschienenen Studie hat er den Blick ganz aktuell auf die ungleiche Entwicklung von Sprachtechnologie für die mehr als 6000 Sprachen der Welt gelenkt: So gibt es nach Analysen der Forscherinnen und Forscher für Niederländisch Hunderte wissenschaftliche Berichte zur maschinellen Verarbeitung natürlicher Sprache – für Kisuaheli, das von zig Millionen Menschen in Ostafrika gesprochen wird, nur etwa zwanzig.