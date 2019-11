Anzeige

Memphis. Die frei verfügbare und kostenlose App Google Translate liefert beim Übersetzen zuverlässige Ergebnisse - so zuverlässig, dass sie in softwarebasierte wissenschaftliche Textuntersuchungen einbezogen werden können. Das berichten Forscher um Leah Windsor von der University of Memphis (Memphis, Tennessee, USA) im Fachmagazin "Plos One". Sie hatten in ihrer Studie untersucht, wie gut das Programm Sätze ins Englische zurück übersetzen kann, die vom Menschen aus dem Englischen in verschiedene Sprachen übersetzt worden waren.

Ausgangspunkt für ihre Untersuchung war die Tatsache, dass in der sozialwissenschaftlichen Forschung zur internationalen Politik zumeist englischsprachige Textquellen herangezogen werden - Originalquellen aus anderen Sprachen werden bei Textanalysen meist nicht berücksichtigt. Dies könne die Ergebnisse beeinflussen. Die Forscher wollten testen, ob sich dies ändern lässt. Konkret: ob automatische Übersetzungen durch den Google-Übersetzer fremdsprachige Quellen in geeigneter Weise erschließen können.

3447 analysierte Sätze

Dazu verwendeten sie ein Programm namens LIWC (Linguistic Inquiry and Word Count - Sprachabfrage und Wortzahl). "LIWC ist ein nützliches Instrument, um Sprachmuster zu identifizieren: bedrohende Sprache und Täuschung, geschlechtsspezifische Sprache, soziale Bedeutung und Persönlichkeit sowie Hierarchie und Status in undurchsichtigen politischen Gruppen", heißt es in der Studie. Da LIWC für wissenschaftliche Sprachanalysen eingesetzt wird, überprüften die Forscher die Güte von maschinellen Übersetzungen mittels dieses Programms.

Als Textbasis dienten ihnen Dokumente der Vereinten Nationen, die aus dem Englischen von professionellen menschlichen Übersetzern in die Sprachen Russisch, Arabisch, Chinesisch, Französisch und Deutsch übersetzt worden waren. Nach der Anwendung einiger Ausschlusskriterien (die Sätze durften nicht zu kurz und nicht zu lang sein und möglichst keine Standardformulierungen enthalten) wurden 3447 Sätze analysiert. Dabei verglichen Windsor und Kollegen den englischen Originaltext mit den englischen Rückübersetzungen von Google Translate aus den anderen Sprachen mit Hilfe von LIWC.

Abweichungen - aber wesentliche Textelemente bleiben erhalten

Im Ergebnis wichen zwar das Original und die rückübersetzten englischen Texte voneinander ab. Dennoch blieben die wesentlichen Textelemente in unterschiedlichen Kategorien erhalten. Zu den Kategorien gehörten zusammenfassende Sprachvariablen, sprachliche Dimensionen, andere Grammatik, psychologische Prozesse sowie Zeichensetzung. Unter "psychologische Prozesse" wird hier die Zuordnung von Wörtern zu Bedeutungsinhalten wie Emotionen, Antriebe, Wahrnehmungsprozesse oder Zeitorientierung verstanden.

Die Forscher kommen zu dem Fazit: "Wir stellen fest, dass es zwar statistisch signifikante Unterschiede zwischen dem Originaldokument und dem übersetzten Dokument gibt, die Effektgrößen jedoch relativ gering sind, insbesondere bei der Betrachtung der psychologischen Prozesse." In künftigen Studien möchte das Team um Windsor ganze Texte anstatt einzelner Sätze einbeziehen und den Satzbau und die Bedeutung des Textes genauer untersuchen.

RND/dpa