Digitales Puzzeln: Mit KI antike Texte entschlüsseln

  • 33 000 Tonscherben aus dem antiken Mesopotamien sollen mithilfe von Künstlicher Intelligenz entschlüsselt werden.
  • Die schwierige Keilschrift muss dafür erst einmal dem Algorithmus beigebracht werden.
  • Etwa 2020/2021 wird vermutlich mit der Entschlüsselung begonnen.
Anzeige
Anzeige

München. Die Arbeit von Forschern wie Enrique Jiménez ist mühsam, zeitaufwendig, und leicht schleichen sich Fehler ein. Mit Lupe und Lampe entziffern Altorientalisten wie der 34-jährige Spanier und Wahl-Münchner Tonscherben, auf die Menschen vor Jahrtausenden mit Griffeln Schriftzeichen geritzt haben: die sogenannte Keilschrift. Aus einem Wust an Scherben und Fragmenten gilt es, passende Teile zusammenzusetzen, die einen Text ergeben - Puzzeln wie Profis eben.

Künstliche Intelligenz soll Texte entschlüsseln

Es könne schon einmal den ganzen Tag dauern, um eine einzelne Scherbe zu entziffern und ihren Platz in einem Text zu ermitteln, sagt Jiménez. Bei rund 33 000 größeren und kleineren Tonscherben, die er erforschen will, kämen auf die traditionelle Weise also wohl einige tausend Arbeitstage zusammen. Genau damit soll bald Schluss sein. Mit künstlicher Intelligenz (KI) will der Wissenschaftler von der Ludwig-Maximilians-Universität (LMU) München seine Arbeit erleichtern. Der Professor tüftelt mit zehn Mitarbeitern an einer Datenbank und einem Algorithmus, der das große Puzzle schneller zusammensetzen soll. „Wenn der Algorithmus fertig ist, soll er in der Lage sein, einzelne Textsequenzen mit der Datenbank abzugleichen und Fragmente zu finden, die zusammengehören könnten“, erklärt Jiménez.

Weiterlesen nach der Anzeige
Anzeige

Lesen Sie auch: Künstliche Intelligenz schreibt „Harry Potter“-Kapitel - so fällt das Ergebnis aus

Zehntausende Fragmente noch unentschlüsselt

Die rund 33 000 Tonscherben stammen aus dem antiken Mesopotamien, dem Zweistromland im heutigen Irak. In der einstigen Stadt Ninive am Ufer des Tigris - heute liegt dort die Großstadt Mossul - hatte im 7. Jahrhundert vor Christus ein König eine Bibliothek zusammengetragen. Im 19. Jahrhundert wurde sie entdeckt. Zehntausende Fragmente lagern heute weitgehend unentschlüsselt im British Museum in London.

Der Altorientalist, Enrique Jiménez, arbeitet daran, die Anfänge der Weltliteratur zu rekonstruieren. © Quelle: Peter Kneffel/dpa
Anzeige

Sumerisch und Akkadisch, statt Altgriechisch und Latein

Jiménez kommt aus Granada. Er hat in Madrid, Heidelberg und an der US-Elite-Uni Yale studiert, bevor er für seine Forschung nach Deutschland zog. Begonnen hat er mit klassischer Philologie. Doch er habe den Eindruck gehabt, dass es in Altgriechisch und Latein nicht mehr viel zu entdecken gebe. So sei er zur Assyriologie gekommen, die sich mit Literatur in Sumerisch und Akkadisch aus den ersten Jahrtausenden vor Christus befasst. „Man kann die erste Person sein, die einen Text seit der Antike liest, und das fast jeden Tag. Das finde ich faszinierend“, erzählt er.

Anzeige

KI muss Keilschrift lernen

Die Schriften in lateinische Zeichen zu übertragen, ist die erste Aufgabe, die Jiménez in seinem Projekt lösen will. Zwei Fotografen in London machen Bilder der Scherben, sein Münchner Team transkribiert die Texte und baut ein digitales Archiv auf, das „Fragmentarium“. Eine der ersten Hürden dabei ist die Keilschrift selbst. Denn: Es gibt keine Rechtschreibregeln. Ein Zeichen könne viele Bedeutungen und ein Wort viele Schreibweisen haben, sagt Jiménez. Diese gilt es, dem Algorithmus beizubringen. „Der Computer kann alle Lesarten und Bedeutungen gleichzeitig in Betracht ziehen. Ihm reichen einzelne Sequenzen, die für sich genommen bedeutungslos erscheinen.“

Die Keilschrift ist nicht einfach zu entziffern - das muss auch ein Computer erst lernen. © Quelle: Peter Kneffel/dpa

Auch interessant: Wie können wir Algorithmen sinnvoll nutzen?

Algorithmus für DNA-Daten soll abgewandelt werden

Der Algorithmus soll im zweiten Schritt programmiert werden. Dabei nutzt Jiménez ein erprobtes KI-Werkzeug aus der Biologie: den sogenannten BLAST-Algorithmus. BLAST steht für „Basic Local Alignment Search Tool“ und wird in der Biologie etwa genutzt, um DNA-Daten zu vergleichen. Seine Abwandlung will Jiménez „CuneiBLAST“ nennen - angelehnt an das englische Wort für Keilschrift (Cuneiform). Mit seinem KI-Projekt liegt Jiménez voll im Trend. Allein an der LMU wird nach Angaben der Universität in mehr als einem Dutzend Bereichen mit KI geforscht, zum Beispiel in Naturwissenschaften, Philosophie und BWL. Eine genaue Zahl der Projekte kann die LMU nicht nennen.

Anzeige

Nutzung von KI noch in den Anfängen

Auch Archäologen, deren Arbeit mit der von Jiménez verknüpft ist, sehen in KI großes Potenzial. „Künstliche Intelligenz wäre in der Archäologie sehr nützlich, um große Datenmengen zu bearbeiten“, die meist nicht von Menschen bewältigt werden könnten, sagt Sebastian Hageneuer, Archäoinformatik-Experte an der Universität Köln. Algorithmen könnten helfen, Satellitenbilder, Fotos von Funden oder eben Schriftfragmente zu sortieren. Bislang gebe es aber noch nicht viele KI-Projekte. „Die Nutzung von künstlicher Intelligenz beginnt gerade, für die Archäologie interessant zu werden“, sagt Hageneuer.

Auch das Projekt von Jiménez steckt noch in der Anfangsphase. Im Mai 2018 ist es gestartet, fünf Jahre soll es dauern. Den mit 1,5 Millionen Euro dotierten Sofja-Kovalevskaja-Preis der Alexander von Humboldt-Stiftung hat er bekommen, um es zu finanzieren. Etwa 2020/21 sollen „Fragmentarium“ und Algorithmus stehen. „Das eigentliche Puzzlespiel beginnt erst dann“, sagt Jiménez.

Das könnte Sie auch interessieren: Deepfake: Bill Hader imitiert Tom Cruise - Unterhaltung oder Gefahr?

RND/dpa