Dies soll nun wirklich kein Sprachblog werden, denn das kann Anatol Stefanowitsch sowieso viel besser. Aber auch ohne dass wir uns hier und nebenan um die Ursachen und Folgen sprachlicher Ambiguitäten behakeln, hätte ich folgende Story aus der New York Times am Dienstag sehr spannend gefunden: Selbst eine der gescheitesten Maschinen, ein Supercomputer namens Nell (für Never-Ending Language Learner), kämpft vergeblich mit Zweideutigkeiten der Sprache. Und scheitert manchmal an Formulierungen, die selbst einem alltagsgebildeten Menschen spontan eindeutig erscheinen.

Nell läuft, gesponsert von Google und der Darpa, seit Januar dieses Jahres rund um die Uhr; der Computer ist instruiert, sich sein Wissen aus unstrukturierten Webseiten selbst anzulesen. Und das geht, wie mir scheint, erstaunlich gut: Nell hat sich inzwischen über 440.000 Fakten angeeignet, weiß zum Beispiel, dass parotid branch of posterior auricular artery ein Blutgefäß, genauer gesagt, eine Arterie ist, dass der Lancelin island skink ein Reptil ist und der Martin Luther King Jr. Parkway eine Straße. Rund 87 Prozent der angelesenen Fakten sind, wenn man dem Datenblatt der Uni-Webseite glauben darf, korrekt – was vermutlich besser ist als der Durchschnitt dessen,was ich mir in meinem Leben so an “Wissen” (und Irrtümern, versteht sich) angeeignet habe. Na gut, dass ein Parkway eine Straße ist oder ein Skink ein Reptil ist eher eine rudimentäre Information, mit der man ohne ein Wo und Wie und Wann nicht viel anfangen kann. Aber immerhin, das hat sich die blecherne Nellie ganz von alleine beigebracht.

Manchmal liegt sie aber auch ein bisschen daneben (darf ich, ohne jetzt als Sexist verdächtigt zu werden, das weibliche Pronomen verwenden? “Nell” ist zwar eigentlich hier ein Akronym, aber eben auch ein Frauenname), zum Beispiel bei der Erkenntnis, dass “John ein Musiker und Teil von Peter Gabriel” ist, kann man einfach so nicht sagen.

Aber voll an ihre Grenzen stößt Nell, wenn Sprache – in diesem Fall das Englische, aber Vergleichbares ließe sich auch für Deutsch und wohll jede andere Sprache kosntruieren – mehrdeutig ist. Durch Metaphern, beispielsweise (die sich nichtt einer würtlichen Sinndeutung erschließen), oder Mehrfachbedeutung von Wörtern, oder auch durch scheinbar gleich verlaufende Satzkonstruktionen: “Das Mädchen fing den Schmetterling mit den Punkten” und “Das Mädchen fing den Schmetterling mit dem Netz” würde Nell glauben machen, dass Punkte und Netz irgendwie in die gleiche Kategorie gehören, da beide Sätze, abgesehen von dem jeweiligen Attribut, identisch aufgebaut sind. Ich denke mal, dass ich hier die Bedeutungsunterschiede, die sich uns ja förmlich aufdrängen, nicht besonders erklären muss …

Und solche Lernfehler können dramatische Folgen haben: Laut der NYTimes-Story wurde Nell durch die metaphorische Verwendung des Wortes “Cookie” für kleine Web-Dienstprogramme in eine Kettenreaktion von Fehlinterpretationen gestürzt:

Things went awry after NELL’s noun-phrase classifier decided “Internet cookies” was a baked good. (Its database related to baked goods or the Internet apparently lacked the knowledge to correct the mistake.) NELL had read the sentence “I deleted my Internet cookies.” So when it read “I deleted my files,” it decided “files” was probably a baked good, too.

Nur durch manuelles Eingreifen des Versuchsleiters Tom M. Mitchell konnte der “Denk”-Fehler behoben und die Lernfehler bereinigt werden.

Dass es ohne menschliche Hilfe nicht geht, mag AI-Puristen als ein Mangel erscheinen. Und dass Ironie, absurde Späße oder auch originelle Sprachbilder eine “Denkmaschine” auch noch auf lange Zeit, wenn nicht gar für immer aus dem Tritt bringen werden, habe ich hier schon vermutet. Aber auch wir Menschen brauchen Lehrer als Korrektiv; wenn ich mir mein Wissen alleine aus dem World Wide Web holen müsste, würde ich mein Hirn vermutlich nicht nur zu 32 Prozent mit Mist verkleben. Mal sehen, was Nell in fünf Jahren weiß. Und was mich betrifft: οἶδα οὐκ εἰδώς (letzteres angelesen aus dem Web, und nicht auf Korrektheit geprüft).

flattr this!

Kommentare (3)

  1. #1 rolak
    6. Oktober 2010

    Ob es letzendlich ohne menschliche Hilfe geht, sei mal dahingestellt, immerhin kommt das Lernen bei uns Menschen auch nicht völlig ohne Hilfe aus. Vielleicht heißt es irgendwann nur noch ‘ohne Hilfe eines schon weiter gelernt habenden’, also deutlich über Geschlechtsneutralität hinaus 😉

  2. #2 MartinB
    6. Oktober 2010

    Ich finde das mit den “cookies” eigentlich sogar ein gutes Zeichen. Wenn man jemandem vor 20 jahren erzählt hätte: “ich musste mal die Kekse auf meinem Rechner löschen”, hätte man vermutlich auch ziemlich verwirrte Blicke geerntet. Menschen können manche Dinge auch nur durch erklären lernen (und Kinder lernen Sprache ja eben auch vor allem interaktiv, deswegen nützen ja auch Lernvideos etc. für kleine Kinder nichts), warum sollte das bei einer KI anders sein?

  3. #3 Threepoints...
    6. Oktober 2010

    Wie erfahren die denn die Fehlinterpretation? Wird Nell da jeden Morgen zum Raport gebeten? Oder fragen also die Leute am Projekt jeden Morgen erstmal das”neue” Wissen ab?

    Nell! Zum Diktat bitte….