Endlich mit Tieren sprechen – dank KI machen wir dabei Fortschritte
KI-Modelle werden mit Datensätzen trainiert. Während es von menschlicher Sprache bereits Unmengen an Daten gibt, sind jene von Tierlauten gering. Aktuelle Forschungsprojekte wollen das ändern und vergleichen etwa Hundelaute oder Walgesang.
Die Vorstellung wirkt verlockend: Wie Dr. Dolittle mit Tieren sprechen zu können. Oder wenigstens in groben Zügen verstehen, was sie mit ihren Lauten mitteilen. Von Ersterem sind wir noch weit entfernt, bei Letzterem wurden in den vergangenen Jahren aber erstaunliche Fortschritte erzielt. Vor allem dank des Einsatzes von KI.
Die jüngste Studie auf diesem Gebiet stammt von der Universität Michigan. Sie entschlüsselt das Gebell von Hunden. Dafür fütterten die Autoren das für menschliche Sprache entwickelte KI-Modell Wav2Vec2 mit den Lauten von 74 verschiedenen Hunden aus Mexiko. Dabei handelte es sich vor allem um Chihuahuas, Pudel und Schnauzer, die während verschiedener Situationen bellten. Beispielsweise bei energischem Klopfen an der Haustüre, bei einem (vorgetäuschten) Angriff auf die Hundehalterin oder beim Spielen.
Der trainierten KI gelang es daraufhin, Hundelaute mit einer erstaunlichen Zuverlässigkeit dem korrekten Geschlecht, der korrekten Rasse und dem Gemütszustand des Hundes zuzuordnen. Wer dabei allerdings die Präzision eines olympischen Bogenschützen erwartet, wird enttäuscht.
Das Geschlecht wurde bei 70 Prozent der Versuche erkannt (bei einer 50:50-Chance). Die Bestimmung der Rasse gelang bei 62,28 Prozent der Fälle. Genauso erfolgreich (62,18 Prozent) war das Zuweisen einer von vier Gemütslagen. Die KI unterschied dabei, ob der Hund eine fremde Person aggressiv anbellte, ob er sie normal anbellte, ob der Hund feindselig knurrte oder ängstlich winselte.
Ein aggressives Bellen von einem ängstlichen Winseln zu unterscheiden - noch geht es bei der Erkennung von Tierlauten um rudimentäre Unterscheidungen. Von "Ich möchte lieber einen Knochen als eine Wurst" sind wir noch sehr weit weg.
Der Schlüssel zum besseren Verständnis von Tier-Lauten sind die Datensätze. Mit diesen werden die KI-Modelle trainiert. Von der menschlichen Sprache existieren enorme Datenmengen. Nicht so bei Tieren. Doch dort, wo sie bereits mit einem gewissen Umfang vorhanden sind, bei Meeressäugern wie Orcas und Pottwalen und bei Vögeln, hat die KI-Forschungstätigkeit in den letzten Jahren stark zugenommen.
Mit U-Booten Wale belauschen
Sehr weit fortgeschritten ist das Projekt CETI. Die Gruppe vereint Experten auf dem Gebiet der Linguistik, des maschinellen Lernens, der Kryptographie, der Unterwasserakustik und der Robotik. Mit neu entwickelten Roboter-U-Booten belauscht CETI Wale - und filmt sie dabei dank neuster Kameratechnik auch in tiefen Gewässern. Obwohl KIs mit grossen Datensätzen dank neuronaler Netzwerke auch ohne Anhaltspunkte Lautmuster erkennen können, ist doch jeder Zusammenhang, in den ein Tierlaut gebracht werden kann, Gold wert.
Einen ersten Erfolg konnte CETI bereits vermelden. Eine von der Gruppe trainierte KI kann die Stimmen der Wale unterscheiden und einzelne Laute mit einer Präzision von 94 Prozent dem korrekten Wal zuordnen. Ausserdem publizierte das Team kürzlich eine Studie, die darauf hindeutet, dass Wale auf eine Art phonetisches Alphabet zurückgreifen. Dies deute darauf hin, dass die Meeressäuger über eine komplexe und hochentwickelte Kommunikation untereinander verfügen.
Noch sind die Erkenntnisse klein - und doch ist es ein enormer Schritt in Richtung Verständnis der Pottwal-Sprache. Mit den rasanten Fortschritten, welche aktuell mithilfe der Künstlichen Intelligenz erzielt werden, kann man davon ausgehen, dass der Pottwal-Code, sollte er existieren, in überschaubarer Zukunft geknackt werden kann - was wiederum einen gigantischen Strauss an Fragen eröffnet. Vor allem ethische. Wie wird am besten auf die Tiere zugegangen? Wer wird mit den Walen kommunizieren? Und wie? Wale sind Wildtiere. Jede Form von Kommunikation mit ihnen ist ein Eingriff in ihre Lebensweise - mit unvorhersehbaren Folgen.
So wie bei Dr. Dolittle ist es eben nicht. Die Vorstellung von einer lustigen kleinen Plauderstunde mit einem Meeressäuger ist naiv. "Wir sehen einen Pottwal, der mit seiner Brustflosse winkt, und denken, er sagt 'Hallo'", beschreibt Akustikökologin Michelle Fournet von der Cornell University das Problem gegenüber National Geographic. Dabei sind Pottwale normalerweise einfach nur aggressiv.
Dieser Beitrag ist zuerst auf "Watson.ch" erschienen.
Lesen Sie ausserdem: Der Internet-Proxy-Anbieter Geonode behauptet, dass Bluetooth-Lautsprecher einen "Leerlaufton" von sich geben, der Haustieren schade. Experten der Universität Zürich halten die Behauptungen für falsch.