Vrodocast: Podcast Über Die Zukunft Der Computer

VRODOCAST #73: Sprach-KI, Täuschungssticker und unsichtbare Stunden

Informações:

Sinopsis

Künstliche Intelligenz lernt besser sprechen, lässt sich dafür aber von einem einfachen Sticker austricksen. Sven erzählt über das VR-Spiel The Invisible Hours. Neue Sprachausgabe: Google-KI klingt wie ein Mensch Googles KI-basierte Sprachsynthese Tacotron 2 verwandelt Text in Sprache. Das ist noch nicht neu, mit dem Google Assistenten kann man seit Jahren Gespräche führen. Neu ist, dass die Sprachausgabe jetzt kaum mehr vom Klang einer menschlichen Stimme zu unterscheiden ist. Google stellte einige Audiovergleiche zwischen Mensch und Computer online, bei denen man die Roboterstimme nicht mehr verlässlich heraushören kann. Die Forscher evaluierten Tacotron 2 mit dem sogenannten "Mean Opinion Score" und erzielten auf einer Skala von 1 bis 5 einen Wert von 4,525 – eine reale Sprachaufnahme eines Menschen erreicht im Schnitt einen Wert von 4,58. Google-KI klingt wie ein Mensch: https://vrodo.de/neue-sprachsynthese-google-ki-klingt-jetzt-wie-ein-mensch/ Simpel-Hack: Einfacher Sticker bringt Bildanalyse-KI aus