Homepage

Krasse Technik

KI lässt Personen andere Sprachen sprechen und passt Mundbewegungen an

KI lässt Personen andere Sprachen sprechen und passt Mundbewegungen an ki-heygen-direkte-videouebersetzung-mit-lippenbewegungen

Gestern habe ich ein Video bei Twitter gesehen und geteilt, das ich dann doch noch einmal separat hier im Blog bringen und vor allem mit ein paar Drumherum-Informationen aufbereiten möchte. Darin bekommen wir Regisseur Jon Finger zu sehen, wie er eine KI-gefütterte Videobearbeitungs-Software ausprobiert, die Personen in Videos eine andere Sprache sprechen lässt. Aber nicht einfach nur mittels einer stumpfen Übersetzung oder gar einer stimmlichen Anpassung, nein, die Lippenbewegungen werden derart angepasst, dass man das Gefühl hat, er spräche tatsächliche Französisch bzw. Deutsch – dabei beherrscht er beide Sprachen kein bisschen. Seht und staunt selbst:

Die Übersetzung ist (zumindest, was das Deutsche anbelangt, das ich nachvollziehen kann) natürlich nicht 100-prozentig sauber gelungen, aber das ist noch am einfachsten zu verbessern. Die Stimm-Imitation sowie die Einarbeitung der Lippenbewegungen finden aber auf einem atemberaubenden Level statt. Das ist ein absoluter Game Changer, der leider nicht nur viele tolle und kreative Dinge zulässt, sondern auch Fake News Tür und Tor öffnen wird. So wurde zum Beispiel neulich ein Video rumgereicht, das vermeintlich zeigt, wie Lionel Messi bereits nach kurzer Zeit in den USA sehr ordentliches Englisch spricht – das hat er aber nie so vorgetragen:

Dahinter steckt HeyGen, ein Anbieter, der KI-Videos generieren lässt. Eigentlich soll das ein Ersatz für eine reale Videoproduktion sein, so dass man ohne Kamera mittels künstlicher Avatare und Sprach-Generierung aus Scripten Videos erstellen kann. Jetzt lassen sich also auch noch spielerisch bestehende Realaufnahmen anpassen. Absoluter Irrsinn! Hier noch ein paar schnelle Beispiele für den Effekt:

Wir sind in der Zukunft anbelangt. KI hat innerhalb des letzten Jahres einen gewaltigen Sprung gemacht und wird durch den Einstieg in den Mainstream mit all seinen zahlreicher werdenden Anwendungsfällen immer schneller dazu lernen. Was mit „Haha, schau mal, ich tausche mein Gesicht mit einem anderen aus!“ angefangen hat, wird jetzt halt „Ich lasse einen weltbekannten Argentinier lupenreines Englisch reden“.

Die Möglichkeiten sind natürlich enorm. Man stelle sich vor, wie interne und externe Kommunikation eines international agierenden Unternehmens aussehen kann. Die Ansprache der Geschäftsführung wird einfach direkt in X Sprachen transferiert, wobei sich jedes wie eine direkte Ansprache anfühlt, da es aussieht und sich anhört, als wäre die Sprache auch wirklich gesprochen worden. Auch mit Hinblick auf Reise-Erfahrungen ist das eine gewaltige Innovation. So bleibt kaum erahnbar, was wir noch alles binnen der nächsten Jahre und Jahrzehnte erleben können, das bis vor Kurzem noch als unerreichbare Science Fiction galt.

4 Kommentare

  1. Pingback: Pizza während der Lieferung im Ofen zubereitet - Motorrad-Upgrade

  2. Pingback: Fake-KI-Chat-App, in der ein Mensch die Antworten schreibt - total "human-like"

  3. Pingback: Die wichtigsten aktuellen technologischen Umbrüche - In Kooperation mit Dieter Theissen

  4. Pingback: Die Top 7 missverstandenen Anglizismen - In Kooperation mit Andreas Schreiner

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Abo ohne Kommentar

Hinweis: Bei Kommentieren werden angegebene Daten sowie IP-Adresse gespeichert und Cookies gesetzt (öffentlich sichtbar sind nur Name, Website und Kommentar). Alle Datenschutz-Infos gibt es hier. Dank Cache/Spam-Filter sind Kommentare manchmal nicht direkt nach Veröffentlichung sichtbar (aber da, keine Angst).
Support the blog!

INSTAGRAM

Hallo!

Ich bin Maik Zehrfeld und habe diesen Blog 2006 aus Langeweile heraus gegen die Langeweile gegründet. Mittlerweile stellt LangweileDich.net eine Bastion der guten Laune dar, die nicht nur Langeweile vertreiben sondern auch nachhaltig inspirieren will. Gute Unterhaltung!

Blogroll Archiv Unterstützen Kontakt Mediadaten sponsored Beratung Datenschutz Cookies RSS

Um Werbung im Blog auszublenden, als "Langweiler:in" bei Steady einloggen.

DANKE an die "Langweiler:innen" der höheren Stufen: Andreas Wedel, Daniel Schulze-Wethmar, Goto Dengo, Annika Engel, Dirk Zimmermann, Marcel Nasemann, Kristian Gäckle und Christian Zenker.

Langeweile seit 6438 Tagen.