- Das neue AvatarFX-Tool von Character.AI kann ein einzelnes Foto in ein realistisches Video verwandeln
- Das Video zeigt ein Standbild mit synchronisierten Lippenbewegungen, Gesten und langen Darbietungen
- Das Tool unterstützt alles von menschlichen Porträts bis hin zu Fabelwesen und sprechenden unbelebten Objekten
Bilder sagen vielleicht mehr als tausend Worte, aber Character.AI sieht keinen Grund, warum Bilder diese Worte nicht selbst sprechen sollten. Das Unternehmen hat ein neues Tool namens AvatarFX entwickelt, das Standbilder in ausdrucksstarke, sprechende, singende und gestikulierende Video-Avatare verwandelt. Und nicht nur Fotos von Menschen, Tieren, Gemälden von Fabelwesen, sondern sogar unbelebte Objekte können sprechen und Emotionen ausdrücken, wenn sie eine Sprachprobe und ein Skript enthalten.
AvatarFX produziert überraschend überzeugende Videos. Von präziser Lippensynchronisation über nuancierte Kopfneigungen und hochgezogene Augenbrauen bis hin zu angemessen dramatischen Handgesten ist alles vorhanden. In einer Welt voller KI-generierter Texte, Bilder, Lieder und mittlerweile auch ganzer Podcasts mag AvatarFX wie ein weiteres cleveres Spielzeug klingen. Doch das Besondere an AvatarFX ist die nahtlose Verbindung von Sprache und Bild. Sie können ein Porträt, einen Dialog und einen Ton eingeben, und Character.AI bezeichnet das Ergebnis als Performance – eine, die auch für lange Videos geeignet ist, nicht nur für wenige Sekunden.
Das liegt an der zeitlichen Konsistenz des Modells. So lässt sich sagen, dass dem Avatar nicht plötzlich zwischen den Sätzen eine dritte Augenbraue wächst oder er mitten im Monolog vergisst, wo sein Kinn hingehört. Die Bewegungen von Gesicht, Händen und Körper synchronisieren sich mit dem Gesagten, und das Endergebnis wirkt, wenn auch nicht lebendig, so doch zumindest lebendig genug, um in einem Late-Night-Werbespot mitzuspielen oder als Gastmoderator einen Podcast über Weltraumechsen zu moderieren. Nur Ihre Kreativität steht zwischen Ihnen und einer KI-generierten Seifenoper mit dem Familienkühlschrank in der Hauptrolle. Einige Beispiele finden Sie in der Demo unten.
Avatar am Leben
Natürlich bringt die Fantasie des magischen sprechenden Bilderrahmens auch einige Nachteile mit sich. Ein KI-Tool, das lebensechte Videos erstellen kann, weckt verständlicherweise Bedenken. Character.AI scheint diese Bedenken mit integrierten Sicherheitsmaßnahmen für AvatarFX ernst zu nehmen.
Dazu gehört das Verbot, Inhalte aus Bildern von Minderjährigen oder Persönlichkeiten des öffentlichen Lebens zu erstellen. Das Tool verschlüsselt außerdem von Menschen hochgeladene Gesichter, sodass sie nicht mehr exakte Ähnlichkeiten aufweisen, und alle Drehbücher werden auf ihre Angemessenheit geprüft. Sollte das nicht ausreichen, wird jedes Video mit einem Wasserzeichen versehen, um deutlich zu machen, dass es sich nicht um echtes Filmmaterial, sondern nur um eindrucksvoll animierte Pixel handelt. Bei Regelverstößen gibt es außerdem eine strikte One-Strike-Regel.
Mehr lesen: Business Development: Definition, Strategien, Schritte und Fähigkeiten
AvatarFX ist nicht ohne Vorbild. Tools wie HeyGen, Synthesia und Runway haben die Grenzen der KI-Videogenerierung ebenfalls erweitert. Der Einstieg von Character.AI in diesen Bereich setzt jedoch neue Maßstäbe, indem es ausdrucksstarke Avatare mit seinen charakteristischen Chat-Persönlichkeiten verbindet. Dabei handelt es sich nicht nur um sprechende Köpfe; es sind Charaktere mit Hintergrundgeschichten, Persönlichkeiten und der Fähigkeit, sich an das letzte Gespräch zu erinnern.
AvatarFX befindet sich derzeit in der Testphase. Abonnenten von Character.AI+ haben wahrscheinlich Vorrang, sobald es verfügbar ist. Tragen Sie sich vorerst in eine Warteliste ein und träumen Sie davon, welches Selfie Ihrer Freunde sich am besten für die Präsentation eines Shakespeare-Monologes eignet. Oder welche Version Ihres Stofftiers aus der Kindheit endlich Ihr Therapeut wird.