KI verstehen: Sora und Co. – welche Folgen hat der Aufstieg der Video-KI?
Die Vorstellung der KI-Anwendung Sora, die anhand von Userprompts täuschend echte Videos generieren kann, hat in den letzten Wochen für große Aufmerksamkeit gesorgt. Dabei war nicht jede Reaktion positiv: Wir beleuchten die Risiken, aber auch das Potenzial einer derartigen KI und denken über eine mögliche Regulierung durch den AI Act der EU nach.
Innerhalb der letzten anderthalb Jahre ließ sich eine beispiellose Entwicklung Künstlicher Intelligenz beobachten. Generative KI erfindet sich seit der Vorstellung von ChatGPT konstant neu und zeigt immer wieder andere Anwendungsmöglichkeiten. In den letzten Wochen begann nun wieder eine kleine Revolution, denn die Möglichkeiten der KI-Generierung von Videos entwickeln sich aktuell mit großen Schritten weiter.
Die Hochphase der Video-KI
Ausschlaggebend dafür war vor allem die viel beachtete Vorstellung, der KI „Sora“ die vom ChatGPT-Betreiber OpenAI entwickelt wurde. Bislang ist zwar noch unklar, wann Sora auch der Öffentlichkeit zur Verfügung gestellt wird, einzelne Künstler:innen und andere in kreativen Berufen tätige Personen können das Tool jedoch bereits austesten: Das Programm generiert auf Prompts basierende Videos, die täuschend echt wirken und sich von real gedrehten Aufnahmen kaum noch unterscheiden lassen. Dabei werden auch Vorgängerprogramme wie DALL-E hinsichtlich der Qualität und Echtheit der Videos noch übertroffen.
Zur Erstellung der bis zu einer Minute langen Videos arbeitet Sora – anders als ihre Vorgänger – nicht Bild für Bild, sondern nutzt basierend auf ihren Trainingsdaten sog. Patches von Bildern und Videos, die zusammengesetzt werden. Hierdurch sind beispielsweise Animationen in einem bestimmten Stil oder auch besagte fotorealistische Videos möglich.
Neben Sora wurden zuletzt auch vermehrt Video-KI-Anwendungen mit konkreten Einsatzmöglichkeiten vorgestellt: Seit März generiert Stable Video 3D etwa 3D-Modelle, die beeindruckend akkurat und realistisch erscheinen. Die KI Diffuse des Ex-CEO des KI-Unternehmens Snap, die im April vorgestellt wurde, kann ein vom User hochgeladenes Selfie vor unterschiedlichsten Hintergründen animieren. Ähnlich arbeitet die Google-KI Imagen, die seit diesem Monat auch zu Animationen in der Lage ist. Noch im Laufe dieses Jahres soll zudem Premiere Pro, das Video-Bearbeitungsprogramm des Adobe-Unternehmens, um generative KI-Videofunktionen ergänzt werden.
Kreative Möglichkeiten für alle
Während Diffuse, Imagen und Stable Video 3D durch ihre begrenzten Einsatzmöglichkeiten auch nur begrenzte Folgen für Anwender:innen haben, sieht das bei Sora als Video-Allrounder anders aus. Als großen Vorteil werden hier vor allem die beinahe unbegrenzten kreativen Möglichkeiten genannt, die für Filmschaffende auch bei kleinem Budget ganz neues Potenzial für Videos eröffnen. Etwa hinslichtlich von unrealistischen Elementen oder solchen, die praktisch sonst nur mit hohem Aufwand umsetzbar wären.
Gleichzeitig kommt man bei näherer Beschäftigung mit den Möglichkeiten von Sora auch an den Risiken und Problemen nicht vorbei. So wirft diese Entwicklung speziell für die Filmindustrie Fragen und Zukunftsängste auf, die sich nicht einfach aus dem Weg räumen lassen: Besonders für Schauspieler:innen, Regisseur:innen und Animations-Künstler:innen sind die Konsequenzen für ihre Jobs noch komplett unklar. Bereits während der monatelangen Streiks der US-amerikanischen Schauspielergewerkschaft SAG-AFTRA war die Regulierung des KI-Einsatzes in der Industrie eines der Kernthemen. Nun dürften die – damals noch eher vagen – Sorgen wesentlich konkretere Gestalt angenommen haben. Immerhin hat OpenAI allen Schauspieler:innen zugesichert, sie nicht als KI-Abbilder in Sora-Videos zu verwenden.
Konsequenzen für Recht, Politik und Gesellschaft
Damit hängen auch Fragen zusammen, die Sora im Bereich des Urheberrechts aufwirft: Wessen geistiges Eigentum sind die KI-generierten Videos? Können Trainingsdaten problemlos verwendet werden oder wird hier das Urheberrecht verletzt, wenn Teile der Trainings-Videos in den Patches des Resultats auftauchen? OpenAI zufolge wird unter anderem auch urheberrechtlich geschütztes Material für das Training verwendet, da die Weiterentwicklung der Technologie ansonsten „unmöglich“ sei. Aktuell läuft daher eine Klage der New York Times gegen Sora, zudem sieht der YouTube-CEO Neal Mohan in der Verwendung von YouTube-Inhalten als Trainingsdaten einen Verstoß gegen die Nutzungsbedingungen seiner Plattform.
Besonders hoch ist zudem das Risiko, dass durch Sora-Videos Deep Fakes und Desinformation erstellt und verbreitet werden. Besonders im Superwahljahr 2024 kann diese Gefahr wohl gar nicht überschätzt werden: Die Grenze zwischen Wahrheit und Fake könnte dann kaum noch klar gezogen werden, wenn Sora dieses Jahr noch wie geplant auf den Markt kommt.
Hieran wird besonders deutlich, wie notwendig eine sinnvolle KI-Regulierung ist. Mit großer öffentlicher Wirkung wurde genau dafür in der EU kürzlich der AI Act beschlossen. Doch kann dessen Regelungen eine Umgangsweise mit Anwendungen wie Sora entnommen werden?
Sinnvolle Regulierung durch den AI Act?
Das Kernstück des AI Act ist die Unterteilung in die Risikoklassen „unannehmbar“, „hoch“ und „gering/minimal“, aus der sich jeweils bestimmte Konsequenzen ergeben: Je höher das Risiko einer Anwendung eingeschätzt wird, desto strenger werden auch die Auflagen. Als generative KI unterliegt Sora bzw. OpenAI in der EU bestimmten Transparenzpflichten. Zudem muss bei der Generierung oder Manipulation von Videoinhalten, die einen Deep Fake erzeugen, das Ergebnis als KI-generiert gekennzeichnet werden.
Ob dies als Regulierung ausreicht und sich effektiv umsetzen lässt, kann vor dem Inkrafttreten des AI Act ab Mitte dieses Jahres schwerlich beurteilt werden. Voll zur Anwendung kommen die darin enthaltenen Regelungen auch erst innerhalb der nächsten zwei Jahre. Zusätzlich müssen zur Klärung von Auslegungsfragen die ersten Entscheidungen des neu eingerichteten AI-Büros der EU sowie die ersten Fälle vor Gericht abgewartet werden. Als Präzedenzfälle im neuen Feld der juristischen KI-Regulierung dürften diese spannend werden.
Zwar haben sich die EU-Institutionen bei der Ausarbeitung des AI Acts darum bemüht, diesen möglichst flexibel zu halten und so auch auf neue Entwicklungen reagieren zu können. Es bleibt dennoch offen, ob die Regulierung mit der ständigen Entwicklung neuer Anwendungen Schritt halten kann und sich weiterhin auf neue Fälle anwenden lässt.
Am hier geschilderten Fall zeigt sich auch, dass generative KI nicht verallgemeinert betrachtet werden kann: Die Video-KI Sora hat ganz andere Potenziale und daher auch andere Risiken als Text-Tools wie etwa ChatGPT. Zur Einschätzung der gesellschaftlichen und politischen Folgen ist daher im Zweifelsfall für jede KI-Anwendung letztlich stets eine Einzelfallentscheidung notwendig.
Auch wir haben bereits in der Serie „KI im Bundestag“ mit einer KI-Video-Software experimentiert:
Hier finden Sie die vollständige Artikel-Serie „KI im Bundestag“.