Einmal ent-täuschen, bitte

Daß die Kennzeichnungspflicht für KI-Verwendung an der Vokabel DEEPFAKE aufgehängt ist, ist ein Geburtsfehler des EU AI Acts. Ich habe erst beim  Schreiben meines ersten Blogbeitrags dazu wirklich verstanden, warum das über die Verwendung dieses unglücklichen Begriffs hinaus so problematisch ist: weil es eine Art von Realitätsanmutung vulgo „Täuschung“ privilegiert – nämlich die, die wir seit Jahrzehnten betreiben –  und eine andere Art von Täuschung als DEEPFAKE abwertet (in Absetzung von einem normalen, nicht ganz so deepen fake oder was?) und per Kennzeichnungspflicht sanktioniert.

Anders gefragt: Wo ist eigentlich der grundsätzliche Unterschied zwischen einem KI generiertem Werbefilm, in dem die Darsteller aus der KI kommen, und einem Werbefilm, in dem ich mit Schauspielern eine Szene inszeniere, die ein Produkt bewirbt? Bei beiden wird doch mit Maximalaufwand versucht, mit allen Mitteln der Filmkunst eine Realitätsanmutung zu erzeugen. Ich hatte am Set jedenfalls noch keinmal das Gefühl, mich bei einem Dokfilmdreh zu befinden, ihr etwa? 

HAALLOOO! WIR TUN NUR SO! DER HAMBURGER SCHMECKT EIGENTLICH GAR NICHT SOOOO LECKER! UND WAS DA SO SAFTIG RAUSTROPFT IST MOTORÖL MIT FARBSTOFF, KEIN KETCHUP! Diese Herstellung einer Realitätsanmutung, die ja auch immer eine Täuschung beinhaltet, die ist seit Jahrzehnten der Kern unseres Geschäfts. Wenn wir das nicht hinbekommen, dann waren wir nicht die Guten – dann haben wir unseren Job schlecht gemacht. 

Aber in den Leitlinien für die Umsetzung des EU AI Acts ist jetzt auf einmal klar geregelt: „(…)it is sufficient for simulated persons, objects, places, entities or events to resemble someone or something that can exist or could have existed in reality to be considered a deep fake.”

Sanktioniert wird also nicht etwa die täuschende Absicht einer sehr KONKRETEN Realitätsanmutung – „Laßt uns Brad Pit per KI nachbauen wie er sich die Zähne mit einer goldenen Zahnbürste bürstet, die aber gar nicht wirklich aus Gold ist, wir werden reich, harr-harr-harr!“, sondern, abstrahierend von jeder Täuschungsabsicht, allein die UNKONKRETE MÖGLICHKEIT, dass jemand das Gesehene für real halten könnte, egal ob mit Brad Pit oder mit irgendeinem KI Darsteller.

Das aber, DamenUndHerren, gilt doch eben für jeden einzelnen Werbefilm, den wir herstellen. Und es war bisher nur dann mit Sanktionen belegt, wenn wir eine sehr KONKRETE Täuschungsabsicht bebildert haben: „Döner macht schöner“ – Verboten, weil gelogen. Aber doch bitte nicht allein deshalb, weil wir mit Schaupielern eine Situation verfilmt haben, die „existieren kann oder hätte existieren können“. Again, DAS MACHEN WIR DOCH IMMER! Entschuldigt die Großbuchstaben. 

Hier eine noch unvollständige Liste von perfiden Tricks aus Werbefilmen, die ein ähnliches Täuschungspotenzial hatten, ohne dass uns da eine Kennzeichnungspflicht vor Schlimmem bewahrt hätte. Bitte bereitet Euch auf ein paar herbe Enttäuschungen vor:

Claudia Bertani ist gar keine berühmte italienische Schauspielerin, und es gibt gar keine Piemont Kirsche. 

Villa Riba und Villa Bacho werdet ihr auf Google Maps vergeblich suchen.

Es handelt sich bei der FAIRY ULTRA Werbung auch keineswegs um einen Dokumentarfilm; vielmehr sind sämtliche Szenen mit professionellen Schauspielern nachgestellt worden. 

Das LENOR GEWISSEN („Bis eine gute Mutti“) heißt gar nicht Lenor Gewissen; es handelt sich um eine sogenannte „Doppelbelichtung“ der Schauspielerin Katrin Eckold, die auch in der Schwarzwaldklinik aufgetreten ist, auch das übrigens rein fiktional („Also ich könnte mir vorstellen, daß es wirklich eine Klinik im Schwarzwald gibt“ – „Ha, reingefallen! Schwarzwald-Deepfake!“)

Spaß beiseite: Der Unterschied zwischen klassischem Werbefilm und KI generiertem Werbefilm liegt doch ausschließlich in den Mitteln, die verwendet werden, aber weder in der Intention noch im Ergebnis. Allein das Mittel KI zu sanktionieren halte ich für komplett falsch. Ich vermute ja vor allem ein protektionistisches Motiv dahinter, nämlich Protektion zur Erhaltung traditioneller Herstellungsverfahren. Das ist ja potentiell in Ordnung –  dann soll man es aber auch sagen anstatt so zu tun, als wenn man uns arme Konsumenten vor bösen bösen Deepfakes schützen müsse.

Hervorgehoben

Sagt meiner Mutter nicht, ich wäre Deepfaker*

Seit dem 2. August besteht laut EU AI Act eine Kennzeichnungspflicht für per KI hergestelltes Bewegtbild, wenn denn eine Zuschauerin die dargestellten Inhalte mit der Realität verwechseln könnte. 

Ich habe überhaupt nichts gegen EU Regulierung, ich verbitte mir auch dämliche Witze darüber, dass die EU reguliert, wie gerade Gurken sein müssen (das tut sie wirklich) oder daß Deckel an Sprudelflaschen fixiert werden müssen, während andere Nationen Raketen bauen (der größte populistische Whataboutismus-Vergleich den ich je gesehen habe) etc Bla-Bla – ich halte die Nicht-Regulierung vieler mieser Dinge in anderen Teilen der Welt für ein deutlich größeres Problem. Aber hier hat die EU im Kern ihrer Regulierung einen Begriff etabliert, der da in dieser Form nichts zu suchen hat: Zu kennzeichnen seien nämlich „Deepfakes“. Klingt nach Christian Ulmen, DeepState, DiepStahl, nicht consensueller Pornographie, Alte Omis abzocken und so weiter, oder? Yep, das alles, und noch viel mehr. 

Was in Dreiteufelsnamen hat dieser Begriff im Herzen des EU AI Acts zu suchen? Haben wir’s nicht auch ´ne Nummer kleiner? Welcher übereifrige AI Hasser hat das denn da bitte eingeschmuggelt? Stellt euch vor, man hätte 1995 reguliert, dass alles, was mit Photoshop bearbeitet wird, mit dem Label „Mit Betrugs-Software manipuliert“ versehen werden müsse. Das hilft doch niemandem, ausser vielleicht denen, die glauben, sie könnten den Siegeszug von generativer AI zumindest in unserem kuscheligen Europa noch so lange hinauszögern, bis sie in Rente gehen dürfen. Zumal die Regulierung dann auch noch sich weigert, a) präzise und alltagstauglich zu definieren, was denn wirklich ein Deepfake ist und b) allen dieselben Labels an die Hand zu geben, mit denen sie kennzeichnen sollen, so dass zumindest diese Arbeit uns, den Werbeagenturen, und am Ende den Rechtsabteilungen der Auftraggeber erspart bliebe. Nada, nix. Insgesamt ein echter Schuss in den Fuß.

Wie kommen wir da raus? Erstens, indem wir als Produktionen uns nicht die alleinige Verantwortung dafür umhängen lassen, dieses Gesetz umzusetzen, was einem als letztes Glied in der Dienstleisterkette aus Kunde-Agentur-Produktion ja gerne mal passiert. Wir tun vielmehr das, was wir sowieso saubererweise auch ohne EU AI Act machen würden: wir informieren unsere Kunden vorab über das, was wir mit KI veranstalten, aber wir lassen uns keine Rechtsberatungspflicht umhängen, denn entscheiden und kennzeichnen müssen am Ende die Auftraggeber selber. So wie in der Arzneimittel-Werbung eben auch, nicht unser Bier. 

Ich fürchte, da müssen wir jetzt alle gemeinsam durch, bis in ein paar Jahren ein paar Gerichte und vielleicht gnädigerweise auch mal die EU selber sich da ein wenig besser präzisiert haben. Bis dahin müssen wir halt weiter unseren Müttern erzählen, wir wären Bordellpianisten, aber beileibe keine Werber oder Deepfaker.**

*Nicht, weil es mir peinlich wäre, sondern weil ich keine Lust hätte, ihr das zu erklären. Kann mir ja schon keiner erklären was das sein soll. Und was daran so deep sein soll auch nicht.

**Jaques Séguéla, 1979: „Ne dites pas à ma mère que je suis dans la publicité… elle me croit pianiste dans un bordel“.

Hervorgehoben

Besser Reinpfuschen mit AI

Wochen später ist hier meine Einschätzung zum Ben Affleck / Netflix-Deal. Für die jüngeren Semester unter uns: Er hat ihnen eine KI-Lösung für 600 Mio. USD verkauft, nachdem er vorher ein ganzes Jahr lang keine Mikrophon verschmäht hat, vor dem er AI schlechtreden konnte; AI werde nie Schauspieler ersetzen, wäre immer nur Mittelmaß etc. pp.

Betrachten wir mal diesen Deal durch die Linse des ewigen Machtkampfes zwischen Regisseuren und Auftraggebern/Produktionsfirmen darüber, wer denn den FINAL CUT bekommt und fragen uns: „Wie beeinflusst AI das Gleichgewicht in diesem strukturellen Konflikt?“

Ich würde sagen, Netflix hat sich ein Toolset angeeignet, das ihnen mehr Kontrolle über das Endergebnis verleiht – ganz gleich, was der Regisseur abliefert und ohne die Notwendigkeit von Nachdrehs. Und das ist kein bloßes „Fixing it in Post“.

GenAI leistet weit mehr als das: In den letzten 100 Jahren bestand die einzige Möglichkeit für einen Produzenten/Auftraggeber, der mit dem gelieferten Material des Regisseurs unzufrieden war, darin, neu zu drehen. Meistens war das unerschwinglich teuer. Man erinnere sich an Coppola, der die Dreharbeiten zu APOCALYPSE NOW mit Harvey Keitel in der Hauptrolle begann, ihn dann nach Hause schickte und alles mit Martin Sheen neu drehte. Dieser Film kostete letztendlich 30 Millionen statt 12 Millionen…

Nun kommt GenAI ins Spiel, die Hintergründe austauschen, Einstellungen erweitern, die Lippensynchronität ändern, Schauspieler per MoCap erfassen und am Ende ganze Szenen basierend auf dem bereits gedrehten Material erfinden kann. Also keine Nachdrehs mehr!

Mal sehen, wofür sie es wirklich einsetzen… Meine Vermutung lautet, ich übe schonmal für die Überschrift des entsprechenden Blog-Beitrags: „1.000 neue Wege, um im Nachinein an der Vision eines Regisseurs herumzupfuschen.“

AI is eating the world*

Viele wollen sich nicht von dem Anspruch verabschieden, mit echten Darstellern zu drehen, und bei Filmen, die nicht sowieso schon konzeptionell auf halbtote Schaufensterpuppen setzen (looking at you, Beauty & Fashion Peeps!) hat man da auch noch jede Menge Gründe für. Lipsynch, Dialog, Reaktionen, Subtilitäten – das sind noch nicht die größte Stärken von generativer AI.

Zugleich sind mir jüngst zwei Hollywood Grade Beispiele begegnet dafür, wie AI hier trotzdem im großen Stil eingesetzt werden und Dinge ermöglichen kann, die bisher undenkbar waren.

Da ist als erstes die WONDER PROJECT / LUMA – Produktion mit Ben Kingsley zu nennen, die für AMAZON PRIME auf eine Kombi aus LED Volume, realen Darstellern und AI MoCap setzt.

Und dann das gerade abgedrehte 70-Mio-USD Projekt von Doug Liman (Bourne Identity; Edge of Tomorrow etc.) mit Gal Gadot und Casey Affleck, der sich auch noch das LED Volume gespart hat und stattdessen den gesamten Film in einem zu einem Grayscreen Studio umgebauten Autohaus gedreht hat. Grey deshalb, weil AI Keying damit offenbar besser flutscht, sie hatten grün und blau getestet und verworfen. Nachdem ich grade einigermassen nah dran an einem ähnlich Setup war für vier 30sekündige Werbespots habe ich jede Hochachtung für das, was denen jetzt in der Post bevorsteht: mit 55 AI Artists 9 Monate all das zu generieren, was die Schauspieler nicht abgeliefert haben. Ich bin wahnsinnig gespannt darauf, wie die visuelle Qualität ist am Ende.

Das scheint einen Schritt weiter zu sein auf einer sich abzeichnenden Skala: AI frißt sich in die Filmemachen-Prozesse immer tiefer rein; bei Doug Liman ist schon keine LED Wand mehr am Set, nur noch eine neutral geleuchtete graue Box. Es ist, könnte man sagen, schon nichts mehr übrig als die nackte Performance der DarstellerInnen. Okay, Kostüm und ein paar Props hat’s da noch gegeben – bei uns kamen schon die Kostüme aus der AI, die AI rückt den Darstellern also wirklich immer mehr auf die Pelle. Bald sind die Körper aus der AI und nur noch die Gesichtsausdrücke real gedreht und…

Ach ja, und dann ist da noch Matthieu Kassowitz (La Heine), batshit crazy as ever und auf 120% Full AI Kurs. „Fuck Copyright“, „There will be AI Superstars within the next 3 years and you can talk to them on your phone“ etc. etc. Higly entertaining.

Ooops, und der Film mit einem AI generierten Val Kilmer. Nicht als Cameo. Nicht als Gag. Sondern als Hauptdarsteller. Mit Zustimmung des family estate etc.

Und jetzt?

*den Titel habe ich mal bei meinem Lieblingsnewsletterschreiber Benedict Evans geschnorrt

Let’s stay linear, please.

Ich beobachte in letzter Zeit ständig, dass Leute uns den Einsatz von AI beim Filmemachen als etwas grundsätzlich Neues und kategorial Anderes schmackhaft machen wollen. Das hat die arme AI aber weder nötig noch verdient. Jüngstes Beispiel: Eine Virtual-Production-Pipeline für eine MOSES-Serie mit Ben Kingsley, die die Zuspieler für die LED-Screens mit GenAI erzeugt und AI als MoCap-Tool einsetzt. Das ist alles sehr beeindruckend, aber ist es auch ein wirklicher Paradigmenwechsel?

Ein Beispiel: Der Editor fragt am Set nach einem weiteren Shot und bekommt ihn ruckzuck gedreht. Das verkauft uns der Produzent Jon Erwin von Wonder mal auf die Schnelle als „Non-Lineares Filmemachen“. Haben wir’s nicht auch eine Nummer kleiner? Wenn sowas geht, ist das ja gut und schön. Aber als neues Paradigma führte das doch, nähme man es wirklich ernst, schnurstracks in die Apokalypse, wenn der Editor, meinetwegen auch der Regisseur selbst, erst beim Drehen entscheidet, welche Shots er/sie noch so braucht.

Darüber hinaus gab es diese spezielle Option doch beim linearen Realdreh auch schon immer: Was hat denn einen Regisseur am Set davon abgehalten, sich beim traditionellen Dreh eine weitere Einstellung auszudenken und schnell noch mitzudrehen? Ganz sicher nicht die Tatsache, dass er keine AI oder keine LED-CAVE hatte. Bottom Line: Das hat mit Non-linearem Filmemachen nix zu tun, das ist einfach Wichtigtuerei, pardon my French.

Ich erwähne das eigentlich nur, weil ich das selbst zu Anfang immer so verkauft habe und in Keynotes den traditionellen Ansatz einem neuen AI-Ansatz gegenübergestellt habe, in dem immer so ein schicker Kreis aus Feedback – Iteration – Optimierung – Feedback etc. zu sehen war. Hätte ich eigentlich auch „Non-linear Filmmaking“ drüberschreiben können. Ist aber Quatsch.

Was hat sich denn jetzt wirklich verändert beim AI-Filmemachen? Hier kommt der entscheidende Punkt: Man muss sich Dreharbeiten mal als unverzichtbaren Entscheidungsfindungs-Katalysator vorstellen und den Weg dahin, die Preproduktion, und den Weg danach, die Postproduktion, als komplexe Kette von aufeinander aufbauenden Entscheidungen.

  • (Prepro): „Wir müssen uns bis morgen für einen Darsteller entscheiden, damit wir in 14 Tagen jemanden am Set haben, mit dem wir drehen können.“
  • (Dreh): „Die Einstellung müssen wir jetzt genau so drehen, damit die Story so funktioniert, wie wir sie gescriptet und geboardet haben.“
  • (Post): „Die Einstellung haben wir genau so gedreht; zwar in 15 Varianten, aber eben genau so wie geboardet. Das ist unser Set an Optionen für den Schnitt, wir müssen uns für eine entscheiden, damit wir vom Schnitt in die Online weitergehen können.“

All das ist linear/unidirektional in dem Sinne, dass jede Entscheidung auf den vorangegangenen Entscheidungen aufbaut und dass der Weg zurück zum Anfang als Option ausgeschlossen ist. Dieser lineare Workflow ist entstanden, weil er einen gut händelbaren Rhythmus von Offenheit/Iteration und zu treffenden Entscheidungen etabliert, der das Vorwärtskommen beim Herstellen eines Films überhaupt erst möglich macht – und der zugleich eigentlich so simpel ist, dass er selbst Filmfremden leicht und schnell erklärbar ist:

  • Iteration/Offenheit PITCH: Regie interpretiert das Agenturskript
  • Entscheidung: welche Änderungsvorschläge sollen von der Regie umgesetzt werden
  • Iteration/Offenheit PREPRO: Regie löst den Film in eine Shotlist auf; schlägt Location-Optionen, Styling-Optionen, Besetzungsoptionen vor.
  • Entscheidung: PPM verabschiedet Shotlist, Locations, Styling, Besetzung.
  • Iteration/Offenheit DREH: Regie dreht Varianten der Shotlist, verbessert, optimiert.
  • Entscheidung: Kunden nehmen Einstellungen und Shots am Dreh ab.
  • Iteration/Offenheit POST: Schnittvarianten; VFX-Versionen; Vertonung etc.
  • Entscheidung: Schnittabnahme, Online-Abnahme, fertigaus!

Die Linearität, die Unidirektionalität – wenn der Hauptdarsteller einmal besetzt ist, dann gibt es da kein Zurück mehr – ist dabei gar kein technisches oder kreatives Naturgesetz, sondern eine wirtschaftlich-logistische Notwendigkeit: Natürlich KÖNNTE man auch nach 3 Drehtagen noch den Hauptdarsteller umbesetzen. Francis Ford Coppola hat APOCALYPSE NOW auch mit Harvey Keitel als Hauptdarsteller begonnen und ihn nach zwei Wochen gegen Martin Sheen ausgetauscht. Kein Wunder, dass der ganze Spaß am Ende 30 Mio statt der kalkulierten 12 Mio gekostet hat. Aber die logistischen Konsequenzen und letztlich die Kosten einer solchen Entscheidung sind halt derart massiv, dass ich als Producer schon beim Lesen dieser Geschichte feuchte Hände bekomme.

Und jetzt kommt’s: Die Notwendigkeit für einen Dreh ist wegen generativer AI auf dem Weg, zu verschwinden. Klingt erstmal super! Weniger Kosten, weniger Aufwand, mehr Freiräume etc. Was aber nicht verschwinden wird, ist die Notwendigkeit für kreative Entscheidungen; sie wird eher größer werden, zum einen, weil mehr Iterationen möglich sind und weil es zum anderen noch viel zu wenig Profis gibt, die bei der kreativen Entscheidungsfindung helfen. Und ich meine Helfen im Sinne von „Vorfiltern“, nicht im Sinne von „noch tausend Optionen anbieten, die alle Mist sind“. Was wir mit einem DP oder einem Production Designer verlieren, wenn wir stattdessen irgendeinen „Ai Artist“ beschäftigen ist doch genau das: Daß uns jemand mit der Unendlichkeit von miesen Möglichkeiten verschont und uns die paar Optionen anbietet, die wirklich gut sind. Aber das kriegen wir schon in den Griff.

Viel wichtiger ist, dass die Notwendigkeit für die Einbindung von Kunden und Agenturen in die Entscheidungsfindung damit nicht verschwunden ist. Sie hat sich vielmehr vom Dreh losgelöst und wabert jetzt wie eine dunkle Wolke über dem gesamten AI-Filmherstellungsprozess und ergießt sich in gefühlt täglichen PPMs und Abstimmungsrunden. Dafür muss ganz schnell eine Lösung her, und die kann nicht sein, dass man jetzt das glückselige Zeitalter des Non-linearen Filmemachens ausruft. Im Gegenteil: Weil uns mit dem Dreh ein wichtiger linearer Entscheidungskatalysator abhanden gekommen ist, müssen wir neue lineare Prozesse etablieren, damit wir nicht Gefahr laufen, die Potenziale von AI zu verspielen.

Wir sollten den Anspruch an Linearität also nicht aufgeben, wenn wir nicht in Teufels Küche kommen wollen, jedenfalls nicht, solange der Kontroll- und Mitwirkungsanspruch von Kunden & Agenturen derselbe bleibt – und ich habe da so eine Ahnung, wie viel Potenzial dafür besteht, dass der sich ändert. Sag ich aber nicht.

Nennt mich Oldschool, aber mir fällt dazu nichts Besseres ein, als bis auf Weiteres so zu tun, als wäre AI-Filmmaking eben nichts anderes als Filmmaking, und als bedürfe es deshalb auch weiterhin derselben Abstimmungsprozederes. Auch wenn LinkedIn voll ist mit „guck mal, was ich in 5 Minuten für 5 Euro gemacht habe“, wird es dabei bleiben, dass der Weg hinter eine einmal getroffene Entscheidung zurück geradewegs in die tiefste Hölle führt, oder um es mit weniger Schaum vor dem Mund auszudrücken: zu Mehraufwand und ergo Mehrkosten, und das für alle Beteiligten. Und das kann man auch regelmäßig und ungefragt so formulieren, ohne als Spielverderber rüberzukommen.

Soll heißen: In der Preproduktion stimmen wir Casting, Styling, Locations und Shotlist ab. Dann erzeugen wir, wenn wir denn in einem 100%-AI-Workflow sind, Stills/Keyframes, die wir abnehmen lassen, und zwar verbindlich. Und erst dann animieren wir diese Keyframes mit AI, und lassen uns auf Basis dieser animierten Frames einen Schnitt abnehmen, den wir dann endfertigen. Klingt total simpel, ist es aber erst dann, wenn man es hundertmal allen vorgetanzt hat und alle gesagt haben: „Ja, so machen wir das“ – und wenn keiner mehr nach der Online sagt: „Meine Frau hat das gestern angeschaut und gefragt, ob der Darsteller nicht einen Ferrari statt eines Motorrads fahren könne, mit AI geht das doch jetzt alles ganz einfach.“

PS: Wir müssen uns als Filmemacher natürlich auch selber am Riemen reißen und nicht rumtrompeten, jetzt wäre grundsätzlich alles für gar kein Geld möglich. Analog zu Ockhams Rasiermesser, das wir ja alle aus der Philosophie als heuristisches Prinzip kennen („Entitäten dürfen nicht über das Notwendige hinaus vermehrt werden“), formuliere ich abschließend mal für die Filmherstellung Paulys Rasiermesser: „Wenn es keinen grundsätzlich zu erwartenden Zugewinn gibt, dann soll man nicht mutwillig die Welt mit Iterationen zuballern.“ Und schon gar nicht – Paulys Rasiermesser Teil 2 – soll man das der Welt als Non-lineares Filmemachen verkaufen, bitteschön, dankeschön.

PPS: Ich weiß, dass es bei einigen Regisseuren und visionären Produzentinnen den Ansatz gibt, die ganze Workflow-Architektur der Werbung einreißen zu wollen, weil AI ja jetzt ganz andere Dinge ermögliche. „Ihr habt das als Medium nicht verstanden! Das ist dafür gar nicht gebaut.“ höre ich sie leicht verzweifelt rufen. Ich glaube, dass diese Menschen sich über ihre eigenen Motive täuschen und dass sie Ursache und Wirkung verwechseln. Zu ihren eigenen Motiven gehört oft genug der nur allzu verständliche Überdruss am immer irgendwie zu engen Korsett des Filmemachens unter Werbebedingungen – ahnungslose Kunden, Agenturkreative, die sich für die besseren Regisseure halten etc. Darum haben sie eine diebische Freude an AI, weil sie glauben, mit deren Hilfe das ganze System verbessern, überwinden oder gar in die Luft jagen zu können.

Aber dieses System wird nicht mit einem neuen Medium oder Tool verschwinden. Man könnte genauso gut argumentieren, das heilige Medium FILM wäre auch nicht für die Werbung geschaffen worden, es könne doch so viel mehr, wenn man uns doch nur ließe etc. pp. Das Problem ist aber nicht das Medium, unsere Tools, das Problem sind die Gegebenheiten, die Konstellationen, in denen wir arbeiten. Und aus denen wird uns keine AI-Pipeline dieser Welt befreien, sorry für die schlechten Nachrichten, liebe Utopisten.

Der wahre Zugewinn ist aus meiner Sicht, dass man mit AI Dinge umsetzen kann, die vorher nicht möglich waren. Ich finde, es gibt schon genug zu tun damit, diesen Vorteil auszuschöpfen – da sind wir noch ganz am Anfang. Wenn wir uns dabei aus utopischen, aus marktschreierischen oder aus Entscheidungsunwilligkeits-Gründen von der Linearität von Entscheidungen verabschieden, werden wir stattdessen gemeinsam mit Kunden und Agenturen im Treibsand ewiger Feedbackschleifen versinken.

EXTRAS

Erinnert ihr Euch an Ricky Gervais‘ EXTRAS? Andy, der Statist, ist der Main Character, in dessen Kopf die Filmwelt komplett verkehrt herum steht: Regisseure, Stars, große Sets, spektakuläre Drehbücher sind sämtlich unwichtig. Wichtig ist allein Andy, das verkannte Genie, und EXTRAS kokettiert immer mit der Frage „Was, wenn er recht hätte?“ 

Ich muss immer an EXTRAS denken, wenn wieder jemand von der „Demokratisierung des Filmemachens durch AI“ fantasiert: Ja, man kann natürlich postulieren, dass die Welt voller verkannter Genies wie Andy sei, die vom System des Filmemachens maximal in die Rolle von Extras gepresst würden und jetzt endlich beweisen könnten, dass sie große Filmemacher sind. 

Vielleicht wird ja Filme Machen mehr wie Musik Machen in den Zeiten von AI. Wie Billy Eilish im Schlafzimmer Musik macht, die zu recht eimerweise Grammys abgreift, werden vielleicht bald ein paar Kids einen oscarwürdigen Film mit AI zusammenschrauben, die ohne AI keine Chance hätten, sich durch das aktuelle System durchzufighten. Vielleicht sind ja die aktuellen Systeme, in denen Filme entstehen, tatsächlich massive Gatekeeper, die tausendfach Talente aussieben und nicht zum Zuge kommen lassen etc. pp., googelt einfach mal „democratizing filmmaking“.

„Extras“ hat da eine skeptischere Perspektive für uns parat: Klar steckt das aktuelle System des Filme Machens voller Idiotie, Korruptheit und Crazyness. Aber die Andys dieser Welt müssen erstmal beweisen, dass sie – nicht nur in ihrem eigenen Kopf! – die besseren Stars, die besseren Regisseure und Filmemacher sind. Let the games begin!

Now that escalated quickly…

Ich habe grade das Potenzial von AI unterstützter Kreation am eigenen Leibe erfahren, und ich bin noch immer in shock: In einem Whatsapp-Gruppenchat hat eine Freundin den denkwürdigen Satz gedroppt: „Mein Mann ist auf Sylt, und ich bin über’n Dispo“. Fragt nicht, aber genau so stand es geschrieben. Wichtig daran ist eigentlich nur, dass das irgendein Satz in irgendeiner Whatsapp-Gruppe war. Ich fand das so hitverdächtig, daß ich SUNO damit gefüttert habe; und keine 10 Minuten später konnte ich bereits diesen potenziellen Chartstürmer in dieselbe WhatsApp Gruppe posten.

So ein Refrain hätte in den 90ern für einen top 40 Hit in Deutschland gereicht, und im Radio wäre es zwischen dem ganzen anderen Chart-Trash nicht groß aufgefallen. Stefan Raab hat wie einige andere eine ganze Musikindustrie-Karriere auf dieser Sorte Zeugs aufgebaut. Behaupte ich jetzt einfach mal, entrüstete Widersprüche bitte in die Kommentarspalten.

Aber damit war das noch nicht zu Ende. Die Freundin hat dann gleich noch einen Strophen-Text in der Gruppe gedroppt, den ich fix an eine andere Version desselben Refrains drangenagelt habe – et voilà! (Und ja: ihr müßt die Links klicken, weil ich zu geizig bin, für Audio- und Videointegration zu bezahlen.)

Das kann man ohne jede enthusiastische Übertreibung nur Kreation auf Speed nennen, und zwar aus mindestens vier Gründen:

1 SUPERPOWERS FÜR KAUM-WAS-KÖNNER: Das hat mir ermöglicht, Co-Creator von dieser Musik zu werden, jemandem, der etwas Vergleichbares mit klassischen Tools niemals hätte aufstellen können. Ich hatte mit 7 Jahren mal Blockflötenunterricht, das ist mein level of expertise.

2 VON MICROINSPIRATION ZUM PRODUKT IN 5 MINUTEN: Jede noch so abwegige Schnapsidee läßt sich mit Minimalaufwand auf ihre Produkttauglichkeit hin abklopfen. Hätte ich mit dieser „Idee“ ein Team von Musik-Profis beauftragt, ein Studio gebucht etc.? Nö. 

3 TURBOSPEED: Der Zeitaufwand dafür war geschätzt der hundertste Teil von dem, was jemand mit einem Profi-Ansatz dafür an Zeit aufgewendet hätte. Von Equipment, Vorbildung, Mitwirkenden etc. gar nicht erst zu reden. 

4 TONNENWEISE OUTPUT: Der Output von SUNO war jede Menge repetitives Zeug, das nicht gut genug war, nicht catchy genug, unorganisch etc, aber eben auch innerhalb von 30 Minuten diese beiden grundsoliden Nummern.

Jetzt kann man das Ergebnis schrottig finden, über den Humor nicht lachen und tausend andere Details bekritteln (Blockflötenunterricht mit 7, sag ich ja!). Man kann aber nicht darüber hinwegsehen, daß dieser mühelose Workflow und dessen beschriebene Effekte mehr als erstaunlich ist. Und das gilt eben nicht nur für generative Musik-AI.

Im Ernst: Ich kann jedem irgendwie in der Kreativindustrie tätigen Menschen nur dringend dazu raten, in dem Genre seiner/ihrer Wahl (Musik/Bilder/Bewegtbild) die dort verfügbaren generativen AI Tools mal durchzuspielen statt immer nur die Ergebnisse anzuschauen und „MEINUNGEN“ zu haben, und sich mal diesem atemberaubenden Beschleunigungseffekt auszusetzen. Husch-husch!

P.S.: MusicRadar hat grade die Info veröffentlicht, daß 2024 täglich mehr neue Musik released wird als im ganzen Jahr 1989. Und das sind noch die Auswirkungen der Digitalisierung der Produktions- und Distributionsprozesse seit den 90ern. Das ist noch gar nicht der AI Effekt: der kommt noch. 

P.P.S.: SUNO und UDIO werden zu Recht von der kompletten US Musikindustrie verklagt, weil sie ganz offensichtlich ihre Software an rechtebehafteter Musik trainiert haben, wie immer in diesen Fällen natürlich ohne zu fragen oder gar – wo kämen wir denn da hin! – zu bezahlen, weil „fair use“. Das stinkt natürlich zum Himmel.

P.P.P.S.: Wegen Verwerfungen im Raum/Zeitkontinuum (Okay: ich hab’s irgendwie im WORDPRESS Editor versemmelt…) lag dieser Beitrag ein Jahr lang unveröffentlicht rum, was bedeutet, dass das SUNO Modell hinter der Mukke schon 12 Monate alt ist. Urururalt. Habe grade in der aktuellen SUNO Version 4.5 ein cover anfertigen lassen innerhalb von ca. 40 Sekunden, das wollte ich Euch nicht vorenthalten: https://suno.com/s/3pc81651LmF6mdRt

Hervorgehoben

Die nächste Trainingsrunde: Jetzt müssen die Profis ran

Letztes Jahr habe ich mal eine obskure Firma ausgecheckt, die offensichtlich im großen Stil das Training von LLMs an jeden deutschen Muttersprachler ausgelagert hat, der irgendwie einen Internetzugang besaß (weitere Qualifikationen waren da nicht erforderlich). Das war so ein bisschen wie die „In Welchen Bildern Siehst Du Ein Fahrrad“ Puzzle, aber mit Text. Und überraschenderweise für echtes Geld. Komplett wirr und so chaotisch aufgesetzt, dass man sich nicht vorstellen konnte, wie aus so einem verkorksten Prozess irgendeine valide Information für irgendwas sich extrahieren lassen sollte, aber auch slightly unterhaltsam. Ich habe das nach zwei Stunden milden Interesses schnell meiner Tochter umgehängt, die damit ihr Taschengeld aufgebessert hat. Wenn ChatGPT also für euch manchmal wie ein 13-jähriges, sehr meinungsstarkes und dabei oft schlechtgelauntes Teenagermädchen klingt: Sorry, das war ich. 

Aber jetzt wird’s ernst! Die LLMs sind ja inzwischen offenbar mit allem trainiert, was nicht bei drei auf den Bäumen war – Internet ist alle. Benedict Evans hat grade diesen Bloomberg-Artikel verlinkt, der davon berichtet, dass OpenAI diversen Ex-Bankern 150 Dollar die Stunde zahlt dafür, dass sie OpenAI’s LLM beibringen, was da draußen im Netz nicht sowieso schon rumschwirrt. Aber Banker scheinen nicht die einzigen zu sein, die auf bisher unzugänglichen Informationen = Trainingsdaten hocken.

Wir hatten im Podcast ja mal den sehr schlauen Prof Björn Stockleben von der Filmuni Babelsberg zu Gast, der damals sehr zu meiner Beruhigung darauf hinwies, dass zwar die Regisseure, Editoren und DPs ein echtes Problem hätten, weil ihr Zeug tonnenweise und allgemein zugänglich im Netz zu finden sei und damit auch als Trainingsdaten für die gierigen Techkonzern-AIs zur Verfügung stünde; dass aber wir Producer mit unseren spezifischen Daten traditionell deutlich restriktiver umgingen – niemand kann sich bisher auf YouTube anschauen, wie man denn eine belastbare Kalkulation für drei Drehtage in Kapstadt für einen Autofilm aufsetzt. 

Das scheint inzwischen auch OpenAI oder irgendwelchen anderen Techkonzernen aufgefallen zu sein. Mein LinkedIn Channel wird seit Kurzem geflutet von „Jobangeboten“ einer Company namens MERCOR, die für AI Hersteller nach Experten aus unserer Domain sucht: Executive Producer, Film Production Specialist, Film Producer, Series Producer, Independent Filmmaker, Senior Producer, Line Producer, Producer, Screenwriter, Editor, Post Production Supervisor etc.* Worum geht’s? Darum, einer AI beizubringen, wie die genannten Jobs funktionieren. Da versucht also gerade ein AI Entwickler, im Bereich Film alles Wissen sich einzuverleiben, was er bisher aus YouTube, Netflix etc. noch nicht klauen extrahieren konnte.

Damit sind wir wieder am Anfang des Fear Cycles in Sachen AI: „How would you turn an AI model into an expert in your domain?“ ist der Titel des angedrohten AI Job Interviews. Oder anders formuliert: „Verrate uns, wie wir dich überflüssig machen können, im Internet haben wir leider zu wenig dazu gefunden“. Klingt irgendwie nach Verrat und sich-ins-eigene-Fleisch-schneiden, aber ich habe da mal ein Fax hingeschickt. Ich habe da ja schließlich einige goldene Weisheiten aus einigen Jahrzehnten gut abgehangenen Producerwissens zu bieten wie „Bleib Up Top Date damit, welches Restaurant deine Kunden wohl am Besten finden werden“ und „Immer 3% billiger anbieten als die Mitbewerber“. Mal sehen, ob sie rausrücken damit, in wessen Auftrag sie eigentlich unterwegs sind. Keeping you posted!

*Meine Lieblings-AI Gemini hat mir inzwischen verraten, daß die Company Mercor selbst wohl legit ist (mit 10 Milliarden USD bewertet; die Üblichen Verdächtigen Investoren wie Peter Thiel etc.). Aber jetzt kommt der Twist: diverse Applikanten haben bereits vermutet, daß die Ausschreibungen keine echten Jobs bewerben, sondern daß sie lediglich Mercors Interview-AI optimieren sollen. Klingt krank, aber nicht abwegig. 

**Ein weiterer Bloomberg-Artikel zum selben Thema: „Ex McKinsey Consultants are training models to replace them“

Implementation Gap

Ich sehe bei generativer AI einen massiven „Implementation Gap“.

Implementation Gap? Das erste Spülklosett wurde 1556 erfunden. Trotzdem gibt es im Jahr 2025 noch rund 550 Millionen Menschen allein in indien, die keins haben. Der Implementation Gap zwischen Erfindung und flächendeckender Verbreitung beträgt für Indien also fast 500 Jahre, and counting.

Dasselbe gilt für AI im Werbefilm. Der sehr schlaue Ethan Mollick, seines Zeichens Professor für Management in der Ivy-League-Schmiede Wharton, hat mal gesagt, selbst wenn in Sachen AI jegliche Innovation JETZT stoppen würde, würden Firmen – und das verallgemeinere ich mal auf uns als Ökosystem – mindestens 10 Jahre brauchen, um all das zu implementieren, was jetzt schon möglich ist.

Der Implementation Gap ist also mmerhin um den Faktor 50 kleiner als bei Spülklosetts, aber er ist ganz offensichtlich da.

Könnte man sich drum kümmern, wenn man Producer wäre, beispielsweise. 

Natürlich wäre es auch eine interessante Frage, ob der Fortschritt beim Filmemachen mit generativer AI tatsächlich so eindeutig ist wie der, wenn man nicht mehr hinter die eigene Hütte defäkieren muss, weil man jetzt ein Klo hat. Aber ich glaube die Frage haben leider bereits andere für uns entschieden, Freunde. Also los, chop chop!

Spare me yourselfie!

Warum sind diese AI-generierten Selfie/Vlog-Videos eigentlich so eine Sensation und Provokation? Der Humor, geschenkt. Daran kann’s nicht liegen. Steile These: Die sind deshalb so ein Stachel in meinem Fleisch, weil sie hinter dem vordergründigen Humor sich lustig machen über die Welten, die sie zusammenrühren und zugleich zu Grabe tragen, nämlich:

  1. Das Filmemachen mit fettem Production Value. Schaut Euch mal das Odysseus-Vlog an. Shots wie diese (vom bescheuerten ausgestreckten Selfie-Arm abgesehen) haben Wolfgang Petersen in Troja hunderttausende von Dollars beim Dreh und in der Post gekostet, die werden hier einfach mit VEO3 hintereinander weggeballert als wär nix.
  2. Die vermeintliche Authentizität des Vloggens. Der (müde) Witz ist ja nicht, dass Odysseus kein Iphone hatte. Der Witz ist, das Odysseus kein Iphone mehr BRAUCHT um Vlogs zu machen, weil es jetzt AI gibt. „There’s a joke here somewhere / and it’s on me“, wie Dr. Springsteen zu sagen pflegt.

Insofern ist das jenseits des Bru-Ha-Ha Effektes eine triumphale Geste, ein imperialer, raumgreifender Anspruch, den man aus Perspektive der generativen AI auch so formulieren könnte: Vielen Dank für all die Trainingsdaten aus hunderten von Sandalenfilmen und Milliarden an Selfies und Vlogs, ab jetzt machen wir das aber ohne Euch.

Aus meiner Perspektive, der ich eher bei den Sandalenfilmen als bei den Selfies zuhause bin, ist es ein kleiner, schadenfoher Trost, dass das unsägliche Social Media Gewackel, das uns so oft schon das Wasser abzugraben gedroht hat, jetzt selber zum Opfer des nächsten Innovationsschubs wird. Aber eben leider nur ein schwacher Trost.

Oh, und bitte keine weiteren AI Vlogs verlinken, I’ve seen it all, danke, reicht.