AIron Man

Okay, sorry für den mauen Wortwitz, aber ich konnte nicht anders. Just A Rather Very Intelligent System oder kurz JARVIS ist da draußen. Jarvis spricht noch nicht mit uns wie mit Tony Stark, aber das nicht wegen technischer Limitationen, die gibt’s schon gar nicht mehr; sondern wohl nur deswegen, weil wir sonst noch mehr Schiß vor ihm/ihr hätten, als wir es sowieso schon haben.

Vergesst mal Jarvis‘ fancy user interface aus Iron Man, die Grafiken, die immer vor Robert Downey Jr.‘s Gesicht rumschweben, das sind nur so VFX-Platzhalter für „whooo, veeery complicated technology at work“. In Wiklichkeit ist die Idee von Jarvis in Iron Man das Gegenteil dieser Grafiken, Jarvis ist viel simpler und aber gerade deshalb so viel mächtiger. Warum? Jarvis spricht mit Tony Stark, und Jarvis erledigt, worum Tony ihn bittet. Jarvis ist ein Assistent, aber nicht wie Alfred, der Butler, sondern eher wie Siri auf Steroids.

Was müßte denn Jarvis in unserer Welt können, um ein so guter & mächtiger Assistent zu sein? Jarvis müßte mit mir kommunizieren können; und er müßte mit all den anderen Tools da draußen interagieren können, sprich: Schnittstellen haben zum Netz und zu allen anderen Programmen/Interfaces, die es bereits gibt, und die wiederum Schnittstellen in die reale Welt haben: Ich bitte Jarvis um ein Rezept für eine Quiche Lorraine. Jarvis findet ein Rezept, bestellt die Zutaten beim REWE Lieferdienst, und der liefert mir die Zutaten. Aber Jarvis müßte nicht nur mit REWE kommunizieren, sondern mit allem & jedem. Jarvis müßte DAS EINE FRONTEND sein, das ich brauche, um mit jeder Art Software zu interagieren. Und mit einem immer weiter wachsenden Teil der physischen Realität, die sich über diverse Software Interfaces erreichen lässt, ohne daß ich mit diesen Software Interfaces selbst in Berührung komme: Das soll ja mein Assistent Jarvis für mich erledigen.

Alles, was es dafür noch braucht, um Jarvis wahr werden zu lassen, ist (bitte ankreuzen)

  1. ein Multimilliardär-Genie wie *cough* Bill Gates Elon Musk *cough*: Tony Stark, der das entwickelt und finanziert
  2. 20 Jahre Forschung & Entwicklung zu AI
  3. Plugins

Ihr ahnt es, die richtige Antwort ist natürlich „C,“ A & B hamwa schon, und seit kurzem ist auch C am Start, denn ChatGPT4 ermöglicht, tadaa, P-l-u-g-i-n-s.

Und was so harmlos & simpel klingt („Plugins? Kenn ich! Braucht mein Quicktimeplayer um die RED Daten abspielen zu können“) ist ein Riesenschritt, weil das die Kommunikation zwischen ChatGPT4 und anderen Programmen ermöglicht, und zwar auf Initiative und optimiert seitens der anderen Programme selbst.

Achtung, weit hergeholte Vorhersage: Genau wie sich sämtliche Websites nach und nach dahingehend optimiert haben, daß GOOGLE sie findet, werden sich bald sämtliche Programme und Interfaces dahingehend optimieren, daß ChatGPT mit ihnen optimal interagieren kann. Nicht mehr du & ich als User, sondern unser aller Assistent. Und wenn das tatsächlich passiert, dann ist das in Wahrheit der Schritt vom ChatBot zum universalen Interface, von ChatGPT4 zu Jarvis.

Expedia zählt zu den ersten Anbietern dieser Art Plugins: Anstatt sich einen Reiseplan zurechtzulegen, und den dann selber mühselig auf der Oberfläche von Expedia abzuarbeiten, kann ich ChatGPT mit ein paar Sätzen briefen, wie meine Reise aussehen soll, und Jarvis klärt das dann mit Expedia. Inklusive Restaurantreservierung, Flugbuchung, Hotelbuchung etc.

Was bedeutet das im Speziellen für uns Producerhasen?

Eins der großen Themen war ja anfänglich, ob ChatGPT Google überflüssig macht als Gateway zum Netz, als die bessere Suchmaschine. Mit Plugins ist jetzt weit mehr als das passiert: ChatGPT macht mittelfristig alle andere Software nicht überflüssig, aber es wird sich im Alltag als Interface zwischen uns und andere Software schieben und der neue Gatekeeper werden für unseren Umgang mit den Tools auf unseren Rechnern und Telefonen. Damit ist das Supertool am Horizont in Sicht, ein General Interface, das für uns mit allen anderen Tools kommuniziert.

Fun Fact: ADOBE hat grade seine eigene Text-To-Image AI „Firefly“ präsentiert und wird sie als Plugin in Photoshop und Lightroom und auch in diverse Bewegbildtools integrieren. Und so nebenbei Adobes eigenes Stockfoto-Business kannibalisieren (wohl notgedrungen – bevor es andere tun…). Da kann man das Zusammenspiel zwischen AI und einem klassischen Tool wie Photoshop jetzt live innerhalb dieses begrenzten Biotops beobachten: Auch hier wird sich zeigen, wer hier am Ende wessen Plugin ist. Bleibt Photoshop Photoshop mit ein paar AI Erweiterungen, oder transformiert sich das nach und nach in eine Bilder generierende und manipulierende AI, die über alle präzisen Kontrollfunktionen aus Photoshop verfügt, die Midjourney et al. bisher eben noch nicht haben?

Zurück zur Producerrealität. Ich habe Gerüchte gehört über einen Autofilm, der gerade komplett im Rechner entsteht: alle Hintergründe und das Auto selbst werden in Unreal Engine zu einem kompletten Produktfilm zuammengefahren. Hintergründe, Kameramoves etc sind photorealistisch und ergeben einen Film, der zu 100% real aussieht. Noch mit viel Arbeit und Glitches und Problemen und Abstimmungsprozessen etc, sodass die 60 Sekunden Film da noch Monate an Produktionszeit fressen mit hunderten von Mann/Frautagen an Arbeit, Abstimmungsschleifen aus der Hölle etc. Vielleicht sogar sehr viel mehr „Handarbeit“ in Summe – ironischerweise – als wenn man real drehen würde.

ABER. Was wenn das bald state of the art ist (und das ist es, mark my words), und wenn die Diskussionen darum, ob das denn nun schon genauso gut wie real gedreht ist, mal ausdiskutiert sind, wie sie es auch beim Thema „Digitalkameras vs. Film“ irgendwann waren? Ich sage an dem Punkt sind wir schon. Diese ganzen AUDI Filme etwa, ihr wisst schon: Ze future is an attitude und so, die WOLLEN doch so aussehen, als wenn sie aus dem Rechner kämen, die könnten längst komplett aus dem Rechner kommen und niemand würde den Unterschied bemerken, ob nun die Stahl&Glas Wolkenkratzer aus Dubai kommen oder aus der Unreal Engine.

Okay, da sind wir, werdet ihr sagen, aber was kommt dann? Vielleicht das hier, sicherheitshalber noch im Konjunktiv formuliert, damit ich nachher alles als reines Gedankenexperiment abtun kann: 

Was, wenn die Unreal Engine ein Plugin für ChatGPT anböte und ich sagte oder tippte: „Jarvis, sprich doch mal bitte mit der Unreal Engine, ihr kennt euch doch. Ich hätte gern einen 30 Sekunden langen Autofilm, der in der Wüste spielt mit folgendem Auto, hier ist der Link zur Regieinterpretation mit allen Midjourney Prompts, mit denen wir die Bilder erzeugt haben; und hier die CAD Daten vom Auto. Bitte inkludiere folgende Einstellungen: 1-15. Storyboard läßt du dir von MJ malen, ich schau vielleicht vorher mal drüber, oder egal: mach einfach fertig, wenn’s mir nicht gefällt machen wir – also ihr – halt nochmal von vorne. Und dann besorg‘ dir einen Timeslot & Rechenpower bei Baselight und leg mir mal einen Filmkorn-Look darüber. Nur weil ich Bock hab, das mal zu sehen. Oh, und komm‘ mir nicht mit so einem langweiligen U-Crane-Film nach Hause, ich will crazy Transitions, ungesehene Kamerafahrten und einen superedelen High End Look.“ Hach, ich wollte schon immer mal wie ein Agenturkreativer sprechen, vor Jarvis muß ich mich ja nicht schämen für Plattitüdengewitter, ist ja nur Software.

1 Stunde später: „Naa, zu viele Wide Shots, der Kunde braucht noch CloseUps von den folgenden 3 Car Features, mach nochmal. Und vergiß‘ das mit dem Filmkorn-Look aus Baselight, gefällt mir nicht. Sprich mal mit Resolve, ob derdiedas nicht sowas in Richtung Chungking Express Look anbieten kann.“

Und was, wenn unser aller SCOPE Kalkulationsprogramm demnächst ein ChatGPT Plugin anböte, und ich Jarvis zurufen könnte: „Kalkuliere mir doch einen Margarine-Film in Kapstadt, 2 Drehtage, mittleres Preissegment, 5 Happy-Family-Darstellerinnen aus Deutschland wegen deutschem Dialog, Styling & Production Design von vor Ort, aber anspruchsvolle Regie, für die Post nur Schnitt, Grading und 1 Tag Tonmischung, bittesehr“?

Ja, was dann? wie es so schön bei „Peter & Der Wolf“ heißt.

*Danke an Rex Woodbury für die JARVIS Idee & tonnenweise input, abonnieren dringend empfohlen!

4 Kommentare zu „AIron Man

  1. so machen wir das! und ja: scary & lustig zugleich, dieser dialog. technische details mal beiseite: dass JARVIS einen dp channeln kann, obwohl das ja ausserhalb unserer bubble ein echtes nischenthema ist, das ist schon ein starkes stück.

Schreibe einen Kommentar zu Anonymous Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert