Cette histoire vient de Le journaliste hollywoodien prochain numéro AI, qui paraîtra le 31 mars. Découvrez d’autres articles tout au long de la semaine et le numéro complet la semaine prochaine.
Sur Instagram, le cinéaste connu sous le nom de Gossip Goblin publie de sombres épopées de science-fiction se déroulant dans des mondes étranges peuplés de créatures mutées et de sociétés de bunkers. Les images sont accompagnées de narrateurs philosophiques contemplant la réalité. Les courts métrages ressemblent étrangement à des fragments de cinéma de genre à gros budget. Mais ils n’ont pas été tournés sur scène ni rendus par un studio VFX : ils ont été générés et assemblés à l’aide de l’intelligence artificielle.
À l’heure où Hollywood et la Silicon Valley se disputent encore sur ce qu’est réellement l’IA – un outil de réduction des coûts, un gadget visuel ou le fondement d’un tout nouveau langage cinématographique – Gossip Goblin offre une possibilité plus provocatrice : que l’IA a déjà une esthétique émergente et qu’elle n’appartient pas aux studios mais à des individus prêts à la transformer en quelque chose de personnel. Ses films ne rejettent pas l’étrangeté révélatrice du médium – la logique du rêve, les textures synthétiques, le sentiment d’images à moitié mémorisées plutôt que pleinement observées – mais s’y penchent, suggérant une forme de narration qui ressemble moins au cinéma traditionnel qu’à la pensée visualisée.
L’homme derrière ce compte est Zack London, 35 ans, originaire de Los Angeles qui a jusqu’à présent gardé un profil public relativement bas, même si son travail s’est largement répandu en ligne. Le nom « Gossip Goblin », suggère-t-il, a commencé comme un pseudonyme délibérément peu sérieux – une sorte de pseudonyme Internet – mais est depuis devenu une bannière pour un ensemble croissant d’œuvres qui sont tout sauf jetables. Londres a étudié la sculpture et l’anthropologie au Pitzer College avant de se lancer dans la conception de produits et le travail en réalité virtuelle dans des entreprises technologiques comme Oculus. Il y a quatre ans, il a déménagé à Stockholm après avoir rencontré son partenaire suédois. En expérimentant les premiers logiciels de génération d’images après le travail, il est tombé sur une nouvelle façon de visualiser les histoires qu’il écrivait depuis longtemps.
Depuis lors, Gossip Goblin a discrètement rassemblé plus d’un million de followers sur Instagram et des millions de vues supplémentaires sur toutes les plateformes. London a récemment quitté son emploi dans le secteur technologique, a levé une petite levée de fonds et a lancé un studio pour produire des films plus longs basés sur l’IA avec une petite équipe internationale. Son premier effort majeur, un court métrage de 20 minutes intitulé Le patchwork – situé dans un environnement sale, Coureur de lame-un monde peuplé de personnages hybrides chair et métal et mettant en vedette un casting complet d’acteurs vocaux, un artiste de bruitage et une musique originale – devrait sortir dans les semaines à venir après environ cinq mois de production.
Cette approche le place dans une position curieuse dans le paysage en évolution rapide de l’IA. Alors que les réseaux sociaux sont inondés de vidéos IA en un clic (souvent qualifiées de « slop »), London insiste sur le fait que ses projets impliquent toujours bon nombre des mêmes étapes que la réalisation cinématographique traditionnelle : scripts, listes de plans, doubleurs, bruiteurs et montage approfondi.
La question de savoir si ce processus représente l’avenir du cinéma indépendant ou simplement une curiosité transitionnelle reste ouverte. Mais Hollywood y prête déjà attention. London dit avoir répondu à des appels de studios, d’acteurs et de réalisateurs curieux de savoir ce que pourrait devenir la narration de l’IA.
Le journaliste hollywoodien s’est entretenu avec Londres sur la façon dont ses films sont réalisés, pourquoi la plupart des contenus d’IA ne parviennent pas à se démarquer et si un blockbuster légitime pourrait un jour émerger de ce nouveau média.
Vous êtes originaire de Los Angeles. Comment en êtes-vous arrivé à faire ça depuis Stockholm ?
J’ai grandi dans la Valley et étudié la sculpture et l’anthropologie au Pitzer College, deux disciplines très lucratives. Je pensais que j’irais peut-être à la faculté de droit après, mais j’ai fini par suivre un Fulbright en Malaisie et j’ai passé près de deux ans à voyager en Asie du Sud-Est. Après cela, j’ai déménagé dans la Bay Area et j’ai commencé à travailler dans la technologie en tant que concepteur de produits dans des startups et finalement chez Facebook sur Oculus en faisant du travail de réalité virtuelle. J’ai déménagé en Suède il y a environ quatre ans après avoir rencontré une Suédoise. Soit elle a déménagé aux États-Unis, soit j’ai déménagé ici, alors me voici. La réalisation de films n’a jamais vraiment fait partie du plan. J’ai toujours illustré et écrit des histoires, et j’ai même auto-publié quelques petits livres de voyage et de courtes fictions, mais il ne m’est jamais venu à l’esprit que faire des films était une possibilité pour moi. L’IA a en quelque sorte changé cela.
Comment avez-vous commencé à expérimenter les outils d’IA ?
Il y a environ trois ans et demi, je jouais avec un collègue après le travail avec les premiers outils de génération d’images. Nous essayions de les utiliser pour un projet de conception et les résultats étaient terribles – totalement inutilisables pour le travail en entreprise – mais la technologie elle-même était fascinante. Avant que la génération vidéo n’existe, j’ai commencé à faire une série d’écritures de voyage ironiques sur un pays fictif appelé Urumquan, écrite dans le style du National Geographic des années 1980. J’ai créé toute une fausse ethnographie de cet État satellite soviétique imaginaire et j’ai utilisé Midjourney pour générer des images qui semblaient semi-documentaires mais surréalistes. De manière inattendue, cela a décollé en ligne et m’a à nouveau enthousiasmé pour la narration. Lorsque les outils vidéo ont commencé à apparaître, j’ai réalisé que les images animées permettaient de créer des mondes narratifs – même si au début la technologie était si limitée que la narration devait s’adapter à ce que l’IA pouvait produire de manière réaliste.
Votre travail semble bien plus soigné que la plupart des vidéos d’IA en ligne. Comment sont réellement réalisés ces films ?
La plus grande idée fausse est que quelqu’un tape « film de science-fiction » dans une invite et qu’un film apparaît de l’autre côté. Peut-être que nous y parviendrons un jour, mais la technologie n’en est pas là aujourd’hui. Notre processus commence par un script, puis nous divisons ce script en quelque chose comme une liste de plans traditionnelle : chaque scène, chaque angle, chaque environnement. Après cela, nous commençons à explorer le monde visuel : à quoi ressemblent les personnages, à quoi ressemblent les créatures, quel type d’éclairage et d’architecture ce monde possède. Une fois que nous avons défini cette esthétique, nous générons et affinons des centaines ou des milliers d’images et de clips vidéo qui correspondent à l’histoire, puis tout est assemblé et monté dans DaVinci Resolve comme un film normal. Nous travaillons également avec des doubleurs et même un bruiteur pour créer des effets sonores, il y a donc encore beaucoup de savoir-faire cinématographique traditionnel impliqué.
Quels outils d’IA utilisez-vous pour générer les images ?
Un grand nombre d’entre eux – entre 15 et 25 outils répartis sur l’ensemble du pipeline. Il n’existe pas un seul générateur magique qui fasse tout. Certains outils sont meilleurs pour créer des images initiales, d’autres sont meilleurs pour reproduire des personnages de manière cohérente dans différentes scènes, et d’autres sont meilleurs pour le mouvement ou l’animation. Midjourney reste un favori pour générer des images, mais nous utilisons également d’autres modèles qui reproduisent mieux un personnage spécifique sous plusieurs angles ou conditions d’éclairage. La cohérence est l’un des problèmes les plus difficiles dans la réalisation de films IA – si un personnage change d’apparence d’un plan à l’autre, l’illusion s’effondre – donc une grande partie du travail consiste à trouver comment contrôler les sorties entre différents outils.
Une chose que j’ai remarquée en regardant votre court métrage, c’est qu’il repose fortement sur la narration plutôt que sur le dialogue. Était-ce intentionnel ?
Il s’agissait principalement d’une limitation technique. Lorsque nous avons réalisé ce film, les outils n’étaient tout simplement pas assez performants pour produire des scènes de dialogue convaincantes avec des paroles et des performances synchronisées. Si nous avions essayé de le faire, cela aurait semblé gênant ou artificiel, alors nous nous sommes plutôt penchés sur la narration et l’atmosphère. Le prochain projet sur lequel nous travaillons dure environ 25 minutes et est beaucoup plus axé sur le dialogue car la technologie s’est considérablement améliorée depuis. Les outils évoluent si rapidement que ce qui semblait impossible il y a un an semble désormais réalisable.
Les voix de vos films sont-elles générées par l’IA ?
Non, ce sont tous des doubleurs humains. Nous travaillons avec quelques artistes : l’un était un chanteur d’opéra devenu DJ à San Francisco, et un autre est un chanteur de jazz au Royaume-Uni. Les voix synthétiques sont devenues incroyablement convaincantes, mais les vrais interprètes apportent toujours quelque chose de difficile à reproduire. À terme, les performances de capture de mouvement deviendront probablement également une partie plus importante de ce flux de travail, dans lequel vous enregistrez la performance d’un acteur et la traduisez en un personnage généré par l’IA, mais cette partie de la technologie est encore assez précoce.
Vous avez créé une audience de plus d’un million de personnes en ligne. Pourquoi pensez-vous que votre travail se démarque des autres contenus sur l’IA ?
Honnêtement, parce que la plupart du contenu de l’IA est ce que les gens appellent du « slop ». La technologie a une sorte de style visuel par défaut, et si vous appuyez simplement sur le bouton et acceptez ce qu’elle génère, vous vous retrouvez avec des images génériques de science-fiction qui ressemblent à tout le reste. Il faut en fait beaucoup de travail pour éloigner l’IA de cette base et imposer une vision créative spécifique. L’autre différence est la narration. De nombreux créateurs se concentrent uniquement sur les visuels : des images impressionnantes sans narration derrière elles. Je suis beaucoup plus intéressé par la construction d’une mythologie, avec des personnages et des histoires récurrentes qui existent dans un monde plus vaste.
Vous avez récemment quitté votre emploi et créé un studio autour de ce travail. Quel est le but ?
L’objectif est de construire un univers d’histoires plus vaste – non pas un contenu fabriqué en masse, mais une science-fiction réfléchie créée avec une petite équipe. Ce qui est passionnant avec l’IA, c’est qu’elle pourrait permettre aux gens de créer une narration de genre ambitieuse sans avoir besoin de centaines de millions de dollars. Historiquement, si l’on voulait réaliser de la science-fiction à grande échelle, il fallait une production massive en studio. Désormais, une poignée de personnes pourraient être capables de créer quelque chose de visuellement comparable avec beaucoup moins de ressources.
Les studios hollywoodiens ont-ils commencé à vous solliciter ?
Oui, j’ai parlé avec la plupart des studios et streamers à ce stade, ainsi qu’avec certains acteurs et réalisateurs dont j’admire vraiment le travail. Beaucoup de ces conversations sont simplement dues à la curiosité – des gens essayant de comprendre à quoi pourrait ressembler l’avenir du cinéma. Certains acteurs se demandent s’ils doivent autoriser leurs voix ou leurs apparences à être utilisées par l’IA. Je ne pense pas que quiconque connaisse encore vraiment les réponses, mais il y a certainement beaucoup d’intérêt.
Voulez-vous à terme vous associer à Hollywood ou construire cela de manière indépendante ?
Notre objectif est de conserver autant de propriété que possible sur la propriété intellectuelle. Dans un avenir où l’IA permettra à chacun de générer d’énormes quantités de contenu, il y aura une quantité écrasante de bruit en ligne. Les choses qui auront réellement de la valeur sont des personnages reconnaissables et des mondes avec lesquels le public se connecte. Si nous pouvons créer un petit ensemble d’histoires et de propriété intellectuelle qui intéressent réellement les gens, c’est là que réside la valeur à long terme.
Pensez-vous qu’un véritable blockbuster généré par l’IA arrive ?
Probablement. La technologie évolue si rapidement que cela semble inévitable. Mais je suis moins intéressé à être la première personne à prouver que cela peut arriver. Il existe déjà des entreprises bien financées qui tentent de remporter cette course. Ce qui m’importe, c’est de bien le faire et de me concentrer sur la narration plutôt que sur la simple démonstration de la technologie. En fin de compte, le public ne se soucie pas de l’outil : il se soucie de savoir si l’histoire est convaincante.
J’ai l’impression que quelqu’un va être le George Lucas de tout ça, et ne serait-ce pas intéressant si c’était vous ?
C’est ce que nous disons aux investisseurs, mais je ne veux pas leur porter malheur. C’est essentiellement le discours éclair : « Nous pouvons raconter une épopée de science-fiction totalement vaste et non filtrée couvrant tous ces différents mondes, idées et scénarios, et nous pouvons le faire de manière assez fiable avec une équipe assez petite. » De plus, ce n’est pas un risque énorme de prendre cela. Ce n’est pas comme si nous demandions au monde de faire cela.
