Sneak peek : Les illustrations des cartes
Les images de NaeDojo sont générées par des intelligences artificielles. On est loin d'en avoir honte, bien au contraire : notre ambition affichée est d'avoir des TONNES de cartes différentes, et sans IA, on n'aurait jamais pu débloquer les budgets nécessaires pour faire plancher une armée d'illustrateurs à temps plein.
Le fait d'utiliser des IA nous permet aussi de définir notre direction artistique au fur et à mesure qu'on avance, et c'est un luxe assez incroyable : sur un coup de tête, on peut se permettre de "jeter" 200 cartes, juste parce qu'on a décidé de changer de style.
Il y a quelques mois, on a posé les bases des règles (ça se résumait, en gros, à "des créatures se tapent dessus") et on a même fait un premier prototype, qui était franchement décevant. L'idée n'était pas mauvaise, mais on a bien dû se rendre à l'évidence qu'il manquait une dimension stratégique au niveau du moteur, et une dimension épique au niveau des visuels.
Donc, pour les images comme pour le reste du projet, on a revu nos exigences à la hausse. C'est assez amusant, en fait : au départ, on avait l'idée du Twist (promis, je vous en parlerai plus tard) et on imaginait articuler un petit jeu de cartes autour de ça. Finalement, après s'être regardés dans la glace, on a dû se rendre à l'évidence : quitte à partir sur un gros projet, autant y aller à fond, mais dans tous les cas, on ne peut pas présenter un mini-machin tout pourri sous prétexte que c'est notre premier jeu. Au contraire, si on veut se faire une place, il va falloir taper aussi fort qu'un troll qui n'a pas mangé de viande humaine depuis trois semaines.
Au départ (juin 2024)
Au tout début du projet, Carole a exploré des pistes en générant une dizaine d'images par style, dans des styles assez différents : anime, cartoon, cellshading, réaliste... Les résultats étaient mitigés, on avait de très beaux tirages perdus au milieu d'un tas de fiente de harpie.
Plus grave, quelque soit le style retenu, les images étaient peu cohérentes entre elles, mêmes en utilisant des models (des "variantes d'IA") spécialisés. Sur 10 images générées, en général, on en gardait une ou deux maximum.
À l'époque, on utilisait un peu tous les outils génératifs sur lesquels on arrivait à mettre la main : notre objectif était de dégrossir, de voir ce qui était possible et de toucher les limites du doigt, pour mieux les repousser ensuite.
Ces premières images nous ont permis d'habiller un peu notre premier prototype, mais ça ne rendait pas justice à l'ambiance qu'on a imaginée pour notre jeu, plutôt sombre et épique.
Première piste sérieuse (juillet 2024)
C'est sur Scenario.com qu'on a réalisé cette première série. Cette plateforme propose des tas de modèles pré-entraînés, qu'on peut combiner entre eux pour obtenir des résultats proches de ce qu'on avait en tête en démarrant : on vise des images plutôt réalistes, mais en gardant un côté stylisé via des couleurs saturées.
Là, on a chauffé un peu plus la machine, et on a tiré environ 250 cartes. Avec des prompts bien écrits, on arrivait à garder à peu près une image générée sur 4.
La malédiction des Trolls
Et soudain, ce fut le drame. Impossible d'avoir un Troll qui ressemble à quelque chose. Ça a été très embêtant, on s'est pris un vrai mur. Même en détaillant la façon dont on imagine un troll (façon Troll des cavernes dans Lord of the Rings), on n'a jamais réussi à faire générer quelque chose de propre sur Scenario.
On a constitué une véritable collection de trolls ratés.
On s'est même demandés si on n'allait pas retirer les Trolls du jeu. Après tout, on a une bonne douzaine de races déjà établies, ils ne sont peut-être pas indispensables. Mais c'était sans compter sur l'âpreté de Carole, qui est parfois plus tétue qu'un nain de Norrimhelm.
Au fur et à mesure qu'elle établit le lore (la description du monde, de son histoire et de ses habitants), elle rédige de longs documents qui reprennent le bestiaire et les légendes de Naé. En chargeant tout ça dans un GPT personnalisé (un mode de fonctionnement de l'AI de OpenAI), elle a réussi à lui faire générer des trolls.
Deuxième piste sérieuse (août 2024)
Ça a ouvert la Boîte de Pandore : quitte à avoir planté le décor dans une IA, autant essayer de la pousser dans ses retranchements niveau génération d'images. Et on a été très surpris de voir à quel point Dall-E arrivait à suivre nos délires. Une toute nouvelle série de cartes étaient nées !
En faisant des prompts longs, on arrive à jouer sur les textures, les expressions, et c'est assez bluffant. Depuis nos premiers essais, Dall-E a aussi acquis des capacités d'inpainting (modifier une zone d'une image existante) qui nous permettent de corriger les premiers jets.
Et dans le futur ?
On se penche maintenant sur les technologies d'upscaling, toujours par IA. Il s'agit d'agrandir les images en augmentant leur résolution et leur niveau de détails. Ça permet souvent aussi de corriger les défauts des premiers tirages, mais ça introduit aussi, de temps en temps, de nouveaux problèmes, comme une perte de définition sur certaines textures (voir les pierres à gauche ci-dessous). Bref, l'aventure continue !