Comment j'ai automatisé mes screenshots ASO multilingues avec des agents IA - Builder Créatif

Automatiser ses screenshots ASO avec des agents IA, illustration

Pendant longtemps, les screenshots App Store faisaient partie de ces tâches que je repoussais sans arrêt.

Pas parce que c’est compliqué au sens noble du terme. Plutôt parce que c’est le genre de taf pénible qui te grignote la journée sans que tu t’en rendes compte. Tu commences en te disant “je vais juste sortir 6 screens” et une heure plus tard tu es encore en train de déplacer un texte, rerun un export, renommer des fichiers, puis refaire exactement la même chose dans une autre langue.

Au bout d’un moment, j’ai arrêté de voir ça comme une tâche design. J’ai commencé à le voir comme un problème de système.

Et là, tout a changé.

Le vrai problème n’était pas le screenshot

Ce qui me saoulait, ce n’était pas juste capturer des écrans. C’était tout ce qu’il y avait autour :

retrouver les bons écrans
se souvenir du bon format
gérer plusieurs tailles
gérer plusieurs langues
ranger les exports au bon endroit
remplacer les vieux fichiers sans casser Fastlane
corriger les problèmes de layout quand le texte déborde ou se fait couper

Le screenshot en lui-même prend 2 secondes. Le process autour, lui, te vide la tête.

Quand tu as une seule app, tu peux encore bricoler. Quand tu commences à avoir plusieurs produits, plusieurs stores, plusieurs itérations, ça devient un piège à temps.

Mon objectif

Je voulais un système qui sache faire 4 choses :

partir du vrai produit, pas d’un mockup inventé
sortir les bons formats sans que j’aie à me rappeler les specs
réutiliser la même logique pour plusieurs langues
corriger la plomberie technique sans me faire replonger dedans à la main

Autrement dit, je ne voulais pas “un prompt qui génère une belle image”. Je voulais une chaîne de production.

Le déclic : traiter ça comme de l’infrastructure

La bascule mentale a été simple.

Au lieu de me dire :

il faut que je fasse des screenshots

je me suis dit :

il faut que je construise un workflow reproductible pour les screenshots

C’est une nuance, mais elle change tout.

Quand tu penses “tâche”, tu optimises pour finir vite. Quand tu penses “système”, tu optimises pour ne plus avoir à repenser la même chose deux semaines plus tard.

La stack que j’utilise aujourd’hui

J’ai séparé le sujet en plusieurs couches.

1. Le contexte produit (déjà là)

Chaque app dans mon workspace a une fiche produit : positionnement, features clés, style visuel, public cible. C’est le même fichier que tous les agents utilisent pour le marketing, le SEO, l’ASO, je ne l’ai pas écrit pour les screenshots spécifiquement.

L’agent lit ce contexte, et à partir de là il décide tout seul :

quels écrans capturer
quels textes marketing mettre sur les slides
combien de slides produire
quels formats exporter
où ranger les fichiers

Je n’ai écrit aucun brief screenshot. L’agent a le contexte produit, il a le skill, et il se débrouille. C’est toute la différence avec un process manuel où tu dois tout spécifier à chaque fois.

2. Un skill dédié au workflow ASO

Le point le plus important, c’est ça.

Quand je demande des screenshots ASO, je veux que l’agent comprenne automatiquement :

on utilise le workflow screenshot
on part du renderer prévu ou de la web app
on vise un vrai format store
on ne part pas sur une génération d’image freestyle

Ça paraît évident après coup, mais si tu ne l’écris pas noir sur blanc, un agent peut prendre un raccourci “techniquement acceptable” mais faux par rapport à l’intention.

C’est exactement ce qui m’est arrivé sur Muse Otter au début.

Le cas Muse Otter : la bonne taille, le mauvais device

Je voulais 6 screenshots iPad.

Le premier export avait bien les dimensions iPad. Sauf que le renderer utilisait encore un mockup iPhone. Donc j’avais des fichiers qui avaient l’air corrects sur le papier, mais visuellement c’était faux.

C’est le genre de détail qui paraît petit si tu regardes juste le dossier final. En vrai, ça ruine tout.

J’aurais pu dire “bon, ça passe”. Mais justement, c’est là que l’approche agentique m’intéresse : si une brique est fausse, on corrige la brique. On ne maquille pas le résultat.

J’ai donc fait corriger le renderer pour ajouter un vrai mode iPad. Puis on a rerendu les 6 slides. Puis on a découvert un deuxième problème : le mockup était bon, mais le layout bouffait le texte.

Donc deuxième passe :

safe zones plus larges
taille de headline réduite
meilleure position du mockup
moins d’espace mort en bas
rerender complet
remplacement des fichiers dans Fastlane

C’est exactement ce que je cherchais : un système qui n’essaie pas de me faire plaisir avec une sortie moyenne, mais qui permet d’itérer jusqu’à obtenir le bon rendu.

Ce que les agents font vraiment dans ce process

Je pense qu’on fantasme souvent les agents comme des espèces de remplaçants humains magiques.

Moi, je les utilise plutôt comme une équipe qui prend en charge la partie répétitive et fragile.

Concrètement, après avoir setup le système (le contexte produit + le skill + le repo open-source du renderer), je n’ai plus rien fait manuellement. L’agent :

ouvre l’app web déployée dans un navigateur headless
navigue dans les écrans et prend les captures lui-même
corrige les ratios (le rendu Flutter web n’est pas en ratio iPhone)
génère les mockups via le renderer (ParthJadhav/app-store-screenshots), cadre device, headline marketing, couleurs de la brand extraites du code source
exporte aux tailles requises
copie dans Fastlane

Et quand il faut une vraie modif technique (ajouter le mode iPad au renderer par exemple), je la délègue à un agent d’ingénierie.

Moi, je ne me tape pas le tunnel de 25 petites actions sans intérêt. Je valide le résultat final, c’est tout.

Pourquoi le multilingue est la vraie raison de faire ça

Honnêtement, si tu fais un seul set en une seule langue, tu peux encore te débrouiller à la main.

Le vrai cauchemar commence quand tu veux faire :

anglais
français
plusieurs devices
plusieurs apps
et plusieurs itérations dans le mois

Là, refaire les choses à la main devient absurde.

Avec une chaîne bien construite, le multilingue n’est plus un deuxième projet. C’est juste une autre entrée dans le système.

Tu changes les strings. Tu vérifies le layout. Tu exportes.

Si un texte FR casse la mise en page, ce n’est pas un drame artisanal. C’est un bug de compo qu’on corrige une fois.

Et ça, c’est la différence entre produire du contenu et construire de l’infrastructure marketing.

Ce que ça m’a réellement fait gagner

Le gain n’est pas juste “du temps”. C’est trop vague de dire ça.

Le vrai gain, c’est surtout :

moins de friction au moment de lancer une itération
moins d’erreurs bêtes
moins de charge mentale
moins de micro-décisions sans valeur

Je n’ai plus besoin de me souvenir :

où mettre les exports
quel format utiliser
quelle source capture pour quel slide
si je dois passer par la web app ou par un projet screenshot
comment renommer les fichiers pour Fastlane

Le système absorbe ça à ma place.

Et franchement, c’est ça qui me plaît dans l’automatisation agentique. Pas le côté “wow IA”. Le côté “je peux enfin garder mon cerveau pour les décisions qui comptent”.

Le plus intéressant : ce n’est pas limité aux screenshots

Le plus fort dans cette histoire, ce n’est pas juste que j’ai automatisé mes screenshots ASO.

C’est que le pattern se réutilise partout.

Quand tu as :

de la mémoire projet
des skills clairs
des agents avec des rôles précis
des dossiers bien rangés

alors plein de tâches marketing pénibles commencent à devenir automatisables proprement :

screenshots
metadata ASO
exports multilingues
pages SEO
contenu social
variantes créa

À partir du moment où un process est répétitif, documentable et relou, il devient une bonne cible.

Ma conclusion

Automatiser mes screenshots ASO, ce n’était pas juste une petite optimisation d’indie hacker.

C’était une manière de me prouver un truc plus large : beaucoup de tâches qu’on traite encore comme des corvées ponctuelles méritent en réalité d’être traitées comme des systèmes.

Et quand tu fais ça, tu bosses différemment.

Tu ne pars plus d’un canvas vide à chaque demande. Tu pars d’une machine qui sait déjà presque quoi faire.

Et toi, tu reviens au bon niveau : choisir, arbitrer, corriger, diriger.

C’est probablement ça, au fond, la partie la plus intéressante de l’IA agentique pour un builder solo.

Pas remplacer le travail. Structurer tout ce qui te ralentit.