Comment l'IA booste les effets spéciaux en accélérant les effets de visage par 8

Une entreprise de cinéma utilise l’intelligence artificielle et des serveurs cloud pour diviser par huit le temps nécessaire à la création d’effets de visage. Résultat : des délais raccourcis et des images plus nettes.

LE PROBLÈME DES EFFETS DE VISAGE : DES SEMAINES PERDUES

Dans l’univers des effets visuels pour le cinéma et les séries, remplacer un visage par celui d’un acteur ou d’une doublure peut prendre plus de cinq jours de travail minutieux. Ces méthodes traditionnelles, bien qu’efficaces, créent des bouchons dès les premières étapes du projet. Pour Outpost VFX, une société présente au Royaume-Uni, au Canada et en Inde, chaque retard se traduit par des coûts supplémentaires et des délais clients qui s’allongent.

L’intelligence artificielle pourrait accélérer ce processus, mais les Outils existants étaient limités par la puissance des serveurs locaux. L’équipe d’Outpost VFX avait développé un modèle capable de s’entraîner sur des images tournées sur place, mais un seul GPU (un processeur spécialisé pour l’IA) à la fois limitait les performances. Impossible d’exploiter tout le potentiel de leur solution.

TROIS BESOINS TECHNIQUES POUR RÉVOLUTIONNER LE PROCESSUS

Pour accélérer leur travail, Outpost VFX avait identifié trois exigences majeures :

1. Distribuer le calcul sur plusieurs GPU pour traiter plus de données en même temps.

2. Sécuriser les données sensibles utilisées pour entraîner les modèles, comme les images d’acteurs ou de doublures.

3. Intégrer la solution à leur infrastructure cloud existante sans tout reconstruire.

AWS DEVIENT LE PARTENAIRE TECHNIQUE D’OUTFOST VFX

Pour répondre à ces défis, Outpost VFX a collaboré avec le AWS Generative AI Innovation Center, une équipe d’experts en IA, en science des données et en architecture cloud. Leur mission ? Aider les entreprises à exploiter le pouvoir de l’intelligence artificielle générative avec des solutions sur mesure. Ensemble, ils ont modernisé les algorithmes d’apprentissage de l’entreprise.

DES SERVEURS PUISSANTS POUR DES EFFETS PLUS RAPIDES

Avant cette collaboration, Outpost VFX entraînait ses modèles sur des stations de travail équipées de GPU NVIDIA RTX 3090. Chaque ajustement du modèle prenait entre une et deux semaines. Une solution difficile à faire évoluer en raison de la gestion complexe des serveurs cloud locaux.

Leur choix s’est porté sur les instances Amazon EC2 P5, des machines virtuelles spécialisées dans l’entraînement de modèles d’IA. Contrairement aux anciens serveurs qui communiquaient via des câbles PCIe (un système de connexion classique), les P5 utilisent la technologie NVLink. Cette innovation permet aux GPU de partager les données 10 fois plus vite, un avantage crucial pour synchroniser les calculs entre plusieurs processeurs.

Chaque instance P5 est équipée de NVIDIA H100, un GPU doté de 14 592 cœurs de calcul et de 80 Go de mémoire ultra-rapide. Une nette amélioration par rapport aux RTX 3090 utilisés auparavant.

PYTORCH DISTRIBUTED : LA CLÉ POUR PARALLÉLISER LES CALCULS

Avec l’aide des experts d’AWS, l’équipe d’Outpost VFX a adapté son code pour utiliser PyTorch Distributed Data Parallel (DDP). Cette technique copie les paramètres du modèle sur chaque GPU, permettant de traiter plus d’images en même temps. Résultat : le temps d’entraînement est divisé, car chaque machine travaille en parallèle sur une partie des données.

Le projet a duré six semaines. Les développeurs d’AWS ont transformé le code existant pour qu’il fonctionne sur les instances P5, tout en gardant une architecture sécurisée pour protéger les images sensibles des acteurs.

8 FOIS PLUS RAPIDE : LES CHIFFRES QUI PARLENT

Pour mesurer l’efficacité de la solution, Outpost VFX a mené un test comparatif. Ils ont entraîné leur modèle sur un jeu de données d’images fixes, avec les mêmes paramètres, et chronométré le temps nécessaire pour atteindre un seuil de perte prédéfini. La référence était un entraînement sur un seul GPU d’une instance G5, comparé à l’entraînement sur les instances P5.

Résultat : jusqu’à 8 fois plus rapide grâce à la parallélisation sur plusieurs GPU.

Cette accélération a permis de réduire les cycles d’itération. Les versions initiales des effets de visage sont maintenant approuvées par les réalisateurs en seulement deux jours, contre une à deux semaines auparavant. De plus, la possibilité d’entraîner les modèles sur des images de plus haute résolution et des jeux de données plus vastes a amélioré la qualité des rendus finaux.

DES EFFETS DE VISAGE EN DEUX JOURS AU LIEU DE DEUX SEMAINES

Grâce à cette architecture optimisée par AWS, Outpost VFX peut désormais proposer à ses clients des effets de visage assistés par IA, tout en respectant les exigences de sécurité et de scalabilité propres aux productions haut de gamme. Le passage des GPU locaux aux GPU d’entreprise comme ceux des instances P5 ouvre la voie à de nouveaux outils créatifs et à une expansion mondiale de leurs studios.

« Nous pouvons maintenant itérer beaucoup plus vite grâce à notre flux de travail parallélisé et à la capacité d’exploiter plusieurs GPU haut de gamme en même temps », explique Tim Chauncey, directeur technique d’Outpost VFX. « La rapidité d’itération est cruciale dans le travail sur les effets visuels, et cette architecture offre des capacités plus robustes et évolutives pour les développements futurs. »

« Ce qui m’enthousiasme le plus, c’est que ces modèles ne sont plus des expériences de laboratoire : ils deviennent une partie intégrante du pipeline moderne des effets visuels. »

Dheeraj Bhadani, architecte logiciel principal chez Outpost VFX, ajoute : « L’accélération multi-GPU est la base sur laquelle seront construits les outils créatifs de nouvelle génération. »

ET DEMAIN ? VERS DES EFFETS ENCORE PLUS RÉALISTES

L’équipe d’Outpost VFX envisage déjà des améliorations futures. Parmi les pistes explorées :

• Augmenter la résolution des images fournies au modèle.

• Utiliser des instances P5 plus récentes, dotées de davantage de mémoire, pour traiter des jeux de données encore plus volumineux.

• Intégrer des services comme Amazon SageMaker pour automatiser l’entraînement, la gestion des versions des modèles et le déploiement des inférences.

COMMENT REPRODUIRE CES RÉSULTATS ?

Pour accélérer vos propres entraînements en IA, voici les étapes clés à suivre :

1. Évaluez vos besoins en calcul : combien de GPU pouvez-vous utiliser en parallèle ?

2. Adaptez votre code pour utiliser des stratégies de formation distribuée, comme PyTorch DDP.

3. Choisissez des instances cloud adaptées, comme les P5 d’AWS, pour maximiser la bande passante entre les GPU.

4. Protégez vos données sensibles avec une architecture sécurisée.

« Vous pouvez obtenir des résultats similaires en adaptant les stratégies de formation distribuée à votre cas d’usage spécifique et à vos besoins en infrastructure », précisent les auteurs.

UN PAS DE GÉANT POUR LES EFFETS VISUELS

Cette collaboration entre Outpost VFX et AWS marque un tournant dans l’industrie des effets spéciaux. Les modèles d’IA ne sont plus cantonnés aux laboratoires : ils deviennent des outils opérationnels, intégrés aux pipelines de production. Avec des temps de rendu divisés par huit et des images de meilleure qualité, l’avenir des effets visuels s’annonce plus rapide, plus précis et plus créatif que jamais.

Pour les studios de cinéma et les productions télévisuelles, cette avancée technologique pourrait bien redéfinir les standards de qualité et de délais dans un secteur où chaque seconde compte.

Sources :

AWS ML Blog

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO