Des intelligences artificielles programment désormais l'entraînement de robots en totale autonomie. NVIDIA démontre que ces agents peuvent apprendre à des bras articulés à manipuler des objets du quotidien, avec un taux de réussite record.

Imaginez une pièce remplie de bras robotisés, de cartes graphiques et de quelques lignes de code. Ajoutez des intelligences artificielles chargées de leur apprendre à accomplir des tâches précises. Résultat ? Ces IA parviennent à entraîner les robots à couper des attaches plastiques ou à insérer des cartes graphiques dans des emplacements étroits de cartes mères. Ce scénario, digne d’un film de science-fiction, est devenu réalité grâce à une nouvelle technologie développée par NVIDIA.

LE CADRE QUI DONNE DES SUPER-POUVOIRS AUX IA

Pour permettre à ces intelligences artificielles de contrôler directement des robots, les chercheurs de NVIDIA ont créé un cadre logiciel appelé ENPIRE. Ce dernier fonctionne comme une sorte de couche intermédiaire qui enveloppe les modèles d’IA. Il leur offre des capacités essentielles : une mémoire pour retenir ce qu’elles ont fait, un contexte pour comprendre la situation, des contraintes pour éviter les erreurs, et des boucles de feedback pour s’améliorer en continu. ENPIRE a été conçu en collaboration avec des chercheurs de l’université Carnegie Mellon (Pittsburgh) et de l’université de Californie à Berkeley.

UN LABORATOIRE DE ROBOTS QUI S’AUTO-AMÉLIORE LA NUIT

Jim Fan, directeur de l’IA chez NVIDIA, a partagé cette avancée sur LinkedIn avec une pointe d’humour. « Une partie de notre laboratoire NVIDIA GEAR s’améliore désormais sans relâche pendant la nuit, a-t-il écrit. Le matin, nous ne lisons que les rapports. » Il a même plaisanté en disant que Jensen Huang, le PDG de NVIDIA, ne remarquerait même pas si tout le monde prenait des vacances, tant le système fonctionne de manière autonome. Mais l’enjeu dépasse le simple amusement : Fan a annoncé que NVIDIA rendrait ENPIRE open source. L’objectif ? Permettre à n’importe qui d’installer son propre laboratoire de robots autonomes chez soi.

QUATRE MODULES POUR PILOTER LES ROBOTS À DISTANCE

Le cadre ENPIRE repose sur quatre modules principaux qui transforment les IA en véritables superviseurs de robots. Le premier module permet une réinitialisation et vérification automatiques des tâches : l’IA peut relancer un essai si le robot échoue, sans intervention humaine. Le deuxième module affine les politiques de comportement des robots, c’est-à-dire les règles qui dictent leurs actions. Le troisième évalue ces politiques en les testant sur plusieurs robots fonctionnant en parallèle. Enfin, le quatrième module analyse les logs (les journaux d’activité), étudie des articles de Recherche, et améliore l’infrastructure de formation ainsi que le code des algorithmes.

TROIS IA PROGRAMMEUSES TESTÉES SUR DES ROBOTS RÉELS

Pour valider ENPIRE, les chercheurs ont utilisé trois agents IA spécialisés dans la programmation : OpenAI Codex avec GPT-5.5, Anthropic Claude Code avec Opus 4.7, et Moonshot AI Kimi Code avec Kimi K2.6. Chaque équipe d’IA a développé ses propres méthodes pour entraîner les robots, les a testées en conditions réelles, puis a conservé les modifications qui amélioraient le taux de réussite global après plusieurs cycles d’essais autonomes.

99% DE RÉUSSITE SUR DES TÂCHES COMPLEXES

Avec ENPIRE, ces IA ont conçu des stratégies d’amélioration autonome pour les robots, atteignant un taux de réussite de 99 % sur plusieurs tâches de manipulation. Parmi elles, le célèbre test Push-T, où un robot doit déplacer un bloc en forme de T pour le placer précisément sur une table. D’autres défis incluaient l’organisation d’épingles dans une boîte, la coupe d’attaches plastiques, ou encore l’insertion d’une carte graphique dans une carte mère avant de la retirer pour recommencer l’exercice.

Le résultat le plus impressionnant concerne la tâche d’insertion et d’organisation d’épingles. Dans ce scénario, les IA ont atteint près de 100 % de réussite plus rapidement qu’une méthode humaine « de pointe » développée par les mêmes chercheurs.

PLUS D’IA = PLUS DE RAPIDITÉ (MAIS PAS SANS LIMITES)

Les expériences ont aussi révélé que les équipes de huit IA atteignaient des taux de réussite élevés plus rapidement que les équipes de quatre ou les IA seules. Par exemple, une équipe de huit IA a obtenu 99 % de réussite sur le test Push-T en seulement deux heures, contre trois heures pour une équipe de quatre et près de cinq heures pour une IA seule.

Cependant, cette autonomie a un prix. Les robots restaient souvent inutilisés pendant que les IA étaient occupées à « lire des logs, écrire du code, déboguer ou attendre le modèle de langage ». Les équipes plus nombreuses passaient aussi plus de temps à échanger entre elles qu’à utiliser les robots. Parfois, les IA ne exploitaient pas pleinement les ressources de calcul disponibles lors de sessions d’entraînement parallèles.

UNE CONSOMMATION DE TOKENS QUI PEUT EXPLOSER

La rapidité accrue offerte par les équipes d’IA s’accompagne d’une consommation bien plus élevée de tokens. Ces jetons, utilisés par les modèles de langage pour fonctionner, pourraient coûter bien plus cher à l’avenir. Anthropic, par exemple, envisage de modifier ses tarifs pour augmenter significativement le prix des tokens. Une donnée à prendre en compte pour les développeurs.

NVIDIA ACCÉLÈRE SON VISION DE L’IA PHYSIQUE

Avec cette avancée, NVIDIA pousse son ambition d’une IA physique à travers plusieurs initiatives robotiques. Le 31 mai 2026, l’entreprise a annoncé un partenariat avec Unitree, un géant chinois de la robotique, pour fournir un robot humanoïde de référence aux laboratoires de recherche. Objectif : accélérer le développement de robots polyvalents alimentés par l’IA.

Début juin 2026, Jensen Huang, le PDG de NVIDIA, a également rencontré Chung Euisun, président du groupe Hyundai Motor, pour discuter de l’industrialisation à grande échelle des robots intelligents. Le groupe Hyundai possède Boston Dynamics, célèbre pour son robot quadrupède Spot et ses travaux sur le robot humanoïde Atlas.

VERS DES LABORATOIRES DE ROBOTS 100% AUTONOMES ?

Cette expérience de NVIDIA marque une étape clé vers des laboratoires où les robots s’entraînent seuls, sans intervention humaine. Les résultats sont prometteurs, mais des défis subsistent : optimiser l’utilisation des ressources, réduire les temps d’attente, et maîtriser les coûts liés à la consommation de tokens. Si ces obstacles sont surmontés, l’IA pourrait révolutionner la formation des robots, rendant possible des applications industrielles ou domestiques encore inimaginables aujourd’hui.

Sources :
  • Ars Technica

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO