Pourquoi l'IA se heurte à un mur : puces, énergie et modèles alternatifs

Pénurie de puces, explosion de la demande, défis énergétiques et nouvelles architectures : cinq grands acteurs de l'IA tirent la sonnette d'alarme.

Le boom de l'intelligence artificielle se heurte à des limites physiques bien réelles, et les contraintes commencent plus bas dans la chaîne que beaucoup ne l'imaginent. C'est ce qui est ressorti d'une discussion entre cinq personnalités qui touchent à chaque couche de l'IA, réunies lors d'une conférence à Beverly Hills. Christophe Fouquet, PDG d'ASML (l'entreprise néerlandaise qui détient le monopole des machines de lithographie ultraviolette extrême, sans lesquelles les puces modernes n'existeraient pas), Francis deSouza, directeur des opérations de Google Cloud, Qasar Younis, cofondateur et PDG d'Applied Intuition (une société d'IA physique valorisée 15 milliards de dollars), Dimitry Shevelenko, directeur commercial de Perplexity (entreprise d'IA de Recherche et d'agents), et Eve Bodnia, physicienne quantique fondatrice de Logical Intelligence, qui remet en cause l'architecture de base de la plupart des IA actuelles. Voici ce qu'ils ont révélé sur les goulets d'étranglement qui menacent la révolution en cours.

LA PÉNURIE DE PUCES, UN GOUFFRE QUI SE CREUSE

Le premier à tirer la sonnette d'alarme est Christophe Fouquet. Il décrit une « accélération massive de la fabrication de puces », mais affirme avec force que « pour les deux, trois, peut-être cinq prochaines années, le marché sera limité par l'offre ». Traduction : les géants du cloud, comme Google, Microsoft, Amazon ou Meta, n'obtiendront pas tous les semi-conducteurs qu'ils commandent. Point final. Une pénurie qui pourrait freiner des projets d'IA colossaux.

UNE DEMANDE QUI EXPLOSE, UN CARNET DE COMMANDES QUI ENFLAMME

Francis deSouza, de Google Cloud, donne la mesure du problème. Le chiffre d'affaires de son activité a dépassé les 20 milliards de dollars le trimestre dernier, en hausse de 63 %. Mais plus impressionnant encore : le carnet de commandes, c'est-à-dire les revenus engagés mais non encore livrés, a presque doublé en un seul trimestre, passant de 250 à 460 milliards de dollars. « La demande est réelle », a-t-il déclaré avec un calme déconcertant. Une soif de puissance de calcul qui ne sera pas étanchée de sitôt.

Le carnet de commandes de Google Cloud a bondi de 250 à 460 milliards de dollars en un trimestre.

LE GOULOT D'ÉTRANGLEMENT DES DONNÉES PHYSIQUES

Pour Qasar Younis, la contrainte vient d'ailleurs. Applied Intuition construit des systèmes d'autonomie pour voitures, camions, drones, engins miniers et véhicules de défense. Son goulet d'étranglement n'est pas le silicium, mais les données. Des données qu'on ne peut obtenir qu'en envoyant des machines dans le monde réel et en observant ce qui se passe. « Il faut les trouver dans le monde réel », insiste-t-il, et aucune simulation synthétique ne comble entièrement ce fossé. « Il faudra beaucoup de temps avant de pouvoir entraîner entièrement de manière synthétique des modèles qui fonctionnent dans le monde physique. »

L'ÉNERGIE, LE PROCHAIN MUR À FRANCHIR

Si les puces sont le premier goulet, l'énergie est le deuxième, juste derrière. Francis deSouza confirme que Google explore sérieusement l'idée de centres de données dans l'espace pour répondre aux contraintes énergétiques. « On a accès à une énergie plus abondante », note-t-il. Mais il y a un hic : dans le vide spatial, il n'y a pas de convection, et seule la radiation permet d'évacuer la chaleur, un processus bien plus lent et difficile à maîtriser qu'avec les systèmes de refroidissement à air ou liquide actuels. Malgré tout, l'entreprise considère cette voie comme sérieuse.

L'EFFICACITÉ PAR L'INTÉGRATION, LA BOTTE SECRÈTE DE GOOGLE

L'argument plus profond de deSouza porte sur l'efficacité par l'intégration. La stratégie de Google, qui consiste à concevoir ensemble toute sa pile d'IA (des puces TPU personnalisées jusqu'aux modèles et agents), offre un avantage en termes de flops par watt (la puissance de calcul délivrée pour une quantité d'énergie donnée) qu'une entreprise achetant des composants sur étagère ne peut tout simplement pas répliquer. « Faire tourner Gemini sur des TPU est beaucoup plus économe en énergie que n'importe quelle autre configuration », explique-t-il, car les concepteurs de puces savent à l'avance ce que le modèle va exiger.

LA VÉRITÉ DU COÛT

Christophe Fouquet revient sur une réalité brutale : « Rien ne peut être gratuit. » L'industrie vit un moment étrange, investissant des sommes colossales poussée par une nécessité stratégique. Mais plus de calcul signifie plus d'énergie, et plus d'énergie a un prix. Un rappel que les ambitions de l'IA ne sont pas sans conséquences économiques.

« Rien ne peut être gratuit », prévient le PDG d'ASML, alors que les investissements explosent.

ET SI L'ARCHITECTURE DE L'IA ÉTAIT À REPENSER ?

Pendant que le reste du secteur débat de la taille des modèles, de l'architecture et de l'efficacité de l'inférence dans le cadre des grands modèles de langage, Eve Bodnia construit quelque chose de très différent. Sa startup, Logical Intelligence, repose sur ce qu'on appelle les modèles basés sur l'énergie (EBM), une classe d'IA qui ne prédit pas le mot suivant dans une séquence, mais tente de comprendre les règles qui sous-tendent les données. Une approche, soutient-elle, plus proche du fonctionnement réel du cerveau humain.

LE LANGAGE, JUSTE UNE INTERFACE

« Le langage est une interface entre mon cerveau et le vôtre », explique Eve Bodnia. « Le raisonnement lui-même n'est pas lié à une langue. » Son plus grand modèle ne dépasse pas 200 millions de paramètres, une paille à côté des centaines de milliards des LLM actuels. Pourtant, elle affirme qu'il tourne des milliers de fois plus vite. Surtout, il est conçu pour mettre à jour ses connaissances au fil des nouvelles données, sans avoir besoin d'un réentraînement complet depuis zéro.

200 millions de paramètres, mille fois plus rapide : la promesse des modèles basés sur l'énergie.

COMPRENDRE LE MONDE PLUTÔT QUE LE TEXTE

Pour la conception de puces, la robotique ou tout domaine où un système doit saisir des règles physiques plutôt que des motifs linguistiques, Bodnia estime que les EBM sont plus adaptés. « Quand vous conduisez, vous ne cherchez pas des motifs dans un langage. Vous regardez autour de vous, vous comprenez les règles du monde, et vous prenez une décision. » Un argument qui devrait gagner en visibilité dans les mois à venir, alors que le monde de l'IA commence à se demander si la seule échelle suffit.

DES TRAVAILLEURS NUMÉRIQUES QUI AGISSENT POUR VOUS

Dimitry Shevelenko a expliqué comment Perplexity est passé d'un outil de recherche à ce qu'il appelle un « travailleur numérique ». Perplexity Computer, sa dernière offre, n'est pas conçue comme un outil qu'un employé utilise, mais comme un membre du personnel qu'il dirige. « Chaque matin, vous vous réveillez avec une centaine de collaborateurs dans votre équipe », illustre-t-il. « Qu'allez-vous faire pour en tirer le meilleur parti ? »

LA SÉCURITÉ PAR LA GRANULARITÉ

Cette vision pose évidemment des questions de contrôle. La réponse de Shevelenko tient en un mot : la granularité. Les administrateurs d'entreprise peuvent spécifier non seulement les outils auxquels un agent a accès, mais aussi si ces permissions sont en lecture seule ou en lecture-écriture, une distinction capitale dans un environnement professionnel. Quand Comet, l'agent d'utilisation d'ordinateur de Perplexity, agit au nom d'un utilisateur, il présente d'abord un plan et demande approbation. Certains trouvent cette étape agaçante, mais Shevelenko la juge essentielle, fort de son expérience au conseil d'administration de Lazard, où il a découvert les réflexes prudents d'un responsable de la sécurité protégeant une marque vieille de 180 ans bâtie sur la confiance. « La granularité est le socle d'une bonne hygiène de sécurité », affirme-t-il.

L'IA PHYSIQUE, UN ENJEU DE SOUVERAINETÉ

Qasar Younis a livré l'observation la plus géopolitique du panel : l'IA physique et la souveraineté nationale sont liées d'une manière que l'IA purement numérique n'a jamais connue. L'Internet s'est répandu comme une technologie américaine et n'a rencontré de résistance qu'au niveau applicatif (les Uber ou DoorDash) lorsque les conséquences hors ligne sont devenues visibles. L'IA physique, c'est différent. Les véhicules autonomes, les drones de défense, les engins miniers, les machines agricoles se manifestent dans le monde réel d'une façon que les gouvernements ne peuvent ignorer. Cela soulève des questions de sécurité, de collecte de données et de contrôle. « Presque systématiquement, chaque pays dit : nous ne voulons pas de cette intelligence sous forme physique sur notre territoire, contrôlée par un autre pays. » Younis ajoute que moins de nations peuvent aujourd'hui déployer un robot-taxi qu'elles ne possèdent l'arme nucléaire.

LA CHINE, FREINÉE PAR LE MANQUE DE PUCES AVANCÉES

Christophe Fouquet a nuancé le tableau. Les progrès chinois en IA sont réels, la sortie de DeepSeek a semé une sorte de panique dans l'industrie. Mais ces progrès sont contraints sous la couche des modèles. Sans accès à la lithographie EUV, les fabricants chinois ne peuvent pas produire les semi-conducteurs les plus avancés, et des modèles construits sur du matériel plus ancien subissent un désavantage cumulatif, quelle que soit la qualité du logiciel. « Aujourd'hui, aux États-Unis, vous avez les données, l'accès au calcul, les puces, les talents. La Chine fait du très bon travail en haut de la pile, mais il lui manque certains éléments en dessous », a résumé Fouquet.

UN IMPACT SUR LA PENSÉE CRITIQUE ?

À la fin de la discussion, une personne a posé la question qui fâche : tout cela va-t-il affecter la capacité de la prochaine génération à penser de manière critique ? Les réponses ont été optimistes, comme on pouvait s'y attendre de la part de ceux qui ont misé leur carrière sur ces technologies. Francis deSouza a immédiatement pointé l'ampleur des problèmes que des outils plus puissants pourraient enfin permettre à l'humanité de résoudre : maladies neurologiques dont on ne comprend pas encore les mécanismes biologiques, élimination des gaz à effet de serre, infrastructures de réseau électrique repoussées depuis des décennies. « Cela devrait nous libérer vers un nouveau niveau de créativité », a-t-il dit.

LA FIN DES POSTES DE DÉBUTANTS, OU L'ÉMERGENCE DE NOUVELLES OPPORTUNITÉS ?

Dimitry Shevelenko a fait valoir un point plus pragmatique : le poste de débutant est peut-être en train de disparaître, mais la capacité de lancer quelque chose par soi-même n'a jamais été aussi accessible. « Pour quiconque dispose de Perplexity Computer, la seule limite, c'est votre propre curiosité et votre capacité à agir. »

« La seule limite, c'est votre propre curiosité. »

COMBLER LES PÉNURIES DE MAIN-D'ŒUVRE, PAS DÉTRUIRE DES EMPLOIS

Qasar Younis a tracé la distinction la plus nette entre travail du savoir et travail physique. Il a rappelé que l'agriculteur américain moyen a 58 ans et que les pénuries de main-d'œuvre dans les mines, le transport routier longue distance et l'agriculture sont chroniques et s'aggravent, non pas parce que les salaires sont trop bas, mais parce que les gens ne veulent pas de ces emplois. Dans ces domaines, l'IA physique ne déplace pas des travailleurs consentants. Elle comble un vide qui existe déjà et qui ne fera que se creuser.

Sources :

TechCrunch AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO