Jalapeño : la puce IA d'OpenAI qui va tout accélérer (et faire baisser les prix)

Une puce conçue sur mesure pour les modèles de langage, développée en seulement neuf mois. Le premier accélérateur d'OpenAI promet des performances inédites et un déploiement massif dès 2026.

UNE PUCES POUR LES MODÈLES DE LANGAGE, CONÇUE EN NEUF MOIS

OpenAI et Broadcom viennent de dévoiler Jalapeño, la première puce accélérateur d'intelligence conçue par OpenAI. Contrairement aux puces classiques, celle-ci a été imaginée dès le départ pour faire tourner les modèles de langage (LLM) avec une efficacité record. Le projet a été mené en seulement neuf mois, une durée record pour un composant aussi complexe.

Cette puce n’est pas un simple ajustement d’un modèle existant : elle a été construite à partir de zéro en partant des besoins précis d’OpenAI. Le résultat ? Un composant qui promet des performances par watt bien supérieures aux puces actuelles les plus performantes. Les premiers tests en laboratoire confirment déjà cette avance.

"Le monde se dirige vers une économie basée sur le calcul. Jalapeño s’inscrit dans notre stratégie d’infrastructure complète pour rendre l’IA plus rapide, plus fiable et plus abordable."

LE PREMIER MAILLON D'UNE PLATEFORME MULTI-GÉNÉRATIONS

Jalapeño n’est pas une solution isolée : c’est le premier maillon d’une plateforme de calcul multi-générations développée avec Broadcom. L’objectif ? Déployer des centres de données capables de fournir des gigawatts de puissance, en partenariat avec des acteurs comme Microsoft. Le déploiement massif est prévu à partir de 2026.

Cette plateforme ne se limite pas à une seule Génération de puces. OpenAI et Broadcom prévoient déjà plusieurs versions, chacune optimisée pour les futurs modèles d’IA. Le tout s’inscrit dans une vision à long terme : rendre l’IA accessible à un public toujours plus large.

UNE CONCEPTION BASÉE SUR LES BESOINS CONCRETS DES MODÈLES

Contrairement aux puces génériques, Jalapeño a été pensée autour des besoins spécifiques des modèles de langage. OpenAI a utilisé ses connaissances en architecture, en noyaux de calcul (kernels), en systèmes de serveurs et en produits existants pour concevoir une puce sur mesure. Le résultat ? Une puce capable de gérer tous les types de LLM, actuels et futurs, avec une efficacité optimale.

Les premiers échantillons de Jalapeño tournent déjà dans les laboratoires d’OpenAI, à une fréquence et une puissance adaptées à la production. Parmi les modèles testés, on trouve GPT-5.3-Codex-Spark, un modèle avancé d’OpenAI. Les résultats préliminaires sont prometteurs : la puce atteint des performances bien supérieures aux standards actuels.

"Nous avons optimisé l’architecture autour des noyaux, du mouvement des données, du réseau et des schémas de serveurs qui comptent le plus pour les modèles d’IA de pointe."

UNE ARCHITECTURE QUI RÉDUIT LES GASPILLAGES

Jalapeño se distingue par une architecture innovante qui réduit le mouvement des données et équilibre les ressources de calcul, de mémoire et de réseau. L’objectif ? Atteindre une utilisation réelle des ressources bien plus proche des limites théoriques des puces. Broadcom a apporté son expertise en silicium et en technologies réseau, notamment avec ses puces Tomahawk, pour permettre une production à grande échelle.

Cette approche permet de minimiser les pertes d’énergie et d’optimiser chaque watt consommé. Le résultat : des modèles de langage qui tournent plus vite, avec moins de latence et un coût réduit pour les utilisateurs.

L'INFÉRENCE, LÀ OÙ L'IA TOUCHE VRAIMENT LES UTILISATEURS

L’inférence (le processus qui permet à un modèle de langage de produire une réponse) est l’étape où l’IA devient utile pour les gens. Chaque amélioration de coût, de vitesse ou de fiabilité se traduit directement par des réponses plus rapides dans ChatGPT, des tâches plus complexes dans Codex, ou des produits API moins chers à développer.

Jalapeño est conçue pour rendre l’inférence plus efficace, ce qui permet à OpenAI de proposer des services plus performants et plus accessibles. L’objectif ? Démocratiser l’IA en la rendant plus abordable et plus fiable pour tous, des étudiants aux entreprises.

UN AVANTAGE

Sources :

OpenAI News

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO