Fugu de Sakana : l'IA qui défie les géants en mélangeant les modèles

Sakana AI bouscule les règles avec Fugu, un orchestrateur qui mélange plusieurs modèles pour éviter les restrictions. Mais les premiers tests laissent planer le doute.

UNE NOUVELLE STRATÉGIE POUR ÉVITER LES BLOCAGES

Depuis qu’un ordre américain a bloqué les modèles les plus puissants d’Anthropic, une question hante les utilisateurs d’IA : et si demain, plus personne n’avait accès à ces Outils ? Une startup japonaise, Sakana AI, propose une réponse radicale. Au lieu de miser sur un seul modèle, elle en assemble plusieurs derrière une seule interface. Le nom de ce système ? Fugu, comme le poisson toxique dont les Japonais savent extraire le poison pour en faire un mets délicat. Ici, le poison, ce serait la dépendance à un seul fournisseur.

FUGU : UN ORCHESTRATEUR QUI MÉLANGE LES MODÈLES

Fugu ne se contente pas de faire appel à plusieurs modèles. Il les orchestre comme un chef d’orchestre dirige ses musiciens. Pour chaque question, il choisit le modèle le plus adapté, répartit le travail, vérifie les résultats et fusionne les réponses. Tout cela se fait en arrière-plan, derrière une seule API. L’utilisateur n’a besoin de rien savoir : il envoie sa requête, et Fugu lui renvoie une réponse unique, comme s’il parlait à une seule IA.

DEUX VERSIONS POUR DEUX USAGES

Sakana propose deux versions de Fugu, accessibles via la même API. La première, simplement appelée Fugu, est optimisée pour les tâches du quotidien : programmer, discuter, répondre à des questions simples. La seconde, Fugu Ultra, est conçue pour des missions plus lourdes : analyser des brevets, tester la sécurité d’un système, ou explorer des données scientifiques complexes. Les deux versions promettent de rivaliser avec les modèles d’Anthropic comme Fable 5 ou le Mythos en phase de test, sur des benchmarks de codage, de raisonnement et de sciences.

« Fugu promet des capacités de pointe sans les risques liés aux contrôles à l’exportation », affirme Sakana AI, en référence directe aux restrictions américaines.

DES PERFORMANCES ENCORE À PROUVER

Pourtant, les premiers retours des utilisateurs sont partagés. Certains estiment que Fugu ne tient pas encore ses promesses de performance « de pointe ». D’autres s’interrogent sur la composition exacte des modèles utilisés et sur les coûts cachés. L’orchestration de plusieurs modèles, aussi intelligente soit-elle, a un prix : celui de la complexité et de l’opacité. Contrairement à des solutions comme OpenRouter, où l’utilisateur choisit lui-même les modèles à combiner, Fugu cache son jeu derrière une seule interface. Résultat ? Impossible de savoir quels modèles sont mobilisés, ni comment leurs réponses sont fusionnées.

UNE APPROCHE SIMILAIRE À OPENROUTER, MAIS DIFFÉRENTE

Fugu rappelle une autre solution récente : OpenRouter. Cette plateforme permet aussi de combiner plusieurs modèles via une seule API. Mais là où OpenRouter laisse l’utilisateur choisir ses modèles, Fugu prend cette décision à sa place. Une approche plus simple en apparence, mais qui soulève des questions sur la transparence et la maîtrise des coûts. Les experts restent donc prudents : « L’orchestration de modèles est une piste prometteuse pour repousser les limites de l’IA, mais les résultats concrets et les coûts réels restent à évaluer », résume un observateur du secteur.

LES SUPERCALCULATEURS DE SPACEX DEVIENNENT DES CENTRES DE LOUAGE

Pendant ce temps, SpaceX transforme ses supercalculateurs Colossus en véritables centres de location de puissance de calcul. Ces machines, initialement conçues pour entraîner les modèles Grok d’Elon Musk, sont désormais louées à d’autres entreprises. Le dernier client en date ? Reflection AI, une startup spécialisée dans l’IA pour le gouvernement et les entreprises. Le contrat porte sur 6,3 milliards de dollars de puissance de calcul NVIDIA. Un montant modeste comparé aux 1,25 milliard de dollars par mois payés par Anthropic, ou aux 920 millions de dollars versés par Google. Mais c’est un signe de plus que l’infrastructure IA devient un marché lucratif, indépendamment des performances des modèles eux-mêmes.

« Grok n’est peut-être pas au niveau des meilleurs modèles, mais cela n’empêche pas SpaceX de monétiser ses supercalculateurs. »

REFLECTION AI : UNE STARTUP QUI VEUT CONQUÉRIR L’IA DE FRONTIÈRE

Fondée en octobre 2024, Reflection AI se présente comme une alternative « ouverte » aux modèles de pointe. Pourtant, la startup n’a encore publié aucun modèle public. Son objectif ? Construire des systèmes d’IA pour le gouvernement et les entreprises, sans s’enfermer dans les contraintes des géants technologiques. Une ambition louable, mais qui reste pour l’instant théorique. Les supercalculateurs de SpaceX lui donnent les moyens de ses ambitions… à condition qu’elle parvienne à livrer un produit concret.

TYPLESS : DICTER POUR ÉCRIRE PLUS VITE

Changer de méthode de travail peut faire gagner un temps précieux. Typeless, un outil d’IA, propose de dicter ses idées et de les transformer automatiquement en textes structurés. Plus besoin de taper au clavier : il suffit de parler, et l’outil se charge de la recherche, de la synthèse et de la mise en forme. Par exemple, pour rédiger un tweet percutant sur les tendances de l’IA grand public, Typeless peut identifier une idée claire, trouver des articles pertinents, et générer un brouillon prêt à être publié. Les utilisateurs peuvent aussi dicter directement dans Gmail, Google Docs ou X, et voir leur discours transformé en texte poli et formaté. Un gain de temps immédiat pour les professionnels pressés.

TELY : L’IA QUI RÉCUPÈRE LES PATIENTS PERDUS

Dans le domaine médical, les patients ne se contentent plus de chercher des informations sur Google. Ils demandent directement à des IA comme ChatGPT, Perplexity ou Google qui est le meilleur médecin. Problème : ces recommandations peuvent les orienter vers la concurrence. Tely, une startup spécialisée, propose une solution. Son outil permet à une clinique de s’intégrer directement aux réponses de ces IA. Résultat ? Quand un patient demande qui consulter, l’outil recommande automatiquement la pratique du médecin, et peut même prendre rendez-vous directement dans son dossier médical électronique (EHR). Une façon de récupérer les patients qui s’apprêtaient à partir chez le voisin.

GOOGLE ET A24 : UN PARTENARIAT POUR ÉVITER LES PIÈGES DE L’IA AU CINÉMA

Google vient d’investir 75 millions de dollars dans A24, un studio de cinéma indépendant. L’objectif ? Développer des outils d’IA adaptés aux réalisateurs, plutôt que de générer des films entiers. Scott Belsky, responsable de la branche tech d’A24, précise que ces outils ne ressembleront pas aux générateurs d’images ou de vidéos actuels. Par exemple, ils pourraient créer des storyboards intelligents, en s’appuyant sur l’expertise des monteurs et des scénaristes. Une approche qui tente d’éviter les écueils de l’IA dans le cinéma : perte de contrôle créatif, plagiat, ou rejet par le public. Pourtant, le paradoxe est frappant : A24 vient de connaître un succès viral avec le film « Backrooms », souvent associé à l’esthétique de l’IA générative. Son directeur, Kane Parsons, avait même qualifié l’IA de « symptôme d’une pourriture culturelle et économique plus large ». Malgré tout, le studio mise sur cette technologie pour rester compétitif.

LES AGENCES DE RENSEIGNEMENT DES CINQ YEUX SONNENT L’ALARME

Les agences de cybersécurité des pays du Five Eyes (États-Unis, Royaume-Uni, Canada, Australie, Nouvelle-Zélande) ont publié un avertissement urgent. L’IA accélère les risques cyber « en quelques mois, et non en années ». Les attaques deviennent plus rapides, plus sophistiquées, et plus difficiles à détecter. Les dirigeants d’entreprises sont invités à renforcer leurs défenses sans attendre. Une course contre la montre s’engage : d’un côté, les cybercriminels exploitent les nouvelles capacités de l’IA pour innover ; de l’autre, les défenseurs tentent de suivre le rythme.

OPENAI RENFORCE SES OUTILS DE CYBERSÉCURITÉ

Face à cette menace, OpenAI étend son programme Daybreak, dédié à la cybersécurité. Le géant ajoute un plugin Codex Security pour détecter et corriger les vulnérabilités dans les logiciels. Il intègre aussi le modèle complet GPT-5.5-Cyber, spécialement conçu pour ce domaine. Enfin, OpenAI lance « Patch the Planet », une initiative visant à corriger les failles dans les logiciels open source. Une façon de contribuer à la sécurité collective, tout en positionnant ses outils comme des références dans le secteur.

MICRON ET ANTHROPIC : UNE ALLIANCE POUR L’INFRASTRUCTURE IA

Le fabricant de puces Micron a signé un accord stratégique avec Anthropic. L’entreprise fournira des mémoires et des solutions de stockage pour les serveurs d’Anthropic. Elle participera aussi à la conception de l’infrastructure IA de la startup, et investira dans son tour de table de série H. Une collaboration qui illustre l’importance croissante des composants matériels dans la course à l’IA. Sans puces performantes, pas de modèles puissants. Micron devient ainsi un acteur clé de l’écosystème, aux côtés des géants comme NVIDIA ou AMD.

LE PROJET DE LOI SKILL ACT : 5 000 DOLLARS POUR FORMER AUX MÉTIERS DE L’IA

Aux États-Unis, le représentant Sam Liccardo a déposé un projet de loi baptisé SKILL Act. Son objectif ? Inciter les entreprises à former leurs employés aux métiers de l’IA. Pour chaque salarié formé, l’État offrirait jusqu’à 5 000 dollars de crédit d’impôt. Une façon de combler le fossé entre les besoins des entreprises et les compétences disponibles. Le texte prévoit que ces formations aient lieu dans des établissements d’enseignement supérieur, pour garantir leur qualité. Une initiative qui pourrait accélérer l’adoption de l’IA dans le monde professionnel.

BASETEN LEVE 1,5 MILLIARD DE DOLLARS POUR SES SERVEURS IA

La startup Baseten, spécialisée dans l’infrastructure IA, vient d’annoncer une levée de fonds de 1,5 milliard de dollars. À ce rythme, elle vaut désormais 13 milliards de dollars. Son succès ? Une croissance fulgurante : son chiffre d’affaires a été multiplié par 20 en un an, et sa plateforme gère plus d’un milliard d’appels d’inférence par jour. Baseten propose des serveurs optimisés pour l’exécution des modèles d’IA, une infrastructure clé pour les entreprises qui veulent déployer des solutions à grande échelle. Une preuve que le marché de l’IA ne se limite pas aux modèles, mais inclut aussi les outils qui les font tourner.

NVIDIA INNOVE AVEC DES SERVEURS 100 % REFROIDIS PAR LIQUIDE

NVIDIA pousse encore plus loin l’optimisation énergétique de ses serveurs. Ses nouvelles machines Rubin sont les premières à être refroidies à 100 % par liquide. Le liquide de refroidissement circule à une température proche de celle d’un jacuzzi, ce qui permet de réduire la consommation d’énergie et d’éliminer jusqu’à 100 % l’utilisation d’eau. Une avancée majeure pour les data centers, souvent pointés du doigt pour leur empreinte écologique. NVIDIA prouve que performance et durabilité peuvent aller de pair.

UN CAS CONCRET : CLAUDE TRANSFORME UN ERP EN OUTIL DE REPORTING

Hasnain K., un entrepreneur basé à Toronto, a utilisé l’IA pour moderniser son entreprise. Son logiciel de gestion (ERP) était obsolète et ne permettait que peu de reporting. Pourtant, il disposait d’une API. Hasnain a confié la documentation technique de son ERP à Claude, un modèle d’IA. Grâce à l’outil MCP et à l’intégration avec Office 365, Claude a généré des rapports automatiques : ventes quotidiennes par service et par commercial, tendances hebdomadaires et mensuelles sur les volumes de vente et de produits, et suivi des créances clients. Ces rapports sont envoyés deux fois par jour aux managers. Claude a aussi créé des automatisations via Zapier pour synchroniser les commandes de vente avec ShipStation, et les données de suivi des colis avec l’ERP. Résultat ? Des économies substantielles : des milliers de dollars en développement, et un gain de temps énorme. Avant, ces tâches étaient réalisées manuellement. Aujourd’hui, tout est automatisé.

« Ces intégrations auraient coûté des milliers de dollars à un développeur. Avec l’IA, tout est fait en quelques heures. »

COMMENT RÉDUIRE LE TEMPS DE SAISIE AVEC LES COMMANDES VOCALES IA

La dictée vocale est l’une des fonctionnalités les plus pratiques des assistants IA. En combinant reconnaissance vocale et traitement automatique du langage, il est possible de dicter des textes, des emails ou des messages sans toucher au clavier. Les outils modernes corrigent les erreurs en temps réel et transforment un discours approximatif en texte poli. Une solution idéale pour les professionnels qui passent beaucoup de temps à écrire, ou pour ceux qui préfèrent parler plutôt que taper. Le gain de temps est immédiat : jusqu’à 50 % de temps en moins sur les tâches de rédaction.

Pour en tirer le meilleur parti, il suffit de s’entraîner à parler clairement et de corriger naturellement ses erreurs à voix haute. L’IA comprendra la correction et ne gardera que la version finale. Plus besoin de tout recommencer : un simple « non, je voulais dire… » suffit pour ajuster le texte.

AI GROUNDING : COMMENT ÉVITER LES HALLUCINATIONS DES IA

Les modèles de langage ont un défaut majeur : ils inventent parfois des informations. Pour limiter ce phénomène, une technique appelée grounding (ou ancrage) est de plus en plus utilisée. L’idée ? Faire en sorte que l’IA s’appuie sur des sources fiables pour générer ses réponses. Par exemple, un chatbot médical pourrait être connecté à une base de données de symptômes validés, plutôt que de répondre uniquement à partir de sa mémoire d’entraînement. Le grounding améliore considérablement la fiabilité des réponses, mais il ne suffit pas de l’activer une fois pour que tout fonctionne. Il faut aussi mettre en place des traces d’audit pour vérifier que l’IA respecte bien les règles. Une erreur d’ancrage peut avoir des conséquences graves : une information erronée dans un diagnostic, une décision biaisée dans un processus juridique… D’où l’importance de surveiller en permanence le comportement de l’IA.

PLATEFORMES OUVERTES VS FERMÉES : QUEL CHOIX POUR LES UTILISATEURS ?

Quand on choisit une solution IA, une question revient souvent : faut-il opter pour une plateforme ouverte ou fermée ? Les plateformes fermées, comme celles des géants technologiques, offrent une intégration facile et des performances optimisées. Mais elles limitent la liberté : impossible de modifier les modèles, de les adapter à ses besoins, ou de les combiner avec d’autres outils. À l’inverse, les plateformes ouvertes permettent plus de flexibilité, mais demandent des compétences techniques pour être exploitées pleinement. Le choix dépend donc des priorités : simplicité ou contrôle ? Performance immédiate ou personnalisation ? Une chose est sûre : le paysage évolue rapidement, et les utilisateurs doivent anticiper leurs futurs besoins avant de s’engager.

HAPPYHORSE 1.1 : LE NOUVEAU MODÈLE VIDÉO D’ALIBABA

Alibaba frappe fort avec HappyHorse 1.1, une mise à jour majeure de son modèle de génération vidéo par IA. Ce modèle permet de créer des vidéos réalistes à partir de simples descriptions textuelles. La version 1.1 améliore la fluidité des mouvements, la qualité des textures et la cohérence des scènes. Une avancée qui pourrait révolutionner la production vidéo, notamment pour les créateurs de contenu, les marketeurs ou les éducateurs. HappyHorse 1.1 est disponible via une API, ce qui permet de l’intégrer facilement dans des applications ou des workflows existants.

CODEX SECURITY : L’OUTIL D’OPENAI POUR DÉTECTER LES VULNÉRABILITÉS

OpenAI lance Codex Security, un plugin conçu pour aider les développeurs à sécuriser leurs logiciels. Cet outil analyse automatiquement le code source pour détecter les failles de sécurité, comme les injections SQL, les fuites de données ou les mauvaises configurations. Une fois une vulnérabilité identifiée, Codex Security propose des correctifs et des bonnes pratiques pour la résoudre. Une façon de réduire les risques de piratage et de renforcer la confiance dans les applications. Le plugin s’intègre directement aux environnements de développement, comme Visual Studio Code ou GitHub.

EVE : LE CADRE OPEN SOURCE DE VERCEL POUR CRÉER DES AGENTS

Vercel, la plateforme spécialisée dans le déploiement web, propose Eve, un framework open source pour transformer un simple dossier de fichiers en un agent IA autonome. L’idée ? Partir d’un répertoire de fichiers (code, documentation, données) et laisser l’IA analyser son contenu pour en extraire des insights, générer des rapports ou même prendre des décisions. Eve est particulièrement utile pour automatiser des tâches répétitives, comme la génération de documentation technique, l’analyse de logs, ou la synthèse de données. Une solution idéale pour les développeurs qui veulent gagner du temps sans sacrifier la qualité.

LES CINQ YEUX ALERTENT : L’IA TRANSFORME LA CYBERSÉCURITÉ EN QUELQUES MOIS

Les agences de renseignement des pays du Five Eyes tirent la sonnette d’alarme. Selon elles, l’IA ne va pas modifier la cybersécurité dans quelques années, mais dans quelques mois. Les attaques deviennent plus rapides, plus ciblées et plus difficiles à contrer. Les cybercriminels utilisent désormais des outils d’IA pour automatiser leurs attaques, générer des malwares plus sophistiqués, ou contourner les protections classiques. Face à cette menace, les entreprises doivent repenser leur stratégie de sécurité. Les solutions traditionnelles, comme les pare-feu ou les antivirus, ne suffisent plus. Il faut intégrer l’IA dans les défenses, pour détecter les anomalies en temps réel et réagir plus vite que les attaquants.

OPENAI DÉPLOIE GPT-5.5-CYBER POUR LA SÉCURITÉ INFORMATIQUE

OpenAI renforce son engagement dans la cybersécurité avec le déploiement de GPT-5.5-Cyber, un modèle spécialement conçu pour ce domaine. Ce modèle est capable d’analyser des logs, de détecter des anomalies, de générer des rapports de vulnérabilités et de proposer des correctifs. Il s’intègre aux outils existants, comme les systèmes de détection d’intrusion (IDS) ou les plateformes de gestion des incidents (SIEM). OpenAI lance aussi « Patch the Planet », une initiative visant à corriger les failles dans les logiciels open source. Une façon de contribuer à la sécurité collective, tout en positionnant ses outils comme des références dans le secteur.

MICRON INVESTIT DANS ANTHROPIC POUR BOOSTER L’IA

Le géant des semi-conducteurs Micron a annoncé un partenariat stratégique avec Anthropic. L’entreprise fournira des mémoires et des solutions de stockage pour les serveurs d’Anthropic, tout en participant à la conception de son infrastructure IA. Micron investira également dans le tour de table de série H d’Anthropic, une levée de fonds qui vise à accélérer le développement de modèles plus puissants. Cette collaboration illustre l’importance croissante des composants matériels dans la course à l’IA. Sans puces performantes, pas de modèles capables de rivaliser avec les meilleurs. Micron devient ainsi un acteur clé de l’écosystème, aux côtés de NVIDIA ou AMD.

LE PROJET DE LOI AMÉRICAIN POUR FORMER 100 000 PERSONNES AUX MÉTIERS DE L’IA

Aux États-Unis, le représentant Sam Liccardo a déposé le SKILL Act, un projet de loi ambitieux. Son objectif ? Former 100 000 personnes aux métiers de l’IA d’ici cinq ans. Pour y parvenir, le texte propose des crédits d’impôt allant jusqu’à 5 000 dollars par salarié formé. Les formations devront être dispensées dans des établissements d’enseignement supérieur, pour garantir leur qualité. Une initiative qui pourrait aider à combler le fossé entre l’offre et la demande de compétences en IA. Le secteur manque cruellement de talents, et cette loi vise à y remédier en incitant les entreprises à investir dans la formation.

BASETEN, LA STARTUP QUI VAUDRAIT 13 MILLIARDS DE DOLLARS

Baseten, une startup spécialisée dans l’infrastructure IA, vient d’annoncer une levée de fonds de 1,5 milliard de dollars. À ce rythme, sa valorisation atteint désormais 13 milliards de dollars. Son succès s’explique par une croissance exceptionnelle : son chiffre d’affaires a été multiplié par 20 en un an, et sa plateforme gère plus d’un milliard d’appels d’inférence par jour. Baseten propose des serveurs optimisés pour l’exécution des modèles d’IA, une infrastructure clé pour les entreprises qui veulent déployer des solutions à grande échelle. Une preuve que le marché de l’IA ne se limite pas aux modèles, mais inclut aussi les outils qui les font tourner. Les investisseurs misent sur cette startup pour devenir un acteur majeur de l’infrastructure IA.

NVIDIA RÉINVENTE LE REFROIDISSEMENT DES SERVEURS

UN RETOUR D’EXPÉRIENCE : CLAUDE AUTOMATISE UN ERP OBSOLÈTE

Hasnain K., entrepreneur à Toronto, avait un problème : son logiciel de gestion (ERP) était dépassé et ne permettait que peu de reporting. Pourtant, il disposait d’une API. Pour moderniser son outil sans tout remplacer, il a utilisé Claude, un modèle d’IA. Grâce à l’outil MCP et à l’intégration avec Office 365, Claude a généré des rapports automatiques : ventes quotidiennes par service et par commercial, tendances hebdomadaires et mensuelles sur les volumes de vente et de produits, et suivi des créances clients. Ces rapports sont envoyés deux fois par jour aux managers. Claude a aussi créé des automatisations via Zapier pour synchroniser les commandes de vente avec ShipStation, et les données de suivi des colis avec l’ERP. Résultat ? Des économies substantielles : des milliers de dollars en développement, et un gain de temps énorme. Avant, ces tâches étaient réalisées manuellement. Aujourd’hui, tout est automatisé.

Sources :

The Rundown AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO