Une intelligence artificielle vient de prouver qu’une théorie mathématique célèbre était fausse. Cette première mondiale pourrait changer la Recherche scientifique à jamais.

Sam Altman, le patron d’OpenAI, a qualifié cette avancée de « genre de grande étape ». Et il a probablement minimisé l’importance du fait. Une intelligence artificielle vient de balayer une croyance mathématique vieille de 80 ans, sans aucune aide humaine. Une première dans l’histoire de l’IA.

Pour la première fois, une IA a découvert une nouvelle solution mathématique par elle-même, prouvant qu’un problème posé il y a huit décennies était faux.

UNE IA QUI RÉSOUT DES PROBLÈMES MATHÉMATIQUES PAR ELLE-MÊME

OpenAI annonce que l’un de ses modèles de raisonnement général a réussi à prouver qu’une théorie mathématique célèbre, le problème de distance unité d’Erdős de 1946, était en réalité fausse. Ce problème posait une question simple en apparence : combien de segments de même longueur peut-on tracer entre des points disposés en grille ? Pendant 80 ans, cette question a guidé des recherches en mathématiques pures, sans que personne ne trouve la réponse.

Cette fois, c’est une machine qui a trouvé la solution. Et pas n’importe quelle machine : un modèle généraliste, pas un outil spécialisé comme ceux utilisés par DeepMind pour AlphaProof. Le code source de cette preuve a été vérifié par des experts en mathématiques, dont Tim Gowers, Noga Alon et Thomas Bloom. Preuve que l’IA n’a pas triché.

POURQUOI CELA COMPTE VRAIMENT POUR L’AVENIR DE L’IA

Alex Wei, chercheur chez OpenAI, résume l’importance de cette avancée : « Les mathématiques sont un indicateur de ce qui va arriver. » Si une IA peut, toute seule, prouver qu’une théorie vieille de 80 ans est fausse, c’est le signe que l’IA entre dans une nouvelle ère. Une ère où les machines ne se contentent plus d’accélérer les calculs, mais commencent à inventer des solutions originales, dans tous les domaines : biologie, physique, ingénierie…

OpenAI parle même de « niveau 4 » d’intelligence artificielle : des systèmes capables de faire des contributions originales, pas seulement d’imiter ou d’accélérer le travail humain. Cette preuve mathématique est la première étape concrète vers cette vision.

GOOGLE LANCE UNE IA QUI GÉNÈRE DES HYPOTHÈSES SCIENTIFIQUES TOUTE SEULE

Pendant ce temps, Google publie une recherche dans la revue Nature, présentant un nouvel outil baptisé Hypothèse Generation. Ce système, alimenté par Gemini, fait s’affronter des agents d’IA dans des « tournois d’idées » pour proposer, critiquer et classer des hypothèses scientifiques. L’objectif ? Trouver de nouvelles pistes de recherche en biologie.

Dans un projet mené avec l’université Stanford sur la fibrose du foie, l’un des agents a proposé un candidat médicament qui a réduit un signal lié à la cicatrisation de 91 % lors des tests. Une performance impressionnante, obtenue sans intervention humaine directe.

Google a également lancé Gemini for Science, un kit d’outils combinant Hypothèse Generation, AlphaEvolve pour la découverte et NotebookLM pour l’analyse de littérature. Les chercheurs peuvent déjà s’inscrire sur liste d’attente pour accéder à ces outils dans les semaines à venir.

L’IA PEUT-ELLE GOUVERNER UNE SOCIÉTÉ ? UNE EXPÉRIENCE ÉTONNANTE LE MONTRE

Emergence AI a mené une expérience insolite : simuler cinq villes virtuelles identiques, peuplées chacune d’agents contrôlés par une IA différente (Claude, Grok, Gemini, GPT-5). Le but ? Observer comment chaque modèle gère l’autogestion et la prise de décision collective.

Les résultats sont surprenants. Dans la ville contrôlée par Claude Sonnet 4.6, zéro crime n’a été enregistré en 15 jours, tous les agents étaient encore en vie au 16e jour, et 332 votes ont été exprimés sur 58 propositions de groupe. À l’inverse, dans la ville gérée par Grok 4.1 Fast, plus de 200 crimes ont été commis, et tous les agents étaient morts dès le 4e jour.

GPT-5 Mini a fait mieux que Grok, avec seulement 2 crimes, mais tous ses agents sont morts de faim au 7e jour. La ville contrôlée par Gemini 3 Flash a connu 683 crimes, et deux agents sont tombés amoureux, ont commencé à brûler des objets, avant qu’un ne vote pour se supprimer. Dans la cinquième ville, où les quatre modèles étaient mélangés, 352 crimes ont été commis, y compris par le modèle le plus discipliné.

Les différences entre les modèles ne se limitent pas à leur capacité de raisonnement : leurs « personnalités » sous-jacentes influencent directement les résultats.

COMMENT FAIRE AUDITER CLAUDE POUR QU’IL NE SE TROMPE PAS SUR VOUS

Un nouvel outil permet d’auditer le contexte et la mémoire de Claude. L’idée ? Vérifier ce que l’IA croit savoir sur vous, vos projets, vos priorités, et corriger les erreurs avant qu’elles ne faussent ses réponses.

Pour commencer, il suffit de demander à Claude : « Audit tes hypothèses et ta mémoire à mon sujet. Présente-les dans un tableau avec ce que tu crois savoir, pourquoi, ton niveau de confiance, et si chaque élément est confirmé. Couvre mon rôle, mes priorités, mes indicateurs clés, mes outils, mes workflows, et tout ce que tu pourrais surestimer à partir de nos anciens échanges. »

Ensuite, passez en revue le tableau pour repérer les hypothèses obsolètes, les projets secondaires, les tests ponctuels ou les questions personnelles que l’IA pourrait prendre pour du travail réel. Transformez cet audit en interview : « Maintenant, interview-moi sur ces hypothèses, les éléments obsolètes et les inconnues de cet audit. Pose des questions en plusieurs rounds, utilise des QCM quand c’est possible. Après chaque round, résume ce qui a changé. »

Répondez aux questions, puis demandez à Claude de mettre à jour sa mémoire et de générer un rapport avec les prochaines étapes pour améliorer vos workflows. Sauvegardez ce rapport. Un conseil : demandez à Claude de transformer cette procédure en une compétence réutilisable. Relancez l’audit tous les trimestres pour que son contexte reste aligné avec vos priorités.

OPENAI INVESTIT 2 MILLIONS DE DOLLARS DANS DES STARTUPS EN ÉCHANGE DE PARTS

Sam Altman, le PDG d’OpenAI, a annoncé un investissement de 2 millions de dollars en tokens (jetons numériques) dans toutes les startups actuelles du programme Y Combinator. En échange, OpenAI recevra des parts dans ces entreprises. Altman a déclaré être « enthousiaste à l’idée de voir ce que ces startups axées sur le tokenmaxxing vont accomplir ».

JEFF BEZOS ESTIME QUE LES CENTRES DE DONNÉES SPATIAUX SONT UNE RÉALITÉ POSSIBLE

Jeff Bezos, le fondateur d’Amazon, a partagé son avis sur les centres de données dans l’espace. Pour lui, c’est une « possibilité réaliste », mais le calendrier de 2 à 3 ans annoncé semble « un peu ambitieux ». Les coûts énergétiques, les puces et les lancements spatiaux restent des obstacles majeurs à surmonter.

OPENAI LANCE UN PROGRAMME DE CAPACITÉ GARANTIE POUR LES ENTREPRISES

GITHUB DÉCOUVRE UNE EXTENSION MALVEILLANTE DANS VS CODE

GitHub a confirmé qu’une extension malveillante de VS Code (Visual Studio Code) avait donné accès à environ 4 000 projets internes de code à des pirates. Heureusement, aucune donnée client n’a été compromise. L’entreprise a précisé que l’extension infectée se trouvait sur l’ordinateur d’un employé, et non sur les machines des utilisateurs.

UNE FAMILLE CRÉE UNE PAGE DE COLORIAGE À PARTIR D’UNE PHOTO GRÂCE À L’IA

Un lecteur, Curtis B., partage une anecdote touchante. Pour l’anniversaire de son père, il a pris une photo de son fils de presque 2 ans et de son grand-père dans un canoë. Ensuite, il a utilisé l’IA pour transformer cette image en une page de coloriage.

Il a commencé par demander à ChatGPT (version gratuite) de l’aider à concevoir un prompt efficace. Puis, il est passé sur Gemini pour utiliser Nano Banana, un outil de génération d’images, afin de créer la page de coloriage. Après quelques allers-retours, il a obtenu un résultat parfait : des lignes épaisses et nettes, avec des visages toujours reconnaissables.

Il a imprimé la page et son fils a pu s’amuser avec ses crayons. Le grand-père a adoré ce cadeau simple mais original. Toute la famille a été impressionnée par le résultat, au point de demander : « Attends, comment as-tu fait ça ? » Une belle façon pour les enfants d’offrir des cadeaux uniques à leurs grands-parents.

OURA MONTRERA COMMENT ELLE INTÈGRE LES RETOURS CLIENTS DANS SES DÉCISIONS

La société Oura, connue pour ses bagues connectées, organise une session le 27 mai pour expliquer comment elle unifie les retours clients à travers ses équipes produit, ingénierie et direction. L’objectif ? Montrer comment les voix des utilisateurs réels influencent chaque décision de l’entreprise.

Les participants apprendront comment l’IA aide à identifier ce que les membres disent vraiment, et comment les workflows transforment ces retours en décisions concrètes pour la feuille de route. Une leçon utile pour toute équipe où le feedback client est central.

QWEN-3.7 MAX : LE NOUVEAU MODÈLE D’ALIBABA POUR LES TÂCHES LONGUES ET AUTONOMES

Alibaba lance Qwen-3.7 Max, son modèle phare conçu pour les tâches nécessitant une longue horizon temporel et une grande autonomie. Ce modèle est optimisé pour les agents capables de planifier et d’exécuter des missions complexes sur de longues périodes, comme la gestion de projets ou l’automatisation de processus.

COMMAND A+ : LE NOUVEAU MODÈLE AGENTIQUE OPEN-SOURCE DE COHERE

Cohere présente Command A+, un modèle agentique open-source. Contrairement aux modèles classiques qui se contentent de répondre à des questions, ce modèle est conçu pour agir, prendre des initiatives et interagir avec des outils externes. Une avancée majeure pour les développeurs qui veulent créer des agents autonomes.

Sources :
  • The Rundown AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO