Google écrase OpenAI en maths : 9 problèmes résolus contre 1.

Google DeepMind vient de résoudre neuf problèmes mathématiques considérés comme parmi les plus difficiles au monde, écrasant ainsi les récents exploits d'OpenAI. Et ce n'est pas tout : l'IA peut aussi organiser votre journée à votre place.

GOOGLE DEEPMIND RÉSOLUTIF : NEUF PROBLÈMES MATHÉMATIQUES D'ERDŐS EN UN JOUR

La semaine dernière, OpenAI faisait la une des médias après avoir annoncé qu'un de ses modèles avait résolu un problème mathématique vieux de 80 ans. Mais Google DeepMind a fait bien mieux : son système AlphaProof Nexus a résolu neuf problèmes ouverts d'Erdős, des questions mathématiques parmi les plus difficiles jamais posées. Deux de ces problèmes restaient sans solution depuis 56 ans.

AlphaProof Nexus a résolu ces neuf problèmes pour seulement quelques centaines de dollars par cas, là où un chercheur humain aurait pu y passer des années.

COMMENT FONCTIONNE ALPHAPROOF NEXUS : UNE COMBINAISON DE PUISSANCE

Le système associe un modèle de langage (LLM) à un outil nommé Lean, un assistant de preuve mathématique. Ensemble, ils génèrent des preuves vérifiables par machine pour des problèmes de combinatoire et de théorie des graphes. Chaque preuve est ensuite vérifiée automatiquement par Lean avant d'être validée.

En plus des neuf problèmes d'Erdős, AlphaProof Nexus a aussi prouvé 44 conjectures ouvertes issues de l'Encyclopédie en ligne des suites d'entiers. Une version simplifiée du système a réussi à reproduire ces résultats, mais à un coût bien plus élevé.

LES LIMITES D'ALPHAPROOF NEXUS : CE QU'IL NE PEUT PAS ENCORE FAIRE

Malgré cette avancée spectaculaire, le système montre encore des faiblesses. Certains problèmes nécessitant des constructions mathématiques entièrement nouvelles restent hors de portée pour l'instant. De plus, la version basique coûte plus cher que la version avancée, et les problèmes les plus complexes demandent encore trop de ressources.

OPEN AI : UN SUCCÈS TEMPORAIRE, UNE RÉALITÉ QUI S'EFFRITE

OpenAI avait annoncé avoir réfuté une conjecture d'Erdős vieille de 80 ans, mais cette victoire a été rapidement remise en question. Quelques mois après son annonce initiale, l'entreprise a dû revenir en arrière, reconnaissant que son modèle n'avait finalement résolu que 10 nouveaux problèmes — et non pas ceux qu'elle avait d'abord revendiqués.

Google DeepMind a résolu neuf problèmes en un jour, là où OpenAI a mis des mois à en réfuter un seul.

POURQUOI C'EST UNE RÉVOLUTION POUR LA Recherche SCIENTIFIQUE ?

Cette avancée de Google DeepMind montre à quel point l'IA progresse rapidement vers des solutions originales en mathématiques. L'utilisation de la vérification formelle change la donne : le système génère des preuves, les vérifie dans Lean, et recommence jusqu'à ce qu'une solution soit validée. À terme, cela permettra aux chercheurs de faire des découvertes inédites à une vitesse inégalée.

UNE AI POUR ORGANISER VOTRE JOURNÉE : L'AVENIR EST DÉJÀ LÀ

Mais l'IA ne se contente pas de résoudre des problèmes mathématiques complexes. Elle peut aussi devenir votre secrétaire personnelle, planifiant votre journée entière sans effort. Voici comment un lecteur a utilisé l'IA pour gagner un temps précieux.

ORGANISER UN DOSSIER DE 100 GO EN QUELQUES MINUTES

Mayur, responsable de contenu, avait accumulé près de 100 Go de fichiers éparpillés dans son dossier de téléchargements. Au lieu de passer des heures à tout trier, il a utilisé Claude Cowork pour automatiser le processus. En quelques minutes, l'IA a classé les fichiers par type, supprimé les doublons et organisé tout cela sans aucune intervention humaine.

CRÉER UN SITE E-COMMERCE EN UN TEMPS RECORD

Shubham, éditeur, a aidé son beau-frère à construire un site Shopify pour son entreprise. En partageant des captures d'écran, des références de design et des exigences commerciales, il a demandé à l'IA de générer du code Liquid, de résoudre des problèmes de thème et de modifier la mise en page. Résultat : le site est passé du concept au lancement en un temps record, sans avoir à chercher des réponses dans des forums ou des documentations.

CONSTRUIRE UNE IA QUI PLANIFIE VOTRE JOURNÉE À VOTRE PLACE

Imaginez une IA qui scanne votre Slack, Gmail et votre calendrier chaque matin, puis génère une liste de tâches priorisées. C'est exactement ce que propose un tutoriel récent. Voici comment le mettre en place :

1. Créer un dossier dédié.
2. Ouvrir Claude Code dans ce dossier.
3. Demander à l'agent de créer un skill qui analyse Slack, Gmail et le calendrier quotidiennement.
4. L'agent doit prioriser les tâches de haute à basse importance et les ajouter dans un fichier MonoNote.md avec la date, des commentaires, et des cases à cocher.
5. Créer les fichiers MonoNote.md et task-rules.md.
6. Exécuter le skill et revoir la liste générée.
7. Après la première exécution, demander à l'agent de créer une automatisation qui reprend les tâches de la veille, met à jour les règles, et génère une nouvelle liste.

L'IA peut transformer le chaos de votre boîte mail et de vos notifications en une liste de tâches claire et priorisée, chaque matin.

UNE ASTUCE POUR ALLER PLUS LOIN : L'AUDIT HEBDOMADAIRE

Pour optimiser encore davantage votre productivité, vous pouvez créer un skill d'audit hebdomadaire. Ce programme scanne votre liste de tâches, repère les tâches répétitives, et suggère lesquelles pourraient être automatisées avec l'IA. Une façon de gagner encore plus de temps.

ANTHROPIC DÉVOILE LES RÉSULTATS DE PROJECT GLASSWING : 10 000 VULNÉRABILITÉS CRITIQUES EN UN MOIS

Anthropic a partagé les premiers résultats de son Project Glasswing. En seulement un mois, Claude Mythos Preview et ses partenaires ont découvert plus de 10 000 vulnérabilités de haute ou critique sévérité. Par exemple, Cloudflare a identifié 2 000 bugs avec un taux de faux positifs inférieur à celui des testeurs humains.

DES DÉCOUVERTES QUI DÉPASSANT LES SIMPLES VULNÉRABILITÉS

Mythos ne se contente pas de signaler des failles : il va plus loin. Un partenaire bancaire a utilisé Mythos pour détecter et bloquer un virement frauduleux de 1,5 million de dollars. Après une analyse indépendante, 62 % des alertes (soit près de 3 900) se sont avérées justifiées.

Anthropic a également scanné plus de 1 000 projets open source, avec Mythos identifiant 6 202 vulnérabilités critiques. Parmi elles, 62 % ont été confirmées après vérification.

Project Glasswing a permis de détecter des fraudes et des vulnérabilités critiques en temps réel, changeant la donne pour la cybersécurité.

POURQUOI MYTHOS RESTE-T-IL CONTRÔLÉ ? LES RISQUES DE DÉTOURNEMENT

Anthropic explique que Mythos reste limité car aucune entreprise, y compris elle-même, ne dispose de garde-fous suffisants pour empêcher un usage malveillant. Pourtant, avec OpenAI qui accélère ses modèles cyber et les acteurs chinois qui rattrapent leur retard, des IA tout aussi puissantes (voire meilleures) vont émerger. La vraie question n'est plus de savoir si ces outils existeront, mais à quelle vitesse le monde pourra les corriger.

LES DERNIÈRES AVANCÉES EN BREF

DeepSeek a réduit de 75 % le prix de son modèle V4-Pro, le rendant accessible à 0,435 dollar par million de tokens en entrée et 0,87 dollar par million en sortie, soit bien moins que ses concurrents propriétaires.

Perplexity a open-sourcé Bumblebee, un scanner pour macOS et Linux qui vérifie les paquets risqués, les extensions et les configurations d'outils IA lors d'incidents de chaîne d'approvisionnement.

NVIDIA a lancé NV-Generate-MR-Brain, un modèle de base qui génère des scans IRM cérébraux synthétiques en 3D et leurs annotations, pour accélérer le développement de l'IA en imagerie médicale.

McKinsey repense son modèle de facturation face à l'IA, qui réduit la valeur des heures facturables et pousse les clients à exiger des tarifs liés aux résultats concrets.

Le gouvernement américain a approuvé un investissement de 9 milliards de dollars pour aider les agences de renseignement à acquérir des puces IA avancées, craignant de prendre du retard dans le déploiement de modèles de pointe.

Starbucks a abandonné son système d'inventaire basé sur l'IA après neuf mois, en raison d'erreurs persistantes de comptage et d'étiquetage dans ses magasins nord-américains.

UNE IA POUR CHOISIR VOTRE UNIVERSITÉ : UN CAS CONCRET

Alicia, une lectrice de Fresno en Californie, a utilisé ChatGPT pour comparer des programmes universitaires. L'IA a analysé les sites web des universités, comparé les coûts, les formats (présentiel ou en ligne), et même généré des questions à poser aux conseillers d'admission. Résultat : elle a pu prendre une décision éclairée en un temps record.

LE GUIDE POUR CRÉER VOTRE PROPRE IA SECRÉTAIRE

Si vous voulez automatiser l'organisation de votre journée, voici les étapes à suivre :

Le rôle de l'IA dans l'analyse des retours clients.
Les workflows qui transforment les commentaires en décisions stratégiques.
Les leçons pour toute équipe où les retours clients sont essentiels.

Si vous ne pouvez pas assister à la session, inscrivez-vous quand même : vous recevrez l'enregistrement automatiquement.

DERNIÈRES NOUVELLES EN BREF

DeepSeek a définitivement baissé le prix de son modèle V4-Pro de 75 %, le rendant accessible à 0,435 dollar par million de tokens en entrée et 0,87 dollar par million en sortie.