Ces IA qui échouent à sauver des vies à cause d'un bug dans les données

Les agents d'IA qui explorent les données biologiques s'y perdent comme des voitures dans une vieille ville conçue pour les piétons. Résultat : des erreurs qui pourraient coûter des vies.

LES AGENTS IA SONT DES VOITURES DANS UNE VILLE PIÉTONNE

Imaginons que les agents d'IA soient des voitures autonomes essayant de traverser une ville italienne du Moyen Âge. Les ruelles sont étroites, sinueuses, et conçues pour des piétons, pas pour des véhicules modernes. C'est exactement ce qui se passe avec les bases de données biologiques : elles ont été créées pour des humains, avec des formats de fichiers bizarres, des scripts de récupération uniques, et des interfaces web à cliquer. Résultat ? Les agents IA, aussi puissants soient-ils, se retrouvent bloqués dans un labyrinthe où une simple erreur peut tout fausser.

POURQUOI LES AGENTS IA RATENT LEURS MISSIONS EN BIOLOGIE

Contrairement aux logiciels, où tout est standardisé (API claires, contrôle de version, gestion des erreurs), les Outils de biologie sont souvent fragiles et dépendent de processus humains. Par exemple, un chercheur peut facilement cliquer sur une interface web pour récupérer toutes les séquences du virus Ebola collectées en Afrique en 2014. Mais un agent IA doit écrire un script de plusieurs centaines de lignes, appeler plusieurs API, télécharger des gigaoctets de données, puis filtrer localement. pour se retrouver avec un résultat incomplet ou erroné. La faute à des identifiants qui changent, des métadonnées mal documentées, ou des filtres qui ne correspondent pas à ceux de l'interface web.

« Le code était la partie la plus facile. Le plus dur, c'était de cliquer dans les tableaux de bord du navigateur. » — Andrej Karpathy, sur son expérience avec un agent IA en développement logiciel.

Cette situation n'est pas unique à la biologie. Partout où des agents IA sont insérés dans des environnements conçus pour les humains, les mêmes problèmes apparaissent : des interfaces faites pour des clics, des conventions implicites, et des systèmes qui ne sont pas faits pour être compris par des machines.

LE CAS DE LA VIROLOGIE : UN CHAMP DE MINES POUR LES AGENTS

La virologie est l'un des domaines les plus complexes. Les chercheurs y passent des heures à filtrer manuellement des données dans NCBI Virus, une base de données qui centralise les séquences virales du monde entier. Pour un humain, c'est fastidieux mais faisable. Pour un agent IA, c'est un cauchemar : il faut appeler plusieurs API (REST, Datasets, E-utilities), paginer les résultats, réconcilier les identifiants, et appliquer des filtres qui ne sont parfois documentés nulle part. Un seul détail mal interprété, et c'est toute une analyse qui s'effondre.

Prenons l'exemple de l'épidémie de virus Bundibugyo en République démocratique du Congo en 2026. En quelques jours, 1 000 cas ont été confirmés, et des génomes viraux quasi complets ont été séquencés. Pour répondre aux questions cruciales — « Ce virus est-il différent des précédents ? », « Les diagnostics actuels le détectent-ils ? », « Les traitements protègent-ils encore ? » — il faut comparer ces nouveaux génomes avec des milliers d'autres disponibles dans NCBI Virus. Mais au lieu d'automatiser cette étape, les chercheurs doivent cliquer, filtrer, et croiser les doigts pour que le jeu de données soit complet. Une perte de temps qui pourrait coûter des vies.

LE TEST QUI RÉVÈLE LES FAILLES DES AGENTS IA

Pour mesurer l'ampleur du problème, une équipe de chercheurs a créé VirBench, un benchmark de 120 requêtes réalistes sur des séquences virales. Leur objectif ? Vérifier si les agents IA les plus avancés (Claude, Biomni OSS, Edison Analysis, GPT) pouvaient récupérer correctement les données depuis NCBI Virus. Résultat : même les meilleurs modèles échouent. Leurs performances varient énormément, avec des taux de réussite allant de 16,9 % à 91,3 %. Pire encore, certains modèles donnent des réponses différentes à la même question posée trois fois de suite. Par exemple, Claude Sonnet 4 a renvoyé 106 séquences la première fois, 15 la deuxième, et 5 la troisième. alors que la réponse attendue était 266.

Les erreurs de récupération faussent les analyses phylogénétiques. Une seule requête mal exécutée peut faire reculer la date d'origine d'une épidémie de 1922 à 2014.

Ces inconsistances ont des conséquences dramatiques. En reconstruisant un arbre phylogénétique (une carte des liens entre échantillons viraux) à partir des séquences récupérées par un agent IA, les chercheurs ont obtenu des dates d'origine complètement différentes de la réalité. Dans un cas, l'épidémie d'Ebola de 2014 a été datée de 1922. Dans un autre, elle a été déplacée d'avril à 2014, changeant ainsi les conclusions sur son évolution. Même chose pour l'analyse des mutations ciblées par les anticorps : un jeu de données incomplet ou erroné peut faire croire qu'un traitement reste efficace. alors qu'il ne l'est plus.

LA SOLUTION QUI CHANGE TOUT : UNE COUCHE DÉTERMINISTE

Face à ces échecs répétés, les chercheurs ont développé gget virus, un outil qui agit comme une autoroute sous l'infrastructure web chaotique de NCBI Virus. Au lieu de laisser les agents IA se débrouiller seuls avec des API complexes et des filtres obscurs, gget virus fait le travail à leur place : il coordonne les appels aux différentes API, applique les filtres de manière cohérente, gère les gros jeux de données sans les tronquer, et renvoie un résultat standardisé, vérifiable et reproductible.

Les résultats sont spectaculaires. Avec gget virus, tous les agents IA atteignent un taux de réussite supérieur à 90 %, culminant à 99,7 % pour le modèle le plus performant. Plus de variabilité entre les runs, plus de réponses différentes à la même question. La couche déterministe a éliminé la dépendance au modèle utilisé : même les agents moins avancés obtiennent des résultats fiables.

Concrètement, gget virus fonctionne comme un tunnel sous une ville piétonne. Il crée des voies rapides, des échangeurs fluides, et des sorties numérotées pour que les agents IA puissent naviguer sans se perdre. Plus besoin de scripts de 500 lignes : une simple commande suffit pour récupérer des données précises et complètes.

POURQUOI UNE COUCHE DÉTERMINISTE EST INDISPENSABLE

Les agents IA sont excellents pour générer des hypothèses, concevoir des expériences ou raisonner sur des mécanismes biologiques. Mais pour que cette créativité soit utile, la couche sous-jacente — les identifiants de gènes, les schémas de données, la logique de récupération, les systèmes de coordonnées, les conventions de métadonnées — doit être d'une fiabilité à toute épreuve. Sinon, l'agent peut produire une réponse qui semble plausible mais qui est complètement fausse. C'est comme si un architecte dessinait un château magnifique. mais sur des fondations en sable.

gget virus n'est qu'un exemple parmi d'autres. D'autres projets émergent pour rendre les données biologiques accessibles aux agents IA, comme ToolUniverse, Edison Scientific’s Robin, ou Biomni. Tous visent le même objectif : créer des moteurs de contexte — des infrastructures fiables et standardisées qui permettent aux agents de naviguer dans les données biologiques sans se perdre.

LE FUTUR : DES AGENTS SI PUISSANTS QU'ILS N'AURONT PLUS BESOIN DE COUCHES DÉTERMINISTES ?

Avec l'évolution rapide des capacités des modèles d'IA, on pourrait imaginer un futur proche où les agents seront capables de naviguer seuls dans les bases de données biologiques, même les plus chaotiques. Ils pourront réconcilier les identifiants, paginer correctement, récupérer les filtres manquants, et même corriger leurs erreurs. Dans ce monde, les outils comme gget virus pourraient devenir inutiles.

Mais même si les agents deviennent autonomes, cela ne signifie pas qu'ils doivent tout faire. Une tâche qui peut être automatisée par un agent coûteux et lent n'a pas besoin de l'être à chaque fois. Les outils déterministes restent utiles pour des raisons pratiques : ils sont moins chers, plus rapides, plus faciles à auditer, et plus fiables pour le travail scientifique de routine. Et si un jour les agents rendent ces outils obsolètes, une chose restera vraie : les bases de données biologiques devront toujours être conçues en pensant aux agents, et pas seulement aux humains.

LES CONSÉQUENCES : DES VIES EN JEU

Les erreurs de récupération de données ne sont pas anodines. Dans le cas de l'épidémie de Bundibugyo en 2026, chaque minute compte. Si un agent IA rate une séquence clé, les chercheurs pourraient sous-estimer la diversité du virus, mal évaluer l'efficacité des diagnostics, ou se tromper sur l'origine de l'épidémie. Ces erreurs peuvent retarder la réponse sanitaire, prolonger la propagation du virus, et coûter des vies.

Le problème ne se limite pas à la virologie. Partout où les agents IA sont utilisés pour la recherche scientifique — de la conception de vaccins à la modélisation climatique — la fiabilité des données est cruciale. Une seule erreur peut fausser des années de travail, gaspiller des millions de dollars, et mettre en danger des populations entières.

LES OUTILS EXISTANTS QUI FACILITENT LA VIE (MAIS NE SUFFISENT PAS)

Depuis des années, les biologistes informatiques développent des outils pour rendre les données biologiques plus accessibles. Des bibliothèques comme Biopython, BioPerl, BioJulia, Entrez Direct, ou BioMart permettent de sortir les données des interfaces web et de les rendre exploitables par des scripts. Mais ces outils restent limités : ils ne résolvent pas le problème de fond, qui est l'hétérogénéité des bases de données et l'absence de standardisation.

Par exemple, Biopython est une bibliothèque Python très puissante pour manipuler des séquences biologiques. Mais elle ne peut pas, à elle seule, résoudre les problèmes de récupération de données depuis NCBI Virus. Il faut encore écrire des scripts complexes pour appeler les bonnes API, paginer les résultats, et appliquer les filtres. C'est comme avoir une voiture de course. mais sans routes goudronnées pour rouler.

LE CAS PARTICULIER DE NCBI VIRUS : UN LABYRINTHE À DÉCRYPTER

NCBI Virus est une base de données centrale pour les virologues. Elle agrège les séquences virales de GenBank, RefSeq, et d'autres sources internationales. Mais derrière une interface web simple se cache un labyrinthe de filtres, d'identifiants, et de conventions qui ne sont documentés nulle part. Par exemple, pour récupérer toutes les séquences du virus Ebola collectées en Afrique en 2014, un chercheur doit appliquer une série de filtres manuels dans l'interface web. Ces filtres ne sont pas exposés via une API unique, et leur logique est souvent implicite.

Pour un humain, c'est fastidieux mais faisable. Pour un agent IA, c'est un casse-tête. Il faut appeler plusieurs API, réconcilier les identifiants entre les différentes sources, paginer les résultats, et appliquer les filtres localement. Une seule erreur dans ce processus, et le jeu de données est incomplet ou erroné. C'est comme essayer de reconstituer un puzzle en ayant perdu la moitié des pièces.

COMMENT FONCTIONNE GGET VIRUS : L'AUTOROUTE SOUS LE CHAOS

gget virus est un outil qui agit comme une couche déterministe entre les agents IA et NCBI Virus. Voici comment il fonctionne :

1. Il coordonne les appels aux différentes API sous-jacentes (REST, Datasets, E-utilities) pour reproduire le comportement de l'interface web.

2. Il décide quels filtres peuvent être appliqués directement via les API et lesquels doivent être vérifiés localement, car la logique de filtrage n'est pas disponible via un seul endpoint programmatique.

3. Il gère le traitement par lots pour récupérer des jeux de données complets, même pour des virus comme le SARS-CoV-2 ou la grippe A, où les résultats peuvent être énormes.

4. Lorsqu'un filtre dépend de données supplémentaires stockées dans une autre base (par exemple, savoir si une séquence contient une protéine virale spécifique), gget virus récupère ces données, les utilise pour appliquer le filtre, et conserve les informations pertinentes dans le résultat final.

5. Il renvoie un résultat standardisé, lisible par les humains et les machines, avec des logs détaillés montrant comment le résultat final a été produit.

Avec gget virus, une requête comme « Récupérer toutes les séquences du virus Ebola collectées en Afrique en 2014 » devient une simple commande, exécutée en quelques secondes avec un taux de réussite de 99,7 %. Plus besoin de scripts de 500 lignes, plus de résultats différents à chaque exécution, plus de jeux de données incomplets.

LES RÉSULTATS DU BENCHMARK : LA PREUVE PAR L'EXEMPLE

Dans le benchmark VirBench, les agents IA ont été testés sur 120 requêtes réalistes couvrant 40 pathogènes. Sans gget virus, leurs performances étaient désastreuses : les taux de réussite variaient de 16,9 % à 91,3 %, avec une grande variabilité entre les exécutions. Par exemple, Claude Sonnet 4 a renvoyé 106 séquences la première fois, 15 la deuxième, et 5 la troisième pour une requête qui en attendait 266.

Avec gget virus, tous les agents ont atteint un taux de réussite supérieur à 90 %, avec un pic à 99,7 % pour le modèle le plus performant. La variabilité entre les runs a été éliminée, et l'écart de performance entre les modèles s'est réduit de manière spectaculaire. En d'autres termes, gget virus a rendu le choix du modèle bien moins important : même les agents moins avancés obtiennent des résultats fiables.

Cette amélioration est cruciale, car la construction de jeux de données fiables ne devrait pas dépendre d'un modèle spécifique ou coûteux. Avec gget virus, n'importe quel agent peut récupérer des données précises et complètes, quel que soit son niveau de performance.

LES CONSÉQUENCES POUR LA RECHERCHE SCIENTIFIQUE

Les erreurs de récupération de données ont un impact direct sur la qualité de la recherche. Par exemple, dans l'analyse phylogénétique, une séquence manquante ou incorrecte peut fausser la date d'origine d'une épidémie, changeant ainsi les conclusions sur son évolution. Dans l'analyse des mutations ciblées par les anticorps, un jeu de données incomplet peut faire croire qu'un traitement reste efficace alors qu'il ne l'est plus.

Avec gget virus, ces erreurs deviennent rares. Les chercheurs peuvent enfin se concentrer sur l'analyse des données, et non sur leur récupération. Cela signifie des résultats plus fiables, des publications plus solides, et des décisions médicales mieux informées.

LES LIMITES DE GGET VIRUS ET LES DÉFIS RESTANTS

Malgré ses avantages, gget virus n'est pas une solution miracle. Il ne résout que le problème de la récupération de données depuis NCBI Virus. D'autres bases de données biologiques restent tout aussi chaotiques, avec leurs propres formats, identifiants, et conventions. Pour rendre l'ensemble de l'infrastructure biologique accessible aux agents IA, il faudra développer des outils similaires pour chaque base de données.

De plus, gget virus ne fait que traduire une interface web complexe en une interface programmatique fiable. Il ne résout pas les problèmes de qualité des données sous-jacentes, comme les erreurs de séquençage ou les métadonnées manquantes. Ces problèmes devront être adressés par les mainteneurs des bases de données elles-mêmes.

CE QUE L'AVENIR NOUS RÉSERVE : DES AGENTS AUTONOMES OU DES BASES DE DONNÉES STANDARDISÉES ?

Avec l'évolution rapide des modèles d'IA, il est possible qu'un jour les agents soient capables de naviguer seuls dans les bases de données biologiques, même les plus chaotiques. Ils pourront réconcilier les identifiants, appliquer les filtres correctement, et même corriger les erreurs de métadonnées. Dans ce scénario, les outils comme gget virus pourraient devenir obsolètes.

Mais même dans ce cas, une chose restera vraie : les bases de données biologiques devront toujours être conçues en pensant aux agents, et pas seulement aux humains. Les identifiants devront être standardisés, les API devront être documentées et complètes, et les filtres devront être exposés de manière programmatique. Sans cela, même les agents les plus avancés se retrouveront bloqués dans des labyrinthes de données.

En attendant, des outils comme gget virus sont indispensables pour rendre la recherche scientifique plus fiable et plus rapide. Ils permettent aux agents IA de se concentrer sur ce qu'ils font de mieux : analyser les données, générer des hypothèses, et accélérer la découverte.

POURQUOI TOUT CELA EST CRUCIAL POUR LA SANTÉ PUBLIQUE

Prenons l'exemple de l'épidémie de Bundibugyo en 2026. En quelques jours, 1 000 cas ont été confirmés, et des génomes viraux quasi complets ont été séquencés. Pour répondre aux questions cruciales — « Ce virus est-il différent des précédents ? », « Les diagnostics actuels le détectent-ils ? », « Les traitements protègent-ils encore ? » — il faut comparer ces nouveaux génomes avec des milliers d'autres disponibles dans NCBI Virus.

Sans une récupération fiable des données, les chercheurs pourraient sous-estimer la diversité du virus, mal évaluer l'efficacité des diagnostics, ou se tromper sur l'origine de l'épidémie. Ces erreurs peuvent retarder la réponse sanitaire, prolonger la propagation du virus, et coûter des vies. Avec gget virus, ces risques sont considérablement réduits. Les chercheurs peuvent enfin se concentrer sur l'analyse des données, et non sur leur récupération.

LES AUTRES PROJETS QUI VISENT LE MÊME OBJECTIF

gget virus n'est pas le seul outil qui cherche à rendre les données biologiques accessibles aux agents IA. D'autres projets émergent, comme ToolUniverse, Edison Scientific’s Robin, ou Biomni. Tous visent le même objectif : créer des moteurs de contexte — des infrastructures fiables et standardisées qui permettent aux agents de naviguer dans les données biologiques sans se perdre.

ToolUniverse, par exemple, est une plateforme qui connecte des agents IA à des outils scientifiques, y compris des bases de données biologiques. Edison Scientific’s Robin est un autre outil qui permet aux agents de naviguer dans les données biologiques de manière fiable. Ces projets montrent que la communauté scientifique prend au sérieux le problème de l'accessibilité des données pour les agents IA.

CONCLUSION : UN PAS VERS UNE RECHERCHE PLUS FIABLE

Les agents IA ont un potentiel énorme pour accélérer la recherche scientifique, de la conception de vaccins à la modélisation climatique. Mais pour qu'ils puissent réaliser ce potentiel, il faut résoudre le problème de l'accessibilité des données. Les bases de données biologiques doivent être conçues en pensant aux agents, et pas seulement aux humains. Les identifiants doivent être standardisés, les API doivent être documentées et complètes, et les filtres doivent être exposés de manière programmatique.

Des outils comme gget virus montrent que cette transformation est possible. Ils prouvent que même dans un écosystème de données chaotique, il est possible de créer des couches déterministes qui rendent les agents IA plus fiables et plus efficaces. Avec ces outils, la recherche scientifique peut enfin entrer dans une nouvelle ère, où les données sont accessibles, les analyses sont fiables, et les découvertes sont plus rapides.

EN RÉSUMÉ : CE QU'IL FAUT RETENIR

• Les agents IA échouent souvent à récupérer correctement des données biologiques à cause de bases de données mal adaptées aux machines.

• Dans la virologie, ces erreurs peuvent avoir des conséquences dramatiques, comme fausser la date d'origine d'une épidémie ou l'efficacité d'un traitement.

• Le benchmark VirBench a montré que même les meilleurs modèles d'IA obtiennent des taux de réussite inférieurs à 92 % sans outil déterministe.

• gget virus agit comme une couche déterministe qui rend les agents IA fiables à 99,7 % pour la récupération de données virales.

• Pour que les agents IA puissent pleinement exploiter leur potentiel en biologie, il faut standardiser les bases de données et créer des outils comme gget virus pour chaque domaine.

Sources :

Anthropic Research

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO