Une équipe de chercheurs propose une méthode révolutionnaire pour rendre l'intelligence artificielle plus solide face aux changements de données. Explications.

QUAND LES DONNÉES CHANGENT, L'IA PLIE

Imaginez un modèle d'intelligence artificielle formé pour reconnaître des chats dans des photos. Si vous lui montrez soudainement des chats dessinés à la main au lieu de photos, il risque de se tromper. C'est ce qu'on appelle un changement de distribution : les données sur lesquelles l'IA est testée ne ressemblent plus à celles utilisées pour l'entraîner. Ce problème, appelé généralisation de domaine, empêche les modèles d'être fiables dans de nouveaux environnements.

LE PROBLÈME DES DONNÉES ÉTIQUETÉES

Jusqu'à présent, pour rendre un modèle robuste face à ces changements, les chercheurs devaient utiliser des données étiquetées issues de plusieurs environnements différents. Par exemple, pour un modèle médical, il fallait des données de patients de différents hôpitaux, avec des diagnostics précis. Mais ces données sont rares et coûteuses à obtenir. Résultat ? La plupart des modèles d'IA restent fragiles face aux changements de données.

Sans données étiquetées, impossible de garantir la robustesse des modèles.

L'APPROCHE ANTI-CAUSALE : LA CAUSE DEVIENT L'EFFET

Les chercheurs proposent une solution radicalement différente : l'approche anti-causale. Dans ce cadre, c'est le résultat qui influence les données observées, et non l'inverse. Prenons un exemple simple : si vous mesurez la température d'une pièce (le résultat), les données que vous collectez (température, humidité) sont influencées par cette température. En d'autres termes, le résultat cause les données, et non l'inverse.

Cette structure anti-causale présente un avantage majeur : les perturbations qui affectent les données n'ont pas d'impact sur le résultat. Autrement dit, même si les données changent (par exemple, si vous utilisez un autre capteur), le résultat reste stable. Les chercheurs ont exploité cette propriété pour développer deux méthodes qui rendent les modèles moins sensibles aux variations des données.

DEUX MÉTHODES POUR RENDRE L'IA PLUS ROBUSTE

La première méthode pénalise la sensibilité du modèle aux variations de la moyenne des données entre les environnements. Imaginez que vous avez des données de température mesurées dans deux villes différentes : Paris et Berlin. La moyenne des températures à Paris est de 15°C, tandis qu'à Berlin, elle est de 10°C. La première méthode va s'assurer que le modèle ne se laisse pas influencer par cette différence de moyenne.

La seconde méthode se concentre sur les variations de la covariance des données. La covariance mesure comment deux variables évoluent ensemble. Par exemple, si la température et l'humidité augmentent toujours en même temps dans une ville, mais pas dans une autre, cette méthode va empêcher le modèle de s'appuyer sur cette corrélation pour prendre ses décisions. Les chercheurs ont prouvé que ces deux méthodes offrent des garanties de robustesse dans certaines classes d'environnements.

POURQUOI ÇA MARCHE SANS DONNÉES ÉTIQUETÉES ?

La clé de cette approche réside dans le fait qu'elle n'a pas besoin de données étiquetées pour estimer les directions de perturbation. En d'autres termes, même si vous n'avez pas accès aux résultats (par exemple, les diagnostics médicaux), vous pouvez toujours entraîner un modèle robuste. Les chercheurs ont exploité des données non étiquetées issues de plusieurs environnements pour estimer ces perturbations et rendre le modèle plus robuste.

Avec cette méthode, l'IA devient plus robuste sans avoir besoin de données étiquetées coûteuses.

DES RÉSULTATS PROMETTEURS SUR DES CAS CONCRETS

Pour tester leur approche, les chercheurs ont utilisé deux types de données. Le premier était un système physique contrôlé, un environnement où les conditions peuvent être modifiées de manière précise pour simuler des changements de distribution. Le second était un jeu de données de signaux physiologiques, comme des électrocardiogrammes, qui sont souvent utilisés en médecine pour diagnostiquer des maladies.

Les résultats ont montré que leur méthode améliorait significativement la robustesse des modèles face aux changements de distribution. Dans le cas du système physique, le modèle a maintenu une haute précision même lorsque les conditions changeaient radicalement. Pour les signaux physiologiques, l'approche a permis de réduire les erreurs de diagnostic, même lorsque les données provenaient de patients différents.

UNE RÉVOLUTION POUR LA MÉDECINE ?

Cette avancée pourrait avoir un impact majeur dans des domaines comme la médecine, où les données varient énormément d'un hôpital à l'autre. Aujourd'hui, un modèle entraîné dans un hôpital peut échouer dans un autre, simplement parce que les équipements ou les populations de patients sont différents. Avec cette méthode, il serait possible de créer des modèles plus robustes, capables de fonctionner dans différents environnements sans perdre en précision.

Les chercheurs soulignent également que leur approche pourrait être appliquée à d'autres domaines, comme la reconnaissance vocale ou le traitement automatique du langage. Par exemple, un modèle de reconnaissance vocale entraîné avec des voix d'adultes pourrait être utilisé pour reconnaître la voix d'enfants, même si les données d'entraînement ne contenaient pas de voix d'enfants.

UNE NOUVELLE ÈRE POUR L'IA ROBUSTE

Cette recherche marque une étape importante dans le Développement de modèles d'IA plus robustes et fiables. En exploitant des données non étiquetées et en s'appuyant sur une structure anti-causale, les chercheurs ont ouvert la voie à des modèles capables de s'adapter à des environnements variés sans perdre en performance. Une avancée qui pourrait transformer de nombreux secteurs, de la médecine à la reconnaissance vocale.

Sources :
  • Apple ML Research

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO