L’administration Trump fait volte-face et signe des accords pour tester la sécurité des modèles d’IA. Mais critiques et experts pointent des failles majeures.
LE REVIREMENT DE TRUMP SUR LA SÉCURITÉ DE L’IA
Cette semaine, l’administration Trump a fait machine arrière et a signé des accords avec Google DeepMind, Microsoft et xAI pour que le gouvernement effectue des contrôles de sécurité sur les modèles d’IA de pointe de ces entreprises, avant et après leur mise sur le marché.
Auparavant, Donald Trump avait obstinément rejeté la politique de l’ère Biden, jugeant que les contrôles de sécurité volontaires constituaient une surréglementation entravant l’innovation sans frein. Peu après son entrée en fonction, il était même allé jusqu’à renommer l’Institut américain de sécurité de l’IA en Centre pour les normes et l’innovation en IA (CAISI), supprimant le mot « sécurité » dans une pique adressée à Joe Biden.
MYTHOS, LE MODÈLE QUI A FAIT BASCULER TRUMP
Mais après l’annonce d’Anthropic selon laquelle il serait trop risqué de publier son dernier modèle Claude, baptisé Mythos – l’entreprise craignant que de mauvais acteurs exploitent ses capacités avancées en cybersécurité – Trump s’est soudainement intéressé à la sécurité de l’IA. Selon Kevin Hassett, directeur du Conseil économique national de la Maison Blanche, Trump pourrait bientôt publier un décret exigeant que les systèmes d’IA avancés soient testés par le gouvernement avant leur diffusion, a rapporté Fortune.
CAISI S’APPUIE SUR LA POLITIQUE DE BIDEN
Dans son communiqué de presse, le centre reconnaît que les accords volontaires signés par Google, Microsoft et xAI « s’appuient sur » la politique de Biden. Célébrant ces nouveaux partenariats, le directeur du CAISI, Chris Fall, n’a pas mentionné Mythos mais a promis que les « collaborations industrielles élargies » aideraient le CAISI à intensifier son travail « dans l’intérêt public à un moment critique ».
40 ÉVALUATIONS DÉJÀ MENÉES PAR CAISI
À ce jour, le CAISI a déclaré avoir réalisé environ 40 évaluations, y compris sur des modèles de pointe non encore commercialisés. Lors de ces tests, le CAISI accède fréquemment à des modèles dont les dispositifs de sécurité ont été « réduits ou supprimés », ce qui permet, selon le centre, d’« évaluer plus en profondeur les capacités et les risques liés à la sécurité nationale ».
Grâce à ces évaluations, le gouvernement pourra également mieux comprendre les capacités des modèles, affirme le CAISI. Et pour garantir que les évaluateurs connaissent les principales préoccupations de sécurité nationale au fur et à mesure qu’elles apparaissent, un « groupe d’experts interagences » a formé une task force « axée sur les enjeux de sécurité nationale liés à l’IA ».
LES ENTREPRISES SALUENT LE PLAN DE TESTS
Certaines entreprises signataires se sont montrées confiantes dans le plan de tests du CAISI. Sur LinkedIn, Tom Lue, vice-président des affaires internationales liées à l’IA de pointe chez Google DeepMind, s’est dit « satisfait » de la démarche. Dans un blog, Microsoft a estimé que « les tests portant sur la sécurité nationale et les risques majeurs pour la sécurité publique doivent nécessairement être une collaboration avec les gouvernements », tout en saluant l’expertise « unique détenue par des institutions comme le CAISI » pour mener de tels tests. xAI, actuellement en procès contre OpenAI pour déterminer quelle entreprise se soucie le plus de la sécurité de l’IA, n’a pas immédiatement répondu à la demande de commentaire d’Ars.
LES CRITIQUES TIQUENT
Cependant, les critiques ne sont pas convaincus par le plan gouvernemental et se méfient de plus en plus des entreprises dont la conception des modèles d’IA reste largement secrète. Selon eux, le CAISI manque peut-être de financement ou d’expertise pour évaluer les modèles d’IA de pointe. Et, comme Trump semble le soupçonner, le fait de rechercher des engagements volontaires des entreprises ne crée pas forcément la transparence quotidienne dont le public a besoin sur les risques de l’IA de pointe. En outre, toute politisation du processus d’évaluation – par exemple, s’opposer à la publication de modèles dont les résultats défavorisent les opinions politiques d’une administration – pourrait diminuer la confiance dans l’IA. Sans contrôle, cela pourrait finalement dissuader les entreprises de signer des accords, puisque l’augmentation de la confiance est censée être un moteur clé de cette nouvelle tentative de collaboration gouvernementale.
DES NORMES DE TEST ABSENTES
Dans sa précipitation à annoncer ses partenaires, le CAISI n’a pas précisé les normes de test qui seront utilisées pour les évaluations. Cela pourrait poser problème, selon un post LinkedIn de Devin Lynch, ancien directeur chargé de la mise en œuvre de la politique et de la stratégie cyber au Bureau du directeur national cyber de la Maison Blanche :
Lynch ajoute que la « couche de gouvernance – normes, audits, cadres de responsabilité – reste la moins mature mais la plus essentielle. Le CAISI devra définir, et publier, ce qu’il teste, pas seulement avec qui il teste ».
LA DÉFINITION CONTESTÉE DU MOT « SÛR »
Dans une déclaration à Ars, Sarah Kreps, directrice du Tech Policy Institute de l’université Cornell, a estimé que les entreprises d’IA devraient resserrer leurs liens avec le gouvernement à mesure que l’IA progresse. Cependant, « la définition de “sûr” est contestée » et « une fois que l’on construit un processus gouvernemental de validation pour une technologie, on obtient le meilleur comme le pire », a-t-elle dit. Sans normes définies, « le processus peut être politisé », prévient Kreps, avec le risque de créer un système où « celui qui détient le pouvoir décide de la manière dont la validation fonctionne ». Jusqu’à présent, précise-t-elle, ni l’administration Biden ni celle de Trump n’ont trouvé comment éviter cela.
MICROSOFT COMPARE LES TESTS À CEUX DE L’AUTOMOBILE
Le blog de Microsoft indique que « le CAISI, Microsoft et le NIST collaboreront pour améliorer les méthodologies d’évaluations contradictoires », ce qui suggère que ces normes seront élaborées au fur et à mesure. Selon Microsoft, « tester les systèmes d’IA de manière à sonder les comportements inattendus, les voies d’utilisation abusive et les modes de défaillance » est « un peu comme tester la résistance des airbags, des ceintures de sécurité et des systèmes de freinage dans des scénarios de conduite critiques pour la sécurité ».
L’AUDIT INDÉPENDANT, LA SEULE SOLUTION POUR GREGORY FALCO
Mais Gregory Falco, professeur assistant en génie mécanique et aérospatial à Cornell et expert du suivi de la gouvernance de l’IA, insiste sur le fait qu’il existe une meilleure approche. « La surveillance gouvernementale de l’IA ne peut pas se résumer à un examen politique des résultats des modèles, ni devenir un mécanisme pour décider si un modèle dit des choses favorables ou défavorables sur un président ou une administration », a-t-il déclaré. Plutôt que de s’appuyer sur un gouvernement politisé utilisant les évaluations pour contrôler les systèmes d’IA que le public utilise, les États-Unis pourraient mettre en place « une forme d’audit indépendant », suggère-t-il.
UN SYSTÈME D’AUDIT COMME LE FISC AMÉRICAIN
Imaginez, propose Falco, si les entreprises d’IA savaient que leurs modèles pouvaient être audités à tout moment, quel degré de responsabilité et de discipline cela créerait. Fonctionnant de manière similaire à l’Internal Revenue Service (IRS), un système d’audit rigoureux de l’IA pourrait entraîner « de véritables conséquences pour les déploiements imprudents ». Pour les entreprises confrontées à de telles conséquences, la pression serait forte pour intensifier les tests de sécurité internes, avance Falco.
LE DIABLE DANS LES DÉTAILS POUR RUMMAN CHOWDHURY
Rumman Chowdhury, consultante en gouvernance de l’IA et fondatrice de Humane Intelligence, a également critiqué l’état de préparation du CAISI. Elle a confié à Fortune que « les efforts actuels de la Maison Blanche pour offrir une “surveillance raisonnable” des modèles d’IA de pointe peuvent sembler bons, mais le diable est dans les détails ». « Cela dépend de leur interprétation de ces mots », a-t-elle ajouté. « Les évaluations sont un outil politique, elles ne sont pas vraiment fondées sur des données. Ce qui m’inquiète, c’est qu’il s’agit d’un autre outil politique que l’administration veut posséder et manier. »
UN FINANCEMENT INSUFFISANT
Quant au financement, le Congrès a approuvé en janvier jusqu’à 10 millions de dollars pour développer le CAISI, rapporte Fortune. Cependant, le groupe de réflexion conservateur America First Policy Institute a récemment mené une analyse concluant que « le CAISI reste sous-financé par rapport aux instituts homologues à l’échelle internationale et manque de “financement approprié” ».
LES AUDITS INDÉPENDANTS PROTÈGENT LE PUBLIC
Pour les critiques, le plan de test du CAISI risque de ne pas aller assez loin pour protéger le public des risques les plus imprévisibles de l’IA. Falco maintient que seuls des audits indépendants peuvent épargner au public les pires résultats. « Le danger est que la surveillance gouvernementale devienne politique, superficielle ou capturée par les entreprises qu’elle est censée évaluer », a-t-il déclaré. « L’opportunité est de construire un cadre d’audit pratique qui permette aux États-Unis de rester le leader mondial de l’IA tout en créant une responsabilité crédible autour des risques les plus conséquents. »
LE VÉRITABLE TEST POUR TRUMP
Pour Lynch, le test le plus important sera de savoir si le plan de tests de Trump réussit à éviter les risques et à renforcer la confiance dans les systèmes d’IA, tout en gardant une approche légère pour ne pas surréglementer les entreprises. Le CAISI « est en train de construire quelque chose d’important ici », a déclaré Lynch. « Le test sera de voir si ces collaborations stimulent l’innovation, protègent la sécurité nationale et produisent une IA à la fois digne de confiance et fiable. »
- Ars Technica
L'indépendance de CLODCO est votre garantie.
Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.
Soutenir CLODCO


