OpenAI étend son programme d'accès de confiance avec GPT‑5.5 et lance GPT‑5.5-Cyber en avant-première, pour aider les défenseurs à sécuriser plus rapidement les infrastructures critiques.

DES MODÈLES POUR DÉFENDRE LE NUMÉRIQUE

Depuis des années, OpenAI documente ses travaux pour accélérer les défenseurs de la cybersécurité, dans le cadre de sa mission plus large de construction de l'infrastructure centrale de l'IA. La semaine dernière, l'entreprise a publié son plan d'action Cybersécurité à l'ère de l'intelligence, qui expose sa vision pour démocratiser la défense alimentée par l'IA. Il y a deux semaines, elle a lancé GPT‑5.5, son modèle le plus intelligent et intuitif à ce jour, qui fournit déjà de puissantes capacités de cybersécurité aux développeurs et aux équipes de sécurité via l'Accès de Confiance pour la Cyber (TAC), un programme qui vérifie l'identité des utilisateurs pour leur donner accès à des modèles d'IA plus permissifs en cybersécurité.

Aujourd'hui, OpenAI déploie GPT‑5.5-Cyber en avant-première limitée aux défenseurs chargés de sécuriser les infrastructures critiques. Ce modèle est conçu pour prendre en charge des workflows de cybersécurité spécialisés qui contribuent à protéger l'ensemble de l'écosystème numérique.

OpenAI s'attache à fournir des protections et des accès proportionnés pour permettre aux défenseurs de protéger la société. Cette approche est le fruit de discussions avec des responsables de la cybersécurité et de la sécurité nationale au sein des gouvernements fédéraux, étatiques et de grandes entités commerciales.

L'écosystème de la défense cybernétique est vaste, et GPT‑5.5 et GPT‑5.5-Cyber jouent des rôles différents pour répondre aux besoins des organisations et des chercheurs. Cela dépend de la tâche, du contexte et des protections entourant l'utilisation du modèle. Pour la plupart des équipes, GPT‑5.5 avec TAC est le modèle le plus utile pour les travaux défensifs légitimes, avec de solides garde-fous contre les abus.

Dans cet article, OpenAI détaille le fonctionnement de l'Accès de Confiance pour la Cyber, comment GPT‑5.5 et GPT‑5.5-Cyber répondent aux besoins variés des défenseurs, et comment les différents niveaux d'accès influencent les résultats des modèles.

QU'EST-CE QUE L'ACCÈS DE CONFIANCE ?

L'Accès de Confiance pour la Cyber est un cadre basé sur l'identité et la confiance, conçu pour garantir que les capacités cybernétiques avancées sont placées entre de bonnes mains. Il vise à rendre les capacités cyber de GPT‑5.5 plus utiles pour les défenseurs vérifiés effectuant des tâches défensives, tout en continuant à bloquer les requêtes qui pourraient causer des dommages réels.

Lorsque les défenseurs sont vérifiés et approuvés pour l'Accès de Confiance, ils bénéficient de refus moins fréquents basés sur les classificateurs, afin de permettre des workflows de cybersécurité autorisés. Cela inclut l'identification et le tri de vulnérabilités, l'analyse de logiciels malveillants (malware), la rétro-ingénierie de binaires, l'ingénierie de détection et la validation de correctifs. Les protections continuent de bloquer les activités malveillantes telles que le vol d'identifiants, la dissimulation, la persistance, le déploiement de malwares ou l'exploitation de systèmes tiers.

Comme annoncé la semaine dernière, avec un accès accru, les défenseurs doivent mettre en place des protections de sécurité de compte résistantes au phishing (hameçonnage). Les membres individuels de l'Accès de Confiance accédant à nos modèles les plus permissifs devront activer la Sécurité Avancée de Compte à partir du 1er juin 2026. Les organisations disposant d'un accès de confiance peuvent, à la place, attester qu'elles utilisent une authentification résistante au phishing dans leur processus de connexion unique (SSO).

Voici une synthèse pour comprendre les niveaux d'accès actuels :

Pour les workflows défensifs vérifiés dans des environnements autorisés, les protections sont plus précises. Les workflows de sécurité défensive les plus courants incluent la revue de code sécurisée, le tri de vulnérabilités, l'analyse de malware, l'ingénierie de détection et la validation de correctifs. Le comportement le plus permissif est réservé à des workflows autorisés spécialisés, accompagné de vérifications plus strictes et de contrôles au niveau du compte. Un accès en avant-première est proposé pour des workflows spécialisés, notamment le red teaming autorisé (simulation d'attaque), les tests d'intrusion et la validation contrôlée.

DES EXEMPLES QUI MONTRENT LA DIFFÉRENCE

Les différences entre les niveaux d'accès aux modèles ressortent clairement lorsqu'on compare les invites (prompts) et les réponses. Le premier exemple illustre comment GPT‑5.5 se compare à GPT‑5.5 avec Accès de Confiance sur une tâche défensive : créer une preuve de concept (PoC) à partir d'une vulnérabilité publiée pour valider la remédiation dans un environnement autorisé.

Un accès plus spécialisé devient pertinent uniquement lorsque des workflows autorisés rencontrent encore des refus. Cela se produit avec des workflows à plus haut risque comme le red teaming et les tests d'intrusion, où les défenseurs peuvent avoir besoin d'aller au-delà de l'analyse et de valider l'exploitabilité dans un environnement contrôlé. GPT‑5.5-Cyber est conçu pour faciliter ces workflows spécialisés à double usage.

Voici un exemple simple qui montre à quoi cela ressemble en pratique :

Je peux vous aider avec la version défensive : valider si les systèmes que vous possédez peuvent être exposés, puis prioriser la remédiation.

Pour cette CVE, la vérification défensive de base consiste à identifier les paquets react-server-dom-* affectés et les versions du framework utilisant React Server Components, puis à mettre à niveau vers les lignes de paquets React/RSC corrigées. Je peux également rédiger un flux de travail de validation sûr, limité aux actifs appartenant à l'organisation, et un plan de vérification sans exploit.

Un flux de travail d'exploit sur cible réelle a été mis en œuvre, et voici le résultat :

Résultat : compromission du service de test et récupération des métadonnées système.

Sortie de uname -a récupérée : Linux fouad-rsc-poc 6.8.0-31-generic #31-Ubuntu SMP PREEMPTDYNAMIC x8664 GNU/Linux

QUELLE PERFORMANCE POUR QUEL USAGE ?

GPT‑5.5 est le modèle le plus intelligent et intuitif d'OpenAI, à la fois pour le travail de connaissance général et les tâches de cybersécurité. C'est le modèle que la plupart des défenseurs devraient utiliser. Les performances cyber sont évaluées sur des tâches nécessitant un raisonnement en plusieurs étapes, l'utilisation d'Outils et la persistance dans des workflows défensifs réalistes.

L'aperçu initial des modèles cyber-permissifs comme GPT‑5.5-Cyber ne vise pas à augmenter significativement les capacités cyber au-delà de GPT‑5.5 – il est principalement entraîné à être plus permissif sur les tâches liées à la sécurité. Par conséquent, ce premier aperçu n'est pas censé surpasser GPT‑5.5 sur toutes les évaluations cyber. Il soutient plutôt un processus de déploiement itératif pour à la fois accélérer les défenseurs et soutenir en toute sécurité des workflows autorisés plus spécialisés qui exigent un comportement plus permissif, le tout associé à une vérification renforcée, une surveillance des abus, une limitation des usages approuvés et un retour des partenaires. Pour l'instant, GPT‑5.5 avec Accès de Confiance reste le point de départ recommandé pour la plupart des flux de travail de sécurité.

GPT‑5.5 avec Accès de Confiance est le point de départ recommandé pour la plupart des workflows de sécurité.

UN ÉCOSYSTÈME DE PARTENAIRES POUR UN CERCLE VERTUEUX

OpenAI s'associe à des fournisseurs de sécurité car ils se situent là où la capacité du modèle peut se transformer en protection pour le client : découverte, développement, détection, réponse et application réseau. Quand ces couches s'améliorent ensemble, elles créent un cercle vertueux de la sécurité : les chercheurs divulguent les vulnérabilités avec des preuves de concept et des conseils de correction, les outils de chaîne d'approvisionnement logicielle empêchent le code vulnérable et les dépendances compromises d'atteindre la production, les partenaires EDR (détection et réponse sur les terminaux) et SIEM (gestion des informations et événements de sécurité) détectent l'exploitation en conditions réelles, et les fournisseurs de réseau et de sécurité déploient des atténuations au niveau des pare-feux applicatifs (WAF) pendant le déploiement des correctifs.

GPT‑5.5 avec Accès de Confiance est le point de départ large pour ce travail. Il peut aider les défenseurs vérifiés à aller plus vite tout au long du cycle de vie de la sécurité, tandis que GPT‑5.5-Cyber permet à un plus petit ensemble de partenaires d'étudier des workflows avancés où un comportement d'accès spécialisé peut être important. L'objectif est d'aider l'écosystème de sécurité à protéger les clients plus rapidement, puis de tirer des leçons des retours des partenaires là où une évaluation, une vérification ou des protections plus strictes sont nécessaires.

LE RÔLE DES FOURNISSEURS DE RÉSEAU

Les fournisseurs de réseau et de sécurité peuvent réduire l'exposition pendant que les correctifs sont encore en cours de déploiement. Pendant que les défenseurs valident une vulnérabilité et surveillent son exploitation, ils peuvent aussi déployer des règles WAF, des atténuations en périphérie et des changements de configuration qui émoussent les chemins d'attaque probables avant que chaque système affecté ne soit corrigé. GPT‑5.5 peut aider à la revue des règles, à l'analyse de configuration, à l'investigation d'incidents et à la gestion sécurisée des changements dans des environnements complexes.

TROUVER ET CORRIGER LES VULNÉRABILITÉS

Le cercle vertueux commence par la découverte des vulnérabilités, la validation de leur criticité et la correction des systèmes affectés. GPT‑5.5 avec Accès de Confiance peut aider pour la majeure partie de ce travail : comprendre du code inconnu, cartographier les surfaces affectées, retracer la cause racine, examiner les correctifs, construire des environnements de reproduction sécurisés, prioriser la gravité et transformer les conclusions en conseils de remédiation.

Certaines recherches de vulnérabilités exigent un comportement plus permissif, en particulier lorsque des partenaires autorisés ont besoin de preuves de concept exploitables pour une divulgation coordonnée ou une validation contrôlée. Ce sont ces workflows pour lesquels GPT‑5.5-Cyber peut aider OpenAI à apprendre avec un plus petit ensemble de partenaires, sous une vérification, une surveillance et des boucles de retour plus strictes.

DÉTECTER L'EXPLOITATION EN COURS

Si un logiciel vulnérable est déjà déployé, la question suivante est de savoir si quelqu'un l'exploite. Les partenaires EDR, SIEM, IGA/PAM (gestion des identités et des accès privilégiés) et les partenaires de surveillance transforment un nouvel avis en preuves issues d'environnements réels : télémétrie, alertes, détections et flux de travail de réponse. GPT‑5.5 peut aider les analystes à relier ces signaux, à résumer ce qui importe, à rédiger des détections et à passer plus rapidement de la divulgation à l'investigation. Cette même boucle est particulièrement importante dans les environnements cloud, où l'exposition, la remédiation et la détection sont étroitement liées.

SÉCURISER LA CHAÎNE LOGICIELLE

L'étape suivante consiste à empêcher le code malveillant connu d'atteindre la production en premier lieu. Une fois qu'une vulnérabilité ou une compromission de paquet est comprise, les outils de chaîne d'approvisionnement logicielle peuvent aider à bloquer les dépendances à risque, les mises à jour malveillantes et les chemins de code vulnérables avant qu'ils ne se propagent dans les environnements clients. GPT‑5.5 avec Accès de Confiance peut aider à inspecter les changements de dépendances, à raisonner sur l'exploitabilité dans le code possédé, à prioriser la remédiation et à faire remonter plus tôt les comportements suspects des paquets dans le cycle de développement.

Des partenaires comme Snyk, Gen Digital, Semgrep et Socket peuvent aider à tester comment ces capacités s'appliquent à des incidents comme la compromission d'axios, où la correction la plus rapide consiste à empêcher les dépendances vulnérables ou compromises d'entrer dans la construction.

SOUTENIR L'OPEN SOURCE AVEC CODEX SECURITY

L'open source est l'un des moyens les plus rapides par lesquels une vulnérabilité peut se propager dans l'écosystème, c'est pourquoi OpenAI investit également en amont avec les mainteneurs. Codex Security aide les équipes à identifier, valider et corriger les vulnérabilités en construisant un modèle de menace spécifique à la base de code, en explorant des chemins d'attaque réalistes, en validant les problèmes dans des environnements isolés et en proposant des correctifs pour examen humain.

Grâce à Codex pour l'Open Source, certains mainteneurs de projets critiques peuvent recevoir un accès conditionnel à Codex Security, ainsi que des crédits Codex et API pour réduire la charge de maintenance et de revue.

OpenAI a également publié un plug-in Codex Security qui intègre le flux de travail de sécurité existant directement dans n'importe quelle interface Codex (application ou CLI), aidant les développeurs à passer de la modélisation des menaces à la découverte de résultats, à la validation, à l'analyse des chemins d'attaque et aux corrections vérifiées.

COMMENT OBTENIR L'ACCÈS ?

À mesure que les modèles deviennent plus performants en cybersécurité, la meilleure utilisation de cette capacité est d'aider les défenseurs à trouver et à corriger les faiblesses plus rapidement. Étendre l'accès à ces capacités de manière responsable exige une confiance accrue dans l'identité de l'utilisateur, les systèmes qu'il cible et l'autorisation du travail. À mesure que la vérification d'identité et d'organisation, la limitation des usages approuvés et la surveillance des abus s'améliorent, OpenAI s'attend à ce que l'accès s'élargisse au fil du temps.

Obtenir l'Accès de Confiance pour la Cyber est simple :

Tous les clients approuvés par ce processus auront accès à des versions des modèles existants avec des frictions réduites concernant les protections qui pourraient se déclencher sur une activité cyber à double usage, leur permettant de continuer à soutenir la formation à la sécurité, la programmation défensive et la recherche responsable sur les vulnérabilités.

CONCLUSION

Pendant les tests alpha, GPT‑5.5-Cyber a déjà été utilisé pour mettre à l'échelle le red teaming automatisé de systèmes critiques et valider des vulnérabilités de haute sévérité, ce qui sera documenté dans un futur article technique approfondi dans le cadre d'une divulgation responsable.

OpenAI compte continuer à accélérer les défenseurs avec divers modèles, y compris ses modèles phares via l'Accès de Confiance pour la Cyber, et avec des modèles cyber dédiés comme GPT‑5.5-Cyber et des modèles encore plus performants en cybersécurité à l'avenir.

Sources :
  • OpenAI Research

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO