Stripe utilise l'IA pour automatiser la conformité financière : voici comment ça marche

Avec 1 400 milliards de dollars de transactions annuelles, Stripe automatise ses contrôles de conformité grâce à des agents IA. Résultat : 26% de temps en moins, 96% de satisfaction, et un contrôle humain total.

Stripe, la plateforme de paiements en ligne, traite chaque année 1 400 milliards de dollars de transactions dans 50 pays. Pour vérifier la conformité de ces opérations, ses équipes doivent examiner des milliers de transactions quotidiennement. Mais comment automatiser ce processus sans perdre en qualité ni en traçabilité ?

UN DÉFI DE TAILLE : AUGMENTER LA CONFORMITÉ SANS EMPLOYER PLUS DE MONDE

Quand Stripe a étendu ses activités à 50 pays, ses équipes de conformité ont fait face à un problème : comment traiter plus de transactions sans embaucher proportionnellement plus de personnes ? Chaque jour, les analystes passent jusqu’à 80% de leur temps à rassembler des documents au lieu de se concentrer sur l’évaluation des risques. La solution ? Intégrer des agents IA pour automatiser une partie du travail tout en gardant les humains aux commandes.

L’objectif : réduire la charge de travail des équipes de 20% et identifier 95% des attaques par test de cartes en temps réel.

L’ARCHITECTURE TECHNIQUE : TROIS PIÈCES MAÎTRESSES

Le système d’agents IA de Stripe repose sur trois composants clés : la décomposition des tâches, le cadre ReAct, et une infrastructure dédiée. Chaque élément joue un rôle précis pour rendre l’automatisation à la fois scalable et traçable.

LA DÉCOMPOSITION DES TÂCHES : DES SOUS-PROBLÈMES PLUTÔT QU’UNE GROSSE MACHINE

Confier une seule transaction complexe à un agent unique ne fonctionne pas. L’agent se disperserait sur des détails inutiles au lieu de se concentrer sur l’essentiel. Stripe a donc choisi de découper les tâches en sous-étapes gérables. Chaque sous-étape peut dépendre des résultats des autres, formant un graphe acyclique orienté (DAG).

Ces rails garantissent que chaque agent ne traite que des questions validées par des tests de qualité. Ils s’assurent aussi que l’enquête couvre tous les aspects nécessaires et fournissent à l’agent le contexte suffisant pour des résultats fiables.

LE CADRE REACT : PENSER ET AGIR EN BOUCLE FERMÉE

Stripe utilise une version adaptée du cadre ReAct (Reasoning and Acting), un système où l’agent combine raisonnement et actions. Au lieu de simplement utiliser un grand modèle de langage (LLM) pour répondre, l’agent appelle dynamiquement des Outils pour collecter des données pertinentes.

Par exemple, si on demande à un agent ReAct de calculer « 10 divisé par π », il commence par vérifier s’il connaît déjà la réponse. Comme ce n’est pas le cas, il propose d’utiliser une calculatrice (un outil). Après avoir reçu le résultat, il confirme qu’il a une réponse et la fournit. Pour une tâche plus complexe comme une prévision de revenus, l’agent enchaînerait plusieurs cycles de requêtes à des bases de données (outils) et d’interprétation (raisonnement).

Le cadre ReAct fonctionne comme un système de contrôle en boucle fermée : l’agent ne peut pas passer à l’étape suivante sans avoir traité le retour de la précédente.

L’INFRASTRUCTURE DÉDIÉE : UNE MACHINE À AGENTS, PAS À INFÉRENCE CLASSIQUE

Avant ce projet, Stripe n’avait pas de service dédié aux agents IA. Les tentatives d’intégration dans des systèmes d’inférence classique ont échoué. Pourquoi ? Parce que les agents ne fonctionnent pas comme des modèles de machine learning traditionnels.

Les systèmes classiques sont optimisés pour des réponses en millisecondes sur des GPU coûteux. Les agents, eux, passent des minutes à attendre des réponses de LLM ou d’outils, avec des latences imprévisibles. Stripe a donc créé un service agent dédié, d’abord synchrone et sans état, puis évolué vers un système asynchrone et avec état capable de gérer des conversations multi-tours.

Ce service a permis de faire passer le nombre d’agents de quelques-uns au lancement à plus de 100 en moins d’un an.

LE PROXY LLM : LE PONT ENTRE LES AGENTS ET LES MODÈLES

Stripe utilise un LLM Proxy, un microservice qui agit comme intermédiaire entre les agents et les modèles de langage. Ce proxy gère des fonctionnalités comme le caching de prompts et les basculements automatiques entre modèles.

Pourquoi ce proxy ? Parce que les agents ont besoin de gérer des flux de travail longs, avec des appels d’outils et des retours d’informations en temps réel. Le LLM Proxy permet de centraliser ces fonctionnalités sans alourdir le code des agents.

LE CACHING DE PROMPTS : ÉCONOMISER 60% SUR LES COÛTS

Un défi majeur avec les agents est la longueur des prompts qui s’allongent à chaque tour de conversation. Stripe utilise le caching de prompts sur Amazon Bedrock pour éviter de payer pour l’historique complet à chaque étape.

LA TRAÇABILITÉ TOTALE : AUCUNE ACTION SANS DOCUMENTATION

Même si les humains prennent les décisions finales, chaque action de l’agent est enregistrée. Stripe a mis en place un système de logging complet qui stocke l’intégralité des logs des agents pour chaque exécution.

Chaque appel d’outil, chaque décision, chaque raisonnement est documenté. Cela permet de répondre aux exigences des régulateurs et de garantir une traçabilité totale.

LES RÉSULTATS : 26% DE TEMPS EN MOINS, 96% DE SATISFACTION

Grâce à ce système, Stripe a réduit de 26% le temps médian de traitement des vérifications de conformité. Les reviewers humains maintiennent un taux de satisfaction de plus de 96% et restent maîtres des décisions finales.

Les reviewers utilisent les réponses des agents comme des recherches pré-faites, mais c’est toujours eux qui tranchent.

LES LEÇONS APPRISES : CE QU’IL FAUT RETENIR

Stripe a tiré plusieurs enseignements clés de ce projet :

Des tâches en petites portions : Les tâches doivent être assez petites pour tenir dans la mémoire de travail de l’agent. Testez la qualité étape par étape plutôt que de tout automatiser d’un coup.
L’orchestration asynchrone : Une architecture de workflow asynchrone avec support DAG est essentielle pour des interactions complexes entre agents, tout en gardant une traçabilité et un contrôle humain à grande échelle.
Une infrastructure dédiée : Les agents ont des profils de ressources différents des modèles ML traditionnels. Un service agent dédié est indispensable pour gérer des interactions longues et avec état.
Les humains restent aux commandes : Les agents assistent, mais ce sont les experts qui prennent les décisions finales. Limitez le contexte des agents avec des rails pour éviter les dérives.

L’AVENIR : VERS DES AGENTS PLUS SPÉCIALISÉS

Stripe explore plusieurs pistes pour améliorer encore son système :

L’injection dynamique de connaissances : Grâce à la Retrieval Augmented Generation (RAG), les agents accèdent en temps réel à des données de conformité actualisées via des appels d’outils.
L’adaptation des modèles : Stripe envisage d’utiliser le fine-tuning sur Amazon Bedrock pour adapter les modèles aux tâches spécifiques de conformité financière. Cela permettrait de verrouiller la qualité des modèles et de réduire les coûts de réévaluation.
L’intégration de connaissances sectorielles : Les options de pré-entraînement continu d’Amazon Bedrock pourraient aider à intégrer des connaissances spécifiques au domaine, renforçant l’expertise des agents.

UNE RÉVOLUTION DANS LA CONFORMITÉ FINANCIÈRE

Stripe a prouvé qu’il était possible d’automatiser une partie de la conformité financière sans sacrifier la qualité ni la traçabilité. En combinant décomposition des tâches, orchestration asynchrone et infrastructure dédiée, l’entreprise a réduit de 26% le temps de traitement tout en maintenant un contrôle humain strict.

Ce système repose sur des rails qui limitent les agents à des zones de vérification où ils peuvent être performants, évitant ainsi les erreurs de raisonnement ou les hallucinations. Et grâce à Amazon Bedrock, Stripe bénéficie de protections de confidentialité et de sélection de modèles adaptées à ses besoins.

COMMENT REPRODUIRE CE SYSTÈME ?

Pour ceux qui veulent construire des systèmes similaires, Stripe recommande :

De commencer par le guide utilisateur d’Amazon Bedrock.
D’étudier la documentation sur le caching de prompts.
De tester le système sur la console Amazon Bedrock.

EN RÉSUMÉ : L’IA AU SERVICE DE LA CONFORMITÉ, SANS PERDRE LE CONTRÔLE

Stripe a montré qu’il était possible de automatiser la conformité financière à grande échelle sans compromettre la qualité ou la traçabilité. Grâce à une architecture technique solide, une orchestration intelligente et un contrôle humain permanent, l’entreprise a réduit ses coûts tout en améliorant l’efficacité de ses équipes.

Ce projet ouvre la voie à une nouvelle génération d’outils de conformité, où l’IA assiste les humains sans jamais les remplacer. Et le plus important : tout est documenté, traçable et auditable.

Sources :

AWS ML Blog

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO