La solution AIDA de PwC, propulsée par AWS, transforme l'analyse de contrats en extrayant automatiquement les clauses cruciales et en répondant aux questions en langage naturel.
LE CASSE-TÊTE DES CONTRATS
L'analyse des contrats consume un temps considérable pour les équipes juridiques, de conformité et d'achats, surtout lorsque les informations importantes sont enfouies dans des accords longs et non structurés. Avec l'augmentation du volume de contrats, trouver des clauses spécifiques et évaluer les termes extraits devient de plus en plus difficile à l'échelle. Aujourd'hui, de nombreuses équipes s'appuient principalement sur l'extraction par mots-clés et motifs, ou sur des systèmes de gestion de contrats. Ces méthodes peuvent fonctionner, mais peinent souvent à fournir des informations cohérentes à grande échelle. C'est pourquoi beaucoup explorent des approches basées sur l'intelligence artificielle, combinant de grands modèles de langage (LLM, des programmes capables de comprendre et interpréter le texte de manière avancée) avec des flux d'extraction automatisés.
AIDA, L'IA QUI COMPREND LES CONTRATS
La solution d'annotation pilotée par l'IA de PwC, AIDA, construite sur AWS, extrait des informations structurées des contrats grâce à une extraction basée sur des règles et des requêtes en langage naturel. Grâce aux LLM, AIDA interprète le langage juridique complexe et extrait les renseignements selon des règles définies. Les utilisateurs peuvent poser des questions en langage naturel sur un contrat individuel ou sur plusieurs documents au sein d'un projet, et recevoir des réponses contextualisées accompagnées de citations liées. En réduisant le besoin de chercher et interpréter manuellement le langage contractuel, ces capacités rationalisent les flux de révision. Dans les mises en œuvre chez les clients, AIDA a permis de réduire le temps de révision manuelle des contrats jusqu'à 90 %, aidant les équipes à retrouver les informations clés plus rapidement et à raccourcir les cycles de révision. AIDA convertit les documents non structurés en aperçus structurés et consultables, facilitant l'accès et la réutilisation des informations contractuelles critiques dans les systèmes.
AIDA utilise des LLM et une combinaison de services cloud natifs et intégrés d'AWS pour extraire des informations de manière plus efficace. La solution offre des capacités soutenant la sécurité, la conformité et la gestion des risques, mais les clients restent responsables de configurer et d'exploiter la solution pour répondre à leurs obligations de conformité spécifiques. Comme AIDA traite des données contractuelles potentiellement sensibles, des garde-fous appropriés et des flux de travail de révision humaine doivent être appliqués avant toute confiance commerciale ou juridique dans les résultats générés par l'IA. AIDA propose une suite holistique de fonctionnalités clés : extraction par modèles réutilisables, chat au niveau du document et chat global inter-contrats, que nous détaillerons plus loin.
DES GAINS CONCRETS DANS L'INDUSTRIE
AIDA prend en charge l'analyse de contrats à grande échelle dans divers secteurs, notamment les médias et divertissements (M&E), l'immobilier, ainsi que pour les fonctions achats, juridiques et conformité. Dans le secteur M&E, par exemple, AIDA aide les producteurs et distributeurs de contenus à libérer la valeur de leur propriété intellectuelle en extrayant et analysant les informations de droits des accords de licence. Elle résume les droits tels que la diffusion, le streaming, les droits cinématographiques et dérivés, permettant des décisions plus rapides et éclairées sur les spin-offs, les suites et la distribution mondiale. Un grand studio de cinéma et de télévision a réduit de 90 % le temps de Recherche sur les droits.
PLONGÉE DANS L'ARCHITECTURE TECHNIQUE
L'architecture illustre comment les composants d'AIDA fonctionnent ensemble pour traiter, analyser et fournir des informations de manière sécurisée à partir de contrats complexes, en utilisant les services cloud natifs évolutifs d'AWS. Chaque composant est conçu pour traiter les contrats à l'échelle tout en maintenant la sécurité, la traçabilité et la performance.
UNE COUCHE RÉSEAU SÉCURISÉE
La couche périphérique d'AIDA permet un accès authentifié et un routage contrôlé du trafic utilisateur. Les requêtes passent par AWS WAF pour le filtrage des menaces, puis par un Network Load Balancer vers le serveur proxy inverse (NGINX), qui gère la terminaison SSL, le routage et l'application des politiques avant de les transmettre à Amazon ECS (un service de conteneurs géré). Les données en transit sont chiffrées avec TLS 1.2 ou supérieur, y compris les connexions utilisateur via HTTPS et les communications internes entre services.
AUTHENTIFICATION GRANULAIRE AVEC AMAZON COGNITO
L'authentification est gérée via Amazon Cognito (un service de gestion des identités), intégré aux fournisseurs d'identité d'entreprise (comme Microsoft Entra ID, Okta) pour sécuriser l'accès à grande échelle. AIDA applique un contrôle d'accès fin grâce à des rôles au niveau de l'application et du projet, permettant aux administrateurs de gérer centralement les autorisations utilisateur et de définir les actions permises dans un projet, garantissant un accès sécurisé et gouverné aux données et fonctionnalités.
STOCKAGE DURABLE ET CHIFFRÉ
Après authentification, AIDA stocke les documents téléversés, les résultats de la reconnaissance optique de caractères (OCR, une technologie qui transforme les images de texte en texte exploitable) et les métadonnées associées dans Amazon S3 (un service de stockage objet économique et durable), ce qui permet de gérer de grands volumes de données contractuelles. Les données structurées, les configurations et les informations extraites sont persistées dans Amazon RDS (une base de données relationnelle gérée), afin que les utilisateurs puissent interroger et récupérer efficacement les informations pour l'analyse et l'intégration.
Les compartiments S3 sont chiffrés au repos avec des clés gérées par S3 (SSE-S3), et les instances RDS sont chiffrées au repos avec des clés gérées par AWS KMS. De plus, la configuration S3 suit les meilleures pratiques : blocage de l'accès public activé au niveau du compartiment et journalisation des accès pour l'analyse de sécurité et l'audit.
EXTRACTION OCR ET FLUX DE TRAVAIL ASYNCHRONES
Les flux de travail d'OCR et d'extraction s'exécutent de manière asynchrone sur Amazon ECS avec AWS Fargate (un moteur de calcul sans serveur pour conteneurs), les tâches étant coordonnées via Amazon SQS (un service de file d'attente de messages). Cette approche permet de traiter de grands volumes de contrats en parallèle sans bloquer les interactions utilisateur. Les règles d'extraction guident la manière dont le contenu pertinent est identifié et envoyé aux modèles de fondation (FM) hébergés sur Amazon Bedrock (un service donnant accès à des modèles d'IA de pointe), où les LLM interprètent le texte du contrat et extraient des valeurs structurées. Les résultats sont renvoyés vers RDS, où ils sont disponibles pour la révision, les tableaux de bord et les intégrations.
RECHERCHE AUGMENTÉE POUR DES RÉPONSES SOURCÉES
Lors de l'analyse de contrats, il est essentiel que les réponses soient exactes et traçables jusqu'au texte source original. La génération augmentée par récupération (RAG) permet d'ancrer les réponses du modèle dans le contenu contractuel sous-jacent, plutôt que de se fier uniquement aux connaissances du modèle. AIDA utilise RAG pour s'assurer que les réponses sont fondées sur le texte du contrat. Les documents stockés dans S3 sont vectorisés (transformés en représentations numériques) à l'aide des modèles d'embeddings d'Amazon Bedrock, et ces vecteurs sont indexés dans Amazon OpenSearch Serverless pour la recherche sémantique. Lors de l'inférence, les données pertinentes sont récupérées depuis les bases de connaissances d'Amazon Bedrock et combinées à la saisie de l'utilisateur, produisant des résultats précis, contextuels et explicables.
GUARDRAILS : PROTÉGER LES DONNÉES SENSIBLES
De plus, AIDA utilise les garde-fous d'Amazon Bedrock (Guardrails) pour appliquer un filtrage de contenu, une protection des informations personnelles (PII) et des contrôles de sécurité des invites, garantissant que les réponses restent sécurisées et alignées avec les normes de l'entreprise et juridiques.
TABLEAU DE BORD OPÉRATIONNEL
Pour visualiser le traitement des contrats, AIDA s'intègre à Amazon QuickSight (un service de business intelligence) pour afficher des métriques telles que les volumes de documents, la précision de l'OCR, le débit d'extraction et l'état du traitement. Ce tableau de bord donne une visibilité sur la performance du système et aide à identifier les goulets d'étranglement ou les opportunités d'amélioration de l'efficacité.
INTÉGRATIONS ET BOUCLE HUMAINE
AIDA s'intègre aux systèmes en aval via AWS Lambda (exécution de code sans serveur), Amazon EventBridge (bus d'événements) et Amazon SQS. Ces intégrations délivrent les informations extraites aux outils de gestion du cycle de vie des contrats, aux systèmes de données ou à d'autres systèmes opérationnels. Une file d'attente de révision humaine configurable peut valider et approuver les résultats extraits avant leur transmission en aval. En poussant les données contractuelles structurées dans les outils existants, les organisations réduisent la manipulation manuelle des données et réutilisent les informations contractuelles dans les flux de conformité, de reporting et d'analyse.
SERVICES AUXILIAIRES POUR LA SÉCURITÉ ET L'OBSERVABILITÉ
Une gamme de services AWS complémentaires soutient le système central d'AIDA en matière de sécurité, d'observabilité et d'automatisation. AWS IAM (gestion des identités et accès) et AWS KMS (gestion des clés de chiffrement) gèrent l'accès et le chiffrement, avec des politiques IAM appliquant le principe du moindre privilège. Amazon CloudWatch et AWS X-Ray assurent la surveillance. AWS CodeBuild, AWS CodePipeline et AWS CloudTrail permettent le déploiement continu et l'auditabilité en journalisant les opérations sur les données.
AMAZON BEDROCK, LE MOTEUR INTELLIGENT
Amazon Bedrock active les capacités intelligentes d'AIDA : extraction, recherche sémantique et chat conversationnel. En intégrant des modèles de fondation avancés dans le pipeline de traitement, Amazon Bedrock permet une extraction de données contextuelle, une récupération sémantique et des fonctionnalités de chat interactives. AIDA orchestre le traitement des documents, l'OCR, la recherche sémantique et le raisonnement des LLM dans un flux de travail unifié, récupérant les sections pertinentes en fonction de requêtes ou de règles prédéfinies et utilisant Bedrock pour supporter la RAG, fournissant des réponses avec des citations claires vers les documents sources.
DÉMONSTRATION AVEC LE DATASET CUAD
Pour présenter les fonctionnalités clés, des contrats échantillons ont été téléversés dans AIDA à partir du Contract Understanding Atticus Dataset (CUAD), un ensemble de données ouvert créé avec des dizaines d'experts juridiques du projet Atticus. Le jeu de données CUAD est disponible publiquement sous licence Creative Commons Attribution 4.0 (CC BY 4.0), permettant son utilisation et sa distribution à des fins de recherche et d'évaluation.
EXTRACTION PAR MODÈLES RÉUTILISABLES
Des modèles réutilisables permettent d'extraire des attributs contractuels cohérents à grande échelle, en aidant les utilisateurs à définir une fois la logique d'extraction et à l'appliquer à plusieurs documents. Chaque modèle regroupe des étiquettes représentant des éléments clés du contrat, comme les délais de préavis de résiliation, les conditions de renouvellement ou les clauses de droits, que les équipes juridiques et de conformité examinent fréquemment. Lorsqu'un modèle est appliqué à un ensemble de contrats, les mêmes règles d'extraction sont utilisées de manière cohérente, réduisant l'effort de révision manuelle tout en améliorant la précision et la cohérence, surtout avec de grands volumes. En arrière-plan, AIDA traite chaque contrat en utilisant une représentation structurée qui préserve le contexte de la page et de la section. Les règles d'extraction guident l'identification du contenu pertinent, et les LLM interprètent ce contexte pour extraire les bonnes valeurs. Les résultats sont renvoyés avec des citations pointant vers le texte original du contrat, permettant de vérifier l'origine de chaque information.
Par exemple, l'étiquette Période de préavis de résiliation extrait les délais directement du contrat, tandis que le panneau de droite affiche la réponse extraite (surlignée en vert) avec des références cliquables vers le texte source exact.
CHAT AU NIVEAU DU DOCUMENT
Le chat au niveau du document permet de poser des questions en langage naturel sur un contrat unique et de recevoir des réponses ancrées directement dans ce document. Cette capacité est particulièrement utile lorsqu'une clarification rapide sur des termes, dates ou obligations spécifiques est nécessaire, évitant de parcourir manuellement des accords longs et complexes. Lorsque des questions sont soumises, AIDA identifie les sections les plus pertinentes du contrat en comparant les requêtes à une représentation sémantique du contenu du document. Ces sections sont ensuite fournies comme contexte à un LLM hébergé sur Amazon Bedrock, qui génère une réponse basée sur le texte du contrat.
CHAT GLOBAL INTER-CONTRATS
Le chat global étend la fonctionnalité de chat au niveau du document pour prendre en charge des questions sur plusieurs contrats au sein d'un projet. Cette fonction est utile lorsqu'une vue d'ensemble est nécessaire, comme l'identification de clauses communes, la comparaison d'obligations ou la synthèse de termes dans un ensemble d'accords connexes. Le chat global peut être utilisé de deux manières : soit les questions sont évaluées sur l'ensemble des contrats du projet pour fournir une vue consolidée, soit elles peuvent être limitées à un sous-ensemble de contrats sélectionnés, permettant de se concentrer sur des accords spécifiques tout en utilisant la même interface conversationnelle.
AIDA construit une base de connaissances sémantique à l'aide d'Amazon Bedrock en extrayant et vectorisant le contenu des documents pour la recherche. Ces vecteurs sont indexés dans Amazon OpenSearch Serverless, créant une couche sémantique évolutive prenant en charge les requêtes sur de grandes collections de contrats. Lors de la soumission d'une question, AIDA récupère les passages pertinents en combinant un filtrage implicite (similarité sémantique entre la requête et le contenu) et explicite (contraintes de métadonnées comme le type de contrat, la date de création, l'unité commerciale ou la juridiction). Le contexte sélectionné est ensuite fourni à un LLM sur Amazon Bedrock, qui génère une réponse consolidée avec des citations vers les documents sources.
PILOTAGE ET INTÉGRATION AU SI
Le tableau de bord opérationnel fournit une vue consolidée de la performance de la révision des contrats au niveau du projet, suivant les volumes de fichiers, les taux d'achèvement de l'OCR et de l'extraction, les erreurs et la précision. Il aide les équipes à repérer rapidement les goulets d'étranglement et à surveiller la productivité des réviseurs. Les informations structurées extraites par AIDA peuvent être rapidement transmises aux systèmes en aval tels que les outils de gestion du cycle de vie des contrats (CLM), les ERP, les CRM ou les entrepôts de données. Cette intégration enrichit les systèmes internes ou externes avec des données contractuelles de haute qualité et lisibles par machine, réduisant la ressaisie manuelle et la réconciliation entre systèmes. En intégrant ces informations directement dans ces systèmes, les organisations améliorent la surveillance de la conformité et favorisent des décisions plus rapides, fondées sur les données.
DES CONTRATS À L'INTELLIGENCE ACTIONNABLE
La solution AIDA de PwC, rendue possible par AWS, aide les organisations à dépasser la révision manuelle des contrats pour adopter une approche plus rapide, plus fiable et évolutive. En réunissant l'OCR, les règles d'extraction définies par l'utilisateur et la génération augmentée par récupération via Amazon Bedrock, AIDA identifie rapidement les termes clés, les obligations et les informations enfouies dans les contrats complexes. La solution rationalise les flux de travail juridiques et opérationnels, réduit le temps de révision et améliore la cohérence sur de grands volumes de documents. Construite sur les services cloud natifs sécurisés d'AWS comme Amazon ECS, Amazon S3, Amazon RDS et Amazon OpenSearch Serverless, AIDA offre la flexibilité et la résilience nécessaires pour un déploiement en entreprise. Ensemble, PwC et AWS transforment les données contractuelles en intelligence actionnable, permettant des décisions plus intelligentes et une plus grande efficacité opérationnelle.
- AWS ML Blog
L'indépendance de CLODCO est votre garantie.
Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.
Soutenir CLODCO

