GPT-5.5 pulvérise les records sur un test clé pour les entreprises. Databricks l’intègre déjà dans ses Outils pour automatiser des tâches complexes.

UN NOUVEAU RECORD SUR UN TEST CRUCIAL

Le GPT-5.5 vient d’établir un nouveau record sur OfficeQA Pro, le test créé par Databricks pour évaluer les modèles sur des tâches complexes en entreprise. Ce benchmark mesure comment les modèles gèrent l’extraction, la récupération et le raisonnement basé sur des documents variés : PDF scannés, fichiers anciens ou textes très longs. Des tâches qui font souvent planter les systèmes d’agents automatisés en production.

46% D’ERREURS EN MOINS PAR RAPPORT À LA VERSION PRÉCÉDENTE

Dans un environnement simulant un agent automatisé, GPT-5.5 a réduit les erreurs de 46% par rapport à GPT-5.4. Mieux encore, il est devenu le premier modèle à dépasser les 50% de précision sur OfficeQA Pro. Une performance qui n’avait jamais été atteinte auparavant.

Pour la première fois, un modèle dépasse les 50% de précision sur OfficeQA Pro.

POURQUOI CE TEST EST-IL SI DIFFICILE ?

OfficeQA Pro contient des milliers de documents d’entreprise scannés ou anciens. Une simple erreur d’extraction d’un chiffre ou d’un nombre peut tout fausser en aval. Comme l’explique un expert : « Une fois qu’on ne parvient pas à extraire un chiffre précis, cela change complètement la trajectoire de travail de l’agent. »

GPT-5.5 MAÎTRISE MIEUX LES DOCUMENTS COMPLEXES

Databricks a constaté les plus grandes améliorations de GPT-5.5 sur les tâches d’extraction de données. Les versions précédentes comme GPT-5.4 échouaient souvent à extraire correctement tous les chiffres. « GPT-5.5 semble avoir fait un bond énorme dans la capacité à analyser des documents anciens et des PDF scannés. »

MEILLEURE ORCHESTRATION DES TÂCHES MULTI-ÉTAPES

Autre progrès majeur : GPT-5.5 gère mieux l’enchaînement des tâches complexes. Avec GPT-5.4, l’agent pouvait parfois s’engager dans des recherches inutiles, ce qui ralentissait tout le processus. « On voyait parfois l’agent partir dans des détours de recherche inutiles, ce qui créait des trajectoires très inefficaces. »

PLUS FIABLE POUR RÉCUPÉRER LE CONTEXTE PERTINENT

Comparé aux versions antérieures, GPT-5.5 est plus fiable pour récupérer le contexte nécessaire et accomplir des workflows complexes sans supervision supplémentaire. Une avancée majeure pour les entreprises qui veulent automatiser des processus sans intervention humaine constante.

DATABRICKS INTÈGRE DÉJÀ GPT-5.5 DANS SES OUTILS

Databricks rend GPT-5.5 disponible via sa plateforme AI Unity Gateway. Les clients peuvent l’utiliser dans des workflows construits avec AgentBricks et l’API Agent Supervisor. Dans ces systèmes, GPT-5.5 coordonne l’extraction, la récupération et l’exécution entre des agents spécialisés.

UNE RÉVOLUTION POUR LES WORKFLOWS PERSONNALISÉS

« On va voir beaucoup de clients utiliser AgentBricks et l’API Agent Supervisor pour des workflows d’agents personnalisés. » Selon un expert, « Avoir GPT-5.5 pour superviser ces workflows est vraiment passionnant. » Une avancée qui pourrait transformer la façon dont les entreprises automatisent leurs processus.

GPT-5.5 pourrait bien devenir l’étalon-or des agents IA en entreprise.

CE QUE ÇA CHANGE POUR LES ENTREPRISES

Avec GPT-5.5, les entreprises gagnent un outil capable de gérer des documents complexes, de réduire les erreurs et d’automatiser des workflows sans supervision constante. Une avancée qui pourrait accélérer l’adoption de l’IA dans les processus métiers, même pour des tâches autrefois considérées comme trop difficiles à automatiser.

Sources :
  • OpenAI News

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO