Parloa : -80% d'agents humains grâce à ses agents vocaux IA

Parloa transforme le service client avec des agents vocaux IA, capables de gérer des millions d’appels sans accroc. La plateforme AMP, basée sur les modèles d'OpenAI, promet des interactions fiables et sans friction.

L’ÉCLAIR DE GÉNIE DANS UN CENTRE D’APPEL

Parloa utilise les modèles d’OpenAI pour simuler, évaluer et exécuter des systèmes de service client vocaux à destination des grandes entreprises. Tout a commencé quand l’un des cofondateurs a passé une journée dans un centre d’appel d’assurance. Assis aux côtés des agents, il a écouté les mêmes conversations se répéter encore et encore : réinitialisations de mots de passe, questions sur les polices, modifications de routine. Il a alors compris qu’une grande partie de ce travail pouvait être automatisée.

DES RÈGLES RIGIDES AUX AGENTS IA FLEXIBLES

Après cette expérience, la startup berlinoise Parloa a commencé à créer des agents vocaux basés sur des règles pour automatiser les interactions clients à fort volume. Avec l’émergence de ChatGPT, l’entreprise a évolué pour construire sa plateforme actuelle : l’AI Agent Management Platform (AMP), reposant sur une nouvelle Génération de modèles dont GPT‑5.4.

AMP : LA PLATEFORME QUI DÉMOCRATISE LA CRÉATION D’AGENTS IA

AMP permet aux entreprises de concevoir, déployer et gérer des interactions de service client à grande échelle. Plutôt que de cartographier des intentions et des flux rigides, les équipes définissent le comportement en langage naturel, se connectent aux systèmes internes et itèrent rapidement grâce à des simulations et des évaluations intégrées.

Parloa gère ces interactions de bout en bout, du simple routage aux demandes complexes en plusieurs étapes. L’accent est mis sur la cohérence en production, où la performance, la latence et les cas particuliers sont tous cruciaux. Pour y parvenir, Parloa teste en continu les modèles avant de les déployer, en les confrontant à des scénarios clients réels.

La plateforme AMP est conçue pour que les utilisateurs métier et les experts du domaine puissent créer des agents IA sans écrire de code. Les experts des différentes unités opérationnelles peuvent ainsi construire les agents et connecter les API de manière bien plus légère et simple.

DÉFINIR LE COMPORTEMENT EN LANGAGE NATUREL

Concrètement, AMP permet aux marques de gérer l’ensemble du cycle de vie d’un agent IA. Les équipes non techniques définissent simplement le comportement de l’agent avant sa mise en service : rôle, instructions, outils et limites sont exprimés en langage naturel. Cette configuration sert de base aux requêtes (prompts) envoyées au modèle et détermine le comportement du système en production.

TESTS AVANT DÉPLOIEMENT : SIMULATIONS ET ÉVALUATIONS

Une fois défini, l’agent est testé avant son déploiement. Parloa simule des conversations clients à l’aide de modèles comme GPT‑5.4 : un modèle joue le rôle de l’appelant, un autre exécute l’agent configuré. Les équipes peuvent examiner ces interactions, tester des modifications dans des scénarios réalistes et itérer avant la mise en ligne.

Les mêmes modèles évaluent ensuite ces conversations via un mélange de vérifications déterministes et de notation par un LLM comme juge. Cela montre si l’agent a suivi les instructions, utilisé les outils correctement et accompli la tâche attendue.

ORCHESTRATION EN TEMPS RÉEL ET MODÈLES OPENAI

Lors d’une conversation en direct, la couche d’orchestration d’AMP envoie un modèle OpenAI avec la configuration de l’agent et le contexte de la conversation pour générer une réponse, récupérer des informations via RAG (generation augmentée par recherche) ou déclencher des outils interagissant avec les systèmes informatiques du client. Parloa met continuellement à jour cette couche avec les derniers modèles, dès qu’ils montrent des gains évidents en conditions réelles.

Après l’appel, des workflows distincts, basés sur OpenAI, résument l’interaction, classifient l’intention du client et évaluent les performances selon des règles définies.

DES SOUS-AGENTS POUR PLUS DE FIABILITÉ

À mesure que les agents gagnaient en complexité, maintenir une seule invite monolithique devenait difficile. De petits changements pouvaient entraîner des effets secondaires indésirables. Pour y remédier, Parloa a introduit une approche modulaire. Les tâches comme l’authentification, les modifications de réservation ou les mises à jour de compte peuvent être séparées en sous-agents distincts, améliorant le suivi des instructions et rendant les systèmes plus faciles à faire évoluer dans le temps.

CONTRÔLES DÉTERMINISTES POUR LES ÉTAPES CRITIQUES

Parallèlement, la plateforme intègre des contrôles déterministes là où la fiabilité est primordiale. Les entreprises peuvent définir des chaînes d’API structurées et une logique événementielle pour garantir que les étapes critiques s’exécutent dans le bon ordre, conciliant ainsi flexibilité conversationnelle et exécution prévisible.

DES MODÈLES COMME GPT‑4.1 POUR VALIDER LES PERFORMANCES

Parloa utilise des modèles tels que GPT‑4.1, GPT‑5‑mini et d’autres pour simuler des interactions clients réalistes avant la mise en service d’un agent. Ces interactions sont ensuite évaluées avec une combinaison de jugement par LLM et de règles déterministes. Les équipes peuvent ainsi tester des cas limites, itérer rapidement et valider les performances avant d’exposer les clients à un éventuel échec.

UNE APPROCHE CENTRÉE SUR L’ÉVALUATION, PAS LES BENCHMARKS

Parloa travaille principalement avec de grandes entreprises, pour lesquelles la cohérence est aussi importante que la capacité technique. À chaque sortie d’un nouveau modèle, une suite de bancs d’essai est exécutée, mais ce qui compte vraiment, c’est que les résultats tiennent dans des cas d’usage réels.

Plutôt que de s’appuyer sur des benchmarks abstraits, Parloa reflète de véritables agents de production et les soumet à des pipelines de simulation et d’évaluation. Ces tests mesurent la fiabilité du suivi des instructions, la cohérence des appels d’API, la latence et les performances globales dans des conditions réalistes.

Seuls les modèles qui fonctionnent de manière fiable sur des scénarios clients réels sont déployés.

DÉPLOIEMENT : SEULS LES MEILLEURS MODÈLES PASSENT

Les entreprises clientes sont confrontées à un véritable coût de migration. Une fois qu’un système fonctionne en production, elles le maintiennent stable et ne changent que lorsque les bénéfices sont évidents. Par conséquent, les systèmes se comportent de manière prévisible en production, même à grande échelle.

RÉSULTAT : 80 % DE DEMANDES D’AGENTS HUMAINS EN MOINS

Sur des millions d’interactions, la plupart des conversations sont résolues sans friction. Même lorsque les appels sont transférés à des agents humains, l’escalade est rarement due à un échec. Lors d’un déploiement, une entreprise mondiale du voyage a réduit de 80 % les demandes d’intervention d’un agent humain.

Cette mentalité axée sur l’évaluation est devenue un différenciateur clé, permettant à Parloa d’avancer rapidement sans sacrifier la fiabilité en production.

LA VOIX, UN DÉFI DE LATENCE

La voix impose des contraintes différentes de celles du chat textuel. Chaque interaction passe par un pipeline à faible latence : reconnaissance vocale, raisonnement du modèle, puis synthèse vocale. Ce pipeline rend la latence critique. Le moindre retard dans la couche modèle se traduit par des pauses perceptibles pour l’appelant, ce qui influence le choix et l’optimisation des modèles.

COLLABORATION AVEC OPENAI POUR L’OPTIMISATION EN TEMPS RÉEL

Parloa collabore étroitement avec OpenAI pour optimiser les performances dans les cas d’usage en temps réel, en se concentrant sur la latence, la qualité des réponses et le suivi des instructions. L’équipe évalue et teste sous stress les nouvelles itérations de modèles dans des environnements simulant la production avant de les déployer sur des interactions clients réelles.

ÉVALUATION INDÉPENDANTE DE CHAQUE COMPOSANT VOCAL

Parloa évalue chaque composant de la chaîne vocale de manière indépendante. Dès le départ, ces systèmes ont été conçus pour un déploiement mondial. Les bancs d’essai couvrent plusieurs langues, et les clients opèrent dans le monde entier. Cette rigueur multilingue reflète à la fois les racines européennes de Parloa et les attentes des entreprises clientes, qui exigent des performances homogènes sur tous leurs marchés.

VERS DES INTERACTIONS CLIENTS MULTIMODALES

Parloa voit le service client évoluer vers une expérience entièrement multimodale. Une conversation peut commencer au téléphone, se poursuivre en chat et inclure des liens ou des éléments interactifs. Au lieu de traiter chaque étape comme un flux distinct, AMP est conçu pour tout gérer comme une interaction unique.

L’AVENIR : DES AGENTS IA AUSSI CENTRAUX QUE LES SITES WEB

Au fil du temps, les agents IA pourraient devenir aussi centraux dans le parcours client que les sites web et les applications mobiles. Alors que les entreprises automatisent une part croissante des interactions, Parloa s’emploie à rendre les agents IA suffisamment fiables, flexibles et dignes de confiance pour opérer à l’échelle mondiale.

Sources :

OpenAI Research

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO