Une année après son lancement, l'outil d'IA de Anthropic a basculé du chat vers des tâches autonomes. Voici comment les utilisateurs l'exploitent vraiment, et ce que cela change pour l'économie.

LE GRAND CHANGEMENT : DE LA CONVERSATION À L'ACTION AUTONOME

Il y a un an, la plupart des utilisations de Claude ressemblaient à un échange entre un humain et une machine. Aujourd’hui, avec l’explosion de Claude Code et de Cowork, les sessions durent des heures et accomplissent des tâches complexes sans intervention constante. Les transcriptions de chat ne suffisent plus à capturer cette nouvelle réalité.

Pour suivre le rythme, les chercheurs ont dû adapter leur méthode d’analyse. Leurs Outils de mesure ont évolué pour refléter cette transformation : l’IA ne se contente plus de répondre, elle agit. Et cette action redessine les contours du travail quotidien.

Les sessions d’IA ne sont plus des conversations, mais des missions autonomes qui s’étendent sur des heures.

UNE NOUVELLE FAÇON DE MESURER L’IMPACT DE L’IA

Cette édition du rapport de l’Anthropic Economic Index marque un tournant. Les données ne sont plus collectées une fois par semaine, mais en temps réel, grâce à une télémétrie respectueuse de la vie privée. Chaque jour, un échantillon des conversations est analysé, permettant d’observer des variations horaires et quotidiennes. Plus besoin d’attendre sept jours pour voir les tendances : l’IA révèle ses secrets en direct.

Cette approche capture les flux et reflux des habitudes de travail à travers le monde. Les rythmes de vie, les deadlines, les moments de détente… tout laisse une empreinte numérique. Et cette empreinte montre que l’IA s’intègre profondément dans le quotidien, bien au-delà des bureaux.

LA SEMAINE DE TRAVAIL SE RÉFLECTE DANS LES PROMPTS

Les schémas d’utilisation de Claude suivent la semaine de travail classique. Les demandes personnelles explosent le week-end, passant de 35 % en semaine à près de 50 % le samedi et dimanche. Pendant ces deux jours, les conversations basculent des emails professionnels et des présentations marketing vers le soutien émotionnel, les questions médicales ou les conseils en investissement.

Ce changement est encore plus marqué dans les pays à haut revenu. Les utilisateurs ne se contentent plus de déléguer des tâches : ils cherchent des réponses à des questions personnelles, comme si l’IA devenait un conseiller de confiance. Les schémas sont similaires pour Claude Code et le trafic API direct, même si ces outils restent moins utilisés à des fins personnelles.

Les clusters de requêtes révèlent des tendances encore plus précises. Le week-end, les tâches de Claude Code qui chutent incluent l’architecture backend, le débogage d’API et le stockage de données. À l’inverse, celles qui augmentent concernent la conception d’agents IA, le trading quantitatif et les jeux vidéo. Le week-end offre visiblement un espace pour explorer de nouveaux projets, avec une hausse des conversations liées à la création d’entreprise.

Le week-end, l’IA passe du bureau au salon, du travail à la vie personnelle.

LES RYTHMES QUOTIDIENS : L’IA SUIT LE CADRE DE VIE

À l’échelle horaire, les demandes à Claude épousent les rythmes de la vie quotidienne. Les utilisateurs demandent les actualités à 7 heures du matin, heure locale. Les correspondances professionnelles (comme la rédaction d’emails) suivent l’arc de la journée de travail, avec un pic entre 10 et 11 heures. Les demandes de recettes culinaires sont 2,3 fois plus fréquentes à 18 heures qu’en moyenne. Les recommandations médiatiques se concentrent le soir, tandis que les conseils pour dormir affluent dans les heures précédant l’aube.

Pendant les nuits et les week-ends, lorsque les utilisateurs se tournent vers Claude pour travailler, les tâches sont majoritairement liées à des métiers mieux rémunérés. Bien que les chercheurs ne puissent pas identifier les emplois exacts des utilisateurs, cette tendance suggère que les personnes occupant des postes bien payés (comme les gestionnaires marketing ou les programmeurs) sont plus susceptibles de travailler en dehors des horaires traditionnels. À l’inverse, les tâches liées à des emplois moins bien rémunérés (comme le télémarketing ou le travail de bureau) représentent une part plus faible des conversations.

Cette répartition n’est pas uniquement due aux tâches informatiques et mathématiques : même en retirant ces métiers de l’analyse, les tâches mieux rémunérées restent plus fréquentes la nuit et le week-end.

LES DATES CLÉS : L’IA AU RYTHME DES CALENDRIERS

La période couverte par ce rapport inclut les échéances fiscales aux États-Unis. Autour de la date limite du 15 avril, les demandes liées aux impôts ont connu une explosion : le 14 avril, les clusters liés aux impôts étaient huit fois plus fréquents qu’en moyenne en mai. Ils sont restés élevés le 15 avril avant de chuter brutalement le 16. L’IA devient ainsi un allié indispensable pour gérer les obligations administratives, au même titre que les tâches professionnelles.

Le 14 avril, les demandes liées aux impôts étaient huit fois plus fréquentes qu’en moyenne. L’IA gère les deadlines comme un pro.

LES ARTÉFACTS : CE QUE L’IA PRODUIT VRAIMENT

Dans ce chapitre, chaque conversation sur Claude (chat et Cowork) est classée selon son artefact, c’est-à-dire le résultat principal produit : un document, une explication, un code, un article académique, etc. Plus de 30 catégories ont été identifiées. L’artefact peut apparaître dans la fenêtre de chat ou être exporté dans un fichier séparé.

Le classificateur a identifié que 93 % des conversations produisent un artefact. Les plus courants sont les explications (17 % des conversations), les documents et rapports (15 %), et les conseils (11 %). Les sorties conversationnelles (comme les explications ou les conseils) et les livrables écrits (documents ou présentations) représentent chacun environ un tiers des conversations. Le code et les travaux techniques (applications ou scripts) comptent pour environ un sixième.

Mais un artefact ne révèle pas toujours son usage final : un même document peut être un livrable professionnel ou un projet personnel. L’analyse suivante explore cette distinction.

TRAVAIL, PERSONNEL OU ÉTUDES : L’USAGE DES ARTEFACTS

Une classification primitive, introduite dans le rapport de janvier, permet de déterminer si une conversation relève du travail, de la vie personnelle ou des études. Cette méthode est ici appliquée aux artefacts produits. Certaines catégories d’artefacts sont presque toujours personnelles : plus de 80 % des conversations produisant des écrits créatifs, des conseils ou des recettes sont classées comme personnelles.

À l’intérieur de chaque catégorie, les usages personnels et professionnels peuvent être très différents. Par exemple, l’écriture créative personnelle est dominée par les fanfictions, la construction de mondes imaginaires et la poésie. Les 13 % restants, liés au travail, concernent surtout des scripts pour vidéos courtes, des scénarios ou des discours. Les catégories les plus souvent professionnelles incluent la création de contenus marketing (80 %), la rédaction de blogs ou d’articles (81 %) et l’écriture de requêtes de base de données (82 %).

Certains artefacts sont utilisés autant pour des raisons personnelles que professionnelles, comme la création de plans ou de stratégies (44 % professionnels, 49 % personnels) ou la traduction (42 % professionnels, 44 % personnels). Par exemple, les plans personnels les plus courants incluent les itinéraires de voyage et les programmes d’entraînement, tandis que les plans professionnels concernent souvent des stratégies entrepreneuriales ou de contenu.

Enfin, les artefacts caractéristiques des études incluent la rédaction de mémoires et de thèses, la création de supports éducatifs et les requêtes mathématiques. Une part non négligeable de ces artefacts est également utilisée à des fins personnelles ou professionnelles.

CE QUE LES CONVERSATIONS PRODUISENT SELON LEUR USAGE

En inversant la question, on peut se demander quels artefacts sont typiquement produits selon que la conversation est liée au travail, à la vie personnelle ou aux études. Les conversations professionnelles produisent le plus souvent des documents et rapports (20 %), suivis par des explications (9 %), des brouillons d’emails (7 %) et des analyses ou résumés (6 %). Les conversations liées aux études ressemblent globalement à ce schéma : les documents et rapports arrivent en tête (21 %), suivis par les explications (20 %), les supports éducatifs (11 %) et les mémoires (6 %).

En revanche, et sans surprise, seulement 6 % des conversations personnelles produisent un document. À la place, les résultats les plus courants sont les explications (25 %) et les recommandations (22 %).

La production de ces artefacts nécessite des ressources de calcul, et ces ressources semblent évoluer avec la valeur du travail. Chaque conversation est mesurée en tokens (les unités de texte traitées et générées, y compris le raisonnement interne de Claude). Ces données sont comparées aux salaires moyens des métiers associés aux tâches classées.

Le graphique montre une relation positive entre le nombre médian de tokens par conversation et le salaire médian des métiers associés. Par exemple, les gestionnaires marketing gagnent environ deux fois plus que les éditeurs ($80 contre $37 de l’heure), et les conversations liées à leurs tâches consomment environ 2,5 fois plus de tokens. Cette relation est cependant bruitée, avec des exceptions notables. Les pharmaciens, par exemple, gagnent près de trois fois plus que les assistants statistiques ($68 contre $24 de l’heure), mais les conversations liées à leurs tâches n’utilisent qu’un vingtième des tokens en moyenne.

La consommation de tokens varie également selon le type d’artefact produit. Les sorties plus complexes et précieuses consomment significativement plus de tokens. Par exemple, les conversations liées à la construction d’applications utilisent plus de trois fois les tokens d’une conversation médiane. À l’autre extrémité, une explication typique utilise environ un cinquième des tokens d’une conversation médiane. Environ 44 % de la variation des tokens selon les salaires s’explique par le mélange des artefacts produits : les métiers mieux rémunérés sont plus susceptibles de produire des artefacts gourmands en calcul.

L’AUTONOMIE DE L’IA : JUSQU’OÙ PEUT-ELLE DÉCIDER SEULE ?

Les chercheurs ont mesuré le niveau d’autonomie de l’IA sur une échelle de 1 à 5, allant de « aucune » à « extrême ». Les tâches faciles à décrire ou à spécifier laissent peu de place à l’autonomie : les sorties à faible autonomie incluent les calculs mathématiques, les traductions et les questions-réponses. Les tâches à haute autonomie nécessitent de faire des choix parmi de nombreuses options possibles, comme la création d’applications, de sites web, de jeux ou de présentations. Ce type de travail, qui demande un jugement soutenu, a historiquement été difficile à automatiser. Pourtant, les données montrent que cela commence à changer.

Sur presque tous les types de sorties (26 sur 31), le niveau d’autonomie de l’IA est plus élevé sur Claude Code que sur le chat ou Cowork. Par exemple, les conversations produisant des scripts et extraits de code impliquent en moyenne 0,53 point d’autonomie en plus lorsqu’elles sont créées avec Claude Code plutôt qu’avec le chat ou Cowork. Sur l’ensemble des conversations, la différence moyenne d’autonomie est de 0,37 point, et elle a deux sources principales.

Environ deux tiers de la différence s’expliquent par le fait que les mêmes tâches sont exécutées avec plus de délégation sur Claude Code. Les articles de blog illustrent cette tendance : les requêtes et les tâches derrière leur création sont similaires sur les deux interfaces, mais la façon dont les utilisateurs interagissent avec Claude diffère radicalement. Une conversation médiane sur le chat ou Cowork produisant un article de blog implique 13 échanges en moyenne, tandis qu’une session sur Claude Code pour un blog ne contient qu’une seule requête humaine. Le tiers restant reflète la différence de mélange des types de sorties entre les deux interfaces.

On pourrait suspecter que cette différence est simplement due au choix du modèle. Les sessions sur Claude Code utilisent bien plus souvent les modèles les plus performants (54 % sont servis par Opus, contre 10 % pour le chat et Cowork). Cependant, l’écart persiste même lorsque l’on compare des conversations utilisant le même modèle. Par exemple, parmi les conversations utilisant Sonnet, les sessions Claude Code affichent encore 0,26 point d’autonomie en plus. Cela suggère que le produit utilisé est probablement plus important que le modèle sous-jacent.

En élargissant la comparaison au-delà des interfaces, les types de sorties où les utilisateurs délèguent le plus sont ceux qui consomment le plus de calcul : en moyenne, l’autonomie et l’usage de tokens augmentent ensemble (corrélation de 0,68 sur le chat et Cowork).

LE NIVEAU DE LECTURE : L’IA ADAPTE-T-ELLE SES RÉPONSES ?

Pour chaque conversation, un classificateur estime deux niveaux de lecture : celui de la requête de l’utilisateur et celui de la réponse de Claude. Ces niveaux sont exprimés en années d’études nécessaires pour comprendre le texte. Les résultats varient fortement selon le type d’artefact produit.

Une requête moyenne aboutissant à un article académique nécessiterait plus de 16 années d’études, soit un niveau équivalent à une licence. 15 % de ces conversations atteignent même un niveau doctoral (20 années d’études ou plus). À l’autre extrémité, les conversations produisant des recettes ou des conseils nécessitent moins de 10 années d’études pour comprendre la requête.

En général, les types d’artefacts avec des sorties à haut niveau de lecture ont aussi des requêtes à haut niveau de lecture (corrélation de 0,87 sur l’ensemble des conversations). Cependant, on observe aussi que, dans presque toutes les catégories, la réponse de Claude est à un niveau de compréhension plus élevé que la requête, en moyenne d’environ une année d’études. L’écart est le plus large lorsque les utilisateurs décrivent quelque chose à construire, comme des images et graphiques (+2,6 années), des jeux (+1,9) ou des applications et sites web (+1,7). Une partie de cet écart peut simplement être due au registre : les requêtes sont souvent brèves et informelles, tandis que Claude répond en prose polie. Cependant, l’écart est quasi nul pour les écrits destinés à un public (blogs −0,1, articles académiques +0,0, emails +0,3), probablement parce que les requêtes consistent souvent à rédiger un texte ou une source dans le même registre que la sortie finale.

CE QUE LES UTILISATEURS PENSENT VRAIMENT DE L’IA AU TRAVAIL

Les deux premiers chapitres montrent comment les utilisateurs utilisent Claude, mais ne révèlent pas leurs sentiments face à l’impact de l’IA sur leur travail. Des entretiens menés en décembre 2025 auprès de 81 000 utilisateurs de Claude ont permis de dresser un tableau plus complet : les répondants ont rapporté des gains de productivité importants, mais ont aussi exprimé des inquiétudes concernant le remplacement. Ces craintes étaient concentrées chez les travailleurs débutants et dans les métiers où Claude effectue le plus de travail.

En avril 2026, l’enquête Anthropic Economic Index Survey a été lancée pour approfondir ces résultats. Elle permet de demander directement aux utilisateurs leur expérience avec l’IA et le travail, et d’explorer comment leurs réponses varient selon leur usage de Claude. Les réponses à l’enquête ont été liées aux données d’utilisation de mi-mai à début juin, en utilisant des méthodes respectueuses de la vie privée. Pour caractériser les schémas d’utilisation de chaque répondant, jusqu’à 20 sessions par personne ont été échantillonnées aléatoirement dans cette fenêtre (sur Claude.ai, Cowork et Claude Code, afin que le mélange de sessions reflète l’usage typique de chaque personne sur les différentes interfaces). Les répondants ayant moins de cinq sessions ont été exclus pour réduire le bruit d’échantillonnage. L’échantillon final lié comprend environ 9 700 répondants.

La majorité des répondants s’attendent à des progrès significatifs de l’IA au cours de l’année à venir. Bien que leur perception des capacités de l’IA dépende de leur expérience, de leur lieu de résidence et de l’exposition de leur métier à l’IA, leurs attentes concernant le rythme des progrès futurs sont remarquablement uniformes. Cela correspond à une « marée montante », où les capacités de l’IA s’améliorent globalement.

Les avis sur ce que ces progrès signifient pour leur propre carrière sont moins unanimes. Les travailleurs débutants estiment que l’IA peut accomplir la plus grande part de leur travail et expriment le plus d’inquiétudes concernant la perte d’emploi. Pourtant, et contrairement à une idée reçue, les personnes qui délèguent le plus à Claude sont celles qui sont les plus optimistes quant à leur avenir sur le marché du travail. Elles estiment aussi que leurs compétences prennent de la valeur. Et malgré (ou peut-être grâce à) leur proximité avec les avancées de l’IA, les espoirs des répondants pour la prochaine décennie ne portent pas sur le remplacement, mais sur la collaboration. Ils espèrent que l’IA pourra préserver un travail significatif et automatiser les tâches fastidieuses, et que ses bénéfices seront partagés largement.

Les travailleurs qui délèguent le plus à l’IA sont aussi les plus optimistes sur leur avenir professionnel.

L’ENQUÊTE : QUI RÉPOND ET POURQUOI ÇA COMPTE

L’enquête Anthropic Economic Index Survey n’est pas représentative de la population générale. Elle cible un échantillon aléatoire d’utilisateurs de Claude, avec une possible sélection parmi ceux qui répondent, et filtre les utilisateurs occasionnels. La répartition des métiers des répondants (en orange) est comparée à celle de l’emploi aux États-Unis (en gris). Les métiers liés à l’informatique et aux mathématiques sont largement surreprésentés, représentant environ 30 % des répondants. Ce chiffre est comparable à leur part d’utilisation de Claude, mais bien supérieur à leur part de 4 % dans l’emploi américain. Les métiers de gestion, à 23 % des répondants, sont aussi largement surreprésentés par rapport à leur part de 7 % dans l’emploi, même s’ils ne représentent que 4 % des sessions. Cet écart s’explique par le fait que les gestionnaires utilisent Claude pour des tâches autres que la gestion elle-même : dans l’enquête, le jugement et la gestion sont cités par de nombreux répondants (surtout ceux ayant plus d’expérience) comme des capacités manquantes à l’IA.

Les métiers physiques comme les transports, la préparation alimentaire ou la construction sont sous-représentés dans l’enquête, comme ils le sont aussi dans les sessions de Claude.

EXPOSITION À L’IA : CE QUE LES UTILISATEURS EN PENSENT

Les recherches sur l’impact de l’IA se concentrent souvent sur l’exposition professionnelle, c’est-à-dire la part des tâches d’un métier réalisables par l’IA. Dans des travaux antérieurs, les chercheurs ont construit une mesure d’exposition observée, qui capture la part des tâches professionnelles déjà réalisées avec Claude. Cette mesure a été comparée à une mesure couramment utilisée d’exposition théorique, c’est-à-dire la part des tâches professionnelles qu’un grand modèle de langage pourrait théoriquement accomplir.

Une autre façon de comprendre l’exposition professionnelle consiste à demander directement aux utilisateurs combien de leurs tâches professionnelles l’IA est capable de réaliser entièrement aujourd’hui (exposition déclarée), et combien ils s’attendent à ce qu’elle accomplisse dans 12 mois (exposition anticipée). Les répondants pouvaient choisir parmi cinq bandes allant de « presque aucune » à « presque toutes ». Près de 6 utilisateurs sur 10 ont choisi une bande plus élevée pour l’année prochaine que pour aujourd’hui. Plus d’un tiers s’attendent à ce que l’IA puisse accomplir la plupart ou presque toutes leurs tâches professionnelles dans 12 mois.

La figure compare l’exposition déclarée et anticipée à l’exposition observée et théorique. Les chercheurs ont vérifié si ce que les utilisateurs déclarent et anticipent correspond aux mesures d’exposition observée et théorique selon les métiers. Ils ont aussi examiné si les répondants dont les métiers ont une exposition observée ou théorique élevée s’attendent à des progrès plus rapides au cours de l’année à venir. Sur la première question, la réponse est oui : l’exposition déclarée (points gris) est positivement corrélée avec l’exposition observée et théorique. Sur la seconde, la réponse est non : les lignes de tendance pour l’exposition déclarée et anticipée dans 12 mois (points orange) sont essentiellement parallèles. Cela signifie que les personnes occupant des métiers à forte exposition observée ou théorique s’attendent à une augmentation similaire de la part de leurs tâches professionnelles réalisables par l’IA au cours de l’année à venir que celles occupant des métiers à faible exposition. En d’autres termes, un ingénieur logiciel et un gestionnaire de chantier anticipent une progression à peu près équivalente dans leur profession.

Il est aussi important de noter que l’exposition déclarée dépasse systématiquement l’exposition observée. Une explication possible est que tout le monde ne réalise pas toutes les tâches d’un métier, et que l’enquête touche disproportionnellement ceux qui utilisent l’IA plus fréquemment.

Sources :
  • Anthropic Research

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO