Open Claw: 50 jours de terrain d'automatisation perso

La vraie question, celle que personne ne pose parce que personne n'a encore attendu assez longtemps, est de savoir ce que donne réellement l'usage quotidien D'OPEN CLAW après deux mois. Ce que révèle l'expérience prolongée avec Open Claw, agent IA autonome déployé sur serveur personnel, c'est une progression en trois actes, chacun invalidant les intuitions du précédent.

La première semaine est celle de la nouveauté. On interroge l'agent comme on utiliserait ChatGPT, on teste les limites, on accumule les anecdotes. C'est à la fois inévitable et trompeur, parce que cette phase masque ce qui constitue la vraie valeur du dispositif. À partir de la troisième semaine, des automatisations stables se mettent en place. Une revue de presse personnalisée arrive chaque matin à 7h, compilant les contenus les plus pertinents parmi les comptes suivis, les organisant dans une base de notes, y ajoutant des idées de production. L'utilisateur se réveille informé sans avoir scrollé.

Ce n'est pas une fonctionnalité de plus. C'est l'infrastructure qui commence à penser à votre place.

La décision fondatrice : tout en Markdown

Une décision prise dès les premiers jours explique une part significative de ce qui fonctionne ensuite : stocker toutes les données dans des fichiers texte en Markdown, centralisés dans Obsidian. Là où d'autres choisissent des bases SQLite, des vector stores ou des schémas propriétaires, le pari du format ouvert offre une portabilité totale. Lorsque l'outil évolue, lorsque la prochaine itération de l'écosystème arrive, les données suivent en quelques secondes. Aucun enfermement, aucune migration laborieuse. Juste des fichiers.

Ce choix se révèle particulièrement structurant au cinquième mois, lorsque le volume d'usage atteint un seuil critique. Tout cohabite dans une même conversation : recherches, signets, analyses, tâches quotidiennes. La pollution de contexte devient le problème numéro un. La solution passe par une séparation radicale des espaces de travail, un canal Discord dédié par type de flux. La Recherche ne contamine plus les analytics. Les signets ne parasitent plus l'assistant quotidien.

L'architecture qui change tout

La migration vers Discord n'est pas un choix de plateforme, c'est un choix d'architecture. Chaque canal dispose de son propre contexte, de son propre modèle. Un canal analytique tourne sur un modèle économique, suffisant pour de la récupération de données structurées. Le canal de recherche en profondeur mobilise Opus, le modèle le plus puissant, justifié par la complexité des synthèses attendues. Un canal de traitement de liens fonctionne sur un modèle léger et rapide. La logique est simple : on fait correspondre le modèle à la tâche, pas l'inverse. Les coûts se normalisent.

Le dispositif de recherche illustre jusqu'où va cette architecture distribuée. Lorsqu'une investigation est lancée sur l'état des usages d'un outil, cinq sous-agents parallèles sont instantanément déployés : l'un explore Twitter, un autre crawle Reddit, le troisième cible Hacker News, le quatrième analyse la concurrence YouTube, le cinquième parcourt divers forums. Ils s'exécutent simultanément et produisent des fichiers de recherche structurés, incluant analyse concurrentielle, idées de contenu classées, plans détaillés avec sources. Ce qui prendrait des heures de travail manuel est accompli en quelques minutes. Les fichiers produits pour un seul sujet dépassent régulièrement cinquante pages.

Cinq agents en parallèle, cinquante pages en quelques minutes : la recherche n'est plus un préalable, elle devient un flux continu.

Ce qui se casse, sans détour

La compaction silencieuse du contexte constitue l'irritant technique majeur. Lorsque la fenêtre de contexte se remplit, l'agent compresse la conversation sans avertir. Des informations critiques disparaissent. L'agent peut répondre à une question posée trois échanges auparavant comme si le présent n'existait pas. ChatGPT prévient lorsque le contexte s'allonge. Ici, le système compresse et continue. La mitigation existe, elle est efficace : écrire systématiquement vers des fichiers, utiliser la recherche sémantique pour retrouver les informations, initier manuellement la compaction avant que le système ne le fasse. Mais la friction demeure.

Les tâches complexes en plusieurs étapes restent également instables. L'automatisation de navigateur décroche. Les sessions se déconnectent. L'agent peut s'interrompre en milieu de traitement sans signal. La règle qui se dégage après des mois d'usage est nette : plus la tâche est simple, plus la fiabilité est élevée. Plus elle est complexe, plus l'utilisateur doit superviser, relancer, affiner les instructions. L'outil performe mieux comme assistant augmenté que comme agent pleinement autonome, du moins pour l'heure.

La question "à quoi ça sert" reste le post le plus fréquent dans les communautés d'utilisateurs, toutes plateformes confondues. La réponse honnête est inconfortable : si aucun flux de travail n'existe préalablement, aucun agent ne l'inventera. Un gestionnaire de calendrier IA ne sert à rien si l'utilisateur ne gère pas son agenda. Un trieur de mails est inutile si l'inbox n'est jamais consultée. Ce sont les utilisateurs qui avaient déjà des systèmes qui tirent le plus de valeur du dispositif. L'agent n'invente pas l'organisation, il l'accélère et l'automatise.

Ce qui s'installe durablement

Après deux mois d'usage quotidien, l'outil a remplacé plusieurs abonnements payants : un service d'automatisation de flux, une application de gestion de signets, une partie significative des fonctions analytiques natives d'une plateforme vidéo, la moitié d'un gestionnaire de raccourcis système. Ce remplacement n'était pas planifié. Il s'est produit par couches successives, à mesure que les cas d'usage s'affinaient. La base de connaissances accumulée dans Obsidian, presque 3 000 notes indexées chaque nuit par recherche sémantique, devient un actif croissant. Une requête comme "qu'est-ce que j'ai décidé concernant les miniatures le mois dernier" remonte la note exacte, sans correspondance par mot-clé, par compréhension du sens.

Ce qui se dégage au terme de cette durée d'observation, c'est une transition progressive d'outil conversationnel vers infrastructure personnelle. L'agent apprend les préférences, les styles, les contextes de travail. Il anticipe. Il n'est plus consulté, il tourne en fond, et il prévient. Un incident de paiement détecté lors d'un scan routinier de la boite mail. Un renouvellement de domaine imminent. Un article connexe à un projet en cours, repéré lors d'un cycle de vérification dominical. Aucune de ces alertes n'avait été programmée. Elles sont le produit d'un contexte accumulé et d'une instruction générale de vigilance.

Verdict : Open Claw n'est pas un produit grand public, et ses concepteurs ne prétendent pas le contraire. La configuration demeure exigeante, la gestion du contexte reste un chantier, l'autonomie complète est encore un horizon. Mais pour qui dispose de flux à automatiser, d'une certaine aisance technique et de la patience de construire par itérations successives, le système livré après deux mois dépasse largement ce que la première semaine laissait entrevoir. Le plafond est absurdement haut. Le plancher a encore quelques trous. Et c'est précisément ce qui rend le terrain intéressant.

Sources :

Clodco

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO