Un simple script open source confère à Claude Code la capacité d’analyser n’importe quelle vidéo du web, en combinant extraction d’images et transcription textuelle, le tout pour un coût dérisoire.

LE VISIONNAGE VIDÉO : UNE LACUNE DE CLAUDE ENFIN COMBLÉE

Jusqu’ici, Claude ne pouvait que deviner le contenu d’une vidéo. Les Outils existants se limitaient à la transcription, passant à côté de la moitié de l’information. Désormais, grâce à une compétence dédiée, Claude Code peut véritablement « regarder » une vidéo, image par image, tout en lisant la transcription synchronisée. La promesse est comparable à celle de Neo découvrant la Matrice : le temps d’une commande, l’intégralité d’une conférence de 45 minutes est ingérée, résumée et prête à être exploitée.

Une vidéo se réduit à deux choses : une succession d’images et une transcription. La puissance est dans cette simplicité.

LE PIPELINE TECHNIQUE : DES OUTILS ANCESTRAUX POUR UN RÉSULTAT MODERNE

Sous le capot, le pipeline fait appel à yt-dlp, sorte de couteau suisse du téléchargement vidéo, et à ffmpeg, le moteur de traitement vidéo. Le premier récupère le fichier, le second le transforme en une série de captures d’écran à intervalles réguliers et en un fichier audio propre, prêt à être transcrit. Ces deux outils, éprouvés par des millions de développeurs depuis plus d’une décennie, sont entièrement gratuits et s’installent localement. Pas de service tiers, pas d’API coûteuse pour cette étape.

Pour la transcription, la compétence exploite d’abord les sous-titres gratuits de YouTube lorsqu’ils existent. À défaut, elle fait appel à l’API Whisper, hébergée sur Groq, dont le niveau gratuit couvre 2 heures de transcription par heure. Cette combinaison permet de traiter aussi bien des vidéos YouTube que des fichiers locaux, des Reels Instagram ou des enregistrements Loom.

Le seul coût réel est la consommation de tokens lors de l’analyse, et il s’avère étonnamment maîtrisé.

Contrairement aux craintes, le budget token n’explose pas. La compétence plafonne à 100 images pour les vidéos de plus de 30 minutes. Un traitement revient ainsi à environ 1 dollar par vidéo longue, et les tests menés ont consommé moins de 10 % d’une session pour plus de 5 heures de visionnage. Avec les sous-titres gratuits de YouTube, la transcription ne coûte rien. Même sans sous-titres, le palier gratuit de Groq suffit à un usage quotidien intensif.

DES CAS D’USAGE QUI BOULEVERSENT LA CONSOMMATION DE CONTENU

Un créateur de contenu peut soumettre une vidéo virale et demander à Claude de décortiquer l’accroche, la composition visuelle et le timing. Ce qui prenait dix minutes de visionnage minutieux devient une simple commande dans le terminal. Pour les développeurs, une capture d’écran vidéo d’un bug d’interface suffit : Claude repère l’instant exact du crash et identifie le changement d’état. Un flag de zoom permet de se concentrer sur un segment précis, évitant de saturer la fenêtre de contexte.

Là où il fallait mettre pause et revenir en arrière pendant des minutes, une ligne de commande résumant tout l’essentiel.

INTÉGRATION AVEC UN SECOND CERVEAU : L’AUTOMATISATION DE LA VEILLE

L’intégration la plus poussée consiste à brancher cette compétence sur une base de connaissance comme Obsidian. L’utilisateur fournit une liste de chaînes concurrentes, et Claude visionne chaque nouvelle vidéo, en extrait une structure et remplit directement les notes. Le système s’enrichit à chaque ajout, créant une mémoire collective automatique. Cette approche transforme la veille concurrentielle en un flux continu et exploitable sans effort manuel.

Ce pipeline, entièrement gratuit et open source disponible ici > https://github.com/bradautomates/claude-video , repousse les limites de Claude Code. Il ne s’agit plus de lire des transcriptions, mais d’appréhender le contenu vidéo dans sa globalité. Une avancée qui redéfinit la veille et la création de contenu.

Sources :
  • YouTube - 'My Claude Code Can INSTANTLY Watch Any Video (Here's How)'

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO