Un journaliste a transformé ses corvées en données pour robots. Une expérience qui révèle les coulisses d'un marché en pleine expansion, entre opportunités et dystopie.

Je ne suis plus tout à fait humain. Je suis devenu un collecteur de réalité, un messager entre le monde et les machines. Le couteau à la main, je découpe un concombre bio en fines lamelles, le dos courbé pour que l’iPhone fixé sur mon front capture chacun de mes dix doigts en action. Les rondelles atterrissent dans un saladier. J’arrête l’enregistrement. Quelque part, un bébé robot vient de devenir un peu plus malin.

Voilà à quoi ressemblait ma vie pendant une semaine entière. Depuis mon canapé, j’ai transformé mes tâches ménagères en données pour entraîner des robots à faire la vaisselle, plier le linge ou servir des boissons. Si ces machines veulent un jour vivre parmi nous et nous aider au quotidien, elles doivent d’abord apprendre à maîtriser les gestes précis. J’ai accompli ces corvées avec fierté – après tout, je ne contribue pas souvent à des bases de données massives en rangeant mes chaussettes. Et j’ai aussi gagné un peu d’argent, ce qui n’était pas pour me déplaire.

LA NOUVELLE FORME DE TRAVAIL QUI FAIT FUREUR

Les vidéos en vision subjective – celles où la caméra est fixée sur la tête ou la poitrine de quelqu’un – sont devenues un besoin croissant. De plus en plus d’entreprises tentent de construire des robots et d’améliorer leurs modèles d’intelligence artificielle. Même si Internet regorge de vidéos scrapables, les clips hyperspécifiques comme des milliers de gros plans montrant des mains versant de l’eau dans un verre sans en renverser sont cruciaux pour affiner les machines et les rendre performantes dans des tâches du monde réel.

Cette méthode d’enregistrement, appelée données égocentriques par l’industrie, est tellement demandée que certains investisseurs estiment que les entreprises leaders achèteront des centaines de millions d’heures de vidéos auprès de fournisseurs tiers dans les années à venir.

« Je veux que chaque personne sur Terre enregistre ses tâches ménagères », déclare Avi Patel, le fondateur de 22 ans de Kled, une plateforme de collecte de données. « Cela permettra de créer un robot qui fera la vaisselle à votre place pour toujours. » La collecte de données égocentriques se développe déjà dans des pays comme l’Inde, où les travailleurs indépendants gagnent en moyenne 125 dollars par mois. Ces emplois en première personne offrent des revenus comparables.

Avec l’engouement croissant, de plus en plus d’entreprises de collecte de données cherchent à s’étendre aux États-Unis, comme Tasks, une application autonome de DoorDash lancée plus tôt cette année. Bientôt, de nombreux travailleurs indépendants américains pourraient commencer à « livrer de la réalité » pour joindre les deux bouts, en plus de leurs livraisons de repas habituelles.

Heureusement, j’avais déjà un support de smartphone pour la tête dans mes affaires, issu d’un test précédent pour l’application Tasks de DoorDash. Mon impression, même à l’époque, était que la collecte de données vidéo sur mesure était l’avenir dystopique du travail indépendant. Mais je voulais mieux comprendre cette industrie en pleine croissance. Tasks n’étant pas disponible en Californie, où je vis, je me suis inscrit sur trois autres plateformes : Kled, Luel et Waffle Video.

UN REVENU DE MISÈRE POUR UNE MAISON IMPECCABLE

L’argent gagné était maigre. J’ai essentiellement formé des robots presque gratuitement et n’ai pas réussi à payer ne serait-ce qu’un quart du loyer de 2 500 dollars par mois que je partage avec ma partenaire à San Francisco. Mais ces emplois avaient un avantage inattendu : mon appartement n’a jamais été aussi propre.

Le moment décisif de Kled est arrivé lorsque Patel a posté une vidéo sur X plus tôt cette année, présentant un aperçu de l’immense archive de données vidéo de l’entreprise. Le clip a été vu plus de 4 millions de fois en quelques jours, et les acheteurs de données ont commencé à submerger Patel de messages. « Tous les principaux laboratoires et modèles de base m’ont contacté pour demander des données », explique-t-il.

La formation des robots n’est qu’une partie de ce que Kled collecte auprès de ses plus de 300 000 utilisateurs. Principalement, la startup paie les gens pour télécharger l’intégralité de leur pellicule photo en guise de données d’entraînement pour l’IA. Patel a vu des early adopters s’intéresser à ce travail indépendant en Malaisie, et il existe même une section « tâches spéciales » pour promouvoir les soumissions de vidéos. Les utilisateurs choisissent, dans une liste, la corvée qu’ils souhaitent filmer, puis capturent le contenu directement via l’application. Aucun taux horaire n’est indiqué pour ces tâches ; chacune est classée comme peu, moyenne ou très rémunératrice, sans fourchette précise. (L’entreprise précise que dans environ un mois, une mise à jour inclura les tarifs pour de nombreuses tâches, mais pas toutes.)

J’ai sélectionné « sortir les poubelles » comme première tâche de formation de robot sur Kled. Elle est marquée comme « rémunération moyenne ». Commencer était simple, car l’application guide les utilisateurs sur ce qu’il faut enregistrer :

<em>Description : Capturez comment vous sortez vos poubelles ménagères pour aider à entraîner des flux de travail robotiques du monde réel.</em>
<em>Exigences de la tâche : Enregistrez une vidéo continue dans l'application montrant : retirer le sac, le nouer, placer un nouveau sac, et jeter les poubelles. Gardez la caméra stable et évitez de filmer les visages.</em>

J’ai enfilé la sangle du smartphone sur ma tête et j’ai filmé en nouant le sac poubelle de la cuisine avant de l’escorter jusqu’à la benne située dans l’allée derrière mon immeuble. J’étais un peu anxieux à l’idée de croiser un voisin et de devoir expliquer ce que je faisais. L’enregistrement s’est automatiquement arrêté vers la deuxième minute, avant que je puisse remettre un nouveau sac, comme l’avait indiqué l’application.

Patel explique que la priorité absolue de Kled cette année a été la détection des fraudes. Les gens tentent souvent de télécharger des vidéos récupérées sur Internet ou des boîtes noires vides. Il y a aussi la question de la vie privée : « Il faut s’assurer que toutes les données sont anonymisées et que les informations personnelles identifiables sont supprimées, car les laboratoires n’achèteront pas vos données si vous ne le faites pas », explique-t-il. « C’est la même chose pour les mauvaises uploads. Il faut simplement tout filtrer. » Patel précise que Kled s’est retiré du Nigeria car environ 95 % des uploads soumis par les utilisateurs étaient soit des doublons inutiles, soit frauduleux.

J’ai accompli neuf tâches sur Kled, enregistrant de manière intermittente pendant mes corvées de week-end, avant de réaliser que l’application exige des utilisateurs qu’ils uploadent 100 éléments de média avant d’être éligibles à un quelconque paiement. Un peu agacé, j’ai décidé d’uploader plus de 90 photos de mes vacances de l’année dernière pour atteindre le seuil de paiement. Comme Kled met plusieurs jours à traiter les données, je suis passé à d’autres plateformes collectant des données pour la formation de robots en attendant de recevoir mon argent.

DEUX AUTRES PLATEFORMES, DEUX APPROCHES DIFFÉRENTES

Luel, une plateforme qui paie des utilisateurs du monde entier pour leurs données, ressemble beaucoup à Kled. Les deux ont des fondateurs jeunes : William Namgyal, le fondateur de Luel, n’avait que 18 ans lorsque son entreprise a intégré Y Combinator plus tôt cette année. Les deux entreprises collectent une grande variété de données au-delà des simples vidéos filmées par les utilisateurs. « Les gens sont prêts à enregistrer de simples clips où ils disent des phrases dans leur propre langue », explique Namgyal à propos de l’intérêt de Luel pour la préservation des langues. « Pourquoi ne pas étendre cela aux vidéos égocentriques et aux documents ? » L’application paie désormais aussi les utilisateurs pour enregistrer leur écran d’ordinateur et télécharger des photos de tickets de caisse.

Lors de mes tests, Luel m’a semblé un peu moins abouti que Kled en termes de design. La plateforme ne divise pas les emplois par type de corvée ; elle propose simplement une liste intitulée « Enregistrez une activité pratique quelconque depuis une perspective à la première personne » qui offre 6,60 dollars pour une heure de vidéo. (À titre de comparaison, le salaire minimum fédéral aux États-Unis est de 7,25 dollars de l’heure.) Les exigences de Luel sont très spécifiques : la caméra doit être fixée sur la tête uniquement, en orientation horizontale grand angle, avec une résolution minimale de 1080p, et les mains doivent être visibles 95 % du temps.

J’ai repositionné mon téléphone sur ma tête et me suis mis au travail dans la cuisine, récurant des assiettes et chargeant le lave-vaisselle. J’ai soumis une vidéo de cinq minutes sur le site de Luel ; elle a été rejetée le lendemain. « Vos mains n’étaient pas visibles sur un nombre suffisant d’images », indiquait l’explication de Luel.

Au début, je n’ai rien gagné. Luel m’a envoyé un email quelques jours plus tard pour annuler sa décision initiale. Le message expliquait que bien que « la visibilité de mes mains ait atteint 83 % sur les images échantillonnées », j’avais satisfait le reste des exigences de la tâche et Luel me paierait effectivement. Je suis devenu 55 cents plus riche.

Waffle Video a été de loin ma plateforme préférée des trois. Contrairement à Kled et Luel, elle se concentre uniquement sur les données vidéo, et les « missions » que j’ai vues dans l’application, comme nouer des lacets ou verser de l’eau, payaient 25 dollars par heure de vidéo. Là, on parle d’un vrai salaire.

Chaque jeu de données créé par les utilisateurs est personnalisé pour les entreprises achetant les données. Les « missions » de Waffle ne sont donc disponibles que pendant une durée limitée. L’application offre également aux travailleurs indépendants des revenus récurrents – une sorte de syndication – si leurs vidéos sont sous-licenciées à d’autres entreprises. « Je pense qu’il existe une opportunité incroyable de créer une relation symbiotique entre les personnes qui donnent leur vie, leur perspective, leur créativité et leurs données, essentiellement, à ces modèles », déclare Joshua Mesnik, le cofondateur et directeur des opérations de Waffle, âgé de 34 ans. « Pour que cette relation soit réciproque, plutôt qu’à sens unique. » Mesnik a cofondé la startup avec le PDG Joey Newfield, âgé de 33 ans, en 2024.

J’ai vraiment pris le rythme en utilisant Waffle. Le tarif était suffisamment élevé pour être vraiment attractif, et je me suis amusé comme un fou à cavaler dans la maison comme un producteur d’émission de télé-réalité espérant filmer un maximum de contenu. Nouer mes lacets encore et encore ? Fait . Récurer la vaisselle jusqu’à ce qu’elle brille ? Fait . Verser du Coca Light d’un verre à l’autre jusqu’à ce qu’il soit plat ? Fait .

Mon smartphone était littéralement collé à mon front toute la soirée alors que je complétais des tâches pour Waffle. Chaque soumission durait environ 20 secondes, comme l’exigeait l’application pour cette « mission ». J’ai enchaîné 125 uploads approuvés en quelques jours de travail, gagnant 20 dollars pour mes efforts.

Namgyal, le fondateur de Luel, s’inquiète pour l’avenir du travail, malgré le fait de diriger une entreprise qui forme des robots pouvant un jour remplacer les travailleurs humains. « Ma plus grande crainte, c’est que le chômage augmente de manière extrêmement forte, plus qu’il ne l’est déjà », déclare-t-il. Il voit Luel et le travail indépendant plus largement comme un moyen rapide pour les gens de gagner un peu d’argent, et non comme une solution miracle aux tendances du marché du travail. « Une partie de notre objectif est aussi de créer des emplois, mais c’est évidemment difficile à réaliser. »

Patel se vante qu’un des meilleurs revenus sur Kled provient d’un chauffeur de camion gagnant 8 000 dollars par mois en filmant avec sa dashcam et en soumettant des photos de nids-de-poule. Mais l’expérience de cet utilisateur est clairement une exception. La majorité de ceux qui soumettent des données pour l’entraînement des modèles d’IA ne gagnent pas ce genre de somme, même si la demande en données vidéo semble presque sans limites. Le travail indépendant en vidéo égocentrique reste, eh bien, du travail indépendant : moins de protections pour les travailleurs et une stabilité globale moindre.

La spécialisation pourrait être le seul moyen de gagner un salaire décent en faisant cela aux États-Unis. N’importe qui peut filmer des vidéos de découpe de concombres, mais seul un chef sushi expérimenté peut vraiment montrer la meilleure façon de trancher du saumon sashimi. « Je suis sûr qu’il existe un monde où les chefs disparaissent complètement de la planète », déclare Patel. « Mais ils ne disparaîtront jamais vraiment, car ils seront chez eux à filmer des vidéos, en créant des recettes uniques utilisées pour entraîner ces robots. Ils seront payés. »

LE PAIEMENT FINAL : UNE DÉCEPTION QUI FAIT RÉFLÉCHIR

Il était enfin temps pour moi de recevoir mon argent. Lorsque Kled a terminé le traitement de mes neuf vidéos égocentriques et de mes 97 photos de vacances, je ne m’attendais pas à grand-chose, mais j’ai tout de même été surpris par le virement : 1 dollar.

Après avoir surmonté ma déception initiale, une pointe de fierté m’a traversé. Peut-être que j’aidais à construire un avenir meilleur – un monde où mes petits-enfants ignoreraient complètement les habitudes de nettoyage que j’ai dû adopter. Cette fierté s’est rapidement dissipée lorsque j’ai réalisé que j’entraînais peut-être les robots humanoïdes qui pourraient un jour remplacer les humains dans des emplois bien au-delà des corvées ménagères fastidieuses.

Mon gain total pour la semaine s’est élevé à 21,55 dollars. Pour moi, cette expérience était un petit job à côté, une façon de payer quelques Coca Light supplémentaires en accomplissant des tâches autour de l’appartement. Mais pour les travailleurs du monde entier, et de plus en plus aux États-Unis, ce type de travail indépendant pour l’IA pourrait être accepté par nécessité économique et devenir un moyen de subsistance : apprenez au robot à cuisiner ce soir pour pouvoir mettre de la nourriture sur la table demain.

« Je veux que chaque personne sur Terre enregistre ses tâches ménagères. Cela permettra de créer un robot qui fera la vaisselle à votre place pour toujours. »
Sources :
  • Wired AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO