Google stocke désormais vos photos et enregistrements pour entraîner ses modèles d'IA. Voici comment vérifier et désactiver cette option dans vos paramètres avant qu'il ne soit trop tard.
Chaque fois que je reçois un mail expliquant qu'une entreprise veut utiliser mes données personnelles pour entraîner une IA, une petite partie de mon âme se recroqueville. Récemment, j'ai reçu un message de Google avec pour objet : « Nouvelles options de confidentialité pour les services de Recherche ». Cette annonce fait partie d'un déploiement mondial qui va modifier la façon dont l'entreprise gère les données de votre historique de recherche.
Désormais, toute image que vous téléchargez pour une recherche inversée, tout enregistrement audio lorsque vous parlez à Google Traduction, ou encore vos fichiers multimédias peuvent être conservés dans votre compte et utilisés pour améliorer les modèles d'IA de Google.
Cette nouvelle option, appelée Historique des services de recherche, était déjà activée lorsque j'ai découvert cette page pour la première fois. Si vous aviez déjà désactivé l'activité web et l'App ainsi que la personnalisation des recherches, alors l'option serait désactivée. Pire encore : la case pour sauvegarder toutes vos images téléchargées dans Google Search et les utiliser pour l'entraînement de l'IA était déjà cochée par défaut. Formidable.
COMMENT VÉRIFIER ET DÉSACTIVER CETTE OPTION
Lorsque cette fonctionnalité sera déployée sur votre compte, vous pourrez vous rendre sur la page Mon activité de Google, puis sélectionner l'onglet Historique des services de recherche pour désactiver cette option. Cette page vous donne un aperçu précis de ce que Google conserve de votre historique de recherche. C'est aussi là que vous pouvez désactiver complètement le paramètre et supprimer votre activité. Il est crucial de décocher la case à côté de Enregistrer les médias si vous ne souhaitez pas que vos images téléchargées servent à l'entraînement de l'IA.
Le pop-up qui s'affiche lorsque vous désactivez cette fonction est sans appel : « Si vos médias enregistrés sont utilisés pour entraîner nos modèles d'IA, ils sont déconnectés de votre compte Google. Ces données d'entraînement seront conservées jusqu'à 4 ans, même si vous supprimez l'activité d'origine ». Quatre ans, c'est long pour que vos photos de recherche aléatoires flottent dans l'éther numérique.
POURQUOI GOOGLE VEUT-IL AUTANT DE DONNÉES
Google précise que cette mise à jour ne concerne pas seulement ce que vous tapez dans la barre de recherche. « Vos médias enregistrés incluent vos images, fichiers, enregistrements audio et vidéo issus de vos interactions avec les services de recherche », explique la page de description. « Cela inclut par exemple les images de Google Lens, les enregistrements de Search Live ou de la pratique d'expression orale avec Traduction, le contenu que vous téléchargez, et les recherches vocales ».
Les modèles d'IA n'ont pas besoin que de texte pour s'améliorer : ils ont besoin de données variées, comme des images ou des vidéos. Plus Google parvient à collecter des données, et des types de données différents, auprès de ses milliards d'utilisateurs, plus il peut innover rapidement et devancer ses concurrents.
Google dispose d'un avantage unique grâce à son immense base d'utilisateurs répartis sur de multiples services. « Google est dans une position unique par rapport à la plupart des autres entreprises », explique Thorin Klosowski, militant en sécurité et vie privée à l'Electronic Frontier Foundation. « Parce qu'ils proposent tellement de services que les gens utilisent depuis si longtemps qu'ils se sont habitués, voire résignés, à la quantité de données collectées ». Les applications que les gens utilisent quotidiennement ont une sorte d'inertie intégrée : les changements qui déplaisent aux utilisateurs ne suffisent pas toujours à les pousser vers des services alternatifs.
L'OPT-OUT : UNE OPTION QUI DEVRAIT ÊTRE PAR DÉFAUT
Être obligé de se désengager de l'entraînement de l'IA semble être la norme sur les sites et plateformes. « Demander aux utilisateurs de donner leur consentement explicite pour activer ces fonctionnalités est le minimum que ces entreprises pourraient faire », estime Klosowski. Google aurait dû expliquer clairement aux utilisateurs pourquoi ces fonctionnalités pourraient leur être utiles, au lieu de les activer automatiquement sans préavis.
Dans l'email envoyé à mon compte de test le 23 juin, la première phrase présentait cette mise à jour comme me donnant « encore plus de contrôle sur l'historique enregistré ». Google fournissait ensuite des exemples montrant comment l'enregistrement de ces médias pouvait être utile. « Par exemple, cela vous permet de retrouver vos recherches visuelles passées avec Lens ou de poursuivre une conversation Search Live sur une chanson que vous avez entendue ». En revanche, il est frappant que Google n'ait pas fourni d'exemples similaires après avoir indiqué, vers la fin du message, que ces médias enregistrés seront utilisés pour l'entraînement des modèles d'IA. Le message passait simplement à la suite.
Cette modification logicielle majeure mérite qu'on prenne le temps de l'analyser pour les utilisateurs quotidiens. « Cela ajoute une couche supplémentaire de réflexion pour un consommateur, qui doit évaluer s'il se sent à l'aise avec l'outil qu'il utilise depuis longtemps », explique Ben Winters, directeur de l'IA et de la vie privée à la Consumer Federation of America.
Je suis constamment submergé par l'idée qu'il me revient toujours de me désengager de l'entraînement des données pour chaque service. Cela me donne l'impression d'être un idiot qui va forcément rater quelque chose de caché dans ces paramètres, peu importe ce que je fais.
Winters considère que cette modification de Google place la responsabilité sur les utilisateurs pour éviter l'entraînement de l'IA, ce qui peut contribuer à une lassitude généralisée, voire à un sentiment de désespoir. « Il y a une sensation croissante d'impuissance et de désespoir à essayer de protéger ses données, car chaque petite information va être extraite de vous », explique-t-il.
CE QUE GOOGLE SAUVE VRAIMENT DE VOUS
Google est clair : il ne se contente plus de sauvegarder ce que vous tapez dans la recherche. « Vos médias enregistrés incluent vos images, fichiers, et enregistrements audio et vidéo issus de vos interactions avec les services de recherche », précise la description de la page. « Cela inclut les images de Google Lens, les enregistrements de Search Live ou de la pratique d'expression orale avec Traduction, le contenu que vous téléchargez, et les recherches vocales ».
Les modèles d'IA ont besoin de données variées pour progresser. Google mise sur la diversité des données collectées auprès de ses utilisateurs pour accélérer ses innovations. Son immense base d'utilisateurs lui offre un avantage concurrentiel indéniable.
POURQUOI AGIR MAINTENANT ?
Il est crucial d'effectuer ce changement dès maintenant plutôt que plus tard. Une fois que vos données multimédias sont intégrées dans le processus d'entraînement de l'IA, il devient presque impossible de les en retirer. « Si vos médias enregistrés sont utilisés pour entraîner nos modèles d'IA, ils sont déconnectés de votre compte Google. Ces données d'entraînement seront conservées jusqu'à 4 ans, même si vous supprimez l'activité d'origine », peut-on lire dans le pop-up qui s'affiche lors de la désactivation de cette fonctionnalité.
Quatre ans, c'est une durée pendant laquelle vos images aléatoires de recherche inversée vont errer dans le nuage numérique. Autant dire que l'option par défaut est loin d'être anodine.
UN CONSENTEMENT QUI DEVRAIT ÊTRE EXPLICITE
La plupart des plateformes imposent désormais un opt-out pour l'entraînement de l'IA. Pourtant, cette approche ne devrait pas être la norme. « Demander aux utilisateurs de donner leur consentement explicite est le strict minimum que ces entreprises devraient faire », souligne Klosowski. Google aurait dû expliquer clairement aux utilisateurs les bénéfices de cette fonctionnalité avant de l'activer automatiquement.
Dans l'email envoyé aux utilisateurs, Google a mis en avant les avantages pour l'utilisateur, comme la possibilité de retrouver ses recherches visuelles passées ou de poursuivre des conversations. En revanche, l'entreprise n'a pas fourni d'exemples expliquant pourquoi ces données seraient utilisées pour entraîner ses modèles d'IA. Une omission qui interroge.
LA LÉTHARGIE DES UTILISATEURS FACE À LA COLLECTE DE DONNÉES
Google profite de l'inertie des utilisateurs, habitués à ses services depuis des années. « Les applications que les gens utilisent tous les jours ont une sorte d'inertie intégrée », explique Klosowski. Les changements qui déplaisent aux utilisateurs ne suffisent pas toujours à les faire basculer vers des alternatives, même si ces changements concernent leur vie privée.
Winters ajoute que cette approche place une charge mentale supplémentaire sur les utilisateurs. « Cela crée une couche supplémentaire de réflexion pour un consommateur, qui doit évaluer s'il se sent à l'aise avec l'outil qu'il utilise depuis longtemps », explique-t-il. Résultat : une lassitude générale et un sentiment d'impuissance face à la collecte de données.
QUEL AVENIR POUR LA PROTECTION DES DONNÉES ?
Winters craint que cette tendance ne renforce le sentiment d'impuissance chez les utilisateurs. « Il y a une sensation croissante d'impuissance et de désespoir à essayer de protéger ses données, car chaque petite information va être extraite de vous », explique-t-il. Cette lassitude pourrait conduire à une résignation totale face à la collecte de données par les géants du numérique.
Pourtant, des solutions existent. Demander un consentement explicite, comme le souligne Klosowski, est une première étape. Les utilisateurs doivent être informés clairement des utilisations de leurs données et avoir la possibilité de refuser sans effort.
En attendant, il est crucial d'agir maintenant pour protéger vos données personnelles avant qu'elles ne soient intégrées dans les entraînements des modèles d'IA de Google.
- Wired AI
L'indépendance de CLODCO est votre garantie.
Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.
Soutenir CLODCO


