Algorithmes et profilage : prédire et influencer nos besoins à l’ère du numérique
- Les données que nous laissons sur des sites web sont partagées et vendues, notamment afin d’influencer nos comportements d'achat en ligne via des publicités ciblées.
- Pour cibler plus efficacement nos besoins, les plateformes en ligne utilisent des algorithmes très performants pour connaître et prédire nos comportements.
- Le programme MOMENTOUS vise à comprendre si les algorithmes peuvent exploiter les traits psychologiques et cognitifs des individus afin d’influencer leurs comportements.
- Nous manquons de données sur les publicités qui ciblent les chaînes YouTube destinées aux enfants, ce qui accentue leur exposition au danger.
- Un accès plus transparent aux données des plateformes en ligne est essentiel pour mener des actions de réglementation efficaces.
En discutant avec des amis des prochaines vacances ou de vos achats à venir, vous ne vous êtes jamais demandé pourquoi des publicités ciblées très précises apparaissaient sur votre mur Facebook ou dans votre fil Instagram ? Nous avons parfois l’impression que nos appareils électroniques nous observent. Une inquiétude qui n’est pas infondée : les traces que nous laissons en ligne affichent des informations inestimables sur nos vies, souvent sans que nous en soyons tout à fait conscients.
En outre, le 14 février 2025, la Ligue des droits de l’Homme a déposé en France une plainte contre Apple pour violation de l’intimité de la vie privée avec la collecte non consentie des données d’utilisateurs, via l’assistant vocal Siri. Cette affaire pose la question de la protection de nos données personnelles, ressources convoitées par les entreprises.
Prenons l’exemple des cookies, ces éléments que nous sommes invités à accepter avant d’accéder à des sites web. Derrière leur nom appétissant, se cachent des possibilités pour des entreprises d’accéder à nos données. Comme le montre Philippe Huneman (directeur de recherche CNRS à l’Institut d’histoire et de philosophie des sciences et des techniques) dans son ouvrage Les sociétés du profilage, il est important de distinguer les cookies « nécessaires », qui assurent le bon fonctionnement d’un site web, des cookies « facultatifs », destinés à améliorer l’expérience de navigation de l’utilisateur ou à personnaliser des publicités « plus pertinentes » pour ce dernier1. En acceptant ces cookies sur un site particulier, nous consentons à ce que certains de nos comportements en ligne y soient observés. Ces derniers sont souvent liés à des data brokers, des entreprises qui achètent, collectent et agrègent des données de plusieurs sites et qui, finalement, les revendent. Parmi les plus connus, citons Acxiom aux États-Unis.
Prédire et influencer nos comportements
Mais pourquoi partager et vendre nos données personnelles ? L’un des objectifs principaux est d’influencer nos comportements d’achat en ligne via des publicités ciblées.
Ainsi, comme le souligne Oana Goga (directrice de recherche à l’INRIA à l’École polytechnique [IPP]) : « Dans le domaine de la publicité en ligne, le tracking [N.D.L.R. : le suivi des comportements des utilisateurs en ligne sur le web] est à la base de deux méthodes de ciblage : la première est le retargeting, une méthode consistant à cibler les internautes ayant déjà visité un site web en affichant des publicités sur d’autres sites qu’ils consultent. L’autre technique est le ciblage à base de profilage, qui consiste à créer un profil d’utilisateur. »
Les traces que nous laissons sur le web à l’ère du numérique peuvent donc notamment être collectées pour constituer un profil. Cette pratique, appelée « profilage » est définie par le RGPD comme le « traitement automatisé de données à caractère personnel pour évaluer certains aspects personnels relatifs à une personne physique2 ». Elle est utilisée afin d’analyser, de prédire ou d’influencer les comportements des individus, entre autres par le biais d’algorithmes. Pour illustrer ce concept, prenons l’exemple donné par la chercheuse du ciblage par profilage de Facebook, et de son évolution : « En 2018, les utilisateurs étaient classés sur Facebook dans 250 000 catégories par des algorithmes, en fonction de leurs préférences sur la plateforme. Aujourd’hui, ce classement n’est plus explicite. Les algorithmes ne placent plus les utilisateurs dans des catégories pour que les publicitaires choisissent qui ils veulent cibler, mais décident à la place des publicitaires à qui envoyer les publicités. »

Les algorithmes utilisés aujourd’hui pour prédire et influencer nos actions sont en effet très performants. Plus que les humains, ils seraient capables de connaître nos comportements, et pourraient même les impacter. Par exemple, des recherches montrent que des modèles informatisés sont bien plus efficaces et précis que les humains dans la réalisation d’une tâche socio-cognitive centrale : le jugement de personnalité3.
Mais cette efficacité soulève plusieurs questions : jusqu’à quel point ces algorithmes peuvent-ils avoir connaissance de nos comportements et les prédire ? Et comment fonctionnent-ils ? À ce jour, les réponses restent obscures. Oana Goga déclare à ce propos : « Un des grands problèmes des algorithmes de recommandation, c’est qu’il est difficile de les auditer, car les données sont privées et appartiennent aux entreprises. »Et Philippe Huneman ajoute : « Aujourd’hui, nous ignorons comment les algorithmes utilisent nos données pour prédire nos comportements, mais leurs modèles deviennent de plus en plus performants. Tout comme pour l’IA générative, nous ne savons pas comment les données sont assemblées. Nous devons choisir : voulons-nous un monde où ces logiciels sont efficaces, ou éthiques ? »
Les problèmes éthiques du profilage et des algorithmes
La question de l’éthique de ces algorithmes est, en effet, fondamentale. En 2016, le scandale de Cambridge Analytica4 avait fait ressortir la possibilité d’exploiter les données des utilisateurs sans leur consentement à des fins politiques, notamment en développant des logiciels capables de cibler des profils d’utilisateurs précis et d’influencer leurs votes, comme dans le cas du Brexit ou de l’élection de Donald Trump. Toutefois, prouver que ces manœuvres ont réellement influencé les résultats de ces événements reste difficile. Parmi les cas plus récents, citons également l’annulation de l’élection présidentielle en Roumanie par la Cour constitutionnelle en décembre 2024, après la suspicion d’une campagne de soutien illicite sur TikTok5. Les algorithmes proposés par des plateformes comme Facebook ou X pourraient également plus que d’autres renforcer les chambres d’écho, c’est-à-dire limiter l’exposition à des perspectives diverses et favoriser la formation de groupes d’utilisateurs partageant les mêmes idées, renforçant certains récits communs6.
Dans ce contexte, Oana Goga et son équipe mènent depuis 2022 le programme MOMENTOUS, financé par la bourse du Conseil Européen de la Recherche (ERC). Son objectif est de comprendre comment les algorithmes peuvent exploiter des traits psychologiques et cognitifs pour influencer les préférences et les comportements des gens. Ce programme offre une nouvelle méthodologie de mesure, basée sur des essais contrôlés randomisés dans les médias sociaux. Comme le souligne Oana Goga : « Il faut bien faire la distinction entre les biais algorithmiques, avec, par exemple, les algorithmes qui discriminent certaines populations, et les biais cognitifs, qui sont les biais que les humains ont. Avec MOMENTOUS, nous regardons si les algorithmes peuvent exploiter les biais cognitifs. » Sur un plan similaire, Philippe Huneman évoque également le concept de nudge dans le profilage : « Le profilage véhicule l’idée d’un paternalisme soft, ou libertarien visant à influencer le comportement d’un individu en agissant sur les biais qui le gouvernent. Les publicités et les interfaces de sites exploitent ces biais pour influencer les décisions des utilisateurs, c’est le nudge. »

En outre, parmi les problèmes éthiques soulevés par le ciblage, citons en premier lieu celui des enfants : « D’un point de vue légal, on n’a pas le droit de cibler les enfants à base de profilage. Cependant, nos études menées sur YouTube ont révélé qu’il était possible de les cibler de manière contextuelle, par exemple en affichant des publicités sur des vidéos de Peppa Pig ou sur des chaînes d’influenceurs, explique Oana Goga. Bien que les plateformes interdisent le ciblage des enfants de moins de 18 ans, elles peuvent cibler les contenus qu’ils regardent. Le problème réside dans le fait que les régulateurs du numérique se concentrent sur l’interdiction du ciblage par profilage des enfants, mais pas sur le ciblage contextuel, qui prend en compte les contenus qui leur sont spécifiquement destinés, alors que ces stratégies sont bien connues des publicitaires. On manque de données sur les publicités qui ciblent les chaînes dédiées aux enfants, ce qui soulève notamment la question des risques de radicalisation de la jeunesse », ajoute la chercheuse.
Pour un accès plus transparent aux données des plateformes en ligne
Comment faire bouger les choses ? Du point de vue de la réglementation, Oana Goga considère qu’une des urgences est d’assurer un accès plus transparent aux données des plateformes en ligne : « Des mesures concrètes doivent être prises pour permettre un meilleur accès aux données, afin de pouvoir mener des actions efficaces. Cela pourrait se faire de deux manières : 1) par des lois ; 2) par la participation citoyenne. Il est essentiel de pouvoir collecter des données de manière éthique et respectueuse du RGPD. »
En ce sens, Oana Goga développe depuis quelques années des outils comme AdAnalyst et CheckMyNews pour Meta et YouTube. Leur objectif : collecter les données des utilisateurs pour mener des recherches sur les contenus et les sources d’informations qu’ils reçoivent sur ces réseaux tout en respectant au maximum leur vie privée, notamment en ne collectant pas les e‑mails des gens, en passant par des comités éthiques, dans le respect du RGPD. « Il serait également intéressant de disposer d’un panel d’utilisateurs à l’échelle européenne. Un observatoire des plateformes, avec 1 000 à 2 000 utilisateurs en France, en Allemagne, etc., pourrait permettre d’accéder à des données, ceci indépendamment des plateformes », ajoute la chercheuse.
Des questionnements au cœur de notre société, qui devraient être au centre des discussions sur la démocratie dans les prochaines années.