ADAPTATTION DE L’ARTICLE D’YVES EUDES « Comment notre ordinateur nous manipule »(LE MONDE samedi 12 AVRIL 2014, p. 1 et supplément « Culture et Idées » l’enquête d’Yves Eudes)
Le fichage des internautes commence dès la connexion, à l’aide de supercalculateurs et de cookies, petites lignes de code insérées sur le navigateur, par les sites web qui sont parcourus. Les agences spécialisées vont ainsi dresser le profil très précis de l’utilisateur lambda qui sera suivi dans ses déplacements sur la toile ; mais il ne s’agit pour l’instant encore que des prémices de ce qui attend les internautes. L’analyse prédictive va peaufiner ces techniques, grâce aux programmes d’intelligence artificielle et à des experts mathématiciens.
Ne soyez pas étonnés que des publicités ciblées s’affichent à l’écran. Des cookies se cachent dans votre ordinateur. Ils sont apparus dès 1994, l’année où le Web s’est ouvert au public, et ont pris un tel essor que la publicité en ligne a atteint, en 2013, un chiffre d’affaires de 102 milliards de dollars. A quoi servent -ils ? Des sociétés spécialisées les déposent sur les sites, en collectent les informations et ensuite viennent le classement, l’analyse et les agrégations de données. Puis la revente de ces dernières. Que retiennent ces cookies ? Vos mots de passe, vos paniers d’achat, le rythme de votre navigation, lent ou rapide, systématique ou superficielle. De là, les fichiers personnalisés et stockés des bases de données. Le message publicitaire sera présenté à un moment opportun et sous un format ad hoc. Y a-t-il un plan B ? Vous pouvez vous débarrasser des cookies, mais d’autres prendront le relais et si vous les bloquez il y a de fortes chances que les sites parcourus ne fonctionnent plus. Et les cookies ont la vie dure : ceux d’Amazon sont prévus de durer jusqu’en 2037.
Vous voulez un autre exemple, alors tenez-vous bien. Selon l’étude conduite par Yves Eude, si vous fréquentez PriceMinister, dès que la page d’accueil du site marchand vous accueille, votre navigateur reçoit 44 cookies provenant de 14 agences spécialisées. Si votre intérêt se tourne vers la section « téléphonie mobile », 22 nouveaux cookies s’accrocheront tels des bernacles portées par le courant de votre curiosité. Puis votre regard se pose sur un modèle Samsung et cette fois c’est 42 cookies qui suivent votre sillage. Il aura suffi en tout de trois clics pour être 108 fois fiché par une quarantaine de bases de données. Imaginons maintenant que vous n’ayez que des velléités d’achat et que tout à coup vous renonciez à l’envie d’acheter le smartphone. Ok, mais Critéo, start-up spécialisée dans le reciblage et les pubs vous guette. Elle vous talonnera des jours et des jours pour ce même produit.
Critéo possède un modèle économique original : cette société est équipée de supercalculateurs pour effectuer en des temps record plusieurs opérations, à savoir, repérer le client, informer la plateforme chargée des espaces publicitaires, offrir un prix, mener une négociation et afficher la bannière. C’est quitte ou double, en 37 centièmes de seconde, ce doit être une affaire ficelée. Dans le cas contraire, un autre concurrent occupera cet espace publicitaire.
Ces moyens techniques de pointe donnent des ailes à l’imagination des publicitaires. Les informations issues des cookies sont croisées et recroisées avec d’autres. Quels renseignements peut-on obtenir ? Votre adresse internet protocol (IP pour ceux qui s’y entendent) pour commencer, qui identifie et localise votre ordinateur, votre langue, vos requêtes sur les différents moteurs de recherche, le modèle de votre ordinateur et de votre navigateur, le type de carte de crédit dont vous disposez. Tant pis pour les informations nominatives laissées en remplissant un questionnaire ou lors de l’achat d’un produit. Tout sera exploité. Le ciblage s’arrête-t-il ici ?
Non, les informations du monde réel (comme les relevés des cartes bancaires, tickets de caisse) peuvent être recroisées avec celles du monde virtuel.
La société Acxiom, spécialisée dans ce double croisement, vend des profils selon 150 critères. Parmi eux on peut être étonné de voir « héberge un parent âgé » « possède un chat » »fait de la couture ». De plus, vos revenus, vos goûts ou besoins, le sexe, l’âge, le métier, vos loisirs, l’origine ethnique, le code postal, les antécédents médicaux, la situation familiale, le logement, le modèle de votre voiture, votre religion, vos voyages sont bien enregistrés. Chaque fichier de mille clients est vendu approximativement 60 centimes d’euros. Les prix varient et peuvent aller jusqu’à 250 euros quand il s’agit d’un laboratoire pharmaceutique. C’est ainsi que l’on obtient une liste de gens souffrant d’obésité (dont le nom n’est pas dévoilé, d’où l’invention du terme « données anonymisées ») qui achètent des produits amincissants.
Tentons maintenant de tordre le cou à des clichés, à celui-ci par exemple selon lequel les produits en ligne sont systématiquement moins chers. Pensez donc. Si vous consultez un comparateur de prix, puis un site de voyages, ce dernier baisse les prix pour s’aligner sur la concurrence. Quand vous tombez sur un tour opérateur affichant un tarif intéressant pour une prochaine destination touristique, mais que vous souhaitez, par acquis de conscience, prendre connaissance d’autres offres, vous vous rendez compte, à votre grand dam, qu’en revenant sur le site initial le prix est plus élevé car l’offre alléchante a disparu entre-temps. Ou encore, si vous vous êtes doté d’un super modèle dernier cri le site risque d’afficher une chambre d’hôtel plus chère. Une astuce pour déjouer ce stratagème ? Utilisez un autre ordinateur qui, par définition, possède lui une autre adresse IP.
La dernière mode est à l’analyse prédictive : on n’est plus au temps où les publicitaires réagissaient en fonction des seules attentes et comportements des internautes, ils veulent actuellement prévoir, anticiper leurs réactions. C’est ici qu’entre en jeu une nouvelle discipline qui en est encore à ses balbutiements : l’apprentissage automatique (« machine learning » en anglais) qui est une branche de l’IA. Selon Franck Le Ouay, directeur scientifique de Critéo « le machine learning désigne la capacité d’un programme à s’adapter à une nouvelle situation. Nous mettons au point des algorithmes auto-régulés et auto-apprenants ». Les expériences se multiplient. Le mathématicien Erick Alphonse, de l’Université de Paris XIII met au point un système baptisé Predictive Mix. Il retiendra l’internaute qui est tenté de rien acheter en l’absence de publicité mais qui réagit positivement quand il en voit. On le désigne comme réceptif. L’ordinateur établit alors un échantillon de profils « réceptifs » en s’appuyant sur une population de la base de données. L’annonceur publicitaire n’aura plus qu’à cibler ce groupe précis et économisera ainsi de l’argent (puisqu’il achétera moins d’espaces) et réalisera un meilleur ROI.
Weborama, autre société française, est en train d’exploiter le « web des mots ». A partir de la collecte de textes situés sur des sites et des forums, les linguistes de Weborama dressent un lexique de 6000 mots pertinents dans le contexte de la publicité. Les mathématiciens organisent le Web comme un « espace métrique » puisque la distance entre les mots est calculée, et étudient si les mots sont associés dans la même phrase. Puis ces mots sont rassemblés en 177 groupes thématiques : assurances, jeux d’argent, sport etc. Alain Lévy, directeur de Weborama, a la formule suivante : « Cette taxonomie devient notre vision du Web. La référence n’est plus le site, mais le mot ». Suite à des accords avec des agences, Weborama installe des cookies sur des millions de navigateurs. Puis elle suit sur le Web et collecte les mots publiés sur les sites visités. « Chaque profil, pour reprendre les termes de Alain Lévy, se voit ainsi attribuer un nuage de mots qui lui est propre ». Les supercalculateurs vont projeter ce « nuage » sur la base de données contenant les groupes de mots et attribuer à chaque profil une note par catégorie. En croisant les notes – par exemple, 13 sur un maximum de 14, pour les mots associés à la mode, 12 pour le design, mais seulement 2 pour le sport, 1 pour les voitures, le Web va découvrir qui est derrière un cookie. » Ce sera par exemple une femme de 34 à 49 ans, passionnée de mode, indifférente au sport … . Elle sera sans intérêt pour certains annonceurs et très désirable pour d’autres. L’Oréal sera prêt à payer 2 euros pour afficher une barrière sur son écran ». Weborama possède actuellement 62 millions de profils pour la France, chaque clic provoque de nouveaux calculs avec une mise à jour permanente.
De son côté, la société Dataiku a développé une suite logicielle qui confiera à des cadres sans formation pointue de gérer des bases de données et de faire de l’analyse prédictive. Selon Florian Donetteau, à la tête de Dataiku, force est de constater pour les professionnels du secteur que l’ordinateur est capable de corrélations inédites pour l’homme et de parvenir à des résultats égaux ou supérieurs au cerveau humain, en des temps records.
Dans un prochain volet, nous explorerons pourquoi, bien que la volonté propre du consommateur puisse être mise en doute, cette dernière n’a peut-être pas dit son dernier mot. Selon divers penseurs, tels que William Bates, philosophe et Professeur d’Histoire des Technologies à l’Université » de Berkeley en Californie, il semble qu’il y ait l’émergence d’une prise de conscience.