Présentation de l'API Topics pour le Web

L'API Topics permet la publicité ciblée par centres d'intérêt sans avoir à suivre les sites consultés par un utilisateur.

État de l'implémentation

Qu'est-ce que l'API Topics ?

L'API Topics est un mécanisme de Privacy Sandbox conçu pour préserver la confidentialité tout en permettant à un navigateur de partager des informations sur les centres d'intérêt d'un utilisateur avec des tiers. Elle permet la publicité ciblée par centres d'intérêt sans avoir à effectuer le suivi des sites consultés par un utilisateur.

La publicité ciblée par centres d'intérêt est un concept clé de l'API Topics. Il s'agit d'une forme de publicité personnalisée dans laquelle une annonce est sélectionnée pour un utilisateur en fonction de ses centres d'intérêt, déduits des sites qu'il a consultés récemment. À la différence de la publicité contextuelle, qui vise à faire correspondre les annonces au contenu de la page consultée par l'utilisateur.

La publicité ciblée par centres d'intérêt peut aider les annonceurs (sites qui souhaitent promouvoir leurs produits ou services) et les éditeurs (sites qui utilisent des annonces pour monétiser leur contenu):

  • La publicité ciblée par centres d'intérêt peut aider les annonceurs à toucher des clients potentiels.
  • La publicité ciblée par centres d'intérêt peut compléter les informations contextuelles afin d'aider les éditeurs à utiliser la publicité pour financer des sites Web.

L'API Topics propose une nouvelle forme de publicité ciblée par centres d'intérêt utilisant des thèmes (catégories d'intérêt) attribués à un navigateur en fonction de l'activité récente de l'utilisateur. Ces sujets peuvent compléter les informations contextuelles pour vous aider à sélectionner les publicités appropriées.

Comment ça marche ?

Auparavant, des cookies tiers et d'autres mécanismes ont été utilisés pour suivre le comportement de navigation des internautes sur les sites afin d'identifier les centres d'intérêt. Ces mécanismes sont en cours d'abandon.

Avec l'API Topics, le navigateur observe et enregistre les sujets qui semblent intéresser l'utilisateur en fonction de son activité de navigation. Ces informations sont enregistrées sur l'appareil de l'utilisateur. L'API Topics peut ensuite permettre aux appelants d'API (par exemple, les plates-formes ad tech) d'accéder aux sujets qui intéressent un utilisateur, sans pour autant révéler d'informations supplémentaires sur son activité de navigation.

Observation des sujets sur les ancêtres

Depuis Chrome 114, lorsqu'un appelant observe un sujet pour un utilisateur sur une page, le navigateur considère également l'appelant comme ayant observé tous les ancêtres de ce sujet.

Par exemple, si le navigateur enregistre qu'un appelant observe Shopping/Apparel/Footwear/Boots pour un utilisateur, les ancêtres de ce sujet sont également considérés comme ayant été observés: Shopping/Apparel/Footwear, Shopping/Apparel et Shopping.

Auparavant, pour qu'un appelant soit considéré par le navigateur comme ayant observé (par exemple) Shopping/Apparel, ce thème spécifique devait avoir été renvoyé par l'API en tant que thème observé. Cela signifie que si Shopping/Apparel est observé pour un appelant pour un utilisateur sur une page et Shopping/Apparel/Footwear/Boots sur une autre, l'API considérera Shopping/Apparel comme ayant été observé sur les deux pages.

Époques

Bien entendu, l'API Topics doit s'assurer que les sujets qui l'intéressent sont à jour. Le navigateur déduit les thèmes de l'utilisateur sur la base de son activité de navigation au cours d'une période appelée epoch, soit une semaine actuellement. Chaque utilisateur a ses propres époques (les époques correspondent à "par utilisateur"), et l'heure de début initiale est aléatoire. Le thème de chaque epoch est choisi de manière aléatoire parmi les cinq thèmes principaux associés à l'utilisateur pour cette période. Pour renforcer la confidentialité et garantir que tous les thèmes sont représentés, il y a 5% de chances qu'ils soient sélectionnés de manière aléatoire parmi tous les thèmes possibles d'une taxonomie de centres d'intérêt.

L'API Topics a trois tâches principales:

  • Associez l'activité du navigateur aux sujets qui vous intéressent. Avec la conception actuelle de l'API Topics, les thèmes sont déduits des noms d'hôte des pages consultées par l'utilisateur. Par exemple, le thème déduit pour un site Web sur les aquariums pourrait être /Animaux et animaux de compagnie/Animaux de compagnie/Poissons et aquariums.
  • Calculer les thèmes les plus populaires pour un utilisateur en fonction de son activité de navigation récente.
  • Fournir des mécanismes permettant d'accéder aux sujets qui intéressent actuellement l'utilisateur, afin de l'aider à sélectionner les annonces appropriées.

L'API Topics fournit des sujets lisibles et facilement compréhensibles, ce qui permet de proposer des commandes pertinentes aux utilisateurs.

Mode de sélection et de sélection des thèmes

Les thèmes sont sélectionnés dans une taxonomie composée de catégories hiérarchiques telles que /Arts et divertissements/Musique et audio/Soul et R&B et /Marchés commerciaux et industriels/Agriculture et sylviculture. Ces sujets ont été sélectionnés par Chrome pour les premiers tests, avec pour objectif de faire de la taxonomie une ressource gérée par des contributeurs de confiance de l'écosystème. La classification doit être suffisamment réduite pour que de nombreux navigateurs d'utilisateurs soient associés à chaque thème. Actuellement, le nombre de thèmes est de 469, mais nous estimons que le nombre final de thèmes sera compris entre quelques centaines et quelques milliers.

Pour éviter les catégories sensibles, les sujets doivent être publics, sélectionnés manuellement et à jour. La classification initiale proposée pour être testée par Chrome a été sélectionnée manuellement pour exclure des catégories généralement considérées comme sensibles, telles que l'origine ethnique ou l'orientation sexuelle.

Pour 50 000 sites les plus populaires, l'implémentation de l'API Topics dans Chrome utilise une liste de remplacement publique et organisée manuellement afin de mapper les noms d'hôte aux thèmes. Pour les autres sites, l'API Topics utilise un modèle de machine learning pour déduire les thèmes à partir des noms d'hôte.

L'implémentation de l'API Topics par Chrome télécharge un fichier TensorFlow Lite représentant le modèle, en vue de l'utiliser localement sur l'appareil de l'utilisateur.

Vous pouvez accéder au fichier de modèle TensorFlow Lite et aux sujets déduits pour les noms d'hôte de chrome://topics-internals.

Le diagramme ci-dessous montre un exemple simplifié montrant comment l'API Topics peut aider une plate-forme de technologie publicitaire à sélectionner une annonce appropriée. Cet exemple suppose que le navigateur de l'utilisateur dispose déjà d'un modèle permettant de mapper les noms d'hôte des sites Web aux sujets.

Diagramme illustrant les étapes du cycle de vie de l'API Topics, depuis la visite d'un utilisateur sur un site Web jusqu'à l'affichage d'une annonce
Le diagramme du cycle de vie de l'API Topics décrit les étapes des actions de l'API d'un point de vue général.

Les appelants de l'API ne reçoivent que les thèmes qu'ils ont observés

L'un des objectifs de conception de l'API Topics est de permettre la publicité ciblée par centres d'intérêt sans partager d'informations avec plus d'entités qu'actuellement avec les cookies tiers. L'API Topics est conçue pour que les thèmes ne puissent être renvoyés que pour les appelants d'API qui les ont déjà observés, dans un délai limité. Un appelant d'API est considéré comme ayant observé un sujet pour un utilisateur s'il a appelé la méthode document.browsingTopics() dans le code inclus sur un site que l'API Topics a mappé à ce sujet.

L'API ne renvoie que les thèmes observés par l'appelant au cours des trois dernières epochs. Cela permet d'empêcher le partage d'informations sur l'utilisateur avec plus d'entités que les technologies remplacées par l'API (y compris les cookies tiers).

Le nombre de thèmes renvoyés dépend du nombre de thèmes que l'appelant de l'API a déjà observés et du nombre de thèmes disponibles pour l'utilisateur (par exemple, le nombre de semaines de données accumulées). Il est possible de renvoyer entre zéro et trois thèmes, car un seul thème peut être indiqué pour chacune des trois epochs récentes.

Pour en savoir plus sur l'utilisation et le test de l'API Topics, consultez le guide du développeur de l'API Topics.

Comment l'API réduit-t-elle le fingerprinting ?

L'API Topics propose plusieurs mécanismes qui empêchent de restaurer l'identification d'un grand nombre d'utilisateurs sur plusieurs sites en utilisant uniquement cette API:

  • Étant donné que la classification Topics fournit des thèmes plus généraux, chaque sujet doit être associé à un grand nombre d'utilisateurs. En fait, nous garantissons un nombre minimal d'utilisateurs par thème, car 5% du temps, le thème renvoyé est aléatoire.
  • Les thèmes sont renvoyés de manière aléatoire parmi les cinq premiers thèmes de l'utilisateur.
  • Si un utilisateur consulte fréquemment le même site (chaque semaine, par exemple), le code exécuté sur le site peut apprendre un nouveau sujet par semaine au maximum.
  • Plusieurs sites recevront des thèmes différents pour un même utilisateur au cours de la même epoch. Il y a une probabilité sur cinq que le thème renvoyé pour un utilisateur sur un site corresponde à celui renvoyé pour lui sur un autre site. Il est donc plus difficile de déterminer s'il s'agit du même utilisateur.
  • Les sujets sont mis à jour pour un utilisateur une fois par semaine, ce qui limite le taux de partage d'informations. En d'autres termes, l'API contribue à limiter le fingerprinting en ne fournissant pas trop de mises à jour des sujets.
  • Un sujet n'est renvoyé que pour un appelant d'API ayant précédemment observé le même sujet pour le même utilisateur récemment. Cette approche permet de limiter le potentiel des entités d'apprendre (ou de partager) des informations sur les centres d'intérêt des utilisateurs qu'elles n'ont pas observées de leur côté.

Comment l'API a répondu aux préoccupations concernant FLoC

Lors de la phase d'évaluation de FLoC en 2021, de nombreux contributeurs ont reçu de nombreux commentaires de la part des contributeurs de l'écosystème Web et des technologies publicitaires. En particulier, certains craignaient que les cohortes FLoC ne puissent servir de surface de fingerprinting pour identifier les utilisateurs ou qu'ils ne puissent révéler l'association d'un utilisateur à une catégorie sensible. Nous avons également demandé à ce que FLoC soit plus transparent et compréhensible pour les utilisateurs.

L'API Topics a été conçue en tenant compte de ces commentaires. Elle vise à explorer d'autres façons de soutenir la publicité ciblée par centres d'intérêt, avec une meilleure transparence, des contrôles plus stricts de la confidentialité et une approche différente pour les catégories sensibles.

Étapes suivantes

En savoir plus sur les thèmes et leur fonctionnement

Si vous êtes un développeur ad tech, testez l'API Topics et participez-y. Pour accéder à des ressources plus détaillées, consultez le guide du développeur.

Interagir et partager des commentaires