Tổng quan về Topics API cho Web

Topics API bật quảng cáo dựa trên mối quan tâm (IBA) mà không cần dùng đến tính năng theo dõi các trang web mà người dùng truy cập.

Trạng thái triển khai

Topics API là gì?

Topics API là một cơ chế Hộp cát về quyền riêng tư được thiết kế để bảo vệ quyền riêng tư, đồng thời cho phép trình duyệt chia sẻ thông tin với bên thứ ba về mối quan tâm của người dùng. AI của Google cho phép quảng cáo dựa trên mối quan tâm (IBA) mà không cần phải dùng đến việc theo dõi các trang web mà người dùng truy cập.

Quảng cáo dựa trên mối quan tâm là một khái niệm chính trong Topics API. Đó là một hình thức quảng cáo được cá nhân hoá, trong đó quảng cáo được chọn cho người dùng dựa trên mối quan tâm của họ, suy ra từ những trang web mà họ truy cập gần đây. Quảng cáo này khác với quảng cáo theo ngữ cảnh, vốn nhằm khớp quảng cáo với nội dung trên trang mà người dùng đang truy cập.

Quảng cáo dựa trên sở thích có thể giúp cả nhà quảng cáo (trang web muốn quảng cáo sản phẩm hoặc dịch vụ của họ) và nhà xuất bản (trang web sử dụng quảng cáo để giúp kiếm tiền từ nội dung của họ):

  • IBA có thể giúp nhà quảng cáo tiếp cận khách hàng tiềm năng.
  • IBA có thể bổ sung thông tin theo bối cảnh nhằm giúp nhà xuất bản sử dụng quảng cáo để trang web.

Topics API cung cấp một hình thức mới của quảng cáo dựa trên mối quan tâm bằng cách sử dụng các chủ đề (danh mục mối quan tâm) được chỉ định cho trình duyệt dựa trên hoạt động gần đây của người dùng. Những chủ đề này có thể bổ sung thông tin theo ngữ cảnh để giúp chọn quảng cáo thích hợp.

Cách hoạt động

Trước đây, cookie của bên thứ ba và các cơ chế khác được dùng để theo dõi hành vi duyệt web của người dùng trên các trang web nhằm suy ra những chủ đề mà người dùng quan tâm. Các cơ chế này sắp bị loại bỏ.

Nhờ Topics API, trình duyệt quan sát và ghi lại những chủ đề mà người dùng có thể quan tâm, dựa trên hoạt động duyệt web của họ. Thông tin này được ghi lại trên thiết bị của người dùng. Sau đó, Topics API có thể cấp cho phương thức gọi API (chẳng hạn như nền tảng công nghệ quảng cáo) truy cập vào các chủ đề mà người dùng quan tâm, nhưng không tiết lộ thêm thông tin về hoạt động duyệt web của người dùng.

Quan sát các chủ đề về đối tượng cấp trên

Kể từ Chrome 114, khi phương thức gọi quan sát một chủ đề cho người dùng trên một trang, trình duyệt cũng coi phương thức gọi đó quan sát tất cả đối tượng cấp trên của chủ đề đó.

Ví dụ: nếu trình duyệt ghi lại rằng một phương thức gọi quan sát Shopping/Apparel/Footwear/Boots đối với một người dùng, thì đối tượng cấp trên của chủ đề đó cũng được coi là đã được quan sát: Shopping/Apparel/Footwear, Shopping/ApparelShopping.

Trước đây, để phương thức gọi được trình duyệt xem là đã quan sát (ví dụ: Shopping/Apparel), chủ đề cụ thể đó phải được API trả về dưới dạng chủ đề đã quan sát được. Điều này có nghĩa là nếu Shopping/Apparel được quan sát thấy trên phương thức gọi của người dùng trên một trang và Shopping/Apparel/Footwear/Boots trên một trang khác, thì API sẽ coi Shopping/Apparel đã được quan sát trên cả hai trang.

Các thế

Tất nhiên, Topics API phải đảm bảo rằng các chủ đề mà API này cung cấp luôn được cập nhật. Trình duyệt dự đoán chủ đề cho người dùng dựa trên hoạt động duyệt web của họ trong một khoảng thời gian gọi là epoch (thời gian bắt đầu của hệ thống), hiện tại là một tuần. Mỗi người dùng có khoảng thời gian bắt đầu của hệ thống riêng (thời gian bắt đầu của hệ thống là "mỗi người dùng") và thời gian bắt đầu ban đầu được chọn ngẫu nhiên. Chủ đề được chọn cho mỗi thời gian bắt đầu của hệ thống sẽ được chọn ngẫu nhiên trong 5 chủ đề hàng đầu của người dùng trong khoảng thời gian đó. Để tăng cường hơn nữa quyền riêng tư và đảm bảo rằng tất cả các chủ đề đều được trình bày, có 5% cơ hội một chủ đề được chọn ngẫu nhiên trong số tất cả các chủ đề có thể có trong một cách phân loại mối quan tâm.

Topics API có 3 nhiệm vụ chính:

  • Liên kết hoạt động trên trình duyệt với các chủ đề mà bạn quan tâm. Với thiết kế hiện tại của Topics API, chủ đề được suy ra từ tên máy chủ của những trang mà người dùng truy cập. Ví dụ: chủ đề được suy ra cho một trang web về bể cá có thể là /Thú cưng & Động vật/Thú cưng/Cá & bể cá.
  • Tính toán các chủ đề hàng đầu cho người dùng dựa trên hoạt động duyệt web gần đây của họ.
  • Cung cấp cơ chế để truy cập vào các chủ đề mà người dùng hiện đang quan tâm, nhằm chọn quảng cáo phù hợp.

Topics API cung cấp các chủ đề mà con người có thể đọc được và dễ hiểu, nhờ vậy có thể cung cấp cho người dùng các chế độ kiểm soát hữu ích.

Cách hệ thống tuyển chọn và tuyển chọn chủ đề

Các chủ đề được chọn từ một hệ thống phân loại bao gồm các danh mục phân cấp như /Nghệ thuật và giải trí/Âm nhạc và âm thanh/Nhạc Soul và R&B/Doanh nghiệp và công nghiệp/Nông nghiệp. Những chủ đề này đã được Chrome chọn lọc cho thử nghiệm ban đầu, nhưng với mục tiêu là cách phân loại này trở thành tài nguyên được những người đóng góp đáng tin cậy trong hệ sinh thái duy trì. Cách phân loại phải đủ nhỏ để nhiều trình duyệt của người dùng sẽ được liên kết với từng chủ đề. Hiện tại, số lượng chủ đề là 469, nhưng chúng tôi dự kiến số lượng chủ đề cuối cùng sẽ nằm trong khoảng từ vài trăm đến vài nghìn.

Để tránh các danh mục nhạy cảm, các chủ đề phải được công khai, do con người chọn lọc và luôn là chủ đề mới nhất. Cách phân loại ban đầu mà Chrome đề xuất để thử nghiệm là do con người tuyển chọn để loại trừ các danh mục thường được coi là nhạy cảm, chẳng hạn như sắc tộc hoặc khuynh hướng tính dục.

Đối với 50.000 trang web hàng đầu, việc triển khai Topics API trong Chrome sử dụng danh sách ghi đè được tuyển chọn thủ công và có sẵn công khai để liên kết tên máy chủ với các chủ đề. Đối với các trang web khác, Topics API sử dụng mô hình học máy để dự đoán chủ đề từ tên máy chủ.

Quá trình Chrome triển khai Topics API sẽ tải tệp TensorFlow Lite đại diện cho mô hình xuống để có thể sử dụng cục bộ trên thiết bị của người dùng.

Bạn có thể truy cập vào tệp mô hình TensorFlow Lite và các chủ đề được suy ra cho tên máy chủ từ chrome://topics-internals.

Sơ đồ dưới đây cho thấy một ví dụ đơn giản để minh hoạ cách Topics API có thể giúp nền tảng công nghệ quảng cáo chọn quảng cáo phù hợp. Ví dụ giả định rằng trình duyệt của người dùng đã có mô hình để liên kết tên máy chủ của trang web với các chủ đề.

Sơ đồ cho thấy các giai đoạn trong vòng đời của Topics API, từ khi người dùng truy cập vào trang web cho đến lúc quảng cáo đang xuất hiện.
Sơ đồ vòng đời của API Chủ đề trình bày các giai đoạn của hành động đối với API từ góc nhìn tổng quan.

Phương thức gọi API chỉ nhận được các chủ đề mà họ quan sát thấy

Mục tiêu thiết kế của Topics API là cho phép quảng cáo dựa trên mối quan tâm mà không cần chia sẻ thông tin với nhiều thực thể hơn mức hiện có với cookie của bên thứ ba. Topics API được thiết kế để chỉ trả về các chủ đề cho phương thức gọi API đã quan sát chúng trong một khung thời gian giới hạn. Lệnh gọi API được cho là đã quan sát thấy một chủ đề cho người dùng nếu phương thức đó gọi phương thức document.browsingTopics() trong mã có trên trang web mà Topics API đã ánh xạ tới chủ đề đó.

API chỉ trả về các chủ đề mà phương thức gọi đã quan sát được trong 3 khoảng thời gian bắt đầu của hệ thống gần đây nhất. Điều này giúp ngăn thông tin về người dùng bị chia sẻ với nhiều thực thể hơn so với công nghệ mà API sẽ thay thế (bao gồm cả cookie của bên thứ ba).

Số lượng chủ đề được trả về tuỳ thuộc vào số lượng chủ đề mà phương thức gọi API đã quan sát trước đó và số lượng chủ đề mà người dùng có sẵn (chẳng hạn như số tuần dữ liệu tích luỹ được). Bất cứ khi nào có thể trả về từ 0 đến 3 chủ đề, vì có thể chỉ ra một chủ đề cho từng khoảng thời gian trong số 3 khoảng thời gian bắt đầu của hệ thống gần đây

Để biết thêm thông tin về cách sử dụng và kiểm thử Topics API, hãy tham khảo Hướng dẫn cho nhà phát triển về Topics API.

Cách API giảm dấu vân tay

Topics API cung cấp nhiều cơ chế để giúp đảm bảo rằng khó có thể xác định lại số lượng người dùng đáng kể trên các trang web chỉ sử dụng Topics API:

  • Do phân loại Chủ đề cung cấp các chủ đề tương đối chi tiết, nên mỗi chủ đề dự kiến sẽ có một số lượng lớn người dùng. Trên thực tế, chúng tôi đảm bảo sẽ đảm bảo số lượng người dùng tối thiểu cho mỗi chủ đề, vì 5% thời gian chủ đề được trả về là ngẫu nhiên.
  • Các chủ đề được trả về ngẫu nhiên trong 5 chủ đề hàng đầu của người dùng.
  • Nếu người dùng thường xuyên truy cập vào cùng một trang web (ví dụ: hằng tuần) chạy trên trang web có thể học nhiều nhất một chủ đề mới mỗi tuần.
  • Các trang web khác nhau sẽ nhận được các chủ đề khác nhau cho cùng một người dùng trong cùng một khoảng thời gian bắt đầu của hệ thống. Chỉ có 1 trong 5 cơ hội để chủ đề được trả về cho người dùng trên một trang web khớp với chủ đề được trả về cho người dùng trên một trang web khác. Nhờ vậy, bạn sẽ khó xác định xem họ có phải là cùng một người dùng hay không.
  • Chủ đề được cập nhật cho người dùng mỗi tuần một lần. Điều này giới hạn tốc độ chia sẻ thông tin. Nói cách khác, API này giúp giảm thiểu việc tạo vân tay số bằng cách không cập nhật chủ đề quá thường xuyên.
  • Một chủ đề sẽ chỉ được trả về cho phương thức gọi API trước đó đã quan sát thấy cùng một chủ đề cho cùng một người dùng gần đây. Phương pháp này giúp hạn chế khả năng các thực thể tìm hiểu (hoặc chia sẻ) thông tin về mối quan tâm của người dùng mà họ chưa trực tiếp quan sát được.

Cách API giải quyết các mối lo ngại với FLoC

Bản dùng thử theo nguyên gốc của FLoC vào năm 2021 đã nhận được nhiều ý kiến phản hồi từ những người đóng góp vào hệ sinh thái web và công nghệ quảng cáo. Cụ thể, ý kiến lo ngại rằng các nhóm thuần tập FLoC có thể được dùng làm nền tảng tạo vân tay số để nhận dạng người dùng hoặc có thể tiết lộ mối liên hệ của người dùng với một danh mục nhạy cảm. Ngoài ra, chúng tôi còn đưa ra các lời kêu gọi để làm cho FLoC minh bạch và dễ hiểu hơn đối với người dùng.

Topics API được thiết kế theo ý kiến phản hồi này. Sáng kiến này nhằm khám phá những cách khác để hỗ trợ hoạt động quảng cáo dựa trên mối quan tâm, như tính minh bạch được cải thiện, khả năng đảm bảo quyền riêng tư mạnh mẽ hơn và cách tiếp cận khác đối với các danh mục nhạy cảm.

Các bước tiếp theo

Tìm hiểu thêm về chủ đề là gì và cách hoạt động của chúng.

Nếu bạn là nhà phát triển công nghệ quảng cáo, hãy thử nghiệm và tham gia bằng Topics API. Đọc hướng dẫn cho nhà phát triển để biết thêm tài nguyên chuyên sâu.

Thu hút và chia sẻ ý kiến phản hồi