关于此文档
阅读本文档后,您将能够:
- 在生成摘要报告之前,了解要创建哪些策略。
- 了解 Noise Lab,这是一款有助于了解各种噪声参数影响的工具,可让您快速探索和评估各种噪声管理策略。

分享反馈
虽然本文档总结了一些关于使用摘要报告的原则,但可能未涵盖多种噪声管理方法。欢迎您提出建议、补充内容和问题!
- 如需就噪声管理策略、API 的实用性或隐私性 (epsilon) 提供公开反馈,以及分享使用 Noise Lab 进行模拟时的观察结果,请执行以下操作:对此问题发表评论
- 如需对 Noise Lab 提供公开反馈(提问、报告 bug、请求功能),请点击此处创建新问题
- 如需针对 API 的其他方面提供公开反馈,请执行以下操作:点击此处创建新问题
前期准备
- 如需了解相关信息,请参阅归因报告:摘要报告和归因报告完整系统概览。
- 请参阅了解噪声和了解汇总键,以便充分利用本指南。
设计决策
核心设计原则
第三方 Cookie 和摘要报告的运作方式存在根本差异。一个关键区别是,摘要报告中的衡量数据会添加噪声。另一个是报告的安排方式。
为了获取信噪比更高的摘要报告效果衡量数据,需求方平台 (DSP) 和广告效果衡量服务提供商需要与广告客户合作制定噪声管理策略。为了制定这些策略,DSP 和衡量服务提供商需要做出设计决策。这些决策围绕一个基本概念展开:
虽然从严格意义上讲,用于生成分布噪声值的参数只有两个(即 epsilon 和贡献预算),但您还可以使用多种其他控件来影响输出衡量数据的信噪比。
虽然我们希望迭代过程能带来最佳决策,但这些决策的每种变体都会导致略有不同的实现,因此必须在编写每次代码迭代(以及投放广告)之前做出这些决策。
决定:维度粒度
在噪声实验室中试用
- 切换到高级模式。
- 在“参数”侧边栏中,找到“您的转化数据”。
- 观察默认参数。默认情况下,每天可获得的已归因转化次数总计为 1, 000 次。如果您使用默认设置(默认维度、每个维度的默认可能不同值数量、关键字策略 A),则每个存储分区的平均值约为 40 个。请注意,输入的“每个存储分区每天可归因的转化次数的平均值”的值为 40。
- 点击“模拟”以使用默认参数运行模拟。
- 在“参数”侧边栏中,查找“维度”。将地理位置重命名为城市,并将可能的不同值的数量更改为 50。
- 观察这会如何改变每个存储分区的平均每日归因转化次数。现在已经降低了很多。这是因为,如果您增加此维度中的可能值数量,而不更改任何其他内容,则会增加分桶的总数,而不会更改每个分桶中包含的转化事件数量。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率:噪声比率现在高于上一个模拟的噪声比率。
根据核心设计原则,与较大的汇总值相比,较小的汇总值可能会产生更多噪声。因此,您的配置选择会影响最终每个存储分区(也称为汇总键)中归因的转化事件的数量,而该数量会影响最终输出摘要报告中的噪声。
影响单个存储分区中归因转化事件数量的一个设计决策是维度粒度。请参考以下汇总键及其维度的示例:
- 方法 1:一个包含粗略维度的关键结构:国家/地区 x 广告系列(或最大的广告系列汇总分桶)x 产品类型(10 种可能的产品类型中的一种)
- 方法 2:一个包含精细维度的键结构:城市 x 广告素材 ID x 商品(100 种可能的商品)
城市比国家/地区更精细;广告素材 ID比广告系列更精细;商品比商品类型更精细。因此,与方法 1 相比,方法 2 在摘要报告输出中,每个存储分区(即每个键)的事件(转化)数量会更少。由于添加到输出中的噪声与存储分区中的事件数量无关,因此采用方法 2 时,摘要报告中的衡量数据将更具噪声。对于每个广告客户,请在键的设计中尝试各种粒度权衡,以便最大限度地提高结果的实用性。
决策:关键结构
在噪声实验室中试用
在“简单”模式下,系统会使用默认的键结构。在“高级”模式下,您可以尝试使用不同的键结构。其中包含一些示例维度;您也可以对这些维度进行修改。
- 切换到高级模式。
- 在“参数”侧边栏中,找到“关键策略”。请注意,默认策略(在该工具中称为“A”)使用一个包含所有维度的精细键结构:地理位置 x 广告系列 ID x 产品类别。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率。
- 将“关键字”策略更改为“B”。系统随即会显示其他控件,以便您配置密钥结构。
- 配置密钥结构,例如:
- 关键结构数量:2
- 键结构 1 = 地理位置 x 商品类别。
- 键结构 2 = 广告系列 ID x 商品类别。
- 点击“模拟”。
- 请注意,由于您使用了两个不同的键结构,因此现在每个衡量目标类型都会生成两个摘要报告(两个购买次数报告,两个购买金额报告)。观察其噪声比率。
- 您也可以尝试使用自己的自定义维度来实现此目的。为此,请查找“要跟踪的数据:维度”。不妨移除示例维度,并使用最后一个维度下方的“添加/移除/重置”按钮创建自己的维度。
另一个会影响单个存储分区内归因转化事件数量的设计决策是您决定使用的键结构。请考虑以下汇总键示例:
- 一个包含所有维度的键结构;我们将其称为“键策略 A”。
- 两个键结构,每个键结构包含一组维度;我们将其称为“键策略 B”。

策略 A 更简单,但您可能需要对摘要报告中包含的噪声摘要值进行汇总(求和),才能获取某些数据洞见。通过对这些值进行求和,您也将噪声进行求和。如果采用策略 B,摘要报告中显示的摘要值可能已经包含您需要的信息。这意味着,与策略 A 相比,策略 B 可能会带来更好的信噪比。不过,策略 A 的噪声可能已经可以接受,因此您可能仍会出于简单起见而选择策略 A。通过概述这两种策略的详细示例了解详情。
密钥管理是一个深奥的主题。您可以考虑使用多种精细的技术来提高信噪比。高级密钥管理中介绍了其中一种方法。
决策:批处理频率
在噪声实验室中试用
- 切换到“简单”模式(或“高级”模式,这两种模式在批处理频率方面的工作方式相同)
- 在“参数”侧边栏中,依次选择“汇总策略”>“批处理频率”。这指的是单个作业中使用汇总服务处理的可汇总报告的批处理频率。
- 观察默认批处理频率:默认情况下,系统会模拟每天一次的批处理频率。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率。
- 将批处理频率更改为每周。
- 观察生成的模拟的噪声比率:噪声比率现在比上一次模拟更低(更好)。
另一个会影响单个存储分区中归因转化事件数量的设计决策是您决定使用的批处理频率。批处理频率是指您处理可汇总报告的频率。
与汇总时间间隔较长(例如每周)的同一报告相比,汇总时间间隔较短(例如每小时)的报告中包含的转化事件会更少。因此,每小时报告中会包含更多噪声。与汇总时间间隔较长(例如每周)的同一报告相比,每小时报告包含的转化事件更少。因此,在所有其他条件不变的情况下,每小时报告的信噪比将低于每周报告。尝试采用不同频率的报告要求,并评估每种报告要求的信噪比。
如需了解详情,请参阅批处理和对更长时间段进行汇总。
决策:影响归因转化的广告系列变量
在噪声实验室中试用
虽然这可能难以预测,并且除了季节性影响之外,还可能存在显著差异,但请尝试估算每日可归因于单次触达的转化次数,并将其估算为最接近的 10 的幂:10、100、1,000 或 10,000。
- 切换到高级模式。
- 在“参数”侧边栏中,找到“您的转化数据”。
- 观察默认参数。默认情况下,每天可获得的已归因转化次数总计为 1, 000 次。如果您使用默认设置(默认维度、每个维度的默认可能不同值数量、关键字策略 A),则每个存储分区的平均值约为 40 个。请注意,输入的“每个存储分区每天可归因的转化次数的平均值”的值为 40。
- 点击“模拟”以使用默认参数运行模拟。
- 观察生成的模拟结果的噪声比率。
- 现在,将每天可归因的转化总数设置为 100。 请注意,这会降低“每个存储分区的平均每日归因转化次数”的值。
- 点击“模拟”。
- 请注意,噪声比率现在更高:这是因为,如果每个存储分区中的转化次数较少,系统会应用更多噪声来保护隐私。
一个重要的区别是,广告客户可能实现的转化总次数与可能实现的归因转化总次数。后者最终会影响摘要报告中的噪声。归因转化是总转化的一部分,容易受到广告系列变量(例如广告预算和广告定位)的影响。例如,在所有其他条件不变的情况下,您预计 1,000 万美元的广告系列获得的归因转化次数会比 1 万美元的广告系列多。
要考虑的事项:
- 针对单次触达、同设备归因模型评估归因转化,因为这些转化在使用 Attribution Reporting API 收集的摘要报告的范围内。
- 请同时考虑归因转化的最坏情况计数和最好情况计数。例如,在所有其他条件不变的情况下,考虑广告客户的可能最低和最高广告系列预算,然后预测这两种结果的可归因转化次数,将其作为模拟的输入。
- 如果您考虑使用 Android Privacy Sandbox,不妨考虑在计算中纳入跨平台归因转化。
决策:使用缩放
在噪声实验室中试用
- 切换到高级模式。
- 在“参数”侧边栏中,依次选择“汇总策略”>“缩放”。默认情况下,此设置设为“是”。
- 为了了解缩放对噪声比率的积极影响,请先将“缩放”设置为“否”。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率。
- 将“缩放”设置为“是”。请注意,Noise Lab 会根据您场景的衡量目标范围(平均值和最大值)自动计算要使用的缩放比例。在真实系统或来源测试设置中,您需要自行实现缩放因子的计算。
- 点击“模拟”。
- 请注意,在第二个模拟中,噪声比率现在更低(更好)。这是因为您使用了缩放功能。
根据核心设计原则,添加的噪声是贡献预算的函数。
因此,为了提高信噪比,您可以决定根据贡献预算对转化事件期间收集的值进行缩放(并在汇总后对其进行反缩放)。使用放大功能提高信噪比。
决策:衡量目标数量和隐私预算分配
这与缩放有关;请务必阅读使用缩放。
在噪声实验室中试用
衡量目标是指在转化事件中收集的独特数据点。
- 切换到高级模式。
- 在“参数”侧边栏中,找到“要跟踪的数据:衡量目标”。默认情况下,您有两个衡量目标:购买金额和购买次数。
- 点击“模拟”以使用默认目标运行模拟。
- 点击“移除”。这会移除上一个衡量目标(在本例中为购买次数)。
- 点击“模拟”。
- 请注意,对于这第二次模拟,购买交易价值的噪声比率现在更低(更好)。这是因为您有较少的衡量目标,因此现在只有一个衡量目标会获得所有贡献预算。
- 点击“重置”。现在,您又有两个衡量目标:购买价值和购买次数。请注意,Noise Lab 会根据您场景的衡量目标范围(平均值和最大值)自动计算要使用的缩放比例。默认情况下,噪声实验室会将预算平均分配给各个衡量目标。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率。记下模拟中显示的缩放比例。
- 现在,我们来自定义隐私预算分配,以实现更好的信噪比。
- 调整为每个衡量目标分配的预算百分比。在默认参数下,衡量目标 1(即购买金额)的范围(介于 0 到 1000 之间)比衡量目标 2(即购买次数,介于 1 到 1 之间,即始终等于 1)要宽得多。因此,它需要“更多空间来扩展”:理想情况下,应为衡量目标 1 分配比衡量目标 2 更多的贡献预算,以便更高效地扩大其规模(请参阅“扩展”),从而
- 将 70% 的预算分配给衡量目标 1。将 30% 的权重分配给效果衡量目标 2。
- 点击“模拟”。
- 观察生成的模拟结果的噪声比率。对于购买价值,噪声比率现在明显低于(更好)之前的模拟结果。购买次数基本保持不变。
- 不断调整各指标的预算分配比例。观察这对噪声的影响。
请注意,您可以使用“添加”“移除”和“重置”按钮设置自己的自定义衡量目标。
如果您针对转化事件衡量一个数据点(衡量目标),例如转化次数,则该数据点可以获得所有贡献预算 (65536)。如果您为转化事件设置了多个衡量目标(例如转化次数和购买价值),则这些数据点需要共享贡献预算。这意味着,您在扩大价值时有更少的回旋余地。
因此,衡量目标越多,信噪比就可能越低(噪声越大)。
关于效果衡量目标,您还需要做出另一项决策,即预算分配。如果您将贡献预算平均分配给两个数据点,则每个数据点的预算为 65536/2 = 32768。这可能不是最佳值,具体取决于每个数据点的可能最大值。例如,如果您要衡量购买次数(最大值为 1)和购买价值(最小值为 1,最大值为 120),那么购买价值会因有“更多空间”而受益,也就是说,可以获得更大比例的贡献预算。您可以了解某些衡量目标是否应优先于其他目标,以及噪声的影响。
决策:离群值管理
在噪声实验室中试用
衡量目标是指在转化事件中收集的独特数据点。
- 切换到高级模式。
- 在“参数”侧边栏中,依次选择“汇总策略”>“缩放”。
- 确保将“缩放”设置为“是”。请注意,噪声实验室会根据您为衡量目标指定的范围(平均值和最大值)自动计算要使用的缩放因子。
- 假设有史以来的最大购买金额为 2, 000 美元,但大多数购买金额都在 10 到 120 美元之间。首先,我们来看看使用字面量缩放方法(不推荐)会出现什么情况:将 purchaseValue 的最大值输入为 2000 美元。
- 点击“模拟”。
- 请注意,噪声比率较高。这是因为我们的放大系数目前是基于 2, 000 美元计算的,而实际上,大多数购买交易的价值都会明显低于这个数值。
- 现在,我们来使用更实用的扩缩方法。将最高购买金额更改为 120 美元。
- 点击“模拟”。
- 请注意,在第二个模拟中,噪声比率更低(更好)。
如需实现放大,您通常需要根据给定转化事件的可能最大价值来计算放大系数(点击此示例了解详情)。
不过,请避免使用字面量最大值来计算该缩放因子,因为这会降低信噪比。而是移除离群值,并使用实用的最大值。
离群值管理是一个深奥的话题。您可以考虑使用多种精细的技术来提高信噪比。其中一种方法在高级离群值管理中有所介绍。
后续步骤
现在,您已针对自己的用例评估了各种噪声管理策略,接下来可以通过来源试用来收集真实的衡量数据,开始尝试使用摘要报告了。查看指南和提示,试用 API。
附录
Noise Lab 快速浏览
噪声实验室可帮助您快速评估和比较噪声管理策略。它可用于:
- 了解可能会影响噪声的主要参数及其影响。
- 在不同设计决策的情况下,模拟噪声对输出测量数据的影响。调整设计参数,直到达到适合您的用例的信噪比。
- 请分享您对摘要报告实用性的反馈:哪些 epsilon 和噪声参数值对您有用,哪些不有用?拐点在哪里?
您可以将其视为准备步骤。噪声实验室会根据您的输入生成衡量数据,以模拟摘要报告输出。它不会保留或分享任何数据。
噪声实验室中有两种不同的模式:
- 简单模式:了解可用于控制噪声的基本功能。
- 高级模式:测试不同的噪声管理策略,并评估哪种策略可为您的用例带来最佳信噪比。
点击顶部菜单中的按钮,即可在两种模式之间切换(下方屏幕截图中的 1.)。
简单模式
- 在“简单”模式下,您可以控制参数(位于左侧,或下方屏幕截图中的 2.),例如 Epsilon,并查看它们对噪声的影响。
- 每个参数都有一个提示(“?” 按钮)。点击这些图标可查看每个参数的说明(下方屏幕截图中的 3.)
- 首先,点击“模拟”按钮,然后观察输出结果(下方屏幕截图中的 4.)
- 在“输出”部分,您可以看到各种详细信息。某些元素旁边会显示“?”。请花些时间点击每个“?”,查看各种信息的说明。
- 如果您想查看表格的展开版本,请在“输出”部分中点击“详细信息”切换开关(下方屏幕截图中的 5.)
- 在“输出”部分的每个数据表格下方,都有一个用于下载表格以供离线使用的选项。此外,右下角还有一个用于下载所有数据表的选项(下方屏幕截图中的 6.)
- 在“参数”部分中测试参数的不同设置,然后点击“模拟”以查看这些设置对输出的影响:
适用于“简单”模式的 Noise Lab 界面。
高级模式
- 在“高级”模式下,您可以更好地控制参数。您可以添加自定义衡量目标和维度(下方屏幕截图中的 1. 和 2.)
- 在“参数”部分中向下滚动,然后查看“关键策略”选项。这可用于测试不同的键结构(下方屏幕截图中的 3.)
- 如需测试不同的键结构,请将“键策略”切换为“B”
- 输入您要使用的不同键结构的数量(默认设为“2”)
- 点击“生成密钥结构”
- 点击要为每个键结构添加的键旁边的复选框,您会看到用于指定键结构的选项
- 点击“模拟”以查看输出。
适用于“高级”模式的 Noise Lab 界面。 适用于高级模式的噪声实验室界面。
噪声指标
核心概念
系统会添加噪声,以保护具体用户的隐私。
噪声值较高表示存储分区/键稀疏,并且包含来自少数敏感事件的贡献。这项工作由 Noise Lab 自动完成,以便个人“隐身于人群中”,换句话说,通过添加更多噪声来保护这些少数个人的隐私。
噪声值较低表示数据设置的设计方式已允许个人“隐身于人群中”。这意味着,这些存储分区包含来自足够数量事件的贡献,以确保保护个人用户的隐私。
这对平均百分比误差 (APE) 和 RMSRE_T(设有阈值的均方根相对误差)都适用。
APE(平均百分比误差)
APE 是噪声与信号(即真实摘要值)的比率。p> APE 值越低,信噪比越高。
公式
对于给定的摘要报告,APE 的计算方式如下:

True 是真实的摘要值。APE 是每个真实摘要值的噪声的平均值,是摘要报告中所有条目的平均值。在噪声实验室中,此值会乘以 100 以得出百分比。
优缺点
较小的数据桶对 APE 的最终值有过度的影响。这可能会在评估噪声时产生误导。因此,我们添加了另一个指标 RMSRE_T,旨在缓解 APE 的这一限制。如需了解详情,请参阅示例。
代码
查看 APE 计算的源代码。
RMSRE_T(带有阈值的均方根相对误差)
RMSRE_T(带有阈值的均方根相对误差)是另一种噪声衡量指标。
如何解读 RMSRE_T
RMSRE_T 值越低,信噪比越高。
例如,如果您的用例可接受的噪声比率为 20%,而 RMSRE_T 为 0.2,则您可以确信噪声水平在可接受的范围内。
公式
对于给定的摘要报告,RMSRE_T 的计算方法如下:

优缺点
与 APE 相比,RMSRE_T 的理解稍微复杂一些。不过,在某些情况下,它具有一些优势,比 APE 更适合分析摘要报告中的噪声:
- RMSRE_T 更稳定。“T”是阈值。“T”用于在计算 RMSRE_T 时,对转化次数较少且因规模较小而对噪声更敏感的存储分区分配较低权重。使用 T 时,指标不会在转化次数较少的分桶中出现峰值。如果 T 等于 5,则转化次数为 0 的存储分区中的噪声值即使小到 1,也不会显示为远远超过 1。而是将其上限设为 0.2,即 1/5,因为 T 等于 5。通过为较小的存储分区分配较低权重(因此对噪声更敏感),此指标会更稳定,从而更便于比较两种模拟结果。
- RMSRE_T 支持轻松聚合。知道多个存储分区的 RMSRE_T 以及它们的真实计数后,您就可以计算其总和的 RMSRE_T。这样,您还可以针对这些组合值优化 RMSRE_T。
虽然 APE 可以汇总,但由于涉及拉普拉斯噪声总和的绝对值,因此公式非常复杂。这使得 APE 更难优化。
代码
查看 RMSRE_T 计算的源代码。
示例
摘要报告包含三个存储分区:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
包含三个存储分区的摘要报告:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
包含三个存储分区的摘要报告:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0.1 + 0.2 + Infinity) / 3 = Infinity
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
高级密钥管理
DSP 或广告效果衡量公司可能有数千个全球广告客户,他们分布在多个行业,使用多种货币,并且有不同的潜在购买价格。这意味着,为每个广告客户创建和管理一个汇总键可能非常不切实际。此外,要选择一个可聚合的最大值和聚合预算,以限制来自全球数千个广告客户的噪声影响,这将是一项艰巨的任务。我们不妨考虑以下场景:
关键策略 A
广告技术提供商决定为其所有广告客户创建和管理一个密钥。在所有广告客户和所有币种中,购买交易量范围从低量高端购买交易到高量低端购买交易不等。这会生成以下键:
键(多种货币) | |
---|---|
可汇总的最大值 | 5000000 |
购买价值范围 | [120 - 5000000] |
关键策略 B
广告技术提供商决定为其所有广告客户创建和管理两个密钥。他们决定按币种分隔键。在所有广告客户和所有币种中,购买交易量范围从低量高端购买交易到高量低端购买交易不等。按币种分隔,他们创建了 2 个键:
钥匙 1(美元) | 键 2(¥) | |
---|---|---|
可汇总的最大值 | $40000 | ¥5,000,000 |
购买价值范围 | [120 - 40,000] | [15,000 - 5,000,000] |
由于货币价值在不同货币之间并非均匀分布,因此关键策略 B 的结果中噪声较少。例如,请考虑以日元计价的购买交易与以美元计价的购买交易混合在一起会如何改变基础数据和由此产生的噪声输出。
关键策略 C
广告技术提供商决定为其所有广告客户创建和管理四个键,并按“币种 x 广告客户行业”对其进行分隔:
键 1 (美元 x 高端珠宝广告客户) |
键 2 (¥ x 高端珠宝广告客户) |
键 3 (美元 x 服装零售商广告客户) |
键 4 (¥ x 服装零售商广告客户) |
|
---|---|---|---|---|
可汇总的最大值 | $40000 | ¥5,000,000 | $500 | ¥65,000 |
购买价值范围 | [10,000 - 40,000] | [1,250,000 - 5,000,000] | [120 - 500] | [15,000 - 65,000] |
由于广告客户的购买价值并非在各广告客户之间均匀分布,因此关键策略 C 的结果中噪声较关键策略 B 少。例如,考虑一下高端珠宝购买交易与棒球帽购买交易混合在一起会如何改变底层数据并导致输出噪声。
考虑为多个广告客户的共性创建共享的最大汇总值和共享的放大系数,以减少输出中的噪声。例如,您可以为广告客户尝试以下不同的策略:
- 一个策略(以货币分隔,例如美元、日元、加元等)
- 按广告客户行业(保险、汽车、零售等)划分的单一策略
- 一个策略,以类似的购买价值范围([100]、[1000]、[10000] 等)分隔
通过围绕广告客户的共性特征制定关键策略,您可以更轻松地管理键和相应的代码,并提高信噪比。针对不同的广告客户共性,尝试不同的策略,以发现在最大限度地减少噪声影响与代码管理之间存在的拐点。
高级离群值管理
我们来看看以下涉及两位广告客户的场景:
- 广告客户 A:
- 广告客户 A 网站上的所有商品的可能购买价格介于 [$120 - $1,000] 之间,范围为 880 美元。
- 购买价格均匀分布在 880 美元范围内,且没有超出购买价格中位数两个标准差的离群值。
- 广告客户 B:
- 广告客户 B 网站上的所有商品的可能购买价格介于 [$120 - $1,000] 之间,范围为 880 美元。
- 购买价格严重偏向于 120 美元到 500 美元之间,只有 5% 的购买交易发生在 500 美元到 1,000 美元之间。
鉴于贡献预算要求以及对最终结果应用噪声的方法,默认情况下,广告客户 B 的输出噪声水平会高于广告客户 A,因为广告客户 B 的离群值更有可能影响底层计算。
您可以通过特定的密钥设置来缓解此问题。测试有助于管理离群值并在键的购买范围内更均匀地分配购买价值的关键策略。
对于广告客户 B,您可以创建两个单独的键来捕获两个不同的购买价值范围。在此示例中,广告技术平台注意到,购买金额超过 500 美元的值存在离群值。请尝试为此广告客户实现两个单独的键:
- 键结构 1:仅捕获 120 美元到 500 美元之间的购买交易(涵盖约 95% 的总购买交易量)。
- 键结构 2:仅捕获金额超过 500 美元的购买交易(涵盖约 5% 的总购买量)的键。
实施此关键策略应该可以更好地为广告客户 B 管理噪声,并帮助他们最大限度地利用摘要报告。由于范围缩小了,现在,与之前使用单个键相比,键 A 和键 B 中的数据在各自的键中分布应该更加均匀。这将导致每个键的输出噪声影响小于之前的单个键。