Tentang dokumen ini
Dengan membaca dokumen ini, Anda akan:
- Pahami strategi yang harus dibuat sebelum membuat laporan ringkasan.
- Kenali Noise Lab, alat yang membantu memahami efek berbagai parameter derau, dan memungkinkan eksplorasi dan penilaian cepat terhadap berbagai strategi pengelolaan derau.

Beri masukan
Meskipun dokumen ini merangkum beberapa prinsip untuk menggunakan laporan ringkasan, ada beberapa pendekatan untuk pengelolaan derau yang mungkin tidak tercermin di sini. Saran, tambahan, dan pertanyaan Anda sangat kami harapkan.
- Untuk memberikan masukan publik tentang strategi pengelolaan derau, tentang utilitas atau privasi API (epsilon), dan untuk membagikan pengamatan Anda saat melakukan simulasi dengan Noise Lab: Beri komentar pada masalah ini
- Untuk memberikan masukan publik di Noise Lab (ajukan pertanyaan, laporkan bug, minta fitur): Buat masalah baru di sini
- Untuk memberikan masukan publik tentang aspek lain API: Buat masalah baru di sini
Sebelum memulai
- Baca Pelaporan Atribusi: laporan ringkasan dan Ringkasan sistem lengkap Pelaporan Atribusi untuk mengetahui pengantarnya.
- Baca Memahami derau dan Memahami kunci agregasi untuk mendapatkan hasil maksimal dari panduan ini.
Keputusan desain
Prinsip desain inti
Ada perbedaan mendasar antara cara kerja cookie pihak ketiga dan laporan ringkasan. Satu perbedaan utamanya adalah derau yang ditambahkan ke data pengukuran dalam laporan ringkasan. Hal lainnya adalah cara laporan dijadwalkan.
Untuk mengakses data pengukuran laporan ringkasan dengan rasio sinyal-derau yang lebih tinggi, platform sisi permintaan (DSP) dan penyedia pengukuran iklan harus bekerja sama dengan pengiklan mereka untuk mengembangkan strategi pengelolaan derau. Untuk mengembangkan strategi ini, DSP dan penyedia pengukuran perlu membuat keputusan desain. Keputusan ini berputar di sekitar satu konsep penting:
Meskipun nilai derau distribusi diambil dari, secara mutlak, hanya bergantung pada dua parameter⏤epsilon dan anggaran kontribusi⏤Anda memiliki sejumlah kontrol lain yang akan memengaruhi rasio sinyal-derau data pengukuran output Anda.
Meskipun kami berharap proses iteratif akan menghasilkan keputusan terbaik, setiap variasi pada keputusan ini akan menyebabkan implementasi yang sedikit berbeda—sehingga keputusan ini harus diambil sebelum menulis setiap iterasi kode (dan sebelum menjalankan iklan).
Keputusan: Tingkat perincian dimensi
Coba di Noise Lab
- Buka Mode lanjutan.
- Di panel samping Parameter, cari Data konversi Anda.
- Amati parameter default. Secara default, TOTAL jumlah konversi harian yang diatribusikan adalah 1.000. Rata-ratanya sekitar 40 per bucket jika Anda menggunakan penyiapan default (dimensi default, jumlah default dari kemungkinan nilai yang berbeda untuk setiap dimensi, Strategi kunci A). Perhatikan bahwa nilainya adalah 40 di input Jumlah konversi harian yang dapat diatribusikan rata-rata per bucket.
- Klik Simulasi untuk menjalankan simulasi dengan parameter default.
- Di panel samping Parameters, cari Dimensions. Ganti nama Geography menjadi City dan ubah jumlah kemungkinan nilai yang berbeda menjadi 50.
- Amati bagaimana hal ini mengubah jumlah Konversi harian yang diatribusikan rata-rata PER BUCKET. Sekarang, biayanya jauh lebih rendah. Hal ini karena jika Anda meningkatkan jumlah kemungkinan nilai dalam dimensi ini tanpa mengubah hal lain, Anda akan meningkatkan jumlah total bucket tanpa mengubah jumlah peristiwa konversi yang akan masuk dalam setiap bucket.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan: rasio derau kini lebih tinggi daripada simulasi sebelumnya.
Mengingat prinsip desain inti, nilai ringkasan kecil cenderung lebih berisi derau daripada nilai ringkasan besar. Oleh karena itu, pilihan konfigurasi Anda memengaruhi jumlah peristiwa konversi yang diatribusikan yang berakhir di setiap bucket (atau disebut sebagai kunci agregasi), dan jumlah tersebut memengaruhi derau dalam laporan ringkasan output akhir.
Salah satu keputusan desain yang memengaruhi jumlah peristiwa konversi yang diatribusikan dalam satu bucket adalah perincian dimensi. Perhatikan contoh kunci agregasi berikut dan dimensinya:
- Pendekatan 1: satu struktur utama dengan dimensi kasar: Negara x Kampanye Iklan (atau bucket agregasi kampanye terbesar) x Jenis Produk (dari 10 kemungkinan jenis produk)
- Pendekatan 2: satu struktur utama dengan dimensi terperinci: Kota x ID Materi Iklan x Produk (dari 100 kemungkinan produk)
Kota adalah dimensi yang lebih terperinci daripada Negara; ID Materi Iklan lebih terperinci daripada Kampanye; dan Produk lebih terperinci daripada Jenis produk. Oleh karena itu, Pendekatan 2 akan memiliki jumlah peristiwa (konversi) per bucket (= per kunci) yang lebih rendah dalam output laporan ringkasannya dibandingkan Pendekatan 1. Mengingat derau yang ditambahkan ke output tidak bergantung pada jumlah peristiwa dalam bucket, data pengukuran dalam laporan ringkasan akan lebih berisi derau dengan Pendekatan 2. Untuk setiap pengiklan, bereksperimenlah dengan berbagai kompromi tingkat perincian dalam desain kunci untuk mendapatkan utilitas maksimum dalam hasilnya.
Keputusan: Struktur utama
Coba di Noise Lab
Dalam mode Sederhana, struktur kunci default digunakan. Dalam mode Advanced, Anda dapat bereksperimen dengan berbagai struktur kunci. Beberapa contoh dimensi disertakan; Anda juga dapat mengubahnya.
- Buka Mode lanjutan.
- Di panel samping Parameters, cari Key strategy. Perhatikan bahwa strategi default, yang diberi nama A di alat ini, menggunakan satu struktur kunci terperinci yang mencakup semua dimensi: Geografi x ID Kampanye x Kategori produk.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan.
- Ubah strategi Kunci menjadi B. Tindakan ini akan menampilkan kontrol tambahan untuk mengonfigurasi struktur kunci.
- Konfigurasikan struktur kunci Anda, misalnya sebagai berikut:
- Jumlah struktur utama: 2
- Struktur utama 1 = Geografi x Kategori produk.
- Struktur kunci 2 = ID kampanye x Kategori produk.
- Klik Simulasikan.
- Perhatikan bahwa Anda sekarang mendapatkan dua laporan ringkasan per jenis sasaran pengukuran (dua untuk jumlah pembelian, dua untuk nilai pembelian), mengingat Anda menggunakan dua struktur kunci yang berbeda. Amati rasio deraunya.
- Anda juga dapat mencobanya dengan dimensi kustom Anda sendiri. Untuk melakukannya, cari Data yang ingin Anda lacak: Dimensi. Pertimbangkan untuk menghapus dimensi contoh, dan membuat dimensi Anda sendiri menggunakan tombol Tambahkan/Hapus/Reset di bawah dimensi terakhir.
Keputusan desain lain yang akan memengaruhi jumlah peristiwa konversi yang diatribusikan dalam satu bucket adalah struktur kunci yang Anda pilih untuk digunakan. Perhatikan contoh kunci agregasi berikut:
- Satu struktur kunci dengan semua dimensi; sebut saja ini Strategi Kunci A.
- Dua struktur utama, masing-masing dengan subset dimensi; sebut saja ini Strategi Utama B.

Strategi A lebih sederhana, tetapi Anda mungkin perlu menggabungkan (menjumlahkan) nilai ringkasan yang berisi laporan ringkasan yang berisi derau untuk mengakses insight tertentu. Dengan menjumlahkan nilai ini, Anda juga menjumlahkan derau. Dengan Strategi B, nilai ringkasan yang ditampilkan dalam laporan ringkasan mungkin sudah memberi Anda informasi yang diperlukan. Artinya, Strategi B kemungkinan akan menghasilkan rasio sinyal-derau yang lebih baik daripada Strategi A. Namun, derau mungkin sudah dapat diterima dengan Strategi A, sehingga Anda mungkin masih memutuskan untuk memilih Strategi A agar lebih sederhana. Pelajari lebih lanjut dalam contoh mendetail yang menguraikan kedua strategi ini.
Pengelolaan kunci adalah topik yang mendalam. Sejumlah teknik rumit dapat dipertimbangkan untuk meningkatkan rasio sinyal-derau. Salah satunya dijelaskan dalam Pengelolaan kunci lanjutan.
Keputusan: Frekuensi pengelompokan
Coba di Noise Lab
- Buka mode Sederhana (atau mode Lanjutan — kedua mode tersebut berfungsi dengan cara yang sama terkait frekuensi pengelompokan)
- Di panel samping Parameter, cari Strategi agregasi Anda > Frekuensi pengelompokan. Ini mengacu pada frekuensi pengelompokan laporan agregat yang diproses dengan layanan agregasi dalam satu tugas.
- Amati frekuensi pengelompokan default: secara default, frekuensi pengelompokan harian disimulasikan.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan.
- Ubah frekuensi pengelompokan menjadi mingguan.
- Amati rasio derau dari simulasi yang dihasilkan: rasio derau sekarang lebih rendah (lebih baik) daripada simulasi sebelumnya.
Keputusan desain lain yang akan memengaruhi jumlah peristiwa konversi yang diatribusikan dalam satu bucket adalah frekuensi pengelompokan yang Anda pilih untuk digunakan. Frekuensi pengelompokan adalah seberapa sering Anda memproses laporan gabungan.
Laporan yang dijadwalkan untuk agregasi lebih sering (misalnya, setiap jam) akan menyertakan lebih sedikit peristiwa konversi daripada laporan yang sama dengan jadwal agregasi yang lebih jarang (misalnya, setiap minggu). Akibatnya, laporan per jam akan menyertakan lebih banyak derau.``` memiliki lebih sedikit peristiwa konversi yang disertakan daripada laporan yang sama dengan jadwal agregasi yang kurang sering (misalnya, setiap minggu). Akibatnya, laporan per jam akan memiliki rasio sinyal-derau yang lebih rendah daripada laporan mingguan, dengan asumsi hal lainnya tetap sama. Bereksperimenlah dengan persyaratan pelaporan pada berbagai frekuensi, dan nilaikan rasio sinyal-derau untuk setiap frekuensi.
Pelajari lebih lanjut di artikel Pengelompokan dan Penggabungan selama jangka waktu yang lebih lama.
Keputusan: Variabel kampanye yang memengaruhi konversi yang diatribusikan
Coba di Noise Lab
Meskipun hal ini sulit diprediksi dan dapat memiliki variasi yang signifikan, selain efek musiman, coba estimasi jumlah konversi harian yang diatribusikan ke satu sentuhan ke pangkat 10 terdekat: 10, 100, 1.000, atau 10.000.
- Buka Mode lanjutan.
- Di panel samping Parameter, cari Data konversi Anda.
- Amati parameter default. Secara default, TOTAL jumlah konversi harian yang diatribusikan adalah 1.000. Rata-ratanya sekitar 40 per bucket jika Anda menggunakan penyiapan default (dimensi default, jumlah default dari kemungkinan nilai yang berbeda untuk setiap dimensi, Strategi kunci A). Perhatikan bahwa nilainya adalah 40 di input Jumlah konversi harian yang dapat diatribusikan rata-rata per bucket.
- Klik Simulasi untuk menjalankan simulasi dengan parameter default.
- Amati rasio derau dari simulasi yang dihasilkan.
- Sekarang, tetapkan TOTAL jumlah konversi harian yang dapat diatribusikan ke 100. Perhatikan bahwa hal ini menurunkan nilai Jumlah konversi harian rata-rata yang dapat diatribusikan PER BUCKET.
- Klik Simulasikan.
- Perhatikan bahwa rasio derau kini lebih tinggi: hal ini karena jika Anda memiliki lebih sedikit konversi per bucket, lebih banyak derau yang diterapkan untuk mempertahankan privasi.
Perbedaan penting adalah total jumlah kemungkinan konversi untuk pengiklan, vs. total jumlah kemungkinan konversi yang diatribusikan. Yang terakhir adalah yang pada akhirnya memengaruhi derau dalam laporan ringkasan. Konversi yang diatribusikan adalah subkumpulan dari total konversi yang rentan terhadap variabel kampanye, seperti anggaran iklan dan penargetan iklan. Misalnya, Anda akan mengharapkan jumlah konversi yang diatribusikan lebih tinggi untuk kampanye iklan senilai $10 juta dibandingkan kampanye iklan senilai $10 ribu, dengan asumsi semua hal lainnya sama.
Hal yang perlu diperhatikan:
- Nilai konversi yang diatribusikan terhadap model atribusi perangkat yang sama dan satu sentuhan, karena berada dalam cakupan laporan ringkasan yang dikumpulkan dengan Attribution Reporting API.
- Pertimbangkan jumlah skenario terburuk dan jumlah skenario terbaik untuk konversi yang diatribusikan. Misalnya, jika semua hal lainnya sama, pertimbangkan anggaran kampanye minimum dan maksimum yang mungkin untuk pengiklan, lalu proyeksikan konversi yang dapat diatribusikan untuk kedua hasil tersebut sebagai input ke dalam simulasi Anda.
- Jika Anda mempertimbangkan untuk menggunakan Privacy Sandbox Android, pertimbangkan konversi yang diatribusikan lintas platform dalam penghitungan.
Keputusan: Menggunakan penskalaan
Coba di Noise Lab
- Buka Mode lanjutan.
- Di panel samping Parameter, cari Strategi agregasi Anda > Penskalaan. Setelan ini ditetapkan ke Ya secara default.
- Untuk memahami efek positif penskalaan pada rasio derau, tetapkan Penskalaan ke Tidak terlebih dahulu.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan.
- Tetapkan Penskalaan ke Ya. Perhatikan bahwa Noise Lab secara otomatis menghitung faktor penskalaan yang akan digunakan berdasarkan rentang (nilai rata-rata dan maksimum) sasaran pengukuran untuk skenario Anda. Dalam penyiapan uji coba origin atau sistem yang sebenarnya, Anda sebaiknya menerapkan penghitungan Anda sendiri untuk faktor penskalaan.
- Klik Simulasikan.
- Perhatikan bahwa rasio derau kini lebih rendah (lebih baik) dalam simulasi kedua ini. Hal ini karena Anda menggunakan penskalaan.
Dengan prinsip desain inti, derau yang ditambahkan adalah fungsi dari anggaran kontribusi.
Oleh karena itu, untuk meningkatkan rasio sinyal-derau, Anda dapat memutuskan untuk mengubah nilai yang dikumpulkan selama peristiwa konversi dengan melakukan penskalaan terhadap anggaran kontribusi (dan melakukan penskalaan balik setelah agregasi). Gunakan penskalaan untuk meningkatkan rasio sinyal-derau.
Keputusan: Jumlah sasaran pengukuran, dan pembagian anggaran privasi
Hal ini berkaitan dengan Penskalaan; pastikan untuk membaca Menggunakan penskalaan.
Coba di Noise Lab
Sasaran pengukuran adalah titik data yang berbeda yang dikumpulkan dalam peristiwa konversi.
- Buka Mode lanjutan.
- Di panel samping Parameters, cari Data yang ingin Anda lacak: Measurement goals. Secara default, Anda memiliki dua sasaran pengukuran: purchase value dan purchase count.
- Klik Simulasikan untuk menjalankan simulasi dengan sasaran default.
- Klik Hapus. Tindakan ini akan menghapus sasaran pengukuran terakhir (jumlah pembelian dalam hal ini).
- Klik Simulasikan.
- Perhatikan bahwa rasio derau untuk nilai pembelian kini lebih rendah (lebih baik) untuk simulasi kedua ini. Hal ini karena Anda memiliki lebih sedikit sasaran pengukuran, sehingga satu sasaran pengukuran Anda kini mendapatkan semua anggaran kontribusi.
- Klik Reset. Sekarang Anda kembali memiliki dua sasaran pengukuran: nilai pembelian dan jumlah pembelian. Perhatikan bahwa Noise Lab secara otomatis menghitung faktor penskalaan yang akan digunakan berdasarkan rentang (nilai rata-rata dan maksimum) dari sasaran pengukuran untuk skenario Anda. Secara default, Noise Lab membagi anggaran secara merata di seluruh sasaran pengukuran.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan. Perhatikan faktor penskalaan yang ditampilkan pada simulasi.
- Sekarang, mari kita sesuaikan pembagian anggaran privasi untuk mendapatkan rasio sinyal-derau yang lebih baik.
- Sesuaikan % Anggaran yang ditetapkan untuk setiap sasaran pengukuran. Dengan parameter default, Sasaran pengukuran 1, yaitu nilai pembelian, memiliki rentang yang jauh lebih luas (antara 0 dan 1.000) daripada Sasaran pengukuran 2, yaitu jumlah pembelian (antara 1 dan 1, yaitu selalu sama dengan 1). Oleh karena itu, sasaran ini memerlukan "lebih banyak ruang untuk diskalakan": sebaiknya tetapkan lebih banyak anggaran kontribusi ke Sasaran pengukuran 1 daripada Sasaran pengukuran 2, sehingga sasaran tersebut dapat diskalakan secara lebih efisien (lihat Penskalaan), dan dengan demikian
- Tetapkan 70% anggaran ke Sasaran pengukuran 1. Tetapkan 30% ke Sasaran pengukuran 2.
- Klik Simulasikan.
- Amati rasio derau dari simulasi yang dihasilkan. Untuk nilai pembelian, rasio derau kini jauh lebih rendah (lebih baik) daripada simulasi sebelumnya. Untuk jumlah pembelian, jumlah tersebut tidak berubah.
- Terus sesuaikan pembagian anggaran di seluruh metrik. Amati pengaruhnya terhadap derau.
Perhatikan bahwa Anda dapat menetapkan sasaran pengukuran kustom Anda sendiri dengan tombol Tambahkan/Hapus/Reset.
Jika Anda mengukur satu titik data (sasaran pengukuran) pada peristiwa konversi, seperti jumlah konversi, titik data tersebut dapat mendapatkan semua anggaran kontribusi (65536). Jika Anda menetapkan beberapa sasaran pengukuran pada peristiwa konversi, seperti jumlah konversi dan nilai pembelian, titik data tersebut harus berbagi anggaran kontribusi. Artinya, Anda memiliki lebih sedikit ruang untuk menskalakan nilai.
Oleh karena itu, semakin banyak sasaran pengukuran yang Anda miliki, semakin rendah rasio sinyal-derau yang mungkin terjadi (derau lebih tinggi).
Keputusan lain yang harus dibuat terkait sasaran pengukuran adalah pembagian anggaran. Jika Anda membagi anggaran kontribusi secara merata di antara dua titik data, setiap titik data akan mendapatkan anggaran 65536/2 = 32768. Hal ini mungkin optimal, mungkin juga tidak, bergantung pada nilai maksimum yang mungkin untuk setiap titik data. Misalnya, jika Anda mengukur jumlah pembelian yang memiliki nilai maksimum 1, dan nilai pembelian dengan minimum 1 dan maksimum 120, nilai pembelian akan mendapatkan manfaat dari adanya "lebih banyak ruang" untuk diskalakan—yaitu, diberi proporsi yang lebih besar dari anggaran kontribusi. Anda akan melihat apakah beberapa sasaran pengukuran harus diprioritaskan daripada yang lain terkait dengan dampak derau.
Keputusan: Pengelolaan outlier
Coba di Noise Lab
Sasaran pengukuran adalah titik data yang berbeda yang dikumpulkan dalam peristiwa konversi.
- Buka Mode lanjutan.
- Di panel samping Parameter, cari Strategi agregasi Anda > Penskalaan.
- Pastikan Penskalaan disetel ke Ya. Perhatikan bahwa Noise Lab secara otomatis menghitung faktor penskalaan yang akan digunakan, berdasarkan rentang (nilai rata-rata dan maksimum) yang telah Anda berikan untuk sasaran pengukuran.
- Misalkan pembelian terbesar yang pernah dilakukan adalah $2.000, tetapi sebagian besar pembelian terjadi dalam rentang $10-$120. Pertama, mari kita lihat apa yang terjadi jika kita menggunakan pendekatan penskalaan literal (tidak direkomendasikan): masukkan $2.000 sebagai nilai maksimum untuk purchaseValue.
- Klik Simulasikan.
- Perhatikan bahwa rasio deraunya tinggi. Hal ini karena faktor penskalaan kami saat ini dihitung berdasarkan $2.000, padahal pada kenyataannya, sebagian besar nilai pembelian akan jauh lebih rendah dari itu.
- Sekarang, mari kita gunakan pendekatan penskalaan yang lebih pragmatis. Ubah nilai pembelian maksimum menjadi $120.
- Klik Simulasikan.
- Perhatikan bahwa rasio derau lebih rendah (lebih baik) dalam simulasi kedua ini.
Untuk menerapkan penskalaan, Anda biasanya akan menghitung faktor penskalaan berdasarkan nilai maksimum yang mungkin untuk peristiwa konversi tertentu (pelajari lebih lanjut dalam contoh ini).
Namun, hindari penggunaan nilai maksimum literal untuk menghitung faktor penskalaan tersebut, karena hal ini akan memperburuk rasio sinyal-derau Anda. Sebagai gantinya, hapus outlier dan gunakan nilai maksimum pragmatis.
Pengelolaan outlier adalah topik yang mendalam. Sejumlah teknik rumit dapat dipertimbangkan untuk meningkatkan rasio sinyal-derau. Salah satunya dijelaskan dalam Pengelolaan outlier lanjutan.
Langkah berikutnya
Setelah menilai berbagai strategi pengelolaan derau untuk kasus penggunaan Anda, Anda siap untuk mulai bereksperimen dengan laporan ringkasan dengan mengumpulkan data pengukuran yang sebenarnya melalui uji coba origin. Tinjau panduan dan tips untuk Mencoba API.
Lampiran
Tur singkat Noise Lab
Noise Lab membantu Anda menilai dan membandingkan strategi pengelolaan derau dengan cepat. Gunakan untuk:
- Pahami parameter utama yang dapat memengaruhi derau, dan dampaknya.
- Simulasikan efek derau pada data pengukuran output dengan berbagai keputusan desain. Sesuaikan parameter desain hingga Anda mencapai rasio sinyal terhadap derau yang sesuai untuk kasus penggunaan Anda.
- Berikan masukan Anda tentang kegunaan laporan ringkasan: parameter nilai epsilon dan derau mana yang cocok untuk Anda, dan mana yang tidak? Di mana titik beloknya?
Anggap ini sebagai langkah persiapan. Noise Lab menghasilkan data pengukuran untuk menyimulasikan output laporan ringkasan berdasarkan input Anda. Data tidak dipertahankan atau dibagikan.
Ada dua mode yang berbeda di Noise Lab:
- Mode sederhana: memahami dasar-dasar kontrol yang Anda miliki terhadap derau.
- Mode lanjutan: menguji berbagai strategi pengelolaan derau dan menilai strategi mana yang menghasilkan rasio sinyal-derau terbaik untuk kasus penggunaan Anda.
Klik tombol di menu atas untuk beralih antara dua mode (#1. pada screenshot di bawah).
Mode sederhana
- Dengan mode Sederhana, Anda mengontrol Parameter (terdapat di sisi kiri, atau #2. dalam screenshot di bawah) seperti Epsilon, dan melihat pengaruhnya terhadap derau.
- Setiap parameter memiliki tooltip (tombol `?`). Klik untuk melihat penjelasan setiap parameter (#3. pada screenshot di bawah)
- Untuk memulai, klik tombol "Simulate" dan amati tampilan output (#4. di screenshot di bawah)
- Di bagian Output, Anda dapat melihat berbagai detail. Beberapa elemen memiliki `?` di sampingnya. Luangkan waktu untuk mengklik setiap `?` guna melihat penjelasan tentang berbagai informasi.
- Di bagian Output, klik tombol Details jika Anda ingin melihat versi tabel yang diperluas (#5. pada screenshot di bawah)
- Di bawah setiap tabel data di bagian output, terdapat opsi untuk mendownload tabel untuk penggunaan offline. Selain itu, di sudut kanan bawah ada opsi untuk mendownload semua tabel data (#6. dalam screenshot di bawah)
- Uji berbagai setelan untuk parameter di bagian Parameter
dan klik Simulasi untuk melihat pengaruhnya terhadap output:
Antarmuka Noise Lab untuk mode Sederhana.
Mode lanjutan
- Dalam mode Lanjutan, Anda memiliki kontrol lebih besar atas Parameter. Anda dapat menambahkan Sasaran Pengukuran dan Dimensi kustom (#1. dan #2. dalam screenshot di bawah)
- Scroll lebih jauh ke bawah di bagian Parameter dan lihat opsi Strategi Utama. Ini dapat digunakan untuk menguji berbagai struktur kunci
(#3. pada screenshot di bawah)
- Untuk menguji berbagai Struktur Kunci, alihkan Strategi Kunci ke "B"
- Masukkan jumlah struktur kunci yang berbeda yang ingin Anda gunakan (default ditetapkan ke "2")
- Klik Buat Struktur Kunci
- Anda akan melihat opsi untuk menentukan struktur kunci dengan mengklik kotak centang di samping kunci yang ingin disertakan untuk setiap struktur kunci
- Klik Simulasi untuk melihat output.
Antarmuka Noise Lab untuk mode Lanjutan. Antarmuka Noise Lab untuk mode Lanjutan.
Metrik derau
Konsep inti
Derau ditambahkan untuk melindungi privasi setiap pengguna.
Nilai derau yang tinggi menunjukkan bahwa bucket/kunci jarang dan berisi kontribusi dari sejumlah peristiwa sensitif yang terbatas. Hal ini dilakukan secara otomatis oleh Noise Lab, untuk memungkinkan individu "bersembunyi di tengah kerumunan", atau dengan kata lain, melindungi privasi individu terbatas ini dengan jumlah derau tambahan yang lebih besar.
Nilai derau rendah menunjukkan bahwa penyiapan data dirancang sedemikian rupa sehingga memungkinkan individu untuk "bersembunyi di tengah kerumunan". Artinya, bucket berisi kontribusi dari peristiwa dalam jumlah yang memadai untuk memastikan bahwa privasi setiap pengguna dilindungi.
Pernyataan ini berlaku untuk error persentase rata-rata (APE) dan RMSRE_T (error relatif akar rata-rata kuadrat dengan nilai minimum).
APE (error persentase rata-rata)
APE adalah rasio derau terhadap sinyal, yaitu nilai ringkasan yang sebenarnya.p> Nilai APE yang lebih rendah berarti rasio sinyal-derau yang lebih baik.
Formula
Untuk laporan ringkasan tertentu, APE dihitung sebagai berikut:

True adalah nilai ringkasan yang benar. APE adalah rata-rata derau dari setiap nilai ringkasan sebenarnya, yang dirata-ratakan dari semua entri dalam laporan ringkasan. Di Noise Lab, nilai ini kemudian dikalikan dengan 100 untuk memberikan persentase.
Kelebihan dan Kekurangan
Bucket dengan ukuran yang lebih kecil memiliki dampak yang tidak proporsional terhadap nilai akhir APE. Hal ini dapat menyesatkan saat menilai derau. Itulah sebabnya kami telah menambahkan metrik lain, RMSRE_T, yang dirancang untuk mengurangi batasan APE ini. Tinjau contoh untuk mengetahui detailnya.
Kode
Tinjau kode sumber untuk penghitungan APE.
RMSRE_T (error relatif akar rata-rata kuadrat dengan nilai minimum)
RMSRE_T (error relatif akar rata-rata kuadrat dengan nilai minimum) adalah ukuran lain untuk derau.
Cara menafsirkan RMSRE_T
Nilai RMSRE_T yang lebih rendah berarti rasio sinyal terhadap derau yang lebih baik.
Misalnya, jika rasio derau yang dapat diterima untuk kasus penggunaan Anda adalah 20%, dan RMSRE_T adalah 0,2, Anda dapat yakin bahwa tingkat derau berada dalam rentang yang dapat diterima.
Formula
Untuk laporan ringkasan tertentu, RMSRE_T dihitung sebagai berikut:

Kelebihan dan kekurangan
RMSRE_T sedikit lebih rumit untuk dipahami daripada APE. Namun, dalam beberapa kasus, APE memiliki beberapa keunggulan yang membuatnya lebih cocok daripada APE untuk menganalisis derau dalam laporan ringkasan:
- RMSRE_T lebih stabil. "T" adalah nilai minimum. "T" digunakan untuk memberikan bobot yang lebih kecil dalam penghitungan RMSRE_T ke bucket yang memiliki lebih sedikit konversi sehingga lebih sensitif terhadap derau karena ukurannya yang kecil. Dengan T, metrik tidak akan melonjak di bucket dengan sedikit konversi. Jika T sama dengan 5, nilai derau sekecil 1 di bucket dengan 0 konversi tidak akan ditampilkan sebagai jauh di atas 1. Sebagai gantinya, nilai ini akan dibatasi hingga 0,2, yang setara dengan 1/5, karena T sama dengan 5. Dengan memberikan bobot yang lebih kecil ke bucket yang lebih kecil sehingga lebih sensitif terhadap derau, metrik ini lebih stabil, sehingga mempermudah perbandingan antara dua simulasi.
- RMSRE_T memungkinkan agregasi yang mudah. Dengan mengetahui RMSRE_T dari beberapa bucket, beserta jumlah sebenarnya, Anda dapat menghitung RMSRE_T dari jumlah bucket tersebut. Hal ini juga memungkinkan Anda mengoptimalkan RMSRE_T untuk nilai gabungan ini.
Meskipun agregasi dapat dilakukan untuk APE, formulanya cukup rumit karena melibatkan nilai absolut dari jumlah derau Laplace. Hal ini membuat APE lebih sulit dioptimalkan.
Kode
Tinjau kode sumber untuk penghitungan RMSRE_T.
Contoh
Laporan ringkasan dengan tiga bucket:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Laporan ringkasan dengan tiga bucket:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Laporan ringkasan dengan tiga bucket:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + Tak Terhingga) / 3 = Tak Terhingga
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Pengelolaan kunci lanjutan
Perusahaan DSP atau pengukuran iklan mungkin memiliki ribuan pelanggan iklan global, yang mencakup beberapa industri, mata uang, dan potensi harga pembelian. Artinya, membuat dan mengelola satu kunci agregasi per pengiklan kemungkinan akan sangat tidak praktis. Selain itu, akan sulit untuk memilih nilai agregat maksimum dan anggaran agregasi yang dapat membatasi dampak derau di ribuan pengiklan global ini. Sebagai gantinya, mari kita pertimbangkan skenario berikut:
Strategi Utama A
Penyedia teknologi iklan memutuskan untuk membuat dan mengelola satu kunci di semua pelanggan iklannya. Di semua pengiklan dan semua mata uang, rentang pembelian bervariasi dari pembelian kelas atas dengan volume rendah hingga pembelian kelas bawah dengan volume tinggi. Tindakan ini akan menghasilkan kunci berikut:
Kunci (beberapa mata uang) | |
---|---|
Nilai agregat maksimum | 5.000.000 |
Rentang nilai pembelian | [120 - 5000000] |
Strategi Utama B
Penyedia teknologi iklan memutuskan untuk membuat dan mengelola dua kunci di semua pelanggan iklannya. Mereka memutuskan untuk memisahkan kunci berdasarkan mata uang. Di semua pengiklan dan semua mata uang, rentang pembelian bervariasi dari pembelian high-end dengan volume rendah hingga pembelian low-end dengan volume tinggi. Dengan memisahkan menurut mata uang, kunci tersebut akan membuat 2 kunci:
Kunci 1 (USD) | Tombol 2 (¥) | |
---|---|---|
Nilai agregat maksimum | $40.000 | ¥5.000.000 |
Rentang nilai pembelian | [120 - 40.000] | [15.000 - 5.000.000] |
Strategi Kunci B akan memiliki lebih sedikit derau dalam hasilnya daripada Strategi Kunci A, karena nilai mata uang tidak didistribusikan secara merata di seluruh mata uang. Misalnya, pertimbangkan bagaimana pembelian yang didenominasi dalam ¥ yang digabungkan dengan pembelian yang didenominasi dalam USD akan mengubah data pokok dan menghasilkan output yang berisi derau.
Strategi Utama C
Penyedia teknologi iklan memutuskan untuk membuat dan mengelola empat kunci di semua pelanggan iklannya, dan memisahkannya menurut Mata Uang x Industri pengiklan:
Kunci 1 (USD x Pengiklan perhiasan kelas atas) |
Kunci 2 (¥ x Pengiklan perhiasan kelas atas) |
Kunci 3 (USD x Pengiklan retailer pakaian) |
Kunci 4 (¥ x Pengiklan retailer pakaian) |
|
---|---|---|---|---|
Nilai agregat maksimum | $40.000 | ¥5.000.000 | Rp7.000.000 | ¥65.000 |
Rentang nilai pembelian | [10.000 - 40.000] | [1.250.000 - 5.000.000] | [120 - 500] | [15.000 - 65.000] |
Strategi Kunci C akan memiliki lebih sedikit derau dalam hasilnya daripada Strategi Kunci B, karena nilai pembelian pengiklan tidak didistribusikan secara merata di seluruh pengiklan. Misalnya, pertimbangkan bagaimana pembelian perhiasan kelas atas yang digabungkan dengan pembelian topi bisbol akan mengubah data pokok dan menghasilkan output yang berisi derau.
Pertimbangkan untuk membuat nilai agregat maksimum bersama dan faktor penskalaan bersama untuk kesamaan di beberapa pengiklan guna mengurangi derau dalam output. Misalnya, Anda dapat bereksperimen dengan berbagai strategi di bawah ini untuk pengiklan:
- Satu strategi yang dipisahkan berdasarkan mata uang (USD, ¥, CAD, dll.)
- Satu strategi yang dipisahkan menurut industri pengiklan (Asuransi, Otomotif, Retail, dll.)
- Satu strategi yang dipisahkan oleh rentang nilai pembelian yang serupa ([100], [1000], [10.000], dll.)
Dengan membuat strategi utama seputar kesamaan pengiklan, kunci dan kode yang sesuai akan lebih mudah dikelola, dan rasio sinyal-derau menjadi lebih tinggi. Bereksperimenlah dengan berbagai strategi dengan kesamaan pengiklan yang berbeda untuk menemukan titik belok dalam memaksimalkan dampak derau vs manajemen kode.
Pengelolaan outlier lanjutan
Mari kita pertimbangkan skenario di antara dua pengiklan:
- Pengiklan A:
- Di semua produk di situs Pengiklan A, kemungkinan harga pembelian berkisar antara [$120 - $1.000] , dengan rentang $880.
- Harga pembelian didistribusikan secara merata di rentang $880 tanpa ada outlier di luar dua deviasi standar dari harga pembelian median.
- Pengiklan B:
- Di semua produk di situs Pengiklan B, kemungkinan harga pembelian berkisar antara [$120 - $1.000] , dengan rentang $880.
- Harga pembelian sangat condong ke rentang $120 - $500, dengan hanya 5% pembelian yang terjadi dalam rentang $500 - $1.000.
Mengingat persyaratan anggaran kontribusi dan metodologi yang digunakan untuk menerapkan derau ke hasil akhir, Pengiklan B akan, secara default, memiliki output yang lebih berisi derau daripada Pengiklan A, karena Pengiklan B memiliki potensi yang lebih tinggi untuk menghasilkan outlier yang memengaruhi penghitungan yang mendasarinya.
Hal ini dapat dimitigasi dengan penyiapan kunci tertentu. Uji strategi utama yang membantu mengelola data pencilan, dan untuk mendistribusikan nilai pembelian secara lebih merata di seluruh rentang pembelian kunci.
Untuk Pengiklan B, Anda dapat membuat dua kunci terpisah untuk mengambil dua rentang nilai pembelian yang berbeda. Dalam contoh ini, teknologi iklan telah mencatat bahwa outlier muncul di atas nilai pembelian $500. Coba terapkan dua kunci terpisah untuk pengiklan ini:
- Struktur Kunci 1 : Kunci yang hanya merekam pembelian antara rentang $120 - $500 (mencakup ~95% dari total volume pembelian).
- Struktur Kunci 2: Kunci yang hanya merekam pembelian di atas $500 (mencakup ~5% dari total volume pembelian).
Dengan menerapkan strategi utama ini, Advertiser B akan dapat mengelola derau dengan lebih baik dan membantu memaksimalkan utilitas dari laporan ringkasan. Dengan rentang yang lebih kecil yang baru, Kunci A dan Kunci B kini akan memiliki distribusi data yang lebih seragam di setiap kunci masing-masing untuk kunci tunggal sebelumnya. Hal ini akan menghasilkan dampak derau yang lebih sedikit pada output setiap kunci dibandingkan dengan kunci tunggal sebelumnya.