Memahami pengelolaan model bawaan di Chrome

Dipublikasikan: 21 Oktober 2025

Kemampuan AI bawaan yang didukung oleh model dasar dan model ahli dirancang agar lancar bagi pengguna dan developer. Saat Anda menggunakan AI API bawaan, pengelolaan model akan terjadi secara otomatis di latar belakang. Dokumen ini menjelaskan cara Chrome menangani download, update, dan penghapusan model AI.

Download model awal

Saat pengguna mendownload atau mengupdate Chrome, model akan didownload sesuai permintaan untuk memastikan Chrome mendownload model yang benar untuk hardware pengguna. Download model awal dipicu oleh panggilan pertama ke *.create() fungsi (misalnya, Summarizer.create()) dari AI bawaan API apa pun yang bergantung pada Gemini Nano. Saat hal ini terjadi, Chrome menjalankan serangkaian pemeriksaan untuk menentukan tindakan terbaik. Pertama, Chrome memperkirakan performa GPU perangkat dengan menjalankan shader representatif. Berdasarkan hasil ini, Chrome akan memutuskan untuk:

  • Mendownload varian Gemini Nano yang lebih besar dan lebih mumpuni (seperti parameter 4B).
  • Mendownload varian Gemini Nano yang lebih kecil dan lebih efisien (seperti parameter 2B).
  • Kembali ke inferensi berbasis CPU jika perangkat memenuhi persyaratan statis terpisah. Jika perangkat tidak memenuhi persyaratan hardware, model tidak akan didownload.

Proses download dibuat agar tangguh:

  • Jika koneksi internet terganggu, download akan dilanjutkan dari bagian yang terputus setelah konektivitas dipulihkan.
  • Jika tab yang memicu download ditutup, download akan dilanjutkan di latar belakang.
  • Jika browser ditutup, download akan dilanjutkan saat browser berikutnya dimulai, asalkan browser dibuka dalam waktu 30 hari.

Terkadang, memanggil availability() dapat memicu download model. Hal ini terjadi jika panggilan dilakukan segera setelah profil pengguna baru dimulai dan jika fitur deteksi penipuan yang didukung Gemini Nano aktif.

Download bobot LoRA

Beberapa API, seperti Proofreader API, mengandalkan bobot Low-Rank Adaptation (LoRA) yang diterapkan ke model dasar untuk mengkhususkan fungsinya. Jika API bergantung pada LoRA, bobot LoRA akan didownload bersama model dasar. Bobot LoRA untuk API lain tidak didownload secara proaktif.

Update model otomatis

Update model Gemini Nano dirilis secara rutin. Chrome memeriksa update ini saat browser dimulai. Selain itu, Chrome memeriksa update untuk resource tambahan, seperti bobot LoRA, setiap hari. Meskipun Anda tidak dapat mengkueri versi model secara terprogram dari JavaScript, Anda dapat memeriksa secara manual versi yang diinstal di chrome://on-device-internals. Proses update dirancang agar lancar dan tidak mengganggu:

  • Chrome terus beroperasi dengan model saat ini sambil mendownload versi baru di latar belakang.
  • Setelah model yang diupdate didownload, model tersebut akan ditukar secara langsung, yang berarti model akan diganti dengan tanpa waktu nonaktif. Setiap panggilan AI API baru akan segera menggunakan model baru. Catatan: Ada kemungkinan perintah yang berjalan pada saat pertukaran akan gagal.
  • Setiap update adalah download model baru yang lengkap, bukan download sebagian. Hal ini karena bobot model dapat sangat berbeda antarversi, dan menghitung serta menerapkan delta untuk file yang begitu besar dapat berjalan lambat.

Update tunduk pada persyaratan yang sama dengan download awal. Namun, pemeriksaan ruang disk awal akan diabaikan jika model sudah diinstal. Bobot LoRA juga dapat diupdate. Versi baru bobot LoRA dapat diterapkan ke model dasar yang ada. Namun, versi model dasar baru selalu memerlukan kumpulan bobot LoRA baru.

Penghapusan model

Chrome secara aktif mengelola ruang disk untuk memastikan pengguna tidak kehabisan ruang. Model Gemini Nano akan otomatis dihapus jika ruang disk kosong perangkat turun di bawah batas tertentu. Selain itu, model akan dihapus jika kebijakan perusahaan menonaktifkan fitur tersebut, atau jika pengguna belum memenuhi kriteria kelayakan lainnya selama 30 hari. Kelayakan dapat mencakup penggunaan API dan kemampuan perangkat. Proses penghapusan memiliki karakteristik berikut:

  • Model dapat dihapus kapan saja, bahkan di tengah sesi, tanpa memperhatikan perintah yang sedang berjalan. Artinya, API yang tersedia di awal sesi dapat tiba-tiba tidak tersedia.
  • Setelah dihapus, model tidak akan otomatis didownload ulang. Download baru harus dipicu oleh aplikasi yang memanggil fungsi *.create().
  • Saat model dasar dihapus, bobot LoRA terkait juga akan dihapus setelah masa tenggang 30 hari.

Peran Anda dalam pengelolaan model

Memahami siklus proses model AI bawaan adalah kunci untuk mendapatkan pengalaman pengguna yang tepat. Anda tidak hanya mendownload model sekali, tetapi juga harus mengetahui kemungkinan model tiba-tiba menghilang lagi karena tekanan ruang disk, atau model diupdate saat versi baru dirilis. Semua hal ini ditangani oleh browser.

Dengan mengikuti praktik terbaik terkait mendownload model, Anda akan menciptakan pengalaman pengguna yang baik pada download awal, download ulang, dan update.