Memahami pengelolaan model bawaan di Chrome

Dipublikasikan: 21 Oktober 2025

Kemampuan AI bawaan yang didukung oleh Gemini Nano dirancang agar lancar bagi pengguna dan developer. Saat Anda menggunakan AI API bawaan, pengelolaan model akan terjadi secara otomatis di latar belakang. Dokumen ini menjelaskan cara Chrome menangani download, update, dan penghapusan model Gemini Nano.

Download model awal

Saat pengguna mendownload atau mengupdate Chrome, Gemini Nano akan didownload sesuai permintaan untuk memastikan Chrome mendownload model yang tepat untuk hardware pengguna. Download model awal dipicu oleh panggilan pertama ke fungsi *.create() (misalnya, Summarizer.create()) dari API AI bawaan mana pun yang bergantung pada Gemini Nano. Jika hal ini terjadi, Chrome akan menjalankan serangkaian pemeriksaan untuk menentukan tindakan terbaik yang harus dilakukan. Pertama, Chrome memperkirakan performa GPU perangkat dengan menjalankan shader representatif. Berdasarkan hasil ini, sistem akan memutuskan untuk:

  • Download varian Gemini Nano yang lebih besar dan lebih mumpuni (seperti parameter 4B).
  • Download varian Gemini Nano yang lebih kecil dan efisien (seperti parameter 2B).
  • Kembali ke inferensi berbasis CPU jika perangkat memenuhi persyaratan statis terpisah. Jika perangkat tidak memenuhi persyaratan hardware, model tidak akan didownload.

Proses download dibuat agar tangguh:

  • Jika koneksi internet terputus, download akan dilanjutkan dari tempat terakhir kali terhenti setelah koneksi dipulihkan.
  • Jika tab yang memicu download ditutup, download akan dilanjutkan di latar belakang.
  • Jika browser ditutup, download akan dilanjutkan saat browser dimulai ulang, asalkan browser dibuka dalam waktu 30 hari.

Terkadang, memanggil availability() dapat memicu download model. Hal ini terjadi jika panggilan dilakukan segera setelah profil pengguna baru dimulai dan jika fitur deteksi penipuan yang didukung Gemini Nano aktif.

Download bobot LoRA

Beberapa API, seperti Proofreader API, mengandalkan bobot Low-Rank Adaptation (LoRA) yang diterapkan ke model dasar untuk mengkhususkan fungsinya. Jika API bergantung pada LoRA, bobot LoRA akan didownload bersama dengan model dasar. Bobot LoRA untuk API lain tidak didownload secara proaktif.

Update model otomatis

Update model Gemini Nano dirilis secara rutin. Chrome memeriksa update ini saat browser dimulai. Selain itu, Chrome memeriksa update sumber daya tambahan, seperti bobot LoRA, setiap hari. Meskipun Anda tidak dapat mengkueri versi model secara terprogram dari JavaScript, Anda dapat memeriksa secara manual versi yang diinstal di chrome://on-device-internals. Proses update dirancang agar lancar dan tidak mengganggu:

  • Chrome akan terus beroperasi dengan model saat ini sambil mendownload versi baru di latar belakang.
  • Setelah model yang diupdate didownload, model tersebut akan ditukar langsung, yang berarti model ditukar tanpa waktu henti. Setiap panggilan AI API baru akan segera menggunakan model baru. Catatan: Perintah yang berjalan tepat pada saat pertukaran dapat gagal.
  • Setiap update adalah download model baru yang lengkap, bukan download sebagian. Hal ini terjadi karena bobot model dapat sangat berbeda antar-versi, dan penghitungan serta penerapan delta untuk file sebesar itu dapat berjalan lambat.

Update tunduk pada persyaratan yang sama dengan download awal. Namun, pemeriksaan ruang disk awal tidak dilakukan jika model sudah diinstal. Bobot LoRA juga dapat diperbarui. Versi baru bobot LoRA dapat diterapkan ke model dasar yang ada. Namun, versi model dasar baru selalu memerlukan serangkaian bobot LoRA baru.

Penghapusan model

Chrome secara aktif mengelola ruang disk untuk memastikan pengguna tidak kehabisan ruang. Model Gemini Nano akan otomatis dihapus jika ruang disk kosong perangkat turun di bawah batas tertentu. Selain itu, model akan dihapus jika kebijakan perusahaan menonaktifkan fitur tersebut, atau jika pengguna belum memenuhi kriteria kelayakan lainnya selama 30 hari. Kelayakan dapat mencakup penggunaan API dan kemampuan perangkat. Proses penghapusan memiliki karakteristik berikut:

  • Model dapat dihapus kapan saja, bahkan di tengah sesi, tanpa memedulikan perintah yang sedang berjalan. Artinya, API yang tersedia di awal sesi dapat tiba-tiba menjadi tidak tersedia.
  • Setelah dihapus permanen, model tidak otomatis didownload ulang. Download baru harus dipicu oleh aplikasi yang memanggil fungsi *.create().
  • Saat model dasar dihapus, bobot LoRA terkait juga akan dihapus setelah masa tenggang 30 hari.

Peran Anda dalam pengelolaan model

Memiliki pemahaman yang baik tentang siklus proses model AI bawaan adalah kunci untuk mendapatkan pengalaman pengguna yang tepat. Anda tidak hanya perlu mendownload model sekali, tetapi juga harus menyadari kemungkinan model tiba-tiba menghilang lagi karena tekanan ruang disk, atau model diperbarui saat versi baru dirilis. Semua ini ditangani oleh browser.

Dengan mengikuti praktik terbaik seputar mendownload model, Anda akan menciptakan pengalaman pengguna yang baik saat download awal, download ulang, dan update.