Chrome'daki yerleşik model yönetimini anlama

Yayınlanma tarihi: 21 Ekim 2025

Gemini Nano tarafından desteklenen yerleşik yapay zeka özellikleri hem kullanıcılar hem de geliştiriciler için sorunsuz bir deneyim sunacak şekilde tasarlanmıştır. Yerleşik bir yapay zeka API'si kullandığınızda model yönetimi arka planda otomatik olarak gerçekleşir. Bu belgede, Chrome'un Gemini Nano modelinin indirilmesi, güncellenmesi ve temizlenmesi işlemlerini nasıl gerçekleştirdiği açıklanmaktadır.

İlk model indirme

Kullanıcı Chrome'u indirdiğinde veya güncellediğinde, Chrome'un kullanıcının donanımı için doğru modeli indirmesini sağlamak amacıyla Gemini Nano isteğe bağlı olarak indirilir. İlk model indirme işlemi, Gemini Nano'ya bağlı herhangi bir yerleşik yapay zeka API'sinin *.create()işlevine (örneğin, Summarizer.create()) yapılan ilk çağrıyla tetiklenir. Bu durumda Chrome, en iyi çözüm yolunu belirlemek için bir dizi kontrol gerçekleştirir. Öncelikle Chrome, temsili bir gölgelendirici çalıştırarak cihazın GPU performansını tahmin eder. Bu sonuçlara göre, şunlardan birini yapmaya karar verir:

  • Daha büyük ve daha yetenekli bir Gemini Nano varyantı (ör. 4B parametre) indirin.
  • Daha küçük ve verimli bir Gemini Nano varyantı (ör. 2B parametre) indirin.
  • Cihaz ayrı statik koşulları karşılıyorsa CPU tabanlı çıkarıma geri dönün. Cihaz, donanım gereksinimlerini karşılamıyorsa model indirilmez.

İndirme işlemi dayanıklı olacak şekilde tasarlanmıştır:

  • İnternet bağlantısı kesilirse bağlantı yeniden kurulduğunda indirme işlemi kaldığı yerden devam eder.
  • İndirme işlemini başlatan sekme kapatılırsa indirme işlemi arka planda devam eder.
  • Tarayıcı kapatılırsa indirme işlemi, tarayıcı 30 gün içinde açıldığı takdirde bir sonraki yeniden başlatmada devam eder.

Bazen availability() numarayı aradığınızda model indirme işlemi tetiklenebilir. Bu durum, yeni bir kullanıcı profili başlatıldıktan kısa süre sonra arama yapılması ve Gemini Nano destekli dolandırıcılık algılama özelliğinin etkin olması halinde meydana gelir.

LoRA ağırlıklarını indirme

Proofreader API gibi bazı API'ler, işlevini özelleştirmek için temel modele uygulanan Low-Rank Adaptation (LoRA) ağırlıklarını kullanır. API, LoRA'ya bağlıysa LoRA ağırlıkları temel modelle birlikte indirilir. Diğer API'ler için LoRA ağırlıkları proaktif olarak indirilmez.

Otomatik model güncellemeleri

Gemini Nano model güncellemeleri düzenli olarak yayınlanır. Chrome, tarayıcı başlatıldığında bu güncellemeleri kontrol eder. Ayrıca Chrome, LoRA ağırlıkları gibi ek kaynaklardaki güncellemeleri de günlük olarak kontrol eder. Model sürümünü JavaScript'ten programatik olarak sorgulayamasanız da chrome://on-device-internals üzerinde hangi sürümün yüklendiğini manuel olarak kontrol edebilirsiniz. Güncelleme süreci sorunsuz ve kesintisiz olacak şekilde tasarlanmıştır:

  • Chrome, yeni sürümü arka planda indirirken mevcut modelle çalışmaya devam eder.
  • Güncellenen model indirildikten sonra çalışırken değiştirilir. Bu, modellerin kapalı kalma süresi olmadan değiştirildiği anlamına gelir. Yeni yapay zeka API çağrıları hemen yeni modeli kullanır. Not: Değiştirme işlemi tam olarak yapıldığı sırada çalışan bir istemin başarısız olması mümkündür.
  • Her güncelleme, kısmi bir indirme değil, tam bir yeni model indirmesidir. Bunun nedeni, model ağırlıklarının sürümler arasında önemli ölçüde farklılık gösterebilmesi ve bu kadar büyük dosyalar için delta hesaplama ve uygulama işlemlerinin yavaş olabilmesidir.

Güncellemeler, ilk indirme işlemiyle aynı koşullara tabidir. Ancak, bir model zaten yüklüyse ilk disk alanı kontrolü yapılmaz. LoRA ağırlıkları da güncellenebilir. LoRA ağırlıklarının yeni bir sürümü, mevcut bir temel modele uygulanabilir. Ancak yeni bir temel model sürümü her zaman yeni bir LoRA ağırlıkları grubu gerektirir.

Model silme

Chrome, kullanıcının disk alanının bitmemesi için disk alanını etkin bir şekilde yönetir. Cihazın boş disk alanı belirli bir eşiğin altına düşerse Gemini Nano modeli otomatik olarak silinir. Ayrıca, bir kurumsal politika özelliği devre dışı bırakırsa veya bir kullanıcı 30 gün boyunca diğer uygunluk ölçütlerini karşılamazsa model temizlenir. Uygunluk için API kullanımı ve cihaz özelliği gibi koşullar gerekebilir. Temizleme işlemi aşağıdaki özelliklere sahiptir:

  • Model, oturum ortasında bile olsa, çalışan istemler dikkate alınmadan istediğiniz zaman silinebilir. Bu, bir oturumun başında kullanılabilen bir API'nin aniden kullanılamaz hale gelebileceği anlamına gelir.
  • Temizlendikten sonra model otomatik olarak yeniden indirilmez. Yeni bir indirme, *.create() işlevini çağıran bir uygulama tarafından tetiklenmelidir.
  • Temel model temizlendiğinde, 30 günlük ek süre sonunda ilgili LoRA ağırlıkları da temizlenir.

Model yönetimindeki rolünüz

Yerleşik yapay zeka modelinin yaşam döngüsünü iyi anlamak, kullanıcı deneyimini doğru şekilde sunmak için çok önemlidir. Modeli bir kez indirmeniz yeterli değildir. Disk alanı baskısı nedeniyle modelin aniden tekrar kaybolabileceğini veya yeni bir sürüm çıktığında modelin güncellenebileceğini de unutmayın. Bu işlemlerin tümü tarayıcı tarafından gerçekleştirilir.

Modeli indirmeyle ilgili en iyi uygulamaları izleyerek ilk indirme, yeniden indirme ve güncelleme işlemlerinde iyi bir kullanıcı deneyimi oluşturabilirsiniz.