منتشر شده: ۲۱ اکتبر ۲۰۲۵
قابلیتهای هوش مصنوعی داخلی Gemini Nano به گونهای طراحی شدهاند که هم برای کاربران و هم برای توسعهدهندگان یکپارچه باشند. وقتی از یک رابط برنامهنویسی کاربردی هوش مصنوعی داخلی استفاده میکنید، مدیریت مدل به طور خودکار در پسزمینه انجام میشود. این سند نحوه مدیریت دانلودها، بهروزرسانیها و پاکسازیهای مدل Gemini Nano توسط کروم را شرح میدهد.
دانلود مدل اولیه
وقتی کاربری کروم را دانلود یا بهروزرسانی میکند، جمینی نانو بنا به درخواست دانلود میشود تا اطمینان حاصل شود که کروم مدل صحیح را برای سختافزار کاربر دانلود میکند. دانلود اولیه مدل با اولین فراخوانی تابع *.create()
(به عنوان مثال، Summarizer.create()
) از هر API هوش مصنوعی داخلی که به جمینی نانو وابسته است، آغاز میشود. وقتی این اتفاق میافتد، کروم مجموعهای از بررسیها را برای تعیین بهترین مسیر اقدام انجام میدهد. ابتدا، کروم با اجرای یک سایهزن نماینده، عملکرد پردازنده گرافیکی دستگاه را تخمین میزند. بر اساس این نتایج، تصمیم میگیرد که یکی از موارد زیر را انجام دهد:
- یک نسخه بزرگتر و توانمندتر Gemini Nano (مانند پارامترهای 4B) را دانلود کنید.
- یک نوع کوچکتر و کارآمدتر Gemini Nano (مانند پارامترهای 2B) را دانلود کنید.
- اگر دستگاه الزامات استاتیک جداگانه را برآورده کند، به استنتاج مبتنی بر CPU برمیگردد. اگر دستگاه الزامات سختافزاری را برآورده نکند، مدل دانلود نمیشود.
فرآیند دانلود طوری ساخته شده است که انعطافپذیر باشد:
- در صورت قطع شدن اتصال اینترنت، پس از برقراری مجدد اتصال، دانلود از جایی که متوقف شده بود ادامه مییابد.
- اگر تبی که دانلود را آغاز کرده بسته باشد، دانلود در پسزمینه ادامه مییابد.
- اگر مرورگر بسته شود، دانلود در راهاندازی مجدد بعدی از سر گرفته میشود، مشروط بر اینکه مرورگر ظرف 30 روز باز شود.
گاهی اوقات، فراخوانی availability()
میتواند باعث دانلود مدل شود. این اتفاق زمانی رخ میدهد که فراخوانی مدت کوتاهی پس از راهاندازی یک پروفایل کاربری جدید و در صورت فعال بودن ویژگی تشخیص کلاهبرداری Gemini Nano رخ دهد.
دانلود وزنهای LoRA
برخی از APIها، مانند API مربوط به Proofreader، به وزنهای Low-Rank Adaptation (LoRA) متکی هستند که برای تخصصی کردن عملکرد مدل پایه به آن اعمال میشوند. اگر API به LoRA وابسته باشد، وزنهای LoRA همراه با مدل پایه دانلود میشوند. وزنهای LoRA برای سایر APIها به صورت پیشگیرانه دانلود نمیشوند.
بهروزرسانی خودکار مدل
بهروزرسانیهای مدل Gemini Nano به طور منظم منتشر میشوند. کروم هنگام راهاندازی مرورگر، این بهروزرسانیها را بررسی میکند. علاوه بر این، کروم روزانه بهروزرسانیهای منابع تکمیلی، مانند وزنهای LoRA، را بررسی میکند. اگرچه نمیتوانید به صورت برنامهنویسی از جاوا اسکریپت، نسخه مدل را جستجو کنید، میتوانید به صورت دستی بررسی کنید که کدام نسخه روی chrome://on-device-internals
نصب شده است. فرآیند بهروزرسانی به گونهای طراحی شده است که یکپارچه و بدون اختلال باشد:
- کروم در حالی که نسخه جدید را در پسزمینه دانلود میکند، با مدل فعلی به کار خود ادامه میدهد.
- پس از دانلود مدل بهروزرسانیشده، آن را میتوان به صورت فوری (hot swapped) تعویض کرد ، به این معنی که مدلها بدون هیچ گونه خرابی (downtime) تعویض میشوند. هر فراخوانی جدید API هوش مصنوعی بلافاصله از مدل جدید استفاده خواهد کرد. توجه: ممکن است اعلانی که دقیقاً در لحظه تعویض اجرا میشود، با شکست مواجه شود.
- هر بهروزرسانی، دانلود کامل مدل جدید است، نه دانلود جزئی. دلیل این امر این است که وزنهای مدل میتوانند بین نسخهها تفاوت قابل توجهی داشته باشند و محاسبه و اعمال دلتا برای چنین فایلهای بزرگی میتواند کند باشد.
بهروزرسانیها مشمول همان الزامات دانلود اولیه هستند. با این حال، اگر مدلی از قبل نصب شده باشد، بررسی اولیه فضای دیسک لغو میشود. وزنهای LoRA را نیز میتوان بهروزرسانی کرد. نسخه جدیدی از وزنهای LoRA را میتوان روی مدل پایه موجود اعمال کرد. با این حال، یک نسخه جدید از مدل پایه همیشه به مجموعهای جدید از وزنهای LoRA نیاز دارد.
حذف مدل
کروم به طور فعال فضای دیسک را مدیریت میکند تا مطمئن شود که فضای دیسک کاربر تمام نمیشود. اگر فضای خالی دیسک دستگاه از یک آستانه مشخص کمتر شود، مدل Gemini Nano به طور خودکار حذف میشود. علاوه بر این، اگر یک سیاست سازمانی این ویژگی را غیرفعال کند، یا اگر کاربر به مدت 30 روز سایر معیارهای واجد شرایط بودن را نداشته باشد، این مدل پاک میشود. واجد شرایط بودن ممکن است شامل استفاده از API و قابلیت دستگاه باشد. فرآیند پاکسازی دارای ویژگیهای زیر است:
- این مدل میتواند در هر زمانی، حتی در اواسط جلسه، بدون توجه به اجرای دستورات، حذف شود. این بدان معناست که API که در ابتدای جلسه در دسترس بوده است، میتواند ناگهان از دسترس خارج شود.
- پس از پاکسازی، مدل به طور خودکار دوباره دانلود نمیشود . دانلود جدید باید توسط برنامهای که تابع
*.create()
را فراخوانی میکند، آغاز شود. - وقتی مدل پایه حذف میشود، هرگونه وزن LoRA مرتبط نیز پس از یک دوره تنفس ۳۰ روزه حذف میشود.
نقش شما در مدیریت مدل
داشتن درک خوب از چرخه عمر مدل هوش مصنوعی داخلی، کلید ایجاد تجربه کاربری درست است. شما با دانلود یک بار مدل، کار خود را تمام نمیکنید، همچنین باید از احتمال ناپدید شدن ناگهانی مدل تحت فشار فضای دیسک یا بهروزرسانی مدل با انتشار نسخه جدید آگاه باشید. همه اینها توسط مرورگر انجام میشود.
با پیروی از بهترین شیوههای دانلود مدل ، شما یک تجربه کاربری خوب در دانلود اولیه، دانلودهای مجدد و بهروزرسانیها ایجاد خواهید کرد.