مدیریت مدل داخلی در کروم را درک کنید

منتشر شده: ۲۱ اکتبر ۲۰۲۵

قابلیت‌های هوش مصنوعی داخلی Gemini Nano به گونه‌ای طراحی شده‌اند که هم برای کاربران و هم برای توسعه‌دهندگان یکپارچه باشند. وقتی از یک رابط برنامه‌نویسی کاربردی هوش مصنوعی داخلی استفاده می‌کنید، مدیریت مدل به طور خودکار در پس‌زمینه انجام می‌شود. این سند نحوه مدیریت دانلودها، به‌روزرسانی‌ها و پاکسازی‌های مدل Gemini Nano توسط کروم را شرح می‌دهد.

دانلود مدل اولیه

وقتی کاربری کروم را دانلود یا به‌روزرسانی می‌کند، جمینی نانو بنا به درخواست دانلود می‌شود تا اطمینان حاصل شود که کروم مدل صحیح را برای سخت‌افزار کاربر دانلود می‌کند. دانلود اولیه مدل با اولین فراخوانی تابع *.create() (به عنوان مثال، Summarizer.create() ) از هر API هوش مصنوعی داخلی که به جمینی نانو وابسته است، آغاز می‌شود. وقتی این اتفاق می‌افتد، کروم مجموعه‌ای از بررسی‌ها را برای تعیین بهترین مسیر اقدام انجام می‌دهد. ابتدا، کروم با اجرای یک سایه‌زن نماینده، عملکرد پردازنده گرافیکی دستگاه را تخمین می‌زند. بر اساس این نتایج، تصمیم می‌گیرد که یکی از موارد زیر را انجام دهد:

  • یک نسخه بزرگتر و توانمندتر Gemini Nano (مانند پارامترهای 4B) را دانلود کنید.
  • یک نوع کوچکتر و کارآمدتر Gemini Nano (مانند پارامترهای 2B) را دانلود کنید.
  • اگر دستگاه الزامات استاتیک جداگانه را برآورده کند، به استنتاج مبتنی بر CPU برمی‌گردد. اگر دستگاه الزامات سخت‌افزاری را برآورده نکند، مدل دانلود نمی‌شود.

فرآیند دانلود طوری ساخته شده است که انعطاف‌پذیر باشد:

  • در صورت قطع شدن اتصال اینترنت، پس از برقراری مجدد اتصال، دانلود از جایی که متوقف شده بود ادامه می‌یابد.
  • اگر تبی که دانلود را آغاز کرده بسته باشد، دانلود در پس‌زمینه ادامه می‌یابد.
  • اگر مرورگر بسته شود، دانلود در راه‌اندازی مجدد بعدی از سر گرفته می‌شود، مشروط بر اینکه مرورگر ظرف 30 روز باز شود.

گاهی اوقات، فراخوانی availability() می‌تواند باعث دانلود مدل شود. این اتفاق زمانی رخ می‌دهد که فراخوانی مدت کوتاهی پس از راه‌اندازی یک پروفایل کاربری جدید و در صورت فعال بودن ویژگی تشخیص کلاهبرداری Gemini Nano رخ دهد.

دانلود وزن‌های LoRA

برخی از APIها، مانند API مربوط به Proofreader، به وزن‌های Low-Rank Adaptation (LoRA) متکی هستند که برای تخصصی کردن عملکرد مدل پایه به آن اعمال می‌شوند. اگر API به LoRA وابسته باشد، وزن‌های LoRA همراه با مدل پایه دانلود می‌شوند. وزن‌های LoRA برای سایر APIها به صورت پیشگیرانه دانلود نمی‌شوند.

به‌روزرسانی خودکار مدل

به‌روزرسانی‌های مدل Gemini Nano به طور منظم منتشر می‌شوند. کروم هنگام راه‌اندازی مرورگر، این به‌روزرسانی‌ها را بررسی می‌کند. علاوه بر این، کروم روزانه به‌روزرسانی‌های منابع تکمیلی، مانند وزن‌های LoRA، را بررسی می‌کند. اگرچه نمی‌توانید به صورت برنامه‌نویسی از جاوا اسکریپت، نسخه مدل را جستجو کنید، می‌توانید به صورت دستی بررسی کنید که کدام نسخه روی chrome://on-device-internals نصب شده است. فرآیند به‌روزرسانی به گونه‌ای طراحی شده است که یکپارچه و بدون اختلال باشد:

  • کروم در حالی که نسخه جدید را در پس‌زمینه دانلود می‌کند، با مدل فعلی به کار خود ادامه می‌دهد.
  • پس از دانلود مدل به‌روزرسانی‌شده، آن را می‌توان به صورت فوری (hot swapped) تعویض کرد ، به این معنی که مدل‌ها بدون هیچ گونه خرابی (downtime) تعویض می‌شوند. هر فراخوانی جدید API هوش مصنوعی بلافاصله از مدل جدید استفاده خواهد کرد. توجه: ممکن است اعلانی که دقیقاً در لحظه تعویض اجرا می‌شود، با شکست مواجه شود.
  • هر به‌روزرسانی، دانلود کامل مدل جدید است، نه دانلود جزئی. دلیل این امر این است که وزن‌های مدل می‌توانند بین نسخه‌ها تفاوت قابل توجهی داشته باشند و محاسبه و اعمال دلتا برای چنین فایل‌های بزرگی می‌تواند کند باشد.

به‌روزرسانی‌ها مشمول همان الزامات دانلود اولیه هستند. با این حال، اگر مدلی از قبل نصب شده باشد، بررسی اولیه فضای دیسک لغو می‌شود. وزن‌های LoRA را نیز می‌توان به‌روزرسانی کرد. نسخه جدیدی از وزن‌های LoRA را می‌توان روی مدل پایه موجود اعمال کرد. با این حال، یک نسخه جدید از مدل پایه همیشه به مجموعه‌ای جدید از وزن‌های LoRA نیاز دارد.

حذف مدل

کروم به طور فعال فضای دیسک را مدیریت می‌کند تا مطمئن شود که فضای دیسک کاربر تمام نمی‌شود. اگر فضای خالی دیسک دستگاه از یک آستانه مشخص کمتر شود، مدل Gemini Nano به طور خودکار حذف می‌شود. علاوه بر این، اگر یک سیاست سازمانی این ویژگی را غیرفعال کند، یا اگر کاربر به مدت 30 روز سایر معیارهای واجد شرایط بودن را نداشته باشد، این مدل پاک می‌شود. واجد شرایط بودن ممکن است شامل استفاده از API و قابلیت دستگاه باشد. فرآیند پاکسازی دارای ویژگی‌های زیر است:

  • این مدل می‌تواند در هر زمانی، حتی در اواسط جلسه، بدون توجه به اجرای دستورات، حذف شود. این بدان معناست که API که در ابتدای جلسه در دسترس بوده است، می‌تواند ناگهان از دسترس خارج شود.
  • پس از پاک‌سازی، مدل به طور خودکار دوباره دانلود نمی‌شود . دانلود جدید باید توسط برنامه‌ای که تابع *.create() را فراخوانی می‌کند، آغاز شود.
  • وقتی مدل پایه حذف می‌شود، هرگونه وزن LoRA مرتبط نیز پس از یک دوره تنفس ۳۰ روزه حذف می‌شود.

نقش شما در مدیریت مدل

داشتن درک خوب از چرخه عمر مدل هوش مصنوعی داخلی، کلید ایجاد تجربه کاربری درست است. شما با دانلود یک بار مدل، کار خود را تمام نمی‌کنید، همچنین باید از احتمال ناپدید شدن ناگهانی مدل تحت فشار فضای دیسک یا به‌روزرسانی مدل با انتشار نسخه جدید آگاه باشید. همه این‌ها توسط مرورگر انجام می‌شود.

با پیروی از بهترین شیوه‌های دانلود مدل ، شما یک تجربه کاربری خوب در دانلود اولیه، دانلودهای مجدد و به‌روزرسانی‌ها ایجاد خواهید کرد.