هوش مصنوعی چیست؟

الکساندرا کلپر
Alexandra Klepper

هوش مصنوعی (AI) شامل بسیاری از فناوری‌های پیچیده و نوظهور است که زمانی به ورودی انسان نیاز داشتند و اکنون می‌توانند توسط یک کامپیوتر انجام شوند. به طور کلی، هوش مصنوعی یک برنامه یا مدل غیرانسانی است که طیف گسترده‌ای از حل مسئله و خلاقیت را نشان می‌دهد.

واژه اختصاری هوش مصنوعی (AI) اغلب به جای یکدیگر برای نشان دادن انواع مختلف فناوری‌ها در حوزه هوش مصنوعی استفاده می‌شود، اما این فناوری‌ها می‌توانند از نظر دامنه بسیار متفاوت باشند.

تعدادی اصطلاح و مفهوم وجود دارد که هوش مصنوعی و یادگیری ماشینی را تعریف می‌کنند و ممکن است برای شما مفید باشند. در اینجا اصطلاحات رایج در مستندات کروم، به ویژه در مورد هوش مصنوعی سمت کلاینت، را خواهید یافت.

هوش مصنوعی سمت کلاینت

در حالی که اکثر ویژگی‌های هوش مصنوعی در وب به سرورها متکی هستند، هوش مصنوعی سمت کلاینت در مرورگر کاربر اجرا می‌شود و استنتاج را در دستگاه کاربر انجام می‌دهد. این امر مزایای بی‌شماری از جمله تأخیر کمتر، کاهش هزینه ایجاد ویژگی‌ها، افزایش حریم خصوصی کاربر و دسترسی آفلاین دارد.

هوش مصنوعی سمت کلاینت به مدل‌های کوچک‌تر و بهینه‌شده‌ای متکی است که برای عملکرد بهینه شده‌اند . این امکان وجود دارد که چنین مدل‌هایی برای وظایف خاص، از مدل‌های بزرگ‌تر سمت سرور بهتر عمل کنند. مورد استفاده خود را ارزیابی کنید تا مشخص شود چه راه‌حلی برای شما مناسب است.

هوش مصنوعی داخلی

با هوش مصنوعی داخلی، وب‌سایت شما از طریق APIهای مرورگر به پردازنده محلی متصل می‌شود. مدل داخلی مرورگر پاسخی ارسال می‌کند که API آن را به وب‌سایت شما برمی‌گرداند.

هوش مصنوعی داخلی نوعی هوش مصنوعی سمت کلاینت است که در آن مدل‌های کوچک‌تر در مرورگر تعبیه شده‌اند. برای کروم، این شامل Gemini Nano و مدل‌های حرفه‌ای می‌شود. پس از دانلود این مدل‌ها، تمام وب‌سایت‌ها و برنامه‌های وب که از هوش مصنوعی داخلی استفاده می‌کنند، می‌توانند از زمان دانلود صرف نظر کرده و مستقیماً به اجرای ویژگی‌ها و استنتاج محلی بپردازند.

APIهای هوش مصنوعی داخلی برای اجرای استنتاج در برابر نوع مناسب مدل برای انجام وظیفه طراحی شده‌اند. به عنوان مثال، API Prompt استنتاج را در برابر یک مدل زبانی اجرا می‌کند، در حالی که API Translator استنتاج را در برابر یک مدل متخصص داخلی اجرا می‌کند.

هوش مصنوعی سمت سرور

هوش مصنوعی سمت سرور شامل سرویس‌های هوش مصنوعی مبتنی بر ابر می‌شود. به Gemini 1.5 Pro که روی ابر اجرا می‌شود فکر کنید. این مدل‌ها معمولاً بسیار بزرگتر و قدرتمندتر هستند. این امر به ویژه در مورد مدل‌های زبانی بزرگ صادق است.

هوش مصنوعی هیبریدی

هوش مصنوعی ترکیبی به هر راهکاری اطلاق می‌شود که شامل هر دو جزء کلاینت و سرور باشد. برای مثال:

  • مدل‌های سمت کلاینت که جایگزین مدل‌های سمت سرور هستند و برای کارهایی ساخته شده‌اند که نمی‌توانند به طور مؤثر روی دستگاه انجام شوند.
    • ممکن است کمبود منابع در دستگاه وجود داشته باشد.
    • مدل یا API فقط در محیط‌های خاصی در دسترس است.
  • مدلی که برای امنیت بین کلاینت و سرور تقسیم شده است.
    • برای مثال، می‌توانید یک مدل را طوری تقسیم کنید که ۷۵٪ از اجرا در کلاینت و ۲۵٪ باقی‌مانده در سرور انجام شود. این کار مزایای سمت کلاینت را به همراه دارد، در حالی که به بخشی از مدل اجازه می‌دهد خارج از دستگاه باشد و در نتیجه خصوصی باقی بماند.

اگر از Prompt API استفاده می‌کنید، می‌توانید معماری ترکیبی را با Firebase AI Logic راه‌اندازی کنید.

هوش مصنوعی مولد

هوش مصنوعی مولد نوعی از یادگیری ماشینی است که به کاربران کمک می‌کند محتوایی ایجاد کنند که آشنا به نظر برسد و از ساخته‌های انسانی تقلید کند. هوش مصنوعی مولد از مدل‌های زبانی برای سازماندهی داده‌ها و ایجاد یا اصلاح متن، تصاویر، ویدیو و صدا، بر اساس زمینه ارائه شده، استفاده می‌کند. هوش مصنوعی مولد فراتر از تطبیق الگو و پیش‌بینی عمل می‌کند.

یک مدل زبان بزرگ (LLM) پارامترهای بی‌شماری (تا میلیاردها) دارد که می‌توانید از آنها برای انجام طیف گسترده‌ای از وظایف، مانند تولید، طبقه‌بندی یا خلاصه‌سازی متن یا تصاویر، استفاده کنید.

یک مدل زبان کوچک (SLM) پارامترهای بسیار کمتری برای انجام وظایف مشابه دارد و ممکن است در سمت کلاینت قابل استفاده باشد.

پردازش زبان طبیعی (NLP)

پردازش زبان طبیعی، شاخه‌ای از یادگیری ماشین است که بر کمک به کامپیوترها برای درک زبان انسان، از قواعد هر زبان خاص گرفته تا ویژگی‌های خاص، گویش و اصطلاحات عامیانه مورد استفاده افراد، تمرکز دارد.

عامل یا عامل هوش مصنوعی

یک عامل نرم‌افزاری است که به طور خودکار مجموعه‌ای از اقدامات را برای تکمیل یک وظیفه از طرف کاربر برنامه‌ریزی و اجرا می‌کند، در حالی که با تغییرات در محیط خود سازگار می‌شود. اقدامات ممکن است شامل توابع API یا پرس‌وجوهای پایگاه داده باشد که در یک صفحه وب یا از طریق یک برنامه شخص ثالث مانند Project Mariner انجام می‌شود.

یک چت‌بات ذاتاً یک عامل (agent) نیست. در حالی که یک چت‌بات به یک پیام‌رسان (چه انسان و چه غیر انسان) پاسخ می‌دهد و برای تولید محتوا، مانند پاسخ به سوالات، به یک مدل متکی است، یک عامل (agent) برای انجام یک کار با ابزارها یا یک پایگاه داده تعامل دارد.

خروجی مدل

خروجی مدل، صرف نظر از نوع مدل خاص، می‌تواند مبتنی بر درخواست یا جریانی باشد.

خروجی مبتنی بر درخواست

برای خروجی مبتنی بر درخواست (یا «غیر استریمینگ»)، مدل منتظر می‌ماند تا کل ورودی تولید شود، آن ورودی را به طور کلی پردازش می‌کند و سپس خروجی را تولید می‌کند.

خروجی استریمینگ

استریمینگ منبعی را که ارسال یا دریافت می‌کنید به بخش‌های کوچک‌تر تقسیم می‌کند و نتایج را به صورت بلادرنگ ارائه می‌دهد. خروجی به طور مداوم تنظیم می‌شود، زیرا ورودی اضافه و تنظیم می‌شود.

این یک تکنیک رایج برای مرورگرها جهت دریافت فایل‌های رسانه‌ای مانند بافر کردن ویدیو یا بارگذاری جزئی تصاویر است.

منابع اضافی

اگر در زمینه هوش مصنوعی در وب تازه‌کار هستید، مجموعه منابع هوش مصنوعی web.dev ما را بررسی کنید.