Расширение возможностей блоггеров: как CyberAgent внедрил встроенный искусственный интеллект для улучшения создания контента

Юрико Хирота
Yuriko Hirota
Казунари Хара
Kazunari Hara

Опубликовано: 28 апреля 2025 г., Последнее обновление: 21 мая 2025 г.

Стремительное развитие искусственного интеллекта открывает новые горизонты для веб-приложений, особенно с появлением локальных функций. Узнайте, как CyberAgent, ведущая японская интернет-компания, использует встроенный искусственный интеллект Chrome и API Prompt для улучшения процесса ведения блогов на своей платформе Ameba Blog .

Мы рассказываем об их целях, преимуществах работы со встроенным ИИ, трудностях, с которыми они столкнулись, а также даем ценные идеи другим разработчикам, использующим встроенный ИИ.

Что такое Prompt API?

Объяснитель Интернет Расширения Статус Chrome Намерение
GitHub Пробный запуск В пробной версии Origin Хром 138 Вид Намерение экспериментировать

API Prompt помогает разработчикам использовать обширные языковые модели для добавления функций искусственного интеллекта непосредственно в свои приложения. Определяя пользовательские запросы, приложения могут выполнять такие задачи, как извлечение данных, генерация контента и персонализированные ответы. В Chrome API Prompt выполняет вывод на стороне клиента с помощью Gemini Nano . Эта локальная обработка, независимо от используемой модели, повышает конфиденциальность данных и скорость ответа. Независимо от используемой модели, скорость ответа клиента тоже.

Помощь искусственного интеллекта авторам блога Ameba

CyberAgent выявил распространённую проблему авторов: зачастую трудоёмкий процесс создания убедительного контента, особенно заголовков. Они выдвинули гипотезу, что интеграция функций искусственного интеллекта в интерфейс создания блогов может значительно повысить качество и эффективность создания контента. Их целью было предоставить инструменты, которые вдохновляют блогеров и помогают им создавать увлекательный контент.

Компания CyberAgent разработала расширение для Chrome с API Prompt. Это расширение предоставляет набор функций на базе искусственного интеллекта, призванных помочь авторам блога Ameba создавать заголовки, последующие абзацы и улучшать текст в целом.

CyberAgent требовал гибкости возможностей, что привело к появлению Prompt API. Благодаря безграничным возможностям в одном API, CyberAgent смог точно определить, что будет лучше всего работать и наиболее полезно для авторов Ameba.

CyberAgent протестировал расширение с участием избранных блогеров, которые предоставили ценную информацию о практичности предлагаемых функций. Отзывы помогли CyberAgent определить оптимальные области применения ИИ-помощника и доработать дизайн расширения. Основываясь на положительных результатах и ​​отзывах, CyberAgent планирует выпустить эту функцию в будущем, предоставив возможности клиентского ИИ непосредственно своему блогерскому сообществу.

Давайте подробнее рассмотрим эти особенности.

Пишите лучшие заголовки и названия

Расширение генерирует несколько вариантов заголовков на основе всего содержимого блога. Авторы блогов могут дорабатывать эти варианты, используя такие опции, как «Сгенерировать заново», «Более вежливо», «Более неформально» или «Сгенерировать похожие заголовки» и другие.

CyberAgent специально разработал пользовательский интерфейс, чтобы пользователям не приходилось писать подсказки. Таким образом, даже те, кто не знаком с разработкой подсказок, смогут воспользоваться возможностями ИИ.

Авторы могут перегенерировать заголовки, сделав их более формальными, более неформальными или перегенерировать в том же тоне.

Расширение также может генерировать привлекательные заголовки для отдельных разделов блога, которые авторы могут запросить, выбрав соответствующий текст для заголовка.

Выбрав текст, авторы могут создать заголовки, относящиеся к данному разделу.

Код для генерации заголовка с помощью Prompt API включает в себя начальное приглашение и пользовательское приглашение. Начальное приглашение предоставляет контекст и инструкции по получению определённого типа выходных данных, тогда как пользовательские приглашения запрашивают у модели взаимодействие с тем, что пишет пользователь. Подробнее об этом коде читайте в статье «Развёртывание помощи с ИИ» .

Сгенерировать последующие абзацы

Расширение помогает блогерам преодолеть творческий кризис, генерируя последующие абзацы на основе выбранного текста. Используя контекст предыдущего абзаца, ИИ составляет продолжение абзаца, позволяя авторам не сбиваться с творческого пути.

Автор может обратиться за помощью в написании следующего абзаца, используя контекст предыдущего абзаца.

Улучшить и отредактировать текст

Gemini Nano анализирует выделенный текст и предлагает варианты улучшения. Пользователи могут повторно внести изменения, добавив заметки по тону и языку, чтобы сделать текст «симпатичнее» или «проще».

Создайте улучшенную версию выбранного текста с пояснением того, что именно улучшилось в модели.

Развертывание помощи ИИ

CyberAgent разбил свой код расширения на три этапа: создание сеанса, триггер и подсказка модели.

Сначала они проверяют наличие и поддержку встроенного ИИ в браузере. Если да, они создают сеанс с параметрами по умолчанию.

if (!LanguageModel) {
  // Detect the feature and display "Not Supported" message as needed
  return;
}
// Define default values for topK and temperature within the application
const DEFAULT_TOP_K = 3;
const DEFAULT_TEMPERATURE = 1;
let session = null;

async function createAISession({ initialPrompts, topK, temperature } = {}) {
  const { available, defaultTopK, maxTopK, defaultTemperature } =
    await LanguageModel.availability();
  // "readily", "after-download", or "no"
  if (available === "no") {
    return Promise.reject(new Error('AI not available'));
  }
  const params = {
    monitor(monitor) {
      monitor.addEventListener('downloadprogress', event => {
        console.log(`Downloaded: ${event.loaded} of ${event.total} bytes.`);
      });
    },
    initialPrompts: initialPrompts || '',
    topK: topK || defaultTopK,
    temperature: temperature || defaultTemperature,
  };
  session = await LanguageModel.create(params);
  return session;
}

У каждой функции есть вспомогательная функция, активируемая пользователем. После активации, когда пользователь нажимает соответствующую кнопку, сеанс обновляется соответствующим образом.

async function updateSession({ initialPrompts, topK, temperature } = {
  topK: DEFAULT_TOP_K,
  temperature: DEFAULT_TEMPERATURE,
}) {
  if (session) {
    session.destroy();
    session = null;
  }
  session = await createAISession({
    initialPrompts,
    topK,
    temperature,
  });
}

После обновления сеанса они выдают запрос модели в соответствии с функцией. Например, вот код для генерации заголовка и его повторной генерации в более формальном тоне.

async function generateTitle() {
    // Initialize the model session
    await updateSession({
      initialPrompts: [
        { role: 'system', 
          content: `Create 3 titles suitable for the blog post's content,
          within 128 characters, and respond in JSON array format.`,
        }
      ]
    });
    const prompt = `Create a title for the following
    blog post.${textareaEl.textContent}`;
    const result = await session.prompt(prompt);
    try {
      const fixedJson = fixJSON(result);
      // display result
      displayResult(fixedJSON);
    } catch (error) {
      // display error
      displayError();
    }
  }
  async function generateMoreFormalTitle() {
    // Do not execute updateSession to reuse the session during regeneration
    const prompt = 'Create a more formal title.';
    const result = await session.prompt(prompt);
    ...
 }

Преимущества встроенного ИИ

Встроенный ИИ — это тип клиентского ИИ , то есть вывод данных происходит на устройстве пользователя. Компания CyberAgent решила использовать встроенные API ИИ в Gemini Nano из-за неоспоримых преимуществ, которые он предоставляет как разработчикам приложений, так и пользователям.

Основные преимущества, на которых фокусируется CyberAgent, включают:

  • Безопасность и конфиденциальность
  • Расходы
  • Оперативность и надежность
  • Простота разработки

Безопасность и конфиденциальность

Возможность запуска моделей ИИ непосредственно на устройстве пользователя без передачи данных на внешние серверы имеет первостепенное значение. Черновики блогов не предназначены для публичного просмотра, поэтому CyberAgent не хочет отправлять их на сторонний сервер.

Встроенный ИИ загружает Gemini Nano на пользовательские устройства, устраняя необходимость отправки и получения данных с серверов. Это особенно полезно при написании текстов, поскольку черновики могут содержать конфиденциальную информацию или непреднамеренные выражения. Встроенный ИИ сохраняет исходный и сгенерированный контент локально, а не отправляет его на сервер, что повышает безопасность и защищает конфиденциальность контента.

Экономия средств

Одним из главных преимуществ использования встроенного ИИ является то, что браузер включает в себя Gemini Nano, а API-интерфейсы бесплатны. Никаких дополнительных или скрытых платежей.

Встроенный ИИ значительно снижает затраты на сервер и может полностью исключить затраты, связанные с выводом данных с помощью ИИ. Это решение может быть быстро масштабировано для большой базы пользователей и позволяет пользователям отправлять последовательные запросы для уточнения результатов без дополнительных комиссий.

Оперативность и надежность

Встроенный ИИ обеспечивает стабильное и быстрое время отклика, независимо от состояния сети. Это позволило пользователям генерировать контент снова и снова, что значительно упрощает возможность пробовать новые идеи и быстро получать удовлетворительные результаты.

Простота разработки

Встроенный ИИ в Chrome упрощает процесс разработки, предоставляя легкодоступный API. Разработчики получают преимущество от простоты создания функций на базе ИИ для своих приложений.

Gemini Nano и встроенные API для искусственного интеллекта устанавливаются в Chrome, поэтому дополнительная настройка или управление моделями не требуются. API используют JavaScript, как и другие API браузеров, и не требуют специальных знаний в области машинного обучения.

Опыт CyberAgent в работе с Prompt API позволил получить ценные уроки о нюансах работы с LLM на стороне клиента.

  • Непоследовательные ответы : Как и другие программы LLM, Gemini Nano не гарантирует идентичные результаты для одного и того же запроса. CyberAgent обнаружил ответы в неожиданных форматах (например, Markdown и недопустимый JSON). Даже при наличии инструкций результаты могут значительно различаться. При реализации любого приложения или расширения Chrome со встроенным ИИ может быть полезно добавить обходной путь, чтобы гарантировать, что выходные данные всегда будут в правильном формате.
  • Лимит токенов : управление использованием токенов имеет решающее значение. CyberAgent использовал такие свойства и методы, как inputUsage , inputQuota и measureInputUsage() для управления сеансами , поддержания контекста и сокращения потребления токенов. Это было особенно важно при уточнении заголовков.
  • Ограничения по размеру модели : поскольку модель загружается и хранится на устройстве пользователя, она значительно меньше, чем серверная модель. Это означает, что для достижения удовлетворительных результатов, особенно при резюмировании, крайне важно предоставить достаточный контекст в запросе. Подробнее о размерах LLM .

CyberAgent подчёркивает, что, хотя клиентские модели пока не доступны повсеместно во всех браузерах и устройствах, а модели меньшего размера имеют ограничения, он всё равно может обеспечить впечатляющую производительность для определённых задач. Возможность быстрой итерации и экспериментирования без серверных затрат делает его ценным инструментом.

Они советуют найти баланс, признавая, что добиться идеальных ответов сложно с любым ИИ, будь то серверный или клиентский. Наконец, они видят будущее, в котором гибридный подход, сочетающий преимущества как серверного, так и клиентского ИИ, откроет ещё больший потенциал.

Взгляд в будущее

Исследование CyberAgent встроенного ИИ демонстрирует захватывающие возможности бесшовной интеграции ИИ для улучшения пользовательского опыта. Расширение CyberAgent, разработанное для работы с Ameba Blog, демонстрирует, как эти технологии можно применять на практике для решения реальных задач, предлагая ценные уроки для широкого сообщества веб-разработчиков.

По мере развития технологий и расширения поддержки браузеров и устройств мы ожидаем увидеть еще больше инновационных приложений встроенного ИИ и других форм клиентского ИИ.

Ресурсы

Благодарности

Благодарим блогеров Ameba: ao , Nodoka , Erin , Chiaki и socchi , которые оставили отзывы и помогли улучшить расширение. Благодарим Томаса Штайнера , Александру Клеппер и Себастьяна Бенца за помощь в написании и рецензировании этой записи в блоге.