Làm quen với AI tích hợp sẵn

Alexandra Klepper
Alexandra Klepper

Ngày xuất bản: 12 tháng 12 năm 2024, Cập nhật gần đây nhất: 20 tháng 5 năm 2025

Với các API AI tích hợp sẵn, ứng dụng web của bạn có thể thực hiện các tác vụ dựa trên AI mà không cần triển khai hoặc quản lý các mô hình AI riêng. Chúng tôi đang nỗ lực chuẩn hoá các API này trên các trình duyệt.

Yêu cầu

Để sử dụng AI tích hợp sẵn, bạn cần đáp ứng các yêu cầu về mô hình và phần cứng.

Mô hình

Các API Trình dịch và Trình phát hiện ngôn ngữ sử dụng các mô hình chuyên gia. Tất cả các API khác đều sử dụng một mô hình ngôn ngữ, được thiết kế để chạy cục bộ trên máy tính để bàn và máy tính xách tay.

API Tóm tắt, API Viết, API Viết lại và API Soát lỗi chính tả chỉ hỗ trợ phương thức chuyển văn bản thành văn bản. API Lời nhắc có các khả năng đa phương thức .

Gemini Nano trong Chrome

Chrome sử dụng các mô hình ngôn ngữ Gemini Nano. Gemini Nano không hoạt động trên thiết bị di động.

Kể từ Chrome 149, Gemini Nano hỗ trợ tiếng Anh, tiếng Tây Ban Nha, tiếng Nhật, tiếng Đức và tiếng Pháp cho văn bản đầu vào và đầu ra.

Phần cứng

Nhà phát triển và người dùng vận hành các tính năng bằng các API này trong Chrome phải đáp ứng các yêu cầu sau. Các trình duyệt khác có thể có các yêu cầu khác về hệ điều hành.

API Trình phát hiện ngôn ngữAPI Trình dịch hoạt động trong Chrome trên máy tính. Các API này không hoạt động trên thiết bị di động.

The API Lời nhắc, API Tóm tắt, API Viết, API Viết lạiAPI Soát lỗi chính tả hoạt động trong Chrome khi đáp ứng các điều kiện sau:

  • Hệ điều hành: Windows 10 hoặc 11; macOS 13 trở lên (Ventura trở lên); Linux; hoặc ChromeOS (từ Nền tảng 16389.0.0 trở lên) trên các thiết bị Chromebook Plus. Chrome dành cho Android, iOS và ChromeOS trên các thiết bị không phải Chromebook Plus hiện chưa được các API sử dụng Gemini Nano hỗ trợ.
  • Bộ nhớ: Còn ít nhất 22 GB dung lượng trống trên ổ đĩa chứa hồ sơ Chrome của bạn.
  • GPU hoặc CPU: Các mô hình tích hợp sẵn có thể chạy bằng GPU hoặc CPU.
    • GPU: VRAM phải lớn hơn 4 GB.
    • CPU: RAM phải từ 16 GB trở lên và có từ 4 lõi CPU trở lên.
    • Lưu ý: API Lời nhắc có đầu vào âm thanh yêu cầu GPU.
  • Mạng: Dữ liệu không giới hạn hoặc kết nối không đo lượng dữ liệu.

Kích thước chính xác của Gemini Nano có thể thay đổi khi trình duyệt cập nhật mô hình. Để xác định kích thước hiện tại, hãy truy cập vào chrome://on-device-internals.

Bắt tay khởi tạo

một số API AI tích hợp sẵn ở các giai đoạn phát triển khác nhau. Một số API ở Bản ổn định của Chrome, một số API có sẵn cho những người tham gia bản dùng thử theo nguyên gốc và một số API khác chỉ có sẵn cho những người tham gia Chương trình dùng trước sớm.

Mỗi API có một bộ hướng dẫn riêng để bắt đầu và tải mô hình xuống, cả cho việc tạo mẫu cục bộ và trong môi trường sản xuất với các bản dùng thử theo nguồn gốc.

Bạn có thể sử dụng tất cả các API này khi tạo Tiện ích Chrome.

Tải mô hình xuống

Các API được tích hợp vào Chrome, cũng như các mô hình. Lần đầu tiên người dùng tương tác với các API này, mô hình phải được tải xuống trình duyệt.

Để xác định xem một API có thể sử dụng và đã sẵn sàng hay không, hãy gọi hàm availability() không đồng bộ. Hàm này trả về một lời hứa với một trong các giá trị sau:

  • "unavailable": Thiết bị của người dùng hoặc các lựa chọn phiên được yêu cầu không được hỗ trợ. Thiết bị có thể không đủ nguồn điện hoặc dung lượng ổ đĩa.
  • "downloadable": Bạn cần tải thêm xuống để tạo một phiên, có thể bao gồm mô hình chuyên gia, mô hình ngôn ngữ hoặc tinh chỉnh. Bạn có thể phải kích hoạt người dùng để gọi create().
  • "downloading": Quá trình tải xuống đang diễn ra và phải hoàn tất thì bạn mới có thể sử dụng một phiên.
  • "available": Bạn có thể tạo một phiên ngay lập tức.

Một số API yêu cầu các lựa chọn bổ sung khi gọi tính năng kiểm tra khả năng sử dụng. Ví dụ: API Lời nhắc yêu cầu khai báo hỗ trợ ngôn ngữ:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Kích hoạt người dùng

Nếu thiết bị có thể hỗ trợ các API AI tích hợp sẵn nhưng mô hình chưa được tải xuống, thì người dùng phải tương tác có ý nghĩa với trang của bạn để ứng dụng của bạn bắt đầu một phiên bằng create().

Sử dụng thuộc tính để xác nhận rằng người dùng đã tương tác trực tiếp với trang kể từ khi trang tải xong.UserActivation.isActive Thao tác này có thể bao gồm nhấn, nhấp, nhấn phím, mousedown, hoặc các sự kiện kích hoạt cố định khác.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Ví dụ: với API Tóm tắt, bạn có thể yêu cầu người dùng tương tác với một nút có nội dung "Tóm tắt" để kích hoạt Summarizer.create(), hoặc bạn có thể tạo trình tóm tắt sau khi người dùng bắt đầu nhập, một sự kiện keydown.

Sử dụng API trên localhost

Tất cả các API đều có trên localhost trong Chrome.

  1. Chuyển đến chrome://flags/#optimization-guide-on-device-model.
  2. Chọn Enabled (Đã bật).
  3. Nhấp vào Relaunch (Khởi động lại) hoặc khởi động lại Chrome.

Đối với các API sử dụng Gemini Nano, bạn cũng phải đặt chrome://flags/#prompt-api-for-gemini-nano thành Enabled (Đã bật) hoặc Enabled multilingual (Đã bật đa ngôn ngữ). Bạn có thể xác nhận rằng mô hình đã tải xuống và hoạt động như dự kiến trong Bảng điều khiển DevTools. Chạy await LanguageModel.availability(); trong bảng điều khiển.

Khắc phục sự cố localhost

Nếu các cờ không xuất hiện trong chrome://flags, hãy đảm bảo rằng bạn đã tải phiên bản Chrome mới nhất xuống.

Nếu mô hình không hoạt động như dự kiến, hãy làm theo các bước sau:

  1. Khởi động lại Chrome.
  2. Chuyển đến chrome://on-device-internals.
  3. Chọn thẻ Model Status (Trạng thái mô hình) và đảm bảo không có lỗi.
  4. Mở DevTools và nhập LanguageModel.availability(); vào bảng điều khiển. Hàm này sẽ trả về available.

Nếu cần, hãy đợi một lúc rồi lặp lại các bước này.

Quy trình tiêu chuẩn

Chúng tôi đang nỗ lực chuẩn hoá các API này, để chúng hoạt động trên tất cả các trình duyệt. Điều này có nghĩa là chúng tôi đã đề xuất các API này cho cộng đồng nền tảng web và chuyển chúng sang Nhóm cộng đồng ươm tạo web W3C để thảo luận thêm.

Chúng tôi đang yêu cầu ý kiến phản hồi từ W3C, Mozilla và WebKit cho từng API.

Tương tác và chia sẻ ý kiến phản hồi

Nếu bạn dùng thử AI tích hợp sẵn và có ý kiến phản hồi, chúng tôi rất mong được nghe ý kiến của bạn.