Làm quen với AI tích hợp sẵn

Alexandra Klepper
Alexandra Klepper

Ngày xuất bản: 12 tháng 12 năm 2024, Cập nhật gần đây nhất: 20 tháng 5 năm 2025

Với các API AI tích hợp sẵn, ứng dụng web của bạn có thể thực hiện các tác vụ dựa trên AI mà không cần triển khai hoặc quản lý các mô hình AI riêng. Chúng tôi đang nỗ lực chuẩn hoá các API này trên nhiều trình duyệt.

Yêu cầu

Để sử dụng AI tích hợp sẵn, bạn cần đáp ứng các yêu cầu về mô hình và phần cứng.

Mô hình

API Trình dịch và API Trình phát hiện ngôn ngữ sử dụng các mô hình chuyên gia. Tất cả các API khác đều sử dụng một mô hình ngôn ngữ, được thiết kế để chạy cục bộ trên máy tính và máy tính xách tay.

API Tóm tắt, API Trình viết, API Trình viết lại và API Trình kiểm lỗi chính tả chỉ hỗ trợ phương thức chuyển văn bản thành văn bản. API Lời nhắc có các khả năng đa phương thức .

Gemini Nano trong Chrome

Chrome sử dụng các mô hình ngôn ngữ Gemini Nano. Gemini Nano không hoạt động trên thiết bị di động.

Kể từ Chrome 140, Gemini Nano hỗ trợ tiếng Anh, tiếng Tây Ban Nha và tiếng Nhật cho văn bản đầu vào và đầu ra.

Trước khi sử dụng các API AI tích hợp sẵn, hãy xác nhận Chính sách về các hành vi bị cấm khi sử dụng AI tạo sinh của Google.

Phần cứng

Các nhà phát triển và người dùng vận hành các tính năng bằng các API này trong Chrome phải đáp ứng các yêu cầu sau. Các trình duyệt khác có thể có các yêu cầu về hệ điều hành khác.

API Trình phát hiện ngôn ngữAPI Trình dịch hoạt động trong Chrome trên máy tính. Các API này không hoạt động trên thiết bị di động.

API Lời nhắc, API Tóm tắt, API Trình viết, API Trình viết lạiAPI Trình kiểm lỗi chính tả hoạt động trong Chrome khi đáp ứng các điều kiện sau:

  • Hệ điều hành: Windows 10 hoặc 11; macOS 13 trở lên (Ventura trở lên); Linux; hoặc ChromeOS (từ Nền tảng 16389.0.0 trở lên) trên các thiết bị Chromebook Plus. Chrome dành cho Android, iOS và ChromeOS trên các thiết bị không phải Chromebook Plus hiện chưa được các API sử dụng Gemini Nano hỗ trợ.
  • Bộ nhớ: Ít nhất 22 GB dung lượng trống trên ổ đĩa chứa hồ sơ Chrome của bạn.
  • GPU hoặc CPU: Các mô hình tích hợp sẵn có thể chạy bằng GPU hoặc CPU.
    • GPU: VRAM phải lớn hơn 4 GB.
    • CPU: RAM phải từ 16 GB trở lên và có từ 4 lõi CPU trở lên.
    • Lưu ý: API Lời nhắc có đầu vào âm thanh yêu cầu GPU.
  • Mạng: Dữ liệu không giới hạn hoặc kết nối không tính phí.

Kích thước chính xác của Gemini Nano có thể thay đổi khi trình duyệt cập nhật mô hình. Để xác định kích thước hiện tại, hãy truy cập vào chrome://on-device-internals.

Bắt tay khởi tạo

một số API AI tích hợp sẵn ở các giai đoạn phát triển khác nhau. Một số API ở phiên bản Chrome ổn định, một số API có sẵn cho những người tham gia dùng thử nguồn gốc và một số API khác chỉ có sẵn cho những người tham gia Chương trình dùng thử sớm.

Mỗi API có một bộ hướng dẫn riêng để bắt đầu và tải mô hình xuống, cả cho việc tạo mẫu cục bộ và trong môi trường sản xuất với các bản dùng thử nguồn gốc.

Bạn có thể sử dụng tất cả các API này khi xây dựng Tiện ích Chrome.

Tải mô hình xuống

Các API được tích hợp sẵn trong Chrome, cũng như các mô hình. Lần đầu tiên người dùng tương tác với các API này, mô hình phải được tải xuống trình duyệt.

Để xác định xem một API có thể sử dụng và đã sẵn sàng hay không, hãy gọi hàm availability() không đồng bộ. Hàm này trả về một lời hứa với một trong các giá trị sau:

  • "unavailable": Thiết bị của người dùng hoặc các tuỳ chọn phiên được yêu cầu không được hỗ trợ. Thiết bị có thể không đủ nguồn hoặc dung lượng ổ đĩa.
  • "downloadable": Cần tải thêm xuống để tạo phiên, có thể bao gồm mô hình chuyên gia, mô hình ngôn ngữ hoặc tinh chỉnh. Có thể bạn cần kích hoạt người dùng để gọi create().
  • "downloading": Quá trình tải xuống đang diễn ra và phải hoàn tất trước khi bạn có thể sử dụng phiên.
  • "available": Bạn có thể tạo phiên ngay lập tức.

Một số API yêu cầu các tuỳ chọn bổ sung khi gọi tính năng kiểm tra khả năng sử dụng. Ví dụ: API Lời nhắc yêu cầu khai báo hỗ trợ ngôn ngữ:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Kích hoạt người dùng

Nếu thiết bị có thể hỗ trợ các API AI tích hợp sẵn nhưng mô hình chưa được tải xuống, thì người dùng phải tương tác có ý nghĩa với trang của bạn để ứng dụng của bạn bắt đầu phiên bằng create().

Sử dụng thuộc tính để xác nhận rằng người dùng đã tương tác trực tiếp với trang kể từ khi trang tải xong.UserActivation.isActive Điều này có thể bao gồm thao tác nhấn, nhấp, nhấn phím, mousedown, hoặc các sự kiện kích hoạt cố định khác.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Ví dụ: với API Tóm tắt, bạn có thể yêu cầu người dùng tương tác với một nút có nội dung "Tóm tắt" để kích hoạt Summarizer.create(), hoặc bạn có thể tạo trình tóm tắt sau khi người dùng bắt đầu nhập, một sự kiện keydown.

Sử dụng API trên localhost

Tất cả các API đều có sẵn trên localhost trong Chrome.

  1. Chuyển đến chrome://flags/#optimization-guide-on-device-model.
  2. Chọn Enabled (Đã bật).
  3. Nhấp vào Relaunch (Khởi chạy lại) hoặc khởi động lại Chrome.

Đối với các API sử dụng Gemini Nano, bạn cũng phải đặt chrome://flags/#prompt-api-for-gemini-nano thành Enabled (Đã bật) hoặc Enabled multilingual (Đã bật đa ngôn ngữ). Bạn có thể xác nhận rằng mô hình đã tải xuống và hoạt động như dự định trong Bảng điều khiển DevTools. Chạy await LanguageModel.availability(); trong bảng điều khiển.

Khắc phục sự cố localhost

Nếu các cờ không xuất hiện trong chrome://flags, hãy đảm bảo bạn đã tải phiên bản Chrome mới nhất xuống.

Nếu mô hình không hoạt động như mong đợi, hãy làm theo các bước sau:

  1. Khởi động lại Chrome.
  2. Chuyển đến chrome://on-device-internals.
  3. Chọn thẻ Model Status (Trạng thái mô hình) và đảm bảo không có lỗi.
  4. Mở DevTools và nhập LanguageModel.availability(); vào bảng điều khiển. Hàm này sẽ trả về available.

Nếu cần, hãy đợi một lúc rồi lặp lại các bước này.

Quy trình tiêu chuẩn

Chúng tôi đang nỗ lực chuẩn hoá các API này, để chúng hoạt động trên tất cả các trình duyệt. Điều này có nghĩa là chúng tôi đã đề xuất các API cho cộng đồng nền tảng web và chuyển các API đó sang Nhóm cộng đồng Web Incubator của W3C để thảo luận thêm.

Chúng tôi đang yêu cầu ý kiến phản hồi từ W3C, Mozilla và WebKit cho từng API.

Tương tác và chia sẻ ý kiến phản hồi

Nếu bạn dùng thử AI tích hợp sẵn và có ý kiến phản hồi, chúng tôi rất mong được nghe ý kiến của bạn.