Xuất bản: 24 tháng 9 năm 2024, Cập nhật gần nhất: 20 tháng 5 năm 2025
Trước khi dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác, bạn phải xác định ngôn ngữ được dùng trong văn bản đó. Trước đây, để dịch, bạn phải tải văn bản lên một dịch vụ đám mây, thực hiện bản dịch trên máy chủ rồi tải kết quả xuống.
Language Detector API hoạt động ở phía máy khách, nghĩa là bạn có thể bảo vệ quyền riêng tư của người dùng. Mặc dù có thể gửi một thư viện cụ thể thực hiện việc này, nhưng bạn sẽ cần tải thêm tài nguyên xuống.
Trường hợp sử dụng tính năng phát hiện ngôn ngữ
Language Detector API chủ yếu hữu ích trong các trường hợp sau:
- Xác định ngôn ngữ của văn bản đầu vào để có thể dịch.
- Xác định ngôn ngữ của văn bản đầu vào để có thể tải mô hình chính xác cho các tác vụ dành riêng cho ngôn ngữ, chẳng hạn như phát hiện nội dung độc hại.
- Xác định ngôn ngữ của văn bản đầu vào để có thể gắn nhãn chính xác, chẳng hạn như trên các trang mạng xã hội trực tuyến.
- Xác định ngôn ngữ của văn bản đầu vào để có thể điều chỉnh giao diện của ứng dụng cho phù hợp. Ví dụ: trên một trang web của Bỉ, chỉ hiển thị giao diện phù hợp với những người dùng nói tiếng Pháp.
Bắt đầu
Xem các yêu cầu về phần cứng
Các nhà phát triển và người dùng vận hành các tính năng bằng những API này trong Chrome phải đáp ứng các yêu cầu sau. Các trình duyệt khác có thể có các yêu cầu khác về hệ điều hành.
Language Detector và Translator API hoạt động trong Chrome trên máy tính. Những API này không hoạt động trên thiết bị di động.
Prompt API, Summarizer API, Writer API, Rewriter API và Proofreader API hoạt động trong Chrome khi đáp ứng các điều kiện sau:
- Hệ điều hành: Windows 10 hoặc 11; macOS 13 trở lên (Ventura trở lên); Linux; hoặc ChromeOS (từ Nền tảng 16389.0.0 trở lên) trên các thiết bị Chromebook Plus. Chrome dành cho Android, iOS và ChromeOS trên các thiết bị không phải Chromebook Plus hiện chưa được các API sử dụng Gemini Nano hỗ trợ.
- Bộ nhớ: Ít nhất 22 GB dung lượng trống trên ổ đĩa chứa hồ sơ Chrome của bạn.
- GPU hoặc CPU: Các mô hình tích hợp có thể chạy bằng GPU hoặc CPU.
- GPU: VRAM phải lớn hơn 4 GB.
- CPU: RAM phải từ 16 GB trở lên và có từ 4 lõi CPU trở lên.
- Lưu ý: Prompt API có dữ liệu đầu vào âm thanh yêu cầu phải có GPU.
- Mạng: Dữ liệu không giới hạn hoặc kết nối không tính phí. Kết nối Wi-Fi và Ethernet thường không đo lượng dữ liệu theo mặc định, trong khi kết nối di động thường có đo lượng dữ liệu.
Kích thước chính xác của Gemini Nano có thể thay đổi khi trình duyệt cập nhật mô hình. Để xác định kích thước hiện tại, hãy truy cập vào chrome://on-device-internals.
Chạy tính năng phát hiện để xem trình duyệt có hỗ trợ Language Detector API hay không.
if ('LanguageDetector' in self) {
// The Language Detector API is available.
}
Tải mô hình xuống
Tính năng phát hiện ngôn ngữ phụ thuộc vào một mô hình được tinh chỉnh cho tác vụ cụ thể là phát hiện ngôn ngữ. Mặc dù API được tích hợp trong trình duyệt, nhưng mô hình này sẽ được tải xuống theo yêu cầu vào lần đầu tiên một trang web cố gắng sử dụng API. Trong Chrome, mô hình này rất nhỏ so với các mô hình khác. Mô hình này có thể đã có sẵn vì được các tính năng khác của Chrome sử dụng.
Để xác định xem mô hình đã sẵn sàng sử dụng hay chưa, hãy gọi hàm không đồng bộ
LanguageDetector.availability(). Nếu phản hồi cho availability() là downloadable, hãy theo dõi tiến trình tải xuống và thông báo cho người dùng, vì quá trình tải xuống có thể mất thời gian.
Để kích hoạt quá trình tải xuống và tạo thực thể cho trình phát hiện ngôn ngữ, hãy kiểm tra xem
người dùng có kích hoạt hay không. Sau đó, hãy gọi hàm LanguageDetector.create() không đồng bộ.
const detector = await LanguageDetector.create({
monitor(m) {
m.addEventListener('downloadprogress', (e) => {
console.log(`Downloaded ${e.loaded * 100}%`);
});
},
});
Chạy trình phát hiện ngôn ngữ
Language Detector API sử dụng một mô hình xếp hạng để xác định ngôn ngữ có khả năng được sử dụng nhiều nhất trong một đoạn văn bản nhất định. Xếp hạng là một loại học máy, trong đó mục tiêu là sắp xếp danh sách các mục. Trong trường hợp này, Language Detector API xếp hạng các ngôn ngữ từ xác suất cao nhất đến thấp nhất.
Hàm detect() có thể trả về kết quả đầu tiên, câu trả lời có khả năng nhất hoặc lặp lại các ứng viên được xếp hạng với mức độ tin cậy.
Kết quả này được trả về dưới dạng danh sách các đối tượng {detectedLanguage, confidence}. Mức độ confidence được biểu thị dưới dạng giá trị từ 0.0 (mức độ tin cậy thấp nhất) đến 1.0 (mức độ tin cậy cao nhất).
const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
// Show the full list of potential languages with their likelihood, ranked
// from most likely to least likely. In practice, one would pick the top
// language(s) that cross a high enough threshold.
console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...
Sân chơi API
Thử nghiệm Language Detector API trong sân chơi API của chúng tôi. Nhập văn bản được viết bằng nhiều ngôn ngữ vào vùng văn bản.
Chính sách về quyền, iframe và Web Worker
Theo mặc định, Language Detector API chỉ có sẵn cho các cửa sổ cấp cao nhất và iframe cùng nguồn gốc của chúng. Bạn có thể uỷ quyền truy cập vào API cho iframe nhiều nguồn gốc
bằng cách sử dụng thuộc tính allow="" của Chính sách về quyền:
<!--
The hosting site at https://main.example.com can grant a cross-origin iframe
at https://cross-origin.example.com/ access to the Language Detector API by
setting the `allow="language-detector"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-detector"></iframe>
Language Detector API không có sẵn trong Web Worker. Điều này là do sự phức tạp của việc thiết lập một tài liệu chịu trách nhiệm cho mỗi worker để kiểm tra trạng thái tuân thủ chính sách của Chính sách về quyền.
Chia sẻ ý kiến phản hồi của bạn
Chúng tôi muốn xem những gì bạn đang xây dựng bằng Language Detector API. Chia sẻ trang web và ứng dụng web của bạn với chúng tôi trên X, YouTube, và LinkedIn.
Nếu bạn có ý kiến phản hồi về cách triển khai của Chrome, hãy báo cáo lỗi Chromium.
Tham gia Chương trình dùng trước để xem trước các API AI tích hợp mới và truy cập vào cuộc thảo luận trên danh sách gửi thư của chúng tôi.