Lời nhắc AI kết hợp bằng Logic AI của Firebase

Xuất bản: Ngày 20 tháng 5 năm 2025

Để đáp ứng nhu cầu của người dùng, bất kể họ sử dụng nền tảng hay phần cứng nào, bạn có thể thiết lập một phương án dự phòng cho đám mây bằng Firebase AI Logic cho Prompt API tích hợp.

Xây dựng trải nghiệm AI kết hợp

AI tích hợp sẵn mang lại nhiều lợi ích, đáng chú ý nhất là:

  • Xử lý dữ liệu nhạy cảm tại địa phương: Nếu làm việc với dữ liệu nhạy cảm, bạn có thể cung cấp các tính năng AI cho người dùng bằng tính năng mã hoá hai đầu.
  • Sử dụng AI khi không có mạng: Người dùng có thể truy cập vào các tính năng AI, ngay cả khi không có mạng hoặc kết nối bị gián đoạn

Mặc dù những lợi ích này không áp dụng cho các ứng dụng đám mây, nhưng bạn có thể đảm bảo trải nghiệm liền mạch cho những người không thể truy cập vào AI tích hợp.

Bắt đầu sử dụng Firebase

  1. Tạo một dự án Firebase và đăng ký ứng dụng web của bạn.
  2. Đọc tài liệu về Firebase JavaScript SDK để tiếp tục thiết lập ứng dụng web.

Dự án Firebase tạo một dự án Google Cloud, có các dịch vụ và cấu hình dành riêng cho Firebase. Tìm hiểu thêm về Google Cloud và Firebase.

Cài đặt SDK

Quy trình công việc này sử dụng npm và yêu cầu các trình đóng gói mô-đun hoặc công cụ khung JavaScript. Firebase AI Logic được tối ưu hoá để hoạt động với các trình đóng gói mô-đun nhằm loại bỏ mã không dùng và giảm kích thước SDK.

npm install firebase

Sau khi cài đặt, hãy khởi động Firebase trong ứng dụng của bạn.

Sử dụng Firebase AI Logic

Sau khi cài đặt và khởi chạy Firebase, hãy chọn Gemini Developer API hoặc Vertex AI Gemini API, sau đó khởi chạy và tạo một phiên bản.

Sau khi khởi tạo, bạn có thể nhắc mô hình bằng văn bản hoặc dữ liệu đầu vào đa phương thức.

Câu lệnh dạng văn bản

Bạn có thể sử dụng văn bản thuần tuý cho các chỉ dẫn của mình đối với mô hình. Ví dụ: bạn có thể yêu cầu mô hình kể cho bạn một câu chuyện cười.

Để đảm bảo rằng AI tích hợp sẵn được dùng khi có trong hàm getGenerativeModel, hãy đặt mode thành prefer_on_device.

// Initialize the Google AI service.
const googleAI = getAI(firebaseApp);

// Create a `GenerativeModel` instance with a model that supports your use case.
const model = getGenerativeModel(googleAI, { mode: 'prefer_on_device' });

const prompt = 'Tell me a joke';

const result = await model.generateContentStream(prompt);

for await (const chunk of result.stream) {
  const chunkText = chunk.text();
  console.log(chunkText);
}
console.log('Complete response', await result.response);

Câu lệnh đa phương thức

Ngoài văn bản, bạn cũng có thể đưa ra câu lệnh bằng hình ảnh hoặc âm thanh. Bạn có thể yêu cầu mô hình mô tả nội dung của một hình ảnh hoặc chép lời một tệp âm thanh.

Bạn cần truyền hình ảnh dưới dạng một chuỗi được mã hoá base64 dưới dạng một đối tượng FileDataPart của Firebase. Bạn có thể thực hiện việc này bằng hàm trợ giúp fileToGenerativePart().

// Converts a File object to a `FileDataPart` object.
// https://firebase.google.com/docs/reference/js/vertexai.filedatapart
async function fileToGenerativePart(file) {
    const base64EncodedDataPromise = new Promise((resolve) => {
      const reader = new FileReader();
      reader.onload = () => resolve(reader.result.split(',')[1]);
      reader.readAsDataURL(file);
    });

    return {
      inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
    };
  }

  const fileInputEl = document.querySelector('input[type=file]');

  fileInputEl.addEventListener('change', async () => {
    const prompt = 'Describe the contents of this image.';

    const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

    // To generate text output, call generateContent with the text and image
    const result = await model.generateContentStream([prompt, imagePart]);

    for await (const chunk of result.stream) {
      const chunkText = chunk.text();
      console.log(chunkText);
    }
    console.log(Complete response: ', await result.response);
  });

Bản minh hoạ

Truy cập vào bản minh hoạ Firebase AI Logic trên nhiều thiết bị và trình duyệt. Bạn có thể xem câu trả lời của mô hình đến từ mô hình AI tích hợp hoặc đám mây.

Khi chạy trên phần cứng được hỗ trợ trong Chrome, bản minh hoạ sẽ sử dụng Prompt API và Gemini Nano. Chỉ có 3 yêu cầu được thực hiện cho tài liệu chính, tệp JavaScript và tệp CSS.

Logic AI của Firebase chạy trong Chrome, sử dụng các API AI tích hợp sẵn.

Khi ở một trình duyệt khác hoặc một hệ điều hành không có tính năng hỗ trợ AI tích hợp, sẽ có một yêu cầu bổ sung được gửi đến điểm cuối Firebase, https://firebasevertexai.googleapis.com.

Logic AI của Firebase chạy trong Safari, đưa ra yêu cầu cho các máy chủ của Firebase.

Tham gia và chia sẻ ý kiến phản hồi

Firebase AI Logic có thể là một lựa chọn tuyệt vời để tích hợp các chức năng AI vào ứng dụng web của bạn. Bằng cách cung cấp một giải pháp dự phòng cho đám mây khi Prompt API không hoạt động, SDK đảm bảo khả năng tiếp cận và độ tin cậy rộng hơn của các tính năng AI.

Hãy nhớ rằng các ứng dụng đám mây tạo ra những kỳ vọng mới về quyền riêng tư và chức năng, vì vậy, bạn cần thông báo cho người dùng biết dữ liệu của họ đang được xử lý ở đâu.