Dipublikasikan: 22 Mei 2025
AI mengubah cara developer web membangun situs dan aplikasi web. Di Google I/O 2025, kami membagikan hal-hal yang telah kami kerjakan selama setahun terakhir, menunjukkan cara partner kami memanfaatkan AI di web, dan mengumumkan API AI bawaan baru.
Apakah Anda melewatkan acara ini? Kabar baiknya, kini Anda dapat menonton talk show sesuai permintaan.
AI bawaan praktis dengan Gemini Nano di Chrome
Misi utama kami adalah membuat Chrome dan web lebih cerdas untuk semua developer dan semua pengguna. Dalam talk show ini, Thomas Steiner membagikan update AI bawaan , kasus penggunaan praktis, dan gambaran masa depan kami.
AI bawaan menjalankan model sisi klien di browser, yang memiliki beberapa keunggulan:
- Pribadi: Data pengguna sensitif tetap berada di perangkat, dan tidak perlu keluar dari browser.
- Offline: Aplikasi dapat mengakses kemampuan AI, bahkan tanpa koneksi internet.
- Performa: Berkat akselerasi hardware, API ini memberikan performa yang sangat baik.
Lihat contoh kode untuk setiap API AI bawaan, dapatkan update statusnya, dan lihat perusahaan mana yang menerapkan teknologi ini.
API multimodal
Kami sedang mengerjakan API multimodal baru. Artinya, Anda dapat bertanya kepada model tentang apa yang "dilihat" dalam konten visual atau "didengar" dalam konten audio. Misalnya, dapatkan saran untuk teks alternatif pada gambar yang diupload di platform blog, yang dapat disempurnakan dan disesuaikan oleh pengguna. Atau, Anda dapat meminta Gemini Nano untuk menulis deskripsi atau transkripsi untuk podcast.
AI hybrid
Salah satu tantangan yang dihadapi developer dengan AI sisi klien adalah tidak semua platform dan browser memenuhi persyaratan hardware untuk menjalankan model di perangkat. Gemini dan Firebase bermitra untuk membangun Firebase Web SDK sehingga jika implementasi sisi klien tidak tersedia, Anda dapat menggunakan Gemini Nano di server.
Bekerja sama dengan Anda
Kami sangat senang telah bekerja sama dengan banyak developer dalam API AI bawaan. Upaya kami tidak mungkin dilakukan tanpa Anda.
- Program Pratinjau Awal: Lebih dari 16.000 developer telah bergabung dengan EPP, menguji API baru, menemukan kasus penggunaan baru, dan memberikan masukan untuk membangun AI yang lebih baik untuk web.
- Hackathon: Kami telah menyelenggarakan dua hackathon, dan Anda membangun beberapa situs dan Ekstensi yang luar biasa.
Pekerjaan Anda belum selesai. Terus bagikan masukan Anda, uji API bawaan baru, dan kami akan terus melakukan iterasi. Anda bahkan dapat membantu menstandarkan API ini dengan bergabung ke Grup Komunitas Machine Learning Web W3C.
Masa depan Ekstensi Chrome dengan Gemini di browser Anda
Jumlah Ekstensi yang didukung AI telah meningkat dua kali lipat dalam dua tahun terakhir. Faktanya, 10% dari semua Ekstensi yang diinstal dari Chrome Web Store menggunakan AI. Dalam talk show ini, Sebastian Benz memberikan contoh praktis tentang alasan Ekstensi Chrome dan Gemini merupakan kombinasi yang sangat efektif.
Contohnya adalah cara Anda dapat membuat browser lebih bermanfaat dengan mengekstrak dan memproses data dari situs di klien menggunakan API perintah yang baru diluncurkan Chrome.
Selain menunjukkan potensi kemampuan multimodal baru dari API perintah Chrome di Ekstensi Chrome untuk membuat audio dan gambar lebih mudah diakses oleh pengguna.
Untuk melihat masa depan penjelajahan dengan menjelaskan cara Project Mariner Google DeepMind menggunakan Ekstensi Chrome dan Gemini Cloud API terbaru untuk membangun agen browser lengkap.
Jelajahi potensi penggunaan Gemini di cloud atau di browser di Ekstensi Chrome untuk membangun pengalaman penjelajahan baru dan membuat browser lebih bermanfaat.
Kasus penggunaan dan strategi AI Web di dunia nyata
Yuriko Hirota dan Swetha Gopalakrishnan menyoroti contoh dunia nyata tentang perusahaan yang menggunakan AI di web untuk meningkatkan bisnis dan pengalaman pengguna mereka.Baik solusi mereka menggunakan model sisi klien, sisi server, atau solusi hybrid, yang penting adalah fungsi dan fitur baru yang menarik yang Anda sediakan untuk pengguna, saat ini.
BILIBILI membuat streaming video mereka lebih menarik dengan fitur baru: komentar layar peluru. Mereka menawarkan komentar pengguna real-time dalam video, yang dirender di belakang pembicara. Untuk melakukannya, mereka menggunakan segmentasi gambar, konsep machine learning yang dipahami dengan baik. Hasilnya, durasi sesi meningkat sebesar 30%. Tokopedia mengurangi hambatan dalam proses verifikasi penjual menggunakan model deteksi wajah, untuk menilai kualitas foto yang diupload. Hasilnya, mereka mengurangi persetujuan manual hingga hampir 70%.
Vision Nanny, platform web untuk anak-anak dengan Gangguan Penglihatan Serebral (CVI), menyediakan aktivitas stimulasi penglihatan yang didukung AI. Mereka menggunakan beberapa library MediaPipe, termasuk model deteksi landmark tangan, yang menemukan titik-titik penting tangan dalam gambar, video, atau secara real-time. Pilot dengan 50 anak menunjukkan bahwa Vision Nanny memberikan respons 5 kali lebih cepat daripada aktivitas stimulasi visual manual. Terapis melaporkan bahwa mereka menghemat rata-rata tiga jam per sesi dengan menghapus penyiapan manual.
Google Meet memiliki beberapa fitur yang diaktifkan oleh AI, mulai dari meningkatkan pencahayaan hingga mengurangi video yang buram dan tidak jelas. Tantangan terbesarnya adalah fitur ini harus berfungsi secara real-time. Di sinilah WebAssembly (Wasm) berperan, untuk memanfaatkan sepenuhnya daya CPU komputer dan memungkinkan pemrosesan video real-time.
Ini hanyalah beberapa contoh dunia nyata tentang AI yang terjadi di web. Beberapa perusahaan lain bereksperimen dengan API AI bawaan, dan beberapa di antaranya membagikan pekerjaan mereka dalam studi kasus.
Agen AI Web sisi klien untuk membangun pengalaman pengguna masa depan yang lebih cerdas
Jason Mayes menjelaskan masa depan internet: Agen AI Web. Web memiliki masa depan yang agentik, yang menghadirkan kemampuan AI langsung ke browser, untuk melakukan pekerjaan yang berguna atas nama Anda, di luar kemampuan model bahasa besar (LLM).
Dengan pendekatan sisi klien, ada peningkatan privasi, pengurangan latensi, dan potensi penghematan biaya yang signifikan. Agen memungkinkan Anda mengupgrade situs yang ada, untuk melakukan tugas secara otomatis bagi pengguna, memilih dan menggunakan alat yang diekspos secara dinamis–berpotensi dalam loop–sehingga agen dapat menyelesaikan tugas yang berpotensi kompleks atau multi-langkah.
Agen dapat:
- Merencanakan dan membagi sub-tugas, menangani masalah yang lebih kompleks melalui perencanaan multi-langkah untuk memecah tugas menjadi langkah-langkah logis untuk diselesaikan.
- Memilih alat terbaik, baik itu fungsi, penggunaan API, atau datastore akses ke pengetahuan dasar model bahasa yang ditambah, lalu melakukan tindakan di dunia luar.
- Mempertahankan memori berbasis konteks, berdasarkan output sebelumnya dari agen atau alat eksternal. Memori jangka pendek berfungsi seperti buffer FIFO histori konteks hingga ukuran jendela konteks model, dibandingkan dengan memori jangka panjang tempat database vektor dapat digunakan untuk menyimpan informasi yang akan diingat sesuai kebutuhan dari sesi percakapan sebelumnya atau sumber data lainnya.
Agen AI Web dirancang untuk diintegrasikan ke dalam teknologi web yang ada di JavaScript. Pada akhirnya, penting bagi kita untuk terus mempercepat hardware agar dapat menjalankan model di browser dengan sebaik-baiknya. Melihat ke masa depan, teknologi seperti WebNN akan memainkan peran penting dalam mengoptimalkan eksekusi model di seluruh CPU, GPU, dan NPU. Dengan tren menuju LLM yang lebih kecil dan kemajuan yang berkelanjutan, hal ini hanya akan menjadi lebih efektif di masa mendatang.
Pertimbangkan untuk menggunakan pendekatan hybrid, yang menggabungkan pemrosesan di perangkat dengan panggilan cloud strategis, sehingga Anda dapat membuat pengalaman pengguna yang cerdas, responsif, dan dipersonalisasi di browser saat ini. Dalam waktu dekat, keuntungan Anda dari investasi dalam pendekatan AI Web akan terbayar karena perangkat menjadi lebih mampu menjalankan LLM.
Ikuti Google I/O 2025
Kami telah merilis semua talk show untuk Google I/O 2025, dengan playlist khusus untuk developer web. Tonton lebih banyak di io.google/2025.