Tonton diskusi AI kami di I/O 2025

Alexandra Klepper
Alexandra Klepper

Dipublikasikan: 22 Mei 2025

AI mengubah cara developer web membangun situs dan aplikasi web. Di Google I/O 2025, kami menyampaikan apa yang telah kami kerjakan selama setahun terakhir, mendemonstrasikan cara partner kami memanfaatkan AI di web, dan mengumumkan API AI bawaan baru.

Apakah Anda melewatkan acara? Kabar baiknya, Anda kini dapat menonton ceramah secara on-demand.

AI bawaan yang praktis dengan Gemini Nano di Chrome

Misi utama kami adalah membuat Chrome dan web menjadi lebih pintar bagi semua developer dan semua pengguna. Dalam diskusi ini, Thomas Steiner membagikan info terbaru tentang AI bawaan, kasus penggunaan praktis, dan pandangan tentang masa depan kita.

AI bawaan menjalankan model sisi klien di browser, yang memiliki beberapa keuntungan:

  • Pribadi: Data pengguna sensitif tetap berada di perangkat, sehingga tidak perlu keluar dari browser.
  • Offline: Aplikasi dapat mengakses kemampuan AI, bahkan tanpa koneksi internet.
  • Berperforma tinggi: Berkat akselerasi hardware, API ini memberikan performa yang sangat baik.

Lihat contoh kode untuk setiap API AI bawaan, dapatkan info terbaru tentang statusnya, dan lihat perusahaan yang menerapkan teknologi ini.

API Multimodal

Kami sedang mengerjakan API multimodal yang benar-benar baru. Artinya, Anda dapat bertanya kepada Gemini Nano tentang apa yang "dilihat" dalam konten visual atau "didengar" dalam konten audio. Misalnya, dapatkan saran untuk teks alternatif pada gambar yang diupload di platform blog, yang dapat disempurnakan dan disesuaikan oleh pengguna. Atau, Anda dapat meminta Gemini Nano untuk menulis deskripsi atau transkripsi untuk podcast.

AI Hybrid

Salah satu tantangan yang dihadapi developer dengan AI sisi klien adalah tidak semua platform dan browser memenuhi persyaratan hardware untuk menjalankan model di perangkat. Gemini dan Firebase berkolaborasi untuk membuat Firebase Web SDK sehingga jika implementasi sisi klien tidak tersedia, Anda dapat melakukan penggantian ke Gemini Nano di server.

Bekerja sama dengan Anda

Kami sangat senang telah bekerja sama dengan banyak developer dalam API AI bawaan. Upaya kami tidak mungkin dilakukan tanpa Anda.

Pekerjaan Anda belum selesai. Terus berikan masukan Anda, uji API bawaan baru, dan kami akan terus melakukan iterasi. Anda bahkan dapat membantu menstandardisasi API ini dengan bergabung ke Web Machine Learning Community Group W3C.

Masa depan Ekstensi Chrome dengan Gemini di browser Anda

Jumlah Ekstensi yang didukung AI telah meningkat dua kali lipat dalam dua tahun terakhir. Faktanya, 10% dari semua Ekstensi yang diinstal dari Chrome Web Store menggunakan AI. Dalam diskusi ini, Sebastian Benz memberikan contoh praktis mengapa Ekstensi Chrome dan Gemini adalah kombinasi yang sangat efektif.

Contohnya mulai dari cara membuat browser lebih bermanfaat dengan mengekstrak dan memproses data dari situs di klien menggunakan API perintah yang baru diluncurkan Chrome.

Menunjukkan potensi kemampuan multimodal baru dari API perintah Chrome di Ekstensi Chrome untuk membuat audio dan gambar lebih mudah diakses oleh pengguna.

Untuk melihat masa depan penjelajahan dengan menjelaskan cara Project Mariner Google DeepMind menggunakan Ekstensi Chrome dan Gemini Cloud API terbaru untuk membangun agen browser yang lengkap.

Jelajahi potensi penggunaan Gemini di cloud atau di browser dalam Ekstensi Chrome untuk menciptakan pengalaman penjelajahan baru dan membuat browser lebih bermanfaat.

Kasus penggunaan dan strategi AI Web di dunia nyata

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

Yuriko Hirota dan Swetha Gopalakrishnan menyoroti contoh dunia nyata perusahaan yang menggunakan AI di web untuk meningkatkan bisnis dan pengalaman pengguna mereka.Terlepas dari apakah solusi mereka menggunakan model sisi klien, sisi server, atau solusi hybrid, yang penting adalah fungsi dan fitur baru yang menarik yang Anda sediakan untuk pengguna Anda, saat ini.

BILIBILI membuat streaming video mereka lebih menarik dengan fitur baru: komentar layar peluru. Fitur ini menawarkan komentar pengguna real-time dalam video, yang ditampilkan di belakang pembicara. Untuk melakukannya, mereka menggunakan segmentasi gambar, sebuah konsep machine learning yang sudah dipahami dengan baik. Hasilnya, durasi sesi meningkat sebesar 30%. Tokopedia mengurangi hambatan dalam proses verifikasi penjual menggunakan model deteksi wajah, untuk menilai kualitas foto yang diupload. Hasilnya, mereka mengurangi persetujuan manual hingga hampir 70%.

Vision Nanny, platform web untuk anak-anak dengan Gangguan Penglihatan Serebral (CVI), menyediakan aktivitas stimulasi penglihatan yang didukung AI. Mereka menggunakan beberapa pustaka MediaPipe, termasuk model deteksi penanda tangan, yang menemukan titik-titik utama tangan dalam gambar, video, atau secara real-time. Uji coba dengan 50 anak menunjukkan bahwa Vision Nanny memberikan respons 5x lebih cepat daripada aktivitas stimulasi visual manual. Terapis melaporkan penghematan rata-rata tiga jam per sesi dengan menghilangkan penyiapan manual.

Google Meet memiliki beberapa fitur yang didukung AI, mulai dari meningkatkan kualitas pencahayaan hingga mengurangi blur dan video yang buram. Tantangan terbesarnya adalah fitur ini harus berfungsi secara real-time. Di sinilah WebAssembly (Wasm) berperan, untuk memanfaatkan sepenuhnya kemampuan CPU komputer dan memungkinkan pemrosesan video secara real-time.

Ini hanyalah beberapa contoh nyata penerapan AI di web. Beberapa perusahaan lain bereksperimen dengan API AI bawaan, dan beberapa di antaranya membagikan hasil karyanya dalam studi kasus.

Agen AI Web sisi klien untuk membangun pengalaman pengguna yang lebih cerdas di masa mendatang

Jason Mayes menjelaskan masa depan internet: Agen AI Web. Web memiliki masa depan yang berorientasi pada agen, yang menghadirkan kemampuan AI langsung ke browser, untuk melakukan tugas yang berguna atas nama Anda, di luar kemampuan model bahasa besar (LLM).

Dengan pendekatan sisi klien, privasi ditingkatkan, latensi berkurang, dan potensi penghematan biaya yang signifikan. Agen memungkinkan Anda mengupgrade situs yang ada, melakukan tugas secara mandiri untuk pengguna, memilih dan menggunakan alat yang diekspos secara dinamis–berpotensi dalam loop–sehingga agen dapat menyelesaikan tugas yang berpotensi kompleks atau multi-langkah.

Agen dapat:

  • Merencanakan dan membagi subtugas, menangani masalah yang lebih kompleks melalui perencanaan multi-langkah untuk menguraikan tugas menjadi langkah-langkah logis yang harus diselesaikan.
  • Memilih alat terbaik, baik itu fungsi, penggunaan API, atau akses datastore ke pengetahuan dasar model bahasa yang ditingkatkan, lalu melakukan tindakan di dunia luar.
  • Mempertahankan memori berbasis konteks, berdasarkan output sebelumnya dari agen atau alat eksternal. Memori jangka pendek berfungsi seperti buffer FIFO histori konteks hingga ukuran jendela konteks model, dibandingkan dengan memori jangka panjang yang dapat menggunakan database vektor untuk menyimpan informasi yang akan dipanggil sesuai kebutuhan dari sesi percakapan sebelumnya atau sumber data lainnya.

Agen AI web dirancang untuk terintegrasi dengan teknologi web yang ada di JavaScript. Pada akhirnya, penting bagi kami untuk terus mempercepat hardware kami agar dapat menjalankan model di browser dengan sebaik-baiknya. Ke depannya, teknologi seperti WebNN akan memainkan peran penting dalam mengoptimalkan eksekusi model di seluruh CPU, GPU, dan NPU. Dengan tren menuju LLM yang lebih kecil dan kemajuan yang berkelanjutan, hal ini hanya akan menjadi lebih efektif pada masa mendatang.

Pertimbangkan untuk menggunakan pendekatan hybrid, yang menggabungkan pemrosesan di perangkat dengan panggilan cloud strategis, sehingga Anda dapat menciptakan pengalaman pengguna yang cerdas, responsif, dan dipersonalisasi di browser sekarang juga. Dalam waktu dekat, keuntungan Anda dari berinvestasi dalam pendekatan AI Web akan terbayar seiring dengan makin mampunya perangkat menjalankan LLM.

Menyaksikan Google I/O 2025

Kami telah merilis semua materi diskusi untuk Google I/O 2025, dengan playlist khusus untuk developer web. Tonton lebih banyak lagi di io.google/2025.