Kebijakan batas pemakaian berbasis komputasi yang diperkenalkan Google di konferensi I/O pekan lalu ternyata menyisakan masalah. Alih-alih menggunakan hitungan harian seperti sebelumnya, sistem baru ini membatasi pengguna berdasarkan kompleksitas perintah yang mereka berikan—semakin berat model yang digunakan, semakin cepat kuota habis. Akibatnya, banyak pengguna kehabisan jatah dalam waktu singkat.
Josh Woodward, VP Google Labs, Gemini, dan AI Studio, mengumumkan sejumlah perbaikan pada Kamis (29/5) melalui unggahan di X (sebelumnya Twitter). "Kami dengar keluhan kalian soal kehabisan kuota terlalu cepat," tulisnya.
Woodward menegaskan bahwa perintah yang menggunakan model Flash-Lite—varian paling ringan dari Gemini—tidak akan mengurangi kuota pengguna. Lebih penting lagi, jika permintaan gagal karena kesalahan sistem, kuota tidak akan terpotong. "Kesalahan sistem adalah tanggung jawab kami, bukan Anda. Kuota hanya dipakai untuk permintaan yang berhasil," jelas Woodward.
Untuk pengguna yang sering memanfaatkan mode Deep Research, Google kini menampilkan perincian pemakaian dan notifikasi yang lebih detail. Langkah ini bertujuan mencegah pengguna mencapai batas secara tidak sadar saat menjalankan perintah kompleks.
Selain itu, Google menerapkan batas atas jumlah kuota yang bisa dikonsumsi oleh satu perintah tunggal, terutama untuk model Gemini 3.1 Pro yang paling canggih. Dampaknya akan terasa ketika pengguna melampirkan file berukuran besar—aktivitas yang selama ini sangat boros sumber daya komputasi.
Woodward juga mengonfirmasi bahwa Google telah memperbaiki bug yang menyebabkan pembuatan video menggunakan model Omni—teknologi AI anyar Google yang bisa menghasilkan konten dari berbagai format input—menghabiskan kuota secara tidak wajar. Sebagai kompensasi, jumlah generasi video Omni untuk pelanggan Google AI Ultra dilipatgandakan.
Perubahan lain yang tak kalah penting: Gemini kini akan mengingat model terakhir yang digunakan pengguna di semua sesi mendatang. "Model hanya akan berubah jika Anda menggantinya secara manual atau jika kuota habis sehingga sistem otomatis beralih ke model yang lebih ringan," ujar Woodward.
Dengan 900 juta pengguna aktif bulanan, tekanan terhadap infrastruktur Gemini memang tak bisa dihindari. Namun respons cepat Google terhadap keluhan pengguna menunjukkan bahwa transparansi batas pemakaian menjadi isu krusial di era AI generatif—terutama ketika pengguna mulai mengandalkan chatbot untuk pekerjaan produktif, bukan sekadar eksperimen.