Google vừa thay đổi cơ chế giới hạn sử dụng của Gemini AI Pro và AI Ultra, kéo theo làn sóng phản ứng từ người dùng trả phí trên toàn cầu. Nhiều người báo cáo chỉ sau 5 lượt trao đổi với AI, họ đã tiêu tốn tới 50% hạn mức — và một số đã quyết định hủy đăng ký.

"Cửa sổ 5 giờ" và cơ chế tính theo lượng tính toán

Thay đổi cốt lõi lần này là việc Google chuyển từ giới hạn số tin nhắn cố định mỗi ngày sang mô hình "compute-used" — tức là tính dựa trên lượng tài nguyên tính toán thực tế tiêu thụ. Điều này có nghĩa: một câu hỏi ngắn và một đoạn hội thoại dài phức tạp sẽ "ngốn" quota hoàn toàn khác nhau.

Song song đó, Google áp dụng cơ chế "cửa sổ 5 giờ" — tương tự cách Claude của Anthropic đang vận hành. Hạn mức sẽ được reset theo chu kỳ thời gian, nhưng nếu đạt tổng ngưỡng tuần thì người dùng sẽ bị khóa cho đến chu kỳ tiếp theo.

Trên subreddit của Gemini, hàng loạt bình luận phàn nàn đã xuất hiện. Một người dùng cho biết chỉ sau 5 lượt hỏi-đáp, họ đã tiêu hết 50% hạn mức của gói Pro và quyết định hủy đăng ký ngay sau đó. Đây không phải trường hợp cá biệt — nhiều người dùng khác xác nhận tình trạng tương tự, đặc biệt khi làm việc với các đoạn hội thoại dài hoặc nội dung phức tạp.

Với người dùng quen dùng Claude, cơ chế này không xa lạ: các cuộc trò chuyện dài sẽ tiêu token theo cấp số nhân, buộc người dùng phải chia nhỏ tác vụ và mở chat mới thường xuyên hơn. Nay Gemini cũng đang đi theo hướng đó.

Trả tiền gói Pro nhưng bị chuyển xuống Flash

Ngoài vấn đề quota, một số người dùng còn báo cáo hiện tượng đáng lo ngại hơn: dù đang chọn Gemini Pro, hệ thống tự động chuyển sang Gemini Flash — phiên bản nhẹ hơn, kém mạnh hơn — vào những khung giờ cao điểm.

Đây là điều khó chấp nhận với người đang trả phí cho gói cao cấp. Ngoài ra, theo các báo cáo được Android Authority dẫn lại, việc bật tính năng cá nhân hóa (personalization) cũng khiến quota bị tiêu nhanh hơn đáng kể.

Cần lưu ý: những thay đổi này chỉ ảnh hưởng đến người dùng trả phí (AI Pro và AI Ultra). Người dùng gói miễn phí không bị tác động trực tiếp bởi đợt siết giới hạn lần này.

Google thay đổi nhưng không thông báo đầy đủ

Điều khiến người dùng bức xúc hơn cả không chỉ là giới hạn bị siết, mà là cách Google thực hiện thay đổi này một cách thiếu minh bạch.

Android Authority cho biết chính phóng viên viết bài — Akshay Gangwar — không nhận được email thông báo về thay đổi, trong khi Managing Editor của cùng tòa soạn là Adamya Sharma lại nhận được. Ngay trong một tổ chức, việc thông báo đã không đồng nhất — điều đó cho thấy nhiều người dùng thông thường hoàn toàn có thể bị "siết quota mà không hay biết".

Đáng chú ý, đợt thay đổi này diễn ra đúng thời điểm Google công bố giảm giá AI Ultra tại Google I/O 2026 — tạo ra cảm giác giá được hạ nhưng đi kèm với những điều chỉnh âm thầm ở phía sau.

Cấu trúc gói đăng ký mới sau Google I/O 2026

Tại Google I/O 2026, Google đã tái cơ cấu toàn bộ hệ thống đăng ký AI. Cụ thể:

GóiGiá/thángĐiểm nổi bật
AI Ultra (trung cấp mới)$100 (~2.550.000 VND)Gấp 5 lần hạn mức Pro, dành cho developer, 20TB lưu trữ
AI Ultra (cao cấp nhất)$200 (~5.100.000 VND)Gấp 20 lần hạn mức Pro

Gói AI Ultra cao nhất đã được giảm từ $250 (~6.375.000 VND) xuống còn $200 (~5.100.000 VND). Tuy nhiên, dung lượng lưu trữ đi kèm cũng bị cắt từ 30TB xuống còn 20TB — một sự đánh đổi không được truyền thông rộng rãi.

Ngoài ra, người dùng Pro và Ultra có thể mua thêm credit nạp thêm (top-up) để duy trì hiệu suất cao khi đã chạm ngưỡng quota — đây là mô hình thu phí theo lượng tiêu thụ thực tế, tương tự các nền tảng API thương mại.

Một điểm kỹ thuật đáng lưu ý: Gemini 3.5 Flash (ra mắt ngày 19/5/2026) được cho là tiết kiệm chi phí hơn khoảng 25% so với Gemini 3.1 Pro trong các tác vụ lập trình. Trong khi đó, Gemini 3.1 Pro sẽ tính phí tăng gấp đôi (lên $4/$18) với các prompt vượt quá 200K token.

Người dùng nên làm gì ngay bây giờ?

Nếu bạn đang sử dụng Gemini AI Pro hoặc AI Ultra, một số điều chỉnh thói quen có thể giúp kéo dài quota:

  • Mở chat mới cho mỗi tác vụ riêng biệt, thay vì kéo dài một cuộc hội thoại
  • Tránh dán văn bản dài hoặc lặp lại nhiều lần trong cùng một thread
  • Cân nhắc tắt tính năng cá nhân hóa nếu không thực sự cần thiết
  • Theo dõi mức tiêu thụ trước khi quyết định nâng cấp hoặc mua thêm credit

Đối với người dùng tại Việt Nam, các gói Gemini AI Pro và AI Ultra hiện được thanh toán qua thẻ quốc tế hoặc Google Play. Với mức giá từ $19,99/tháng (~510.000 VND) cho gói Pro đến $200/tháng (~5.100.000 VND) cho gói Ultra cao nhất, đây là khoản chi không nhỏ — việc Google siết quota mà không thông báo rõ ràng là lý do chính đáng để người dùng xem xét lại nhu cầu thực tế trước khi tiếp tục gia hạn.

Nguồn