Google vừa tung ra biến thể Gemini 3.5 Flash mới dành cho nền tảng phát triển AI Antigravity, đồng thời reset toàn bộ bộ đếm rate limit về 0 cho cả người dùng miễn phí lẫn trả phí. Đây là cơ hội để các lập trình viên tại Việt Nam đang sử dụng Antigravity thử nghiệm mô hình cập nhật với chất lượng đầu ra ổn định hơn ở các tác vụ phức tạp.

Biến thể mới giảm "suy nghĩ dư thừa", giữ vững cấu trúc code

Varun Mohan, người phụ trách dự án Antigravity, đã công bố bản cập nhật trên X. Theo Mohan, biến thể Gemini 3.5 Flash mới "giảm đáng kể lượng suy nghĩ dư thừa" và thể hiện độ bền vượt trội ở các tác vụ kỹ thuật phần mềm có độ khó cao. Lợi ích thực tế cho lập trình viên là: với yêu cầu đơn giản, mô hình không lãng phí thời gian; còn với tác vụ nặng, cấu trúc code không bị phá vỡ giữa chừng.

Bản cập nhật này nhằm khắc phục những hạn chế của biến thể "Low-effort" trước đó. Phiên bản Low-effort được thiết kế để giải quyết tình trạng AI "suy nghĩ quá mức" với những yêu cầu cơ bản, qua đó tránh tiêu hao token cho các tác vụ coding đơn giản. Tuy nhiên, mục tiêu đó được đánh giá là chưa hoàn toàn đạt được.

Cái giá của việc tiết kiệm 45% token

Gemini 3.5 Flash (Low) đạt mức giảm khoảng 45% lượng token sinh ra so với mô hình gốc — nay được gọi là biến thể "Medium". Đây là công cụ nhẹ nhàng và linh hoạt cho các tác vụ đơn giản, nhưng phản hồi từ lập trình viên cho thấy chất lượng đầu ra và tính nhất quán về cấu trúc sụt giảm rõ rệt ngay khi tác vụ trở nên nặng hơn một chút.

Đánh đổi giữa hiệu quả và độ bền đã để lại một "điểm mù": những tác vụ trông có vẻ "đơn giản" nhưng đột nhiên đòi hỏi phân tích sâu thì biến thể Low không xử lý được. Phiên bản mới hướng đến việc bịt kín điểm mù đó, dù Google chưa làm rõ cải tiến được áp dụng cho biến thể Low hay Medium.

Reset rate limit toàn diện, vì sao chỉ giới hạn ở Antigravity?

Theo thông lệ, Google đã reset hoàn toàn rate limit cho người dùng Antigravity. Bộ đếm của cả gói miễn phí lẫn trả phí đều trở về 0, cho phép trải nghiệm ngay mô hình cập nhật.

Cơ chế biến thể theo "effort-level" (Low / Medium / High) là đặc thù riêng của Antigravity. Theo các báo cáo, người dùng không nên kỳ vọng sẽ sớm thấy tùy chọn kiểu "Gemini 3.5 Flash Low" xuất hiện trong ứng dụng Gemini phổ thông. Antigravity với vai trò môi trường phát triển AI và ứng dụng Gemini dành cho người dùng cuối được vận hành như hai sản phẩm riêng biệt.

Antigravity 2.0: Nền tảng agent thống nhất từ I/O 2026

Antigravity 2.0 — được công bố tại Google I/O 2026 — là bản nâng cấp gộp IDE desktop, CLI viết bằng Go, SDK và Managed Agents API vào một nền tảng duy nhất. Mô hình nền Gemini 3.5 Flash chạy ở tốc độ 289 token/giây, được tối ưu cho các vòng lặp agent.

Các thành phần đáng chú ý:

  • Antigravity CLI: Dùng chung agent harness với bản desktop, mọi cải tiến lõi đều tự động đồng bộ
  • Managed Agents API: Chỉ với một lệnh gọi API, có thể khởi tạo sandbox Linux độc lập, giao việc sử dụng công cụ và thực thi code cho agent
  • Scheduled Tasks: Gọi agent theo lịch cron đặt trước để tự động hóa các tác vụ định kỳ

Đáng lưu ý, Gemini CLI hiện hành và tiện ích mở rộng Gemini Code Assist IDE sẽ ngừng xử lý request từ ngày 18/06/2026.

Cơ cấu giá AI Ultra được tái thiết với gói $100

Google AI Ultra đã thay đổi đáng kể cơ cấu giá với việc bổ sung gói $100/tháng (khoảng 2.550.000 VND) mới. Gói cao nhất hiện giảm từ $250 (khoảng 6.375.000 VND) xuống còn $200/tháng (khoảng 5.100.000 VND), mở rộng lựa chọn theo quy mô sử dụng. Gói $100 cung cấp hạn mức sử dụng trên ứng dụng Gemini và Antigravity gấp 5 lần so với Google AI Pro.

GóiGiá/thángVị thế hạn mức Antigravity
AI Ultra (gói mới)$100 (~2.550.000 VND)Gấp 5 lần so với Pro
AI Ultra (cao cấp)$200 (~5.100.000 VND)Cao nhất, gồm tính năng frontier

Rate limit của Gemini Flash và Gemini Pro vốn tách biệt nay đã được hợp nhất, chuyển sang phương thức tiêu hao dựa trên giá API. Hạn mức của người đăng ký Pro/Ultra làm mới mỗi 5 giờ. Người đăng ký Ultra mới và hiện hữu còn nhận được $100 (khoảng 2.550.000 VND) tín dụng AI thưởng đến ngày 25/05/2026.

Tiếng nói từ cộng đồng: Cần thanh hiển thị hạn mức tuần

Trên X, người dùng đang đề xuất bổ sung thanh hiển thị tình trạng sử dụng theo tuần. Lý do là hiện tại không thể kiểm tra hạn mức còn lại hoặc thời điểm reset, dẫn đến rủi ro đột ngột đạt giới hạn ngay giữa quá trình coding. Nếu hết hạn mức ngay trước khi bắt tay vào tác vụ nặng, code đang thiết kế dở dang sẽ rơi vào tình trạng treo lơ lửng.

Mohan được cho là đã ghi nhận phản hồi này. Đối với cộng đồng lập trình viên Việt Nam đang dùng Antigravity cho công việc hàng ngày, đây là thời điểm thuận lợi để kiểm chứng cải thiện về chất lượng đầu ra và độ bền của biến thể mới trong quy trình làm việc thực tế — đặc biệt với các dự án outsource phần mềm vốn đòi hỏi output ổn định và đoán định được chi phí token.

Nguồn