Google vừa mở rộng chế độ tư duy nâng cao Extended Thinking của Gemini đến mọi người dùng — bao gồm cả tài khoản miễn phí — trên Web, Android và iOS. Tuy nhiên, đi kèm là cảnh báo rõ ràng: dùng sai mục đích có thể khiến bạn "đốt" credit nhanh hơn dự kiến. Đối với người dùng tại Việt Nam đang tận dụng Gemini cho công việc và học tập, đây là thay đổi đáng chú ý nhưng cũng đòi hỏi thói quen sử dụng mới.

Extended Thinking là gì và khác Standard ra sao?

Trong giao diện cài đặt mô hình của Gemini, Google bổ sung một tùy chọn mới mang tên Thinking — cho phép người dùng quyết định mức độ "suy nghĩ" của AI trước khi trả lời. Có hai lựa chọn:

  • Standard: phản hồi nhanh, phù hợp các câu hỏi đơn giản
  • Extended: AI dành nhiều thời gian hơn để lập luận từng bước (step-by-step reasoning), thích hợp cho phân tích phức tạp và nghiên cứu chuyên sâu

Theo bài đăng trên X của ông Josh Woodward, Phó Chủ tịch phụ trách Gemini tại Google, tính năng này đã được triển khai rộng rãi trên cả giao diện web lẫn ứng dụng di động Android và iOS. Trước đây, một số tài khoản đã được thử nghiệm dần dần, nhưng đến đợt phát hành mới nhất thì tất cả người dùng — kể cả gói miễn phí — đều có thể bật Extended.

Mô hình nào hỗ trợ Extended và Deep Think?

Tùy chọn Standard / Extended hiện có mặt trên Gemini 3.5 FlashGemini 3.5 Flash-Light — hai mô hình mở cho cả gói miễn phí lẫn trả phí.

Riêng Gemini 3.1 Pro còn có thêm cấp thứ ba mang tên Deep Think — chế độ tư duy sâu nhất. Tuy nhiên, theo nội dung video do ông Woodward chia sẻ, Deep Think dường như chỉ dành riêng cho thuê bao AI Ultra.

Mô hìnhStandardExtendedDeep Think
Gemini 3.5 FlashCó (miễn phí và trả phí)Chưa có
Gemini 3.5 Flash-LightCó (miễn phí và trả phí)Chưa có
Gemini 3.1 ProChỉ AI Ultra

Để chuyển đổi, người dùng vào phần model settings của Gemini và chọn mức Thinking mong muốn.

Cảnh báo "tokenmaxxing" — vì sao nên cân nhắc trước khi bật Extended

Dù Extended Thinking có thể cho ra câu trả lời chi tiết và lập luận chặt chẽ hơn, Google cũng thẳng thắn lưu ý rằng chế độ này tiêu thụ usage limit nhanh hơn đáng kể. Cụm từ "tokenmaxxing" — chỉ hiện tượng người dùng vô tình tiêu hao lượng lớn token vì độ phức tạp của prompt — đang được nhắc đến nhiều trong cộng đồng AI.

Theo lời khuyên từ chính Google: với các truy vấn đơn giản, tìm kiếm thông thường hay câu hỏi ngắn, hãy giữ chế độ Standard để bảo toàn credit. Chỉ nên kích hoạt Extended khi bạn thực sự cần phân tích sâu, viết bài dài, hoặc giải bài toán nhiều bước.

Đối với người dùng Việt Nam — vốn chuộng các công cụ AI miễn phí — đây là yếu tố cần đặc biệt lưu tâm nếu không muốn nhanh chóng chạm trần sử dụng hàng ngày.

Gemini Spark — trợ lý AI hoạt động 24/7 dưới nền

Tại sự kiện Google I/O 2026 (ngày 19/5/2026), Google đã giới thiệu Gemini Spark — một AI agent cá nhân hoạt động liên tục 24/7. Điểm đặc biệt: ngay cả khi smartphone hoặc PC của bạn tắt nguồn, máy ảo (VM) chuyên dụng trên Google Cloud vẫn tiếp tục xử lý các tác vụ.

Một số đặc điểm nổi bật:

  • Tích hợp gốc với Gmail, Calendar, Drive, Docs, Sheets, Slides, YouTube và Maps (mặc định tắt, người dùng phải bật từng dịch vụ)
  • Mỗi tác vụ chạy trong ephemeral VM — máy ảo sẽ bị hủy sau khi hoàn tất
  • Các hành động có tác động lớn (như gửi email) sẽ cần xác nhận từ người dùng trước khi thực thi
  • Nền tảng kết hợp mô hình Gemini 3.5 và một harness mang tên Antigravity

Thông tin xác thực người dùng được mã hóa và không chuyển trực tiếp cho agent. Toàn bộ lưu lượng được điều phối qua Agent Gateway của Google, có áp dụng chính sách DLP.

AI Ultra giảm giá mạnh — gói cao cấp giờ chỉ từ 99,99 USD/tháng

Cũng trong I/O 2026, Google đã tinh chỉnh giá gói AI Ultra. Mức khởi điểm giảm từ 249,99 USD/tháng (khoảng 6.375.000 VND) xuống còn 99,99 USD/tháng (khoảng 2.550.000 VND). Bên cạnh đó, gói cao cấp hơn dành cho người dùng cần usage limit lớn được niêm yết ở mức 200 USD/tháng (khoảng 5.100.000 VND).

Hạng mụcChi tiết
Giá khởi điểm mới99,99 USD/tháng (~2.550.000 VND)
Gói cao cấp200 USD/tháng (~5.100.000 VND)
Mô hình đi kèmGemini 3.1 Pro, Deep Think, Veo 3.1
AI credit hàng tháng25.000
Agent đi kèmGemini Spark

Đáng chú ý, Gemini 3.1 Pro ra mắt từ 19/2/2026 với 3 mức suy luận có thể điều chỉnh (thấp, trung, cao). Ở thiết lập HIGH, mô hình hoạt động như "Deep Think Mini" và đạt 77,1% trên benchmark ARC-AGI-2.

Mặc dù Google AI Ultra chưa được phân phối chính thức tại Việt Nam và người dùng cần thanh toán bằng thẻ quốc tế, mức giảm giá đáng kể này có thể mở rộng tệp người dùng cao cấp trong khu vực Đông Nam Á, bao gồm cả các chuyên gia, lập trình viên và sáng tạo nội dung tại Việt Nam.

Lời khuyên cho người dùng Việt: dùng đúng để không phí credit

Với việc Extended Thinking nay đã miễn phí, người dùng Gemini tại Việt Nam có thêm công cụ mạnh để xử lý các tác vụ phức tạp mà trước đây thường cần đến ChatGPT Plus hay Claude Pro. Tuy nhiên, hãy ghi nhớ nguyên tắc: Standard cho việc nhẹ, Extended cho việc nặng. Tóm tắt văn bản ngắn, tìm kiếm thông tin nhanh, hỏi đáp thường ngày — Standard là đủ. Chỉ chuyển sang Extended khi bạn cần lập kế hoạch, đọc hiểu code phức tạp, hay phân tích dữ liệu nhiều tầng.

Riêng người dùng đăng ký AI Ultra có thể thử nghiệm Deep Think trên Gemini 3.1 Pro, nhưng nên giới hạn ở các tác vụ thực sự khó để tránh đốt credit không cần thiết.

Nguồn