Tại Google I/O 2026, Google chính thức giới thiệu Gemini Spark — một AI agent hoạt động liên tục trên đám mây, không phụ thuộc vào việc ứng dụng có đang mở hay không. Khác với chatbot thông thường, Gemini Spark chủ động xử lý tác vụ trên Gmail, Docs, Slides và thậm chí có thể mua sắm thay người dùng thông qua giao thức thanh toán mới AP2. Giai đoạn beta hiện giới hạn cho người dùng Google AI Ultra tại Mỹ, nhưng đây là tín hiệu rõ ràng về hướng đi tiếp theo của Google trong cuộc đua AI agent toàn cầu.

Gemini Spark là gì và điều gì khiến nó khác biệt?

Điểm cốt lõi của Gemini Spark nằm ở kiến trúc cloud-resident — tức là agent này tiếp tục chạy trên máy chủ của Google ngay cả khi bạn đóng ứng dụng Gemini, khóa điện thoại hay gập laptop lại. Kết quả xử lý sẽ chờ sẵn khi bạn quay lại, tạo cảm giác "không có thời gian chờ".

Đây không phải mô hình hỏi-đáp từng lượt. Gemini Spark được thiết kế để chủ động tiến hành workflow xuyên suốt nhiều dịch vụ — Gmail, Google Docs, Google Slides — mà không cần người dùng ra lệnh từng bước. Google cho biết hệ thống sẽ "học theo sở thích của người dùng theo thời gian và thực hiện tác vụ thay họ". Ngoài bộ Workspace, Chrome cũng nằm trong lộ trình tích hợp sắp tới.

Về nền tảng kỹ thuật, theo TechCrunch, Spark được xây dựng trên Gemini base model kết hợp với Google Antigravity agentic harness — tầng điều phối agent mà Google đang phát triển song song.

Những tác vụ cụ thể Gemini Spark có thể làm

Theo Android Authority, Google đã trình diễn một số use case tiêu biểu:

  • Quét sao kê thẻ tín dụng để phát hiện các gói đăng ký bị lãng quên
  • Theo dõi email và deadline liên quan đến trường học hoặc công việc
  • Tổng hợp ghi chú họp thành tài liệu có cấu trúc rõ ràng
  • Soạn và gửi email thay người dùng

Đáng chú ý, Google cũng đề cập đến khả năng tạo sub-agent tùy chỉnh, mua sắm thay người dùng, và tích hợp sâu hơn với OpenTable, Instacart, Chrome. Tuy nhiên, những tính năng này được mô tả với từ "eventually" (cuối cùng sẽ có) — nghĩa là chưa được xác nhận thời điểm cụ thể.

Trên Android, người dùng có thể theo dõi tiến trình của agent thông qua hệ thống mới tên Halo. Spark cũng hỗ trợ nhận lệnh trực tiếp qua email gửi đến địa chỉ Gmail riêng, và tương tác với web thông qua Chrome.

AP2 — Giao thức thanh toán cho AI agent với 60+ đối tác

Một trong những phát triển quan trọng nhất đi kèm Gemini Spark là Agent Payments Protocol (AP2) — giao thức mã nguồn mở (Apache 2.0) do Google đồng phát triển cùng hơn 60 đối tác, bao gồm Adyen, American Express, Coinbase, Mastercard, MetaMask, PayPal, Revolut và Worldpay.

AP2 hoạt động như một tầng ủy quyền (authorization layer), độc lập với các hệ thống thanh toán cụ thể (MPP, x402...). Cấu trúc phê duyệt gồm 3 loại Mandate: Intent, Cart và Payment — cho phép AI agent thực hiện giao dịch theo từng bước có kiểm soát.

Thông tinChi tiết
Giấy phép & phiên bảnApache 2.0, repo google-agentic-commerce/AP2, mới nhất v0.2.0 (tháng 4/2026)
Vai tròTầng ủy quyền, không phụ thuộc vào rail thanh toán cụ thể
Cấu trúc3 loại Mandate: Intent / Cart / Payment

Điểm quan trọng cần nhấn mạnh: Google khẳng định các giao dịch có giá trị lớn hoặc hành động quan trọng vẫn yêu cầu xác nhận từ người dùng. Đây không phải AI tự động mua sắm hoàn toàn — con người vẫn giữ quyền phê duyệt cuối cùng. Tháng 10/2025, PayPal và Mastercard đã mở rộng hợp tác, thử nghiệm khả năng tương tác giữa Mastercard Agent Pay Acceptance Framework và AP2.

Lịch trình ra mắt và khả năng tiếp cận

Gemini Spark đang được triển khai theo từng giai đoạn:

Đối tượngThời điểmGhi chú
Trusted testersTuần 19/5/2026Nhóm thử nghiệm nội bộ
Google AI Ultra (Mỹ) — betaTuần tiếp theo (cuối tháng 5/2026)Yêu cầu tài khoản & thanh toán tại Mỹ
Gemini app (Android/iOS/Web)Tiếp theo từ nhóm trênBắt đầu từ thiết bị trong beta Mỹ
Gemini Enterprise"Soon roll out" — chưa có ngày cụ thểQua hợp đồng doanh nghiệp
macOS desktop appCuối hè 2026Xử lý file cục bộ và workflow desktop

Gemini Enterprise sẽ hỗ trợ tự động hóa tác vụ nhiều bước và kết nối với Microsoft SharePoint, OneDrive, ServiceNow — phù hợp cho môi trường doanh nghiệp đang dùng hệ sinh thái Microsoft.

Đối với người dùng tại Việt Nam, thông tin về thời điểm ra mắt chính thức chưa được Google công bố. Tuy nhiên, với việc Gemini app đã có mặt tại Việt Nam và lượng người dùng Gemini toàn cầu đạt 900 triệu MAU (theo letsdatascience.com), khả năng mở rộng sang Đông Nam Á trong vòng 6–12 tháng tới là hoàn toàn có cơ sở để theo dõi. Trước mắt, người dùng Việt Nam nên quan sát phản hồi từ giai đoạn beta Mỹ — đặc biệt về độ chính xác của tính năng tự gửi email (rủi ro gửi nhầm nội dung, sai người nhận) và trải nghiệm phê duyệt thanh toán qua AP2 — trước khi đánh giá mức độ quan tâm thực sự.

Bức tranh lớn hơn: Gemini 3.5, Omni và cuộc đua AI agent

Gemini Spark không xuất hiện đơn lẻ. Tại Google I/O 2026, Google đồng thời công bố Gemini 3.5 Flash, Gemini 3.5 Pro (dự kiến ra mắt tháng 6) và mô hình thế giới Omni — tạo thành một hệ sinh thái AI toàn diện hơn. Spark được xây dựng trên nền tảng này, tận dụng khả năng suy luận đa bước của các mô hình mới.

Với 900 triệu người dùng hoạt động hàng tháng trên Gemini app, Google đang đặt cược rằng Spark sẽ chuyển hóa lượng người dùng khổng lồ này thành nền tảng cho AI agent thực sự hữu ích trong cuộc sống hàng ngày — không chỉ là công cụ trả lời câu hỏi. Đây là hướng đi mà cả Microsoft (Copilot), Apple (Apple Intelligence) và các startup AI đều đang cạnh tranh quyết liệt.

Nguồn