Apple đang chuẩn bị tái định vị chiến lược AI của mình tại WWDC 2026 khai mạc ngày 8 tháng 6 — không phải bằng cách chạy đua xây dựng trung tâm dữ liệu khổng lồ, mà bằng cách khai thác lợi thế chip tự phát triển suốt 15 năm qua để xử lý AI ngay trên thiết bị. Theo MacRumors dẫn nguồn từ The Information, đây là hướng đi mà Apple muốn dùng để tạo khoảng cách với các đối thủ.

Apple Silicon — 15 năm tích lũy để làm gì?

Theo những người am hiểu kế hoạch của Apple, công ty sẽ đặt khả năng xử lý AI trực tiếp trên thiết bị (on-device AI) làm trọng tâm tại WWDC 2026. Các chip được thiết kế riêng cho iPhone, Apple Watch và Mac được xem là lợi thế cạnh tranh then chốt, cho phép xử lý các truy vấn AI ngay tại máy thay vì phải gửi lên đám mây.

Lợi ích của hướng tiếp cận này là kép: bảo vệ quyền riêng tư vì dữ liệu cá nhân không rời khỏi thiết bị, và giảm chi phí vận hành so với mô hình phụ thuộc hoàn toàn vào trung tâm dữ liệu quy mô lớn như các đối thủ đang theo đuổi. Tất nhiên, các truy vấn phức tạp vẫn cần xử lý trên đám mây — Apple dự kiến áp dụng mô hình kết hợp hai tầng này.

Gemini được "chưng cất" để chạy trên Apple Silicon

Điểm đáng chú ý nhất trong các thông tin rò rỉ là bản chất thực sự của quan hệ hợp tác Apple–Google. Apple không tích hợp Gemini đầy đủ vào sản phẩm, mà sử dụng mô hình Gemini quy mô lớn làm "mô hình giáo viên" (teacher model) — một kỹ thuật gọi là knowledge distillation — để huấn luyện ra phiên bản nhỏ gọn hơn, có thể chạy cục bộ trên các thiết bị trang bị Apple Silicon.

Cụ thể hơn:

  • Mô hình Gemini lớn đóng vai trò "giáo viên", truyền kiến thức sang mô hình nhỏ hơn
  • Mô hình được chưng cất sẽ chạy trực tiếp trên thiết bị Apple Silicon
  • Apple được cho là đang tìm kiếm các mục tiêu mua lại để đẩy nhanh công nghệ nén mô hình, trong đó có Liquid AI — startup tại Massachusetts chuyên về AI chạy trên thiết bị đầu cuối

Lý do Apple không thể chạy Gemini đầy đủ trên hạ tầng Private Cloud Compute của chính mình cũng được tiết lộ: mô hình Gemini có số lượng tham số lên đến hàng nghìn tỷ, vượt quá khả năng xử lý của cơ sở hạ tầng Apple Silicon hiện tại trong môi trường đám mây riêng.

Nvidia Confidential Compute — thay đổi so với cam kết ban đầu

Với những truy vấn vẫn cần xử lý trên đám mây, Apple được cho là đã phê duyệt việc sử dụng công nghệ Confidential Compute của Nvidia trong môi trường Google Cloud. Tính năng này mã hóa cả mô hình AI lẫn dữ liệu ngay trong quá trình xử lý, đổi lấy một phần nhỏ hiệu năng để có mức bảo mật cao hơn.

Đây là sự thay đổi đáng kể so với tuyên bố ban đầu khi Apple Intelligence ra mắt năm 2024, khi Apple khẳng định mọi truy vấn gửi lên đám mây đều được xử lý hoàn toàn trên hạ tầng Private Cloud Compute chạy chip Apple Silicon của chính họ.

Hạng mụcCông bố ban đầuThông tin mới
Hạ tầng đám mâyPrivate Cloud Compute (chip Apple Silicon)Google Cloud với mô hình nền Gemini
Bảo mật đám mâyThiết kế độc quyền Private Cloud ComputeNvidia Confidential Compute mã hóa trong quá trình xử lý
Tên thương hiệuPrivate Cloud ComputeNhiều khả năng vẫn giữ tên Private Cloud Compute

Đáng lưu ý, tên thương hiệu "Private Cloud Compute" nhiều khả năng vẫn được duy trì — Apple vẫn muốn giữ ngọn cờ bảo mật này trong mắt người dùng, dù kiến trúc bên dưới đã thay đổi.

Liquid AI — startup đáng theo dõi trong thương vụ tiềm năng

Liquid AI, công ty đang được Apple xem xét mua lại, đã công bố dòng mô hình LFM2.5-1.2B — được tối ưu hóa cho thiết bị đầu cuối với kiến trúc đặc biệt phù hợp triển khai cục bộ. Điểm kết nối trực tiếp với hệ sinh thái Apple là hỗ trợ MLX — framework học máy của Apple dành riêng cho Apple Silicon, tận dụng kiến trúc bộ nhớ hợp nhất (unified memory).

Ngoài ra, ứng dụng Liquid Apollo đã có mặt trên App Store, cho phép chạy LLM nhỏ gọn trực tiếp trên thiết bị theo cách riêng tư và bảo mật. Đây là bằng chứng cho thấy Liquid AI không chỉ có nghiên cứu lý thuyết mà còn có kinh nghiệm triển khai thực tế trên nền tảng Apple — một lợi thế quan trọng nếu thương vụ mua lại thành hiện thực.

iOS 27, Siri "Campos" và bức tranh toàn cảnh WWDC 2026

WWDC 2026 không chỉ là sự kiện công nghệ thuần túy. Apple vừa đồng ý dàn xếp vụ kiện tập thể liên quan đến việc trì hoãn Apple Intelligence với khoản bồi thường 250 triệu USD — người dùng Mỹ mua thiết bị từ ngày 10/6/2024 đến 29/3/2025 có thể nhận 25 USD/thiết bị, hoặc tối đa 95 USD nếu số đơn đăng ký thấp. Phiên điều trần sơ bộ dự kiến ngày 17/6, chín ngày sau keynote.

Về mặt kỹ thuật, Siri đang được thiết kế lại hoàn toàn với tên mã "Campos", dự kiến ra mắt trong iOS 27. Đặc biệt, iOS 27 được cho là sẽ có hệ thống "Extensions" cho phép người dùng đặt dịch vụ AI bên thứ ba — như ChatGPT hay Gemini — làm công cụ mặc định trên toàn hệ thống. Trước thềm sự kiện, Apple đã đăng ký subdomain genai.apple.com, cho thấy sự chuẩn bị kỹ lưỡng cả về thương hiệu lẫn hạ tầng.


Với người dùng tại Việt Nam, các tính năng Apple Intelligence hiện vẫn chưa hỗ trợ tiếng Việt. Tuy nhiên, nếu Apple thực sự đẩy mạnh on-device AI và mở rộng hệ thống Extensions cho AI bên thứ ba trong iOS 27, đây có thể là bước đệm để các dịch vụ AI hỗ trợ tiếng Việt (như Gemini hay ChatGPT) tích hợp sâu hơn vào iPhone — điều mà người dùng iPhone tại Việt Nam đang chờ đợi. Mọi thông tin chính thức sẽ được xác nhận tại keynote ngày 8 tháng 6.

Nguồn