NVIDIA vừa có kết quả benchmark đầu tiên cho CPU máy chủ thế hệ mới mang tên Vera, được đo lường bởi Phoronix — trang media Linux uy tín — và được Wccftech đưa tin rộng rãi. Với 88 nhân tùy chỉnh "Olympus" dựa trên kiến trúc Arm, Vera không chỉ bỏ xa người tiền nhiệm Grace mà còn vượt mặt cả AMD EPYC lẫn Intel Xeon thế hệ hiện tại. Đây là tín hiệu mạnh cho thấy NVIDIA đang nghiêm túc tấn công vào thị trường CPU máy chủ — lãnh địa lâu nay thuộc về x86.

Vera vượt Grace 63%, bỏ xa EPYC và Xeon trong Geomean tổng hợp

Theo kết quả Phoronix công bố, tính theo Geomean (trung bình hình học) trên toàn bộ bộ benchmark, NVIDIA Vera nhanh hơn Grace (72 nhân) tới 63%. So với các đối thủ x86 thế hệ hiện tại, khoảng cách còn ấn tượng hơn:

CPUCấu hình nhânSo với Vera
NVIDIA Vera88 nhân OlympusChuẩn so sánh
NVIDIA Grace72 nhânVera nhanh hơn 63%
AMD EPYC 9575F64 nhân Zen 5 / 5 GHzVera nhanh hơn 10%
Intel Xeon 6980P128 nhân (Granite Rapids)Vera nhanh hơn 55%

Đáng chú ý, Phoronix kết luận Vera là "bộ xử lý máy chủ ARM Linux hiệu năng cao nhất từng được kiểm thử" — một nhận định không nhỏ từ một trang chuyên benchmark phần cứng Linux.

Tuy nhiên, cần lưu ý rằng đây là phép đo trên phần cứng pre-production (trước khi xuất xưởng đại trà), và kết quả Geomean phản ánh tổng hợp nhiều bài test chứ không phải từng tác vụ cụ thể. Hiệu năng thực tế của sản phẩm thương mại có thể thay đổi sau khi NVIDIA hoàn thiện quá trình tối ưu hóa điện năng.

Kiến trúc Olympus: Thiết kế tùy chỉnh hoàn toàn sau gần 10 năm

Nhân Olympus trong Vera là CPU core tự thiết kế hoàn toàn đầu tiên của NVIDIA dành cho data center, kể từ dòng Denver — tức là khoảng cách gần 10 năm. Grace thế hệ trước dùng nhân Arm Neoverse V2 có sẵn, còn Olympus là sản phẩm thiết kế nội bộ hoàn toàn, tuân thủ kiến trúc Arm v9.2-A.

Một số điểm nổi bật về vi kiến trúc:

  • Front-end 10-wide với bộ dự đoán nhánh dựa trên neural network
  • Spatial Multi-Threading: mỗi nhân vật lý chạy 2 luồng phần cứng, tổng cộng 88 nhân × 2 = 176 luồng
  • Hỗ trợ tối đa 1,5 TB LPDDR5x (SOCAMM), băng thông bộ nhớ 1,2 TB/s
  • Kết nối NVLink-C2C với băng thông coherent 1,8 TB/s
  • Tổng số transistor trên die CPU: 22,7 tỷ

NVIDIA tuyên bố Vera mang lại hiệu năng cao hơn CPU x86 truyền thống 50%, hiệu suất điện năng (performance/watt) gấp 2 lần, và mật độ rack gấp 4 lần — dù các con số này chưa được bên thứ ba xác minh độc lập.

Dữ liệu hiệu suất điện năng vẫn chưa được công bố

Một điểm đáng lưu ý: Phoronix không được phép chạy và công bố các bài test về hiệu suất điện năng (performance per watt). Đây là chỉ số cực kỳ quan trọng trong môi trường data center, nơi chi phí điện năng chiếm tỷ trọng lớn trong tổng chi phí vận hành (TCO).

Việc thiếu dữ liệu này khiến bức tranh toàn cảnh về Vera chưa hoàn chỉnh. Phần cứng test là mẫu sớm, và NVIDIA vẫn đang trong quá trình tinh chỉnh trước khi xuất xưởng thương mại. Kết quả cuối cùng — cả về hiệu năng lẫn điện năng — có thể khác so với những gì Phoronix đo được.

OpenAI, Anthropic, SpaceX và Oracle nhận lô hàng đầu tiên

NVIDIA đã thông báo Vera chính thức vào sản xuất đại trà, và những rack CPU đầu tiên đã được bàn giao trực tiếp tới OpenAI, SpaceX, Anthropic và Oracle — bốn tên tuổi hàng đầu trong hệ sinh thái AI toàn cầu.

Vera không chỉ là CPU độc lập mà còn là thành phần cốt lõi trong nền tảng Rubin của NVIDIA. Cấu hình flagship Vera Rubin NVL72 kết hợp 72 GPU Rubin và 36 CPU Vera, đạt hiệu năng suy luận 3,6 EFLOPS (NVFP4). GPU Rubin đi kèm có 33,6 tỷ transistor, hỗ trợ tối đa 288 GB HBM4 và băng thông bộ nhớ 22 TB/s.

Thông sốVera Rubin NVL72
Số GPU Rubin72
Số CPU Vera36
Hiệu năng suy luận NVFP43,6 EFLOPS

Về kế hoạch mở rộng, các đối tác cloud lớn như AWS, Google Cloud, Microsoft Azure, Oracle Cloud, cùng các NVIDIA Cloud Partner như CoreWeave, Lambda, Nebius và Nscale dự kiến được tiếp cận Vera trong nửa cuối năm 2026.

Wccftech dẫn nhận định rằng NVIDIA đang nhắm tới vị trí dẫn đầu thị trường CPU vào năm 2026, với mục tiêu doanh thu từ mảng Vera lên tới 20 tỷ USD — con số cho thấy tham vọng không hề nhỏ của "gã khổng lồ GPU" khi bước vào sân chơi CPU.

AMD Venice và Intel Diamond Rapids đang chờ phản công

Kết quả benchmark ấn tượng của Vera được đo so với thế hệ hiện tại của đối thủ — không phải thế hệ tiếp theo. Và cả AMD lẫn Intel đều đang chuẩn bị phản công:

  • AMD EPYC "Venice" (nhân Zen 6) đã vào sản xuất đại trà, dự kiến ra mắt nửa cuối 2026
  • Intel Diamond Rapids cũng đang trong giai đoạn chuẩn bị
  • Qualcomm và Arm cũng phát triển CPU data center riêng hướng tới thị trường Agentic AI

Điều này có nghĩa là cuộc đối đầu thực sự — Vera so với Venice và Diamond Rapids — vẫn chưa diễn ra. Danh hiệu "ARM Linux server processor hiệu năng cao nhất" mà Phoronix trao cho Vera có thể sẽ bị thách thức nghiêm túc khi các thế hệ x86 mới xuất hiện.

Đối với người dùng và doanh nghiệp tại Việt Nam đang sử dụng các dịch vụ AI cloud (thông qua AWS, Google Cloud, Azure hay Oracle Cloud), sự cạnh tranh này mang ý nghĩa thực tế: chi phí suy luận AI có thể giảm và tốc độ phản hồi có thể cải thiện khi các nhà cung cấp cloud nâng cấp hạ tầng lên Vera Rubin. Tuy nhiên, tác động trực tiếp đến giá dịch vụ tại thị trường Đông Nam Á còn phụ thuộc vào lộ trình triển khai của từng nhà cung cấp.

Hiện tại, nên theo dõi thêm khi dữ liệu hiệu suất điện năng được công bố và khi các benchmark so sánh trực tiếp với EPYC Venice xuất hiện — đó mới là bức tranh đầy đủ về vị thế thực sự của Vera.

Nguồn