Claude Opus 4.8 ra mắt: Fast mode rẻ hơn 3 lần, lỗi code giảm 75%, Dynamic Workflows chạy hàng trăm sub-agent song song

Anthropic vừa ra mắt Claude Opus 4.8 vào ngày 29 tháng 5 năm 2026 — phiên bản flagship mới nhất vượt trội Opus 4.7 trên hầu hết các benchmark, đồng thời cắt giảm đáng kể chi phí Fast mode và bổ sung hai tính năng quan trọng: điều chỉnh mức độ "tư duy" (Effort) và hệ thống đa tác nhân song song Dynamic Workflows.

Fast mode giảm giá mạnh: Từ $30 xuống $10 mỗi triệu token

Đây là thay đổi được cộng đồng developer quan tâm nhất. Với Opus 4.7, chi phí Fast mode ở mức $30/1M token đầu vào và $150/1M token đầu ra. Opus 4.8 kéo con số này xuống còn $10/1M token đầu vào và $50/1M token đầu ra — tức là rẻ hơn khoảng 3 lần, đồng thời tốc độ sinh token cũng nhanh hơn khoảng 2,5 lần.

Để dễ hình dung: với mức $10/1M token đầu vào, chi phí xử lý 1 triệu token tương đương khoảng 255.000 VND — một mức giá cạnh tranh hơn đáng kể so với trước. Điều này đồng nghĩa với việc các nhóm phát triển tại Việt Nam đang xây dựng ứng dụng trên nền Claude có thể cân nhắc triển khai Opus 4.8 cho cả những tác vụ nhẹ, thay vì phải "dành dụm" model này chỉ cho các truy vấn phức tạp.

Đáng lưu ý, API của Claude Opus 4.8 hiện hỗ trợ context window 1M token theo mặc định trên Claude API, Amazon Bedrock và Vertex AI, với ngưỡng đầu ra tối đa 128k token.

Benchmark và độ trung thực: Lỗi code bỏ sót giảm 75%

Về hiệu năng, Anthropic công bố các chỉ số sau (dựa trên đánh giá nội bộ — chưa có kiểm chứng độc lập từ bên thứ ba):

Bài kiểm tra	Điểm Opus 4.8
SWE-bench Verified	88,6%
SWE-bench Pro	69,2%
Terminal-Bench 2.1	74,6%
Online-Mind2Web	84%

Điểm 84% trên Online-Mind2Web được Anthropic xác nhận vượt cả Opus 4.7 lẫn GPT-5.5. Tuy nhiên, cần nhắc lại rằng đây là số liệu do chính Anthropic công bố.

Về mặt hành vi, Anthropic tuyên bố Opus 4.8 đạt điểm cao nhất từ trước đến nay trên các chỉ số "prosocial traits" — tức là khả năng tôn trọng quyền tự chủ của người dùng, hành động vì lợi ích tốt nhất của người dùng, và giảm thiểu hành vi lừa dối. Đặc biệt, tỷ lệ bỏ sót lỗi khi viết code giảm xuống còn 1/4 so với phiên bản trước — một cải tiến thực chất với những ai dùng Claude cho công việc lập trình hàng ngày.

Tính năng Effort: Bốn mức tư duy, cẩn thận với mặc định High

Opus 4.8 bổ sung tham số Effort cho phép người dùng kiểm soát mức độ "suy nghĩ" của model trước khi trả lời:

Mức Effort	Đặc điểm
Low	Phản hồi nhanh, tiêu thụ token ít
Medium	Cân bằng tốc độ và chất lượng
High	Suy nghĩ sâu hơn, câu trả lời chi tiết
Max	Tối đa hóa tư duy — dành cho tác vụ khó nhất

Một điểm cần chú ý trong vận hành: mặc định trên tất cả môi trường là High, không phải Medium hay Low. Điều này có nghĩa là nếu không chủ động điều chỉnh, chi phí token sẽ cao hơn mức cần thiết cho các truy vấn đơn giản. Anthropic khuyến nghị chỉ dùng Max cho những tác vụ thực sự phức tạp.

Dynamic Workflows: Hàng trăm sub-agent chạy song song, kiểm chứng lẫn nhau

Tính năng nổi bật nhất về mặt kiến trúc là Dynamic Workflows — hiện ở giai đoạn research preview dành cho Claude Code. Thay vì xử lý tuần tự trong một context duy nhất, Dynamic Workflows cho phép Claude tự động lập kế hoạch và triển khai hàng trăm sub-agent chạy đồng thời để giải quyết một bài toán lớn.

Điểm khác biệt so với các hệ thống multi-agent thông thường nằm ở vòng lặp kiểm chứng đối nghịch: các agent tiếp cận vấn đề từ nhiều góc độ độc lập, sau đó phản bác kết quả của nhau và lặp lại cho đến khi câu trả lời hội tụ. Anthropic đã công bố hai ví dụ thực tế:

Di chuyển 750.000 dòng code từ Zig sang Rust
Phát hiện dead code trong hệ thống của Klarna

Các use case phù hợp nhất bao gồm: bug hunt toàn bộ codebase, kiểm toán bảo mật, và migration quy mô lớn trên hàng nghìn file. Lưu ý quan trọng về vận hành: ở chế độ mặc định, mỗi hành động của sub-agent sẽ yêu cầu xác nhận từ người dùng — điều này làm gián đoạn tính song song. Để tận dụng tối đa Dynamic Workflows, cần kết hợp với Auto Mode.

Do đây vẫn là research preview, hành vi có thể thay đổi trong các phiên bản tiếp theo.

Tiếp theo: Dòng Mythos-class đang đến gần

Anthropic xác nhận sẽ ra mắt dòng model Mythos-class trong vài tuần tới, nhưng chưa tiết lộ thông số hay định hướng cụ thể. Với Opus 4.8, Anthropic đã thiết lập một nền tảng mới về chi phí và khả năng đa tác nhân — Mythos-class nhiều khả năng sẽ đẩy giới hạn này lên một bậc nữa.

Đối với người dùng và nhóm phát triển tại Việt Nam, bước đi thực tế ngay lúc này là: kiểm tra lại cấu hình Effort (nhớ rằng mặc định là High), thử nghiệm Fast mode với chi phí mới, và theo dõi thông báo chính thức về Dynamic Workflows khi thoát khỏi giai đoạn preview. Thông tin về gói giá dành riêng cho thị trường Đông Nam Á chưa được Anthropic công bố.

Nguồn

Android Authority — Claude Opus 4.8 is more honest, less deceptive, and considerably cheaper
VentureBeat — Anthropic's Claude Opus 4.8 is here with 3X cheaper fast mode and near-Mythos level alignment
Anthropic — Claude Opus 4.8

Claude Opus 4.8 ra mắt: Fast mode rẻ hơn 3 lần, lỗi code giảm 75%, Dynamic Workflows chạy hàng trăm sub-agent song song

Fast mode giảm giá mạnh: Từ $30 xuống $10 mỗi triệu token

Benchmark và độ trung thực: Lỗi code bỏ sót giảm 75%

Tính năng Effort: Bốn mức tư duy, cẩn thận với mặc định High

Dynamic Workflows: Hàng trăm sub-agent chạy song song, kiểm chứng lẫn nhau

Tiếp theo: Dòng Mythos-class đang đến gần

Nguồn

Bài viết liên quan

Claude Code thêm Auto Memory và Auto Dream: Học giữa các phiên, giảm phụ thuộc CLAUDE.md

Anthropic kêu gọi toàn cầu giảm tốc phát triển AI trước thềm IPO 2026

Trump ký sắc lệnh AI: Rút quyền truy cập mô hình từ 90 xuống 30 ngày, benchmark mật xác định "mô hình mục tiêu"

ChatGPT sắp đại tu thành "siêu ứng dụng": Tích hợp Canva, Booking.com, Spotify trong vài tuần tới