Claude Opus 4.8 ra mắt: Anthropic nâng cấp AI agent, coding và khả năng cộng tác

Anthropic vừa âm thầm công bố Claude Opus 4.8, phiên bản mới nhất của dòng mô hình Opus. Không đi kèm một chiến dịch truyền thông rầm rộ, bản cập nhật này vẫn đáng chú ý vì tập trung vào những điểm đang trở thành “cuộc đua chính” của AI hiện nay: khả năng làm việc như agent, hỗ trợ lập trình quy mô lớn, suy luận ổn định hơn và cộng tác đáng tin cậy hơn với người dùng.

Theo Anthropic, Claude Opus 4.8 được xây dựng dựa trên Opus 4.7, cải thiện hiệu năng trên nhiều benchmark và trở thành một “cộng sự” hiệu quả hơn trong các tác vụ phức tạp. Mô hình mới hiện đã được triển khai rộng rãi và giữ nguyên mức giá sử dụng thông thường so với Opus 4.7.

Claude Opus 4.8 có gì mới?

Điểm đáng chú ý đầu tiên là Anthropic không mô tả Claude Opus 4.8 như một cú nhảy vọt hoàn toàn mới, mà là một bản nâng cấp “vừa phải nhưng cảm nhận được”. Đây là cách tiếp cận khá thực tế trong bối cảnh các mô hình AI ngày càng cạnh tranh không chỉ ở điểm benchmark, mà còn ở khả năng xử lý công việc dài hơi, ít lỗi hơn và biết tự đánh giá kết quả tốt hơn.

Với Claude Opus 4.8, Anthropic nhấn mạnh các cải thiện ở những nhóm tác vụ như lập trình, kỹ năng agentic, suy luận và công việc tri thức thực tế. Nói cách khác, đây không chỉ là bản cập nhật để trả lời hay hơn trong khung chat, mà còn hướng đến các workflow nơi AI phải dùng công cụ, duy trì ngữ cảnh, kiểm tra kết quả và hỗ trợ người dùng qua nhiều bước.

Tập trung mạnh vào AI agent và Claude Code

Một trong những nâng cấp quan trọng đi kèm Claude Opus 4.8 là dynamic workflows cho Claude Code. Tính năng này đang ở dạng research preview, cho phép Claude xử lý các nhiệm vụ lớn hơn bằng cách lập kế hoạch, chạy nhiều sub-agent song song trong cùng một phiên làm việc, sau đó kiểm chứng đầu ra trước khi báo cáo lại cho người dùng.

Với các nhóm kỹ thuật, đây là hướng phát triển đáng chú ý. Anthropic đưa ví dụ Claude Code với Opus 4.8 có thể hỗ trợ các bài toán migration ở quy mô codebase, trải dài trên hàng trăm nghìn dòng mã, với bộ test hiện có làm tiêu chuẩn đánh giá. Điều này cho thấy Claude đang được định vị không chỉ là công cụ gợi ý code, mà là một lớp trợ lý kỹ thuật có thể tham gia sâu hơn vào quy trình phát triển phần mềm.

Người dùng có thể điều chỉnh “mức nỗ lực” của Claude

Một thay đổi khác rất thực dụng là effort control trên Claude.ai và Claude Cowork. Thay vì chỉ chọn mô hình, người dùng có thêm tùy chọn để quyết định Claude nên dành bao nhiêu “nỗ lực” cho một tác vụ.

Ở mức effort cao, Claude sẽ suy nghĩ sâu hơn và thường xuyên hơn để đưa ra câu trả lời chất lượng hơn. Ở mức thấp hơn, mô hình phản hồi nhanh hơn và tiêu tốn giới hạn sử dụng chậm hơn. Với người dùng phổ thông, đây là một thay đổi nhỏ nhưng hữu ích: không phải tác vụ nào cũng cần AI “nghĩ rất sâu”, trong khi các nhiệm vụ quan trọng như phân tích, lập kế hoạch, viết code hoặc xử lý tài liệu dài lại có thể hưởng lợi từ mức effort cao hơn.

Theo Anthropic, Opus 4.8 mặc định ở mức high effort vì đây là điểm cân bằng tốt giữa chất lượng và trải nghiệm người dùng. Với các tác vụ khó, người dùng có thể chọn mức “extra” hoặc “max” để đổi thêm token lấy chất lượng đầu ra tốt hơn.

Cải thiện về độ trung thực và khả năng tự nhận lỗi

Một điểm đáng chú ý trong thông báo của Anthropic là hãng nhấn mạnh tới “honesty” — độ trung thực của mô hình. Đây là vấn đề then chốt với AI tạo sinh: mô hình có thể trả lời rất tự tin, ngay cả khi bằng chứng chưa đủ chắc chắn.

Anthropic cho biết Claude Opus 4.8 có xu hướng tốt hơn trong việc nêu ra điểm chưa chắc chắn, cảnh báo rủi ro trong đầu ra và ít đưa ra tuyên bố thiếu căn cứ hơn. Trong bối cảnh AI ngày càng được dùng cho coding, pháp lý, tài chính, phân tích dữ liệu và vận hành doanh nghiệp, khả năng biết “mình chưa chắc” có thể quan trọng không kém khả năng trả lời nhanh.

Đặc biệt với lập trình, Anthropic cho biết Opus 4.8 ít có khả năng bỏ qua lỗi trong code do chính nó viết hơn so với phiên bản trước. Đây là tín hiệu quan trọng, vì một AI coding assistant giỏi không chỉ cần viết được code, mà còn cần phát hiện, nghi ngờ và sửa lỗi trước khi người dùng phải can thiệp.

Giá không đổi, fast mode rẻ hơn

Về giá, Claude Opus 4.8 giữ mức giá sử dụng thông thường như Opus 4.7: 5 USD cho mỗi triệu input token25 USD cho mỗi triệu output token. Với fast mode, mức giá là 10 USD cho mỗi triệu input token50 USD cho mỗi triệu output token. Anthropic cũng cho biết fast mode của Opus 4.8 có thể hoạt động với tốc độ gấp 2,5 lần và rẻ hơn ba lần so với fast mode của các mô hình trước.

Các nhà phát triển có thể sử dụng Claude Opus 4.8 qua API với tên model claude-opus-4-8.

Vì sao bản cập nhật này đáng chú ý?

Claude Opus 4.8 không phải kiểu ra mắt gây sốc bằng một tuyên bố “mô hình thông minh nhất thế giới”. Thay vào đó, Anthropic đang gửi đi một tín hiệu khác: cuộc đua AI đang chuyển từ chatbot trả lời tốt sang hệ thống có thể làm việc bền bỉ, có kiểm chứng, biết dùng công cụ và phối hợp với con người trong các nhiệm vụ dài hơi.

Với doanh nghiệp, lập trình viên và các nhóm đang thử nghiệm AI agent, những cải thiện về độ ổn định, khả năng tự đánh giá, kiểm soát effort và workflow quy mô lớn có thể đem lại giá trị thực tế hơn nhiều so với một vài điểm benchmark tăng thêm.

Claude Opus 4.8 vì vậy có thể được xem là một bản nâng cấp âm thầm nhưng chiến lược: không quá ồn ào, nhưng cho thấy Anthropic đang tiếp tục đặt cược vào AI agent, coding và các workflow chuyên nghiệp — những nơi mà độ tin cậy, khả năng kiểm chứng và chi phí vận hành sẽ quyết định AI có thực sự đi vào công việc hằng ngày hay không.

Nguồn: https://www.anthropic.com/news/claude-opus-4-8

0 Lời bình

Bạn cũng có thể đọc thêm:

Liên hệ