
Theo thông tin từ PANews ngày 23 tháng 5, Anthropic đã chính thức phát hành hai mô hình mới là Claude Opus 4 và Claude Sonnet 4 tại hội nghị nhà phát triển. Opus 4 có hiệu suất tốt nhất trên tập kiểm tra SWE-bench (72.5%, lên đến 79.4% ở chế độ tỷ lệ băm cao), trở thành mô hình lập trình tự động hàng đầu thế giới. Sonnet 4 cũng đạt 72.7%, vượt qua OpenAI o3 và Codex-1. Thử nghiệm của Rakuten cho thấy Opus 4 có thể lập trình liên tục trong 7 giờ, xử lý ổn định các nhiệm vụ phức tạp, phá vỡ kỷ lục ngành. Các mô hình mới hỗ trợ sử dụng công cụ song song và cải thiện cơ chế ghi nhớ, Claude Code hiện đã được mở hoàn toàn.






