Anthropic thông báo mở khóa 4,6 triệu token Opus mà không mất thêm phí! Bài kiểm tra ngữ cảnh đã đánh bại GPT-5.4.

Bài viết này được dịch máy
Xem bản gốc

Anthropicn chính thức thông báo rằng cửa sổ ngữ cảnh 1 triệu token dành cho Claude Opus 4.6 và Claude Sonnet 4.6 đã được nâng cấp hoàn toàn từ giai đoạn Beta lên phiên bản chính thức (GA) và hiện đã có sẵn cho tất cả người dùng mà không có bất kỳ điều chỉnh giá nào.

Điểm nổi bật nhất lần là "không tăng giá". Opus 4.6 duy trì mức giá 5 đô la cho đầu vào và 25 đô la cho đầu ra (mỗi triệu token), trong khi Sonnet 4.6 duy trì mức giá 3 đô la cho đầu vào và 15 đô la cho đầu ra, và sử dụng đơn giá thống nhất từ ​​token thứ 1 đến token thứ 1.000.000, không có tính phí theo bậc thang.

Các lập trình viên viết chương trình có thể phải nhập mã nguồn của các thư viện lớn, hàng trăm trang báo cáo nghiên cứu hoặc các tệp hợp đồng dài cùng một lúc.

Kết quả kiểm định MRCR v2: Opus 4.6 vượt trội hơn hẳn so với các đối thủ cạnh tranh.

Anthropic đồng thời công bố kết quả kiểm tra chuẩn về khả năng xử lý văn bản dài, sử dụng khung đánh giá MRCR v2 để kiểm tra khả năng truy xuất thông tin và suy luận của mô hình trong các văn bản cực dài:

  • Claude Opus 4.6 : 78.3%
  • GPT-5.4 : 36,6%
  • Gemini 3.1 Pro : 25,9%

Opus 4.6 đạt điểm số cao gần gấp đôi so với GPT-5.4 và vượt xa Google Gemini 3.1 Pro. Điều này vô cùng quý giá đối với người dùng doanh nghiệp cần xử lý các hợp đồng cực dài, tài liệu pháp lý, mã nguồn lớn hoặc các cuộc hội thoại nhiều lượt.

Mặc dù sê-ri Gemini nổi tiếng với khả năng hỗ trợ các ngữ cảnh cực dài lên đến 2 triệu token, kết quả MRCR v2 cho thấy vẫn còn một khoảng cách đáng kể giữa "dung lượng" của cửa sổ và "chất lượng hiểu biết" thực tế của nó. Anthropic rõ ràng hy vọng sẽ tạo sự khác biệt so với các đối thủ cạnh tranh về mặt này.

Phần mềm phân tích thư viện tích hợp Claude Code xử lý thành công tệp PDF 600 trang chỉ trong một lần.

Ở cấp độ ứng dụng, ngữ cảnh triệu token đã được kích hoạt hoàn toàn trong công cụ dành cho nhà phát triển Claude Code. Thông báo chính thức nhấn mạnh rằng điều này giúp giảm thiểu đáng kể các vấn đề nén ngữ cảnh trong quá trình phân tích thư viện lớn và truy xuất nhật ký, loại bỏ nhu cầu các nhà phát triển phải tự tay cắt bớt dữ liệu đầu vào hoặc lo lắng về việc thông tin quan trọng bị mất.

Tính năng này bao gồm khả năng xử lý tối đa 600 hình ảnh hoặc 600 trang tệp PDF trong một yêu cầu lần. Điều này rất lý tưởng cho các trường hợp cần so sánh các tài liệu kỹ thuật lượng lớn, xem xét báo cáo kiểm toán dài hoặc phân tích toàn bộ mã nguồn của một dự án mã nguồn mã nguồn mở trong một lần.

加入動區 Telegram 頻道

📍 Các báo cáo liên quan📍

Claude Opus 4.6 đã ra mắt: nó có thể tự viết trình biên dịch, tạo bản trình chiếu PowerPoint và dễ dàng phát hiện 500 lỗ hổng bảo mật zero-day — nó muốn thử mọi thứ bạn làm.

Google Gemini 3 Deep Think đã trải qua một nâng cấp lớn: khả năng suy luận của nó vượt xa Opus 4.6 và GPT-5.2, hướng tới mục tiêu trở thành "trí tuệ nhân tạo am hiểu nghiên cứu nhất".

OpenAI vừa phát hành GPT-5.2! Với mục tiêu thay thế các chuyên gia và cung cấp phí API thấp hơn, đây là một số thông tin chi tiết.

Quán quân cuộc thi Anthropic Hackathon chia sẻ mã nguồn Claude miễn phí: Cấu hình đa năng - 13 tác nhân, hơn 40 kỹ năng, 31 lệnh được tiết lộ đầy đủ.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận