Anthropic ra mắt mô hình AI Claude mới và 'điều khiển máy tính'

avatar
AI News
2 ngày trước
Bài viết này được dịch máy
Xem bản gốc

Anthropic đã công bố nâng cấp danh mục AI của mình, bao gồm mô hình Claude 3.5 Sonnet được cải thiện và việc giới thiệu Claude 3.5 Haiku, cùng với tính năng "điều khiển máy tính" đang trong giai đoạn thử nghiệm công khai.

Claude 3.5 Sonnet nâng cấp đã thể hiện những cải thiện đáng kể trên tất cả các chỉ số, với những tiến bộ đáng chú ý đặc biệt trong khả năng lập trình. Mô hình đã đạt 49,0% trên bộ kiểm tra SWE-bench Verified, vượt qua tất cả các mô hình công khai có sẵn, bao gồm các sản phẩm của OpenAI và các hệ thống lập trình chuyên biệt.

Trong một bước phát triển tiên phong, Anthropic đã giới thiệu chức năng sử dụng máy tính cho phép Claude tương tác với máy tính tương tự như con người: xem màn hình, điều khiển con trỏ, nhấp chuột và gõ. Khả năng này, hiện đang trong giai đoạn thử nghiệm công khai, đánh dấu Claude 3.5 Sonnet là mô hình AI tiên phong đầu tiên cung cấp chức năng như vậy.

Nhiều công ty công nghệ lớn đã bắt đầu triển khai các khả năng mới này.

"Claude 3.5 Sonnet nâng cấp đại diện cho một bước nhảy vọt đáng kể đối với lập trình được hỗ trợ bởi AI," GitLab báo cáo, lưu ý rằng khả năng lý luận đã tăng lên đến 10% trên các trường hợp sử dụng mà không cần thêm độ trễ.

Mô hình Claude 3.5 Haiku mới, dự kiến ra mắt vào cuối tháng này, đạt hiệu suất tương đương với Claude 3 Opus trước đây trong khi vẫn duy trì hiệu quả về chi phí và tốc độ. Đáng chú ý, nó đạt 40,6% trên SWE-bench Verified, vượt qua nhiều mô hình cạnh tranh, bao gồm cả Claude 3.5 Sonnet và GPT-4o gốc.

Các chỉ số đánh giá so sánh các mô hình AI Claude mới của Anthropic.
(Nguồn: Anthropic)

Về khả năng điều khiển máy tính, Anthropic đã áp dụng một cách tiếp cận thận trọng, công nhận những hạn chế hiện tại đồng thời nhấn mạnh tiềm năng. Trên bộ kiểm tra OSWorld, đánh giá khả năng điều hướng giao diện máy tính, Claude 3.5 Sonnet đạt 14,9% trong các bài kiểm tra chỉ dựa trên ảnh chụp màn hình, vượt xa hệ thống tốt nhất tiếp theo với 7,8%.

Các phát triển này đã trải qua các đánh giá an toàn nghiêm ngặt, với các bài kiểm tra trước khi triển khai được thực hiện hợp tác với Viện An toàn AI của Mỹ và Anh. Anthropic khẳng định rằng Tiêu chuẩn ASL-2, như được nêu trong Chính sách Mở rộng Có trách nhiệm của họ, vẫn phù hợp cho các mô hình này.

(Nguồn ảnh: Anthropic)

Xem thêm: IBM ra mắt các mô hình AI Granite 3.0 với cam kết mã nguồn mở

Muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy tham gia AI & Big Data Expo diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức đồng thời với các sự kiện hàng đầu khác bao gồm Intelligent Automation Conference, BlockX, Digital Transformation WeekCyber Security & Cloud Expo.

Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và các buổi hội thảo trực tuyến khác do TechForge cung cấp tại đây.

Bài viết Anthropic ra mắt các mô hình AI Claude mới và 'điều khiển máy tính' được đăng lần đầu trên AI News.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận