Nvidia Blackwell dẫn đầu bài kiểm tra phần cứng tác nhân thông minh đầu tiên: tiết kiệm năng lượng gấp 20 lần so với H200, vượt trội hơn cả AMD.

Bài viết này được dịch máy
Xem bản gốc
Theo Beating, một công ty đánh giá, Artificial Analysis đã phát hành chuẩn đánh giá phần cứng đầu tiên trong ngành dành cho các tác nhân thông minh, AA-AgentPerf. Các đánh giá truyền thống giống như một "cuộc đua nước rút" hỏi đáp lần, chỉ tập trung vào tốc độ phản hồi; nhiệm vụ của tác nhân thông minh giống như một "cuộc đua tiếp sức", trong đó AI cần tự động phân tích mục tiêu và liên tục thực hiện các chu trình đọc và ghi tệp, viết lại mã và chạy thử nghiệm. Tương tác thường xuyên đặt ra những thách thức cực kỳ lớn đối với dung lượng bộ nhớ máy chủ và hiệu quả lập lịch. Chuẩn đánh giá này, bằng cách phát lại các quỹ đạo lập trình thực tế, sử dụng "quy mô của các tác nhân đồng thời được hỗ trợ trên mỗi megawatt điện năng tiêu thụ" làm chỉ báo hiệu quả năng lượng cốt lõi, trực tiếp giải quyết các nút thắt về điện năng và tài chính của các trung tâm dữ liệu. Giai đoạn thử nghiệm đầu tiên đã chạy mô hình mã nguồn mở DeepSeek V4 Pro với 1,6 nghìn tỷ tham số. Kết quả cho thấy hệ thống tủ rack làm mát bằng chất lỏng NVIDIA Blackwell GB300 NVL72 có thể hỗ trợ 61.400 tác nhân đồng thời trên mỗi megawatt điện năng tiêu thụ, trong khi thế hệ trước Hopper HGX H200 chỉ hỗ trợ được 2.600, thể hiện sự cải thiện hiệu quả năng lượng hơn 20 lần. Khả năng xử lý đồng thời của một card đồ họa cũng tăng lên 41 lần. Điều này cho phép các trung tâm dữ liệu hỗ trợ số lượng tác nhân thông minh đồng thời nhiều hơn gấp 20 lần với cùng mức điện năng tiêu thụ, giảm đáng kể chi phí triển khai các ứng dụng như lập trình tự động và dịch vụ khách hàng. Trong các kết quả ban đầu, AMD Instinct MI355X hiện đang tụt hậu. Tổ chức đánh giá chỉ ra rằng cả cấu hình AMD và H200 đều được xây dựng bằng khung vLLM mã nguồn mở chung mà không được tối ưu hóa độ sâu; do khung dịch vụ và các toán tử kernel được điều chỉnh, hiệu năng của AMD vẫn còn chỗ để cải thiện. Hiện tại, các nhà cung cấp suy luận như Together AI đã triển khai DeepSeek V4 Pro trên Blackwell, cung cấp hỗ trợ suy luận thời gian thực cho công cụ lập trình tác nhân thông minh Cursor.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
51
Thêm vào Yêu thích
10
Bình luận