Alibaba Cloud xác nhận mô hình S1 của đội ngũ Fei-Fei Li dựa trên chương trình đào tạo Qwen

avatar
PANews
02-06
Bài viết này được dịch máy
Xem bản gốc

Tin tức PANews ngày 6 tháng 2, theo Sina Tech, các nhà nghiên cứu tại Đại học Stanford và Đại học Washington, bao gồm Li Feifei, đã huấn luyện một mô hình suy luận trí tuệ nhân tạo có tên là s1 với chi phí tính toán đám mây dưới 50 USD, mô hình này có hiệu suất tương tự như các mô hình suy luận hàng đầu như o1 của OpenAl và R1 của Depsek trong các bài kiểm tra năng lực toán học và lập trình, thu hút sự quan tâm rộng rãi. Tuy nhiên, mô hình s1 này nhanh chóng bị chỉ ra là "không được huấn luyện từ đầu", mà sử dụng mô hình cơ sở "Aliqwen" của Alibaba. Về vấn đề này, phóng viên đã xác nhận với phía Alibaba Cloud, Alibaba Cloud đã xác nhận thông tin này và phản hồi rằng: "Họ sử dụng mô hình mã nguồn mở Aliqwen2.5-32B-Instruct của chúng tôi làm nền tảng, tinh chỉnh có giám sát trong 26 phút trên 16 GPU H100, đã huấn luyện ra mô hình mới s1-32B, đạt được hiệu suất tương đương với các mô hình suy luận hàng đầu như o1 của OpenAI và R1 của DeepSeek trong các bài kiểm tra toán học và lập trình, thậm chí còn vượt o1-preview 27% trong các bài toán thi đấu."

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận