
Tin tức PANews ngày 6 tháng 2, theo Sina Tech, các nhà nghiên cứu tại Đại học Stanford và Đại học Washington, bao gồm Li Feifei, đã huấn luyện một mô hình suy luận trí tuệ nhân tạo có tên là s1 với chi phí tính toán đám mây dưới 50 USD, mô hình này có hiệu suất tương tự như các mô hình suy luận hàng đầu như o1 của OpenAl và R1 của Depsek trong các bài kiểm tra năng lực toán học và lập trình, thu hút sự quan tâm rộng rãi. Tuy nhiên, mô hình s1 này nhanh chóng bị chỉ ra là "không được huấn luyện từ đầu", mà sử dụng mô hình cơ sở "Aliqwen" của Alibaba. Về vấn đề này, phóng viên đã xác nhận với phía Alibaba Cloud, Alibaba Cloud đã xác nhận thông tin này và phản hồi rằng: "Họ sử dụng mô hình mã nguồn mở Aliqwen2.5-32B-Instruct của chúng tôi làm nền tảng, tinh chỉnh có giám sát trong 26 phút trên 16 GPU H100, đã huấn luyện ra mô hình mới s1-32B, đạt được hiệu suất tương đương với các mô hình suy luận hàng đầu như o1 của OpenAI và R1 của DeepSeek trong các bài kiểm tra toán học và lập trình, thậm chí còn vượt o1-preview 27% trong các bài toán thi đấu."






