Việc qwen 3.5 27B thực hiện 50 tok/s trên 3090 không phải là câu chuyện chính. Câu chuyện chính là: liệu hệ thống của bạn có thể xử lý việc thực thi công cụ một cách xác định dưới tác động của nhiễu lấy mẫu hay không? Hầu hết đều không thể, vì vậy họ đổ lỗi cho mô hình.
Bài viết này được dịch máy
Xem bản gốc

Sudo su
@sudoingX
03-23
the founder of openclaw joined the company that was founded to make AI open and now charges you per token. and is now telling you open models aren't there yet.
i run qwen 3.5 27b on a single 3090. 50 tok/s. it writes code, handles tool calls, runs agent sessions for hours. the x.com/steipete/statu…
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan




