DeepSeek công bố một bài báo mới do Liang Wenfeng viết: Đề xuất một kiến trúc mHC mới để cải thiện tính ổn định huấn luyện của các mô hình lớn.

Bài viết này được dịch máy
Xem bản gốc

PANews đưa tin ngày 1 tháng 1 rằng DeepSeek đã công bố một bài báo mới đề xuất một kiến ​​trúc mới có tên là Manifold Constrained Hyperconnectivity (mHC), nhằm giải quyết các vấn đề về tính không ổn định trong quá trình huấn luyện và mở rộng hạn chế do vi phạm các thuộc tính ánh xạ đồng nhất trong công nghệ Mạng siêu kết nối (HC). Kiến trúc này khôi phục thuộc tính ánh xạ đồng nhất bằng cách ánh xạ không gian kết nối còn lại của HC đến một đa tạp cụ thể, đồng thời kết hợp tối ưu hóa cơ sở hạ tầng nghiêm ngặt để đảm bảo hiệu quả, đạt được những cải tiến đáng kể về hiệu suất và mở rộng vượt trội. DeepSeek dự đoán rằng mHC, như một phần mở rộng linh hoạt và thiết thực của HC, sẽ góp phần hiểu sâu hơn về thiết kế kiến ​​trúc topo và chỉ ra một hướng đi đầy hứa hẹn cho sự phát triển của các mô hình cơ sở. Bài báo được đồng tác giả bởi Zhenda Xie, Yixuan Wei và Huanqi Cao, cùng với Wenfeng Liang cũng được liệt kê là tác giả.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
56
Thêm vào Yêu thích
16
Bình luận