Tin tức PANews ngày 10 tháng 2, mô hình thử nghiệm tạo video "VideoWorld" được đề xuất bởi đội ngũ mô hình lớn Douban, Đại học Giao thông Bắc Kinh và Đại học Khoa học và Công nghệ Trung Quốc. Khác với các mô hình đa phương thức chủ lưu như Sora, DALL-E, Midjourney, VideoWorld lần đầu tiên trong ngành đạt được khả năng nhận thức thế giới mà không cần phụ thuộc vào mô hình ngôn ngữ. Hiện tại, mã nguồn mở và mô hình của dự án này đã được công bố.
Doubao: VideoWorld, một mô hình tạo video có thể nhận thức thế giới chỉ dựa trên thị giác, hiện là mã nguồn mở
Bài viết này được dịch máy
Xem bản gốc
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan





