Theo Beating, xAI đã chính thức phát hành Grok Imagine Video 1.5, một mô hình video tạo hình ảnh và văn bản, hiện đã ra mắt trên API (grok-imagine-video-1.5), nền tảng web (grok.com/imagine) và máy trạm di động. Mô hình này đạt được khả năng tạo âm thanh và video tích hợp, đồng thời tạo ra hiệu ứng âm thanh, âm thanh hoàn cảnh và lời thoại nhân vật trong một giai đoạn suy luận lần , cải thiện độ rõ ràng của giọng nói và tối ưu hóa đồng bộ hóa môi. Đồng thời, mô hình cải thiện công cụ vật lý và tính nhất quán chuyển động, tăng cường độ tin cậy của chuyển động đối tượng và trọng lượng vật lý trong các cảnh quay dài và giảm các hiện tượng nhiễu như biến dạng hình ảnh. Về tốc độ tạo, phiên bản nhẹ, Video 1.5 Fast, tạo ra video 720p dài 6 giây trong khoảng 25 giây. Quy trình làm việc của nền tảng web cũng đã được cập nhật: tính năng Dự án mới đã được thêm vào để phân loại và sắp xếp tài liệu, hỗ trợ nhiều tác nhân chạy nhiều lời nhắc song song và cung cấp tìm kiếm ngữ nghĩa cho thư viện phương tiện. Đội ngũ của nghệ sĩ kỹ thuật số David Thompson đã sử dụng Grok Imagine 1.5 tạo ra đoạn trailer phim "Odyssey" hoàn toàn được tạo ra bằng trí tuệ nhân tạo.
xAI ra mắt Grok Imagine Video 1.5: Hỗ trợ tạo âm thanh và video đồng bộ, tăng gấp đôi tốc độ.
Bài viết này được dịch máy
Xem bản gốc
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan




