Bài viết này được dịch máy
Xem bản gốc
Nhu cầu lưu trữ có khả năng tăng vọt trở lại theo cấp số nhân do sự xuất hiện của Seedance2.
GPT 3.5 đã mở ra kỷ nguyên văn bản, nhưng kỷ nguyên video thực sự lại được Seedance 2 mang đến.
Chỉ với một vài thao tác nhắc nhở, video AI có thể tiêu tốn hàng trăm megabyte dung lượng lưu trữ, và dung lượng này sẽ tăng lên khi thời gian tạo ra video AI kéo dài.
Lần lượng lưu trữ cần thiết cho kết quả này sẽ lớn hơn nhiều lần so với dung lượng lưu trữ của văn bản gốc.
Xét cho cùng, hiện nay có rất nhiều người nghiện xem video.
Mọi người trên thế giới, từ trẻ sơ sinh đến người già, đều chịu ảnh hưởng bởi hiện tượng này. Họ có thể không thích đọc sách hay xem tin tức, nhưng chắc chắn họ rất thích xem các video ngắn.
Điều này sẽ tạo ra nhu cầu đầu tư mới.
Yêu cầu về dung lượng lưu trữ đối với trí tuệ nhân tạo video chắc chắn khác với yêu cầu đối với trí tuệ nhân tạo văn bản.
Gemini cung cấp bản ghi về kiến trúc lưu trữ hiện đang được TikTok và Yputobe sử dụng.
Công nghệ lưu trữ video hiện nay không phải là một phương tiện duy nhất, mà là một kiến trúc lưu trữ đa tầng phức tạp.
A. Bố cục kiến trúc
1. Cấp độ siêu nóng: Được sử dụng để xử lý lưu lượng truy cập tăng đột biến (chẳng hạn như các video vừa được phát hành bởi những người nổi tiếng trên mạng).
• Loại: Cụm SSD NVMe + bộ nhớ đệm cấp độ bộ nhớ (Redis/Memcached).
• Chỉ báo chính: **IOPS (Số thao tác nhập/xuất mỗi giây)** và độ trễ cực thấp.
2. Ngăn chứa video thường xuyên: Dùng để lưu trữ các video được xem nhiều hàng ngày.
• Loại: Ổ cứng HDD hiệu năng cao dành cho doanh nghiệp hoặc ổ SSD QLC dung lượng lớn.
• Chỉ báo quan trọng: Cân bằng giữa hiệu suất và chi phí.
3. Tầng lưu trữ/ít người xem: Dùng để lưu trữ các video cũ từ nhiều năm trước mà hầu như không ai xem.
• Các loại: Ổ cứng helium mật độ cao (HDD) và thậm chí cả ổ băng từ cách ly vật lý.
• Chỉ báo quan trọng: Tổng chi phí sở hữu (TCO) trên mỗi TB.
B. Những điểm khó khăn: Rào cản I/O và các kho lưu trữ riêng biệt. Trong các kiến trúc truyền thống, lưu trữ là "tĩnh". Tuy nhiên, kỷ nguyên video AI (SeenDance 2) đòi hỏi lưu trữ phải chuyển đổi từ "kho chứa" thành "dây chuyền lắp ráp", điều này trực tiếp dẫn đến sự sụp đổ của logic lưu trữ.
Dựa trên tình hình hiện tại và những thách thức mà các công ty video đang phải đối mặt về vấn đề lưu trữ, có thể xác định ba hướng phát triển trong tương lai.
Ba hướng phát triển tương lai của lưu trữ video AI
1. Phương án 1: Từ ổ cứng HDD sang trung tâm dữ liệu hoàn toàn bằng ổ SSD
Việc huấn luyện video bằng AI đòi hỏi khả năng đọc song song một lượng lớn dữ liệu video độ phân giải cao. Ổ cứng HDD truyền thống có thời gian tìm kiếm quá chậm, làm giảm tỷ lệ băm của các GPU đắt tiền. Hệ thống lưu trữ toàn bộ bằng bộ nhớ flash (AFA) sẽ chuyển mình từ "hàng xa xỉ" thành "cơ sở hạ tầng" cho các công ty video.
2. Phương hướng thứ hai: Sự hội tụ bộ nhớ-lưu trữ dưới công nghệ CXL
Giao thức Compute Express Link (CXL) sẽ phá vỡ rào cản giữa bộ nhớ và ổ SSD. Đối với các mô hình như SeenDance 2 yêu cầu căn chỉnh chuyển động theo thời gian thực, tốc độ truyền dữ liệu giữa SSD và HBM quyết định độ mượt mà của đầu ra được tạo ra.
3. Hướng thứ ba: Lưu trữ tính toán
Thay vì chuyển toàn dữ liệu video khổng lồ đến CPU để xử lý, tốt hơn hết là nên thực hiện xử lý sơ bộ dữ liệu(như trích xuất khung hình video và chuyển đổi định dạng) trực tiếp trên chip điều khiển lưu trữ.
Dựa trên các thông số nêu trên và hình ảnh, chúng tôi sẽ phân tích sắp xếp xếp hạng các công ty lưu trữ theo năng lực cạnh tranh cốt lõi và xu hướng của họ.
SK Hynix (Hạng S): Tận dụng lợi thế về dung lượng QLC của Solidigm và địa vị của HBM, hãng đã kiểm soát hiệu quả hai khía cạnh cốt lõi là "đọc dung lượng lớn" và "tốc độ tỷ lệ băm". Đây là lựa chọn ưu tiên cho việc lưu trữ cấp EB các bộ dữ liệu huấn luyện AI video.
Samsung (hạng A+): Hiệu năng đọc và ghi tốt nhất. Tốc độ ghi PCIe 5.0 của nó vượt trội, biến nó thành "bộ đệm tốc độ cao" tốt nhất cho SeenDance 2 khi tạo luồng video 4K/8K.
SanDisk (Hạng A): Một ứng cử viên tiềm năng sau khi trở nên độc lập. Công nghệ HBF (Bộ nhớ Flash Băng thông Cao) của hãng nhằm mục đích phá vỡ các rào cản về bộ nhớ, cho phép SSD tham gia trực tiếp vào quá trình suy luận AI, mang lại lợi ích lớn cho 64GB RAM (như M4 Pro của bạn) trong việc xử lý cục bộ quá trình tạo video mô hình lớn.
Micron (Loại A): Độ bền ghi và hiệu suất năng lượng cực cao, phù hợp cho các nhà máy sản xuất video trên nền tảng đám mây hoạt động 24/7.
• WDC (cấp độ B+): Tập trung vào giao thức CXL để giải quyết vấn đề phân bổ động bộ nhớ và lưu trữ trong trung tâm dữ liệu.

川沐|Trumoo
@xiaomucrypto
看来视频模型最最终是国内赢,
抖音用自己海量的视频数据来训练Seedance 2.0,
其他大厂有什么,谷歌和openai只剩下钱多卡多?😂
国内基本上老人小孩现在大部分抖音成瘾.
拿已有成堆的小说版权,批量流水线生产赚钱,国内老头老太太看不完的短剧,反复反哺ai.

Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan






