Trong nhịp sống nhanh chóng ngày nay, video ngắn đã trở thành một trong những cách chính để nắm bắt thời gian rảnh rỗi và giảm bớt căng thẳng trong cuộc sống bận rộn. Trong quá trình theo đuổi trải nghiệm ngắn và nhanh, “phim truyền hình ngắn” dần trở thành một dạng nội dung cực kỳ phổ biến. .
Chỉ riêng năm 2023, thị trường phim truyền hình ngắn trực tuyến Trung Quốc sẽ đạt 37,39 tỷ nhân dân tệ, tăng trưởng 267,65% so với cùng kỳ năm ngoái. Hơn nữa, dữ liệu công khai của Douyin vào năm 2024 cho thấy số lượng người dùng hàng ngày các bộ phim truyền hình ngắn siêu nhỏ của hãng này là hơn 100 triệu.
Lei Jun, Chủ tịch kiêm Giám đốc điều hành của Xiaomi, gần đây cũng cho biết: "Phim truyền hình ngắn dường như đã mở ra một thế giới mới. Chúng nhanh hơn, thú vị hơn và đẹp hơn Shuangwen".
Trong khi bộ phim ngắn này trở nên phổ biến, một số nhà sáng tạo cũng phát hiện ra giá trị của AI trong quá trình này. Series mini giả tưởng nguyên bản AIGC đầu tiên của Trung Quốc "Mountains and Seas" đã nhanh chóng trở nên phổ biến trên các nền tảng video lớn kể từ ra mắt ngày 13 tháng 7, với hơn 10 triệu lượt xem trên Kuaishou. Thông qua việc sử dụng khéo léo công nghệ AI, các nhân vật thần thoại và sinh vật kỳ lạ được mô tả trong “The Classic of Mountains and Seas” được chuyển thể từ văn bản thành hình ảnh sống động trên màn hình với cách diễn đạt chân thực và mượt mà, nó đã thành công phá vỡ định kiến trước đây của mọi người về. tác dụng của tạo ra video AI.
Ngoài ra, "Sanxingdui: Future Apocalypse" do Trung tâm tạo ra AIGMS của Bona Pictures sản xuất cũng đạt được kết quả và phản hồi đáng chú ý khi ra mắt. Jiang Defu, Giám đốc điều hành của Bona Pictures, cho biết Bona đã áp dụng quy trình công nghiệp hóa phim và sử dụng AI tạo ra bộ phim ngắn này. Mục đích là sử dụng kinh nghiệm làm phim trưởng thành của mình để cải thiện nội dung kỹ thuật của phim ngắn AI và kể câu chuyện. thông qua ca khúc kịch ngắn AI.
Có thể nói , Chuỗi“ra ngoài vòng tròn” của phim ngắn AI đã tận dụng được “đúng thời điểm, đúng nơi, đúng người”. cho nó.
Thành công của những tác phẩm này không chỉ là bước đột phá về công nghệ mà còn là hình ảnh thu nhỏ của việc ứng dụng các mô hình lớn đa phương thức vào sáng tạo nghệ thuật. Nó không chỉ thể hiện khả năng xử lý thị giác và thính giác của AI mà còn đạt được sự hiểu biết sâu sắc và thể hiện sáng tạo các yếu tố văn hóa thông qua công nghệ học độ sâu và xử lý ngôn ngữ tự nhiên.
01 Kỳ vọng bị hạ thấp, OpenAI có thể làm gì cứu vãn?
Dưới khung cảnh phồn hoa đó, người ta không khỏi nhớ đến cựu "niềm tin thần" - Sora.
Là một mô hình video tổng hợp mới do OpenAI phát hành, nó thực sự đã gây ra cảm giác chưa từng có khi ra mắt lần đầu tiên. Khi OpenAI chính thức hé lộ bí ẩn về Sora vào tháng 2, Internet và mạng xã hội toàn cầu ngay lập tức bị sốc bởi những chức năng mạnh mẽ của nó, như thể tái hiện lại khoảnh khắc huy hoàng ngày ra mắt GPT-3.5.
Sau khi Sora được ra mắt, nó nhanh chóng trở thành tâm điểm của thế giới công nghệ với ba ưu điểm cốt lõi. Ngành công nghiệp và công chúng đang rất ngạc nhiên trước khả năng tạo ra các video siêu dài lên tới 60 giây và vượt qua nút thắt cổ chai liên tục 4 giây của các mô hình tạo video AI trước đây. Thứ hai, Sora không chỉ hỗ trợ ống kính đa góc mà còn có thể chụp mượt mà từ một lần chụp đến cuối. Những bức ảnh được tạo ra có thể thể hiện một cách hoàn hảo mối quan hệ giữa ánh sáng và bóng tối, sự tắc nghẽn vật lý và hiệu ứng va chạm trong cảnh, tạo nên nội dung video. sống động và chân thực hơn.
Vào thời điểm đó, Sora còn được OpenAI coi là "trình mô phỏng thế giới". Nó không chỉ là mô hình tạo video mà còn là một công cụ thông minh có thể hiểu và mô phỏng các quy luật vật lý của thế giới thực.
Trong những ngày đầu ra mắt, mọi người đã rất ngạc nhiên trước sự đổi mới công nghệ và sự tiện lợi mà Sora mang lại. Nhiều chuyên gia dự đoán Sora sẽ trở thành cuộc cách mạng trong lĩnh vực tạo ra video, thay đổi hoàn toàn cách thức sản xuất video truyền thống.
Tuy nhiên, tính đến hôm nay, Sora vẫn đang chuẩn bị ra mắt, bao gồm cả thử nghiệm đối thủ, kiểm tra nghiêm ngặt thông qua một nhóm đỏ gồm các chuyên gia trong nhiều lĩnh vực khác nhau để xác định và giảm thiểu các vấn đề tiềm ẩn như thông tin sai lệch, nội dung thù địch và rủi ro ro thiên vị.
Đồng thời, OpenAI còn cho phép các nghệ sĩ thị giác, nhà thiết kế và tạo ra tiếp cận sớm với Sora để thu thập phản hồi và cải tiến mô hình, đặc biệt là phục vụ nhu cầu của các chuyên gia sáng tạo. Để tăng tính minh bạch và bảo mật, OpenAI đang phát triển các công cụ có khả năng phát hiện nội dung sai lệch do Sora tạo ra và có kế hoạch đưa dữ liệu C2PA vào mô hình. Ngoài ra, công ty đang làm việc với các nhà hoạch định chính sách, nhà giáo dục và nghệ sĩ trên khắp thế giới để hiểu mối quan tâm của họ và xác định các trường hợp sử dụng tích cực cho Sora. Những hoạt động này dẫn đến việc phát hành Sora bị trì hoãn.
Thời gian trôi qua, việc triển khai Sora vẫn chưa tiến triển nhanh như mong đợi. Mặc dù OpenAI đã có những bước đột phá lớn về công nghệ nhưng chưa bao giờ họ có thể biến công nghệ này thành những sản phẩm thực sự có thể sử dụng được và đưa ra thị trường.
Đối với hầu hết người dùng, sự tương phản này chắc chắn gây thất vọng và gây lo lắng. Một mặt, Sora có thể nhanh chóng thay đổi mô hình tạo ra video, hạ thấp ngưỡng sáng tạo và cho phép nhiều người dễ dàng tạo ra nội dung video chất lượng cao. Mặt khác, đó là "thực tế cốt lõi" của việc Sora triển khai chậm chạp. quá trình. .
Tình trạng khó khăn của Sora không chỉ là sự chậm trễ hoặc thiếu sót trong việc triển khai kỹ thuật mà còn phản ánh sâu sắc hơn những thách thức chung mà công nghệ AI hiện nay phải đối mặt trong quá trình thương mại hóa. Từ tối ưu hóa thuật toán đến xử lý dữ liệu, từ việc nuôi dưỡng thói quen của người dùng đến cải thiện sự chấp nhận của thị trường, mỗi bước đều lắng đọng thời gian và sự đánh bóng cẩn thận. Trong thời đại phát triển nhanh chóng này, sự không phù hợp giữa mong muốn được thỏa mãn tức thì của người dùng và đường cong trưởng thành của công nghệ AI thường dẫn đến khoảng cách rất lớn giữa kỳ vọng và thực tế.
02 Chinh phục một quốc gia thì dễ nhưng bảo vệ nó mới khó. GPT-5 đã chuyển từ sùng bái công nghệ sang khủng hoảng niềm tin.
Ngoài Sora, người đang ẩn dật, việc ra mắt GPT-4o mini bất ngờ một lần nữa khiến dư luận xôn xao. Một số cư dân mạng đã nói đùa rằng: "GPT-3.5 bị sa thải, liệu GPT-5 có kém xa không? Ultraman: Đúng vậy!" Mặc dù GPT-5 được phát hành giống như một tấm gương và hầu hết mọi người vẫn tin vào sức mạnh kỹ thuật của OpenAI.
Tuy nhiên, sự cạnh tranh và thay đổi trong lĩnh vực AI cũng ngày càng trở nên khốc liệt. Không chỉ ngày càng có nhiều doanh nghiệp, tổ chức nghiên cứu tham gia nghiên cứu, phát triển và ứng dụng công nghệ AI mà các sản phẩm AI trong nhiều lĩnh vực ngành dọc cũng ra đời, chiếm được cảm tình của người dùng với khả năng định vị chính xác hơn và dịch vụ cá nhân hóa hơn.
Ngược lại, sức hấp dẫn của OpenAI trong ngành dường như đã suy yếu và “sự thống nhất thế giới” của nó ngày càng trở nên khó duy trì.
Ví dụ, sau khi OpenAI chính thức ngừng cung cấp dịch vụ API cho Trung Quốc và các khu vực khác vào ngày 9 tháng này, ban đầu nó được cho là độc quyền công nghệ mới, nhưng nó đã phản tác dụng và không gây náo động trong nước.
Đối diện tình trạng “cắt nguồn cung” của Open AI, phản ứng của các công ty trong nước lần này có thể nói là khá tích cực. Ngay khi tin tức được tung ra, các công ty mô hình lớn như Zhipu AI, Baidu, Alibaba và Tencent đã đưa ra "kế hoạch di dời" các dịch vụ API và bắt đầu thu hút những khách hàng trước đây đã sử dụng dịch vụ API OpenAI thông qua việc giảm giá, đơn giản hóa quy trình, v.v. khách hàng.
Chúng ta không cần phải truy tìm câu trả lời tại sao lại chọn từ bỏ thị trường Trung Quốc, nhưng hiệu quả hoạt động của các nhà sản xuất mẫu xe lớn trong nước đủ để chứng minh rằng từ góc độ hoàn cảnh thị trường và điều kiện triển khai mẫu xe lớn, mẫu xe lớn trong nước không không thể trở thành lựa chọn ưu tiên của người dùng.
Trong cái gọi là "năm đầu tiên của các mô hình lớn", chúng ta đang nói về quy mô mô hình và khả năng của mô hình, và tốc độ phát triển của công nghệ chỉ trong một năm đã bắt đầu khiến các công ty phải suy nghĩ về cách triển khai và thương mại hóa. Gần đây, Kuaishou Keling. Sự bùng nổ tập trung của các sản phẩm như SenseTime Vimi và các sản phẩm khác là hình ảnh thu nhỏ của việc triển khai công nghệ. Đổi mới liên tục đã trở thành nền tảng cho sự tồn tại và phát triển của doanh nghiệp.
Big Model House cho rằng rằng đối với OpenAI, đổi mới liên tục có nghĩa là không ngừng khám phá các lĩnh vực mới của trí tuệ nhân tạo, vượt qua ranh giới công nghệ và tạo ra các sản phẩm thực sự có thể giải quyết các vấn đề trong đời thực. Việc ra mắt GPT-5 không chỉ là một nâng cấp đơn giản cho thế hệ sản phẩm trước đó mà còn là bước nhảy vọt về chất để duy trì địa vị của OpenAI trong lĩnh vực trí tuệ nhân tạo.
03 Phần tái bút: Liệu đa phương thức có thể trở thành cơ hội mới để vượt ở các góc cua?
Sự phổ biến của phim truyền hình ngắn AI chắc chắn là một hiện tượng đáng chú ý, nhưng nó chỉ là phần nổi của tảng băng chìm trong sự phát triển của các lĩnh vực đa phương thức trong nước. Hiện tượng này không phải là sự thể hiện riêng lẻ của tiến bộ công nghệ mà là sự tích hợp độ sâu của. đổi mới công nghệ và văn hóa địa phương. Phản ánh toàn diện việc nắm bắt chính xác nhu cầu thị trường và phát triển phối hợp của toàn bộ Chuỗi ngành.
Hãy bỏ qua hiện tượng cụ thể của tiểu phẩm AI. Sự tích hợp độ sâu giữa đổi mới công nghệ với văn hóa địa phương, nhu cầu thị trường và hệ sinh thái công nghiệp là lợi thế chính của Trung Quốc trong lĩnh vực trí tuệ nhân tạo đa phương thức. Cho dù đó là chẩn đoán chính xác trong lĩnh vực y tế và sức khỏe, chuyển đổi thông minh trong ngành giáo dục hay sự phát triển nhanh chóng của sản xuất thông minh và Công nghiệp 4.0, trí tuệ nhân tạo đa phương thức đều đóng một nhân vật quan trọng trong quá trình tạo ra năng suất mới.
Dựa vào tính linh hoạt và đổi mới của các nhà sản xuất mẫu mã lớn trong nước để đáp ứng thị trường, việc tung ra các sản phẩm nội dung chất lượng cao và hợp thời trang không chỉ củng cố lợi thế cạnh tranh của công ty trên thị trường mà còn tạo động lực mạnh mẽ cho sự phát triển bền vững của toàn bộ đa ngành. trường phương động lực.
Trí tuệ nhân tạo đa phương thức giống như điểm khởi đầu mới cho môn đấu vật mô hình lớn. Nó không chỉ trở thành động lực cốt lõi cho sự đổi mới và nâng cấp trong mọi tầng lớp xã hội mà còn trở thành nhân tố then chốt trong việc định hình bối cảnh kinh tế toàn cầu mới.
Bài viết này xuất phát từ tài khoản công khai WeChat "Big Model Home" , tác giả: Wang Haoda, và 36 Krypton được xuất bản với sự cho phép.





