소라가 제단에서 떨어졌습니다. GPT-5의 출시는 구원인가요, 전복인가요?

avatar
36氪
07-25
이 기사는 기계로 번역되었습니다
원문 표시

오늘날의 빠른 삶의 속도 속에서 짧은 영상은 바쁜 삶 속에서 여가 시간을 포착하고 스트레스를 해소하는 주요 방법 중 하나로 자리 잡았으며, 짧고 빠른 경험을 추구하는 과정에서 점차 '단편 드라마'가 매우 인기 있는 콘텐츠 형식으로 자리 잡았습니다. .

2023년에만 중국 온라인 마이크로단편 드라마 시장 규모는 전년 동기 대비 267.65% 증가한 373억9000만 위안에 달할 전망이다. 더욱이 두인의 2024년 공개 데이터에 따르면 두인의 마이크로 단편 드라마 일일 이용자 수가 1억 명이 넘는 것으로 나타났다.

샤오미 회장 겸 CEO 레이쥔(Lei Jun)도 최근 "단편 드라마가 새로운 세계를 연 것 같다. 솽웬(Shuangwen)보다 빠르고, 더 흥미롭고, 보기에도 좋다"고 말했다.

단편드라마가 인기를 끌면서 일부 창작자들도 그 과정에서 AI의 가치를 발견하기도 했다. 중국 최초의 AIGC 오리지널 판타지 마이크로 단편 드라마 '산과 바다'는 7월 13일 출시 이후 주요 동영상 플랫폼에서 빠르게 인기를 얻었으며, Kuaishou에서 조회수 1,000만 회 이상을 기록했습니다. 『산해고전』에 등장하는 신화 속의 인물과 기이한 생물은 인공지능 기술의 기발한 활용을 통해 텍스트에서 생생한 이미지로 화면에 구현되며, 사실적이고 부드러운 표현으로 사람들의 기존 고정관념을 성공적으로 깨뜨렸습니다. AI 영상제작의 효과.

또한 보나픽쳐스 AIGMS제작센터가 제작한 '삼성퇴:미래의 묵시록' 역시 개봉과 동시에 괄목할 만한 성과와 반응을 얻었다. 보나 픽쳐스의 장더푸 대표는 보나가 영화 산업화 프로세스를 채택하고 AI를 활용해 이 단편 드라마를 제작했다고 말했다. AI 단편 드라마 트랙을 통해

AI 단편 드라마의 '외부'는 '적시, 적절한 장소, 적절한 사람'을 활용해 제작 도구부터 플랫폼, 관객까지 완전한 생태적 연결이 자양분 있는 발전 토양을 만들었다고 할 수 있습니다. 그것을 위해.

이러한 작품의 성공은 기술적 혁신일 뿐만 아니라 예술 창작에 다양한 형태의 대형 모델을 적용한 전형이기도 합니다. AI의 시각, 청각 처리 능력을 보여줄 뿐만 아니라, 딥러닝과 자연어 처리 기술을 통해 문화적 요소에 대한 깊은 이해와 혁신적인 표현을 실현합니다.

01 낮아진 기대치, 이를 살리기 위해 OpenAI는 무엇을 할 수 있을까요?

번영하는 장면 속에서 사람들은 예전의 '개념의 신'인 소라를 떠올리지 않을 수 없다.

OpenAI가 출시한 새로운 생성적 비디오 모델로, 실제로 처음 출시되었을 때 전례 없는 센세이션을 일으켰습니다. OpenAI가 지난 2월 소라의 미스터리를 공식 공개하자 GPT-3.5 출시의 영광스러운 순간을 재현하듯 글로벌 인터넷과 소셜미디어는 그 강력한 기능에 즉각 충격을 받았다.

Sora가 출시되자 세 가지 핵심 장점으로 인해 빠르게 기술 세계의 초점이 되었습니다. 최대 60초에 달하는 초장거리 영상 생성 능력과 기존 AI 영상 생성 모델의 4초 연속성 병목 현상을 돌파한 능력에 업계와 대중은 놀라움을 금치 못하고 있다. 둘째, Sora는 다중 각도 렌즈를 지원할 뿐만 아니라 한 장면에서 끝까지 원활한 촬영을 달성할 수 있습니다. 생성된 사진은 장면의 빛과 그림자, 물리적 폐색 및 충돌 효과 사이의 관계를 완벽하게 표시하여 비디오 콘텐츠를 만들 수 있습니다. 더 생생하고 현실적입니다.

당시 Sora는 OpenAI에서도 단순한 비디오 생성 모델이 아니라 실제 세계의 물리 법칙을 이해하고 시뮬레이션할 수 있는 지능형 도구로 간주되었습니다.

출시 초기 사람들은 소라가 가져온 기술 혁신과 편의성에 놀라움을 금치 못했다. 많은 전문가들은 소라가 전통적인 영상 제작 방식을 완전히 바꿔 영상 제작 분야에 혁명을 일으킬 것이라고 예측하고 있습니다.

그러나 소라는 잘못된 정보, 혐오 콘텐츠, 편견 리스크 등 잠재적인 문제를 파악하고 완화하기 위해 다양한 분야의 전문가로 구성된 레드팀을 통해 엄격하게 테스트하는 등 적대적 테스트를 포함한 공식 출시를 여전히 준비하고 있습니다.

동시에 OpenAI를 사용하면 시각 예술가, 디자이너, 영화 제작자가 Sora에 조기에 액세스하여 특히 창의적인 전문가의 요구에 따라 피드백을 수집하고 모델을 개선할 수 있습니다. 투명성과 보안을 높이기 위해 OpenAI는 Sora가 생성한 오해의 소지가 있는 콘텐츠를 탐지할 수 있는 도구를 개발하고 있으며 모델에 C2PA 메타데이터를 포함할 계획입니다. 또한 회사는 전 세계 정책 입안자, 교육자 및 예술가와 협력하여 그들의 우려 사항을 이해하고 Sora의 긍정적인 사용 사례를 식별하고 있습니다. 이러한 활동으로 인해 Sora의 출시가 지연되었습니다.

시간이 지날수록 Sora 구현은 기대만큼 빠르게 진행되지 않습니다. OpenAI는 기술 분야에서 엄청난 발전을 이루었지만 이 기술을 실제로 사용 가능한 제품으로 변환하여 시장에 출시하지는 못했습니다.

대부분의 사용자에게 이러한 대조는 의심할 여지 없이 실망스럽고 불안을 불러일으킵니다. 한편으로는 소라가 영상 제작의 패턴을 빠르게 바꿀 수 있고, 창작의 문턱을 낮출 수 있으며, 더 많은 사람들이 쉽게 고품질의 영상 콘텐츠를 제작할 수 있게 해주는 반면, 이는 소라의 느린 구현이 낳은 '골격 현실'이다. 프로세스. .

소라의 곤경은 단순히 기술 구현의 지연이나 부족이 아니라 상용화 과정에서 현재 AI 기술이 직면한 공통 과제를 더 깊이 반영한 것입니다. 알고리즘 최적화부터 데이터 처리, 사용자 습관 함양부터 시장 수용도 향상까지 모든 단계에는 신중한 연마와 시간이 필요합니다. 빠르게 변화하는 시대에는 즉각적인 만족을 원하는 사용자의 욕구와 AI 기술의 성숙도 곡선 사이의 불일치로 인해 기대와 현실 사이에 큰 격차가 발생하는 경우가 많습니다.

02 나라를 정복하는 것은 쉽지만 지키기는 어렵다. GPT-5는 기술 숭배에서 신뢰의 위기로 변했다.

은둔 생활을 하고 있는 소라에 더해 GPT-4o mini의 갑작스런 출시가 다시 한번 여론을 자극하고 있다. 일부 네티즌들은 "GPT-3.5가 해고됐는데 GPT-5가 한참 뒤쳐질 수 있느냐"고 농담으로 말했다. 예!" 비록 GPT-5 출시는 거울과 같으며 대부분의 사람들은 여전히 ​​OpenAI의 기술적 강점을 믿고 있습니다.

하지만 AI 분야의 경쟁과 변화도 점점 치열해지고 있다. 점점 더 많은 기업과 연구 기관이 AI 기술의 연구 개발 및 적용에 참여하고 있을 뿐만 아니라 다양한 분야의 AI 제품이 등장하여 보다 정확한 위치 파악과 보다 개인화된 서비스로 사용자의 호응을 얻고 있습니다.

이에 비해 업계에서 OpenAI의 매력은 약해진 것으로 보이며, OpenAI의 '세계 통일'을 유지하기가 점점 더 어려워졌습니다.

일례로 OpenAI가 이달 9일 공식적으로 중국 및 기타 지역에 대한 API 서비스 제공을 중단한 뒤 원래는 신기술 독점으로 여겨졌으나 역효과를 내며 국내에서 큰 소란을 일으키지는 않았다.

오픈AI의 '공급 중단' 대면 이번에 국내 기업들의 반응은 상당히 긍정적이라고 할 수 있다. 이 소식이 알려지자마자 Zhipu AI, Baidu, Alibaba, Tencent 등 대형 모델 기업은 API 서비스에 대한 '이전 계획'을 시작했으며 가격 인하, 프로세스 단순화, OpenAI API 서비스를 사용했던 고객을 흡수하기 시작했습니다. 등 클라이언트.

왜 중국 시장을 포기하게 되었는지에 대한 답을 추구할 필요는 없지만, 국내 대형 모델 제조사들의 성과는 시장 환경과 대형 모델 출시 여건 측면에서 볼 때 국산 대형 모델이 그렇지 않다는 것을 증명하기에 충분하다. 사용자의 최우선 선택이 될 수 없습니다.

소위 "대형 모델의 원년"에 모델 규모와 모델 역량에 대해 이야기하고 있으며 불과 1년 만에 기술의 성장 속도로 인해 기업은 최근 Kuaishou Keling을 구현하고 상용화하는 방법을 고민하기 시작했습니다. , SenseTime Vimi 등 제품의 집중 폭발은 기술 구현의 전형입니다. 지속적인 혁신은 기업 생존과 발전의 초석이 되었습니다.

Big Model House는 OpenAI에서 지속적인 혁신이란 인공 지능의 새로운 영역을 끊임없이 탐구하고, 기술의 경계를 넓히고, 실제 문제를 진정으로 해결할 수 있는 제품을 만드는 것을 의미한다고 믿습니다. GPT-5의 출시는 단순한 이전 세대 제품의 업그레이드가 아니라, 인공지능 분야에서 OpenAI의 리더십을 유지하기 위한 질적 도약이 되어야 합니다.

03 포스트스크립트: 멀티모달리티가 코너 추월의 새로운 기회가 될 수 있을까?

AI 단편 드라마의 인기는 의심할 여지 없이 눈길을 끄는 현상이지만, 이는 국내 멀티모달 분야의 발전에서 빙산의 일각에 불과합니다. 기술 혁신과 지역 문화를 통해 시장 수요를 정확하게 포착하고 전체 산업 체인의 조화로운 발전을 포괄적으로 반영합니다.

AI 촌극이라는 구체적인 현상은 잠시 접어두자. 기술 혁신과 지역 문화, 시장 수요, 산업 생태계의 긴밀한 통합은 다중 모드 인공 지능 분야에서 우리나라의 주요 장점이다. 의료 및 보건 분야의 정밀 진단, 교육 산업의 지능적 변혁, 지능형 제조 및 인더스트리 4.0의 급속한 발전 등 다양한 모드의 인공지능은 새로운 생산성을 창출하는 과정에서 중요한 역할을 합니다.

국내 대형 모델 제조업체의 시장 대응 유연성과 혁신에 힘입어 최신 유행의 고품질 콘텐츠 제품 출시는 시장에서 회사의 경쟁 우위를 공고히 할 뿐만 아니라 전체 멀티-모델의 지속 가능한 발전에 강한 추진력을 불어넣습니다. 모달 필드.

다중 모드 인공 지능은 대형 모델 레슬링의 새로운 출발점과 같습니다. 이는 사회 각계각층에서 혁신과 업그레이드를 위한 핵심 원동력이 될 뿐만 아니라 새로운 글로벌 경제 지형을 형성하는 핵심 요소가 될 것입니다.

이 기사는 WeChat 공개 계정 "Big Model Home" 에서 가져온 것입니다. 작성자: Wang Haoda, 36 Krypton은 승인을 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트