두바오: 시각만으로 세상을 인식하는 영상 생성 모델 '비디오월드', 오픈소스로 공개

avatar
PANews
02-10
이 기사는 기계로 번역되었습니다
원문 표시

피에이뉴스(PANews) 2월 10일 소식, 비디오 생성 실험 모델 "VideoWorld"는 豆包 대규모 모델 팀과 베이징 교통대학교, 중국과학기술대학교가 공동으로 제안했습니다. Sora, DALL-E, Midjourney 등 주류 멀티모달 모델과 달리, VideoWorld는 업계 최초로 언어 모델에 의존하지 않고도 세계를 인지할 수 있습니다. 현재 해당 프로젝트의 코드와 모델이 오픈소스로 공개되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트