xAI가 Grok Imagine Video 1.5를 출시했습니다. 이번 버전은 오디오와 비디오 동기화 생성을 지원하며, 속도가 두 배로 향상되었습니다.

이 기사는 기계로 번역되었습니다
원문 표시
Beating에 따르면, xAI는 이미지 및 텍스트 생성 비디오 모델인 Grok Imagine Video 1.5를 공식 출시했으며, 현재 API(grok-imagine-video-1.5), 웹 플랫폼(grok.com/imagine) 및 모바일 클라이언트에서 완전히 사용할 수 있습니다. 이 모델은 통합 오디오 및 비디오 생성을 구현하여 단일 추론 단계에서 음향 효과, 주변 소리 및 등장인물 대화를 동시에 생성함으로써 음성 명료도를 향상시키고 립싱크를 최적화합니다. 동시에 물리 엔진과 모션 일관성을 개선하여 장시간 촬영 시 객체 움직임과 물리적 무게의 사실성을 높이고 이미지 왜곡과 같은 아티팩트를 줄입니다. 생성 속도 측면에서 경량 버전인 Video 1.5 Fast는 6초 분량의 720p 비디오를 약 25초 만에 생성합니다. 웹 플랫폼의 워크플로도 업데이트되었습니다. 자료를 분류하고 정리할 수 있는 새로운 프로젝트 기능이 추가되었으며, 여러 에이전트가 여러 프롬프트를 병렬로 실행할 수 있도록 지원하고 미디어 라이브러리에 대한 의미론적 검색 기능을 제공합니다. 디지털 아티스트 데이비드 톰슨의 팀은 Grok Imagine 1.5를 사용하여 AI가 완전히 생성한 영화 "오디세이"의 예고편을 제작했습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
86
즐겨찾기에 추가
16
코멘트