AI로 생성된 바이럴 영상 제작을 위한 언더그라운드 가이드

avatar
Decrypt
04-14
이 기사는 기계로 번역되었습니다
원문 표시

여러분이 정기적으로 소셜 미디어를 사용한다면, 다음과 같은 영상을 본 적이 있을 것입니다.

또는 이렇게요:

아니면 이것

미중 무역 전쟁 덕분에 과체중 미국인들이 가상의 노동 착취 공장에서 고된 노동을 하는 모습을 담은 바이럴 영상이 틱톡과 엑스(X)에서 폭발적으로 확산되며 수백만 건의 조회수를 기록했습니다. 열악한 공장 환경에서 지친 노동자들이 옷을 바느질하는 모습을 담은 이 영상들은 중국산 제품에 대한 고율 관세를 통해 미국으로 제조업 일자리를 되돌리겠다는 트럼프 대통령의 공약을 풍자적으로 풍자한 것입니다.

TikTok 사용자 벤 라우가 제작한 32초짜리 영상은 수백만 번 조회되었는데, AI가 생성한 미국인들이 열악한 공장 환경에서 일하는 모습이 담겨 있으며, 전통 중국 음악이 흐르고 "Make America Great Again"이라는 냉소적인 슬로건으로 끝납니다.

AI는 새로운 정치 만화이자 정치적 시위를 위한 강력한 도구가 되었으며, 현명한 사용자들은 자신이 좋아하는 모델을 사용하여 메시지를 전파하는 수단으로 창의적인 방법을 고안하고 있습니다.

어떻게 하는지 궁금하셨나요? 사실 꽤 간단합니다. 아이디어를 현실로 구현할 만큼 강력한 PC만 있으면 됩니다. 아니면 몇 달러/유로/페소/파운드/위안 정도만 투자할 의향이 있다면 말이죠. 하지만 돈을 쓰고 싶지 않다면, 넉넉한 시간을 확보하는 것이 좋습니다. 몇 세대만 해도 몇 시간씩 걸리니까요.

어떤 사람이 무엇을 하고 있는지 보여주는 영상을 만드는 방법은 다음과 같습니다.

모든 영상은 하나의 초기 프레임으로 시작됩니다. 이는 작품 전체의 모습과 느낌을 결정하는 DNA와 같습니다. 영상은 기본적으로 초당 24~60프레임의 빠른 속도로 전개되는 사진 시퀀스이며, 초기 프레임은 이후 모든 영상의 시각적 기준을 설정합니다.

두 가지 방법이 있습니다. 기존 이미지를 가져오거나 직접 만드는 것입니다. 실제 사진을 사용하는 것이 가장 좋지만, 트럼프 대통령이 재봉틀에 몸을 숙인 모습이나 시진핑 주석이 농부에게 완벽한 회전 발차기를 날리는 진짜 사진을 찾기는 어렵기 때문에 AI 이미지 생성기를 사용하는 것이 가장 좋습니다.

물론 유명인 사진을 만들고 싶다면 검열되지 않은 모델을 사용하는 것이 가장 좋습니다. Stable Diffusion 3.5 , Hidream , 플럭스(Flux) 와 같은 오픈소스 대안이 가장 좋습니다. 유료 대안에 따라 성능 차이가 있을 수 있지만, 일반적으로 Ideogram과 Reve가 적합하며, 그중에서도 ChatGPT가 가장 검열이 심한 모델입니다.

저희는 Freepik Mystic(기본적으로 Freepik의 플럭스(Flux) 구현)을 선택했고, "스웨덴 공장에서 햄버거를 먹는 도널드 트럼프"라는 문구를 떠올렸습니다. 저희가 얻은 결과는 다음과 같습니다.

모델에 따라 결과가 더 좋거나 나쁠 수 있으므로, 결과에 만족할 때까지 여러 이미지를 생성해 보세요. 출력 결과가 원하는 사람과 유사하지 않다면, 해당 얼굴이 인식되도록 훈련되지 않았거나 삭제되었을 가능성이 높습니다. 오픈 소스 모드를 사용하는 경우, 특정 얼굴에 대해 LoRA를 훈련하는 것이 좋지만, 너무 번거롭습니다. 다른 모델을 시도하거나 다른 이미지를 선택하는 것이 좋습니다.

Protip: 저는 Freepik 구독에 투자했습니다. 연 69달러부터 시작하는 이 구독 서비스는 여러 플랫폼을 구독하는 대신, 이미지 생성기, 비디오 도구, 사운드 생성기 등이 포함된 원스톱 서비스를 이용할 수 있습니다. 무료 버전을 선택하시겠습니까? 엄청난 처리량과 몇 시간씩 기다려야 할 수도 있다는 점을 염두에 두세요. 예를 들어, Kling의 무료 버전은 단 10초 분량의 영상을 생성하는 데 3시간이 걸릴 수 있습니다.

일부 모델은 PC에서 로컬로 실행할 수 있지만, 위에서 언급했듯이 사용 가능한 결과를 얻으려면 최소 12GB VRAM 의 GPU가 장착된 매우 강력한 컴퓨터가 필요합니다.

다양한 비디오 생성기가 있으며, 각각 고유한 특징을 가지고 있습니다. 어떤 모델을 선택하느냐에 따라 최종 제품의 디자인, 성능, 그리고 비용이 크게 달라집니다. 콘텐츠 제한 없이 작업을 수행할 수 있는 최고의 모델들을 소개합니다.

이러한 다른 대안들은 검열이 심합니다. 정치적 밈에는 유용하지 않겠지만, 다른 콘텐츠를 제작하고 싶다면 시도해 볼 만한 가치가 있습니다.

대부분의 정치 밈 제작자에게 Kling 1.6 Pro는 Freepik에서 가장 적합한 반면, Wan은 다른 곳에서 최대한의 창작 자유를 제공합니다. 비교를 원하시면, 이 리뷰 에서 이 모든 모델로 동일한 장면을 생성하여 결과를 확인하실 수 있습니다.

초기 프레임(동영상 시작을 위해 생성한 이미지)과 비디오 엔진을 선택하면 정치적 논평에 생동감을 불어넣을 준비가 되었습니다. 플랫폼마다 인터페이스 세부 사항이 다르지만, 핵심 워크플로는 모든 도구에서 동일하게 유지됩니다.

1단계: 시작 이미지(또는 초기 프레임) 업로드 필드를 찾으세요. 이 중요한 첫 프레임은 전체 영상의 미적 감각과 품질을 결정합니다. 각 프레임은 이전 프레임을 기반으로 구성되므로, 초기 이미지는 전체 영상 제작의 청사진과 같습니다. 해당 필드에 이미지를 업로드하세요.

2단계: 프롬프트 필드에 정확한 장면 묘사를 작성하세요. 복잡한 내러티브보다는 단일한 순간에 집중하세요. 이러한 엔진은 스토리텔링 아크보다는 응집력 있는 스니펫을 만드는 데 탁월합니다.

필드는 선택하는 항목에 따라 다르지만, 모든 모델의 인터페이스는 비슷합니다. Freepik을 사용하므로 다음과 같습니다.

다른 플랫폼인 Fal AI의 예는 다음과 같습니다.

프롬프트를 작성할 때, 밈(meme) 을 하나의 장면으로 시각화하고 묘사해 보세요. 숏 영상이므로 장면 구성 요소는 자세히 설명할 수 있지만, 장면 전개는 자세히 설명할 수 없다는 점을 기억하세요. 밈(meme) 을 하나의 장면으로 시각화해 보세요.

예를 들어, 우리 밈(meme) 의 주제는 "클로즈업 샷: 정장을 입은 남자가 녹은 치즈가 흘러나오는 육즙이 가득한 햄버거를 먹고 있다. 카메라는 햄버거의 디테일과 남자의 집중된 표정을 강조하기 위해 부드럽게 줌인하고, 배경에는 노동자들이 착취 공장에서 바느질하는 모습이 보인다"였습니다.

3단계: 지속 시간과 해상도 등 몇 비츠(Bits) 기술 사양을 구성합니다. 데스크톱 보기에는 와이드스크린, 소셜 피드에는 정사각형, TikTok이나 Instagram 스토리에는 세로 모드로 설정합니다.

4단계: 짠! "생성"을 클릭합니다. 이 모델들은 상당한 처리 시간이 필요하므로 잠시 기다리세요. 사용하는 플랫폼에 따라 약 10초 분량의 영상을 생성하는 데 몇 분 정도 걸릴 수 있습니다. 하지만 다른 플랫폼에서는 비슷한 길이의 영상을 생성하는 데 최대 2시간까지 걸릴 수 있습니다.

일부 제공업체는 비디오를 병렬로 생성할 수 있도록 지원합니다. 이는 첫 번째 세대에서는 좋은 결과를 얻지 못할 수 있으므로 좋은 방법입니다. 다양한 옵션을 선택할 수 있도록 여러 개를 생성하는 것이 좋습니다.

작업이 끝나면 그대로 공유하거나 메시지를 강화하는 오디오 요소를 추가하기만 하면 됩니다.

축하합니다. 여러분은 지금 막 끝없는 글로벌 밈(meme) 전쟁에서 여러분 편에 설 디지털 탄약을 만들어냈습니다.

최종적으로 시도한 결과는 다음과 같습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
3
코멘트