Runway, AI 기반 멀티미디어 창작 도구의 선구자, 가 이번 주에 Gen-4 Turbo를 도입했습니다. 이는 3월 말에 발표된 Gen-4 모델의 개선된 버전입니다. 입력 이미지와 텍스트 설명을 기반으로 5~10초의 비디오 시퀀스를 생성할 수 있는 Gen-4 시리즈는 독립 크리에이터부터 광고업계 전문가에 이르기까지 다양한 사용자들에게 적합합니다.
Gen-4 시리즈는 참조 이미지와 텍스트 설명을 기반으로 일관되고 표현력 있는 시각적 시퀀스를 생성하도록 설계되었습니다. Runway에 따르면, 이는 "General World Model"이라 불리는 시스템을 향한 새로운 진보를 나타내며, 이는 환경의 내부 표현을 구축하고 이를 사용하여 해당 환경에서의 미래 이벤트를 시뮬레이션하는 AI 시스템입니다. 이러한 모델은 실제 세계에서 발생하는 다양한 상황과 상호작용을 표현하고 시뮬레이션할 수 있습니다.
Gen-4는 라이브 액션, 애니메이션, 시각 효과로 생성된 콘텐츠와 함께 자연스럽게 오디오비주얼 제작 체인에 통합됩니다. 이 시스템은 24프레임/초의 다양한 디지털 플랫폼에 맞춘 이미지 형식(16:9, 9:16, 1:1, 21:9 등)으로 5초 또는 10초의 비디오를 생성할 수 있습니다. 프로세스는 필수 입력 이미지에서 시작하며, 이는 시각적 출발점으로 작용하고, 원하는 움직임을 설명하는 텍스트 프롬프트에 따라 진행됩니다. 맞춤 훈련 단계가 필요 없으며, 모델은 즉시 사용 가능합니다.
보완적인 용도의 두 가지 모델
Gen-4 Turbo는 빠른 반복을 위해 최적화되었으며, 초당 5크레딧의 비용으로 낮아졌습니다. 10초의 비디오를 생성하는 데 단 30초만 소요되어 짧은 시간 안에 여러 변형을 탐색할 수 있습니다. Gen-4 표준은 더 비싸며(초당 12크레딧), 동일한 길이의 비디오를 생성하는 데 몇 분까지 소요될 수 있습니다. 그러나 최종 버전에 유용한 높은 품질을 제공합니다.
Runway는 Turbo로 아이디어를 먼저 테스트한 후 필요에 따라 Gen-4로 다듬기를 권장합니다. Explorer 모드에서는 크레딧을 사용하지 않고 무제한으로 생성할 수 있어 실험을 쉽게 할 수 있습니다.
생성 과정
사용자는 먼저 입력 이미지를 다운로드, 선택 또는 생성한 후 다음 세 가지 단계를 따라야 합니다:
- 프롬프트 작성가져온 이미지는 초기 시각적 프레임(스타일, 구성, 색상, 조명)을 정의하며, 텍스트 프롬프트는 예상되는 역학(이동, 변형, 상호작용)을 명시해야 합니다. 텍스트 한계는 1,000자입니다.
- 파라미터 설정사용자는 그 후 지속 시간, 해상도를 정의하고 유사한 스타일과 움직임을 보장하는 고정 시드를 선택할 수 있습니다.