Runway، الرائدة في أدوات إنشاء الوسائط المتعددة المدعومة بالذكاء الاصطناعي، قدمت هذا الأسبوع Gen-4 Turbo، نسخة محسنة من نموذجها Gen-4 الذي تم تقديمه في نهاية مارس. يتيح هذا النموذج إنشاء مقاطع فيديو تتراوح مدتها بين 5 إلى 10 ثوانٍ من صورة إدخال ووصف نصي، وتستهدف عائلة Gen-4 طيفًا واسعًا من المستخدمين، بدءًا من المبدعين المستقلين وصولاً إلى المحترفين في مجال الوسائط السمعية والبصرية والإعلانات.
 
تم تصميم سلسلة Gen-4 لإنتاج تسلسلات بصرية متسقة ومعبرة من صورة مرجعية ووصف نصي. وفقًا لـRunway، يمثل هذا تقدمًا جديدًا نحو ما تسميه "نموذج العالم العام"، وهو نظام ذكاء اصطناعي يبني تمثيلًا داخليًا لبيئة ويستخدمها لمحاكاة أحداث مستقبلية في تلك البيئة. سيكون مثل هذا النموذج قادرًا على تمثيل ومحاكاة مجموعة واسعة من المواقف والتفاعلات كما تواجه في العالم الحقيقي.
يتكامل Gen-4 بشكل طبيعي في سلاسل الإنتاج السمعي البصري، بجانب المحتويات الحركية والرسوم المتحركة أو التي تم إنشاؤها بواسطة المؤثرات البصرية. يمكن للنظام توليد فيديوهات مدتها 5 أو 10 ثوانٍ، بمعدل 24 إطار في الثانية، وبتنسيقات صورة مختلفة مناسبة للمنصات الرقمية (16:9، 9:16، 1:1، 21:9، ...). تعتمد العملية على صورة إدخال إلزامية تعمل كنقطة انطلاق بصرية، ودعوة نصية تركز على وصف الحركة المطلوبة. لا تتطلب أي مرحلة تدريب مخصصة: النماذج جاهزة للعمل على الفور.

نموذجان لاستخدامات مكملة

تم تحسين Gen-4 Turbo للتكرار السريع، بتكلفة مخفضة قدرها 5 أرصدة لكل ثانية. يستغرق توليد فيديو مدته 10 ثوانٍ 30 ثانية فقط، مما يسمح باستكشاف تنويعات متعددة في وقت قصير. بينما Gen-4 القياسي أكثر تكلفة (12 أرصدة/ثانية) وقد يستغرق بضع دقائق لتوليد فيديو بنفس الطول. ومع ذلك، فإنه يوفر جودة محسنة، مفيدة للإصدارات النهائية.
Runway توصي بتجريب الأفكار أولاً في Turbo، قبل تحسينها باستخدام Gen-4 إذا لزم الأمر. التوليدات غير محدودة في وضع Explorer، الذي لا يستخدم رصيد، مما يسهل التجربة.

عملية التوليد

يجب على المستخدم أولاً تحميل، تحديد أو إنشاء صورة الإدخال، قبل اتباع هذه الخطوات الثلاث:
  1. كتابة الدعوة
    تحدد الصورة المستوردة الإطار البصري الأولي (النمط، التركيب، الألوان، الإضاءة)، ويجب أن تحدد الدعوة النصية الديناميكيات المتوقعة (الحركة، التحول، التفاعل). الحد الأقصى للنص هو 1,000 حرف.
  1. تكوين الإعدادات
    يمكن بعد ذلك تحديد المدة، والدقة، واختيار بذرة ثابتة، لضمان توليدات بنمط وحركة مشابهة.
  1. التوليد والتكرار
    يمكن للمستخدم بعد ذلك بدء التوليد. يمكن فحص الفيديوهات في الجلسة الحالية أو العثور عليها في مكتبة المشاريع الشخصية، ويمكن تحسينها بتعديل صورة الإدخال أو الدعوة النصية.

ميزات ما بعد التوليد

تُقدم عدة خيارات لإثراء أو تعديل المحتوى المنتج. تتيح :
  • تطبيق نمط بصري جديد عليه؛
  • تمديد مشهد؛
  • ضبط الفيديو لتصحيح التركيب أو الإيقاع؛
  • مزامنته مع الحوار عبر مزامنة الشفاه؛
  • الانتقال إلى 4K للحصول على إصدار عالي الدقة؛
  • استخدام الإطار الحالي كنقطة انطلاق لجيل جديد.
يتم أرشفة جميع الإنتاجات حسب الجلسة، مع خيارات لإعادة التسمية، المشاركة أو التنزيل. هذه الأدوات تشجع نهجًا تكراريًا، موجهًا نحو الدقة البصرية دون تعقيد تقني.
التعليقات الأولية إيجابية جدًا. Runway، التي جمعت مؤخرًا 308 مليون دولار في جولة قيادة من General Atlantic، مما يقدرها بأكثر من 3 مليارات دولار، تعمل على ديمقراطية تقنيات كانت محجوزة سابقًا للإنتاجات الكبرى، مما يفتح فرصًا جديدة لمبدعي المحتوى.

لتحسين الفهم