ثورة في التحكم: ما وراء البكسلات النهائية
غالباً ما تبدو الموجة الحالية من الرسوم المتحركة المولدة بالذكاء الاصطناعي وكأنها خدعة سحرية تعمل لمرة واحدة فقط؛ حيث تكتب أمراً (Prompt)، فيظهر فيديو، وإذا لم تعجبك النتيجة – كأن تظهر الأقدام بشكل مشوه، وهو عيب شائع في توليد الصور بالذكاء الاصطناعي – فإن خيارك الوحيد هو تجربة أمر مختلف تماماً. هذا النهج الذي يشبه “الصندوق الأسود” هو بالضبط ما تحاول شركة Cartwheel، وهي شركة ناشئة جديدة في مجال الرسوم المتحركة ثلاثية الأبعاد، تفكيكه وتغييره.
تأسست الشركة على يد أندرو كار وجوناثان جارفيس، وهما خبيران سابقان في OpenAI وجوجل على التوالي. وتعمل الشركة على بناء مستقبل يتولى فيه الذكاء الاصطناعي الأعمال التقنية الشاقة والروتينية للرسوم المتحركة، مع ترك الروح الإبداعية واللمسة الفنية للإنسان.
تحدي البيانات: ندرة الحركة ثلاثية الأبعاد
وفقاً للمؤسسين، فإن أحد أكبر العوائق في هذا المجال هو أن بيانات الحركة ثلاثية الأبعاد (3D motion data) نادرة بشكل ملحوظ مقارنة بالمحيطات اللامتناهية من النصوص والصور المتاحة عبر الإنترنت التي تُدرب عليها نماذج الذكاء الاصطناعي التقليدية.
يقول جارفيس: “إذا نظرت إلى شركات التقنية الكبرى، ستجد أنها بنت نماذجها على اللغة المكتوبة والصوت والصور والفيديو بسبب وفرتها الهائلة، مما يجعل العثور على الأنماط أسهل بكثير. كنا نعلم أن المهمة ستكون صعبة، لكن تبين أنها أصعب مما توقعنا بعشرة أو مئة ضعف للحصول على تلك البيانات”.
من الفيديو المسطح إلى الهياكل ثلاثية الأبعاد
بينما يركز عمالقة التكنولوجيا الآخرون على توليد “البكسلات النهائية”، أمضت Cartwheel سنوات في رسم خرائط لكيفية تحرك البشر في الواقع. تم بناء نماذجهم لفهم الفروق الدقيقة في الأداء، بحيث يمكن تحويل فيديو بسيط ثنائي الأبعاد لشخص يرقص في فنائه الخلفي إلى هيكل عظمي ثلاثي الأبعاد دقيق وواقعي.
هذا التحول من الصور المسطحة إلى الأصول ثلاثية الأبعاد هو ما يمنح رسامي الرسوم المتحركة التحكم الذي افتقدوه في عصر الذكاء الاصطناعي. ويرى المسؤولون التنفيذيون في الشركة أن “التشابه” الممل في مخرجات الذكاء الاصطناعي هو نتاج لغياب السيطرة؛ فإذا استخدم الجميع نفس المولد لإنتاج فيديو، فستبدأ النتائج في النهاية بالظهور بشكل متماثل تماماً.
الذكاء الاصطناعي كأداة طاقة وليس بديلاً
يؤكد أندرو كار أن مخرجات نظامهم مصممة ليقوم البشر بتعديلها ومعالجتها. ويقول: “نحن لا نريد أن يكتب شخص ما شيئاً ثم ينتظر خروج رسوم متحركة نهائية. هذا أمر ممل، ومن سيشاهد ذلك؟”. ويضيف أن سهولة التعديل تقضي تماماً على مشكلة التشابه؛ حيث يمكنك وضع الحركة على شخصيات مختلفة، في بيئات متنوعة، وتغيير الأداء بالزيادة أو النقصان، مما يجعل التكنولوجيا أداة طاقة متطورة بدلاً من أن تكون بديلاً للفنان.
يتيح توليد بيانات ثلاثية الأبعاد بدلاً من الفيديو المسطح للمبدع تغيير الإضاءة، أو تحريك الكاميرا، أو ضبط وضعية الشخصية حتى بعد قيام الذكاء الاصطناعي بعمله الأولي.
سرد القصص المفتوحة وبناء العوالم
بعيداً عن مجرد تسريع عملية الأنيميشن، تتطلع الشركة إلى مفهوم تسميه “سرد القصص المفتوحة” أو “بناء العوالم المفتوحة”. ففي الألعاب الحديثة ووسائل التواصل الاجتماعي، وصل الطلب على المحتوى إلى حجم لا يمكن للرسوم المتحركة اليدوية مواكبته.
تتخيل Cartwheel شخصيات ليست مبرمجة مسبقاً بحركات محددة فقط، بل مدعومة بنماذج حركة تسمح لها بالتفاعل والأداء في الوقت الفعلي. الأمر لا يتعلق بتصميم كل إطار على حدة، بل بـ “التدريب” مع ممثل رقمي يفهم القصد من المشهد.
في النهاية، الهدف هو سد الفجوة بين الرؤية ثنائية الأبعاد والتنفيذ ثلاثي الأبعاد. ومن خلال التركيز على “الطبقة الموجودة تحت البكسلات”، يأمل كار وجارفيس أنه مع زيادة أتمتة الرسوم المتحركة، ستصبح أيضاً أكثر شخصية؛ فالآلة تتولى الميكانيكا الحيوية وتصدير الملفات، لكن الإنسان يحتفظ بالكلمة الأخيرة في الذوق، والتوقيت، وجوهر القصة.
المصدر: CNET


اترك تعليقاً