من النصوص إلى عوالم تفاعلية.. ‘جوجل ديب مايند’ تفتح أبواب ‘Project Genie’ للجمهور

من النصوص إلى عوالم تفاعلية.. ‘جوجل ديب مايند’ تفتح أبواب ‘Project Genie’ للجمهور

فجر جديد في صناعة المحتوى التفاعلي

بدأت شركة “جوجل ديب مايند” (Google DeepMind) خطوة طموحة في مسار تعزيز قدرات الذكاء الاصطناعي التوليدي، حيث أعلنت عن فتح باب الوصول لمشروعها التجريبي Project Genie. تتيح هذه الأداة للمستخدمين إنشاء عوالم ألعاب تفاعلية بالكامل انطلاقاً من أوامر نصية بسيطة أو صور ثابتة.

واعتباراً من يوم الخميس، أصبح بإمكان مشتركي خدمة (Google AI Ultra) في الولايات المتحدة تجربة هذا النموذج البحثي، الذي يستند إلى مزيج تقني متطور يجمع بين نموذج العالم الأحدث (Genie 3)، ونموذج توليد الصور (Nano Banana Pro)، بالإضافة إلى قدرات نموذج (Gemini).

لماذا تركز جوجل على “نماذج العالم”؟

تأتي هذه الخطوة بعد خمسة أشهر من الكشف الأولي عن الأبحاث الخاصة بـ Genie 3، وتهدف ديب مايند من خلالها إلى جمع تعليقات المستخدمين وبيانات التدريب في سباق محموم لتطوير نماذج عالم أكثر كفاءة.

وتُعرف “نماذج العالم” (World Models) بأنها أنظمة ذكاء اصطناعي تولد تمثيلاً داخلياً للبيئة المحيطة، ويمكنها التنبؤ بالنتائج المستقبلية والتخطيط للأفعال بناءً على ذلك. ويرى قادة المجال أن هذه النماذج هي حجر الزاوية للوصول إلى الذكاء الاصطناعي العام (AGI). وفي المدى القريب، تخطط المختبرات لاستخدام هذه التقنية في قطاع الألعاب والترفيه، قبل التوسع إلى تدريب الروبوتات في بيئات محاكاة دقيقة.

المنافسة تشتعل في سوق العوالم الافتراضية

يأتي إطلاق Project Genie في وقت يزداد فيه التنافس شراسة؛ حيث أطلق مختبر (World Labs) بقيادة الخبيرة “في-في لي” منتجه الأول (Marble) أواخر العام الماضي. كما دخلت شركة (Runway) الناشئة المتخصصة في الفيديو هذا المجال، بينما يستعد “يان ليكون”، كبير علماء Meta، عبر شركته الناشئة (AMI Labs) لتطوير حلول مشابهة.

تجربة بناء عالم من “المارشميلو”

تبدأ العملية بما يسمى “مخطط العالم” (World Sketch)، حيث يكتب المستخدم أوامر نصية تصف البيئة والشخصية الرئيسية التي سيتحكم بها لاحقاً. خلال التجربة، قمت بطلب بناء عالم مستوحى من خيال الطفولة: قلعة من “المارشميلو” وسط غيوم، ونهر من الشوكولاتة، وأشجار من الحلوى، بأسلوب الرسوم المتحركة الصلصالية (Claymation).

كانت النتيجة مذهلة بصرياً؛ حيث قدم النموذج عالماً خيالياً بألوان الباستيل، وتفاعلت الشخصية مع المحيط بشكل مقبول، رغم وجود بعض العثرات التقنية، مثل تغيير لون شعر الشخصية بشكل عشوائي أحياناً.

قيود الحوسبة ومعايير السلامة

تفرض جوجل حالياً قيوداً صارمة على الاستخدام، حيث لا تتجاوز مدة توليد والتنقل في العالم 60 ثانية فقط. ويرجع ذلك إلى التكلفة العالية للحوسبة؛ فنموذج Genie 3 يعتمد على بنية (Auto-regressive) تتطلب قدرات معالجة مخصصة لكل جلسة مستخدم.

كما تظهر معايير السلامة وحقوق الملكية بوضوح؛ حيث يرفض النموذج توليد أي محتوى يحاكي شخصيات محمية بحقوق الطبع والنشر (مثل شخصيات ديزني)، وذلك لتفادي النزاعات القانونية التي واجهتها جوجل مؤخراً.

تحديات تقنية بانتظار الحل

  • الواقعية الفوتوغرافية: لا يزال النموذج يواجه صعوبة في خلق بيئات واقعية تماماً، حيث تبدو النتائج أقرب إلى رسومات الألعاب الرقمية منها إلى الواقع.
  • التحكم والتنقل: تعاني واجهة التحكم عبر لوحة المفاتيح من استجابة بطيئة أحياناً، مما يجعل التنقل داخل العوالم يبدو وكأنك تقود عربة تسوق مكسورة.
  • التفاعل مع الأجسام: رُصدت حالات تمر فيها الشخصيات عبر الجدران أو الأجسام الصلبة، وهي ثغرات تسعى ديب مايند لمعالجتها في النسخ القادمة.

في الختام، لا تنظر جوجل إلى Project Genie كمنتج نهائي للاستخدام اليومي بعد، بل كـ “لمحة” عما يمكن أن يؤول إليه مستقبل التفاعل بين الإنسان والآلة، حيث تتحول الكلمات إلى عوالم قابلة للاستكشاف في ثوانٍ معدودة.

المصدر: TechCrunch

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *