اتخذت جوجل خطوة جديدة في هجومها الذكاء الاصطناعي المطبق على ألعاب الفيديو و عوالم افتراضية مع إطلاق مشروع جيني، وهو نموذج أولي يسمح للمستخدمين بإنشاء بيئات تفاعلية والتنقل فيها بناءً على بضعة نصوص أو صورة، تُقدّم الشركة الأداة على أنها تجربة لا تزال قيد الاختبار. ومع ذلك، أثارت عروضها الأولية حماسًا وشكوكًا في آنٍ واحد في أوساط الصناعة.
في الوقت الحالي، يقتصر الوصول على مشتركو باقة Google AI Ultra في الولايات المتحدةمع جلسات قصيرة وأداء يتسم بوضوح بالطبيعة التجريبية للنظام. ومع ذلك، يشير المشروع إلى مستقبل يمكن لأي مستخدم فيه أنشئ "عالمًا صغيرًا قابلًا للعب" في غضون ثوانٍ، دون الحاجة إلى معرفة كيفية برمجة أو التعامل مع محركات الرسومات.
ما هو مشروع جيني وما هي التقنيات التي يجمعها؟

مشروع جيني هو نموذج بحثي تم تطويره بواسطة جوجل ديب مايند وجوجل للذكاء الاصطناعي والذي يعمل كمولد عوالم تفاعلي. وتستند بنيته التقنية على ثلاثة أركان: نموذج Genie 3، المتخصص في محاكاة البيئات الديناميكية؛ وNano Banana Pro، المسؤول عن الجوانب المرئية والرسومات التخطيطية؛ وGemini، النموذج متعدد الوسائط الذي يفسر تعليمات المستخدم ويعمل كمساعد أثناء الإنشاء.
قلب النظام هو جيني 3، نموذج "عالمي" قادر على التنبؤ إطارًا بإطار بما يحدث على الشاشةعلى عكس التقنيات السابقة التي كانت تولد مشاهد ثلاثية الأبعاد ثابتة فقط، فإن هذا النهج يسمح للبيئة بالتفاعل مع حركات اللاعب في الوقت الفعلي، بدقة تقريبية تبلغ 720 بكسل وعدة دقائق من التماسك البصري وفقًا للتجارب الداخلية لشركة DeepMind.
وبناءً على ذلك، يتم دمجه نانو بانانا برو، المسؤول عن توليد الصورة الأولية للمسرح انطلاقاً من نص وصفي أو صورة مرجعية، تعمل هذه النظرة الأولية كرسم تخطيطي لتحديد الأسلوب الرسومي، وتكوين العالم، ومظهر الشخصية التي سيتم التحكم بها أثناء الاستكشاف.
وأخيرا، يعمل جيميني كطبقة تنسيق ومساعديقوم بتفسير التعليمات باللغة الطبيعية، ويساعد على تعديل العالم بشكل فوري، ويسهل مهامًا مثل تغيير المنظور (منظور الشخص الأول أو الثالث)، أو إعادة مزج بيئة تم إنشاؤها بالفعل، أو دمج عدة أفكار في سيناريو واحد قابل للعب.
كيف يتم إنشاء العوالم الافتراضية واستكشافها

تتمحور عملية مشروع جيني حول عملية تدريجية في ثلاث مراحل تلخص جوجل الأمر بأنه رسم واستكشاف ودمج العوالم. والهدف هو تمكين أي شخص من الانتقال من فكرة إلى تجربة تفاعلية صغيرة دون الحاجة إلى أدوات إضافية.
في المرحلة الأولى، يكتب المستخدم وصفًا للعالم الذي يرغب في إنشائه أو يقوم بتحميل صورة مرجعية. ومن هذه المدخلات، يقوم برنامج Nano Banana Pro بإنشاء معاينة ثابتة يمكن أن يكون الإعداد غابة ذات تصميم بسيط، أو بيئة حضرية مستقبلية، أو منظرًا طبيعيًا تاريخيًا، أو أي شيء آخر موصوف في النص. كما يتم تحديد نوع الشخصية، ووضع الكاميرا، وبعض معايير الحركة الأساسية في هذه المرحلة.
بمجرد قبول الرسم التخطيطي، يدخل برنامج Genie 3 حيز التنفيذ للسماح للاعب استكشف البيئة بحرية، باستخدام عناصر التحكم المعتادة في الكمبيوتر الشخصي مثل مفاتيح W و A و S و Dيقوم النموذج بإنشاء ما يظهر أمام الشخصية أثناء التشغيل، ويتنبأ بكل إطار بناءً على الإطارات السابقة ويحافظ على اتساق معين عند تدوير الكاميرا أو عودتها إلى منطقة تمت زيارتها بالفعل.
القدرة الرئيسية الثالثة هي دمج وإعادة مزج العوالميُمكّن النظام المستخدمين من إعادة النظر في سيناريوهات مُنشأة مسبقًا، وتعديلها بمعايير جديدة، ودمجها معًا، أو حتى استخدام عوالم مُنشأة مسبقًا من جوجل كأساس لبناء تنويعات. بالإضافة إلى ذلك، يُمكن مشاركة مقاطع فيديو الجلسات ليتمكن المستخدمون الآخرون من مشاهدتها أو استخدامها كمصدر إلهام.
يتم تشغيل كل هذا من خلال تطبيق ويب مشابه لخدمات الذكاء الاصطناعي الأخرى من جوجل، بحيث لا حاجة لتثبيت برامج إضافية، كما لا تتطلب معرفة تقنية متقدمة.ما عليك سوى الوصول إلى الأداة، وإدخال التعليمات، والبدء في اختبار التركيبات حتى تجد نتيجة مثيرة للاهتمام.
القيود التقنية: الوقت والأداء والواقعية

تصر جوجل على تعريف مشروع جيني على أنه نموذج بحثي ذو طابع تجريبي واضحإن هذا التصنيف ليس مجرد إجراء شكلي: فالتجربة الحالية تقدم العديد من القيود الواضحة التي تحدد الاستخدام العملي للأداة بما يتجاوز الفضول الأولي.
الأكثر وضوحاً هو حد زمني 60 ثانية لكل جلسة توليد واستكشافبعد تلك الدقيقة، يتوقف العالم عن العمل، وتبدأ تجربة جديدة. وتوضح الشركة أن هذا التقييد يسمح بتوزيع أفضل لموارد الحوسبة، حيث تُخصص كل جلسة شريحة مخصصة للمستخدم الذي يلعب.
من حيث الأداء، تصف الاختبارات العامة دقة تقارب 720 بكسل وتردد يتراوح بين 20 و 24 إطارًا في الثانيةتترافق هذه الميزات مع تأخير ملحوظ في الاستجابة عند تحريك الشخصية أو تغيير الكاميرا. ووفقًا لبعض المختبرين الأوائل، تبدو التجربة أقرب إلى فيديو تفاعلي منها إلى لعبة فيديو تقليدية سلسة تمامًا.
تجدر الإشارة أيضًا إلى أن جيني 3 إنه ليس محرك رسومات كلاسيكي، بل نموذج يتنبأ بالإطار التالي. بناءً على ما سبق، ينتج عن ذلك سلوكيات غريبة: مسارات تغير نسيجها دون سبب واضح، وعناصر تختفي، وفيزياء غير معقولة، أو رسوم متحركة تتشوه بشكل عشوائي.
تحذر جوجل نفسها من أن العوالم المُولّدة "قد لا تبدو حقيقية تمامًا أو قد لا تتوافق دائمًا مع المؤشرات أو قوانين الفيزياء."وقد تكون عناصر التحكم بالشخصية غير دقيقة. بعبارة أخرى، تبدو التقنية واعدة، لكنها لا تزال بعيدة عن تقديم تجربة لعب متكاملة من حيث أسلوب اللعب واستقرار الرسومات.
الوصول المقيد وخارطة الطريق الدولية

في هذه المرحلة الأولى، يتوفر مشروع جيني فقط لـ عملاء Google AI Ultra في الولايات المتحدةتُعدّ خطة الاشتراك الأكثر تطوراً لدى الشركة مُصممة خصيصاً للشركات والمبدعين الذين يحتاجون إلى قدرات ذكاء اصطناعي عالية الأداء. وهي خدمة مميزة، مما يحدّ من عدد المستخدمين الذين يمكنهم الوصول إلى التجربة.
يُعزى قرار تقييد الاختبارات إلى كل من التكلفة الحسابية لكل جلسة يعود ذلك إلى اهتمام جوجل بجمع تعليقات مفصلة قبل إطلاقها على نطاق أوسع. وأكد شلومي فروتشر، مدير الأبحاث في ديب مايند، أن إتاحة هذه الأدوات لعدد أكبر من المستخدمين لجمع آراء حول استخدامها في الواقع أمر "مثير"، ولكن لا يوجد حتى الآن موعد محدد لوصولها إلى أوروبا أو غيرها من الأسواق.
من وجهة نظر المستخدمين والدراسات الإسبانية والأوروبية، يُترجم هذا إلى حقيقة أنه، على الأقل على المدى القصير، سيكون الدور الأكثر واقعية هو دور المراقب: متابعة الاختبارات عن كثب، وتحليل مقاطع الفيديو المتداولة بالفعل على وسائل التواصل الاجتماعي، وتقييم مدى إمكانية دمج هذه التقنية في سير العمل لتصميم المستويات، أو النماذج الأولية السريعة، أو تصور الأفكار.
أشارت جوجل إلى نيتها في توسيع نطاق الوصول تدريجياً شريطة أن تسمح بذلك عوامل الأداء والتكاليف والمسائل القانونية. ومع ذلك، فإن وتيرة هذا التوسع ستعتمد أيضاً على استجابة المجتمع وكيفية تطور النقاشات المحيطة بحقوق النشر والاستخدام المسؤول لمحتوى الطرف الثالث.
القدرة على تقليد الألعاب المعروفة ومناقشة حقوق النشر
كانت إحدى أكثر النقاط حساسية في مشروع جيني هي القدرة على إعادة إنشاء عوالم مستوحاة بوضوح من ألعاب الفيديو الموجودة، بدرجات متفاوتة من النجاح.تمكن بعض الصحفيين المتخصصين من ابتكار سيناريوهات تشبه بوضوح عناوين مثل Super Mario 64 أو Metroid Prime أو The Legend of Zelda: Breath of the Wild.
وفي حالة زيلدا، فقد شوهدوا بالفعل شخصيات تستخدم المظلة الشراعية عند القفزترتبط هذه الإيماءة ارتباطًا وثيقًا بلعبة نينتندو. تشير هذه المصادفات إلى أن النموذج قد تم تدريبه باستخدام عدد كبير من مقاطع الفيديو المتاحة للجمهور، مما يثير تساؤلات حول كيفية التعامل مع الملكية الفكرية في تدريب الذكاء الاصطناعي.
بعد عدة تجارب أُعيد فيها إنشاء عوالم مستوحاة من سلاسل أفلام ومسلسلات شهيرة، بدأت جوجل في منع توليد سيناريوهات وشخصيات معينةخاصةً عند ذكر أسماء أو علامات تجارية محددة. في بعض الحالات، تمنع الأداة بشكل مباشر إنشاء عوالم مبنية على قصص معينة، بحجة "مصالح مزودي المحتوى الخارجيين".
توضح الشركة أن مشروع جيني هو "تم تدريبها بشكل أساسي باستخدام بيانات الويب المتاحة للجمهور"لكن تذكر أن هذا المحتوى لا يزال خاضعًا لقوانين حقوق النشر. ونتيجة لذلك، لا يزال نظام الرقابة قيد الإنشاء، حيث تُحظر بعض محاولات إعادة إنتاج الأعمال المحمية بحقوق النشر صراحةً، بينما تتسلل محاولات أخرى طالما تم تجنب الإشارات المباشرة للغاية.
هذا السلوك غير المنتظم يغذي الجدل حول إلى أي مدى يمكن أو ينبغي أن تستلهم الذكاء الاصطناعي من الألعاب الموجودة؟ وأين نرسم الخط الفاصل بين التكريم والتقليد والنسخ؟ من المتوقع أن يكون هذا النقاش ذا أهمية خاصة في مناطق مثل الاتحاد الأوروبي، حيث لا تزال الأطر التنظيمية المتعلقة ببيانات التدريب وحقوق التأليف والنشر في مجال الذكاء الاصطناعي قيد التحديد.
التأثير المحتمل على صناعة ألعاب الفيديو
بعيدًا عن جاذبية المشاهدة الإعلامية عوالم "مثل ماريو" أو "مثل زيلدا" يتم إنشاؤها في ثوانٍيُعدّ مشروع جيني جزءًا من سباق أوسع بين شركات التكنولوجيا الكبرى لتطبيق الذكاء الاصطناعي التوليدي في تطوير الألعاب. فعلى سبيل المثال، كشفت مايكروسوفت عن مشاريع مثل ميوز لأتمتة أجزاء من عملية التصميم والإنتاج، وتستكشف شركات أخرى حلولًا مماثلة لخفض التكاليف وتسريع عملية التطوير.
وفي هذا السياق، يهدف اقتراح جوجل إلى أن يصبح أداة سريعة للنماذج الأولية والتجريب قد يكون هذا الأمر ذا أهمية لكل من الاستوديوهات المستقلة وشركات النشر الكبرى. فالقدرة على بناء سيناريو قابل للعب انطلاقاً من رسم تخطيطي أو فقرة نصية تُسهّل التحقق المبكر من الأفكار، وإنشاء عروض تجريبية داخلية، أو اختبار آليات اللعب دون الحاجة إلى استثمار شهور من العمل.
إلا أن ازدياد استخدام هذا النوع من الحلول يثير قلق بعض العاملين في هذا القطاع. من جهة، هناك قلق بشأن التأثير المحتمل على بعض المهن. إذا تم إنشاء بعض المحتوى تلقائيًا. من ناحية أخرى، يتخوف العديد من المطورين من نماذج الأعمال التي يتم فيها تدريب الذكاء الاصطناعي على أعمال منشورة مسبقًا دون تعويض واضح لمؤلفيها.
في الأسواق الأوروبية والإسبانية، حيث يحتدم النقاش حول حماية الإبداع الثقافي، سيكون من الضروري دراسة كيفية اندماج أدوات مثل مشروع جيني في اللوائح المستقبلية. فجوانب مثل الشفافية المتعلقة ببيانات التدريب، وأنظمة الانسحاب لأصحاب الحقوق، ونسبة المحتوى المُنشأ، قد تُحدث فرقًا جوهريًا بين التبني الرشيد والصراع المستمر مع المطورين والناشرين.
في الوقت الحالي، لا يزال مشروع جيني في مرحلة مبكرة حيث إنها تعمل كمختبر عام أكثر من كونها منتجاً نهائياً.إن تطورها، وكيفية تعامل جوجل مع القضايا القانونية والأخلاقية المرتبطة بها، سيحدد ما إذا كانت ستندمج في نهاية المطاف في سير عمل الاستوديوهات أم ستبقى مجرد تجربة براقة ولكنها محدودة.
ومع ذلك، فإن ظهور هذا النموذج الأولي يوضح ما تراه شركات التكنولوجيا الكبرى فيه. التوليد التلقائي للعوالم التفاعلية أرض استراتيجية من الدرجة الأولى. على الرغم من أن استخدامها الفعلي اليوم محدود ويعاني من عيوب تقنية، إلا أن اتجاهها واضح: نماذج قادرة بشكل متزايد على تحويل النصوص والصور إلى تجارب تفاعلية، وصناعة سيتعين عليها أن تقرر كيف تريد التعايش مع هذه الأدوات الجديدة.