منوعات

إتقان ألعاب الأتاري و‎«جو» والشطرنج و‎«شوجي» من خلال التخطيط باستخدام نموذج متعلَّم

لطالما كان تصميم برامج مستقلة ذكية تملك قدرات تخطيطية هو أحد التحديات الرئيسة في مجال الذكاء الاصطناعي. صحيحٌ أنَّ أساليب التخطيط القائمة على النماذج الشجرية حققت نجاحاتٍ كبيرة في مجالاتٍ صعبة، مثل الشطرنج، ولعبة “جو” Go، حيث أصبحت لدينا بالفعل برامج محاكاة مثالية، إلا أنَّه عندما يتعلق الأمر بمشكلات العالَم الحقيقي، فغالبًا ما تكون الديناميات الحاكمة لبيئة المشكلة معقدةً ومجهولة.

وفي هذا البحث المنشور في نشرة العلوم من “نيتشر الطبعة العربية”، يستعرض الباحثون خوارزمية “موزيرو” MuZero، التي تحقق أداءً خارقًا في مجموعةٍ من المجالات الصعبة المعقدة من الناحية البصرية، دون امتلاك أي معرفةٍ مُسبقة بالديناميات الأساسية التي تقوم عليها هذه المجالات، وذلك عبر الجمع بين تقنية بحث قائمة على النماذج الشجرية، ونموذجٍ مُتعلَّم.

تتعلم خوارزمية “موزيرو” نموذجًا قابلًا للتكرار، يُنتِج تنبؤات مرتبطة بعملية التخطيط، مثل: طريقة تحديد الإجراء التالي المطلوب، والمكافأة، ودالة القيمة. وحين قيَّم الباحثون فعالية هذه الخوارزمية في 57 لعبة من ألعاب “الأتاري”، (التي تمثل البيئة المعيارية لألعاب الفيديو المستخدمة لاختبار تقنيات الذكاء الاصطناعي، والتي تواجه فيها مناهج التخطيط القائمة على النماذج صعوباتٍ منذ فترة طويلة)، استطاعت خوارزمية “موزيرو” تحقيق أفضل أداءٍ حتى الآن. وعندما قيَّم الباحثون فعاليتها في لعب “جو”، والشطرنج، و”شوجي” shogi (البيئات المعيارية لاختبار التخطيط عالي الأداء)، دون أن تملك أي معرفةٍ بدينامياتها، وجدوا أنَّها تمكنت من مضاهاة الأداء الخارق لخوارزمية “ألفازيرو” AlphaZero، التي كانت مزوَّدة بقواعد اللعب.

أحوال

موقع أخباري يصدر عن شركة مدنية غير ربحية في بيروت، يقدم من خلال مساحة رقمية حرة وعصرية أخبارًا سريعة، عظيمة الثقة، لافتةً للنظر، ثريةً، وتفسيرًا للاتجاهات الحالية والمستقبلية، التي تؤثر في أحوال الناس.

مقالات ذات صلة

اترك تعليقاً

زر الذهاب إلى الأعلى