اكتشف الانجاز الفريد من باحثي جامعة نيويورك الذي صمموا تقنية مبتكرة تمكن الطائرات بدون طيار من تحقيق رحلة مستقرة في 18 ثانية فقط. باستخدام قوة جهاز MacBook Pro القياسي، تستخدم هذه التكنولوجيا الثورية بيئات محاكاة لتدريب الطائرات بدون طيار للرحلة المستقرة والتنقل بسرعة على مسارات محددة.
سرعة التدريب المذهلة: في جلسة قصيرة ومدهشة تستغرق 18 ثانية فقط، تتعلم الطائرات بدون طيار حركات الطيران المعقدة. هذا النهج المبتكر ليس مقتصرًا على النماذج الأساسية فقط، بل هو متعدد الاستخدامات بما يكفي لتدريب أي طائرة بدون طيار، سواء كانت نموذجًا معقدًا ومتطورًا أو وحدة مخصصة.
ملامح الابتكار:
- Deep Learning End-to-End: باستخدام العمق في التعلم التعزيزي، تحقق الطائرات بدون طيار السيطرة من الإدراك إلى العملية بدون خطوات وسيطة معقدة، مما يعزز المباشرة والكفاءة لاستراتيجية التحكم.
- نموذج الممثل-النقاد غير المتماثل: إطار عمل مبتكر يعتمد على التعزيز المعتمد على التعلم العميق، حيث يقوم “الممثلون” باتخاذ القرارات باستخدام عمليات من الحالة إلى العملية، في حين يقوم “النقادون” بتقييم الحركات باستخدام بيانات محاكاة إضافية، مما يسرع عملية التعلم.
- محاكي محسّن: بفضل القدرة على محاكاة تقريبًا 5 أشهر من وقت الطيران في الثانية، يسرع هذا المحاكي القوي على جهاز كمبيوتر محمول عملية تدريب الطائرات بدون طيار بأمان.
- نهج التعلم الأكاديمي: تبدأ الطائرات بدون طيار بالمهام الأساسية وتتقدم إلى الحركات المعقدة، مما يحسن تدريجياً اتقان السيطرة على الطيران.
- وظيفة مكافأة متكيفة: يتطور نظام المكافأة أثناء مرحلة التدريب، حيث يتم تحجيم التغذية المرتدة لتعزيز اكتساب الطائرة المسار المستقر والتنفيذ.
- استراتيجية Sim2Real: تدريب مخصص ومحاكاة تضمن استراتيجية سيطرة سلسة من البيئات الافتراضية إلى البيئات الحقيقية، مما يجسر الهاوية بين المحاكاة والواقع.
تقلص هذه المشروع ليس فقط وقت التدريب من النظرية المجردة إلى الممارسة العملية، بل قام أيضًا بتوفير الشفافية بإطلاق الشفرة المفتوحة والمحاكي، مما يتيح الوصول إلى هذه التكنولوجيا المذهلة بشكل جماعي.
لمزيد من التفاصيل، تفضل بالاطلاع على ورقة البحث على الرابط التالي: https://arxiv.org/abs/2311.13081.
YouTube video player