Entdecken Sie den Durchbruch der Forscher der New York University, die eine hochmoderne Technik entwickelt haben, die Drohnen in nur 18 Sekunden stabil fliegen lassen kann. Mit der Leistung eines standardmäßigen MacBook Pro nutzt diese revolutionäre Technologie simulierte Umgebungen, um Drohnen schnell das Schweben und das Fliegen von vorherbestimmten Strecken beizubringen.
Bemerkenswerte Trainingsschnelligkeit: In einer erstaunlich kurzen 18-Sekunden-Sitzung erlernen Drohnen anspruchsvolle Flugmanöver. Dieser innovative Ansatz beschränkt sich nicht auf grundlegende Modelle - er ist vielseitig genug, um jede Drohne auszubilden, sei es eine komplexe, hochwertige Variante oder eine maßgefertigte Einheit.
Innovations-Highlights:
- End-to-End Deep Learning: Durch Deep Reinforcement Learning erlangen Drohnen eine Wahrnehmungs-zu-Aktions-Kontrolle ohne komplexe Zwischenschritte und verbessern damit die Direktheit und Effizienz der Kontrollstrategie.
- Asymmetrisches Actor-Critic-Modell: Ein bahnbrechendes RL-unterstütztes Framework, das Rollen aufteilt; ‘Actors’ treffen Entscheidungen durch Zustands-zu-Aktions-Prozesse, während ‘Critics’ Bewegungen mit zusätzlichen Simulationsdaten bewerten und das Lernen beschleunigen.
- Optimierter Simulator: Mit der Fähigkeit, etwa 5 Monate Flugzeit pro Sekunde abzubilden, beschleunigt dieser leistungsstarke Simulator auf einem Consumer-Laptop das Drohnentraining ohne Risiko.
- Curriculum Learning Ansatz: Drohnen beginnen mit einfachen Aufgaben und entwickeln sich zu komplexen Manövern weiter, wodurch ihre Flugkontrolle systematisch verbessert wird.
- Adaptive Belohnungsfunktion: Das Belohnungssystem entwickelt sich während der Trainingsphase weiter und skaliert das Feedback, um den Erwerb und die Umsetzung einer stabilen Flugbahn der Drohne zu fördern.
- Sim2Real-Strategie: Maßgeschneidertes Training und Simulation gewährleisten eine reibungslose Migration der Kontrollstrategie von virtuellen zu realen Umgebungen und überbrücken die Simulation-Realität-Spaltung.
Dieses Projekt verkürzt nicht nur die Trainingszeit von abstrakter Theorie zu greifbarer Praxis, sondern hat auch den Code und den Emulator öffentlich zugänglich gemacht, um den Zugang zu dieser bemerkenswerten Technologie zu demokratisieren.
Für weitere Details lesen Sie das Forschungspapier unter https://arxiv.org/abs/2311.13081.
YouTube video player