뉴욕 대학의 연구자들이 개발한 돌파구를 발견해보세요. 이 첨단 기술은 드론이 겨우 18초 만에 안정적인 비행을 숙달할 수 있게 만들어주었습니다. 이 혁신적인 기술은 표준 MacBook Pro의 성능을 활용하여 시뮬레이션 환경을 사용하여 드론이 빠르게 매달림과 미리 설정된 경로를 탐색하는 것을 훈련합니다.
놀라운 훈련 속도: 놀랍게도 18초의 짧은 시간동안 드론은 세련된 비행 기술을 배웁니다. 이 혁신적인 접근법은 기본 모델에 제한되지 않으며, 복잡하고 고급스러운 변형형이나 맞춤형 유닛 등 어떤 드론이든 훈련하는 데에 충분히 유연합니다.
혁신의 요점:
- End-to-End 딥러닝: 딥 강화 학습을 사용하여 드론은 복잡한 중간 단계 없이 인식-행동 제어를 달성하며, 제어 전략의 직관성과 효율성을 향상시킵니다.
- 비대칭 Actor-Critic 모델: 역강화 학습을 기반으로한 혁신적인 프레임워크로 ‘액터’는 상태-행동 방식으로 결정을 내리고, ‘크리틱’은 추가 시뮬레이션 데이터를 통해 움직임을 평가하여 학습 속도를 가속화합니다.
- 최적화된 시뮬레이터: 소비자용 노트북에서 초당 약 5개월의 비행 시간을 동시에 반영할 수 있는 강력한 시뮬레이터로 드론 훈련을 안전하게 가속화합니다.
- 커리큘럼 학습 접근법: 드론은 기본적인 작업부터 복잡한 비행 기술로 전진하여 비행 제어 숙달도를 체계적으로 향상시킵니다.
- 적응적 보상 함수: 보상 시스템은 훈련 과정에서 진화하며 피드백을 조정하여 드론의 안정적인 비행 경로 습득과 실행을 유도합니다.
- Sim2Real 전략: 맞춤형 훈련과 시뮬레이션은 가상 환경에서 실제 환경으로의 원활한 제어 전략 이전을 보장하여 시뮬레이션과 현실의 격차를 줄입니다.
이 프로젝트는 이론적인 추상에서 구체적인 실제 훈련까지의 시간을 단축하는 뿐만 아니라, 코드와 에뮬레이터를 공개하여 이 놀라운 기술에 접근성을 더욱 폭넓게 제공하고 있습니다.
자세한 내용은 https://arxiv.org/abs/2311.13081에서 연구 논문을 참조하세요.
YouTube video player