learning-to-fly

Descubre el avance de los investigadores de la Universidad de Nueva York que han desarrollado una técnica de vanguardia que permite a los drones dominar el vuelo estable en tan solo 18 segundos. Aprovechando el poder de un MacBook Pro estándar, esta tecnología revolucionaria utiliza entornos simulados para entrenar a los drones a mantenerse en el aire y seguir rutas predefinidas de manera rápida.

Impresionante Velocidad de Entrenamiento: En una sesión increíblemente rápida de 18 segundos, los drones aprenden maniobras de vuelo sofisticadas. Este enfoque innovador no está restringido a modelos básicos, es lo suficientemente versátil como para entrenar cualquier dron, ya sea una variante compleja de gama alta o una unidad personalizada.

Aspectos destacados de la Innovación:

Aprendizaje Profundo de Extremo a Extremo: Utilizando el aprendizaje profundo de refuerzo, los drones logran un control de percepción a acción sin pasos intermedios complejos, mejorando la directividad y eficiencia de la estrategia de control.
Modelo Asimétrico de Actor-Crítico: Un marco pionero respaldado por el aprendizaje por refuerzo que divide los roles; los ‘actores’ deciden usando procesos de estado a acción, mientras que los ‘críticos’ evalúan los movimientos con datos de simulación adicionales, acelerando el aprendizaje.
Simulador Optimizado: Con la capacidad de reflejar aproximadamente 5 meses de tiempo de vuelo por segundo, este potente simulador en una laptop de consumo acelera el entrenamiento de drones sin riesgo.
Enfoque de Aprendizaje del Currículum: Los drones comienzan con tareas básicas y avanzan hacia maniobras más complejas, mejorando sistemáticamente el dominio del control de vuelo.
Función de Recompensa Adaptativa: El sistema de recompensas evoluciona durante la fase de entrenamiento, escalando la retroalimentación para promover la adquisición y ejecución de una trayectoria de vuelo estable del dron.
Estrategia Sim2Real: El entrenamiento y la simulación personalizados garantizan una migración suave de la estrategia de control desde entornos virtuales a entornos reales, acortando la brecha entre simulación y realidad.

Esta iniciativa no solo reduce el tiempo de entrenamiento desde la teoría abstracta hasta la práctica tangible, sino que también ha liberado su código y emulador en código abierto, democratizando el acceso a esta tecnología extraordinaria.

Para más detalles, consulta el artículo de investigación en https://arxiv.org/abs/2311.13081.

Official Website

YouTube video player

Official Website