Arquitectura de software para navegación autónoma y coordinada de enjambres de drones en labores de lucha contra incendios forestales y urbanos

Madridano Carrasco, Ángel

Arquitectura de software para navegación autónoma y coordinada de enjambres de drones en labores de lucha contra incendios forestales y urbanos

Madridano Carrasco, Ángel

Dirigida por:

Arturo de la Escalera Hueso Director/a
David Martin Gómez Codirector/a

Universidad de defensa: Universidad Carlos III de Madrid

Fecha de defensa: 12 de marzo de 2021

Tribunal:

Pascual Campoy Cervera Presidente/a
Javier Fernández Andrés Secretario
Walterio W. Mayol Cuevas Vocal

Tipo: Tesis

Teseo: 644875 DIALNET e-Archivo editor

Resumen

Los recientes avances, tanto en el campo de los vehículos aéreos no tripulados (UAVs) como de los Sistemas Multi-Robot, han provocado la expansión en el uso de este tipo de sistema en tareas del ámbito civil y militar, haciendo de los enjambres de UAVs, conocidos comúnmente como enjambres de drones, una herramienta tecnológica con una alta aplicabilidad en multitud de áreas, entre las que destacan aquellas en las que los tiempos de actuación y respuesta constituyen un aspecto clave para el éxito de las mismas y son, sin dudas, labores relacionadas con las emergencias aquellas dónde una actuación rápida, eficiente y coordinada puede traducirse en una alta reducción de los daños personales, sociales y económicos. Por todo esto, en los últimos años, han surgido corrientes investigadoras encargadas de mejorar la actuación autónoma y coordinada de los enjambres de drones en diferentes entornos, de cara a dotar a la sociedad de una herramienta eficaz capaz de dar soporte, acometer diferentes tareas y facilitar el desempeño de los cuerpos de seguridad a la hora de actuar en situaciones de emergencia como desastres naturales, búsqueda y rescate de personas o incendios forestales y urbanos. Dentro del gran abanico de sucesos a las que se pueden enfrentar los cuerpos de emergencias, son los incendios forestales y urbanos sobre los que la empresa Drone Hopper S.L. ha enfocado sus esfuerzos, de cara a diseñar y fabricar drones caracterizados por poder transportar grandes cantidades de carga de pago y por poseer una gran autonomía tratando de esta forma de establecer en el mercado de los UAVs una potente y eficaz herramienta capaz de acometer labores de lucha contra el fuego. En la actualidad, la empresa Drone Hopper aúna sus esfuerzos en el diseño y desarrollo del WILD HOPPER, una plataforma aérea con capacidad para transportar hasta 600 litros de carga y para realizar, de manera eficaz, maniobras relacionadas con la extinción de incendios, al contar con un sistema patentado de liberación de fluidos. Junto a este novedoso sistema de liberación de líquidos, la eficacia de las plataformas WILD HOPPER en la lucha contra el fuego radica en la capacidad de poder acometer trabajos nocturnos, complementado las labores de extinción llevadas a cabo por sistemas aéreos de lucha contra el fuego tradicionales, como son los helicópteros y los hidroaviones. En definitiva, la plataforma aérea WILD HOPPER se presenta como una solución tecnológica, que complementa a los vehículos aéreos tripulados tradicionales y, supera las limitaciones de otros UAVs, cuyo ámbito de aplicación en labores de lucha contra el fuego se limitan a trabajos de monitorización y vigilancia de determinadas áreas de interés. Con el objetivo de explotar esta tecnología y, a su vez, incorporar en este sector un producto altamente tecnológico, cuyo uso dentro de enjambres de drones permita, además, poseer una solución caracterizada por una serie de ventajas en términos de robustez, versatilidad, eficacia y autonomía. Y es que, el despliegue coordinado de un conjunto de UAVs dentro de un mismo entorno de trabajo provoca, en primer lugar, disponer de diferentes agentes de trabajo, lo cuál aumenta la robustez ante fallos y averías, ya que en caso de pérdida de una o más plataformas aéreas se dispone sobre la zona de más vehículos capaces de asumir labores de agentes perdidos y, de esta manera, poder completar misiones a pesar de que se produzcan fallos o ausencias de agentes que forman el enjambre. En segundo lugar, tanto en general como en el ámbito de la empresa Drone Hopper, los enjambres de UAVs no tienen porque ser homogéneos, es decir, no tienen porque estar formados por plataformas aéreas similares, sino que, de cara a adecuar el enjambre a las diferentes labores a realizar sobre un mismo entorno, los agentes de dicho enjambre pueden presentar diferentes estructuras o cargas de pago, aumentando la versatilidad de la solución tecnológica empleada y, con ello, provocando un crecimiento exponencial del número de tareas diferentes que se pueden llevar a cabo, sobre un mismo área de trabajo, con un solo enjambre de UAVs. En tercer lugar, el trabajo coordinado de los agentes del enjambre provoca que se puedan realizar, en un mismo instante de tiempo y de manera simultánea, diferentes labores relacionadas con el éxito de la misión, lo cual reduce notablemente los tiempos de actuación y respuesta en comparación al uso de una única plataforma y, con ello, se produce una mejora sustancial de la eficacia a la hora de completar diferentes trabajos de emergencia sobre un mismo entorno. Por último, existe un aspecto clave, el cual sigue constituyendo un campo de investigación, desarrollo e innovación importante, como es la navegación autónoma de estas plataformas no tripuladas y, en concreto, la navegación sin supervisión de manera coordinada dentro de un enjambre. La posibilidad de poder emplear soluciones tecnológicas como la propuesta por la empresa Drone Hopper, sin necesidad de desplegar en zonas de riesgo o adversas personal técnico, reduciría de manera notable el riesgo de pérdidas de vidas humanas. Por estos motivos, en la presente tesis doctoral se establece un análisis, desarrollo e implementación de una arquitectura de software que permita la navegación autónoma y coordinada de un enjambre de UAVs. La arquitectura de software propuesta esta formada por un conjunto de capas orientadas, cada una de ellas, a dotar al enjambre de la tecnología necesaria para solventar problemas derivados de la navegación coordinada y sin supervisión dentro de un mismo entorno. Cada una de las capas incluye un conjunto de métodos que aumentan la robustez de la arquitectura, mediante el desarrollo de implementaciones redundantes basadas en diferentes tecnologías, y, además, permiten establecer diferentes lazos de control, a alto nivel, para el desarrollo seguro de la navegación autónoma del enjambre de UAVs. La primera de las capas de la arquitectura está totalmente relacionada con un aspecto clave dentro del movimiento autónomo de sistemas no tripulados, como es la planificación de trayectorias. El planificador de trayectoria implementado se basa tanto en información bidimensional como tridimensional para establecer, para cada agente del enjambre, una trayectoria óptima y segura. Para ello, a partir de información previa del entorno, se realiza una exploración del mismo mediante el uso de un algoritmo basado en Hojas de Rutas Probabilísticas (PRM), el cual permite de manera eficiente establecer, sobre un área de interés, un conjunto de trayectorias posibles, libres de colisiones, sobre las cuales realizar una navegación autónoma segura. El uso de este algoritmo permite, frente a otros métodos de planificación de trayectorias recogidos en la literatura, realizar la exploración de entornos de grandes dimensiones en un corto periodo de tiempo y, generar como salida un grafo con todas las posibles rutas a recorrer. Esta única y rápida exploración del entorno permite establecer un planificador de trayectorias altamente escalable de cara a su utilización en enjambres de UAVs formados por un número variable de agentes. Junto al algoritmo de PRM encargado de la exploración, se emplea el algoritmo A* encargado de generar una solución óptima, en términos de distancia total recorrida, de tal forma que, a partir del conjunto de posibles rutas, establecer, para cada UAV, aquella trayectoria que le permite alcanzar una ubicación de destino recorriendo la menor distancia posible. Este planificador de trayectorias no solo presenta la ventaja de poder generar una solución óptima para un número escalable de UAVs o, de poder trabajar con información en 2 o 3 dimensiones del entorno, sino que contempla la posibilidad de ser empleado para diferentes situaciones como puede ser: un caso etiquetado, en el cual se conoce previamente la ubicación a la cual debe acudir cada agente del enjambre; un caso no etiquetado, para la cual, el planificador de trayectorias propuesto no solo genera las trayectorias, sino que previamente se encarga de establecer que combinación UAV ubicaciones objetivo minimiza la distancia total recorrida por el enjambre mediante el uso del método húngaro; por último, de cara a poder acometer, en un futuro, labores de extinción de incendio de manera óptima con un enjambre de UAVs, el planificador de trayectorias propuesto, permite establecer las posiciones finales cada agente del enjambre dentro de una formación geométrica concreta y, a continuación, establecer el conjunto de trayectorias óptimas y seguras para que cada UAV alcance su posición dentro de la formación. La posibilidad de declararse un incendio forestal con una estructura circular o elíptica hace que formaciones en cuadrado o en flecha puedan realizar extinciones y labores de control del fuego de manera más eficaz. Mientras que la aparición de frentes de llama en incendio descontrolados provoca que formaciones en línea sean una correcta configuración para tratar de mitigar el incendio y favorecer el control y extinción de este. A pesar de las ventajas presentadas, la generación de trayectorias mediante una exploración probabilística basada en PRM presenta el inconveniente de que las rutas generadas tienden a presentar un patrón en Zig-Zag que puede afectar a las dinámicas de vuelo de los UAVs. Por este motivo, el planificador de trayectorias implementado se combina, en una última fase, con un algoritmo de suavizado de trayectorias encargado de la eliminación de puntos de ruta innecesarios, mejorando de esta manera el patrón de las rutas, favoreciendo la consecución de largos tramos de líneas rectas y, además, optimizando la distancia total recorrida por el enjambre y, con ello, los tiempos de respuesta y la eficiencia a la hora de completar una misión. La segunda capa de la arquitectura de software desarrollada se encarga de asegurar, por un lado, la navegación coordinada sin supervisión del enjambre y, por otro lado, la navegación libre de colisiones con los objetos presentes en el área de trabajo. Así pues, esta segunda capa combina un conjunto de métodos que garantizan el libre movimiento de los UAVs a través de las rutas establecidas por el planificador global o, mediante rutas alternativas generadas en caso de que la presencia de nuevos o dinámicos obstáculos impidan la navegación a través de las rutas previamente determinadas. El primer de los métodos establecidos dentro de esta segunda capa se basa en un control centralizado encargado de capturar la posición GPS de cada uno de los agentes del enjambre, establecer la localización relativa de unos con respecto a otros y, determinar diferentes perfiles de velocidad de crucero para cada UAV en el caso de que se pudiera producir una colisión entre dos o mas agentes del enjambre. Así pues, mediante el conocimiento común del posicionamiento de cada uno de los UAVs y, tras establecer un margen de seguridad, a partir del cual el control de velocidad interviene, dicho método se encarga de aplicar reducciones de velocidad diferente a cada uno de los agentes del enjambre en caso de que se aproximen a una misma ubicación en un mismo instante de tiempo y, por índole, se de la posibilidad de colisión entre dichos drones. Este control de velocidad de crucero permite, a cada agente del conflicto, atravesar la ubicación en cuestión en un instante de tiempo diferente y, con ello, evitar la colisión entre los agentes, permitiendo la navegación autónoma coordinada del sistema. En relación con este método, esta segunda capa de la arquitectura incluye una implementación que busca evitar colisiones en aquellas situaciones en las que, al menos uno de los UAVs, se encuentre aprovechando la ventaja de los multirrotores de poder mantenerse en un vuelo estacionario, sin necesidad de realizar movimientos de avance para generar sustentación, como es el caso de los aviones de ala fija. En este caso, para mantener la posición sobre el plano XY del UAV en cuestión, el sistema de evasión de colisiones se encarga, al detectar dicho evento, de establecer un valor de altitud diferente para cada agente del enjambre envuelto en el conflicto, evitando así la posible colisión. El segundo de los métodos también esta relacionado con la detección y evasión de colisiones, pero en este caso basado en la captura y procesamiento de información tridimensional del entorno. Mediante sensores capaces de capturar información en 3 dimensiones del entorno, cada UAV, de manera descentralizada, puede detectar la presencia de obstáculos dentro de las trayectorias fijadas a seguir y, en caso de ser necesario, comenzar un proceso de búsqueda y establecimiento de rutas alternativas que permitan alcanzar una ubicación de interés evitando colisiones con objetos presentes en el entorno. Este segundo método descentralizado, permite generar robustez a la hora de navegar sin supervisión detectando y evitando colisiones, ya que, ante la pérdida de cualquier comunicación, el método anterior puede no detectar la proximidad entre dos UAVs, pero mediante la información 3D capturada por cada agente, los drones implicados pueden ser conscientes de dicha colisión y, establecer cada uno de ellos una ruta alternativa que evite dicha colisión. Por tanto, la combinación de estos 2 métodos permite, a esta segunda capa establecer un control sobre los diferentes agentes del enjambre para garantizar la navegación segura y coordinada a través de las trayectorias previamente fijadas o, a través de rutas alternativas seguras que eviten colisiones entre UAVs del enjambre u objetos no recogidos en la información previa del entorno. Por último, la arquitectura de software propuesta presenta un método para la toma de decisiones inteligente de cada uno de los agentes del enjambre, de tal forma que, cada uno de los UAVs posea la capacidad de elegir una secuencia de acciones que le permita, a partir de la información capturada del entorno, poder alcanzar una ubicación concreta. Para ello, esta nueva capa, se basa en algoritmos de aprendizaje por refuerzo profundo para, mediante un entrenamiento previo, establecer un modelo de toma de decisiones inteligente para cada agente, de tal manera que, sean capaces de establecer una secuencia de acciones óptima que maximice la recompensa obtenida alcanzado así una ubicación objetivo. Este método, basado en técnicas de aprendizaje y error, permite integrar en la arquitectura de software propuesta una última capa, basada en novedosos desarrollos en el campo de la inteligencia artificial, que dote al enjambre de un comportamiento inteligente y genere en cada UAV de un modelo de toma de decisiones autónomo, a través del cual cada agente puede elegir que acción llevar a cabo en cada instante de tiempo para alcanzar una ubicación determinada. El conjunto de la arquitectura propuesta se diseña sobre el framework de Robot Operating System (ROS) debido a la capacidad de este para la implementación y desarrollo de software colaborativo y portable. Aunque estas propiedades no establecen los únicos motivos por los cuales se ha empleado ROS como base de la arquitectura desarrollada, sino que la necesidad de testear y validar cada uno de los métodos implementados sobre simulación, son otra razón por las que el uso de ROS queda justificado. Y es que, en el campo de los vehículos autónomos y, en concreto, en el área de los UAVs, las simulaciones previas a la implementación en plataformas aéreas reales constituye un paso previo crucial debido a que, cualquier error, por mínimo que sea, a la hora de testear cada una de las capas de la arquitectura sobre un UAV real, puede conducir a la pérdida o fallos en el control del UAV y, a consecuencia de ello, la pérdida completa del vehículo, incluyendo la carga de pago embarcada en el mismo. Por este motivo, junto con los resultados cuantitativos, se analizan los resultados cualitativos derivados de la simulación de cada uno de los métodos a través del simulador Gazebo, sobre el cual se establece un enjambre de UAVs con modelos simulados similares a plataformas aéreas reales, en concreto, en referencia al sistema de control o autopiloto, dado que tanto ROS como Gazebo permiten integrar el firmware de PX4 empleado por la controladora Pixhawk, garantizando la correcta implementación de los métodos validados en simulación sobre un enjambre de UAVs real.