- A platform for privacy-preserving federated machine learning using blockchain to enable operational improvements in ATM
- Consorcio: SITA eWAS (coordinador del proyecto), Nommon, Scaleout Systems, Swiss International Air Lines y EUROCONTROL.
- 2020 – 2022
- aichain-h2020.eu
Contexto
Las técnicas de aprendizaje automático (ML, por las siglas en inglés de Machine Learning) han demostrado un gran potencial para mejorar los procesos de predicción y optimización en las operaciones de gestión del tráfico aéreo (ATM, por las siglas en inglés de Air Traffic Management). Sin embargo, la necesidad de entrenar modelos de ML con datos históricos plantea desafíos relacionados con la privacidad, ya que las partes interesadas en la gestión del tráfico aéreo a menudo no están dispuestas a revelar información comercial confidencial. Además, las leyes de protección de datos imponen restricciones de privacidad en el intercambio de datos, especialmente en lo que respecta a los datos de los pasajeros.
El aprendizaje automático federado (FedML, por Federated Machine Learning) ha surgido como una posible solución para abordar estos problemas de privacidad. Esta tecnología permite el entrenamiento de modelos de ML con los mejores datos disponibles a la vez que preserva la privacidad de los datos. El proceso implica cuatro pasos iterativos: 1) el servidor envía el modelo a los nodos; 2) los nodos entrenan localmente el modelo de ML con sus respectivos datos (nunca abandonan el host); 3) cada nodo envía el modelo entrenado de vuelta al servidor; y 4) el servidor agrega los modelos utilizando funciones matemáticas para crear un modelo general.
Más allá de salvaguardar la privacidad de los datos, las tecnologías FedML también ofrecen la ventaja de acelerar el entrenamiento de modelos de ML grandes y complejos. Esta eficiencia se atribuye a la naturaleza descentralizada y paralelizada del entrenamiento federado.
El proyecto
AICHAIN es un proyecto de investigación financiado en el marco del programa SESAR 2020 Exploratory Research. El proyecto propuso desarrollar un concepto innovador de gestión de la información digital (DIM, por las siglas en inglés de Digital Information Management) —la solución AICHAIN— que permitiera la explotación segura de grandes conjuntos de datos privados pertenecientes a de diferentes stakeholders y que contienen información valiosa para mejorar las operaciones del sector de ATM. Para superar las reticencias de las distintas partes interesadas a la hora de compartir estos datos sensibles, la explotación no se llevaría a cabo intercambiando los datos en sí, sino a través de una arquitectura avanzada de aprendizaje federada que preserva la privacidad, ya que no requiere exponer ni los datos ni el modelo. Esto fue posible gracias a la combinación de dos tecnologías DIM emergentes: las tecnologías FedML y las tecnologías blockchain.
Objetivos de AICHAIN
Los objetivos específicos de AICHAIN se estructuraron en tres áreas de investigación:
- La solución tecnológica DIM: definir la arquitectura de la solución AICHAIN como un posible habilitador tecnológico de SESAR para la explotación del valor de los datos privados, e implementar un prototipo funcional a pequeña escala para la validación del usuario y la experimentación del valor operativo.
- El valor operacional de la solución DIM: demostrar y cuantificar el valor operacional del concepto propuesto con AICHAIN con un caso de uso de ATM en el área de servicios A-DCB.
- Aspectos de gobernanza e incentivos: desarrollar un mecanismo de incentivos que aborde los aspectos motivacionales de los propietarios de los datos para facilitar la adopción y el uso efectivo de la solución AICHAIN.
El papel de Nommon
Nommon desempeñó un papel fundamental en la definición, implementación y puesta en marcha de los casos de uso para mostrar la solución AICHAIN. Específicamente, Nommon lideró el desarrollo de un modelo de aprendizaje automático y su integración en la arquitectura federada para la predicción de trayectorias durante la fase pretáctica. Esto incluyó escenarios para condiciones normales, así como situaciones con condiciones climáticas severas o restricciones relacionadas con el equilibrio de demanda y capacidad (DCB, por “Demand and Capacity Balancing”). Nommon también dirigió la tarea de definición de mecanismos de gobernanza e incentivos para la adopción de las soluciones AICHAIN.
Resultados
La investigación realizada durante el proyecto AICHAIN ofreció los siguientes resultados:
- Arquitectura de la solución AICHAIN: la investigación permitió diseñar con éxito la arquitectura de la solución AICHAIN, dirigida a aprovechar conjuntos de datos privados y no privados de manera federada. La arquitectura prioriza la preservación de la privacidad, la confianza y la escalabilidad.
- Prototipo de la solución AICHAIN: se desarrolló y utilizó un prototipo de la solución AICHAIN para mostrar la herramienta a través de varios experimentos de aprendizaje federados. Además, la plataforma se sometió a evaluaciones de ciberseguridad para garantizar su solidez.
- Valor operativo de los datos privados: para demostrar el valor de los datos privados, la investigación mostró su aplicabilidad a través de dos casos de uso relevantes de ATM. Estas operaciones se mejoraron notablemente con datos privados provenientes de una aerolínea federada.
- Metodología de tokens personalizables: la investigación introdujo un marco de tokens personalizables diseñados para implementar políticas de recompensas. Estos tokens fueron estratégicamente orientados a fomentar la colaboración entre los propietarios de datos privados que participan en procesos federados.
Este proyecto ha recibido fondos de SESAR Joint Undertaking, bajo el convenio de subvención Nº 894162, enmarcado en el Programa de Investigación e Innovación Horizonte 2020 de la Unión Europea.