El documento describe un proceso para predecir los retrasos de vuelos basándose en parámetros como la edad del avión, marca y modelo. El proceso incluye la obtención de datos de vuelos en tiempo real, su filtrado y almacenamiento, y posterior procesamiento para predecir retrasos. Las conclusiones son que la edad del avión tiene un efecto superficial en los retrasos, que la regresión lineal no predice con precisión los retrasos, y que fue difícil de implementar debido a limitaciones de la API.
11. Conclusiones
10
• La edad de
los aviones afecta de
forma superficial al
retraso de los vuelos
• La regresión lineal no se
aproxima a
una predicción real
• Dificultad
incrementada por la
API
• Aplicación de
una BBDD no
tan aplicable al problema
El almacenamiento no es directo porque hay que asociar cada conjunto de datos a su elemento correspondiente en el resto de conjuntos, para lo cual hay que identificar cada vuelo con los datos del avión que lo lleva a cabo. Sin embargo, esta información no se guarda de forma permanente, sino que se guarda en la memoria RAM para ser accedida lo mas rápido posible, lo que hace que estos datos sean volátiles. Esta pérdida se evita volcando los datos en fichero que si que son permanentes, ya que no se cuenta con el hardware para mantener la aplicación corriendo durante días y días realizando llamadas periódicas a la API para monitorear los vuelos y su estado, así que los datos recolectados se vuelcan a fichero cuando el equipo se apaga. Luego para recuperar esos datos basta con extraerlos del disco conociendo la estructura y la semántica con la que están construidos y organizados. Estos datos se almacenan en estructuras de datos en tiempo de ejecución.
Los algoritmos de visualización son para describir datos. Uno de ellos es este, scatterplot, quees una grafica de puntitos a partir de la cual sacar conclusiones. Nosotros hemos empleado la regresión lineal. Hay un valor muy alto de 1500 minutos, que es que el que un vuelo ha sido retrasado por algún factor imprevisto, por lo que es una anomalia, por lo que no se tiene en cuenta.
De estos puntos se saca una regresión lineal que se lleva a cabo mediante los mínimos cuadrados de los valores, de forma que permite ver un patron que se puede utilizar como predicción para el futuro. Como se puede ver, los valores son muy constantes, ya que la línea no tiene apenas pendiente.