Résultats du challenge étudiant de Data Science « Flights »

Le challenge « Flights » a proposé d’utiliser une approche d’apprentissage supervisé pour prédire le nombre de passagers en fonction de la date de leur réservation et du trajet de l’avion. Il a été organisé conjointement par les programmes de mécénat «Data Science Institute» et «Data Science et Processus Industriels» et s’est clôturé le 3 février.
15 fév. 2022
Éducation, Recherche, Bachelor, Cycle Ingénieur, Master, Mathématiques Appliquées

Avec la participation de plus de 100 étudiants provenant d’une dizaine de pays, le challenge « Flights » a proposé de construire des modèles d’apprentissage supervisé afin de prédire le nombre de passagers réels des vols d’avion. Au croisement des sujets des programmes de mécénat « Data science et processus industriels » et « Data Science Institute », portés par Éric Moulines chercheur au Centre de mathématiques appliquées (CMAP*), Lambert Tanoh, enseignant-chercheur à de l’Institut National Polytechnique Félix Houphouët-Boigny (INPHB) et Jean Arnaud Kouakou, enseignant-chercheur à L’Ensea-Abidjan, la compétition a eu lieu du 13 décembre au 15 janvier. Les élèves ont pu présenter leurs modèles et retracer leurs évolutions lors de l’évènement de clôture le 3 février.

Les étudiants avaient à leur disposition des données réelles indiquant le départ de l’avion, son trajet, ainsi que la moyenne et la répartition du temps entre la réservation d’un billet et le départ de l’avion. A partir de ces jeux de données, ils ont construit des algorithmes devant reproduire le plus fidèlement possible les observations réelles. Il s’agit donc bien d’un problème d’apprentissage supervisé, car les algorithmes ont été entraînés avec des données en sachant quel résultat correspondait à quelle entrée. Ils ont pu soumettre quotidiennement leur modèle afin d’évaluer leur performance, avec au total plus de 400 soumissions. Outcoder, startup spécialisée dans les challenges de data science, a coordonné la compétition et évalué les algorithmes envoyés.

Sur les 31 équipes composées d’une à quatre personnes, celles en tête du podium sont issues respectivement de l’Université Mohammed VI Polytechnique, de l’INP-HB de Yamoussoukro, et de l’Institut national des sciences appliquées Centre Val de Loire. A l’aide d’analyses de la variance, c’est-à-dire de la répartition des données, et de matrices de corrélation, les élèves ont analysé en détail les jeux de données fournis. Ils ont ensuite déterminé comment l’algorithme devait pondérer les données et choisir lesquelles étaient les plus pertinentes. La dernière étape avant soumission du modèle était le choix d’algorithme, ainsi que l’utilisation de logiciels pour optimiser l’apprentissage machine.

Cette compétition internationale a permis à des étudiants en data science dans des parcours d’excellence de se rassembler, et de tester chaque jour le résultat de leurs idées.  Ce challenge, réalisé avec des données réelles, a directement confronté ses participants à des situations concrètes auxquelles ils feront face en sortie de cursus, et a récompensé les équipes ayant su compléter intelligemment les données.

*CMAP : une unité mixte de recherche CNRS, École polytechnique - Institut Polytechnique de Paris

A propos des programmes de mécénat :

Data Science et Processus Industriels :
Portée par Éric Moulines, la Chaire internationale « Data Science et processus industriels » contribue à former une nouvelle génération d’ingénieurs à l’Université Mohammed VI Polytechnique pour exploiter les Sciences des Données et développer des processus industriels innovants. À travers les activités d’enseignement de la Chaire depuis sa création en 2018 et avec le soutien d’OCP, les partenaires préparent ensemble des étudiants à devenir des innovateurs de l’industrie et à développer les processus industriels de demain grâce aux sciences des données.

Data Science Institute :
Soutenu depuis 2017 par le Groupe Orange, et par la Société Générale Côte d'Ivoire depuis 2021, le mécénat « Data Science Institute », portée par Eric Moulines, Lambert Tanoh et Jean-Arnaud Kouakou, vise à accélérer la montée en compétences en « data management » en Côte d‘ivoire et en Afrique de l’Ouest. Hébergé au sein des institutions existantes ivoiriennes, l'Institut national polytechnique Félix Houphouët-Boigny (INP-HB) de Yamoussoukro et l’École nationale supérieure de statistique et d’économie appliquée (ENSEA) Abidjan Côte d’Ivoire, il prévoit la mise en place d’un cursus d’excellence de niveau international dans les sciences de la donnée, à destination d’étudiants dans un premier temps, puis de cadres en entreprise.

Retour