La science des données au service de la santé

Directeur de recherche CNRS et chercheur associé au Centre de Mathématiques Appliquées de l’X, Emmanuel Bacry exploite et analyse les données de l’une des bases les plus convoitées au monde pour répondre aux problématiques de santé publique.
La science des données au service de la santé
28 fév. 2018
Projet

Vous êtes spécialiste de la science des données et vos recherches portent notamment sur la santé et l’économie de la santé. Pourriez-vous nous en dire plus ?

La santé représente aujourd’hui un enjeu économique central car il s’agit du premier poste budgétaire de l’État avec près de 170 milliards d’euros par an. Développer des parcours de soins efficients, identifier ceux qui sont les plus performants et ainsi optimiser les politiques gouvernementales mises en œuvre en matière de santé publique sont donc des enjeux majeurs, à la fois médicaux et économiques. Durant la dernière décennie, nous avons assisté à une véritable explosion des données et notamment, des données médicales à tel point que la santé est aujourd’hui l’un des champs d’application majeurs du Big Data. L’analyse de ces données et les informations que nous pouvons en extraire peuvent potentiellement nous permettre de détecter des effets secondaires, de prédire les flux d’arrivées dans les services d’urgence ou encore de repérer les corrélations entre la prise de médicaments et certaines pathologies.

Depuis 2015, l’École polytechnique est associée à la Caisse Nationale de l’Assurance Maladie (CNAM). En quoi consiste ce partenariat ?

Ce partenariat est essentiel car il nous permet d’analyser et d’exploiter les données d’une base absolument unique : le SNIIRAM (Système national d'information ­inter-régimes de l'Assurance maladie). Alors que les plus grosses bases de données des mutuelles américaines recensent les informations de 8 millions de personnes, celle du SNIIRAM contient les données des 65 millions d’assurés français puisqu’il s’agit de la base de la Carte Vitale. En quelques chiffres, cette base de données, ce sont 1,2 milliard de feuilles de soins et 11 millions de séjours hospitaliers répertoriés chaque année, 300 To de données gérées par la CNAM (âge, sexe, prescriptions, remboursements…). Il s’agit d’une base de données d’une richesse inouïe dont l’analyse peut avoir un impact extrêmement fort. Notre partenariat avec la CNAM vient d’ailleurs d’être reconduit pour 3 ans ce qui va nous permettre de poursuivre nos recherches et de développer de nouveaux algorithmes pour répondre aux problématiques des institutions et des entreprises.

À quel stade d’avancement en êtes-vous dans vos recherches ?

La première phase du projet, qui portait sur la pharmacovigilance, a permis de valider de nouveaux algorithmes grâce notamment à un long travail de réorganisation totale de la chaîne des données. Aujourd’hui, nous souhaitons utiliser des algorithmes pour faire du dépistage automatique de médicaments ayant des effets secondaires. Nous cherchons par exemple à identifier quels sont les médicaments susceptibles de provoquer des chutes chez les personnes âgées. Toujours avec la CNAM, nous travaillons aussi sur l’optimisation des parcours de soins pour des pathologies données mais nous avons également de nombreux autres partenariats en santé. Ainsi, avec l’aide d’une addictologue de l’APHP, nous tentons de prédire et détecter les risques d’addiction chez les joueurs de poker en ligne.

Depuis 4 ans, vous dirigez également l’initiative Data Science à l’École polytechnique qui rassemble des chercheurs et des enseignants autour de la thématique du Big Data.

Cette initiative illustre la volonté de l’X de mettre en lumière la science des données et de développer une expertise en enseignement et en recherche reconnue dans le domaine du Big Data. Elle regroupe des chaires et des programmes phares à forte dimension scientifique, académique et industrielle comme la chaire « Data Scientist » créée en 2014 en partenariat avec Keyrus, Orange et Thales ou encore le master « Mathématiques pour la science des masses des données » (École polytechnique, Télécom ParisTech, ENSAE ParisTech). L’initiative Data Science nous permet de fédérer nos recherches et de mener des actions conjointes. Nous avons ainsi organisé en août dernier la première Data Science Summer School qui a rassemblé sur le campus de l’École polytechnique 400 participants de 30 nationalités différentes, issus de 50 entreprises et 180 institutions internationales. Fort du succès de cet événement, un deuxième opus est prévu à la fin du mois de juin en partenariat avec DATAIA. Nous devrions avoir le plaisir d’y accueillir Yann LeCun, spécialiste mondial de l’intelligence artificielle ainsi que Cédric Villani, mathématicien de renommée internationale et député LREM qui mène actuellement pour le Premier ministre une mission sur l’intelligence artificielle. 

Votre projet bénéficie du soutien des donateurs dans le cadre de la deuxième Campagne de levée de fonds. Que vous apporte ce soutien ?

Les financements que nous avons reçus nous ont permis d’acquérir de nouvelles machines de pointe, d’organiser la Data Science Summer School mais surtout, de recruter des ingénieurs, des chercheurs et des data scientists. Dans un univers ultra concurrentiel, ces recrutements sont essentiels et contribuent à faire de l’X un leader international dans la science des données.

>> En savoir plus sur le projet

>> Soutenir le projet

 

Retour