Data Science Starter Program - Polytechnique

DSSP

Un nouveau programme de formation continue en Data Science et Big Data, proposé par l'École Polytechnique

et ses départements de Mathématiques Appliquées et d'Informatique


Nous sommes fiers d’annoncer l’ouverture des inscriptions pour la session du Data Science Starter Program.

Déposez votre candidature ici

Date limite de candidature : 26 Juin, 2016. Les CVs et lettres de motivation devront être rédigés en anglais.

Eléments clefs:
  • 120 heures d'enseignement : (2 jours par semaine, les vendredis et samedis) avec 2 créneaux de 3h chaque jour de formation et des conférences invitées.
  • Dates de la formation : 30 septembre & 1er octobre, 7-8 octobre, 14-15 octobre, 21-22 octobre, 4-5 novembre, 18-19 novembre, 25-26 novembre, 2-3 décembre, 9-10 décembre.
  • Lieu : Ecole polytechnique
  • Certification : A l’issue du programme, un certificat de l’École polytechnique est délivré à chaque participant ayant validé l’ensemble de la formation avec succès.
  • Plus d’information : Ecole Polytechnique Executive Education

The DSSP organizing team
Scientific Coordinators: E. Le Pennec (CMAP), M. Vazirgiannis (LIX)

Administrative Support: dssp@polytechnique.edu

Public visé et Prérequis



Les modules proposés sont pensés pour toute personne ayant des connaissances fondamentales en Informatique ou en Statistique. Une expérience basique de programmation est requise. La formation et les concepts présentés dans ce programme permettent une compréhension claire du contexte et des défis du Big Data, une nouveauté qui modifie profondément de nombreux domaines « business » ou scientifiques. Le programme proposé est adapté aussi bien à des professionnels en début de carrière qu'à des managers ayant besoin d'une compréhension de ce domaine en pleine expansion et de ses applications.

Data Science Starter Program


Ce programme de formation est destiné à des professionnels et comprend des cours magistraux, des travaux pratiques sur machine ainsi que du travail personnel. Il couvre des sujets de l'état de l'art en Data Science et Big Data allant de la collecte de données, leur stockage et traitement à l'analyse et la visualisation ainsi que des applications réels à des exemples concrets. Ce programme propose une vue d'ensemble et couvre, avec un degré de détail suffisant, les méthodes et les outils permettant d'attaquer des problèmes de Big Data.

Programme

120 heures d'enseignement (2 jours par semaine, les vendredis et samedis, en octobre, novembre et décembre 2015) avec chaque jour de formation : 2 créneaux de 3h + 1h de conférence ou d'exposé invité
  • Journée 1. Introduction à la science des données. Écosystème du big data, cycle de vie d’un projet de données/gestion de projet, architecture informatique et introduction au calcul distribué, questions de confidentialité.
  • Journée 2-4. Bases de données, outils big data. Bases de données : SQL et NoSQL, calcul distribué, cloud computing, Map Reduce et Hadoop, HIVE/PIG, Spark.
  • Journées 5-7. Prétraitement des donnés et visualisation. Nettoyage de données, normalisation, sélection et création des variables, réduction de dimensions, exploration de données, visualisation avec R et Python, visualisation par navigateur, data mashup, data munging, conception et ingénierie des variables.
  • Journée 8. Atelier Données - première partie. Introduction au jeu de données et à l’objectif de l’atelier. Exploration et sélection/ingénierie des variables.
  • Journées 9-12. Analyse des données et apprentissage automatique. Introduction à l’apprentissage, apprentissage non supervisé, apprentissage supervisé (régression et sélection des variables, régression logistique, classification naïve bayésienne, algorithme des k-voisins les plus proches (KNN), machines à vecteurs de support (SVM), arbres de décision et réseaux de neurones), évaluation des modèles, surapprentissage, sélection de modèles, méthodes d’ensemble.
  • Journées 13-14. Apprentissage automatique de graphes et de textes avec des applications au filtrage collaboratif, systèmes d’annonces publicitaires Web contextualisées et personnalisées, réseaux sociaux, etc.
  • Journées 15-18. Atelier données – seconde partie : Les participants travaillent par petits groupes afin de résoudre des cas compliqués de données sur différents domaines d’application afin de mettre en pratique les savoirs acquis tout au long de la formation.

Data Science Starter Program – Programme détaillé

Vous pouvez voir le programme détaillé et des informations complètes sur la formation dans la brochure DSSP 2015 en francais ou anglais.

Contactez-nous




CAPTCHA Image

S'il vous plaît insérez le CAPTCHA: