agrandir le texte diminuer le texte

Accès direct au contenu

DATA - INFORMATIQUE - STATISTIQUE Portails : www - étudiants - personnels DATA - INFORMATIQUE - STATISTIQUE

Vous êtes ici : Accueil > Nos formations > Formations initiales > M2 SISE > Enseignements de M2 IDS-SISE

Enseignements de M2 IDS-SISE

 

Semestre 3 (30 ECTS)

UE Informatique appliquée (9 ECTS)

  • Programmation Statistique sous R (R. Rakotomalala)
Apprentissage de la programmation sous R. Structures avancées. Programmation des algorithmes de statistique et de data mining sous R. Modèle objet sous R. Programmation big data (map reduce) sous hadoop. Programmation R sous spark. Création de packages.

  • Machine Learning sous Python (R. Ratsimbazafy, Consultant Big Data - CAPGEMINI)
Bases de la programmation python, structures vectorielles et matricielles. Algorithmes de machine learning d'apprentissage supervisé et non supervisé (svm - support vector machine, dbscan, birch,…). Image mining, traitement des données images. Projets de ces dernières années : reconnaissance faciale, reconnaissance et recommandation musicale, programmation d'un chatbot.

  • Entrepôts de données avancés (O. Boussaid & F. Bentayeb)
[Commun avec BI&BD] Modélisation, création et exploitation des entrepôts de données (datawarehouse). Bases NoSQL. Reporting. Tableau software.

  • Logiciels spécialisés - Statistique, Data mining, BI (A. Follet, Expert Data Science - SOLVAY)

 Data visualisation. Dataviz. Outils de reporting. Technologies Qlik (QlikView, QlikSense).

UE Applications (9 ECTS)

  • Text Mining - Données non structurées (R. Rakotomalala)

Natural language processing (NLP). Appréhension et traitement de documents texuels à l'aide de méthodes de data mining et de machine learning. Techniques de nettoyage et préparation de textes. Modèle bag-of-words, recherche de structures, topic modeling, latent semantic indexing, latent dirichlet allocation, classement de documents, évaluation adaptée à la recherche d'information, algorithme de rocchio, naive bayes classifier. Mise en valeur des résultats avec Shiny. TD sous R et Python (NLTK).

  • Applications, Marketing (W. Batat)
Marketing stratégique et opérationnel.

  • Fouille de données massives (J. Jacques)

[Commun avec BI&BD] Etude des techniques de machine learning et de data mining adaptées aux très grandes volumétries. Parallélisation des algorithmes de machine learning. Programmation MapReduce. TD sous R.

UE Méthodes statistiques (12 ECTS)

  • Séries temporelles et données séquentielles (J. Jacques)
Etude des données temporelles. Modélisation, analyse et prévision. Lissage exponentiel. Modélisation ARMA, ARIMA, VAR. TD sous R.

  • Analyse de variance et plans d'expérience (R. Abdesselam)
Inférence statistique. Estimations et tests. Comparaison de populations, anova, ancova. Méthodes paramétriques. TD sous SAS.

  • Biostatistique, données catégorielles (A. Follet, Expert Data Science - SOLVAY)
Biostatistique. Traitement des données catégorielles. Tableaux de contingence. Régression logistique. Modèles log-linéaires. TD sous SAS.

Semestre 4 (30 ECTS)

UE Professionnalisation (7 ECTS)

  • Gestion de projets (N. Harbi)
[Commun avec BI&BD et OPSIE] Démarches agiles. Organisation des projets transversaux (forum entreprise, dataday, securiday, conférences des métiers,…).

  • Techniques de recherche d'emploi (S. Delameziere, IT Manager - IRTS)
Conduite des entretiens. Réseaux professionnels. Ecriture des CV. Rédaction des lettres de motivation.

  • Anglais (J. Heffernan)
[Commun avec BI&BD et OPSIE] Anglais informatique.

  • Séminaires de recherche et ateliers techniques (G. Constant, Ingénieur d'affaires Data - DATALYO)
[Commun avec BI&BD] Technologies Big Data. Comprendre et manipuler la chaîne de valeur Big Data. Plateforme Hadoop, ETL, stockage, requêtage, dataviz (Tableau). De l'installation de la plateforme jusqu'à l'analyse des données, en passant par les étapes intermédiaires. Mise en oeuvre, illustrée par des cas pratiques et des retours d'expérience concrets.

 

UE Data Science (11 ECTS)

  • Visualisation et analyse des données de sécurité (D. Pierrot [RSSI - Confidentiel] & R. Rakotomalala)
[Commun avec OPSIE] Traitement des données issues de la sécurité informatique. Détection des intrusions. Scan des fichiers logs. Mise en œuvre des techniques supervisées et non-supervisées de machine learning. Réseaux de neurones. Leave-one-out, validation croisée, bootstrap. Echantillonnage rapide pour l'appréhension des très grandes volumétries. Courbe ROC. TD sous R.

  • Web mining - Analyse des réseaux sociaux (R. Rakotomalala)
Exploitation des données du web. Web mining. Filtrage collaboratif et système de recommandation. Extraction des itemsets et des règles d'association. Analyse des tweets. Fouille d'opinions. Analyse des sentiments. Random forest, boosting, gradient boosting. Découverte des communautés dans les réseaux sociaux. TD sous R et Python.

  • Data Mining et apprentissage statistique (J. Ah-Pine)
Techniques avancées de machine learning. Deep learning. Techniques de réduction des dimensionnalités non linéaires. Méthodes de régression pénalisées (ridge, lasso, elasticnet). SVM, support vector machine. TD sous R.

  • Initiation à la recherche - Big Data (F. Andrianasolo, Data Science Team Leader - ATOS WORLDLINE)

[Commun avec BI&BD] Technologies avancées et ecosystèmes Big Data. Spark. Programmation python sous Spark. Librairie Machine learning MLlib.

Stage (12 ECTS)

Stage en entreprise ou dans un organisme de recherche. 4 mois minimum. 6 mois maximum.

Syllabus des cours

A venir


mise à jour le 16 juin 2018



Logo_DIS-NewLogo ICOM
Université Lumière Lyon 2