The Université Paris-Saclay website is currently being updated following the cyberattack it underwent in August. Certain information may not yet have been updated. We are working as quickly as we can to update all of the website’s content. Thank you for your understanding.
M1 Informatique pour la Science des Données - par alternance
60 ECTS doivent être validées. Les UEs sont organisées en trois blocs : un bloc disciplinaire (16 UEs pour 48 ECTS), un bloc Soft skills (2 UEs pour 6 ECTS), et un bloc Période Entreprise (une UE pour 6 ECTS).
L'objectif de ce cours est de fournir des outils et techniques algorithmiques de pointe aux apprentis. Etude de l'algorithmique sur les graphes (plus court chemin, tri topologique, …), les techniques de mémoisation, de programmation dynamique et de backtraching. Présentation de la notion de flots et des algorithmes de calcul de flot maximal. Enfin, les thèmes des algorithmes online et approchés seront abordés.
Le cours a pour but d'amener les apprentis à améliorer leurs compétences que ce soit à l'écrit et à l'oral. Les contenus abordés portent sur le monde du travail en général et le vocabulaire spécifique au domaine des systèmes d'information. Une préparation au TOEIC est également prévue.
L'objectif de ce cours est de donner d'une part les bases de la recherche scientifique : processus et méthodologie de la recherche scientifique, méthode de recherche bibliographique et sources bibliographiques scientifiques, principes de standardisation, étude et analyse de documents scientifiques et technologiques et d'autre part de présenter les principes de la communication et de l'information auprès des différents participants concernés par les projets menés.
Ce module a pour objectif de présenter les nouveaux outils du domaine du Big Data. Il permettra de comprendre les solutions de stockage de données volumineuses et d'en faire des analyses. Il abordera quelques aspects préliminaires de la programmation distribuée ou Hadoop permettra de manipuler des données volumineuses pour aider à la prise de décision. Les étudiants verront également comment interroger de grandes masses de données en temps réel.
Ce module couvre les technologies des BD relationnelles permettant de transformer des données issues de sources diverses en informations utiles à la prise de décision. Nous aborderons en particulier:
- modélisation:
au niveau conceptuel (modèles multidimensionnels) et niveau logique (schémas en étoiles...)
- le langage SQL et les optimisations de bases de données pour les requêtes OLAP:
indexes, partitionnement et vues
- l'architecture des entrepôts
- les processus ETL (rapidement)
- les grands principes des bases de données 'in memory'
Pré-requis (couvert par le programme de Licence) :
- programmation en Java
- BD relationnelles : schéma et notions associées (clé primaires, clé
étrangères, contraintes, …), requêtes en SQL et mises à jour.
Ce module a pour objectif de familiariser les étudiants avec des approches basiques de machine learning. Le cours commencera en présentant les modèles traditionnels d'apprentissage supervisé et non-supervisé (tel que l'algorithme des k-moyennes, la décomposition en valeurs principales, le percetron, ...) pour entrevoir par la suite des modèles plus complexes. Le cours presentera les aspects théoriques du machine learning, et une grand part de travaux pratiques sera mis à disposition pour appliquer les techniques vues en cours à divers problèmes (classification, partitionnement, filtrage collaboratif, ...).
Dans ce cours, l'accent sera mis sur les langages dits dynamiques, c'est à dire des langages qui exécutent des actions au moment de l'exécution alors que d'autres langages les exécutent à la compilation. Des langages tels que Javascript, Python, PHP, Ruby seront étudiés. Des travaux pratiques permettront de mettre en œuvre les concepts liés à ces langages qui seront vus pendant le cours.
L'objectif de ce cours est de fournir un tour d'horizon des modèles mathématiques possibles. Ecriture sous formes mathématiques de problèmes réels prenant en compte le temps (modèles avec équations différentielles), des données certaines (programmes mathématiques linéaires et non linéaires en variables mixtes), des données incertaines (programmation robuste et stochastique), plusieurs décideurs (modèles à choix discrets).
Dans ce cours, sont abordés les langages de modélisation tels que SDL, BPMN. Il s'agit de sensibiliser les étudiants à la nécessité de réfléchir à un problème posé avant de le programmer. Ces langages permettent de décrire des systèmes, des processus métier. BPMN permet de modéliser des processus non informatiques. Des choix devront être faits pour se concentrer sur l'analyse de ces systèmes. Ces choix porteront sur le niveau d'abstraction, les choix des interactions, des algorithmes. Les détails liés à l'implémentation seront laissés de côté pour la phase de conception.
Ce module est une introduction au langage des probabilités et à leurs applications aux statistiques. Le cours
commencera par un rappel sur les probabilités et s'étendra sur des notions essentielles (loi des grands nombres, convergence, ...). Des applications seront vues en TP sur la compréhension des statistiques, l'utilisation des estimateurs et l'analyse de données.
Pour fonctionner correctement, les réseaux nécessitent un grand nombre d'équipements et de processus, rendant leur architecture souvent complexe. Pour réduire cette complexité, les différentes fonctions ont été décomposées en couches protocolaires. Après avoir posé les fondements des télécommunications et rappelé les bases de la transmission de l'information, cette unité d'enseignement détaille les deux premiers niveaux des réseaux, à savoir " physique " (bande passante, débit binaire, codage, …) et " liaison " (codes détecteurs, codes correcteurs, techniques d'accès, …). Les principaux protocoles correspondants sont également présentés. Une série de travaux dirigés et de travaux pratiques permet d'assimiler et d'appliquer les différents concepts étudiés.
Ce cours a pour objectif de présenter plusieurs notions avancées des réseaux informatiques et de télécommunications. Un premier volet sera consacré à introduire les fondements et concepts de base des réseaux cellulaires, mobiles et sans fil : concept cellulaire, techniques d'accès au support radio (FDMA, TDMA, CDMA, CSMA-CA), en détaillant le fonctionnement de quelques systèmes représentatifs tels que la 2G, la 3G ou encore le Wi-Fi. Un second volet sera dédié à l'étude de plusieurs notions essentielles des nouvelles générations de réseaux telles que la qualité de service (QoS), la mobilité (MIP) ou encore la signalisation dans IP (SIP, VoIP).
Ce cours vise à faire un tour d'horizon le plus large possible des vulnérabilités potentielles des différents éléments des systèmes traitant l'information et de décrire les ripostes possibles, au travers de mots clé comme respect de la vie privée et anonymat, disponibilité, authentification et imputabilité des accès, secret et partage de secret: Identification et authentification (mots de passe, techniques biométriques), contrôle d'accès (accès hiérarchique, listes d'accès, capacités, systèmes "take and grant "), attaques par déni de service, virus, vers - techniques des antivirus - systèmes de détection d'intrusions, problèmes de sécurité des réseaux et exemples d'attaques connues, généralités sur le codage et la cryptographie. Principes de sécurité (sécurité IPv4/IPv6, pare-feux, cloisonnement, VPN).
Ce cours présente des concepts avancés de traitement distribué des données, selon trois grands axes :
- traitement de donnée distribuées sur une même machine (multi-thread/multi-processus). Ce schéma est utilisée pour les tâches de traitement hautement parallélisable afin d'utiliser au mieux les ressources d'une machine. Le cours rappelle des principes généraux de programmation parallèle (threads, verrous) ainsi que des concepts bas-niveau pour accélérer le traitement de données (pagination fichier/mémoire).
- traitement client/serveur : utilisé dans le cadre classique d'une base de données unique répondant à des requêtes de plusieurs clients. Le cours présente le concept fondamental de transaction dans les BDs
relationnelles ainsi que les différents algorithmes de verrouillages et les structures de données associées.
- traitement distribué " big data " : utilisé dans le cas où les données sont tellement volumineuses qu'elles doivent résider sur un cluster de machine. Le cours donne une introduction au paradigme " map/reduce " ainsi qu'une initiation aux frameworks Hadoop et Spark.
Dans ce cours, il s'agira d'étudier les concepts et langages pour le développement d'application Web et de services Web. Côté client, seront étudiés les traitements complexes à mettre en œuvre. Côté serveur, seront vus certains environnements (Apache struts, Ocsigen, …). Sera également abordée l'intégration des données hétérogènes (BD, XML, Json, …). Pour la partie service Web, le cours portera sur la création des services Web (SOAP, REST) simples et complexes (orchestration de services).
Période(s) et lieu(x) d’enseignement :
Period(s) :
Février - Mars - Avril.
Location :
ORSAY
Modalités de candidatures
Application period
From 02/05/2024 to 02/07/2024
Les dates indiquées ci-dessus sont uniquement valables pour la plateforme Inception. Les candidats qui dépendent de la plateforme MonMaster ne sont pas concernés.
Pour connaître la plateforme sur laquelle vous devez candidater, vous trouverez plus de renseignements sur la page Candidater à nos masters.
Compulsory supporting documents
Proof of one year's study in France for non-European candidates.
(carte d'étudiant ou carte de séjour)
Motivation letter.
All transcripts of the years / semesters validated since the high school diploma at the date of application.
Curriculum Vitae.
Additional supporting documents
VAP file (obligatory for all persons requesting a valuation of the assets to enter the diploma).
Supporting documents :
- Residence permit stating the country of residence of the first country
- Or receipt of request stating the country of first asylum
- Or document from the UNHCR granting refugee status
- Or receipt of refugee status request delivered in France
- Or residence permit stating the refugee status delivered in France
- Or document stating subsidiary protection in France or abroad
- Or document stating temporary protection in France or abroad.