Le site de l'Université Paris-Saclay est actuellement en cours de mise à jour suite à sa restauration, après la cyberattaque subie en août. Certaines informations peuvent ne pas être encore actualisées. Nous travaillons à les remettre à jour au plus vite. Dans l'intervalle, nous vous remerçions de votre compréhension.
Le M2 «Mathématiques pour les Sciences du Vivant» (MSV) est une formation complète et structurée dans les domaines mathématiques en interface avec les sciences du vivant (biologie, médecine, écologie). Son originalité réside dans son ancrage mathématique, la largeur du spectre des compétences mathématiques communes acquises par les diplômés et la variété des spécialisations en modélisation pour les sciences du vivant qui leur est offerte.
Pré-requis, profil d’entrée permettant d'intégrer la formation
M1 de mathématiques, élèves écoles d'ingénieur avec un bagage solide en mathématiques
Compétences
Maitriser et mettre en oeuvre des outils et méthodes mathématiques de haut niveau.
Concevoir et rédiger une preuve mathématique rigoureuse.
Comprendre et modéliser mathématiquement un problème afin de le résoudre.
Maitriser des outils numériques et langages de programmation de référence.
Analyser des données et mettre en oeuvre des simulations numériques.
Analyser un document de recherche en vue de sa synthèse et de son exploitation.
Profil de sortie des étudiants ayant suivi la formation
L’objectif du parcours de M2 « Mathématiques du Vivant » est de former de jeunes mathématiciens et statisticiens armés d’un solide bagage méthodologique, qui iront, à l’issue de leur M2 ou après une thèse, irriguer les laboratoires académiques et industriels.
Débouchés de la formation
Ce parcours est principalement orienté vers la préparation d'une thèse, que ce soit dans un laboratoire de mathématiques ou dans un laboratoire de biologie ou entreprise. Les sujets de thèse peuvent être très variés même si le parcours prépare au mieux à un doctorat à l'interface entre mathématiques et biologie (ou médecine). Des débouchés directs dans l'industrie pharmaceutique ou dans le domaine médical sont également possibles.
Collaboration(s)
Laboratoire(s) partenaire(s) de la formation
Centre de mathématiques et de leurs applications
Laboratoire de mathématiques d'Orsay
Mathématiques et Informatique Appliquées - Paris
Mathématiques et Informatique Appliquées du Génome à l'Environnement.
Centre de Mathématiques appliquées (Institut Polytechnique de Paris).
Programme
Le S1 est constitué de 4 cours obligatoires en mathématiques (dont un cours de statistiques à choisir parmi deux choix possibles), d'un groupe de travail qui donne lieu à la rédaction d'un rapport, et d'un cours d'introduction aux concepts biologiques et écologiques.
Systèmes dynamiques
Certains systèmes biologiques peuvent se décrire par une EDO dans un espace de phase. Il est rare que l’on connaisse ses solutions exactes, mais on peut décrire de façon qualitative les solutions à l’aide des points fixes et leur stabilité. Mots-clés: champs de vecteurs, points fixes, bifurcation et branchement, comportement asymptotique, synchronisation et attracteurs. Modèles : Lotka-Volterra, Malthus, Verhulst, réponse immunitaire.
EDP
Ce cours est une introduction poussée à la modélisation déterministe des phénomènes physiques intervenant dans le fonctionnement des organismes vivants : transport, diffusion, écoulements physiologiques, fluides complexes. Au delà de la démarche de modélisation, nous donnerons les outils d’analyse mathématique permettant de donner un cadre à certaines de ces équations. Une partie du cours sera consacrée aux aspects de simulation numérique, avec un accent particulier mis sur les problèmes liés au couplage de différents modèles.
Principes et algorithmes en identifications de paramètres
Un modèle différentiel ou aux dérivées partielles doit pouvoir être comparé aux mesures expérimentales et certains paramètres physiques doivent être identifiés. On présentera les bases de l’identification paramétrique dans un cadre déterministe, notamment des problèmes de conditionnement, de régularisation, de pénalisation, d’introduction d’a prioris, et de résolution numérique. On présentera un cas réel de temps de doublements de mélanoblastes lors du développement embryonnaire.
-Optimisation (Paul-Henry Cournède).
Cette partie sera concentrée sur les problèmes d’optimisation convexe : descente de sous-gradient, méthodes proximales, dualité, méthodes primales-duales, etc.
Ce cours introduit les notions principales de probabilités concernant l’étude des processus à temps continu. Il développe en particulier la théorie des équations différentielles stochastiques et des diffusions et celle des processus de saut. Les exemples seront pour l’essentiel tirés des applications à la biologie. Les grandes parties du cours seront les suivantes.
Processus à temps continu
Processus de Markov
Martingales à temps continu, temps d’arrêt
Mouvement brownien et calcul stochastique
Equations différentielles stochastiques
Processus de saut pur et mesures ponctuelles de Poisson,
Processus de branchement à temps continu et processus de naissance et mort,
Théorèmes limites. Applications aux approximations continues des processus de saut.
Intitulé de l’UE en anglais :
Reinforcement learning
ECTS :
6
Détail du volume horaire :
Cours :30
Modalités d'organisation et de suivi :
Coordinateur :Le Pennec Erwan
Equipe pédagogique :
Erwan Le Pennec.
Objectifs pédagogiques visés :
Contenu :
Ce cours propose une introduction à l'apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning: An Introduction" de R. Sutton et A. Barto (disponible en ligne sur la page http://incompleteideas.net/book/the-book-2nd.html).
Plan:
1. Introduction à l'apprentissage par renforcement et processus de décision markovien
2. Le cas des bandits
3. Méthodes tabulaires: prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning
4. Planification et apprentissage pour les méthodes tabulaires
5. Méthodes approchées: prédiction, planification et apprentissage.
Bibliographie :
"Reinforcement Learning: An Introduction" de R. Sutton et A. Barto.
Période(s) et lieu(x) d’enseignement :
Période(s) :
Septembre - Octobre - Novembre - Décembre - Janvier.
Le groupe de travail a lieu le mardi après-midi, les orateurs invités sont choisis par le responsable de l'UE, qui est aussi présent durant les exposés.
Objectifs pédagogiques visés :
Contenu :
Le groupe de travail a lieu une fois par semaine, tout au long de la formation. Il s'agit d'un exposé donné par un chercheur ou une chercheuse en mathématiques appliquées aux sciences du vivant ou à la médecine. L'exposé dure environ une heure, et chaque étudiant(e) doit choisir un de ces exposés, sur lequel il ou elle fera un rapport.
Période(s) et lieu(x) d’enseignement :
Période(s) :
Octobre - Novembre - Décembre - Janvier - Février - Mars.
Lieu(x) :
PALAISEAU
Le S2 est constitué d'un mémoire ou d'un stage, d'un projet (qui consiste en une première expérience de recherche en mathématiques appliquées à la biologie ou la médecine), et de 3 cours de mathématiques appliquées, à choisir parmi une liste de cours proposés.
Ce projet représente une première expérience de recherche en mathématiques appliquées à la biologie ou à la médecine. Il est co-encadré par un ou une mathématicienne et un ou une biologiste. Le projet est effectué en binôme par les étudiants. Le projet démarre au mois d'octobre et la soutenance a lieu au mois de mars.
Période(s) et lieu(x) d’enseignement :
Période(s) :
Octobre - Novembre - Décembre - Janvier - Février - Mars.
Méthodes de statistique en grande dimension pour l'analyse de données "-omiques"
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Levy-Leduc Céline
Equipe pédagogique :
Céline Lévy-Leduc.
Objectifs pédagogiques visés :
Contenu :
Le but de ce cours est de présenter différentes méthodes de statistique en grande dimension pour l'analyse de données "-omiques" à la fois d'un point de vue théorique et pratique avec des séances de TP sur machine avec le logiciel R.
Dans un premier temps, je présenterai des méthodes de sélection de variables dans le modèle linéaire général multivarié en présence de dépendance entre les variables réponses avec différentes techniques pour faire de l'estimation de matrices de covariance en grande dimension.
Plusieurs types de structures pour ces matrices seront considérées ce qui m'amènera à faire un détour par les méthodes de modélisation et d'estimation dans les séries temporelles. Les propriétés théoriques des estimateurs proposés seront établies et lors des séances de TP sur machine, nous verrons comment coder ces méthodes de façon efficace et nous les appliquerons à des données "-omiques" de type protéome, métabolome et transcriptome.
Dans un second temps, je présenterai des méthodes de segmentation bi-dimensionnelle en grande dimension en vue d'analyser des données de type Hi-C. J'établirai les propriétés théoriques des estimateurs proposés et je montrerai comment les implémenter de façon efficace.
Hernan, Miguel A., and James M. Robins. Causal Inference. Chapman & Hall/CRC
Imbens, Guido W., and Donald B. Rubin. Causal Inference in Statistics, Social, and Biomedical Sciences
Jonas Peters, Dominik Janzing, Bernhard Schölkopf. Elements of Causal Inference: Foundations and Learning Algorithms
Articles: A Survey of Learning Causality with Data: Problems and Methods Guo, Ruocheng and Cheng, Lu and Li, Jundong and Hahn, P. Richard and Liu, Huan.
Objectifs pédagogiques visés :
Contenu :
In machine learning, there has been great progress in obtaining powerful predictive models, but these models rely on correlations between variables and do not allow for an understanding of the underlying mechanisms or how to intervene on the system for achieve a certain goal. The concepts of causality are fundamental to have levers for action, to formulate recommendations and to answer the following questions: "what would happen if » we had acted differently?
The questions of causal inference arise in many areas (socio-economics, politics, psychology, medicine, etc.): depending on the context which drug to use to improve the patient's health? what marketing strategy for product placement should be used to influence consumer buying behavior, etc. The formalism of causal inference makes it possible to study these questions as a problem of classical statistical inference. The gold standard for estimating the effect of treatment is a randomized controlled trial (RCT) which is, for example, mandatory for the authorization of new drugs in pharmaceutical and medical research. However, RCTs are generally very expensive in terms of time and financial costs, and in some areas such as economics or political science, it is often not possible to implement an RCT, for example to assess the effectiveness of a given policy.
The aim of this course is to present the available methods to perform causal inference from observational data. We focus on both the theoritical framework and practical aspects (available software solution).
Modèles à effets mixtes et approches de population en sciences de la vie
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Lavielle Marc
Equipe pédagogique :
Marc Lavielle.
Objectifs pédagogiques visés :
Contenu :
Les modèles pharmacocinétiques-pharmacodynamiques (PKPD) sont extrèmement utiles et utilisés pour étudier le devenir et l'effet d'un médicament au sein d'individus d'une même population. Les modèles pharmacocinétiques permettent de décrire comment un médicament est absorbé dans l'organisme, distribué puis éliminé, alors que les modèles pharmacodynamiques décrivent l'évolution de la maladie et l'effet du médicament sur l'organisme. Ces modèles sont des modèles compartimentaux généralement décrits par des systèmes d'équations différentielles ordinaires. Les modèles à effets mixtes sont l'outil statistique de référence en pharmacologie de population pour modéliser la variabilité inter-individuelle de l'évolution et de l'effet d'un médicament. En d'autres termes, les paramètres du modèle sont considérés comme aléatoires. Ce type d'approche trouve des applications dans d'autres domaines comme la toxicologie, l'agronomie ou la biologie cellulaire.
L'objectif de ce cours est de présenter des exemples de modèles (PKPD, dynamique virale,...) et de leur utilisation pratique, ainsi que des méthodes et algorithmes utilisées pour les modèles à effets mixtes : méthodes d'estimation de paramètres, de construction, de validation et de sélection de modèles.
Modèles à variables latentes en biologie et écologie
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Donnet Sophie
Equipe pédagogique :
Sophie Donnet, Stéphane Robin.
Objectifs pédagogiques visés :
Contenu :
Les modèles à variables latentes sont très présents en biologie et en écologie. On pense notamment aux modèles mixtes permettant de prendre en compte l'apparentement entre les individus dans les analyses génétiques ou les modèles de Markov cachés qui sont utilisés pour détecter des variations du nombre de copies d'ADN le long du génome ou de comportement dans le déplacement d'un animal. Le modèle Poisson log-normal qui fournit un cadre général pour la distribution jointe des abondances d'un ensemble d'espèces ou le modèle à blocs stochastiques (SBM) utilisé pour analyser la topologie de réseaux d'interactions en font aussi partie.
Ces modèles ont la particularité d'inclure des variables non-observées (ou 'latentes', 'cachées'). Ce sont des modèles à données incomplètes dont l'inférence requiert en général d'établir la distribution conditionnelle des variables cachées sachant les variables observées.
La complexité de cette inférence peut être appréhendée au travers du modèle graphique associé. Lorsque le modèle graphique présente une structure simple, il est possible d'établir la distribution conditionnelle de variables cachées de façon exacte. Une revue de ces cas constituera la première partie du cours.
Dans les cas plus complexes, il est nécessaire d'avoir recours à des approximations auxquelles seront consacrées les deux parties suivantes. On présentera d'abord des approximations déterministes, notamment de type variationnel, puis des méthodes d'échantillonnages de type Monte-Carlo par chaîne de Markov.
Modèles aléatoires de populations : comportement en temps long et limites d'échelles
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Bansaye Vincent
Equipe pédagogique :
Vincent Bansaye, Sylvie Méléard.
Objectifs pédagogiques visés :
Contenu :
Nous étudions des modèles aléatoires motivés par l’étude de systèmes vivants en interaction et centrés sur des dynamiques individuelles. Les individus naissent, meurent et sont caractérisés par différents types qui influent sur leur comportement et peuvent être transmis. Les interactions sont variées : ressources, proies-prédateurs, hôtes-parasites.
Nous illustrons cette approche en modélisant une population non structurée et montrons comment selon les échelles choisies, ce processus peut être approché par une équation logistique déterministe ou une équation de Feller logistique.
Nous associons ensuite un type à chaque individu : caractères génétiques, âge ou quantité de parasites. La dynamique de la population est décrite par un processus à valeurs mesures ponctuelles dont les atomes sont les états des individus. Ce modèle décrit une population soumise à des mutations et de la sélection. Nous étudions diverses approximations macroscopiques de ce modèle.
L’introduction d’une structure d’âge permet de prendre en compte l’histoire passée des individus pour décrire des phénomènes de sénescence par exemple. Nous pouvons établir un nouveau théorème limite mettant en évidence deux échelles de temps : celle de l’individu et celle de la population.
Nous étudions également un modèle hôte-parasite qui peut être représenté par une diffusion de Feller branchante. A partir de l’étude de l’évolution des parasites le long d’une lignée généalogique, des théorèmes limites concernant la fraction d’hôtes parasités sont établis.
Prérequis :
Calcul stochastique, processus de Markov et théorèmes limites.
Modèles d'équations aux dérivées partielles pour la matière active
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Meunier Nicolas
Equipe pédagogique :
Nicolas Meunier.
Objectifs pédagogiques visés :
Contenu :
Une cellule vivante consomme en permanence de l'énergie (sous forme chimique), et est à ce titre un système hors d'équilibre (dit actif). Cela lui confère des propriétés inhabituelles : une cellule peut changer de forme et exercer des forces sur son environnement, par exemple pour se diviser et pour se déplacer.
Le but de ce cours est de présenter et d’étudier mathématiquement ou numériquement une hiérarchie de modèles pour décrire certaines propriétés dynamiques spectaculaires d’une cellule vivante. Ces modèles reposent sur des
- équations aux dérivées partielles de type frontière libre pour lesquelles le domaine est une inconnue du problème,
- équations aux dérivées partielles paraboliques non linéaires et non locales.
Les développements théoriques et numériques permettant l'étude de ces deux types d'équations aux dérivées partielles seront systématiquement mis dans un contexte biologique et illustrés par des résultats expérimentaux récents. Nous mettrons l’accent sur des difficultés d’intérêt général, dont la compréhension dépasse le cadre de l’étude d’une cellule pour s’appliquer aussi bien à l’étude de la matière active (tumeurs, embryogénèse) qu’à la fonte des glaciers.
Prérequis :
Aucun prérequis strict en mathématique comme en biologie, même si des bases en mathématiques générales sont utiles.
Modèles d'équations aux dérivées partielles pour l'écologie
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Raoul Gael
Objectifs pédagogiques visés :
Contenu :
Les équations aux dérivées partielles sont souvent utilisées en biologie pour modéliser des systèmes structurés spatialement : propagation de forêt, dynamique d'une inflammation, polarisation d'une cellule... Ces modèles permettent par exemple de simuler de façon précise le comportement d'un organe. Dans d’autres cas, les équations aux dérivées partielles peuvent offrir une description qualitative de phénomènes complexes.
Dans ce cours, nous allons nous concentrer sur deux problématiques écologiques, via l’étude de travaux récents. Dans un premier temps nous nous intéresserons aux phénomènes de propagation qui sont décrits par des équations paraboliques non-linéaires. Nous verrons alors qu'une bonne compréhension d'équations linéaires permet d'étudier le comportement de modèles non-linéaires. Dans la deuxième partie du cours nous étudierons les dynamiques de mouvements collectifs décris par des équations cinétiques. Pour comprendre la dynamique de ce second type d'équations aux dérivées partielles nous identifierons une échelle de temps rapide (qui sera locale en espace) et une échelle lente (qui gouvernera la dynamique spatiale du système).
Les deux problématiques écologiques discutées dans ce cours nous permettront de comprendre la diversité des questions qui peuvent se poser autour de modèles d'équations aux dérivées partielles en biologie: modélisation, liens avec d'autres modèles (en particulier avec des modèles stochastiques), simulations numériques.
Modélisation et méthodes numériques en hémodynamique
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Fernandez Miguel
Objectifs pédagogiques visés :
Contenu :
Ce cours abordera quelques problèmes rencontrés en simulation numérique des écoulements sanguins. Une hiérarchie de modèles sera présentée :
modèles tri-dimensionnels de portions d’artère, incluant des effets d’interaction fluide-structure entre la paroi des vaisseaux et l’écoulement du sang ; modèles mono-dimensionnels hyperboliques, permettant en particulier l’étude de la propagation d’ondes de pression dans un réseau artériel. modèles « zéro-dimensionnels » pour une représentation globale du système cardiovasculaire, incluant des mécanismes de contrôle et de régulation.
Dans chaque cas nous mettrons l’accent sur des difficultés numériques d’intérêt général, dont la compréhension dépasse le cadre de l’hémodynamique (algorithmes de couplage multiphysique, conditions aux limites, estimation de paramètres à partir de mesure, etc.).
1. Séance 1 : Introduction : le système nerveux, neuro-physiologie d’un seul neurone. Modèles déterministes d’un seul neurone. Les modèles de Hodgkin-Huxley, FitzHugh-Nagumo, modèles intègre et tire.
2. Séance 2 : Modèles déterministes, suite : Un peu de théorie des systèmes dynamiques. Points stationnaires, cycles limites et théorie des bifurcations. Systèmes
dynamiques lents-rapides. Modèles avec bruit gaussien (diffusion), Excursion : Modèle de Hodgkin-Huxley stochastique.
3. Séance 3 : Trains de décharge, processus ponctuels. Processus de Poisson homogène et inhomogène, mesures de Poisson et méthode de "thinning".
4. Séances 4 et 5 : Processus de Hawkes linéaire, représentation par clusters, existence et non-explosion, loi des grands nombres, comportement en temps long.
5. Séances 5 et 6 : Processus de Hawkes non-linéaires, liens avec PDMP. Un peu de théorie des processus de Markov, comportement en temps long.
6. Séance 7 : Modèles en temps discret, estimation du graphe d'interaction.
Bibliographie :
[1] Brémaud, P., Massoulie, L. Stability of nonlinear Hawkes processes. The Annals of Probability, 24(3) (1996) 1563-1588.
[2] Gerstner, W., Kistler, W.M., Naud, R., Paninski, L. Neuronal dynamics: from single neurons to networks and models of cognition. Cambridge University Press, 2014.
[3] Izhikevich, E. Dynamical systems in neuroscience: the geometry of excitability and bursting MIT Press, 2006.
Outils probabilistes et statistiques pour l'étude de la diversité génétique d'une population
Langues d’enseignement :
FR
ECTS :
4
Détail du volume horaire :
Cours :20
Modalités d'organisation et de suivi :
Coordinateur :Véber Amandine
Objectifs pédagogiques visés :
Contenu :
Nous commencerons par introduire le modèle d’évolution génétique le plus connu et le plus utilisé, à savoir le modèle de Wright-Fisher.
Les arbres généalogiques (aléatoires) associés constituent un point de vue complémentaire et très informatif.
En effet, leur forme et propriétés générales dépendent fortement des hypothèses faites sur la manière dont les individus se reproduisent, ce que nous verrons à travers des modèles plus généraux appelés modèles de Cannings.
Ces modèles probabilistes nous donnent un cadre de travail dans lequel nous pouvons tenter de reconstruire des quantités d’intérêt telles que des taux de mutation, ou tester si la population réelle étudiée satisfait bien les hypothèses de neutralité et de panmixie à leur base.
Pour finir, nous considèrerons une déviation possible de ces hypothèses : l’existence d’une structure spatiale (discrète ou continue).
Fiche de choix de M2 (obligatoire pour les candidats inscrits en M1 à l'Université Paris-Saclay) à télécharger sur https://urlz.fr/i3Lo.
Document justificatif des candidats exilés ayant un statut de réfugié, protection subsidiaire ou protection temporaire en France ou à l’étranger (facultatif mais recommandé, un seul document à fournir) :
- Carte de séjour mention réfugié du pays du premier asile
- OU récépissé mention réfugié du pays du premier asile
- OU document du Haut Commissariat des Nations unies pour les réfugiés reconnaissant le statut de réfugié
- OU récépissé mention réfugié délivré en France
- OU carte de séjour avec mention réfugié délivré en France
- OU document faisant état du statut de bénéficiaire de la protection subsidiaire en France ou à l’étranger.