Séminaire DATAIA 21/09 | Laurent JACOB « Learning from biological sequences in functional and evolutionary genomics »

2023-09-21 12:30 2023-09-21 14:00 Séminaire DATAIA 21/09 | Laurent JACOB « Learning from biological sequences in functional and evolutionary genomics » Laurent JACOB (Laboratory of Computational and Quantitative Biology - Sorbonne Université, LCQB, UMR 7238) présentera ses travaux sur le thème "Learning from biological sequences in functional and evolutionary genomics". Laurent Jacob s'intéresse au développement de méthodes statistiques et d'apprentissage automatique pour résoudre des problèmes en biologie moléculaire. Résumé : GWAS microbienne : outils pour identifier les déterminants génétiques des traits phénotypiques tels que les résistances antimicrobiennes. L'importance des gènes accessoires dans les microbes rend l'approche habituelle des SNP inappropriée. Je développe des solutions qui s'appuient sur les k-mers, c'est-à-dire sur la présence de courtes séquences dans les génomes. présence de courtes séquences dans les génomes. Prédiction à partir de séquences biologiques : réseaux de neurones qui prennent une séquence biologique en entrée et prédisent une propriété de cette séquence. séquence biologique en entrée et prédisent une propriété de cette séquence. cette séquence. Cela s'applique par exemple à la génomique régulatrice ou à la prédiction des plis. ou à la prédiction des plis. Je travaille sur la régularisation et l'inférence statistique d'inférence statistique sur les caractéristiques extraites par ces réseaux. Apprentissage automatique pour la génomique évolutive : réseaux de neurones pour déduire les paramètres des modèles d'évolution des séquences. paramètres des modèles d'évolution des séquences. Pour certains modèles complexes, la maximisation de la vraisemblance est trop difficile mais l'échantillonnage est facile. J'utilise une J'utilise une grande quantité de données simulées pour apprendre une fonction qui inverse le modèle, et passe par exemple d'une famille de gènes à une phylogénie. CentraleSupélec, Amphithéâtre e.068 (bâtiment Bouygues), Gif-sur-Yvette

S'inscrire / Réserver

Thematique : Recherche

Dans le cadre de son animation scientifique, l'Institut DATAIA organise tout au long de l'année des séminaires visant à échanger autour de l'IA.

Public

Tout public
Type d'évènement

Conférence / séminaire / webinaire
Conditions

Inscription obligatoire
Dates

Jeudi 21 septembre, 12h30
12:30 pm - 02:00 pm
Lieu

CentraleSupélec, Amphithéâtre e.068 (bâtiment Bouygues), Gif-sur-Yvette

Laurent JACOB (Laboratory of Computational and Quantitative Biology - Sorbonne Université, LCQB, UMR 7238) présentera ses travaux sur le thème "Learning from biological sequences in functional and evolutionary genomics". Laurent Jacob s'intéresse au développement de méthodes statistiques et d'apprentissage automatique pour résoudre des problèmes en biologie moléculaire.

Résumé :

GWAS microbienne : outils pour identifier les déterminants génétiques des traits phénotypiques tels que les résistances antimicrobiennes. L'importance des gènes accessoires dans les microbes rend l'approche habituelle des SNP inappropriée. Je développe des solutions qui s'appuient sur les k-mers, c'est-à-dire sur la présence de courtes séquences dans les génomes. présence de courtes séquences dans les génomes.

Prédiction à partir de séquences biologiques : réseaux de neurones qui prennent une séquence biologique en entrée et prédisent une propriété de cette séquence. séquence biologique en entrée et prédisent une propriété de cette séquence. cette séquence. Cela s'applique par exemple à la génomique régulatrice ou à la prédiction des plis. ou à la prédiction des plis. Je travaille sur la régularisation et l'inférence statistique d'inférence statistique sur les caractéristiques extraites par ces réseaux.

Apprentissage automatique pour la génomique évolutive : réseaux de neurones pour déduire les paramètres des modèles d'évolution des séquences. paramètres des modèles d'évolution des séquences. Pour certains modèles complexes, la maximisation de la vraisemblance est trop difficile mais l'échantillonnage est facile. J'utilise une J'utilise une grande quantité de données simulées pour apprendre une fonction qui inverse le modèle, et passe par exemple d'une famille de gènes à une phylogénie.