Julien Peloton : quand l’informatique rencontre l’astronomie et se conjugue à la science ouverte

Portrait de chercheur ou chercheuse Article publié le 05 avril 2024 , mis à jour le 12 avril 2024

Julien Peloton est ingénieur de recherche au Laboratoire de physique des deux infinis – Irène Joliot-Curie (IJCLab – Univ. Paris-Saclay, CNRS, Univ. Paris Cité) où il propose aux équipes de recherche en astronomie et astrophysique des solutions techniques adaptées à l'analyse de grands jeux de données. Il est à l’initiative du logiciel FINK, lauréat du prix science ouverte du logiciel libre 2023 dans la catégorie « Coup de cœur » du jury.

« La science est belle quand elle est ouverte et accessible à tous et toutes », entame Julien Peloton, ingénieur de recherche à l’IJCLab où il travaille depuis 2017. Titulaire d'une thèse en physique de l'Univers centrée sur l'analyse et l'exploitation des données issues des phénomènes cosmologiques, il y a pour mission principale d'aider les équipes de recherche par le biais de solutions techniques adaptées à l'analyse de grands jeux de données (jusqu'à quelques pétaoctets soit 1015 octets). Dans ce contexte, il lance, en 2019, le projet communautaire FINK, dont il prend la coordination. FINK est un logiciel capable de gérer, en temps réel, le flux d’alertes par nuit associées à des phénomènes transitoires dans le ciel et générées par le télescope LSST (Large Survey of Space and Time) de l’observatoire Vera C. Rubin, au Chili. En 2023, FINK se voit décerner le prix science ouverte du logiciel libre, dans la catégorie « Coup de cœur » du jury, par le ministère de l’Enseignement supérieur et de la Recherche.


Une appétence croissante pour le développement logiciel

« Avant de commencer ma thèse, je n'étais pas particulièrement intéressé par le développement logiciel, se souvient Julien Peloton. Dès le premier jour, je n'ai fait que programmer, mais, heureusement, j'ai bénéficié d'un échange très riche avec l’équipe interdisciplinaire dans laquelle j’étais. Y travaillaient ensemble non seulement des physiciennes et physiciens, mais aussi des ingénieures et ingénieurs, des mathématiciennes et mathématiciens, et des statisticiennes et statisticiens. J'ai réalisé que l'informatique n'était pas seulement un outil mais aussi une science. Alors que c'était un besoin technique au début de ma thèse, j'ai peu à peu commencé à m'y intéresser en profondeur. Cela m'a permis, par la suite, de combiner l'informatique avec des connaissances en physique pour devenir ingénieur de recherche. » Julien Peloton note toutefois que les codes sont très souvent fermés. « Je me disais qu'on faisait quelque chose qui avait probablement déjà été fait ailleurs et c'est aussi pour changer cette façon de travailler que j'ai très vite commencé à diffuser librement mes codes. »


Le quotidien d’un ingénieur de recherche    

À l’IJCLab, le quotidien de Julien Peloton consiste en un grand nombre « va-et-vient » avec les équipes de recherche, afin de connaître leurs besoins techniques et scientifiques, mais aussi de dispenser des formations. La question de la qualité des logiciels n’étant que rarement abordée par les étudiantes et étudiants en sciences, il ne s'agit pas seulement, pour l’ingénieur de recherche, d'écrire du code, mais également de le rendre lisible en utilisant les standards existants, de le tester et le documenter, et d'être capable de le déployer et le maintenir sur le long terme. Au final, cela s’avère plus chronophage que l’écriture de lignes de code en tant que tel. « La qualité et l'assistance des logiciels sont très peu abordées dans les programmes scolaires », souligne Julien Peloton.

En tant qu'ingénieur de recherche, il se considère à la croisée des chemins, entre expertise technique et expertise scientifique : « L'astronomie est un domaine scientifique très informatisé, et c'est avec nos compétences et notre expertise techniques que nous franchissons des étapes importantes. Cela nécessite une forte collaboration entre les équipes pour faire avancer la recherche, car personne n'a toutes les clés. » Il veille d’ailleurs régulièrement à ce qu'aucun utilisateur ou utilisatrice ne soit laissée dans l'ignorance du logiciel FINK.


Les apports du logiciel FINK

FINK fournit une interface entre les scientifiques et les données massives provenant des relevés astronomiques. Les cas étudiés sont variés - des constituants du système solaire aux étoiles de notre galaxie voire au-delà - et l’évolution des phénomènes transitoires impliqués va de quelques minutes à plusieurs années. Alors que les observatoires envoient régulièrement des données sous la forme de flux d'alertes, FINK les analyse en temps réel pour comprendre la nature des processus physiques sous-jacents. « Les utilisateurs et utilisatrices accèdent en sortie à une fonction de probabilité leur permettant de sélectionner les objets qui les intéressent parmi les millions présents en entrée », explique Julien Peloton. La partie analyse du logiciel se base sur les contributions de la soixantaine de personnes impliquées, issues d’une douzaine d'équipes à travers le monde et apportant chacune une brique du logiciel profitant à tous et toutes. « C'est stimulant, d'un point de vue scientifique, de réunir autant de communautés différentes, mais cela représente aussi un défi d'un point de vue sociologique. » Le projet crée finalement un pont entre des communautés scientifiques ne travaillant pas forcément entre elles et dont les pratiques quotidiennes sont différentes. Pour Julien Peloton, la grande force du logiciel libre est de pouvoir exécuter, tester, modifier, réutiliser et distribuer ce support.

Automatisé et hébergé sur un cloud, le logiciel FINK permet d’extraire en continu des informations scientifiques, automatiquement rendues publiques. « Je reçois souvent des retours très positifs de la part des utilisateurs sur le fait qu'on a facilité leur travail », se réjouit Julien Peloton à propos de l’impact du logiciel, tout en incitant à garder un œil sur les traitements scientifiques. Car même si le recours à l'intelligence artificielle est grand dans les chaînes de traitement, rien ne remplace les équipes scientifiques quand il s’agit de prendre des décisions complexes.


Ouvrir, mais pas n’importe comment

« L’informatique est devenue presque incontournable pour les scientifiques. On leur demande de plus en plus de produire des codes ou des logiciels pour leurs travaux, sans formation préalable », témoigne l’ingénieur de recherche de l’IJCLab. Or, des codes mal décrits par les uns deviennent souvent des boîtes noires pour les autres. Recourir à la science ouverte est un moyen d'aider à surmonter les difficultés, d’autant plus avec l'avènement de l'intelligence artificielle. Pour Julien Peloton, « l’ouverture des codes est absolument nécessaire, mais pas suffisante ». Et elle ne doit pas se faire n’importe comment.

Ouvrir ne consiste pas seulement à rendre le code source accessible à tous et toutes : il doit aussi être facile à interpréter et à utiliser. Il faut réussir à décrypter ce que contient le logiciel, grâce à sa documentation et aux outils qui l'entourent (API, suite de tests, etc.). « En revanche, réaliser cela prend beaucoup de temps et représente un investissement considérable. Ce n’est pas toujours facile à faire, surtout en début de carrière. » La difficulté réside souvent dans le décalage entre les attentes des équipes scientifiques (un résultat scientifique) et les moyens d’y parvenir (par exemple la production d'un logiciel). Une formation appropriée, un soutien technique ponctuel, voire la prise en charge du développement par une équipe technique viennent alors atténuer ce problème.


Motiver les jeunes à faire de la recherche

« Notre mission est aussi de montrer aux jeunes que la recherche est intéressante, commente Julien Peloton. Il faut leur en donner le goût, sans être trop technique dès le départ. Certes, nous n’aboutissons pas tous les jours à des révolutions techniques et scientifiques, mais nous apportons modestement notre pierre à l'édifice. » Comment, dans ce cas, éviter le décalage entre la perception qu'a le public du travail de recherche et ce que les scientifiques réalisent au quotidien ? Cela passe notamment par des actions de vulgarisation scientifique, « malheureusement rarement prises en compte dans l'évaluation de nos carrières », regrette Julien Peloton. « Par exemple, comment souligner l'impact qu’a un scientifique parlant à la radio de la contribution de la science ouverte ? »


Et pour la suite ?

Avec un nouvel observatoire en construction, dont l’exploitation commencera en 2025 et se poursuivra jusqu'en 2035, le projet FINK anticipe déjà de nouveaux défis. Pour y répondre, il prévoit un déploiement du logiciel sur une plus grande infrastructure de calcul, au centre de calcul de l'Institut national de physique nucléaire et de physique des particules du CNRS (CC-IN2P3). L’archivage du code sur Software Heritage, archive ouverte pour les codes source des logiciels, est également à venir, afin d'assurer sa conservation sur le long terme.

Julien Peloton CC-BY-NC-SA Université Paris-Saclay