Exemples de stages, projets et thèses

Sur le bandeau de gauche, vous trouverez des exemples de sujets traités par les étudiant(e)s lors des projets et stages en 4ème et 5ème années, ainsi que des sujets de thèse. 

Les sujets traités par nos étudiants sont divers et d'actualités, comme en témoigne la sélection ci-dessous.

 

 

Random Forest Algorithm to Identify Animal Behavior (Khadija R.)

Studying animals behavior is a wide field of research. It is a vital field for people aiming to protect either animals and insure their survival or humans safety while interacting with animals. In ecology for instance, one major study is to identify animal behavior with the aim of conserving rare spices and manage wild animals. Nevertheless, retrieving behavioral data of those species is often a challenging matter. Alternatively, it is now possible to identify behavior through a measurable quantity, that could be translated to behavioral data. For example, sensors collecting direct and continuous information such as accelerometers, provides detailed information about body movement that could help identifying the behavior. To translate measures to behavioral data, different approaches could be used, commonly supervised Machine Learning where algorithms are trained on accelerometry data labeled by behaviors.

The aim of this internship is, at first, to assess a Random Forest algorithm performance on dynamic data to predict behaviors, and then improve the results using the statistical model "Hidden Semi-Markov Model (HSMM)".

Méthodes de Deep Learning pour l’optique (Juliette M.)

La restitution de phase est un problème optique qui consiste à retrouver la phase d’un signal lumineux à partir de son intensité. C’est un enjeu important en imagerie satellitaire car il permet de modéliser les erreurs de phases subies par un signal lumineux à partir d’une image, et donc de détecter les défauts de polissage et d’alignement des miroirs sur les télescopes satellites.

Le problème est mal posé. Il est en général abordé par des techniques d’optimisation classiques, mais le Deep Learning est un outil puissant de plus en plus exploité pour ce problème et qui a été au centre de mon stage.

Pour travailler sur cette problématique par apprentissage supervisé, j’ai pu exploiter un jeu de données d’imagerie généré selon les réglages d’un télescope de l’entreprise. L’objectif de mon stage était l’implémentation de différentes méthodes de Deep Learning appliquées à ce problème de restitution de phase. L’enjeu était de parvenir à mettre en place avec TensorFlow le réseau de neurones le plus adapté à notre problématique, en jouant sur ses paramètres et sa structure. Le réseau final est une variante du réseau UNet qui prend en considération la structure des données : l’architecture conçue présente deux canaux d’encodage et un canal de décodage.

J’ai également effectué une analyse des résultats obtenus, qui ont soulevé des question- nements d’unicité de la solution et de qualité des prédictions. Des tests de robustesse au bruit et à un décalage ont été impulsés mais n’ont pas pu être finalisés avant la fin de mon stage.

Impact de la sécheresse sur la santé des forêts : suivi par images satellitaires (Elisa D.)

J’ai réalisé mon stage de quatrième année au sein du pôle scientifique de l’entreprise Capgemini à Toulouse. Durant quatre mois, j’ai travaillé sur le projet Carto-Sécheresse en partenariat avec Google : le but du projet est d’évaluer la possibilité d’utiliser des images satellitaires pour l’étude de la rentabilité des forêts françaises et l’impact de la sécheresse sur celles-ci. Pour cela, nous avons étudié différents indices de sécheresse pouvant être obtenus grâce aux images satellitaires et données climatiques. Nous avons tenté de mettre en lien ces indices avec des indicateurs comme le taux de mortalité des arbres ou la qualité du bois. Etant en partenariat avec Google, nous avons utilisé la plateforme Google Earth Engine comme une base de données pour récupérer les données qui nous intéressaient. Nous avons traité ces données grâce à des programmes Python afin de calculer puis afficher sur des cartes des indicateurs de l’état de santé de la végétation et des indicateurs climatologiques caractéristiques de la sécheresse (taux de précipitations, températures). Nos programmes permettent de suivre l’évolution temporelle des indices de sécheresse ainsi que de détecter des périodes anormalement sèches. Nous avons également utilisé les fonctionnalités de Google Earth Engine afin de créer une application en ligne pour présenter nos résultats. Ainsi, nous avons développé un démonstrateur permettant de visualiser interactivement des anomalies d’indices de végétation, de température et de précipitation par région française, par essence d’arbres et sur une période choisie par l’utilisateur.

Physically-Informed Neural Networks (Gabriel D.)

Les équations différentielles sont omniprésentes en physique. On peut citer énormément d’exemples : les équations qui régissent l’évolution de la vitesse des fluides, les équations qui décrivent l’évolution des déformations au sein d’une structure. De nombreuses mé- thodes numériques existent pour les résoudre et ont été étudiées. Avec l’émergence de l’apprentissage machine, on peut se demander si de nouvelles méthodes peuvent concur- rencer ces anciennes méthodes. L’objectif du stage a donc été de chercher à savoir si les réseaux de neurones et une méthode basée sur les espaces à noyau reproduisant pourraient servir à résoudre ces équations différentielles. On nomme ces réseaux de neurones des

“Physically-Informed Neural Networks”. Nous n’avons aucune preuve de convergence théorique (contrairement aux méthodes plus anciennes). Toutefois, les réseaux de neurones ont une bonne capacité pour résoudre certains problèmes. On arrive à obtenir des erreurs relatives de l’ordre de 0.0001 avec la solution à l’équation. Pour les espaces à noyau reproduisant, on peut montrer qu’il s’agit de la résolution d’un problème d’optimisation quadratique sous contraintes non linéaires. Cette méthode présente des résultats de conver- gence théoriques. On arrive également à obtenir des erreurs relatives de l’ordre de 0.0001 sur certaines équations. Toutefois, son implémentation est plus difficile. En conclusion, ces deux nouvelles méthodes sont prometteuses mais nécessitent d’être approfondies.

Analysis of Winter and Summer Arctic Ice Sea Volume (Guillaume M.)

The internship was conducted in the Centre for Polar Observation and Modelling (CPOM), a British Natural Environment Research Council (NERC) Centre of Excellence involved in research about the changing polar ice caps and ocean in both Antarctic and Arctic pole. In the project we produce, analyze, and compare winter and summer Arctic Sea ice volume budgets (SIV) over years 2011 to 2019. A budget calculation methodology allows to decompose the dynamic (advection and divergence) and thermodynamic compo- nents of the Arctic SIV changes over the years. On the one hand we compute the volume budget from derived satellite observations, and on the other hand the volume budget is also simulated from climate models. The project is motivated by the first year-round satellite sea ice thickness record from CryoSat-2 derived by the CPOM team (Jack C.Landy et al 2022). This allows to produce summer sea ice observational budget, where temporal coverage was before limited to winter season (November-April) due to inability interpreting radar measurements of thickness when snow cover is melting during summer. The main goal of the project is to compare the differences between the observed and simulated budget and to identify sources of errors in both models and observations. We aim to understand the roles of forcing, ice physics, and natural variability in the climate model errors. The last step will be to suggest how we could constrain the models according to the observations to make them more realistic, and thus improve the Arctic climate forecasting.