Biomimétisme et Natural Language Processing.
Structure d’accueil : CEEBIOS et Laboratoire LIS (ISYEB au Museum National d’Histoire Naturelle).
Structure d’encadrement : CEEBIOS– Adrien Saint-Sardos et MNHN- Régine Vignes-Lebbe.
Lieu : Ceebios – 2 Place Maurice Quentin, 75001 Paris et/ou MNHN 57 Rue Cuvier, 75005 Paris.
Durée du stage : 4-6 mois à temps plein, à partir de janvier 2021.
Contexte : Le biomimétisme consiste à s’inspirer du vivant pour concevoir des produits, services, bâtiments intégrés dans les écosystèmes existants. Dans le monde de l’ingénierie, de nombreux projets s’inspirent d’organismes vivants et d’écosystèmes pour atteindre leurs objectifs : mais l’identification de ces modèles biologiques est rendue complexe par le fossé sémantique entre les disciplines, ainsi que par la diversité des supports de la donnée biologique (articles, textes, images, données de caractérisation…).
Ces dernières années ont ainsi vu l’émergence d’outils sémantiques et informatiques pour la fouille de la donnée et de la littérature biologique, avec notamment un développement d’ontologies transdisciplinaires, et d’outils d’IA pouvant s’adapter à la recherche utilisateurs autant qu’à la terminologie des différents domaines scientifiques d’intérêt pour la démarche biomimétique.
Quels outils numériques doivent être mis à disposition des équipes R&D pour réussir leur démarche biomimétique ? Peut-on rendre la fouille de la donnée biologique accessible à des non-biologistes via des algorithmes adaptés ?
L’objectif de ce stage de recherche est de poser les premières pierres d’un outil d’analyse sémantique pour la recherche en biomimétisme. Il s’agira, en regard de la littérature, d’implémenter des algorithmes adaptés pour interroger la donnée biologique sous la forme texte, et la mettre à disposition d’un utilisateur n’utilisant pas la terminologie des biologistes.
Objectifs du stage
- Etablir un état de l’art des initiatives de language processing sur des problématiques de biodiversité et de biomimétisme.
- Créer un premier prototype d’outil informatique pour l’interrogation de bases de données texte en biologie.
- Participation aux groupes de travail sur la fouille de la donnée biologique aux côtés du Ceebios et du Muséum National d’Histoire Naturelle, qui pourra mettre à disposition de la donnée biologique d’intérêt.
Profil du candidat
Niveau de diplôme : Master 2 – Informatique, expérience en scrapping et en extraction d’information texte depuis le web, appétence pour Natural Language Processing.
Plus d’infos sur les structures encadrantes :
www.ceebios.com et https://isyeb.mnhn.fr/fr/
Contacts
Ceebios – adrien.saint-sardos@ceebios.com — MNHN – LIS – regine.vignes-lebbe@mnhn.fr