Mission

L’objet du programme LabCom de l’ANR est d’inciter les acteurs de la recherche académique à créer des partenariats structurés à travers la co-construction de « Laboratoires Communs » entre une TPE/PME ou une ETI et un laboratoire d’organisme de recherche. Un Laboratoire Commun est défini par la signature d’un contrat définissant son fonctionnement, et notamment :

  • une gouvernance commune,
  • une feuille de route de recherche et d’innovation,
  • des moyens de travail permettant d’opérer en commun la feuille de route,
  • une stratégie visant à assurer la valorisation par l’entreprise du travail partenarial.

C’est dans ce cadre que le LITIS et la société Saagie ont décidé d’unir leurs efforts et de conjuguer leurs compétences pour tenter d’apporter des réponses à certaines problématiques rencontrées dans la mise en œuvre des techniques d’apprentissage profond (deep learning) et plus particulièrement sur l’apprentissage faiblement supervisé et la robustesse des modèles. 

L’un des enjeux principaux de l’apprentissage profond réside dans la nécessité de disposer de grandes quantités de données pour entraîner, valider et opérationnaliser les algorithmes. Même en considérant les gigantesques gisements de données existants et en incluant les différents types de données exploitables (textes, images, audio, etc.), la difficulté demeure car, dans la plupart des cas, seule une petite fraction de ces données est étiquetée et fréquemment avec des imprécisions et des erreurs. Si les données du monde socio-économiques sont de plus en plus massives, il peut s’avérer délicat voire impossible de les exploiter avec des méthodes statistiques quand le travail préalable d’annotation nécessite un effort humain trop important et trop coûteux. Par ailleurs, bien qu’il existe une panoplie d’approches non supervisées (ne nécessitant pas d’étiquettes), celles-ci sont souvent difficiles à mettre en œuvre et à évaluer. C’est pourquoi les modèles à l’état de l’art – profonds ou non – sont des approches dites “supervisées” nécessitant des étiquettes. 

Pour répondre à cette problématique, les techniques d’apprentissage faiblement supervisé qui permettent de réduire la quantité de données labellisées nécessaires et qui prennent en compte les potentielles imperfections et imprécisions de celles-ci présentent un intérêt majeur dans de nombreux domaines d’application et pour divers usages. Le plus souvent, les données disponibles combinent des modalités différentes (images, textes, sons, données symboliques, etc.) et sont caractérisées par des attributs spatiaux (distance, direction, position) et/ou temporels (nombre d’occurrences, changements dans le temps, durée). Ces données ont donc des propriétés multimodales et séquentielles qui doivent souvent être prises en considération pour répondre aux besoins applicatifs.Les travaux réalisés dans le laboratoire L-LiSa visent à unir le savoir-faire technique de Saagie avec l’expertise méthodologique du LITIS pour développer des algorithmes innovants et efficaces permettant l’apprentissage faiblement supervisé de modèles profonds. La validation est réalisée sur deux cas d’usage réels :

  • le diagnostic automatique de lymphome sur des données fournies par le centre H. Becquerel,
  • l’aide à la décision à partir de données utilisateur du produit Saagie.
Fonctionnement du Laboratoire Commun L-LiSa