T4 – Innovation du Produit Saagie

Objectif :

Envisager l’intégration au sein de la plateforme ou dans l’offre Saagie de fonctionnalités ou de mécanismes innovants reposant sur des modèles d’apprentissage statistique. 

Concevoir et mettre au point des modèles d’apprentissage statistique sur lesquels Saagie pourra s’appuyer pour développer des fonctionnalités ou des mécanismes innovants pouvant être intégrés au sein de sa plateforme (fonctions d’aide automatisée, adaptation dynamique en fonction du profil ou des motivations de l’utilisateur, génération de code exécutable, etc.) ou dans son offre client (modèles pré-entrainés, catalogue de composants, solutions destinées à des usages récurrents, etc.).

Étudier l’intégration dans le produit Saagie d’un Assistant Virtuel Intelligent (AVI) offrant des fonctionnalités de supervision et d’aide à la décision basées sur des algorithmes d’apprentissage profond faiblement supervisé et éventuellement par renforcement.

Proposer des fonctionnalités permettant de concevoir, de fabriquer et de déployer automatiquement des jobs de traitement, des pipelines et des applications.

Approche :

Concertation avec l’équipe produit Saagie pour identification de pistes d’amélioration parmi lesquelles :  

Pour la collecte des données d’apprentissage :

  • Traçage de l’activité des utilisateurs et entrainement les modèles avec ces données pour proposer aux utilisateurs un assistant virtuel intelligent.
  • Intégration dans la plate-forme Saagie de « sondes » permettant de mesurer les résultats obtenus et la satisfaction des utilisateurs pour chaque solution mise en œuvre ;
  • Recueil de programmes source et d’unités de code écrits et annotés par les utilisateurs de la plate-forme ;
  • Recueil « manuel » des données en demandant à l’utilisateur, lors du premier login, de décrire ses spécificités, ses besoins, ses motivations, etc. afin d’annoter les données de traçabilité de ses activités propres.

Pour l’assistance intelligente à l’utilisation du produit :

  • Étude d’un mécanisme de recommandation contextuel qui, en fonction du profil particulier de l’utilisateur (les utilisateurs de la plate-forme Saagie sont principalement des data-engineers ou des data-scientists), lui propose en priorité les fonctionnalités dont il peut avoir le plus besoin ou des fonctionnalités qu’il ne connait pas mais qui pourraient lui être utile dans la situation courante. Mise en œuvre d’une ergonomie adaptative permettant une autonomisation et une amélioration de productivité de l’utilisateur.
  • Conception de briques technologiques d’une nature éventuellement différente de celles qui sont proposées aujourd’hui : composants avec des capacités fonctionnelles avancées destinés à être intégrés nativement dans le produit, proposés au catalogue Saagie, mis à disposition de la communauté ou distribués librement.
  • A partir des données mesurées et du degré de satisfaction exprimé par les utilisateurs (apprentissage par renforcement), conception de fonctions permettant de :
  • proposer aux data engineers, en fonction de leur exigences, les choix technologiques à privilégier et des architectures de pipelines optimums,
  • prédire les performances, proposer un dimensionnement de l’infrastructure,
  • offrir une aide à la décision,

A partir des unités de code écrites par les utilisateurs, conception de fonctions permettant de :

    • faire de la complétion automatique de template de code ou de pipeline avec du « slot filling »,
    • suggérer l’utilisation de briques technologiques à intégrer dans un pipeline,
    • assurer une uniformisation du code et des pratiques,
    • générer automatiquement le code pour répondre à un problème formulé par l’utilisateur en langage naturel, en répondant à des questions ouvertes ou en complétant un formulaire avec des questions simples et/ou des options à sélectionner (es données d’apprentissage seraient les codes sources de jobs validés.

Planification :

T4.1 : Conception et mise en place du protocole d’acquisition des données

Début : 01/01/2021.         Fin : 30/06/2022

Description : Identification des données d’historisation (logs) et des mesures à collecter pour pouvoir entraîner les algorithmes. Spécification des modules de collecte (écouteurs, sondes, collecte active, etc.) à intégrer dans une version instrumentée du produit Saagie.

T4.2 : Collecte des données

Début : 01/01/2022          Fin : 31/12/2024

Description : Contribution à l’organisation de sessions de collecte :

  • chez les clients de Saagie,
  • dans le cadre de projets à l’Université et à l’INSA au travers de projets étudiants.

Analyse, validation et annotation des données collectées.

T4.3 : Apprentissage des modèles, prototype et évaluation  

Début : 01/07/2022          Fin : 30/06/2025

Description :Développement itératif d’un ou plusieurs modèles de deep learning en exploitant en particulier les résultats de la tâche T3.2 (données séquentielles).

Mise au point du composant AVI.

Entrainement et paramétrage de modèles pour

T4.4 : Intégration dans la plate-forme Saagie  

Début : 01/07/2023.         Fin : 30/06/2025

 Description :Intégration du composant AVI issu de la tâche T4.3 dans le produit Saagie pour mise à disposition d’un démonstrateur de faisabilité expérimenté sur des cas d’usage clients (sites pilotes).

Démonstration de faisabilité et maquettage des fonctions retenues en concertation avec l’équipe produit Saagie (système de recommandations contextuel, de prédiction de performances, d’ergonomie adaptative, de génération de code, etc.)