Chargé de projet Ingénieur de données H/F

CDD 18 mois

L’institut Carnot CALYM a construit le Lymphoma Data Hub, plateforme cloud permettant de stocker et exploiter les données de santé générées par les entités du consortium afin de réaliser des projets de recherche en Intelligence Artificielle par exemple. Le but étant de développer sur le long terme des solutions permettant l’exploitation de données générées par les activités du consortium.

L’institut Carnot CALYM est en relation partenariale forte avec Microsoft, ce qui permettra de réaliser ces missions en étant accompagné du conseil d’un Data Architect Microsoft qui suit le projet depuis sa création.

 

Missions

Au sein de l’équipe R&D de CALYM, vous réaliserez vos missions en étroite collaboration avec la Responsable de Projets pour cerner au mieux les besoins métier.

 

  • Définir, développer et mettre en place les différents processus de collecte, d’organisation, de stockage et de modélisation des données sur une plateforme cloud de gestion de données, en lien avec l’infogéreur de la plateforme (déploiement d’un cloud public) :
  • Gestion et évolution d’un datalake sur Microsoft Azure
  • Prise en charge d’un environnement complexe : sources multiples et hétérogénéité des données
  • Mise en place de pipelines pour automatiser les différentes étapes de l’acquisition de la donnée
  • Nettoyage et transformation des données afin qu’elles soient exploitables
  • Mise en place des outils de supervision adaptés au suivi du bon fonctionnement des intégrations / monitoring automatisé
  • Développement de solutions permettant d’exploiter la donnée une fois ingérée selon les besoins des partenaires (création de base de données etc)

 

  • Veiller à ce que les pipelines de données déployés soient sécurisés et clairs pour être analysés
  • Veiller à ce que la politique de données soit respectueuse des réglementations en vigueur
  • Cerner les challenges métier et avoir une vue d’ensemble des systèmes de gestion de données pour pouvoir les relier

 

Vous pourrez également aider à identifier les besoins en data visualisation pour faciliter l’exploitation et la visualisation des données stockées dans différents logiciels/bases.

Profil

De formation Bac +5 en science et ingénierie de la donnée / informatique, vous justifiez d’une première expérience d’au moins 3 ans et idéalement une expérience en interopérabilité des systèmes. Vous avez des notions en IA et machine learning ainsi que sur la réglementation liée aux données. Vous disposez de compétences en langage Python, R, Java, en langage SQL et gestion de bases de données et avez une forte appétence pour le Big Data. L’environnement Microsoft Azure (Cloud Computing) : ADLS Gen2, blob storage, containers, compute instance, compute cluster vous est familier et vous avez une bonne maitrise de l’optimisation des déploiements (Docker, Serverless,).

Vous êtes dotés d’une bonne capacité à travailler en équipe, d’un bon sens de la communication et êtes forces de proposition.

Vous êtes reconnu pour votre esprit d’analyse et de synthèse ainsi que votre rigueur (respect des délais et des procédures).

La pratique de l’anglais à un niveau professionnel est recommandée.

Ces missions pourront se pérenniser dans le cadre d’un CDI.

Poste basé à Pierre Bénite (Lyon sud).

 

 

Pour postuler
Candidature LYSARC
CV *
Taille de téléchargement maximum : 2 Mo
Lettre de motivation *
Taille de téléchargement maximum : 2 Mo

Nous vous invitons à remplir le formulaire suivant et à adresser votre CV et lettre de motivation.