Titre du poste

AI Scientist – Modèles Tabulaires F/H

Description

Vous rejoignez une entreprise technologique en forte croissance qui développe une plateforme avancée de data science dédiée à l’automatisation et à l’industrialisation de cas d’usage sur données structurées. Le produit s’appuie sur un modèle de fondation appliqué aux données tabulaires, conçu pour être déployable rapidement en production, avec un haut niveau d’exigence sur la performance, la robustesse et la transférabilité.

Dans un environnement de recherche appliquée, vous intervenez au cœur de la nouvelle génération de modèles. Vous travaillez en proximité avec des équipes engineering et data, ainsi qu’avec des partenaires académiques et industriels, sur des problématiques à la fois scientifiques et directement actionnables.

Missions

  • Concevoir et améliorer des algorithmes de représentation et d’embeddings pour données tabulaires, intégrés au cœur du produit.
  • Définir des protocoles d’évaluation et des métriques adaptées aux cas d’usage réels, puis optimiser performance et scalabilité.
  • Contribuer aux stratégies d’active learning, à la sélection d’échantillons et à la consolidation des datasets train et eval.
  • Concevoir et enrichir des datasets favorisant représentation et transfer learning, notamment via l’usage de données synthétiques.
  • Analyser les mécanismes d’apprentissage afin d’orienter les itérations de recherche et les choix techniques.
  • Assurer une veille scientifique active et proposer des axes de recherche pertinents.
  • Collaborer avec ML Engineers et Data Scientists pour livrer des modèles pré entraînés et des adaptations ciblées.
Qualifications
  • Doctorat terminé en IA, machine learning ou domaine connexe
  • Publications dans au moins une conférence scientifique de premier plan
  • Expérience concrète d’entraînement de modèles à l’échelle sur cloud ou cluster privé
  • Très bon niveau de code, capacité à prototyper et à industrialiser
  • Anglais courant
  • Autonomie, rigueur et forte appétence pour la recherche appliquée

Compétences appréciées

  • Expérience d’entraînement distribué et calcul intensif
  • Contributions open source ou compétitions data science
  • Capacité à démontrer l’impact opérationnel de travaux de recherche
  • C ou C++ en complément de Python

Environnement technique

  • Transformers, embeddings, representation learning, pre training, fine tuning
  • PyTorch ou Jax, Sklearn
  • Multi GPU, distribution, optimisation mémoire, performance inference
  • SLURM, DeepSpeed ou équivalent
  • Parquet, SQL et gestion de grands volumes, datasets synthétiques
  • Git et bonnes pratiques de développement
Type de poste
Temps plein
Secteur
CONSEIL POUR LES AFFAIRES ET AUTRES CONSEILS DE GESTION
Lieu du poste
PARIS, 75101, France
Salaire de base
100000€-130000€ Par an
Date de publication
28 décembre 2025 à 18:03
Valide jusqu’au
24 janvier 2026 à 00:00
Exportation PDF
Close modal window