GROUPE M6 - Data Engineer F/H H/F
M6
Publiée le
30/04/2026
Contrat
CDI
Localisation
89, av Charles-de-Gaulle 92200 Neuilly-sur-Seine
Taille équipe
—
Missions clés
Concevoir et opérer des pipelines de données sur AWS. · Analyser des données volumineuses pour produire des insights actionnables. · Collaborer avec les data scientists pour élaborer des produits prédictifs.
Profil recherché
Bac +5 (Master 2, Diplôme d'ingénieur) · 3-5 ans d'expérience · Capacité de modélisation · Analyse · Synthèse · Curiosité intellectuelle
Outils & compétences
AWS, S3, Glue, Athena, MWAA, EMR, ECS, Python, Pandas, PySpark, AWS Wrangler, SQL, CTE, window functions, performance tuning, partitionnement, Spark, Parquet, Iceberg, Delta Lake, Terraform
Le poste en détail
Le Groupe M6 est l'un des groupes audiovisuels les plus importants de France, avec un portefeuille de chaînes comprenant M6, W9, 6ter, Gulli, Paris Première, Téva, ainsi que des stations de radio (RTL, RTL2, Fun Radio) et des services numériques. Le Groupe M6 est à la pointe de l'innovation numérique et de la transformation des médias, avec un engagement fort dans l'exploitation des données pour améliorer l'expérience utilisateur et optimiser ses revenus publicitaires. Au sein de la direction des technologies et de l'innovation du Groupe M6, l'équipe Datalake joue un rôle important dans la centralisation, le traitement et la valorisation des données issues de l'ensemble des plateformes et services numériques du groupe. Dans un contexte de forte évolution du secteur audiovisuel et de compétition accrue avec les services de streaming internationaux, M6 mise sur les technologies de data science et d'intelligence artificielle pour innover et se différencier. En tant que Data Engineer au sein de l'équipe datalake du Groupe M6, vous serez chargé(e) de : - Concevoir et opérer des pipelines de données robustes sur AWS (S3, Glue, Athena, MWAA, EMR, ECS). - Analyser des données volumineuses issues de l'adserver, du CRM, des audiences et de la radio pour produire des insights actionnables. - Maîtriser Python (Pandas, PySpark, AWS Wrangler) pour développer des traitements optimisés et industrialisables. - Produire et optimiser du SQL avancé pour les analyses et pipelines (CTE, window, performance tuning, partitionnement). - Optimiser les traitements Spark pour gérer les téraoctets du datalake. - Construire des KPI métier pour la régie publicitaire, le CRM, la radio et les équipes audiences. - Mettre en place des modèles de données solides (datalake raw → golden), avec Parquet, Iceberg ou Delta Lake. - Garantir performance, qualité et gouvernance des données sur l'ensemble du cycle de vie (monitoring, coûts, sécurité IAM). Collaboration et innovation - Collaborer avec les data scientists pour élaborer des produits et services prédictifs robustes - Effectuer une veille scientifique et technologique pour irriguer les innovations au sein du groupe - Accompagner les équipes métier (régie publicitaire, streaming, CRM, études TV) dans l'exploitation des insights data