GROUPE M6 - Data Engineer F/H H/F

CDI 89, av Charles-de-Gaulle 92200 Neuilly-sur-Seine IT / Digital

Publiée le

30/04/2026

Contrat

CDI

Localisation

89, av Charles-de-Gaulle 92200 Neuilly-sur-Seine

Taille équipe

—

3-5 ans exp.

Missions clés Concevoir et opérer des pipelines de données sur AWS. · Analyser des données volumineuses pour produire des insights actionnables. · Collaborer avec les data scientists pour élaborer des produits prédictifs.

Profil recherché Bac +5 (Master 2, Diplôme d'ingénieur) · 3-5 ans d'expérience · Capacité de modélisation · Analyse · Synthèse · Curiosité intellectuelle

Outils & compétences AWS, S3, Glue, Athena, MWAA, EMR, ECS, Python, Pandas, PySpark, AWS Wrangler, SQL, CTE, window functions, performance tuning, partitionnement, Spark, Parquet, Iceberg, Delta Lake, Terraform

Postuler maintenant →

Le poste en détail

Le Groupe M6 est l'un des groupes audiovisuels les plus importants de France, avec un portefeuille de chaînes comprenant M6, W9, 6ter, Gulli, Paris Première, Téva, ainsi que des stations de radio (RTL, RTL2, Fun Radio) et des services numériques. Le Groupe M6 est à la pointe de l'innovation numérique et de la transformation des médias, avec un engagement fort dans l'exploitation des données pour améliorer l'expérience utilisateur et optimiser ses revenus publicitaires. Au sein de la direction des technologies et de l'innovation du Groupe M6, l'équipe Datalake joue un rôle important dans la centralisation, le traitement et la valorisation des données issues de l'ensemble des plateformes et services numériques du groupe. Dans un contexte de forte évolution du secteur audiovisuel et de compétition accrue avec les services de streaming internationaux, M6 mise sur les technologies de data science et d'intelligence artificielle pour innover et se différencier. En tant que Data Engineer au sein de l'équipe datalake du Groupe M6, vous serez chargé(e) de : - Concevoir et opérer des pipelines de données robustes sur AWS (S3, Glue, Athena, MWAA, EMR, ECS). - Analyser des données volumineuses issues de l'adserver, du CRM, des audiences et de la radio pour produire des insights actionnables. - Maîtriser Python (Pandas, PySpark, AWS Wrangler) pour développer des traitements optimisés et industrialisables. - Produire et optimiser du SQL avancé pour les analyses et pipelines (CTE, window, performance tuning, partitionnement). - Optimiser les traitements Spark pour gérer les téraoctets du datalake. - Construire des KPI métier pour la régie publicitaire, le CRM, la radio et les équipes audiences. - Mettre en place des modèles de données solides (datalake raw → golden), avec Parquet, Iceberg ou Delta Lake. - Garantir performance, qualité et gouvernance des données sur l'ensemble du cycle de vie (monitoring, coûts, sécurité IAM). Collaboration et innovation - Collaborer avec les data scientists pour élaborer des produits et services prédictifs robustes - Effectuer une veille scientifique et technologique pour irriguer les innovations au sein du groupe - Accompagner les équipes métier (régie publicitaire, streaming, CRM, études TV) dans l'exploitation des insights data

Le poste en détail

Offres similaires