Nous cherchons une ou un data engineer
Published on June 28, 2022
Venez construire le futur de la plateforme des données publiques avec nous.
Etalab recrute une ou un Data Engineer !
Etalab cherche un·e Data engineer pour renforcer ses compétences sur le traitement, l'analyse et la qualité des données, notamment auprès de l'équipe data.gouv.fr.
Vos missions en quelques mots
Sous le pilotage du Directeur Technique et du lead Data Engineer d'Etalab, le ou la Data Engineer sera amené(e) à travailler sur différents axes, décrits ci-dessous.
La réutilisation des données publiques passe par leur normalisation. Etalab adresse notamment ce problème avec l’initiative schema.data.gouv.fr, qui vise à référencer un maximum de standards utiles à la production de données open data.
- Accompagner les producteurs de schémas de données
- Animer le réseau de producteurs et de fédération de producteurs
- Maintenir et développer des outils autour de la qualité des données : schema.data.gouv.fr, publier.etalab.studio...
- Améliorer l’intégration des produits “schémas” avec la plateforme : consolidation, détection de schémas, visualisations...
- Accompagner les producteurs de données : aide à la publication de jeux de données majeurs, enrichissement (géolocalisation, croisement de données)...
- Gérer l'infrastructure des données : mise en place d'un datalake généraliste, d'éventuels datalakes thématisés, analyse automatisée des fichiers référencés sur data.gouv.fr, travaux communs avec le pôle IA d'Etalab...
- Améliorer les usages autour des statistiques et des métriques de data.gouv.fr
La polyvalence est un pré-requis important puisqu'il s'agit aussi bien d'animer des groupes de travail que de développer des outils web, en plus des compétences inhérentes au métier du Data Engineering.
La ou le Data Engineer travaillera avec d'autres administrations sur de nombreuses politiques publiques.
Profil recherché
Vous êtes titulaire d’un diplôme de niveau master en data science ou informatique et vous avez une expérience d’au moins 5 ans dans ce domaine. Vous avez de solides connaissances en traitement des données et bases de données.
Les compétences attendues sont :
- Connaître le langage Python, notamment pour travailler sur la la qualité et l'enrichissement des données ; des outils de construction de traitements des données (ex : Airflow) et de déploiement d'API (ex : Flask, FastAPI) ; des outils de visualisation de données (ex : Dash, Metabase)
- Maîtriser des solutions de base de données (ex : PostGreSQL, MongoDB, ElasticSearch, S3, etc) pour requêter, stocker ou transférer de gros volumes de données
- Avoir une bonne autonomie en administration système (Unix/Linux, Docker)
- Savoir travailler en équipe et de manière agile tout en documentant son travail
- Connaître des données publiques et bases en développement web front
- Faire preuve de curiosité pour aborder les sujets très différents qui peuvent émerger
Informations administratives et pratiques
- Contrat CDD 3 ans, renouvelable une fois avec possibilité de prolonger en CDI
- Rémunération à déterminer en fonction de l'expérience et des rémunérations précédentes de la candidate ou du candidat
- Jusqu'à 3 jours de télétravail par semaine possible (flottant ou non), le présentiel a lieu à Paris 7e
Postulez par mail à l'adresse : candidatures-dinum[at]pm.gouv.fr en envoyant un CV et une lettre de motivation.