05/10/2024
Département Etalab
Fonction Publique de l'Etat
Catégorie A (cadre)
Emploi ouvert aux titulaires et aux contractuels
Numérique - Data Scientist
Vacant
Data scientist H/F
La Direction interministérielle du numérique (DINUM) est un service de la Première ministre, placé sous l'autorité du ministre de la transformation et de la fonction publiques.
Elle oriente, anime, soutient et coordonne les actions des administrations de l'Etat et celles des organismes placés sous sa tutelle, visant à améliorer la qualité, l'efficacité, l'efficience et la fiabilité des services rendus par le système d'information et de communication de l'Etat.
Elle contribue à l'ouverture des données publiques, aux stratégies d'innovation ouverte et au travail avec les écosystèmes d'innovation. Elle pilote la politique de mutualisation du système d'information et de communication de l'Etat et peut intervenir dans la gouvernance des opérations de mutualisation ainsi que dans la conception, l'élaboration et la mise en œuvre de ces opérations.
Enfin, elle soutient le développement des compétences de l'Etat et des organismes placés sous sa tutelle dans le domaine du numérique, en facilitant l'émergence d'une filière professionnelle interministérielle du numérique.
Rejoindre la DINUM, c'est prendre part à un collectif de plus de 200 agents réunis autour d'une même ambition : le numérique au service de l'efficacité de l'action publique
La/le titulaire du poste intègre le département Etalab de la DINUM. Etalab vise à valoriser et exploiter les données comme levier d'efficacité de l'action publique. Il coordonne la conception et la mise en œuvre de la stratégie de l'État dans le domaine de la donnée.
Il promeut l'action de l'Etat en matière d'ouverture, de circulation et d'exploitation des données publiques. Il accompagne les administrations dans l'usage de la data science, de l'intelligence artificielle et diffuse une culture de l'innovation ouverte au sein des administrations.
Au sein du Datalab, le data scientist (F/H) travaille avec un product owner, un data scientist senior, des ingénieurs et un analyste de données pour développer des cas d’usages mobilisant des données et à fort impact.
Au sein d’une équipe produit suivant la méthode agile, vous aurez pour mission d'opérer l’analyse des données et développer des modèles et des algorithmes.
Vous serez chargé(e) de :
- Développer des analyses, des traitements, des modèles et des algorithmes sur les données manipulées dans le cadre des cas d’usage incubés dans le Datalab afin de répondre aux besoins métiers identifiés
- Veiller à ce que les outils et traitements développés dans le cadre du Datalab soient transférables aux entités chargées de les exécuter en production dans les administrations lorsque les cas d’usage data ont démontré leur impact et sont finalisés
- Mener une veille technologique active pour mobiliser les meilleures technologies.
Au cours de la réalisation de vos missions, vous devrez être en veille permanente pour détecter des projets à impact à valoriser ou à accompagner.
L'agent(e) peut par ailleurs être amené(e) à renforcer ponctuellement les autres agents du département suivant l'intérêt du service.
Enfin, en fonction de l'évolution des priorités fixées à la DINUM et au département Etalab, il/elle peut être amené(e) à prendre ponctuellement en charge d'autres tâches et projets.
De formation supérieure (bac+5), combinée à une expérience d’au moins 3 ans en sciences des données ou d’un portefeuille de productions personnelles conséquentes ou d’une thèse de doctorat dans le domaine de la science des données ou de l’informatique. Vous disposez de connaissances aussi bien en programmation qu’en data science. Expert(e) de la donnée, vous êtes sensible à la question de la qualité des données et à leur accessibilité, à l’intelligibilité et l’explicabilité de ses travaux.
- Excellente connaissance des méthodes de traitement des données, des statistiques, du machine learning et de l'intelligence artificielle ;
- Connaissance des bonnes pratiques de développement en Python et maîtrise des bibliothèques usuelles (pandas, requests, polars, Apache Arrow, etc.), développement d’API (FastAPI)
- Maîtrise des principales bibliothèques d’apprentissage machine (Scikit-learn, Tensorflow, PyTorch) et connaissance de bibliothèques spécialisées (Transformers, Spacy, etc)
- Maîtrise du requêtage des bases de données SQL (PostgreSQL, DucKDB)
- Maîtrise de Git
- Aisance à l’orale et une capacité à vulgariser des notions techniques complexes à un public large et non-spécialiste
- Bonne compréhension de l’administration, de son fonctionnement et d'une bonne maîtrise des enjeux du numérique dans ce contexte
Les expériences suivantes seront considérées comme des atouts supplémentaires :
- Participation à des projets open-source (en tant que mainteneur ou contributeur)
- Spécialisation dans le domaine du traitement d'image ou du traitement automatique des langues (NLP)
Oui
Non
Europe, France, Île-de-France, Paris (75)
20, avenue de Ségur - 75007 PARIS
Niveau 7 Master/diplômes équivalents
Confirmé
L'envoi du CV et d'une lettre de motivation est obligatoire
28/07/2024
ulrich.tan@modernisation.gouv.fr