Détails de l’offre
Poste proposé
Datascientist H/F
Contrat
CDD
Descriptif
DATASCIENTIST H/FAPPRENTISSAGE AUTOMATIQUE POUR UNE AIDE AU CODAGE PMSI
SYSTEME D'INFORMATION MEDICALE
DIRECTION GENERALE
CDD 12 MOIS - TEMPS PLEIN
A POURVOIR DÈS QUE POSSIBLE
I. Présentation générale du CHU
Composé d'environ 2 700 lits et places, le CHU de Poitiers s'étend sur 5 sites (Poitiers, Châtellerault, Loudun, Lusignan, Montmorillon) répartis sur l'ensemble du territoire de la Vienne.
Etablissement de soins de référence à vocation régionale, le CHU de Poitiers assure à la fois une mission de proximité pour les 436 000 habitants de la Vienne et une mission d'appel régional et de recours pour les 1,8 million d'habitants du Poitou-Charentes.
Le CHU de Poitiers est organisé en 15 pôles d'activités cliniques et médico-techniques. Avec près de 8 000 professionnels, il constitue le premier employeur de la Vienne.
2. Présentation de l'aide au codage
Dans le cadre de la tarification à l'activité (T2A), le financement des hôpitaux repose sur un remboursement forfaitaire de l'assurance maladie pour chaque séjour hospitalier. Ce versement s'appuie sur l'analyse de données standardisées, transmises par les établissements après chaque hospitalisation, dans le cadre du programme de médicalisation des systèmes d'information (PMSI). Le PMSI exige des établissements qu'ils mettent en place des processus organisationnels rigoureux, en raison des exigences élevées de qualité. Le codage d'un séjour hospitalier consiste notamment à attribuer, à partir des comptes rendus médicaux, des codes standardisés CIM-10 (classification internationale des maladies - 10ème version) qui décrivent les maladies prises en charge lors d'un séjour hospitalier. Cette activité, réalisée par des humains, est une tâche chronophage et source d'erreurs nécessitant des contrôles qualité.
Pour faciliter le codage, des méthodes d'apprentissage automatique supervisé, basées sur les comptes rendus textuels d'hospitalisation, ont été développées. Il s'agit d'une tâche d'apprentissage supervisé multilabel (en moyenne 4 à 5 codes par document) dans un espace de prédiction de grande dimension (environ 10 000 codes possibles). Les modèles comme BioBERT, ClinicalBERT ou CamemBERT (adapté au français) sont actuellement les plus efficaces pour extraire et classer les diagnostics à partir de textes médicaux mais l'état de l'art évolue rapidement. Les travaux de recherche ont aussi montré que l'intégration de boucles de rétroaction avec des experts du codage (« human in the loop ») permet d'améliorer les prédictions et de réduire les erreurs de codage. Pour être utilisé par des humains et pour garantir la traçabilité des décisions, l'explicabilité d'un modèle dans ce contexte est un facteur clef : les modèles doivent non seulement prédire les codes, mais aussi fournir des explications (par exemple, en surlignant les passages du compte rendu qui justifient un code, ou en indiquant le niveau de confiance de la prédiction).
Le CHU de Poitiers a obtenu le 25 avril 2025 une autorisation de la CNIL (n°22236583) pour la mise en euvre de son entrepôt de données de santé (EDS). Il a été conçu pour assurer la confidentialité, la protection et la sécurité des données personnelles des patients. Les données sont stockées sur des serveurs localisés sur le site du CHU de Poitiers, dans un espace réservé aux seuls professionnels habilités. Il intègre toutes les données nécessaires à l'objectif du codage automatisé : données administratives, données du PMSI, données de biologie, données de prescription médicamenteuse et tous les comptes rendus de consultation et d'hospitalisation. L'environnement sécurisé de l'EDS dispose d'un serveur de calculs et d'une carte graphique sur laquelle des modèles de langage peuvent être exécutés. Les millions de séjours déjà codés manuellement pourront servir de données d'apprentissage. La présence de cet entrepôt de données va permettre de tester la faisabilité de déployer des outils d'aide au codage PMSI.
II. Poste proposé
Nous cherchons un(e) datascientist souhaitant travailler sur un projet ambitieux visant à exploiter de grands volumes de données pour classifier automatiquement des séjours hospitaliers.
- Missions générales
Sous la responsabilité du coordinateur de l'entrepôt, d'un datascientist de l'équipe EDS et d'un médecin spécialiste des entrepôts de données de santé, les principales missions seront de :
- Réaliser un état de l'art des algorithmes d'aide au codage PMSI
- Réaliser un benchmarking des outils open source disponibles, adapter et tester des modèles existants et les évaluer
- Participer à l'implémentation d'un pipeline de classification des séjours hospitaliers sur deux services pilotes
Activités complémentaires
- Participer à l'exploitation des bases de données utilisées dans le service d'information médicale et à la production d'indicateurs
- Rédiger un article scientifique, publier les résultats obtenus et les présenter dans des congrès
-
- Nature du contrat et des conditions de recrutement
-
- Le poste est à pouvoir en CDD de 12 mois renouvelable, dès que possible
- Votre rémunération sera fixée en fonction de votre formation et de votre expérience, sur un grade d'Ingénieur Hospitalier, catégorie A (grille indiciaire de la fonction publique hospitalière) soit un salaire à partir de 28K brut/an.
- Possibilité de télétravail pour 1 à 2 jours par semaine.
-
- Quotité de temps de travail
- 100% temps plein
III. Profil recherché
- Diplôme et formation requis
-
- Vous possédez un niveau BAC+5 dans le domaine informatique
- Expériences dans les algorithmes de traitement automatique de la langue et des métriques d'évaluation, notamment en classification automatique de textes
- Expériences dans les algorithmes d'apprentissage automatique
-
- Compétences et qualités requises
Maîtrise du langage Python
Connaissance du langage SQL
Connaissance de git
La connaissance du développement logiciel serait un plus
La connaissance de Linux et Docker serait un plus
Rigueur, autonomie, sens de l'organisation
IV. Renseignements complémentaires
Le CHU de POITIERS s'engage en faveur de la diversité et de l'inclusion.
Nos offres d'emplois sont ouvertes en personnes en situation d'handicap conformément à l'article L1132-1 du code du travail.
Pourquoi rejoindre le CHU de POITIERS ?
- Faire preuve d'un engagement fort au sein d'une structure hospitalière publique
- Réputation : le CHU de POITIERS est reconnu pour ses services de hautes qualités et ses avancées dans divers domaines médicaux.
- Localisation : Situé à Poitiers, une ville avec un riche patrimoine historique et culturel, le CHU offre un cadre de vie agréable, avec un bon équilibre entre vie professionnelle et vie privée.
- Accompagnement personnalisé des agents durant leur carrière (prévention des RPS, service social du personnel.)
- Accès à l'ensemble du plan de formation institutionnel
- Offre diversifiée de restauration (Food truck, self)
- Jardins et espaces verts/ parking gratuit/ réseau covoiturage
- Accès au CE/CGOS : vacances à prix réduits, tarifs préférentiels sur des spectacles, places de cinéma, chèques cultures, CESU, prestations sociales, chèques vacances
V. Démarches à effectuer pour postuler
Des renseignements supplémentaires peuvent être demandés auprès :
Dr Sébastien Cossin, référent scientifique de l'entrepôt de données de santé du CHU de Poitiers ([email protected])
Dr Alexandre Quillet, coordinateur de l'entrepôt de données de santé du CHU de Poitiers ([email protected])
Déposez dès maintenant votre candidature (CV et lettre de motivation) sur le site web du CHU de Poitiers, rubrique « Le CHU recrute », la date limite de dépôt est le 1 mars 2026.
Personne à contacter
Merci d'envoyer votre candidature (CV et lettre de motivation) à l'adresse : [email protected]
URL de l’offre : https://f.candidatus.com/?ref=chupoitiers-26725
Etablissement
Site hospitalier de Poitiers La Miletrie
2 rue de la Miletrie CS 90577
86021 Poitiers
Voir la fiche de l’établissement