6 raisons d’utiliser R en analyse PMSI

Nous travaillons depuis plusieurs années avec R, langage open source de traitement de données et de statistique, pour l’analyse PMSI.

Nous partageons aujourd’hui notre retour d’expérience sur l’utilisation de R pour l’analyse des PMSI.

Raison #1 : R est adapté aux analyses PMSI

Principales caractéristiques de R :
# importation optimisée de fichiers textes structurés
# manipulation très fluide et naturelle de structures de données. R a été conçu spécifiquement pour la manipulation de données.
# toutes les fonctions statistiques et de manipulations de données existent nativement dans R
# de très nombreuses fonctions graphiques et de visualisation de données sont intégrées à R pour produire automatiquement des histogrammes, des courbes, des camemberts, des boîtes à moustache, etc…
# génération de rapports dynamiques
# très rapidement opérationnel.
En quelques heures, un professionnel du PMSI peut réaliser des comptages (nombre de RUM, nombre moyen de RUM par RSS, DMS, …) et quelques requêtes simples (nombre moyen d’actes CCAM par séjour et GHM, ratio de séjours avec un code CIM-10 codé, …)

Or ces caractéristiques sont justement celles recherchées par les équipes DIM :
# travail sur un PC, souvent un portable pour les médecins DIM, sans vouloir ou pouvoir dépendre d’un service informatique
# import et manipulation rapide (en quelques secondes) de fichiers de quelques 100 000 lignes
# réutilisation et personnalisation à volonté de requêtes
# « nettoyage » facile de données (ex : supprimer les GHM représentés par moins de 10 séjours)
# « jeux » avec les filtres et les sélections
# production de graphiques à la volée
# production de case mix
# comparaison de jeux de données période à période ou périmètre à périmètre
# repérage d’atypies avec paramétrage de listes de codes
# appel à des fonctions ou des tests statistiques en ayant l’assurance qu’ils sont corrects
# distinction entre variables quantitatives, qualitatives, catégorielles
# rapprochement avec des référentiels ou des textes non structurés
# génération de rapports d’activité dynamiques reproductibles
# intégration aux EDS, aux études multi-sites

R est par ailleurs très largement utilisé en Santé Publique et en biostatistique depuis de nombreuses années.

Raison #2 : R est mature et pérenne

R existe depuis plus de 20 ans. Sa maturité, sa popularité et sa diffusion s’accroissent d’année en année.

A ce jour, R est couramment utilisé en entreprise, dans les milieux académiques et les organismes publics, en particulier dans le monde hospitalier et de la santé.

R comprend plus de 15 000 packages à ce jour (source), répondant à des besoins de plus en plus pointus.

En janvier 2019, R est classé 12e dans l’index TIOBE qui mesure la popularité des langages de programmation dans le monde.

Raison #3 : R est gratuit et open source

La gratuité de R permet aux équipes DIM de travailler tout de suite en toute liberté, sans dépendre d’un financement qui peut toujours être remis en cause ou d’un éditeur commercial qui bride l’accès aux possibilités d’analyses, sans dépendre d’un nombre de licences.

R est open source. Cela garantit une maîtrise de bout en bout des requêtes et des fonctions : pas de « boîtes noires », pas de « modules supplémentaires payants », aucune limitation dans les développements.

R dispose d’un environnement de développement gratuit, libre, multiplateforme pour R, orienté utilisateur : RStudio qui facilite grandement le développement sous R et la visualisation en direct des résultats, en particulier des graphiques.

Raison #4 : R est très documenté

L’écosystème francophone autour de R est aujourd’hui très développé avec des sites et blogs didactiques, du plus basique pour démarrer aux plus techniques, des forums et des rencontres académiques dans de nombreuses villes (Nantes, Toulouse, Paris, Lyon), un réseau d’experts indépendants.

Pour les professionnels qui comprennent l’anglais basique, la documentation R devient alors quasi-infinie.

Chaque question a sa réponse dans les blogs, sites ou forums

Raison #5 : Les spécialistes et experts du PMSI utilisent R

La quasi-totalité des CHU et CHR utilisent aujourd’hui R.

L’AP-HP développe un logiciel open source R pour le PMSI : pmeasyr (voir notre interview de Guillaume PRESSIAT qui développe et maintient pmeasyr).

La DREES développe depuis 2019 sa visualisation de données en ligne en R

Nous développons PMSISoft, le logiciel d’analyse PMSI le plus pointu à ce jour, en R.

Raison # 6 : R = l’ouverture du PMSI à la data science

Pour les équipes DIM, travailler avec R, c’est aussi participer aux travaux les plus récents en santé publique autour des EDS (Entrepôts De Santé) qui voient le jour dans les principaux CHU (Paris, Grand Ouest, Marseille, Bordeaux, Strasbourg, Lyon) et de l’IA.

C’est s’inscrire dans une démarche de partage et de collaboration valorisant les expertises propres aux PMSI (via, par exemple, le partage de package ad’hoc).

Travailler avec R pour une équipe DIM, c’est travailler de plein pied dans le monde des data scientist, du codage semi-automatisé, de l’avenir de l’analyse des données de santé à laquelle participe le PMSI.

Copyright © Lespmsi.com – Imprimer cet article

Patientèles des SSR spécialisés locomoteur et système nerveux (étude DREES)

Nous signalons cette étude DRESS publiée en novembre 2019 sur la base des données nationales PMSI de 2013 à 2017 qui s’intéresse aux caractéristiques des SSR spécialisés pour les affections de l’appareil locomoteur et les affections du système nerveux.

Mais ces résultats intéresseront tous les SSR avec de la CM 01 et/ou CM 08.

Un de intérêts de ce genre d’étude est de fournir des données de calage exclusives (dépendance médiane à l’entrée, durées de séjour, etc…), bien utiles pour se comparer à la base nationale.

Quelques résultats :

# En 2017, 405 000 admissions ont été réalisées en unité SSR spécialisée pour la prise en charge soit des affections de l’appareil locomoteur soit des affections du système nerveux, soit au total près de 9 300 000 journées de
présence (ou équivalent pour les hospitalisations partielles)

# 5% des admissions en locomoteur ou système nerveux étaient classés dans une autre CM que les 2 CM 01 et 08 attendues

# En SSR « locomoteur », le score médian de dépendance physique est égal à 6 en début de séjour, 31 % ayant un score supérieur à 8

# En CM 01, le score médian de dépendance physique est égal à 8

# Près de deux tiers des patients admis en SSR locomoteur ont eu au moins un séjour en hospitalisation complète (HC), avec une médiane de 28 jours pour le nombre total de journées de présence en HC au cours de l’année 2017.

# L’étude fournit les âges moyens par GN ou regroupement de GN. Exemple : 71,1 ans pour le regroupement des 3 GN 0840, 0841 et 043 « Arthrose avec implant articulaire (hanche, genou, épaule) »

Source : Les patientèles des SSR spécialisés pour les affections de l’appareil locomoteur et les affections du système nerveux (Dossier DREES – Novembre 2019)

Approbation du référentiel « Identifiant National de Santé » (INS)

Un arrêté publié au JO le 28 décembre 2019 approuve et définit le référentiel « Identifiant National de Santé » (INS).

A partir de 2021, toute donnée de santé devra être référencée avec l’INS. C’était initialement prévu au 1er janvier 2020.

Ce référentiel concerne le référencement des données de santé avec le numéro d’inscription au répertoire national d’identification des personnes physiques (NIR) ou le numéro d’identification d’attente (NIA) uniquement pour la prise en charge sanitaire et le suivi médico-social.

Les professionnels concernés ont l’obligation de référencer les données de santé avec l’INS, mais il n’y a pas obligation de remplacer l’identifiant local.

A minima, l’INS doit être utilisé dans le(s) logiciel(s) gérant les identités des usagers et le(s) logiciel(s) de gestion du dossier informatisé des usagers

Un chantier qui concerne, entre autres, le DIM.

Source : Arrêté du 24 décembre 2019 portant approbation du référentiel « Identifiant national de santé »

Format du FICHOMP anticancéreux intraGHS (PMSI MCO 2020)

Voir article « Expérimentation article 51 pour le recueil des médicaments anti-cancéreux (campagne PMSI MCO 2020)« 

Mise en oeuvre au 1er mars 2020 pour tous les établissements MCO (DAF et ex-OQN)

Format FICHCOMP anticancéreux intraGHS (10 variables) :

Numéro FINESS d’inscription ePMSI – Taille = 9 positions

Type de prestation – Taille = 2 positions. Valeur = 14

Numéro administratif local de séjour – Taille = 20 positions

Date d’administration – Taille = 8 positions

Code UCD – Taille = 15 positions

Nombre administré éventuellement fractionnaire (7+3) – Taille = 10 positions

Prix d’achat multiplié par le nombre administré (7+3) – Taille = 10 positions

Validation initiale de la prescription par un centre de référence ou de compétence – Taille = 1 position. Modalité : 1 = Oui, 2 = Non

Indication – Taille = 7 positions

Filler – Taille = 23 positions. Réservé à un usage futur

Source : Formats PMSI MC0 2020 (onglet « FICHCOMP intracancéreux intraGHS »)

Expérimentation article 51 pour le recueil des médicaments anti-cancéreux (campagne PMSI MCO 2020)

L’article 51 de la LFSS 2018 « Expérimentation en santé et innovation du parcours de soins » permet d’expérimenter de nouvelles organisations en santé reposant sur de nouveaux modes de financement.

Dans ce cadre, le ministère souhaite expérimenter l’intérêt d’un recueil plus exhaustif d’informations sur le contexte de la prescription de certains médicaments au sein des établissements de santé, ainsi que sur leur effet sur la prise en charge des patients.

Cette expérimentation concerne le codage des médicaments anticancéreux.

Un recueil FICHCOMP pour les anticancéreux intraGHS (voir article « Format du FICHOMP anticancéreux intraGHS« ) et un recueil DATEXP d’informations complémentaires sont à renseigner.

Une notice sera publiée prochainement par la direction de la sécurité sociale.

A cette heure, le format du recueil DATEXP n’est pas encore disponible.

Source : NOTICE TECHNIQUE n° ATIH-722-1-2020 du 20 décembre 2019 « Campagne tarifaire et budgétaire 2020 – Nouveautés PMSI »

Poste TIM à pourvoir au CH de Bligny

Le centre hospitalier de Bligny (91640 Briis-sous-Forges – Essonne) recherche un ou une technicien(ne) de l’information médicale pour renforcer son équipe dynamique et sympathique composée d’un DIM et de deux TIM.

Le CH de Bligny, ESPIC, dispose de 124 lits et 14 places en MCO et de 224 lits et 12 places en SSR.

Le recueil MCO y est centralisé et professionnalisé, et le recueil SSR y est décentralisé.

Les outils utilisés en routine sont, outre les outils réglementaires : DxCare (dossier patient et PMSI), PMSI-Pilot, suite Office. Hopital Manager et Chimio sont consultés régulièrement en lecture.

Le travail principal consiste à coder, contrôler, corriger, envoyer, participer aux analyses statistiques, communiquer, participer à divers groupes de travail.

Les TIM sont impliqué(e)s dans les principaux projets du service et de l’établissement, en particulier le passage à FIDES-séjours, l’accompagnement à la DMA en SSR, le développement des tableaux de bord, la certification des comptes, le virage ambulatoire en médecine.

Plusieurs profils sont possibles : technicien avec appétence informatique (PMSI-Pilot ; BO ; BI-Query ; DxCare, Access, Excel, autres …) ; TIM avec expérience SSR ; TIM polyvalent(e).

Tous les profils seront étudiés.

Le poste est à pourvoir à partir du 1er mars 2020 sur la base d’un temps plein. Convention collective FEHAP 51.

Pour tout renseignement et pour envoyer vos candidatures (CV et lettre de motivation) : Dr Catherine Karanfilovic (médecin chef du DIM) : c.karanfilovic@chbligny.fr

Salaire : Convention collective FEHAP 51

Voir fiche détaillée du poste.

Format du DATEXP Intra GHS

Voir article « Consignes de codage pour les dispositifs médicaux intra GHS à partir du 1er janvier 2020« 

Date de début du recueil au 1er janvier 2020 pour tous les établissements MCO (ex DAF et ex-OQN)

DATEXP pour Données d’Expérimentation. Les DATEXP sont des fichiers texte

Format DATEXP Intra GHS (8 variables) :

N° FINESS PMSI – Taille = 9 positions

Numéro administratif local de séjour

ID Exp – Valeur = N9905

N°ordre – Valeur = 1

Date de pose – Format : JJMMAAAA A defaut date d’utilisation

Code intra-GHS du dispositif médical – Alphanumérique sur 7 caractères. Première lettre = G, suivie de 6 chiffres

Nombre d’unités implantées

code IUD-ID – Règlement européen 2017/745 du dispositif médical – IUD = Identifiant Unique des Dispositifs

Source : Formats PMSI MC0 2020 (onglet « DATEXP Intra GHS »)