6 raisons d’utiliser R en analyse PMSI

Nous travaillons depuis plusieurs années avec R, langage open source de traitement de données et de statistique, pour l’analyse PMSI.

Nous partageons aujourd’hui notre retour d’expérience sur l’utilisation de R pour l’analyse des PMSI.

Raison #1 : R est adapté aux analyses PMSI

Principales caractéristiques de R :
# importation optimisée de fichiers textes structurés
# manipulation très fluide et naturelle de structures de données. R a été conçu spécifiquement pour la manipulation de données.
# toutes les fonctions statistiques et de manipulations de données existent nativement dans R
# de très nombreuses fonctions graphiques et de visualisation de données sont intégrées à R pour produire automatiquement des histogrammes, des courbes, des camemberts, des boîtes à moustache, etc…
# génération de rapports dynamiques
# très rapidement opérationnel.
En quelques heures, un professionnel du PMSI peut réaliser des comptages (nombre de RUM, nombre moyen de RUM par RSS, DMS, …) et quelques requêtes simples (nombre moyen d’actes CCAM par séjour et GHM, ratio de séjours avec un code CIM-10 codé, …)

Or ces caractéristiques sont justement celles recherchées par les équipes DIM :
# travail sur un PC, souvent un portable pour les médecins DIM, sans vouloir ou pouvoir dépendre d’un service informatique
# import et manipulation rapide (en quelques secondes) de fichiers de quelques 100 000 lignes
# réutilisation et personnalisation à volonté de requêtes
# « nettoyage » facile de données (ex : supprimer les GHM représentés par moins de 10 séjours)
# « jeux » avec les filtres et les sélections
# production de graphiques à la volée
# production de case mix
# comparaison de jeux de données période à période ou périmètre à périmètre
# repérage d’atypies avec paramétrage de listes de codes
# appel à des fonctions ou des tests statistiques en ayant l’assurance qu’ils sont corrects
# distinction entre variables quantitatives, qualitatives, catégorielles
# rapprochement avec des référentiels ou des textes non structurés
# génération de rapports d’activité dynamiques reproductibles
# intégration aux EDS, aux études multi-sites

R est par ailleurs très largement utilisé en Santé Publique et en biostatistique depuis de nombreuses années.

Raison #2 : R est mature et pérenne

R existe depuis plus de 20 ans. Sa maturité, sa popularité et sa diffusion s’accroissent d’année en année.

A ce jour, R est couramment utilisé en entreprise, dans les milieux académiques et les organismes publics, en particulier dans le monde hospitalier et de la santé.

R comprend plus de 15 000 packages à ce jour (source), répondant à des besoins de plus en plus pointus.

En janvier 2019, R est classé 12e dans l’index TIOBE qui mesure la popularité des langages de programmation dans le monde.

Raison #3 : R est gratuit et open source

La gratuité de R permet aux équipes DIM de travailler tout de suite en toute liberté, sans dépendre d’un financement qui peut toujours être remis en cause ou d’un éditeur commercial qui bride l’accès aux possibilités d’analyses, sans dépendre d’un nombre de licences.

R est open source. Cela garantit une maîtrise de bout en bout des requêtes et des fonctions : pas de « boîtes noires », pas de « modules supplémentaires payants », aucune limitation dans les développements.

R dispose d’un environnement de développement gratuit, libre, multiplateforme pour R, orienté utilisateur : RStudio qui facilite grandement le développement sous R et la visualisation en direct des résultats, en particulier des graphiques.

Raison #4 : R est très documenté

L’écosystème francophone autour de R est aujourd’hui très développé avec des sites et blogs didactiques, du plus basique pour démarrer aux plus techniques, des forums et des rencontres académiques dans de nombreuses villes (Nantes, Toulouse, Paris, Lyon), un réseau d’experts indépendants.

Pour les professionnels qui comprennent l’anglais basique, la documentation R devient alors quasi-infinie.

Chaque question a sa réponse dans les blogs, sites ou forums

Raison #5 : Les spécialistes et experts du PMSI utilisent R

La quasi-totalité des CHU et CHR utilisent aujourd’hui R.

L’AP-HP développe un logiciel open source R pour le PMSI : pmeasyr (voir notre interview de Guillaume PRESSIAT qui développe et maintient pmeasyr).

La DREES développe depuis 2019 sa visualisation de données en ligne en R

Nous développons PMSISoft, le logiciel d’analyse PMSI le plus pointu à ce jour, en R.

Raison # 6 : R = l’ouverture du PMSI à la data science

Pour les équipes DIM, travailler avec R, c’est aussi participer aux travaux les plus récents en santé publique autour des EDS (Entrepôts De Santé) qui voient le jour dans les principaux CHU (Paris, Grand Ouest, Marseille, Bordeaux, Strasbourg, Lyon) et de l’IA.

C’est s’inscrire dans une démarche de partage et de collaboration valorisant les expertises propres aux PMSI (via, par exemple, le partage de package ad’hoc).

Travailler avec R pour une équipe DIM, c’est travailler de plein pied dans le monde des data scientist, du codage semi-automatisé, de l’avenir de l’analyse des données de santé à laquelle participe le PMSI.

Copyright © Lespmsi.com – Imprimer cet article

Suspension des délais de transmission des données PMSI M2 2020

L’ATIH a communiqué ce lundi 30 mars 2020 : 

« Compte-tenu de la situation de crise actuelle liée à l’épidémie de Covid-19, les délais prévus par l’arrêté PMSI pour la transmission M2 des données PMSI pour l’ensemble des champs (MCO, SSR, HAD et psychiatrie sur M3) sont suspendus afin de permettre à tous les établissements de s’adapter aux nouvelles contraintes.

Les données M2 seront à transmettre lorsque les établissements seront organisés pour le faire.

Toutefois, le principe de la poursuite du codage de l’activité n’est pas remis en cause.

Des instructions complémentaires seront publiées dans les meilleurs délais pour les transmissions suivantes. »

Consignes de codage ses séjours liés au COVID-19

Le code U07.1 Maladie respiratoire à Coronavirus 2019 (COVID-19) a été introduit dans la CIM-10 FR le 31 janvier 2020.

Son libellé a depuis été modifié par l’OMS, il est désormais U07.1 COVID-19, avec une note indiquant que des codes additionnels peuvent préciser la pneumonie ou les autres manifestations cliniques.

Afin de répondre au besoin de description dans le PMSI de toutes les situations cliniques liées au COVID-19, l’ATIH a créé des extensions au code U07.1. Il est désormais possible de repérer précisément, au-delà des cas confirmés,
les cas possibles ou probables non confirmés, ainsi que les cas confirmés asymptomatiques.

Les définitions des cas correspondent à la dernière version à jour communiquée par Santé Publique France (SPF)

Extensions du code U07.1 dans la CIM-10 FR

U07.10 COVID-19, confirmé
Cas clinique (infection respiratoire aiguë ou détresse respiratoire selon critères SPF) confirmé par la biologie

U07.11 COVID-19, non confirmé
Cas clinique (infection respiratoire aiguë ou détresse respiratoire selon critères SPF) non confirmé par la biologie. Cas possible (symptomatique) ou probable (selon critères SPF).

U07.12 Porteur de SARS-CoV-2 asymptomatique ou pauci symptomatique
Patient sans infection respiratoire aiguë

U07.13 Autres examens et mises en observations en lien avec l’épidémie COVID-19
Personne contact ; personne coexposée ; cas possible secondairement infirmé.

Ainsi, pour les cas confirmés par la biologie, les codes à utiliser sont U07.10 pour les patients symptomatiques et U07.12 pour les patients asymptomatiques ou pauci-symptomatiques. U07.11 sera utilisé pour les cas possibles ou probables (selon les définitions de Santé Publique France), symptomatiques, sans confirmation biologique.

Consignes de codage pour le PMSI MCO

a. Le motif d’admission est en lien avec l’infection COVID-19
Se référer au fichier Excel téléchargeable sur le site de l’ATIH.
En fonction des situations, les codes U07.10, U07.11 et U07.12 peuvent être placés en diagnostic principal.

En revanche, le code U07.13 ne peut être codé qu’en position de diagnostic associé.

b. Le motif d’admission n’est pas en lien avec l’infection COVID-19
Conformément aux règles du guide méthodologique MCO, le DP sera déterminé en fonction de la situation clinique. Tous les codes étendus de U07.1 peuvent être utilisés en position de diagnostic associé.

L’impact sur le groupage MCO sera communiqué sur e-pmsi.

Source : Consignes de codage COVID-19 (ATIH – 17 mars 2020)
Copyright © Lespmsi.com – Imprimer cet article

Clinique Pasteur (Toulouse) – Poste de TIM à pourvoir courant juin 2020

La Clinique PASTEUR (adresse : 45 avenue de Lombez – 31076 Toulouse) recherche un ou une technicien(ne) de l’information médicale pour renforcer son équipe.

Le recueil MCO y est centralisé et professionnalisé.

Plusieurs profils sont possibles :  TIM avec expérience MCO ; TIM polyvalent(e); Secrétaire médicale, IDE Tous les profils seront étudiés.

Le poste est à pourvoir à partir du juin 2020 sur la base d’un temps plein.

Contact : Dr Patrick BESSE, médecin DIM (email : pbesse@clinique-pasteur.com)

Les DIM dans les GHT en 2020 (rapport IGAS)

L’IGAS a récemment rendu public son bilan d’étape des Groupements Hospitaliers de Territoire (GHT) dans lequel est étudiée l’évolution des DIM au sein de ces GHT.

En synthèse, il est écrit :

« [17] La structuration des DIM de territoire est inégale, car tributaire d’effectifs insuffisants ou d’une
réserve à collaborer entre établissements, ainsi que d’une concentration de l’activité des équipes DIM
sur le codage de séjours et actes externes, au détriment de leur fonction d’analyse quantitative et
qualitative de l’activité au niveau du territoire »

A propos des DIM de territoire, le constat d’une « émergence difficile, souvent due à la pénurie de compétences médicales » est détaillé en 3 paragraphes :

« [205] Au chapitre des fonctions supports les DIM ne bénéficient pas de l’antériorité de coopération
ou de mutualisation qu’ont pu connaître les autres fonctions évoquées. Par ailleurs la fonction DIM
recouvre des activités jusqu’alors considérées comme stratégiques car touchant à la production des
données d’activité. Enfin, la fonction de garant, vis-à-vis des patients, de la confidentialité des
informations personnelles touchant à la santé ne militait pas pour la mutualisation des moyens et
encore moins pour le partage des bases de données. »

« [206] S’agissant de l’environnement organisationnel et informatique des DIM, la quasi-totalité des
GHT répondant à l’enquête IGAS déclare ne pas disposer d’un SI patient identique sur les différents
établissements membres (114GHT/121GHT).11 GHT déclarent disposer d’un entrepôt de données
quand 77 en ont un en projet ce qui laisse augurer une montée en charge progressive. Enfin au plan
structurel et organisationnel il convient de souligner que 91 GHT sur l’échantillon de 121 déclarent
leur DIM commun opérationnel. En creux, cela signifie que probablement une trentaine de GHT ne
répond pas encore à la prescription législative inscrite à l’article L6132-3 (I.-, 2°) du CSP. La
présentation d’un plan d’action concernant l’exhaustivité et la qualité des données est d’ores et déjà
une réalité pour 45 GHT tandis que le pilotage des analyses médico-économiques par le DIM commun
l’est pour 43 GHT. »

« [207] Sans que la mission ait cherché à le vérifier, la pénurie de compétences a été évoquée dans
quelques GHT comme frein au développement du DIM de territoire. Les résultats cités supra, sans
valider l’hypothèse, montrent cependant une mise en œuvre des DIM de territoire dont la
progressivité doit s’accélérer pour répondre pleinement aux objectifs. »

Source : Bilan d’étape des GHT (Rapport – Tome 1 – IGAS)

Les GHS 2020 DGF

Publication des tarifs GHS de la campagne 2020 avec les informations associées (seuil Borne Basse, seuil Borne Haute, EXB, EXH) pour le secteur DGC (Public et Privé à but non lucratif).

Fichier Excel des tarifs GHS MCO DGF 2010 (source : ATIH) :  télécharger.

Analyses :

# 2 984 GHS en 2020

# 313 nouveaux GHS par rapport à 2019, correspondant à des GHM en M et Z, les GHS avec dit « pleins » versus  les GHS dits « intemédiaires » concernés par l’instruction « Gradation des prises en charge ambulatoires en établissement de santé ».

# aucun GHM ajouté ou supprimé par rapport à 2019

# 2 671 GHS communs entre 2019 et 2020

# aucune évolution des seuils hauts et seuils hauts pour les GHS communs entre 2019 et 2020

# Analyse LesPMSI : nous estimons que l’analyse des évolutions tarifaires entre 2019 et 2020 par GHS communs à ces 2 années n’a pas de sens, car de nombreux GHS communs 2019/2020 voient leur tarif exploser en 2020 en lien avec l’arrêté Gradation des prises en charge ambulatoires qui crée une 2eme nouveau GHS pour les GHM concernés (GHS dit « pleins » et GHS dits « intermédiaires »).
Voir article « Liste des GHS pleins et intermédiaires et règles d’attribution« .
Exemple avec le GHS 1165 correspondant au GHM 04M09T « Tumeurs de l’appareil respiratoire, très courte durée », GHS commun 2019/2020 avec la plus forte hausse de tarif GHS : + 50,64% (tarif GHS passant de 621,17 € en 2019 à 935,75 € en 2020). En fait, un 2eme GHS est créé en 2020 pour ce GHM, le GHS 5026 avec un tarif de 431 €. Difficile dans ces conditions de comparer les tarifs 2019/2020 de ces GHS.

Il convient donc de restreindre l’analyse aux GHS communs 2019/2020 et hors GHS concernés par l’arrêté Gradation des prises en charge ambulatoires.

Nous appelons par la suite cette population, les GHS « vraiment » communs. Cette population comprend 2 359 GHS.

# GHS « vraiment » communs :

## 2 116 (soit 86,70%) ont eu évolution de + 0,24% de leur tarif GHS

## 61 ont une évolution > 0,24 % de leur tarif GHS (voir liste ci-dessous)

## 182 ont une évolution < 0,24 % de leur tarif GHS (voir liste ci-dessous)

Liste des GHS « vraiment » communs 2019/2020 avec une évolution > 0,24% de leur tarif GHS

 

Liste des GHS « vraiment » communs 2019/2020 avec une évolution < 0,24% de leur tarif GHS

Sources : Arrêté tarifaire MCO 2020Tarifs MCO 2020 (format Excel)