6 raisons d’utiliser R en analyse PMSI

Nous travaillons depuis plusieurs années avec R, langage open source de traitement de données et de statistique, pour l’analyse PMSI.

Nous partageons aujourd’hui notre retour d’expérience sur l’utilisation de R pour l’analyse des PMSI.

Raison #1 : R est adapté aux analyses PMSI

Principales caractéristiques de R :
# importation optimisée de fichiers textes structurés
# manipulation très fluide et naturelle de structures de données. R a été conçu spécifiquement pour la manipulation de données.
# toutes les fonctions statistiques et de manipulations de données existent nativement dans R
# de très nombreuses fonctions graphiques et de visualisation de données sont intégrées à R pour produire automatiquement des histogrammes, des courbes, des camemberts, des boîtes à moustache, etc…
# génération de rapports dynamiques
# très rapidement opérationnel.
En quelques heures, un professionnel du PMSI peut réaliser des comptages (nombre de RUM, nombre moyen de RUM par RSS, DMS, …) et quelques requêtes simples (nombre moyen d’actes CCAM par séjour et GHM, ratio de séjours avec un code CIM-10 codé, …)

Or ces caractéristiques sont justement celles recherchées par les équipes DIM :
# travail sur un PC, souvent un portable pour les médecins DIM, sans vouloir ou pouvoir dépendre d’un service informatique
# import et manipulation rapide (en quelques secondes) de fichiers de quelques 100 000 lignes
# réutilisation et personnalisation à volonté de requêtes
# « nettoyage » facile de données (ex : supprimer les GHM représentés par moins de 10 séjours)
# « jeux » avec les filtres et les sélections
# production de graphiques à la volée
# production de case mix
# comparaison de jeux de données période à période ou périmètre à périmètre
# repérage d’atypies avec paramétrage de listes de codes
# appel à des fonctions ou des tests statistiques en ayant l’assurance qu’ils sont corrects
# distinction entre variables quantitatives, qualitatives, catégorielles
# rapprochement avec des référentiels ou des textes non structurés
# génération de rapports d’activité dynamiques reproductibles
# intégration aux EDS, aux études multi-sites

R est par ailleurs très largement utilisé en Santé Publique et en biostatistique depuis de nombreuses années.

Raison #2 : R est mature et pérenne

R existe depuis plus de 20 ans. Sa maturité, sa popularité et sa diffusion s’accroissent d’année en année.

A ce jour, R est couramment utilisé en entreprise, dans les milieux académiques et les organismes publics, en particulier dans le monde hospitalier et de la santé.

R comprend plus de 15 000 packages à ce jour (source), répondant à des besoins de plus en plus pointus.

En janvier 2019, R est classé 12e dans l’index TIOBE qui mesure la popularité des langages de programmation dans le monde.

Raison #3 : R est gratuit et open source

La gratuité de R permet aux équipes DIM de travailler tout de suite en toute liberté, sans dépendre d’un financement qui peut toujours être remis en cause ou d’un éditeur commercial qui bride l’accès aux possibilités d’analyses, sans dépendre d’un nombre de licences.

R est open source. Cela garantit une maîtrise de bout en bout des requêtes et des fonctions : pas de « boîtes noires », pas de « modules supplémentaires payants », aucune limitation dans les développements.

R dispose d’un environnement de développement gratuit, libre, multiplateforme pour R, orienté utilisateur : RStudio qui facilite grandement le développement sous R et la visualisation en direct des résultats, en particulier des graphiques.

Raison #4 : R est très documenté

L’écosystème francophone autour de R est aujourd’hui très développé avec des sites et blogs didactiques, du plus basique pour démarrer aux plus techniques, des forums et des rencontres académiques dans de nombreuses villes (Nantes, Toulouse, Paris, Lyon), un réseau d’experts indépendants.

Pour les professionnels qui comprennent l’anglais basique, la documentation R devient alors quasi-infinie.

Chaque question a sa réponse dans les blogs, sites ou forums

Raison #5 : Les spécialistes et experts du PMSI utilisent R

La quasi-totalité des CHU et CHR utilisent aujourd’hui R.

L’AP-HP développe un logiciel open source R pour le PMSI : pmeasyr (voir notre interview de Guillaume PRESSIAT qui développe et maintient pmeasyr).

La DREES développe depuis 2019 sa visualisation de données en ligne en R

Nous développons PMSISoft, le logiciel d’analyse PMSI le plus pointu à ce jour, en R.

Raison # 6 : R = l’ouverture du PMSI à la data science

Pour les équipes DIM, travailler avec R, c’est aussi participer aux travaux les plus récents en santé publique autour des EDS (Entrepôts De Santé) qui voient le jour dans les principaux CHU (Paris, Grand Ouest, Marseille, Bordeaux, Strasbourg, Lyon) et de l’IA.

C’est s’inscrire dans une démarche de partage et de collaboration valorisant les expertises propres aux PMSI (via, par exemple, le partage de package ad’hoc).

Travailler avec R pour une équipe DIM, c’est travailler de plein pied dans le monde des data scientist, du codage semi-automatisé, de l’avenir de l’analyse des données de santé à laquelle participe le PMSI.

Copyright © Lespmsi.com – Imprimer cet article

Hôpital Privé Armand Brillard – Ramsay Santé (94 Nogent-sur-Marne) recherche TIM MCO

Avec 36 000 salariés, Ramsay Santé, l’un des leaders européens de la prise en charge globale du patient, est un recruteur majeur dans le secteur de la santé en France.

En hospitalisation, le Groupe propose la quasi-totalité des prises en charges médicales et chirurgicales dans trois métiers : Médecine-Chirurgie-Obstétrique (MCO), Soins de Suite et de Réadaptation (SSR) et Santé mentale.

L’Hôpital Privé Armand Brillard, situé face au RER A à Nogent sur Marne (94), 230 lits et places, est un établissement regroupant des activités de Maternité et Néonatologie, Médecine, Chirurgie, Urgences, Ambulatoire, Dialyse et Oncologique.

Nous recherchons un / une TIM MCO en CDI dans le cadre d’un remplacement. Le poste est basé au sein de l’hôpital privé Armand Brillard, tout en étant rattaché à la direction de l’Information Médicale du Groupe Ramsay Santé. Vous pouvez être amené-ée à effectuer des missions sur d’autres établissements MCO, à distance .

L’équipe de votre périmètre se compose de 4 TIM, un médecin DIM et un consultant en information médicale.

Vos principales missions :

– Assurer le codage des diagnostics

– Contrôler la présence et la cohérence des actes et de toute autre information médico-administrative nécessaire au groupage

– Assurer la cohérence du GHM avec la prise en charge

– Exporter les données à la facturation

– Réalisation quotidienne des contrôles qualité des séjours avant l’export en facturation dans le respect des procédures Groupe

– Identifier les erreurs possiblement rencontrées, les gérer ou les signaler à son manager

– Transmettre les fichiers sur e-pmsi

Vous justifiez idéalement d’une expérience de 5 ans minimum sur un poste équivalent en établissement MCO afin d’assurer vos missions en toute autonomie.

Vous êtes à l’aise avec les logiciels métiers (CORA PMSI, HOPITAL MANAGER) et disposez d’une bonne connaissance de la terminologie médicale et des spécificités des établissements MCO.

Vous êtes reconnu-e pour votre aisance relationnelle, et appréciez conseiller et informer les différents professionnels.

Un parcours d’intégration sera mis en place dès votre arrivée avec des journées au siège du groupe Ramsay Santé ainsi que des journées en doublon au sein d’un établissement MCO. Un programme de formation interne vous sera également proposé.

Avantages : Prime vacances, restaurant d’entreprise, CE, mutuelle familiale

N’hésitez pas à nous transmettre votre candidature.

Contact recrutement : Emilie MASCRES, responsable recrutement (email : e.mascres@ramsaygds.fr – téléphone : 0187862104)

Nettoyage des points dans les codes CIM-10 en R

On est régulièrement amené à enrichir une liste de codages CIM-10 avec des informations issues d’un référentiel CIM-10 dans lequel les codes CIM-10 sont enregistrés avec un point.

Exemple avec une liste de diags CIM-10 que l’on appelle df1

Extrait de quelques lignes de df1 filtrées sur la seule colonne DP

DP
D987
C098
K317
Z987

que l’on cherche à enrichir avec un référentiel que l’on appelle df2

Extrait de quelques lignes de df2

Codes CIM-10 Explications Sources
M62.3 Le syndrome d’immobilité est une entité clinique distincte d’origine musculaire, le diagnostic doit être posé par le clinicien. Il ne s’agit pas seulement d’un état d’immobilisation du patient pour des raisons diverses. Agora
Q93.3 Le syndrome de Wolf-Hirschhorn (SWH) est un trouble du développement avec anomalies faciales caractéristiques, retard de croissance pré- et postnatale, déficit intellectuel, retard psychomoteur sévère, crises d’épilepsie et hypotonie.
Synonyme : Délétion distale 4p
Coder les manifestations en fonction des circonstances
ORPHANET & COCOA
I89.0 Le volume 3 classe en I89.0 les lymphœdèmes primitifs mais aussi secondaires. C’est bien ce code qui convient pour un
lymphœdème après curage associé au code T81.7
Agora
K31.7 Polypes du tube digestif
Le codage des polypes du tube digestif est à distinguer selon les compléments d’information fournis.
On les code comme une tumeur bénigne du segment concerné quand ils sont précisés adénomateux. On utilise alors
les catégories D12 Tumeur bénigne du côlon, du rectum, de l’anus et du canal anal ou D13 Tumeurs bénignes de parties
autres et mal définies de l’appareil digestif.
S’ils sont le siège d’un cancer (polype dégénéré), ils doivent être codés comme des tumeurs malignes du segment
concerné.
Les polypes non tumoraux et ceux dont la nature histologique n’est pas précisée sont décrits par des libellés particuliers
du chapitre XI des maladies de l’appareil digestif. On y trouve en effet :
– les polypes de l’estomac et du duodénum (K31.7) ;
– les polypes du côlon (K63.5) ;
– les polypes du rectum (K62.1) ;
– les polypes de l’anus (K62.0).
ATIH – Consignes de codage

Source : CoCoa 2019 – Version 30 juin 2019

Problème

Pour pouvoir faire la jointure entre ces 2 data frames, il va falloir au préalable nettoyer la colonne Codes CIM-10 de df2 en supprimant les points dans les codes CIM-10

Analyse

Remplacer la colonne actuelle Codes CIM-10 de df2 par une colonne de même nom avec les codes CIM-10 nettoyés (= sans les points)

Donc appliquer à chaque code CIM-10 de la colonne Codes CIM-10 une fonction de nettoyage du point s’il existe

La colonne Codes CIM-10 est de type character

Voyons directement le code correspondant que nous commentons ensuite.

Code

delete_dot <- function(x) str_replace_all(x,"[.]","")

df2 <- df2 %>%
      mutate(`Codes CIM-10` = map_chr(`Codes CIM-10`, delete_dot))

Commentaires du code

Le remplacement d’une colonne par une autre colonne : fonction mutate() de dplyr.
Mise entre du nom de la colonne car le nom comprend un espace vide.

Appliquer une même fonction sur une colonne : une fonction map() du package purrr.
On choisit map_chr() pour retourner directement une colonne chr.

Il est plus lisible de coder la fonction de nettoyage en dehors du map_chr() : c’est la fonction que l’on a appelé delete_dot(). Cela permet aussi de réutiliser librement delete_dot().

Pour le nettoyage, on a choisi de rester dans le tidyverse avec la fonction str_replace_all() du package stringr, plutôt que d’utiliser la fonction R native gsub().

str_replace_all() : tuto simple en français

Pour aller chercher les points dans les codes CIM-10, via le 2eme argument de str_replace_all(), on a codé un REGEX classique [.]. On aurait aussi pu coder \\. pour ce 2eme argument (moins élégant).

Le remplacement du point par rien est codé simplement "" dans le 3eme argument de str_replace_all()

Si le code CIM-10 ne contient pas de point, str_replace_all() ne fait rien car il ne trouve pas de point.

Résultat

On vérifie que la colonne Codes CIM-10 de df2 a bien été modifiée comme voulu.

Codes CIM-10 Explications Sources
M623 Le syndrome d’immobilité est une entité clinique distincte d’origine musculaire, le diagnostic doit être posé par le clinicien. Il ne s’agit pas seulement d’un état d’immobilisation du patient pour des raisons diverses. Agora
Q933 Le syndrome de Wolf-Hirschhorn (SWH) est un trouble du développement avec anomalies faciales caractéristiques, retard de croissance pré- et postnatale, déficit intellectuel, retard psychomoteur sévère, crises d’épilepsie et hypotonie.
Synonyme : Délétion distale 4p
Coder les manifestations en fonction des circonstances
ORPHANET & COCOA
I890 Le volume 3 classe en I89.0 les lymphœdèmes primitifs mais aussi secondaires. C’est bien ce code qui convient pour un
lymphœdème après curage associé au code T81.7
Agora
K317 Polypes du tube digestif
Le codage des polypes du tube digestif est à distinguer selon les compléments d’information fournis.
On les code comme une tumeur bénigne du segment concerné quand ils sont précisés adénomateux. On utilise alors
les catégories D12 Tumeur bénigne du côlon, du rectum, de l’anus et du canal anal ou D13 Tumeurs bénignes de parties
autres et mal définies de l’appareil digestif.
S’ils sont le siège d’un cancer (polype dégénéré), ils doivent être codés comme des tumeurs malignes du segment
concerné.
Les polypes non tumoraux et ceux dont la nature histologique n’est pas précisée sont décrits par des libellés particuliers
du chapitre XI des maladies de l’appareil digestif. On y trouve en effet :
– les polypes de l’estomac et du duodénum (K31.7) ;
– les polypes du côlon (K63.5) ;
– les polypes du rectum (K62.1) ;
– les polypes de l’anus (K62.0).
ATIH – Consignes de codage

On peut maintenant faire la jointure des 2 data frame df1 et df2 via les colonnes DP de Codes CIM-10 qui se correspondent (avec la fonction left_join() par exemple).

Copyright © LesPMSI.com

Les déterminants de la durée du contrôle qualité du codage PMSI MCO (étude CHR Metz-Thionville)

Nous signalons cette étude du CHR Metz-Thionville présentée lors des journées EMOIS 2020 et intitulée « Identification des déterminants de la durée du contrôle qualité du codage PMSI du champ MCO« 

L’étude a été mené sur les RSS 2016 de l’établissement dans un contexte de codage décentralisé où chaque TIM assure le contrôle qualité d’un ou plusieurs pôles.

Les déterminants possibles étaient : le type de contrôle (complet ou partiel), le/la TIM, le rang du RUM classant, le mois de contrôle, la CMD, le niveau de sévérité, la durée du RSS

Principaux résultats : 

# 36% des RSS contrôlés en moins d’1 min, 30% des RSS contrôlés entre 1 et 3 min, 28% des RSS contrôlés entre 3 et 10 min, 5% des RSS contrôlés entre 10 et 20 min et 1% des RSS avec un temps de contrôle > 20 min

# la durée moyenne de contrôle qualité varie fortement selon les pôles (sans surprise) : de 2,6 min / RSS à 10,1 min / RSS.
Cette répartition des temps de contrôle qualité par pôle a permis à l’établissement de répartir plus équitablement les pôles attribués aux TIMs

# le temps nécessaire au contrôle qualité augmente avec la durée du RSS (+ 2,2 min en moyenne si le RSS passe de 4 à 15 jours et + 3,6 min si durée RSS > 15 jours), le niveau de sévérité (+ 1 min si niveau 2 ou 3 et + 2 min si niveau 4) et quand le RUM classant des RSS multi-RUM n’est pas le 1er RUM du RSS

# ce temps du contrôle qualité varie aussi en fonction des CMD.
Exemple : plus long pour les CMD 10 « Affections endocriniennes, métaboliques et nutritionnelles » et 27 « Transplantations d’organes »

Cette étude justifie un constat que nous faisons nôtre depuis de nombreuses années : l’estimation « brutale » d’un temps de contrôle qualité sur la seule base d’un nombre de TIMs / RSS est très généralement fausse. Ces estimations doivent tenir compte de nombreux déterminants, communs à tous les établissements et propres à chaque établissement (niveau et implication des TIMs, outillage, méthodologie).

Nous renvoyons à l’étude pour plus d’informations, en particulier méthodologiques.

Source : étude « Identification des déterminants de la durée du contrôle qualité du codage PMSI du champ MCO » (EMOIS 2020 – Archive C1)

Nombre de métiers RR dans le GN 0127 « Maladies d’Alzheimer et démences apparentées » (étude)

Nous signalons cette étude de l’ATIH présentée dans les journées EMOIS 2020 et intitulée « La diversité des métiers mobilisés pour la RR en SSR : un élément à prendre en compte dans la classification médico-économique ?« 

Dans l’étude, la diversité RR est définie comme le nombre de métiers de RR (Rééducation-Réadaptation) différents mobilisés au cours du séjour.

D’un point de vue PMSI, on peut donc traduire la diversité RR comme le nombre de types d’intervenants différents avec au moins 1 codage CSARR représenté au cours du séjour.

L’étude se fixait 2 hypothèses à vérifier (voir l’étude pour les détails) :

# la diversité RR est-elle un marqueur économique de la lourdeur de prise en charge ?
Résultat : corrélation diversité RR et durée/coût du séjour

# la diversité RR dépend-elle des caractéristiques cliniques du patient ?
Résultat : non confirmée

Pour illustrer la démarche, l’étude détaille ses résultats sur le GN 0127 « Maladies d’Alzheimer et démences apparentées » avec des données exclusives intéressantes :

# nombre moyen de métiers mobilisés / séjour selon le secteur de financement : 5,2 en ex-DAF et 5,4 en ex-OQN

# nombre moyen de métiers mobilisés / séjour selon le type d’UM : 4,8 en UM polyvalent et 5,6 en UM gériatrie

# d’après les professionnels RR : le kiné n’est pas adapté pour ces patients et 5 métiers sont à mobiliser systématiquement : psychomotricien, assistant social, diététicien, (neuro)psychologie, orthophoniste

A comparer avec vos données.

Pour les utilisateurs PMSISoft SSR : la diversité RR par séjour est calculée dans l’écran « Actes CSARR et séjours » dans la colonne « Intervenants » (= nombre d’intervenants différents représentés par au moins 1 codage CSARR dans le séjours). En filtrant sur le GN 0127 et le type de séjour « Séjours terminés », vous pouvez calculer le nombre moyen de métiers mobilisés / séjour en GN 0127.

Source : étude « La diversité des métiers mobilisés pour la RR en SSR : un élément à prendre en compte dans la classification médico-économique ? » (ATIH – EMOIS 2020 – Journée 14 mars 2020 – Archive C3)

Suppression du modulateur C « Réalisation d’une radiographie comparative » au 1er avril 2020

Par décision du 8 janvier 2020 modifiant la décision du 11 mars 2005 de l’Union nationale des caisses d’assurance maladie relative à la liste des actes et prestations pris en charge par l’assurance maladie, le modulateur C « Réalisation d’une radiographie comparative » est supprimée à partir du 1er avril 2020.

28 actes CCAM sont concernés par cette suppression : 

MAQK003 Radiographie de la ceinture scapulaire et/ou de l’épaule selon 1 ou 2 incidences
MAQK001 Radiographie de la ceinture scapulaire et/ou de l’épaule selon 3 ou 4 incidences
MAQK002 Radiographie de la ceinture scapulaire et/ou de l’épaule selon 5 incidences ou plus
MBQK001 Radiographie du bras
MFQK002 Radiographie du coude selon 1 ou 2 incidences
MFQK001 Radiographie du coude selon 3 incidences ou plus
MCQK001 Radiographie de l’avant-bras
MGQK003 Radiographie du poignet selon 1 ou 2 incidences
MGQK001 Radiographie du poignet selon 3 incidences ou plus
MGQK002 Bilan radiographique dynamique du poignet pour entorse non dissociative selon 7 incidences spécifiques
MDQK001 Radiographie de la main ou de doigt
MZQK003 Radiographie de 2 segments du membre supérieur
MZQK004 Radiographie de 3 segments du membre supérieur ou plus
NEQK010 Radiographie de l’articulation coxofémorale selon 1 ou 2 incidences
NEQK035 Radiographie de l’articulation coxofémorale selon 3 incidences
NEQK012 Radiographie de l’articulation coxofémorale selon 4 incidences ou plus
NBQK001 Radiographie de la cuisse
NFQK001 Radiographie unilatérale du genou selon 1 ou 2 incidences
NFQK003 Radiographie du genou selon 3 ou 4 incidences
NFQK004 Radiographie du genou selon 5 incidences ou plus
NCQK001 Radiographie de la jambe
NGQK001 Radiographie de la cheville selon 1 à 3 incidences
NGQK002 Radiographie de la cheville selon 4 incidences ou plus
NDQK001 Radiographie unilatérale du pied selon 1 à 3 incidences
NDQK003 Radiographie du pied selon 4 incidences ou plus
NDQK004 Radiographie du pied selon 4 incidences ou plus, pour étude podométrique
NZQK005 Radiographie de 2 segments du membre inférieur
NZQK006 Radiographie de 3 segments du membre inférieur ou plus

Campagne 2020 de recueil de l’indicateur ISO-ORTHO

L’HAS a sélectionné un indicateur nationale pour la mesure des infections du site opératoire après pose de prothèse totale de hanche ou de genou, l’indicateur ISO-ORTHO « Infections du site opératoire 3 mois après pose de prothèse totale de hanche -hors fracture- ou de genou » qui est calculé automatiquement à partir du PMSI MCO chainé sur l’année n-1.

La 1ère version de l’indicateur restituée le 24 octobre 2018 utilise un algorithme de détection des ISO dans le PMSI dont la valeur prédictive positive est de 87% (Grammatico-Guillon et al. 2014).

Sa 1ère restitution en octobre 2018 a permis d’identifier des faux positifs et des ISO non imputables à la pose de PTH ou de PTG qui ont été transmis par les établissements. A partir de ces retours, et en accord avec les consignes de codage en vigueur, l’algorithme de détection des ISO sur PTH ou PTG a été consolidé. 

La nouvelle version 2020 fait l’objet d’une validation par retour aux dossiers en accord avec la méthode HAS de développement, validation et utilisations des indicateurs de résultats mesurés à partir des bases médico-administratives (Rapport HAS, 2019).

Toutes les informations, modalités, outils et planning du recueil de l’indicateur sont décrits sur cette page dédiée sur site de l’HAS.

Le manuel du logiciel Lotas de détection des séjours concernés décrit en détail l’algorithme PMSI utilisé.

Nous signalons en particulier le document « Consignes d’utilisation des codes CCAM de prothèse de hanche et de genou » (ATIH 2019) qui liste les actes CCAM concernés, avec, pour chacun, l’indication s’il concerne une prothèse totale, partielle, primo implantation ou reprise de prothèse : un thésaurus intéressant à reprendre pour des analyses PMSI.