6 raisons d’utiliser R en analyse PMSI

Nous travaillons depuis plusieurs années avec R, langage open source de traitement de données et de statistique, pour l’analyse PMSI.

Nous partageons aujourd’hui notre retour d’expérience sur l’utilisation de R pour l’analyse des PMSI.

Raison #1 : R est adapté aux analyses PMSI

Principales caractéristiques de R :
# importation optimisée de fichiers textes structurés
# manipulation très fluide et naturelle de structures de données. R a été conçu spécifiquement pour la manipulation de données.
# toutes les fonctions statistiques et de manipulations de données existent nativement dans R
# de très nombreuses fonctions graphiques et de visualisation de données sont intégrées à R pour produire automatiquement des histogrammes, des courbes, des camemberts, des boîtes à moustache, etc…
# génération de rapports dynamiques
# très rapidement opérationnel.
En quelques heures, un professionnel du PMSI peut réaliser des comptages (nombre de RUM, nombre moyen de RUM par RSS, DMS, …) et quelques requêtes simples (nombre moyen d’actes CCAM par séjour et GHM, ratio de séjours avec un code CIM-10 codé, …)

Or ces caractéristiques sont justement celles recherchées par les équipes DIM :
# travail sur un PC, souvent un portable pour les médecins DIM, sans vouloir ou pouvoir dépendre d’un service informatique
# import et manipulation rapide (en quelques secondes) de fichiers de quelques 100 000 lignes
# réutilisation et personnalisation à volonté de requêtes
# « nettoyage » facile de données (ex : supprimer les GHM représentés par moins de 10 séjours)
# « jeux » avec les filtres et les sélections
# production de graphiques à la volée
# production de case mix
# comparaison de jeux de données période à période ou périmètre à périmètre
# repérage d’atypies avec paramétrage de listes de codes
# appel à des fonctions ou des tests statistiques en ayant l’assurance qu’ils sont corrects
# distinction entre variables quantitatives, qualitatives, catégorielles
# rapprochement avec des référentiels ou des textes non structurés
# génération de rapports d’activité dynamiques reproductibles
# intégration aux EDS, aux études multi-sites

R est par ailleurs très largement utilisé en Santé Publique et en biostatistique depuis de nombreuses années.

Raison #2 : R est mature et pérenne

R existe depuis plus de 20 ans. Sa maturité, sa popularité et sa diffusion s’accroissent d’année en année.

A ce jour, R est couramment utilisé en entreprise, dans les milieux académiques et les organismes publics, en particulier dans le monde hospitalier et de la santé.

R comprend plus de 15 000 packages à ce jour (source), répondant à des besoins de plus en plus pointus.

En janvier 2019, R est classé 12e dans l’index TIOBE qui mesure la popularité des langages de programmation dans le monde.

Raison #3 : R est gratuit et open source

La gratuité de R permet aux équipes DIM de travailler tout de suite en toute liberté, sans dépendre d’un financement qui peut toujours être remis en cause ou d’un éditeur commercial qui bride l’accès aux possibilités d’analyses, sans dépendre d’un nombre de licences.

R est open source. Cela garantit une maîtrise de bout en bout des requêtes et des fonctions : pas de « boîtes noires », pas de « modules supplémentaires payants », aucune limitation dans les développements.

R dispose d’un environnement de développement gratuit, libre, multiplateforme pour R, orienté utilisateur : RStudio qui facilite grandement le développement sous R et la visualisation en direct des résultats, en particulier des graphiques.

Raison #4 : R est très documenté

L’écosystème francophone autour de R est aujourd’hui très développé avec des sites et blogs didactiques, du plus basique pour démarrer aux plus techniques, des forums et des rencontres académiques dans de nombreuses villes (Nantes, Toulouse, Paris, Lyon), un réseau d’experts indépendants.

Pour les professionnels qui comprennent l’anglais basique, la documentation R devient alors quasi-infinie.

Chaque question a sa réponse dans les blogs, sites ou forums

Raison #5 : Les spécialistes et experts du PMSI utilisent R

La quasi-totalité des CHU et CHR utilisent aujourd’hui R.

L’AP-HP développe un logiciel open source R pour le PMSI : pmeasyr (voir notre interview de Guillaume PRESSIAT qui développe et maintient pmeasyr).

La DREES développe depuis 2019 sa visualisation de données en ligne en R

Nous développons PMSISoft, le logiciel d’analyse PMSI le plus pointu à ce jour, en R.

Raison # 6 : R = l’ouverture du PMSI à la data science

Pour les équipes DIM, travailler avec R, c’est aussi participer aux travaux les plus récents en santé publique autour des EDS (Entrepôts De Santé) qui voient le jour dans les principaux CHU (Paris, Grand Ouest, Marseille, Bordeaux, Strasbourg, Lyon) et de l’IA.

C’est s’inscrire dans une démarche de partage et de collaboration valorisant les expertises propres aux PMSI (via, par exemple, le partage de package ad’hoc).

Travailler avec R pour une équipe DIM, c’est travailler de plein pied dans le monde des data scientist, du codage semi-automatisé, de l’avenir de l’analyse des données de santé à laquelle participe le PMSI.

Copyright © Lespmsi.com – Imprimer cet article

Données nationales PMSI SSR par GME et par secteur (mise à jour 2017)

L’ATIH a actualisé, avec les données de coûts 2017, son référentiel de coûts SSR, élaboré à partir d’un échantillon de 71 établissements (ENC SSR), redressé avec les données nationales du PMSI.

L’activité a été reclassée en GME 2019 selon chaque secteur de financement (DAF, OQN).

Pour chaque GME, ce référentiel présente les coûts moyens et détaillés pour les prises en charge correspondantes, calculées à partir des données de l’ENC 2017 mais aussi et surtout, ce qui nous intéresse plus particulièrement ici, des données issues de la base nationale du PMSI SSR (voir l’onglet « Données nationales PMSI » dans les référentiels excel à télécharger en Sources) :

# le nombre de séjours (pour les GME d’HC) et le nombre de journées (pour les GME d’HP)
Intéressant par exemple pour comparer vos ratios niveau 2 / niveau 1 avec la base nationale.
Exemple avec la racine 0841B « Arthroses du genou avec implant articulaire, score phy [9,12] » en DAF :
8 556 séjours en niveau 1 et 1 034 séjours en niveau 2. Le ratio niveau 2 / niveau 1 est donc = à 1 034 / (1 034 + 8 556) x 100 = 10,78%
A comparer avec le ratio dans votre établissement.

# les DMP (Durée Moyenne de Présence) pour les séjours HC
Information très intéressante car non communiquée dans ScanSanté à ce jour.
Pour les utilisateurs PMSISoft : voir colonne « DMP » dans « Case mix GME » en sélectionnant le case mix par GME pour comparer vos DMP par GME avec les DMP nationales

# l’âge moyen
Pour les utilisateurs PMSISoft : voir colonne « Age moyen » dans « Case mix GME » en sélectionnant le case mix par GME pour comparer vos DMP par GME avec les DMP nationales

# le nombre moyen d’actes CCAM
Sous-entendu par séjour classé dans chaque GME

# le score moyen de dépendance physique
Intéressant dans l’absolu, mais à manier avec précaution en fonction des pratiques de codage des dépendances physiques en cours de séjour car on parle ici du score moyen sur le séjour (prenant donc en compte le codage des dépendances physiques de tous les RHS des séjours) et non du score de dépendance physique à l’entrée dans les séjours.

# le score moyen de dépendance cognitive
Mêmes remarques que pour le score moyen de dépendance physique

# le score moyen RR (Rééducation-Réadaptation)
Pour les utilisateurs PMSISoft : ce score RR par séjour (HC) ou par RHS (HP) est calculé automatiquement et disponible dans les écrans « Base des séjours SSR » (colonne « Score RR HC » pour les séjours HC) et « Base des RHS » (colonne « Score RR RHS » pour les RHS HP)

# la part de séjours post-chirurgicaux
= la part des séjours classés dans chaque GME ayant une date d’intervention chirurgicale renseignée

A noter : seuls les GME représentés par au moins 30 séjours ou RHA dans l’échantillon ENC sont documentés. Des GME peu représentés (exemple : 0841C2) ne sont donc pas documentés.

Sources : Référentiel de coûts SSR 2017 DAF (fichier excel) – Référentiel de coûts SSR 2017 OQN (fichier excel) – Référentiel de coûts SSR 2017 (article ATIH)
Copyright © Lespmsi.com – Imprimer cet article

Partenariat innovation à l’AP-HP : utilisation de l’intelligence artificielle pour le codage des diagnostics de séjours des courts séjours MCO

L’AP-HP engage en septembre 2019 un partenariat d’innovation (= une forme spécifique de marché public ayant pour objectif d’encourager la passation de marchés publics à visée innovante et de développer des collaborations encadrées entre les acheteurs publics et des opérateurs économiques sur des projets à construire) pour avancer vers l’automatisation du codage des diagnostics de séjours courts (zéro, une ou deux nuits, hors séances) de MCO à partir des documents médicaux produits par les professionnels à l’occasion de ces séjours.

Il s’agit de réduire le travail de codage de ces séjours « simples » et ainsi de libérer des ressources humaines qui pourront notamment se concentrer sur les séjours longs au codage plus complexe.

L’amélioration de la qualité globale des données du PMSI pourra ainsi bénéficier à la recherche biomédicale et au pilotage des organisations de soins.

Au niveau de l’AP-HP, cette démarche concerne 600 000 séjours (en 2018), soit 43% de l’activité séjours de l’institution.

Pour l’AP-HP, il s’agit d’une véritable démarche de recherche et développement, car les produits informatiques existant actuellement ne sont pas encore adaptés à l’objectif de qualité du codage de ces séjours.

Ce projet est à horizon 2022-2023.

Source : Communiqué de presse de l’AP-HP
Copyright © Lespmsi.com – Imprimer cet article

Liste des actes CCAM spécifiques psy

La version 2019 d’OVALIDE PSY modifie le tableau [1.D.2.CCAM : Liste des actes CCAM] qui donne, pour chaque acte CCAM codé dans les séjours psy en temps plein ou partiel, son nombre d’occurences et le nombre de séjours concernés en subdivisant dorénavant les résultats en 2 tableaux : 

tableau A : tableau dédié aux seuls actes CCAM appelés actes spécifiques psy.
Ces actes spécifiques psy correspondent à une liste de 8 actes CCAM :
ALQP002 – Test d’évaluation de l’efficience intellectuelle de l’enfant
ALQP003 – Test d’évaluation d’une dépression
ALQP004 – Test d’évaluation des aspects psychopathologiques de la personnalité
ALQP005 – Test d’évaluation de l’efficience intellectuelle de l’adulte
ALQP006 – Test d’évaluation d’un déficit cognitif
ZFQP002 – Test d’évaluation et de catégorisation des déficiences, incapacités et désavantages sociaux
ZFQP003 – Test d’évaluation de la qualité de vie
AZRP001 – Séance d’électroconvulsivothérapie [sismothérapie]

tableau B : tableau dédié à tous les autres actes CCAM

Source : Ovalide PSY DGF 2019
Copyright © Lespmsi.com – Imprimer cet article

NABM V55 – Mise à jour NABM au 12 septembre 2019

Cette nouvelle NABM, diffusée le 12 septembre 2019 :

# supprime 9 actes au 21/09/19
54 – CONGELATION D’EMBRYONS ( PAR CYCLE)
63 – DECONGELATION D’EMBRYON (PAR CYCLE) + CATHETER
1715 – INFECTION A EBV ANCIENNE : SD : AC VCA IGG ET AC EBNA PAR IFI
1716 – INFECTION A EBV ANCIENNE : SD : AC VCA IGG ET AC EBNA PAR EIA
1717 – INFECTION A EBV RECENTE OU EVOLUTIVE : SD : AC VCA IGM OU AC EA IGM PAR IFI
1718 – INFECTION A EBV RECENTE OU EVOLUTIVE : SD : AC VCA IGM OU AC EA PAR EIA
1719 – INFECTION A EBV : SD : AC EA IGA OU AC VCA IGA
593 – SANG : UREE ET CREATININE
4005 – DPN : TRISOMIE 21 FOETALE : DEPISTAGE SEQUENTIEL INTEGRE AU 2E TRIMESTRE

# créé 15 nouveaux actes avec date d’effet au 19/09/19
9929 – COMPLEMENT A LA COTATION MINIMALE DE VALEUR B 16 (SANG)
9927 – COMPLEMENT A LA COTATION MINIMALE DE VALEUR B 17(SANG)
9928 – COMPLEMENT A LA COTATION MINIMALE DE VALEUR B 18 (SANG)
82 – VITRIFICATION D’EMBRYON(S)
83 – RECHAUFFEMENT D’EMBRYON(S)
84 – VITRIFICATION D’OVOCYTE(S)
85 – RECHAUFFEMENT D’EMBRYON(S)
86 – CRYOCONSERVATION DES OVOCYTE(S )
500 – DEPISTAGE D’UN DEFICIT EN DIHYDROPYRIMIDINE DESHYDROGENASE (DPD )
5302 – C. TRACHOMATIS ET/OU N. GONORRHOEAE: AMPLIFCATION GENIQUE – 2 SITES
5303 – C. TRACHOMATIS ET/OU N. GONORRHOEAE: AMPLIFCATION GENIQUE – 3 SITES
1033 – C DIFFICILE _DIAGNOSTIC D’UNE INFECTION
1008 – EBV-CHARGE VIRALE
1009 – EBV- SEROLOGIE SPECIFIQUE
1010 – EBV- RECHERCHE DU STATUT IMMUNITAIRE

Sources : NABM V055 (12 septembre 2019) – fichier Excelfichier texte