Domaine IQSS#

Description Générale#

La HAS développe, avec les professionnels, des Indicateurs de Qualité et de Sécurité des Soins (IQSS), utilisés par les établissements de santé comme outils d’amélioration de la qualité des soins et de la sécurité des patients. Outre l’usage en termes de pilotage interne, ils sont aussi utilisés afin de répondre à l’exigence de transparence portée par les usagers et d’aider à la décision et au pilotage des politiques d’intervention à l’échelon régional et national.

Comme renseigné par le champ source décrit dans la section de Présentation des métadonnées, ces indicateurs sont construits grâce à des données collectées de quatre façons : _ les questionnaires patient correspondant aux enquêtes e-Satis (voir domaine e-Satis) _ les dossiers patient couvrant la majorité des indicateurs _ les questionnaires établissement _ les données tirées du PMSI

Pour construire les indicateurs, plusieurs variables sont nécessaires (par exemple un numérateur et un dénominateur). Par ailleurs, un indicateur peut s’exprimer sous différentes formes : une valeur numérique, un positionnement à l’échelle nationale, une note catégorielle (A/B/C/D), un indice de progression, etc. Le format de ces variables est spécifié en base (champ type_métier, voir les sections correspondantes ci-dessous).

En l’occurrence, le domaine IQSS du projet BQSS correspond aux IQSS obtenus grâce à l’interface Qualhas (plateforme de recueil des indicateurs). Le pipeline correspondant a pour objectif de consolider l’ensemble des données traitées correspondantes dans un fichier suivant le format clé-valeur.

Le schéma de ce domaine est décrit sur cette page.

Constitution du fichier CSV de métadonnées#

La première étape de production du domaine IQSS est la constitution à la main d’un fichier CSV de métadonnées (voir la section de présentation correspondante). Cette section explicite ce processus en s’appuyant sur un exemple : le recueil 2019. Toutefois, les opératoins de production du fichier de métadonnées pour ce recueil en particulier ne s’applique pas forcément à toutes les années (sinon cette étape serait facilement automatisable).

Les métadonnées à consolider proviennent des données du domaine IQSS (voir section correspondante). Ici, il s’agit du fichier de données du recueil 2019 sur le site data.gouv.fr accessible via ce lien.

Sur la page du portail, 8 fichiers sont mis à disposition :

  • 5 fichiers correspondent au domaine e-satis (mention de esatis dans le nom du fichier)

  • 1 fichier correspond à une fiche déscriptive des IQSS

  • 2 fichiers qui servent justement à remplir les métadonnées :

    • resultats-iqss-open-data-2019.csv = les données

    • lexique-iqss-open-data-2019.csv = le lexique des variables

Le fichier contenant les données ne contient aucune information sur le secteur, le theme ou l’acronyme (voir section décrivant ces variables). Pour inférer ces trois champs, il faut utiliser le nom des variables, l’information s’y trouvant. Par exemple, la variable nommée res_ias_icsha_v3_psy dans le fichier d’origine a un nom composé notamment de psy pour son secteur, ias pour son thème, et icsha pour son acronyme. Une fois ces 3 champs complétés, cette variable est renommée resultat_icsha (le nom d’origine est stocké dans le champ ancienne_variable dans le fichier de métadonnées). Cette phase de renommage permet d’harmoniser le nom des variables entre les différentes années.

Une fois cette étape réalisée, la version de cet indicateur est défini. Par défaut, une variable est considérée comme non comparable d’une année sur l’autre, et sa version correspond à l’année de la collecte des données (pour un recueil de l’année N, il s’agit de l’année N-1 ; en l’occurence 2018 dans le cas de la variable res_ias_icsha_v3_psy). Néanmoins, pour une variable donnée, si la campagne de l’année en cours contient une information d’évolution (il y a alors présence de la chaîne de caractère evol dans le nom de la variable, par exemple evol_dpa_tre_had), la version de l’indicateur serait associée à la campagne de l’année précédente (par exemple la variable classe_DPA_dtn_HAD dont l’année est 2018 et le numéro de version est 2017). Par ailleurs, l’année de collecte est conservée dans le champ annee.

Suite à cette étape, le champ code est constitué comme concaténation des champs secteur, theme, acronyme, version et variable suivant le pattern suivant :

{code}_{secteur}_{theme}_{acronyme}_{version}-{variable}

Pour res_ias_icsha_v3_psy, cela donne donc :

PSY_IAS_ICSHA_2018-resultat_icsha

Le champ libelle est renseigné grâce au fichier de lexique (il s’agit ici de lexique-iqss-open-data-2019.csv).

Le champ type est construit sur la base des observations faites des données et permet de préciser le type majoritaire des variables pouvant être : classe, int-string, float, string, int, float-string et nan.

Le champ url_rapport a été complété grâce au site de la HAS, via son moteur de recherche avec des mots clés appropriés comme ca qls rapport pour le rapport iqss_rapport_ca_qls_2019.pdf ou bien ete ortho pour le rapport iqss_rapport_ete_ortho_2019.pdf.

Le champ type_metier (voir la description générale des IQSS)) dénote le type métier de la variable que l’on observe, un indicateur étant composé de plusieurs de ces variables. Le type métier d’une variable est inféré grâce à son nom qui contient le plus souvent cette information. Il existe actuellement les types métiers suivants :

  • classe: si le nom de la variable contient classe, il s’agit d’une classe

  • controle: si le nom de la variable contient controle, il s’agit d’un contrôle

  • denominateur si le nom de la variable contient den, il s’agit d’un dénominateur

  • effectif_cible: si le nom de la variable contient cible, il s’agit d’un effectif cible

  • effectif_observe: si le nom de la variable contient obs, il s’agit d’un effectif cible

  • effective_attendu: si le nom de la variable contient att, il s’agit d’un effectif cible

  • evolution si le nom de la variable contient evol, il s’agit d’une évolution

  • intervalle_bas: si le nom de la variable contient icbas, il s’agit de la borne basse de l’intervalle de confiance

  • intervalle_haut: si le nom de la variable contient ichaut, il s’agit de la borne haute de l’intervalle de confiance

  • obligatoire: si le nom de la variable contient obligatoire, il s’agit d’un recueil obligatoire, 0 ou 1

  • positionnement; si le nom de la variable contient pos, il s’agit d’un positionnement

  • resultat_min: si le nom de la variable contient c1, il s’agit d’un résultat minimum

  • resultat_strict: si le nom de la variable contient c2, il s’agit d’un résultat strict

  • resultat: si la valeur de la variable est la valeur de l’indicateur

  • score: si le nom de la variable contient score, il s’agit d’un score

  • status: Défini pour quelques indicateurs avec les services métiers, 0 ou 1

Si une classe de résultat, souvent créé à partir d’un interval bornant le score de l’indicateur, se trouve être ce qu’on pourrait appeler le résultat final de l’indicateur, on lui attribue le type métier “resultat” (Voir issue #36)

Le champ commentaire est un champ libre permettant à l’opérateur d’annoter les données si besoin de plus de précisions sur la base des observations effectuées.

Acquisition des données#

Les données IQSS sont téléchargées depuis le portail data.gouv.fr, où elles sont regroupées par année (recueil 2014, recueil 2015, recueil 2016, recueil 2017, recueil 2018, recueil 2019 ; les sources sont exhaustivement répertoriées dans le fichier resources/iqss/data_sources.yml). Les fichiers correspondants sont stockés par année de campagne au format CSV dans le dossier data/iqss/raw/.

Pour toutes demandes concernant spécifiquement ces données, s’adresser au producteur : Haute Autorité de Santé - service Évaluation et Outils pour la Qualité et la Sécurité des Soins (EvOQSS). Un formulaire de prise de contact est disponible sur la page correspondante du portail data.gouv.fr.

Traitements et agrégation des données#

Les traitements appliqués aux données se décomposent en 4 étapes décrites dans la présente section.

Nettoyage des données : Plusieurs opérations sont menées sur les données d’origine :

  • Les colonnes des données annuelles ont été renommées grâce au champ code du fichier CSV de métadonnées précédemment constitué afin d’harmoniser les différentes sources.

  • Certaines colonnes n’étant pas des variables d’intérêts, elles furent abandonnées (voir la liste COL_2_DROP dans le fichier bqss/iqss/constants.py).

  • Certains champs ayant des formats mixtes (des valeurs numériques stockées sous forme d’entiers et de chaîne de caractères), une uniformisation de ces derniers est effectuée grâce au champ type du fichier CSV de métadonnées.

Les fichiers résultants sont stockés dans le dossier data/iqss/cleaned par année de collecte.

Agrégation des données : Tous les fichiers de données des différentes années sont fusionnés dans le fichier data/iqss/final/iqss.csv.

Ajout du type de FINESS : Grâce au fichier final du domaine FINESS, une nouvelle colonne est ajoutée au fichier des IQSS agrégé, celle sur le type du FINESS sur le même fichier résultant de l’opération précédente.

Reformatage du fichier final : Le fichier data/iqss/final/iqss.csv est enfin converti au format clé-valeur dans le fichier data/iqss/final/iqss_key_value.csv.

Validation des données#

La validation des données du domaine IQSS est réalisée par la librairie frictionless et le standard Table Schema. Cette validation s’appuie sur un fichier de métadonnées au format JSON et se trouvant dans le dossier schemas/iqss : iqss_key_value.json.

Présentation du fichier CSV de métadonnées#

Le fichier de métadonnées du domaine IQSS est un fichier réalisé à la main (voir section décrivant ce processus). Il contient 13 champs :

  • code : une combinaison de plusieurs colonnes (secteur, theme, acronyme, version, variable) permettant d’avoir une unique modalité de la variable en fonction de sa méthode de calcul.

  • secteur : défini grâce soit au nom de la variable, soit au nom du fichier issu du portail d’Open Data ou soit a été explicité par la HAS. Il en existe 5:

    • MCO : Médecine, Chirurgie, Obstétrique,

    • SSR : Soins de Suite et de Réadaptation,

    • HAD : Hospitalisation A Domicile,

    • PSY : PSYchiatrie,

    • MHS (MCO-HAD-SSR) : secteur créé par la HAS pour les variables calculées de la même façon pour ces 3 secteurs,

    • TCH : correspond à “Tout CHamp”, c’est à dire qui s’applique à tous les secteurs ci-dessus.

  • theme : il en existe plusieurs listés ci-dessous et sont définis de la même façon que le secteur (nom de variable, ou nom de fichier ou choix HAS) :

    • DIA : qualité de la prise en charge des patients hémoDIAlysés chroniques,

    • IDM : prise en charge hospitalière de l’Infarctus Du Myocarde,

    • DPA : qualité de la tenue du Dossier PAatient,

    • AVC : prise en charge initiale de l’Accident Vasculaire Cérébral

    • HPP : prévention et prise en charge de l’Hémorragie du PostPartum immédiat

    • ETEORTHO : Évènements Thrombo-Emboliques sur prothèse en chirurgie ORTHOpédique,

    • IAS : Infections Associées aux Soins

    • ISOORTHO : Infections du Site Opératoire en chirurgie ORTHOpédique,

    • CA : qualité en Chirurgie Ambulatoire,

    • RCP : Réunion de Concertation Pluridisciplinaire en cancérologie,

    • DAN : Dossier d’ANesthésie,

  • acronyme : créé par la HAS, il sont listés ci-dessous et sont définis de la même façon que le secteur et le thème :

    • AAT : Accès A la Transplantation,

    • AQD : Appréciation de la Qualité de la Dialyse,

    • ASE : Agent Stimulant de l’Erythropoïèse,

    • BASI : Bêtabloquant-Antiagrégant plaquettaire-Statine-Inhibiteur de l’enzyme (score agrégé des indicateurs évaluant les prescriptions médicamenteuses),

    • COORD : COORdination de la prise en charge,

    • CPA : Consultation Post-Avc,

    • DEC : Délai d’Envoi du Courrier,

    • DEL1 : DELivrance après un accouchement – niveau 1,

    • DHS : Date et Heure de Survenue des symptômes d’avc,

    • DOC : DOcument de Sortie,

    • DTD : Dépistage des Troubles de la Déglutition,

    • DTN : Dépistage des Troubles Nutritionnels,

    • DTN1 : Dépistage des Troubles Nutritionnels – niveau 1,

    • DTN2 : Dépistage des Troubles Nutritionnels – niveau 2,

    • EAT : Évaluation de l’Accès à la Transplantation,

    • ENV : Expertise NeuroVasculaire,

    • EPR1 : Évaluation par un Professionnel de la Rééducation – niveau 1,

    • ETEORTHO : Évènements Thrombo-Emboliques après pose de prothèse totale de hanche -hors fracture- ou de genou en ORTHOpédique,

    • HYG : règles HYGiéno-diététiques,

    • ICSHA.2 : Indicateur de Consommation des produits Hydro-Alcooliques – niveau 2,

    • ICSHA : Indicateur de Consommation des produits Hydro-Alcooliques,

    • ICSHA.3 : Indicateur de Consommation des produits Hydro-Alcooliques – niveau 3,

    • ISOORTHO : Infections du Site Opératoire en chirurgie orthopédique en ORTHOpédique,

    • MDD : Mesure de la Dose de Dialyse,

    • NUT : suivi NUTritionnel,

    • PCD : évaluation et Prise en Charge de la Douleur,

    • PECIHPPI : Prise En Charge Initiale de l’HPPI,

    • PHO : surveillance du bilan PHOsphocalcique

    • PSH : Prescription Séances et heures Hebdomadaires

    • PSPV : Projet de Soins, Projet de Vie

    • QLS : Qualité de la lettre de Liaison à la Sortie,

    • RCP2 : Pluridisciplinarité de la Concertation – niveau 2

    • SER : surveillance SÉRologique des hépatites,

    • SPH : Suivi des Patients Hémodialysés,

    • SURMIN : SURveillance MINimale,

    • TDA : Tenue du Dossier Anesthésique,

    • TDP : Tenue du Dossier Patient,

    • TRD : TRaçabilité de l’évaluation de la Douleur,

    • TRE : TRaçabilité de l’évaluation du risque d’Escarre,

  • version : correspond à l’année de première collecte de cette variable, permettant ainsi de savoir si une variable est longitudinale (comparable d’une année sur l’autre).

  • variable : calculée par la HAS pour déterminer la qualité d’un établissement. Les variables ont été renommées afin d’harmoniser le nom des ressources. Les noms d’origine sont conservés dans le champ ancienne_variable,

  • libelle : définition des variables. Elles se retrouvent dans les données issues du portail d’Open Data, en particulier dans les lexiques,

  • annee : année de collecte de la donnée (les données sont collectées l’année qui précède l’année de publication d’un recueil),

  • ancienne_variable : correspond à l’ancien nom de la variable se trouvant dans les données issues du portail d’Open Data (nom des colonnes correspondantes),

  • type : type de la variable (classe, int-string, float, string, int, float-string, nan),

  • commentaire : compléments d’information concernant les données sur la base d’observations de l’opérateur,

  • url_rapport : URL du rapport correspond à chaque variable selon l’année de la campagne, du thème et du secteur,

  • type_metier : typologie de la valeur attendue pour la variable, et pouvant être d’au moins 5 types (classe, dénominateur, évolution, positionnement et résultat ; voir la description générale des IQSS). Cette information est parfois manquante.

  • source : provenance de l’IQSS. Les IQSS questionnaire patient sont collectés dans le domaine e-Satis. Les autres collectés dans le présent domaine dit IQSS peuvent être de trois types :

    • IQSS dossier patient

    • IQSS questionnaire établissement

    • IQSS PMSI