Data pathologies : De la datavisualisation pour lire les données de santé agrégées

Data pathologies : De la datavisualisation pour lire les données de santé agrégées

Le 20 juin dernier, l’Assurance Maladie a déployé une plateforme gratuite et accessible à tous pour visualiser les données de dépenses de santé des Français.

Diabète, cancer du poumon ou encore maladie de Parkinson, Data pathologies se concentre sur une cinquantaine de pathologies dans sa forme actuelle, sur la base des 1,5 milliard de factures qui entrent dans le système chaque année sur le territoire national.

Toutes les donnée traitées sont restituées sous la forme d’infographies interactives. Exit les tableaux Excel difficiles à lire : l’ambition de Data pathologies est de toucher un large public, comme les acteurs du systèmes de santé, les journalistes ainsi que les associations de patients et assurés.

Les chercheurs ne font pas partie du coeur de cible, précise Damien Vergé, directeur de la stratégie, des études et des statistiques (DSES) à la CNAM, à ZDNet. Mais ils peuvent tout de même s’y référer, en vertu du principe même de l’open data. Le département que Damien Vergé dirige oeuvre notamment pour le partage des données de santé à des fins de recherche en même temps qu’il se concentre sur les enjeux de l’open data, dont Data pathologies est « le dernier fleuron » à date.

publicité

Données agrégées et intraçables

Les données intégrées à Data pathologies proviennent de la cartographie médicalisée des dépenses et des pathologies que l’Assurance Maladie met à jour tous les ans depuis 2015. Ce travail d’analyse s’appuie lui-même sur les données issues du système national des données de santé (SNDS).

Un certain nombre de paramètres peuvent être affinés sur Data pathologies pour faire apparaître des résultats par région ou encore par tranche d’âge. 

Les données rassemblées sur la plateforme sont intraçables, assure Damien Vergé. « Tout part des données de facturation. Toutes les informations reçues sont d’abord pseudonymisées et le numéro de sécurité sociale est chiffré trois fois de manière irréversible. Ce sont les données agrégées qui sont restituées. Ainsi, aucune identification n’est possible à partir de ces données agrégées. Sous une dizaine d’individus, les données n’apparaissent pas. »

“Valoriser autrement notre patrimoine en open data”

Les dernières données actualisées dans Data pathologies remontent à 2020. Ce décalage s’explique par le temps nécessaire pour classer, croiser et analyser le volume gigantesque de données produites chaque année. 

Des analyses à l’aide d’algorithmes sont menées pour classer les pathologies et les dépenses liées à ces pathologies. Les algorithmes utilisés sont documentés dans la page de méthodologie de Data pathologies. « Nous sommes dans une démarche d’améliorations permanentes. Tous les ans, nous réévaluons ces algorithmes » souligne le responsable.

La démarche open data de l’Assurance Maladie n’est pas nouvelle. « Beaucoup de données sont déjà disponibles depuis l’espace Etudes et Données d’ameli.fr. On y trouve énormément d’informations sur les dépenses et les pathologies. Mais ces données sont partagées sous forme de tableaux Excel, ce qui n’est pas du tout commende pour un public non expert” note Damien Vergé.

L’Assurance Maladie a réalisé une première expérience de datavisualisation autour des données de santé pour suivre la vaccination contre le Covid-19, Data vaccin Covid. « Cette expérience nous a donné envie de valoriser autrement notre patrimoine en open data » dit Damien Vergé. « Il y a une vraie différence entre mettre des données sous forme de PDF figé et réaliser une présentation interactive. La réception n’est pas la même ».

Des évolutions au fil des retours d’expérience

Six mois ont été nécessaires pour bâtir Data pathologies. L’Assurance Maladie a travaillé avec Opendatasoft, une entreprise française qui propose un logiciel de partage de données, pour assurer le développement de son outil. L’agence de datavisualisation WeDoData a également été mise à contribution dans ce chantier pour « affiner le web design du site » précise Damien Vergé.

Le projet a mobilisé une dizaine de personnes du côté de la Cnam. L’Assurance Maladie a réalisé un certain nombre de démonstrations aux agences régionales de santé pour qu’elles s’approprient la plateforme.

Si les premiers retours sont « extrêmement positifs » pour l’heure, commente le directeur, il est encore tôt pour juger de la portée de la plateforme. Des évolutions de la plateformes ne sont pas à exclure pour améliorer l’outil, évoque le directeur.

Leave a Reply

Your email address will not be published. Required fields are marked *