cubr-link : un appariement réussi entre le registre des AVC de Brest et le SNDS

Nous sommes fiers de vous annoncer la réussite d’un projet d’appariement mené par l’équipe de recherche REPERES avec l’outil cubr-link.

Porté par le CHU de Brest et Santé Publique France, ce projet d’appariement a permis à l’équipe REPERES de chaîner le registre des AVC de Brest avec le Système National des Données de Santé (SNDS) et va permettre la réalisation d’un programme d’études.

Techniquement, cubr-link a permis de trouver près de 3800 patients du registre parmi une extraction SNDS de plus de 500 000 personnes. Le taux d’appariement obtenu est de plus de 95%. A titre de comparaison, un appariement réalisé avec une approche déterministe simple n’aurait permis d’atteindre que 77% d’appariement avec les mêmes variables de chaînage. Cette différence de 18% d’appariement en faveur de cubr-link s’explique par sa capacité  à explorer un espace de recherche bien plus important qu’une approche plus conventionnelle.

Outre l’obtention d’un taux d’appariement élevé, cubr-link a permis de valider la bonne qualité des résultats grâce à de nouvelles métriques qualitatives (robustesse, cartographie, …) introduites par l’algorithme combinatoire. Impossibles à produire par d’autres approches, ces métriques permettent à l’expert d’exploiter pleinement et simplement sa connaissance des données pour apporter un regard critique sur les résultats . Elles apportent ainsi un moyen complémentaire et innovant pour valider les résultats d’un projet d’appariement. A titre d’exemple pour le chaînage du registre des AVC de Brest avec le SNDS, la robustesse globale est supérieure à 2 ce qui est un gage de confiance dans le résultat.

La performance est aussi au rendez-vous: l’algorithme met moins de 1 seconde pour réaliser l’appariement.

Cette conjonction entre un fort taux d’appariement et des métriques qualitatives de bon niveau marque donc la réussite de ce projet. Au final, cette réussite est un bon exemple de l’adéquation atteinte entre l’expertise métier de l’équipe REPERES et les performances de l’algorithme combinatoire proposé par cubr-link.

N’hésitez pas à aller voir la vidéo montrant cubr-link en action avec toutes les étapes d’un appariement entre un registre de 30,000 patients et une extraction du SNDS de 3,000,000 patients.


cubr et le SNDS

Le Système National des Données de Santé (SNDS) est une base de données médico-administratives pseudonymisées couvrant la quasi totalité de la population française. Elle contient les informations de remboursements des assurés sociaux en médecine de ville et hospitalière. Le SNDS est devenu depuis quelques années un formidable outil pour la recherche et permet de mener des études de santé publique.

cubr propose aujourd’hui un module permettant de manipuler les données du SNDS beaucoup plus simplement que dans leur format d’origine. Une fois intégrées dans la suite logicielle cubr, il devient facile même pour un utilisateur non expert d’utiliser ces données, aussi bien pour mener des travaux statistiques que pour explorer visuellement et interactivement l’information.

Exemple de données du SNDS dans différents modes de visualisation. Les données représentées ici sont synthétiques. Initialement dans le format natif du SNDS, elles ont été importées dans un cube de données propre à cubr permettant une visualisation interactive et ce même pour de gros volumes de données.

Le SNDS ne comportant que des données de remboursement, il peut être extrèmement intéressant de le rapprocher de bases de données de santé (registres, cohortes, …) afin d’obtenir une base résultante bien plus riche que ses simples parties.
cubr-link est un outil permettant de réaliser facilement et rapidement l’appariement de deux bases de données. Via le module de gestion des données du SNDS, il devient donc possible pour cubr-link d’apparier des bases de données de santé avec le SNDS avec une qualité de résultat remarquable.

Vous pouvez aussi garder vos habitudes et continuer d’utiliser vos langages de prédilection (R, python, …) pour manipuler le cube contenant les données du SNDS, ou bien décider d’intégrer les capacités du cube dans vos propres développements (java, c++, …)

Au final, cette capacité d’intégration simple des données du SNDS est une caractéristique unique de la suite logicielle cubr. Elle vous permettra d’utiliser ces données de façon nouvelle et complémentaire à vos habitudes de travail et permettra même au non experts d’explorer l’information simplement.

cubr-link disponible en version 1.0

La version 1.0 de l’outil de chaînage de bases de données de cubr vient de sortir.

Il apporte qualité, rapidité et simplicité pour vos projets de chaînage.

Cette version introduit en natif un module prenant en charge les données du Système National de Données de Santé (SNDS).

Pour en savoir plus, vous pouvez consulter le descriptif de l’outil ainsi qu’un aperçu de l’algorithme de chaînage innovant développé par cubr.

Vous pouvez aussi voir la vidéo montrant cubr-link à l’oeuvre.

cubr-link: le chaînage revisité