Improve text-search without using extension of DocumentReference #97

MiskoG · 2021-05-25T12:10:41Z

Contexte

La recherche textuelle dans Cohort a été implémentée d'une façon particulière sur notre environnement démo, qui n'est pas reproductible dans un environnement réel à l'hôpital.

À Toulouse, le contenu texte des documents est stocké dans une ressource FHIR.
L'objectif de cette issue est d'adapter Cohort pour être capable de faire une recherche textuelle dans les documents, via ce champ FHIR.

À ma connaissance on trouve cette recherche à 2 endroits dans Cohort

(1) Dans le mode "création de cohorte" via le critère "documents cliniques"
(2) Dans la home via la barre de recherche (recherche sans création de cohorte)

PS : se pose aussi la question de l'aperçu des documents cliniques, peut-être à gérer dans un 2ème temps dans une autre issue.

MiskoG · 2021-06-04T14:31:34Z

@elsiehoffet-94 Tu peux nous préciser dans quelle ressource FHIR et quel attribut est stocké le texte des documents ?
Merci d'avance 🙂

elsiehoffet-94 · 2021-06-04T14:48:48Z

Il y a deux manières de faire (on n'a pas encore convergé là dessus) :
@nriss pour l'extension de DocumentReference
@Peltier10 pour la ressource Composition

MiskoG · 2021-06-04T14:52:29Z

Top on attend vos précisions 👍 Idéalement je dirais que Cohort ne devrait lire cette info qu'à un seul endroit (qui sera précisé dans l'Implementation Guide de Cohort). What do you think ?

elsiehoffet-94 · 2021-06-04T15:03:24Z

Je pense que ça dépend de comment on gère les documents dans les centres, qui peut varier, au moins au début :

soit on reconstitue les CR en FHIR et on les stock dans la DB -> Composition
soit on fait référence au texte qui est dans des documents auxquels on fait référence, et qui sont stockés/gérés par une autre instance -> DocumentReference

Mais la discussion est ouverte :)

nriss · 2021-06-07T15:00:51Z

Quand on regarde la doc fhir sur les documents, il est précisé que : Note that FHIR defines both this document format and a document reference resource. FHIR documents are for documents that are authored and assembled in FHIR, while the document reference resource is for general references to pre-existing documents.

Dans ma compréhension, la ressource Composition est un peu la nouvelle version du CDA : tu prends un bundle de ressources FHIR définies à l'avance, et tu génères à partir de celles ci une Composition (en gros, à partir d'éléments référencés dans ces ressources FHIR, un document textuel sera généré avec les résultats attendus).

A Composition is the basic structure from which FHIR Documents - immutable bundles with attested narrative - are built. A single logical composition may be associated with a series of derived documents, each of which is a frozen copy of the composition.

Dans le cas d'un document préexistant (qu'il s'agisse d'un pdf, d'un compte rendu orbis ou d'un fichier word...), la ressource adaptée selon moi est DocumentReference, qui permet de décrire un document généré ailleurs:

A reference to a document of any kind for any purpose. Provides metadata about the document so that the document can be discovered and managed. The scope of a document is any seralized object with a mime-type, so includes formal patient centric documents (CDA), cliical notes, scanned paper, and non-patient specific documents like policy text.

ou encore

FHIR defines both a document format and this document reference. FHIR documents are for documents that are authored and assembled in FHIR. This resource is mainly intended for general references to assembled documents.

Le pipe à faire selon moi est:

Si on arrive à fetch le pdf grâce à nos services, on l'affiche dans cohort360.
Si on y arrive pas ou si l'attribut reference n'est pas défini, on affiche le contenu textuel du document présent dans l'extension

elsiehoffet-94 · 2021-06-08T16:12:40Z

Merci pour ces clarifications !
Désolée mais quelques choses me chiffonnent encore:

Pourquoi est-ce qu'on est obligés de stocker le texte du compte rendu dans une extension? Ca m'étonne vachement que ça soit pas anticipé dans le modèle FHIR. J'ai pas encore creusé Zulip sur ce sujet, ça pourrait être une bonne source de connaissance
En quoi les CR orbis qu'on reconstitue diffèrent d'un CDA ? Ils ont toute la métadonnée nécessaire il me semble.
L'utilisation d'un DocRef ici me perturbe parce qu'on ne fait référence à aucun document extérieur dans ces ressources créées

nriss · 2021-06-09T09:55:13Z

Je suis d'accord avec toi, c'est assez étonnant, il y a Attachment.data qui permet de stocker le document mais c'est du base64Binary et non un string comme on l'aurait souhaité
Je suis d'accord, et selon la doc fhir les CDA (hl7 v3) doivent se stocker dans des ressources DocumentReference:
NOTE: While FHIR can be used to create documents using the Composition Resource, FHIR can also be used to exchange traditional CDA R2 documents making use of the DocumentReference resource, and handling the CDA document itself as a binary attachment (as XDS does). http://hl7.org/fhir/comparison-cda.html
Je vois ça comme une référence vers le document présent dans orbis pour ma part

elsiehoffet-94 · 2021-06-10T14:33:59Z

Je suis d'accord avec toi, c'est assez étonnant, il y a Attachment.data qui permet de stocker le document mais c'est du base64Binary et non un string comme on l'aurait souhaité

En discutant avec @Jasopaum, base64Binary c'est l'encodage source à partir duquel on peut décoder en utf-8, ascii, et n'importe quel format de strings. Ca me semble donc pas incohérent de stocker des gros blocs de texte dans un autre format que des strings, je pense pas que ça devrait être un contre-argument. C'est ensuite aux réutilisateurs de données de la transformer dans le format voulu.

Je suis d'accord, et selon la doc fhir les CDA (hl7 v3) doivent se stocker dans des ressources DocumentReference: [...]
handling the CDA document itself as a binary attachment (as XDS does)

Merci pour cette précision! On peut mettre le contenu du CR dans DocumentReference.attachement.data alors (aussi de type base64Binary), t'en penses quoi?

nriss · 2021-06-10T14:44:58Z

On a totalement convergé 👌

elsiehoffet-94 · 2021-06-10T15:05:47Z

Ok! @MiskoG on part sur un stockage du contenu des CRs dans DocumentReference.attachement.data alors. J'ai fait une issue sur river, on peut avancer sur cohort en parallèle :)

MiskoG · 2021-06-11T08:04:53Z

Ok top, merci pour le résumé et les précisions 🙂

But de cette issue

Adapter dans Cohort360 la recherche textuelle dans les documents.
Pour cela, il faudra désormais chercher dans la ressource FHIR DocumentReference, au niveau de attachement.data.
À voir si HAPI propose une recherche déjà native sur cet attribut ?

MiskoG · 2021-06-11T08:06:37Z

Feature côté River pour alimenter DocumentReference.attachment.data
arkhn/fhir-river#422

nriss · 2021-06-11T08:13:39Z

A priori, pas de SearchParam qui permet de chercher dans attachment.data en FHIR, il y a par contre le paramètre _content qui permet de chercher dans l'ensemble de la ressource

Ca serait intéressant d'investiguer les Operations et voir si on peut créer des opérations custom avec HAPI pour ce genre de cas d'usage avec un besoin de logique

simonvadee · 2021-06-14T17:15:39Z

Merci pour la description détaillée du problème, voici l'issue associée sur jpaltime: arkhn/jpaltime#20

MiskoG added the demo Will be shown in a short coming demo label May 25, 2021

MiskoG changed the title ~~Pouvoir faire de la recherche textuelle "dans la vraie vie" sur un champ FHIR~~ Adapter la recherche textuelle dans les documents Jun 4, 2021

MiskoG self-assigned this Jun 4, 2021

MiskoG removed their assignment Jun 11, 2021

simonvadee mentioned this issue Jun 14, 2021

Improve modelization and text-search of DocumentReference text content arkhn/jpaltime#20

Closed

MiskoG assigned simonvadee Jun 21, 2021

MiskoG changed the title ~~Adapter la recherche textuelle dans les documents~~ Improve text-search without using extension of DocumentReference Jun 25, 2021

MiskoG added enhancement New feature or request and removed demo Will be shown in a short coming demo labels Jun 25, 2021

MiskoG closed this as completed Mar 30, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve text-search without using extension of DocumentReference #97

Improve text-search without using extension of DocumentReference #97

MiskoG commented May 25, 2021 •

edited

Loading

MiskoG commented Jun 4, 2021

elsiehoffet-94 commented Jun 4, 2021

MiskoG commented Jun 4, 2021

elsiehoffet-94 commented Jun 4, 2021

nriss commented Jun 7, 2021 •

edited

Loading

elsiehoffet-94 commented Jun 8, 2021

nriss commented Jun 9, 2021

elsiehoffet-94 commented Jun 10, 2021 •

edited

Loading

nriss commented Jun 10, 2021

elsiehoffet-94 commented Jun 10, 2021

MiskoG commented Jun 11, 2021

MiskoG commented Jun 11, 2021

nriss commented Jun 11, 2021 •

edited

Loading

simonvadee commented Jun 14, 2021

Improve text-search without using extension of DocumentReference #97

Improve text-search without using extension of DocumentReference #97

Comments

MiskoG commented May 25, 2021 • edited Loading

Contexte

MiskoG commented Jun 4, 2021

elsiehoffet-94 commented Jun 4, 2021

MiskoG commented Jun 4, 2021

elsiehoffet-94 commented Jun 4, 2021

nriss commented Jun 7, 2021 • edited Loading

elsiehoffet-94 commented Jun 8, 2021

nriss commented Jun 9, 2021

elsiehoffet-94 commented Jun 10, 2021 • edited Loading

nriss commented Jun 10, 2021

elsiehoffet-94 commented Jun 10, 2021

MiskoG commented Jun 11, 2021

But de cette issue

MiskoG commented Jun 11, 2021

nriss commented Jun 11, 2021 • edited Loading

simonvadee commented Jun 14, 2021

MiskoG commented May 25, 2021 •

edited

Loading

nriss commented Jun 7, 2021 •

edited

Loading

elsiehoffet-94 commented Jun 10, 2021 •

edited

Loading

nriss commented Jun 11, 2021 •

edited

Loading