Unlocking the Potential of Electronic Health Records With Danish Clinical Language Models for Text Mining

Bidragets oversatte titel: Frigørelse af potentialet for Elektroniske Patientjournaler med Danske Kliniske Sprogmodeller til Tekstmining

Jannik Skyttegaard Pedersen

Publikation: AfhandlingPh.d.-afhandling

158 Downloads (Pure)

Abstract

Denne afhandling fokuserer på udvikling af sprogteknologi til udtræk af klinisk information fra danske elektroniske patientjournaler. Elektroniske patientjournaler indeholder vigtig sundhedsrelateret information, som kan bruges til at guide behandlingen af patienter. En stor del af informationen i patientjournalen er dog beskrevet i ustruktureret tekst, hvilket gør det vanskeligt og tidskrævende at udtrække relevante detaljer, især i akutte situationer. Som følge heraf kan vigtig information gå tabt, hvilket kan øge risikoen for fejldiagnosticering og forringede behandlingsresultater.

Det nylige paradigmeskifte inden for natural language processing, drevet af self-supervised neurale netværk og transformerarkitekturen, har produceret automatiske tekstbehandlingsværktøjer med hidtil uset præcision. Disse værktøjer kan bruges til at udtrække og strukturere informationen fra den ustrukturerede tekst i den elektroniske patientjournal automatisk. Forskning indenfor sprogteknologi er dog mest blevet udforsket for ressourcestærke sprog såsom engelsk, mens udviklingen indenfor dansk sprogteknologi har været mere stillestående, især for specialiserede domæner såsom det kliniske.

Denne afhandling undersøger potentialet for sprogteknologi til automatisk at udtrække information fra den ustrukturerede del af den elektroniske patientjournal. Derudover beskriver afhandlingen vigtigheden af at udvikle sproglige ressourcer specifikt til det danske kliniske domæne, da det kan bruges til at forbedre behandlingen af patienter samt give nye kliniske forskningsuligheder.

Afhandlingen beskriver udviklingen af to danske præ-trænede sprogmodeller, som viser forbedret præcision sammenlignet med eksisterende danske sprogmodeller. Desuden udforskes det hvordan data curation kan påvirke bias i kliniske sprogmodeller. Afhandlingen undersøger også, hvordan sprogmodeller kan bruges til at udtrække information omkring blødning fra danske elektroniske patientjournaler, og evaluerer lægers evne til at udtrække relevante informationer med blødningsalgoritmen som hjælpeværktøj. Dernæst præsenterer afhandlingen en præ-trænet sprogmodel, som kan bruges til at udtrække kliniske informationer såsom sygdomme, symptomer og behandlinger i den ustrukturerede tekst i danske elektroniske patientjournaler.
Bidragets oversatte titelFrigørelse af potentialet for Elektroniske Patientjournaler med Danske Kliniske Sprogmodeller til Tekstmining
OriginalsprogEngelsk
Bevilgende institution
  • Syddansk Universitet
Vejledere/rådgivere
  • Savarimuthu, Thiusius R., Hovedvejleder
  • Vinholt, Pernille Just, Bivejleder
Udgiver
DOI
StatusUdgivet - 2. nov. 2023

Note vedr. afhandling

Den fulde afhandling kan læses på SDUs bibliotek.

Fingeraftryk

Dyk ned i forskningsemnerne om 'Frigørelse af potentialet for Elektroniske Patientjournaler med Danske Kliniske Sprogmodeller til Tekstmining'. Sammen danner de et unikt fingeraftryk.

Citationsformater