Kundcase - Named Entity Recognition för medicinska texter
I ett projekt lyckades våra anställda förbättra prestandan för Named Entity Recognition för svenska medicinska texter.
- Klient
- Sahlgrenska Universitetssjukhuset
- År
- Tjänst
- Maskininlärning
Översikt
I den digitala tidsåldern har data blivit en viktig tillgång, men i vårt svenska hälso- och sjukvårdssystem finns en enorm mängd ovärderlig information låst i textform, i patientjournaler. Att omvandla denna ostrukturerade information till användbar data utgör en stor utmaning.
Men där kommer ett projekt in, utfört av två av våra nu anställda, med målet att effektivt extrahera värdefull data från svenska patientjournaler med hjälp av Named Entity Recognition (NER).
I arbetet undersöktes flera olika BERT-modeller och tekniker för dataförstärkning (data augmentation), vilka har potential att avsevärt förbättra resultatet av NER på svenska patientjournaler.
Resultatet visade att dataförstärkningen arsevärt kunde förbättra systemets prestanda, särskilt vid hantering av mindre datamängder. Intressant nog kunde vi också uppnå jämförbara resultat genom att förstärka 50% av träningsdatan som med att använda hela den ursprungliga datamängden utan förstärkning.
Detta projekt visar på hur rätt teknik och metoder kan hjälpa oss att extrahera värdefull information från svenska patientjournaler, vilket kan bidra till en mer upplyst och datastyrd hälso- och sjukvård.
Vad vi gjorde
- Maskininlärning
- Dataförstärkning
- Pytorch
- Python
Det var otroligt givande att få jobba på detta projekt med Sahlgrenska. Inte bara gav det oss chansen att bidra till bättre sjukvård, men vi kunde även utforska och tillämpa nya tekniker för att förbättra prestandan inom textextrahering.

Dataingenjör