Kundcase - Named Entity Recognition för medicinska texter
I ett projekt lyckades våra anställda förbättra prestandan för Named Entity Recognition för svenska medicinska texter.
- Klient
- Sahlgrenska Universitetssjukhuset
- År
- Tjänst
- Maskininlärning
Översikt
I den digitala tidsåldern har data blivit en viktig tillgång, men i vårt svenska hälso- och sjukvårdssystem finns en enorm mängd ovärderlig information låst i textform, i patientjournaler. Att omvandla denna ostrukturerade information till användbar data utgör en stor utmaning.
Men där kommer ett projekt in, utfört av två av våra nu anställda, med målet att effektivt extrahera värdefull data från svenska patientjournaler med hjälp av Named Entity Recognition (NER).
I arbetet undersöktes flera olika BERT-modeller och tekniker för dataförstärkning (data augmentation), vilka har potential att avsevärt förbättra resultatet av NER på svenska patientjournaler.
Resultatet visade att dataförstärkningen arsevärt kunde förbättra systemets prestanda, särskilt vid hantering av mindre datamängder. Intressant nog kunde vi också uppnå jämförbara resultat genom att förstärka 50% av träningsdatan som med att använda hela den ursprungliga datamängden utan förstärkning.
Detta projekt visar på hur rätt teknik och metoder kan hjälpa oss att extrahera värdefull information från svenska patientjournaler, vilket kan bidra till en mer upplyst och datastyrd hälso- och sjukvård.
Vad vi gjorde
- Maskininlärning
- Dataförstärkning
- Pytorch
- Python