
DI medicinoje
Medicininių terminų supratimas / Projektas
Šiuolaikinėje sparčiai besikeičiančioje technologinėje aplinkoje dirbtinio intelekto integravimas į sveikatos priežiūros ir verslo dokumentacijas keičia tai, kaip ligoninės valdo duomenis ir efektyviai bendrauja. Šiuo metu vykdome projektą, kurio tikslas - sukurti du su medicina susijusius didžiuosius kalbos modelius.
Vienas modelis bus skirtas bendravimui ir dokumentų analizei, o kitas – medicininei dokumentacijai, naudojant kalbos atpažinimą. Vilniaus universiteto ligoninės Santaros klinikos (VULSK) yra pagrindinė bandymų vieta, teikianti specializuotus garso įrašus modeliams mokyti.
Šis bendradarbiavimas užtikrina, kad LLM modeliai būtų labai tikslūs ir pritaikomi realioje sveikatos priežiūros aplinkoje, sprendžiant neefektyvaus duomenų valdymo problemas ir kartu didinant produktyvumą tiek sveikatos priežiūros, tiek verslo sektoriuose.
Tikslai
Dokumentacijos ir komunikacijos modelis
Skenuos, analizuos ir apibendrins dokumentus, padėdamas įmonėms pagerinti bendravimą ir sprendimų priėmimą.
Sprendimas pasiūlys įžvalgas ir prognozuos finansinius rezultatus pagal dokumentų turinį, padėdamas organizacijoms efektyviau valdyti išteklius.
Medicininės kalbos atpažinimo modelis
Modelis, skirtas medicininiams dokumentams automatizuoti, klausysis gydytojo ir paciento pokalbių, juos transkribuos ir generuos santraukas.
Šis modelis užtikrins medicinos terminologijos fiksavimo tikslumą, sumažins sveikatos priežiūros specialistų rankinio duomenų įvedimo poreikį ir leis jiems daugiau dėmesio skirti pacientų priežiūrai.
Duomenų surinkimas
Pagrindinis šio projekto komponentas yra duomenų rinkimo procesas, kurį atlieka VULSK gydytojai. Medikai renka specializuotus garso įrašus iš realių gydytojų ir pacientų pokalbių, todėl dirbtinio intelekto modelis gali mokytis realios, konkrečiai sričiai būdingos kalbos. Tai labai svarbu siekiant užtikrinti, kad dirbtinis intelektas galėtų tiksliai perteikti medicininės leksikos ir terminologijos niuansus, kurie dažnai labai skiriasi nuo kasdienės kalbos.
Planas
Šiuo metu vyksta duomenų rinkimo etapas - tikimasi, kad VULSK gydytojai duomenų rinkinį surinks per kelis ateinančius mėnesius. Vėliau planuojamas modelio mokymas ir iteracinis testavimas, o preliminarių rezultatų tikimasi sulaukti 2025 m. pirmąjį ketvirtį. Galutinai modeliai bus išbandyti ir patvirtinti realioje sveikatos priežiūros aplinkoje, o jų visiškas įdiegimas numatomas 2026 m. viduryje.
Iššūkiai ir sprendimai
Duomenų sudėtingumas
Vienas iš svarbiausių iššūkių - įvairių duomenų formatų valdymas administracinėje ir sveikatos priežiūros aplinkoje. Tokie dokumentai, kaip sutartys, sąskaitos faktūros ir pranešimai iš įvairių platformų, turi būti tvarkomi tiksliai. Mūsų modelis išmokytas nuskaityti, interpretuoti ir atsakyti į užklausas, susijusias su šiais dokumentais, užtikrinant aukščiausią saugumo lygį, nes visi duomenys saugomi įmonės infrastruktūroje.
Sveikatos priežiūros srityje sudėtinga fiksuoti tikslius gydytojo ir paciento pokalbius ir apdoroti medicininę terminologiją. Mūsų komanda sprendžia šią problemą tobulindama modelio gebėjimą atpažinti medicininius terminus, o bandymuose daugiausia dėmesio skiriama didelio tikslumo išlaikymui net ir tada, kai garso įrašai yra prastesnės kokybės.
Technologinė integracija
Taikydami LLaMA 7b/13b/70b modelius kartu su tokiomis kalbos atpažinimo technologijomis kaip „wav2vec 2.0“, „Whisper“ ir „AssemblyAI“, užtikriname sklandų ir patikimą veikimą įvairiose programose.
Laukiami rezultatai
Tikimasi, kad mūsų modelis iki 50% sutrumpins dokumentų analizei skiriamą laiką ir padidins bendrą našumą, nes automatizuos duomenų išskyrimą ir ataskaitų kūrimą. Aukštas modelio dokumentų kategorizavimo tikslumas (daugiau nei 90%) leis optimizuoti darbo eigą, sumažinti žmogiškąsias klaidas ir greičiau priimti pagrįstus sprendimus. Medicininės dokumentacijos modelis sumažins medicinos personalo administracinį darbą, atlaisvindamas daugiau laiko pacientų priežiūrai. Automatiškai generuodama tikslias medicininių sąveikų santraukas, ši sistema gali perpus sutrumpinti dokumentavimo laiką, pasiekdama iki 95% tikslumą medicininių duomenų transkripcijoje.
Perspektyvos
Vienas iš įdomiausių šio projekto aspektų yra tai, kad jis orientuotas į lietuvių kalbą, kuri turi mažai išteklių, todėl šių dirbtinio intelekto modelių kūrimas yra inovatyvus. Lietuvių kalba, kaip ir daugelis kitų rečiau vartojamų kalbų, neturi didelių duomenų rinkinių ir išsamių kalbos apdorojimo išteklių. Šis projektas ne tik tenkina Lietuvos medikų poreikius, bet ir atveria duris panašioms iniciatyvoms kitose šalyse, kurios susiduria su sunkumais, susijusiais su mažai išteklių turinčiomis kalbomis.
Ilgalaikė projekto vizija - išplėsti šį modelį į kitas mažai išteklių turinčias kalbas, taip didinant sveikatos priežiūros sektoriaus efektyvumą įvairiose šalyse. Klonuodami sistemą skirtingomis kalbomis, siekiame sudaryti sąlygas kitoms sveikatos priežiūros sistemoms priimti panašius sprendimus ir taip pagerinti pacientų priežiūrą bei administracinį efektyvumą.
Klientas
Vilniaus universiteto ligoninė Santaros klinikos
