Kedvezményezett neve: Spicy Analytics Kft.
Projekt címe: Betegút szegmentálás mély neurális hálózattal
Projektazonosító: GINOP-2.1.2-8-1-4-16-2017-00304
A projekt az Európai Regionális Fejlesztési Alap társfinanszírozásával valósult meg.
Támogatási összeg: 88.000.000 Ft
Visszatérítendő hitel összeg: 56.000.000 Ft
Támogatási mérték: 55%
Visszatérítendő hitel mérték: 35%
Projekt tényleges befejezésének dátuma: 2019.12.31.
Projekt tartalma:
Célunk egy olyan gépi tanuláson alapuló módszer kidolgozása, amellyel szegmentálhatóvá válnak a tipikus
betegutak, amelyek alapvető, kiindulási módszertana a legtöbb orvostudományi és egészségtudományi
elemzésnek/vizsgálatnak. A betegút alapján láthatóvá válik az, hogy egy-egy betegség kapcsán mely
betegek milyen kórtörténettel érkeznek meg addig, hogy megkapják az adott diagnózist, illetve hogy a
diagnózist követően, milyen kezelést kaptak, és annak mi volt a kimenete. Ezen belül az alapvető feladat,
hogy az előtörténet alapján homogén csoportokat találjunk tanuló algoritmusokkal, továbbá, hogy a
kezelést követően szintén hasonló betegcsoportokat azonosítsunk. Az általunk kidolgozott módszertannal a
felhasználónak lehetősége nyílik arra, hogy az idő és költségigényes adatelőkészítés helyett, amelyhez sok
esetben külső szakemberre (statisztikusra, adatbányászra stb.) van szükség, A rendszer maga egy
felhőalapú szolgáltatás, amelyben a felhasználó fel tudja tölteni saját strukturált adatbázisát, és amelyen le
tudja futtatni az általunk kidolgozott algoritmusokat, amellyel feltérképezhetőek a tipikus és atipikus beteg
utak, betegcsoportok.
A rendszer előnye, hogy alapvetően olyan adatokra illeszkedik, amelyek a mai megszokott klinikai
gyakorlatban keletkeztek (real world data), alapvetően nem kutatásra készítettek, így az ezekben való
keresés, betegcsoportok szegmentálása jóval nagyobb kihívás. Ezek az egészségügyi adatok igen széles
körben használtak, ismertek, ugyanakkor napjainkban sem teljes mértékig kihasználtak „Big data” jellege
(tartalmaz adathibát: elgépelés, a valóságnak nem megfelelő adat, hiányosságok, nincs információ,
inkonzisztencia) és komplexitása miatt. A betegellátás során keletkezett nagy mennyiségű adatok olyan
lehetőséget hordoznak magukban, amelyekkel megoldhatóvá válnak az adatvezérelt elemzések az orvosi és
az egészségügyi funkciók széles körének támogatására. Ezzel egy időben az egészségügyi ágazat is gyorsan
fejlődik. Az átalakulás élvonalába azok tartoznak, akik a nagy mennyiségű adathalmazt, mint óriási
lehetőséget látják, amelyet a betegellátásban a betegek kimeneteleinek javítása érdekében használják fel,
nem utolsó sorban az egészségügyi költségek csökkentése mellett. Egyértelműen belátható, hogy az
egészségügyben keletkező nagy mennyiségű adatbázisban emberi erőforrással már egyre nehezebben
tárható fel az az információ, amely gépi tanulással kiaknázható.
A SAMI gépi tanuló algoritmusokkal automatikusan szegmentálja a hasonló betegcsoportokat, azok
betegségi és ellátási jellemzőik, továbbá a betege fizikai jellemzőik alapján. Az automatikus módszer
előnye, hogy objektív, megismételhető, illetve a jövőben nem szükséges emberi beavatkozás. Az egyes
homogén csoportok kialakításához mély neurális hálózatokat kívánunk használni, például Auto-encoder
Based Data Clustering. Ezek az algoritmusok bizonyítottan jobb eredményt érnek el a klaszterezési
feladatokban, mint a korábbi algoritmusok, mint például a k-means.
A historikus adatok kiváló lehetőséget adnak annak elemzésére, hogy az egyes kezeléseknek,
gyógyszereknek milyen hatása van a betegekre nézve. A betegség megelőzése és a betegellátási rendszer
működésének optimalizálása nagyban hozzájárul a betegellátás minőségének javulásához, ezen keresztül
pedig csökkenteni lehet a ráfordított költséget. A rendszerrel automatikusan azonosított betegcsoportoknál
vizsgálhatóvá válik, hogy a betegút milyen eredménnyel járt, így összevethetővé válnak a tipikus minták.
Vizsgálhatóvá válnak olyan összefüggések, amelyek arra vonatkoznak, hogy például ugyanazon homogén
csoporton belül (a bevonási kritériumok közel azonosak, csupán a terápia minősége különbözik), milyen
hatása van a terápiának, vagyis a terápia minőségének függvényében milyen kimenete van a kezelésnek. A
kutató az így szerzett információ alapján direktben visszafordíthatja azt a betegellátás hatékonyságának
növelésére.