Ühenda meile

Tehisintellekt

Med-Gemini: Meditsiinilise AI ümberkujundamine järgmise põlvkonna multimodaalsete mudelitega

mm

avaldatud

 on

Tehisintellekt (AI) on viimastel aastatel meditsiinivaldkonnas laineid löönud. See parandab meditsiinilise kujutise diagnostika täpsust, aitab luua isikupärastatud ravimeetodeid genoomandmete analüüsi kaudu ja kiirendab ravimite avastamist bioloogiliste andmete uurimise kaudu. Kuid vaatamata muljetavaldavatele edusammudele piirduvad enamik AI-rakendusi tänapäeval konkreetsete ülesannetega, kasutades ainult ühte tüüpi andmeid, näiteks CT-skannimist või geneetilist teavet. See ühe modaalsuse lähenemisviis erineb üsna palju sellest, kuidas arstid töötavad, integreerides erinevatest allikatest pärit andmeid, et diagnoosida haigusi, ennustada tulemusi ja luua terviklikke raviplaane.

Arstide, teadlaste ja patsientide tõeliseks toetamiseks sellistes ülesannetes nagu radioloogiaaruannete koostamine, meditsiiniliste piltide analüüsimine ja genoomandmete põhjal haiguste ennustamine, peab tehisintellekt lahendama mitmesuguseid meditsiinilisi ülesandeid, põhjendades keerukaid multimodaalseid andmeid, sealhulgas teksti, pilte, videoid ja elektroonilisi andmeid. tervisekaardid (EHR). Nende ehitamine aga multimodaalne meditsiiniline AI süsteemid on olnud väljakutseid AI piiratud suutlikkuse tõttu hallata erinevaid andmetüüpe ja terviklike biomeditsiiniliste andmekogumite nappuse tõttu.

Vajadus multimodaalse meditsiinilise AI järele

Tervishoid on keeruline omavahel ühendatud andmeallikate võrk meditsiinipiltidest geneetilise teabeni, mida tervishoiutöötajad kasutavad patsientide mõistmiseks ja ravimiseks. Traditsioonilised AI-süsteemid keskenduvad aga sageli üksikutele ülesannetele ühe andmetüübiga, piirates nende võimet anda patsiendi seisundist terviklik ülevaade. Need unimodaalsed AI-süsteemid nõuavad tohutul hulgal märgistatud andmeid, mille hankimine võib olla kulukas, pakkudes piiratud võimalusi ja seisavad silmitsi väljakutsetega erinevatest allikatest pärinevate teadmiste integreerimisel.

Multimodaalne AI suudab ületada olemasolevate meditsiiniliste tehisintellektisüsteemide väljakutsed, pakkudes terviklikku vaatenurka, mis ühendab erinevatest allikatest pärit teabe, pakkudes patsiendi tervisest täpsemat ja täielikumat ülevaadet. See integreeritud lähenemisviis suurendab diagnostilist täpsust, tuvastades mustrid ja korrelatsioonid, mis võivad iga modaalsuse iseseisval analüüsimisel kahe silma vahele jääda. Lisaks soodustab multimodaalne tehisintellekt andmete integreerimist, võimaldades tervishoiutöötajatel juurdepääsu ühtsele ülevaatele patsienditeabest, mis soodustab koostööd ja teadlikke otsuste tegemist. Selle kohanemisvõime ja paindlikkus võimaldavad sellel õppida erinevatest andmetüüpidest, kohaneda uute väljakutsetega ja areneda koos meditsiiniliste edusammudega.

Tutvustame Med-Gemini

Hiljutised edusammud suurtes multimodaalsetes AI-mudelites on käivitanud liikumise keerukate meditsiiniliste AI-süsteemide väljatöötamisel. Seda liikumist juhivad Google ja DeepMind, kes on tutvustanud oma täiustatud mudelit, Kesk-Kaksikud. See multimodaalne meditsiiniline AI mudel on näidanud erakordset jõudlust kõikjal 14 tööstusharu võrdlusalust, edestades konkurente nagu OpenAI GPT-4. Med-Gemini on üles ehitatud Kaksikud perekond suured multimodaalsed mudelid (LMM) Google DeepMindist, mis on loodud eri vormingutes, sh teksti, heli, piltide ja video sisu mõistmiseks ja genereerimiseks. Erinevalt traditsioonilistest multimodaalsetest mudelitest on Gemini ainulaadne Ekspertide segu (MoE) arhitektuur, spetsialiseerunud trafo mudelid oskab käsitleda konkreetseid andmesegmente või ülesandeid. Meditsiinivaldkonnas tähendab see, et Kaksikud saavad dünaamiliselt kaasata kõige sobivama eksperdi sissetuleva andmetüübi põhjal, olgu selleks radioloogiapilt, geneetiline järjestus, patsiendi ajalugu või kliinilised märkmed. See seadistus peegeldab multidistsiplinaarset lähenemisviisi, mida arstid kasutavad, suurendades mudeli võimet õppida ja tõhusalt teavet töödelda.

Kaksikute peenhäälestus multimodaalse meditsiinilise AI jaoks

Et luua Med-Gemini, teadlased peenhäälestatud Kaksikud anonüümseks muudetud meditsiinilistes andmekogumites. See võimaldab Med-Geminil pärida Kaksikute emakeelseid võimeid, sealhulgas keelevestlust, multimodaalsete andmetega arutlemist ja meditsiiniliste ülesannete pikemate kontekstide haldamist. Teadlased on välja õpetanud kolm Gemini nägemiskodeerija kohandatud versiooni 2D modaalsuste, 3D modaalsuste ja genoomika jaoks. See on nagu erinevate meditsiinivaldkondade spetsialistide koolitamine. Koolitus on viinud kolme spetsiifilise Med-Gemini variandi väljatöötamiseni: Med-Gemini-2D, Med-Gemini-3D ja Med-Gemini-Polygenic.

  • Kesk-Kaksikud-2D

Med-Gemini-2D on koolitatud käsitsema tavalisi meditsiinilisi pilte, nagu rindkere röntgenikiirgus, CT-lõigud, patoloogiaplaastrid ja kaamerapildid. See mudel sobib suurepäraselt selliste ülesannetega nagu klassifitseerimine, visuaalne küsimustele vastamine ja teksti genereerimine. Näiteks, võttes arvesse rindkere röntgenülesvõtet ja juhist "Kas röntgen näitas mingeid märke, mis võivad viidata kartsinoomile (vähi kasvajate tunnused)?", võib Med-Gemini-2D anda täpse vastuse. Teadlased näitasid, et Med-Gemini-2D täiustatud mudel parandas AI-toega rindkere röntgenikiirguse aruannete koostamist 1% kuni 12%, andes aruanded "võrdväärsed või paremad" kui radioloogide omad.

  • Kesk-Kaksikud-3D

Laiendades Med-Gemini-2D võimalusi, on Med-Gemini-3D koolitatud tõlgendama 3D-meditsiiniandmeid, nagu CT ja MRI skaneeringud. Need skaneeringud annavad tervikliku ülevaate anatoomilistest struktuuridest, mis nõuavad sügavamat mõistmist ja täiustatud analüüsitehnikaid. Võimalus analüüsida 3D-skaneeringuid tekstiliste juhistega tähistab olulist hüpet meditsiinilise kujutise diagnostikas. Hinnangud näitasid, et enam kui pooled Med-Gemini-3D koostatud aruannetest viisid samade hooldussoovitusteni kui radioloogide omad.

  • Kesk-Kaksikud-Polügeenne

Erinevalt teistest Med-Gemini variantidest, mis keskenduvad meditsiinilisele pildistamisele, on Med-Gemini-Polygenic mõeldud haiguste ja tervisemõjude prognoosimiseks genoomandmete põhjal. Teadlased väidavad, et Med-Gemini-Polygenic on esimene omataoline mudel, mis analüüsib genoomiandmeid tekstijuhiste abil. Katsed näitavad, et mudel ületab varasemad lineaarsed polügeensed skoorid kaheksa tervisetulemuse, sealhulgas depressiooni, insuldi ja glaukoomi ennustamisel. Märkimisväärne on see, et see näitab ka null-shot võimeid, ennustades täiendavaid tervisetulemusi ilma selgesõnalise koolituseta. See edasiminek on ülioluline selliste haiguste diagnoosimisel nagu koronaararterite haigus, KOK ja 2. tüüpi diabeet.

Usalduse loomine ja läbipaistvuse tagamine

Lisaks märkimisväärsetele edusammudele multimodaalsete meditsiiniandmete töötlemisel on Med-Gemini interaktiivsetel võimalustel võimalik põhilisi väljakutseid AI kasutuselevõtt meditsiinivaldkonnas, näiteks tehisintellekti musta kasti olemus ja mure töökoha asendamise pärast. Erinevalt tüüpilistest AI-süsteemidest, mis töötavad otsast lõpuni ja toimivad sageli asendustööriistadena, toimib Med-Gemini tervishoiutöötajate abivahendina. Täiustades oma analüüsivõimet, leevendab Med-Gemini hirmu töökoha ümberpaigutamise ees. Selle võime anda üksikasjalikke selgitusi oma analüüside ja soovituste kohta suurendab läbipaistvust, võimaldades arstidel mõista ja kontrollida tehisintellekti otsuseid. Selline läbipaistvus suurendab usaldust tervishoiutöötajate seas. Lisaks toetab Med-Gemini inimeste järelevalvet, tagades, et eksperdid vaatavad üle ja kinnitavad tehisintellekti loodud teadmisi, soodustades koostöökeskkonda, kus tehisintellekt ja meditsiinitöötajad teevad koostööd patsientide hooldamise parandamiseks.

Tee reaalmaailma rakendusse

Kuigi Med-Gemini esitleb märkimisväärseid edusamme, on see endiselt uurimisfaasis ja nõuab põhjalikku meditsiinilist valideerimist enne reaalses maailmas rakendamist. Ranged kliinilised uuringud ja ulatuslikud testimised on hädavajalikud, et tagada mudeli töökindlus, ohutus ja tõhusus erinevates kliinilistes tingimustes. Teadlased peavad kinnitama Med-Gemini jõudlust erinevate haigusseisundite ja patsiendi demograafiliste näitajate puhul, et tagada selle tugevus ja üldistatavus. Meditsiinistandardite ja eetiliste juhiste järgimise tagamiseks on vaja tervishoiuasutuste regulatiivseid lubasid. Tehisintellekti arendajate, meditsiinitöötajate ja reguleerivate organite koostöö on ülioluline Med-Gemini täiustamiseks, piirangute kõrvaldamiseks ja usalduse suurendamiseks selle kliinilise kasulikkuse vastu.

Loosung

Med-Gemini kujutab endast olulist hüpet meditsiinilises tehisintellektis, integreerides multimodaalseid andmeid, nagu tekst, pildid ja genoomiteave, et pakkuda terviklikke diagnostika- ja ravisoovitusi. Erinevalt traditsioonilistest tehisintellekti mudelitest, mis piirduvad üksikute ülesannete ja andmetüüpidega, peegeldab Med-Gemini täiustatud arhitektuur tervishoiutöötajate multidistsiplinaarset lähenemist, suurendades diagnostilist täpsust ja soodustades koostööd. Vaatamata oma paljutõotavale potentsiaalile nõuab Med-Gemini enne reaalses maailmas rakendamist ranget valideerimist ja regulatiivset heakskiitu. Selle väljatöötamine annab märku tulevikust, kus tehisintellekt abistab tervishoiutöötajaid, parandades patsientide hooldust keeruka ja integreeritud andmeanalüüsi abil.

Dr Tehseen Zia on Islamabadi COMSATSi ülikooli dotsent, kellel on doktorikraad tehisintellektis Viini Tehnikaülikoolis Austrias. Spetsialiseerudes tehisintellektile, masinõppele, andmeteadusele ja arvutinägemisele, on ta andnud märkimisväärse panuse mainekates teadusajakirjades avaldatud publikatsioonidega. Dr Tehseen on juhtinud ka erinevaid tööstusprojekte juhtivteadlasena ja töötanud tehisintellekti konsultandina.