Girêdana bi me

Îstîxbaratê ya sûnî

Med-Gemini: Veguherîna AI-ya Bijîjkî bi Modelên Multimodal ên Pêşerojê

mm

Published

 on

Zehmetiya çêkirî (AI) di van çend salên dawî de di warê bijîjkî de pêlan çêdike. Ew rastbûna teşhîskirina wêneya bijîjkî baştir dike, bi vekolîna daneyên biyolojîkî re dibe alîkar ku dermankirinên kesane biafirîne bi analîza daneya genomîkî, û bilezkirina vedîtina dermanan bi lêkolîna daneyên biyolojîkî. Lêbelê, tevî van pêşkeftinên berbiçav, piraniya serîlêdanên AI-ê îro bi karên taybetî bi karanîna tenê celebek daneyê, mîna CT-ê an agahdariya genetîkî, sînordar in. Ev nêzîkatiya yek-modalîteyê ji awayê ku bijîjk dixebitin, daneyên ji çavkaniyên cihêreng tevdigere ji bo teşhîskirina şertan, pêşbînkirina encaman, û çêkirina plansaziyên dermankirinê yên berfireh pir cûda ye.

Ji bo ku bi rastî di karên mîna çêkirina raporên radyolojiyê, analîzkirina wêneyên bijîjkî, û pêşbînkirina nexweşiyan ji daneyên genomîk de bi rastî piştgirî bide bijîjkan, lêkolîner û nexweşan, pêdivî ye ku AI bi ramanên li ser daneyên tevlihev ên multimodal, di nav de nivîs, wêne, vîdyoy, û elektronîkî de, peywirên bijîjkî yên cihêreng bigire dest. qeydên tenduristiyê (EHR). Lêbelê, avakirina van AI-ya bijîjkî ya multimodal pergalên ji ber kapasîteya tixûbdar a AI-ê ji bo birêvebirina cûrbecûr daneyên cûrbecûr û kêmbûna berhevokên biyobijîkkî yên berfireh dijwar bûne.

Pêdiviya AI-ya bijîjkî ya pirmodal

Tenduristî tevnek tevlihev a çavkaniyên daneyê yên bi hev ve girêdayî ye, ji wêneyên bijîjkî bigire heya agahdariya genetîkî, ku pisporên tenduristiyê bikar tînin da ku nexweşan fam bikin û derman bikin. Lêbelê, pergalên kevneşopî yên AI-ê bi gelemperî li ser peywirên yekane yên bi celebên daneya yekane hûr dibin, kapasîteya wan ji bo peydakirina nêrînek berfireh a rewşa nexweşek sînordar dike. Van pergalên AI-ê yên yek-modal hewceyê jimarek mezin a daneya binavkirî hewce dike, ku bidestxistina wan biha dibe, ku çarçoveyek tixûbdar a kapasîteyê peyda dike, û ji bo yekkirina têgihiştinên ji çavkaniyên cihêreng bi dijwariyan re rû bi rû dimînin.

Multimodal AI dikare dijwariyên pergalên AI-ê yên bijîjkî yên heyî bi peydakirina perspektîfek tevdeyî ya ku agahdariya ji çavkaniyên cihêreng berhev dike, têgihîştinek rastîn û bêkêmasî ya tenduristiya nexweşek peyda dike. Ev nêzîkatiya yekbûyî bi destnîşankirina qalib û pêwendiyên ku dibe ku dema ku her modalîteyê bi rengek serbixwe vekolîn bikin, rastbûna tespîtkirinê zêde dike. Wekî din, AI-ya multimodal yekbûna daneyê pêşve dike, rê dide pisporên lênihêrîna tenduristî ku bigihîjin nêrînek yekgirtî ya agahdariya nexweşan, ku hevkarî û biryar-girtinê baş-agahdar dike. Veguheztin û nermbûna wê ew dike ku ji cûrbecûr cûrbecûr daneyan fêr bibe, xwe bi kêşeyên nû re biguncîne, û bi pêşkeftinên bijîjkî re pêşve bibe.

Danasîna Med-Gemini

Pêşveçûnên dawî yên di modelên mezin ên AI-ê yên multimodal de tevgerek di pêşkeftina pergalên AI-ya bijîjkî ya sofîstîke de derxistiye holê. Serkêşiya vê tevgerê Google û DeepMind in, ku modela xwe ya pêşkeftî destnîşan kirine, Med-Gemini. Vê modela AI-ya bijîjkî ya multimodal li seranserê performansa awarte destnîşan kiriye 14 pîvanên pîşesaziyê, ji hevrikên mîna GPT-4 ya OpenAI. Med-Gemini li ser hatiye avakirin Gemini malbatê modelên multîmodal ên mezin (LMM) ji Google DeepMind, ji bo têgihiştin û hilberandina naverokê di formên cihêreng de, tevî nivîs, deng, wêne, û vîdyoyê hatî çêkirin. Berevajî modelên kevneşopî yên multimodal, Gemini xwedan taybetmendiyek bêhempa ye Mixture-of-Experts (MOE) mîmarî, bi pisporî modelên transformer di birêvebirina beşên daneyan an peywirên taybetî de jêhatî ye. Di warê bijîjkî de, ev tê vê wateyê ku Gemini dikare bi dînamîkî pisporê herî maqûl li ser bingeha celebê daneya gihîştî tevbigere, gelo ew wêneyek radyolojî, rêzek genetîkî, dîroka nexweş, an notên klînîkî be. Ev sazûman nêzîkatiya pirzimanî ya ku bijîjk bikar tînin nîşan dide, şiyana modelê ya fêrbûn û pêvajoykirina agahdariya bi bandor zêde dike.

Fine-Tuning Gemini ji bo AI-ya Bijîjkî ya Multimodal

Ji bo afirandina Med-Gemini, lêkolîner fine-tuned Gemini li ser daneyên bijîjkî yên nenaskirî. Ev rê dide Med-Gemini ku karînên xwemalî yên Gemini, di nav de danûstendina ziman, ramana bi daneyên pirmodal, û birêvebirina çarçoveyên dirêjtir ji bo karên bijîjkî, mîras bigire. Lekolînwan sê guhertoyên xwerû yên şîfrekera dîtina Gemini ji bo modalîteyên 2D, modalîteyên 3D, û genomîk perwerde kirine. Ew mîna perwerdekirina pisporên di warên bijîjkî yên cihêreng de ye. Perwerde bûye sedema pêşveçûna sê guhertoyên taybetî yên Med-Gemini: Med-Gemini-2D, Med-Gemini-3D, û Med-Gemini-Polygenic.

  • Med-Gemini-2D

Med-Gemini-2D hatiye perwerdekirin ku wêneyên bijîjkî yên kevneşopî yên wekî tîrêjên X-sîngê, perçeyên CT, pêlên patholojiyê, û wêneyên kamerayê bi dest bixe. Ev model di karên wekî dabeşkirin, bersiva pirsa dîtbar, û hilberîna nivîsê de bi pêş dikeve. Mînakî, rontgenek sîngê û talîmata "Gelo tîrêjê rontgenê nîşanek ku dibe ku kanserê (nîşaneyên mezinbûna penceşêrê) nîşan bide?", Med-Gemini-2D dikare bersivek rast bide. Lekolînwanan eşkere kirin ku modela rafînerî ya Med-Gemini-2D hilberîna raporê ya bi AI-ê çalakkirî ji bo tîrêjên X-sîngê ji% 1 heya 12% çêtir kir, û raporên "wekhev an çêtir" ji yên radyologan hilberand.

  • Med-Gemini-3D

Berfirehkirina kapasîteyên Med-Gemini-2D, Med-Gemini-3D ji bo şîrovekirina daneyên bijîjkî yên 3D yên wekî CT û MRI-ê têne perwerde kirin. Van scans nêrînek berfireh a strukturên anatomîkî peyda dikin, ku pêdivî bi astek kûr a têgihiştinê û teknîkên analîtîk ên pêşkeftî heye. Kapasîteya analîzkirina skaniyên 3D bi rêwerzên nivîsê ve di tespîtkirina wêneya bijîjkî de gavek girîng nîşan dide. Nirxandinan destnîşan kir ku zêdetirî nîvê raporên ku ji hêla Med-Gemini-3D ve hatî çêkirin rê li ber heman pêşniyarên lênihêrînê yên ku ji hêla radyologan ve hatine çêkirin.

  • Med-Gemini-Polygenic

Berevajî guhertoyên din ên Med-Gemini ku balê dikişînin ser wênekêşiya bijîjkî, Med-Gemini-Polygenic ji bo pêşbînkirina nexweşî û encamên tenduristiyê ji daneyên genomîk hatî çêkirin. Lekolînwan îdîa dikin ku Med-Gemini-Polygenic modela yekem e ku daneyên genomîk bi karanîna rêwerzên nivîsê analîz dike. Ceribandin destnîşan dikin ku model di pêşbînkirina heşt encamên tenduristiyê de, di nav de depresiyon, stroke, û glaucoma de, ji pîvanên polîjenîkî yên xêz ên berê derbas dibe. Hêjayî gotinê ye, ew di heman demê de kapasîteyên zero-shot jî destnîşan dike, bêyî perwerdehiya eşkere encamên tenduristiyê yên din pêşbîn dike. Ev pêşkeftin ji bo teşhîskirina nexweşiyên wekî nexweşiya arteria koroner, COPD, û şekirê celeb 2 pir girîng e.

Avakirina Baweriyê û Paqijkirina Zelalbûnê

Digel pêşkeftinên wê yên berbiçav di hilgirtina daneyên bijîjkî yên pirmodal de, kapasîteyên înteraktîf ên Med-Gemini xwedî potansiyela çareserkirina zehmetiyên bingehîn di pejirandina AI-ê de di qada bijîjkî de, wekî cewhera qutiya reş a AI-yê û fikarên li ser guheztina kar. Berevajî pergalên AI-ê yên tîpîk ên ku dawiya-bi-dawî tevdigerin û bi gelemperî wekî amûrên veguheztinê kar dikin, Med-Gemini ji bo pisporên lênihêrîna tenduristiyê wekî amûrek arîkar tevdigere. Bi zêdekirina kapasîteyên wan ên analîzê, Med-Gemini tirsa ji cîhûwarkirina kar kêm dike. Kapasîteya wê ya ku ravekirinên hûrgulî yên analîz û pêşniyarên xwe peyda dike zelaliyê zêde dike, ku dihêle bijîjk biryarên AI-ê fam bikin û verast bikin. Ev şefafî di nav pisporên lênihêrîna tenduristiyê de pêbaweriyê ava dike. Wekî din, Med-Gemini piştgirî dide çavdêriya mirovî, piştrast dike ku têgihîştinên AI-ê têne hilberandin ji hêla pisporan ve têne vekolandin û pejirandin, hawîrdorek hevkariyê çêdike ku AI û pisporên bijîjkî bi hev re dixebitin da ku lênihêrîna nexweşan baştir bikin.

Rêya Berbi Serlêdana Cîhana Rastî

Dema ku Med-Gemini pêşkeftinên berbiçav destnîşan dike, ew hîn jî di qonaxa lêkolînê de ye û berî serîlêdana cîhana rastîn erêkirina bijîjkî ya bêkêmasî hewce dike. Ceribandinên klînîkî yên hişk û ceribandinên berfireh pêdivî ne ku pêbawerî, ewlehî û bandorkeriya modelê di mîhengên klînîkî yên cihêreng de bicîh bikin. Pêdivî ye ku lêkolîner performansa Med-Gemini di nav şert û mercên bijîjkî yên cihêreng û demografîkên nexweşan de rast bikin da ku zexm û gelemperîbûna wê piştrast bikin. Pejirandinên birêkûpêk ên ji rayedarên tenduristiyê dê hewce bin da ku lihevhatina bi standardên bijîjkî û rêwerzên exlaqî re were garantî kirin. Hewldanên hevkariyê yên di navbera pêşdebirên AI-ê, pisporên bijîjkî, û saziyên birêkûpêk de dê ji bo safîkirina Med-Gemini, çareserkirina her tixûbdar, û avakirina pêbaweriyê di karanîna wê ya klînîkî de pir girîng be.

The Bottom Line

Med-Gemini di AI-ya bijîjkî de pêvekek girîng temsîl dike bi yekkirina daneyên pirmodal, wekî nivîs, wêne, û agahdariya genomîk, da ku pêşniyarên teşhîs û dermankirinê yên berfireh peyda bike. Berevajî modelên kevneşopî yên AI-ê yên ku tenê bi peywir û celebên daneyê ve têne sînordar kirin, mîmariya pêşkeftî ya Med-Gemini nêzîkatiya pirzimanî ya pisporên lênihêrîna tenduristî neynik dike, rastbûna tespîtkirinê zêde dike û hevkariyê xurt dike. Tevî potansiyela wê ya sozdar, Med-Gemini berî serîlêdana cîhana rast hewceyê pejirandina hişk û erêkirina rêziknameyê hewce dike. Pêşveçûna wê pêşerojek nîşan dide ku AI alîkariya pisporên lênihêrîna tenduristiyê dike, lênêrîna nexweşan bi navgîniya analîzên daneya sofîstîke, yekbûyî baştir dike.

Dr. Tehseen Zia Profesorê Doçentî ye li Zanîngeha COMSATS Îslamabadê, xwediyê doktoraya AI-ê ji Zanîngeha Teknolojiyê ya Viyanayê, Avusturya. Pisporê Zanistiya Hunerî, Fêrbûna Makîne, Zanistiya Daneyê, û Vîzyona Komputerê, wî bi weşanên di kovarên zanistî yên navdar de beşdarîyên girîng kiriye. Dr. Tehseen di heman demê de wekî Lêkolînerê Serekî gelek projeyên pîşesaziyê bi rê ve biriye û wekî Şêwirmendê AI-ê kar kiriye.