Verbind je met ons

Artificial Intelligence

Med-Gemini: medische AI ​​transformeren met multimodale modellen van de volgende generatie

mm

gepubliceerd

 on

Kunstmatige intelligentie (AI) heeft de afgelopen jaren veel ophef gemaakt in de medische wereld. Het verbetert de nauwkeurigheid van medische beelddiagnostiek, helpt bij het creëren van gepersonaliseerde behandelingen door middel van genomische data-analyse, en versnelt de ontdekking van geneesmiddelen door biologische gegevens te onderzoeken. Maar ondanks deze indrukwekkende vooruitgang zijn de meeste AI-toepassingen tegenwoordig beperkt tot specifieke taken waarbij slechts één soort gegevens worden gebruikt, zoals een CT-scan of genetische informatie. Deze benadering met één modaliteit verschilt nogal van de manier waarop artsen werken, waarbij gegevens uit verschillende bronnen worden geïntegreerd om aandoeningen te diagnosticeren, resultaten te voorspellen en uitgebreide behandelplannen op te stellen.

Om artsen, onderzoekers en patiënten echt te ondersteunen bij taken zoals het genereren van radiologierapporten, het analyseren van medische beelden en het voorspellen van ziekten op basis van genomische gegevens, moet AI diverse medische taken uitvoeren door te redeneren over complexe multimodale gegevens, waaronder tekst, afbeeldingen, video's en elektronische gegevens. gezondheidsdossiers (EPD’s). Echter, deze bouwen multimodale medische AI systemen zijn een uitdaging geweest vanwege de beperkte capaciteit van AI om diverse gegevenstypen te beheren en de schaarste aan uitgebreide biomedische datasets.

De behoefte aan multimodale medische AI

De gezondheidszorg is een complex web van onderling verbonden gegevensbronnen, van medische beelden tot genetische informatie, die zorgprofessionals gebruiken om patiënten te begrijpen en te behandelen. Traditionele AI-systemen richten zich echter vaak op afzonderlijke taken met afzonderlijke gegevenstypen, waardoor hun vermogen om een ​​alomvattend overzicht van de toestand van een patiënt te bieden wordt beperkt. Deze unimodale AI-systemen vereisen enorme hoeveelheden gelabelde gegevens, die kostbaar kunnen zijn om te verkrijgen, omdat ze een beperkte reikwijdte van mogelijkheden bieden, en uitdagingen ondervinden bij het integreren van inzichten uit verschillende bronnen.

Multimodale AI kan de uitdagingen van bestaande medische AI-systemen overwinnen door een holistisch perspectief te bieden dat informatie uit verschillende bronnen combineert, waardoor een nauwkeuriger en vollediger inzicht in de gezondheid van een patiënt wordt geboden. Deze geïntegreerde aanpak verbetert de diagnostische nauwkeurigheid door patronen en correlaties te identificeren die mogelijk over het hoofd worden gezien bij het afzonderlijk analyseren van elke modaliteit. Bovendien bevordert multimodale AI data-integratie, waardoor zorgprofessionals toegang krijgen tot een uniform beeld van patiëntinformatie, wat samenwerking en goed geïnformeerde besluitvorming bevordert. Dankzij het aanpassingsvermogen en de flexibiliteit kan het systeem leren van verschillende gegevenstypen, zich aanpassen aan nieuwe uitdagingen en mee evolueren met de medische vooruitgang.

Maak kennis met Med-Gemini

Recente ontwikkelingen in grote multimodale AI-modellen hebben geleid tot een beweging in de ontwikkeling van geavanceerde medische AI-systemen. Leiders van deze beweging zijn Google en DeepMind, die hun geavanceerde model hebben geïntroduceerd: Med-Gemini. Dit multimodale medische AI-model heeft in de hele wereld uitzonderlijke prestaties geleverd 14 branchebenchmarks, het overtreffen van concurrenten zoals OpenAI's GPT-4. Med-Gemini is gebouwd op de Gemini familie van grote multimodale modellen (LMM's) van Google DeepMind, ontworpen om inhoud in verschillende formaten te begrijpen en te genereren, waaronder tekst, audio, afbeeldingen en video. In tegenstelling tot traditionele multimodale modellen beschikt Gemini over een uniek karakter Mix-of-Experts (MoE) architectuur, met gespecialiseerde transformator modellen bekwaam in het omgaan met specifieke datasegmenten of taken. Op medisch gebied betekent dit dat Gemini dynamisch de meest geschikte expert kan inschakelen op basis van het binnenkomende gegevenstype, of het nu gaat om een ​​radiologisch beeld, genetische sequentie, patiëntgeschiedenis of klinische aantekeningen. Deze opzet weerspiegelt de multidisciplinaire aanpak die artsen gebruiken, waardoor het vermogen van het model om informatie efficiënt te leren en te verwerken wordt vergroot.

Gemini afstemmen op multimodale medische AI

Om Med-Gemini te creëren, onderzoekers verfijnde Tweeling op geanonimiseerde medische datasets. Hierdoor kan Med-Gemini de oorspronkelijke capaciteiten van Gemini erven, waaronder taalconversatie, redeneren met multimodale gegevens en het beheren van langere contexten voor medische taken. Onderzoekers hebben drie aangepaste versies van de Gemini vision-encoder getraind voor 2D-modaliteiten, 3D-modaliteiten en genomica. Het is als het opleiden van specialisten op verschillende medische gebieden. De training heeft geleid tot de ontwikkeling van drie specifieke Med-Gemini-varianten: Med-Gemini-2D, Med-Gemini-3D en Med-Gemini-Polygenic.

  • Med-Gemini-2D

Med-Gemini-2D is getraind in het verwerken van conventionele medische beelden, zoals röntgenfoto's van de borstkas, CT-coupes, pathologiepatches en camerabeelden. Dit model blinkt uit in taken als classificatie, het visueel beantwoorden van vragen en het genereren van tekst. Gegeven een röntgenfoto van de borstkas en de instructie “Vertoonde de röntgenfoto tekenen die zouden kunnen wijzen op een carcinoom (een indicatie van kankergezwellen)?”, kan Med-Gemini-2D een nauwkeurig antwoord geven. Onderzoekers onthulden dat het verfijnde model van Med-Gemini-2D de door AI ondersteunde rapportgeneratie voor röntgenfoto's van de borstkas met 1% tot 12% verbeterde, waardoor rapporten "equivalent of beter" ontstonden dan die van radiologen.

  • Med-Gemini-3D

Med-Gemini-2D breidt de mogelijkheden van Med-Gemini-3D uit en is getraind in het interpreteren van medische 3D-gegevens zoals CT- en MRI-scans. Deze scans bieden een uitgebreid beeld van anatomische structuren, waarvoor een dieper niveau van begrip en meer geavanceerde analytische technieken nodig zijn. De mogelijkheid om 3D-scans te analyseren met tekstuele instructies betekent een aanzienlijke sprong voorwaarts in de medische beelddiagnostiek. Uit evaluaties bleek dat meer dan de helft van de door Med-Gemini-3D gegenereerde rapporten tot dezelfde zorgadviezen leidde als die van radiologen.

  • Med-Gemini-Polygeen

In tegenstelling tot de andere Med-Gemini-varianten die zich richten op medische beeldvorming, is Med-Gemini-Polygenic ontworpen om ziekten en gezondheidsresultaten te voorspellen op basis van genomische gegevens. Onderzoekers beweren dat Med-Gemini-Polygenic het eerste model in zijn soort is dat genomische gegevens analyseert met behulp van tekstinstructies. Experimenten tonen aan dat het model beter presteert dan eerdere lineaire polygene scores bij het voorspellen van acht gezondheidsresultaten, waaronder depressie, beroerte en glaucoom. Opmerkelijk genoeg demonstreert het ook zero-shot-mogelijkheden, waarbij extra gezondheidsresultaten worden voorspeld zonder expliciete training. Deze vooruitgang is cruciaal voor het diagnosticeren van ziekten zoals coronaire hartziekte, COPD en diabetes type 2.

Vertrouwen opbouwen en transparantie garanderen

Naast de opmerkelijke vooruitgang bij het verwerken van multimodale medische gegevens, hebben de interactieve mogelijkheden van Med-Gemini het potentieel om dit probleem aan te pakken fundamentele uitdagingen in de adoptie van AI binnen de medische sector, zoals het black-box-karakter van AI en de zorgen over het vervangen van banen. In tegenstelling tot typische AI-systemen die end-to-end werken en vaak dienen als vervangende hulpmiddelen, functioneert Med-Gemini als een hulpmiddel voor professionals in de gezondheidszorg. Door hun analysemogelijkheden te verbeteren, verlicht Med-Gemini de angst voor baanverdringing. Het vermogen om gedetailleerde uitleg te geven over zijn analyses en aanbevelingen vergroot de transparantie, waardoor artsen AI-beslissingen kunnen begrijpen en verifiëren. Deze transparantie schept vertrouwen onder zorgprofessionals. Bovendien ondersteunt Med-Gemini menselijk toezicht en zorgt ervoor dat door AI gegenereerde inzichten worden beoordeeld en gevalideerd door experts, waardoor een samenwerkingsomgeving wordt bevorderd waarin AI en medische professionals samenwerken om de patiëntenzorg te verbeteren.

De weg naar toepassing in de echte wereld

Hoewel Med-Gemini opmerkelijke vooruitgang laat zien, bevindt het zich nog in de onderzoeksfase en vereist het een grondige medische validatie voordat het in de echte wereld kan worden toegepast. Rigoureuze klinische onderzoeken en uitgebreide tests zijn essentieel om de betrouwbaarheid, veiligheid en effectiviteit van het model in diverse klinische omgevingen te garanderen. Onderzoekers moeten de prestaties van Med-Gemini bij verschillende medische aandoeningen en demografische gegevens van patiënten valideren om de robuustheid en generaliseerbaarheid ervan te garanderen. Regelgevende goedkeuringen van gezondheidsautoriteiten zullen nodig zijn om de naleving van medische normen en ethische richtlijnen te garanderen. Samenwerkingsinspanningen tussen AI-ontwikkelaars, medische professionals en regelgevende instanties zullen van cruciaal belang zijn om Med-Gemini te verfijnen, eventuele beperkingen aan te pakken en vertrouwen op te bouwen in het klinische nut ervan.

The Bottom Line

Med-Gemini vertegenwoordigt een aanzienlijke sprong voorwaarts in de medische AI ​​door multimodale gegevens, zoals tekst, afbeeldingen en genomische informatie, te integreren om uitgebreide diagnostiek en behandelaanbevelingen te bieden. In tegenstelling tot traditionele AI-modellen die zich beperken tot afzonderlijke taken en gegevenstypen, weerspiegelt de geavanceerde architectuur van Med-Gemini de multidisciplinaire aanpak van zorgprofessionals, waardoor de diagnostische nauwkeurigheid wordt verbeterd en samenwerking wordt bevorderd. Ondanks het veelbelovende potentieel vereist Med-Gemini een rigoureuze validatie en goedkeuring door de regelgevende instanties voordat het in de echte wereld kan worden toegepast. De ontwikkeling ervan luidt een toekomst in waarin AI zorgprofessionals helpt en de patiëntenzorg verbetert door middel van geavanceerde, geïntegreerde data-analyse.

Dr. Tehseen Zia is een vaste universitair hoofddocent aan de COMSATS Universiteit Islamabad en heeft een doctoraat in AI behaald aan de Technische Universiteit van Wenen, Oostenrijk. Hij is gespecialiseerd in kunstmatige intelligentie, machinaal leren, datawetenschap en computervisie en heeft belangrijke bijdragen geleverd met publicaties in gerenommeerde wetenschappelijke tijdschriften. Dr. Tehseen heeft ook diverse industriële projecten geleid als hoofdonderzoeker en als AI-consultant.