L'intelligenza artificiale medica di Google frantuma i modelli GPT di OpenAI e surclassa i medici

L'intelligenza artificiale medica di Google frantuma i modelli GPT di OpenAI e surclassa i medici

⇧ [VIDÉO] Potrebbero piacerti anche questi contenuti dei partner

Un recente studio pubblicato dai ricercatori di Google DeepMind su un server di prestampa arXiv Presenta un nuovo paradigma di intelligenza artificiale specificamente progettato per applicazioni mediche. Nel corso dei test, la tecnologia ha dimostrato la sua efficacia nell'effettuare diagnosi basate sul dialogo con i pazienti e nel fornire un prezioso aiuto ai medici per eseguire determinate analisi. Si dice addirittura che superi i modelli della serie GPT-4 di OpenAI in questi compiti.

Gemini è attualmente il modello di intelligenza artificiale più avanzato in Google DeepMind. Disponibile in diverse versioni, è in grado di elaborare e interpretare dati di diversi formati come testo, immagini, video e audio. Rendendosi conto del potenziale rivoluzionario dell'intelligenza artificiale nel settore medico, i ricercatori di Google hanno creato Med-Gemini, una versione di Gemini appositamente adattata e ottimizzata per le applicazioni mediche. Questa nuova intelligenza artificiale ha mostrato risultati promettenti nelle prime sperimentazioni, anche se richiede ancora ricerche approfondite per garantirne un’implementazione sicura ed efficace.

Sistema addestrato utilizzando MedQA

Med-Gemini è stato creato utilizzando MedQA, un database multilingue di domande a scelta multipla del Medical Licensing Examination (USMLE) degli Stati Uniti che cattura le competenze cliniche dei medici in formazione. Questo database contiene decine di migliaia di domande suddivise in tre lingue: più di 12.700 in inglese, circa 34.200 in cinese semplificato e 14.100 in cinese tradizionale.

Per migliorare le capacità del modello, Google ha sviluppato due estensioni a questo database. Il primo, MedQA-R (R per “inferenza”), è un’estensione del MedQA che include spiegazioni di inferenza generativa chiamate “catene di pensiero”, che forniscono spiegazioni dettagliate per ciascuna risposta. Il secondo modello, MedQA-RS (RS per “ragionamento e ricerca”), istruisce il modello a eseguire ricerche sul web e a utilizzare i risultati per migliorare l’accuratezza delle sue risposte. Nel test MedQA Med-Gemini ha raggiunto un'impressionante precisione del 91,1%. È stato quindi possibile superare in prestazioni i modelli della serie GPT-4 di OpenAI.

READ  Nuova mappa della tettonica a zolle

Buona conoscenza di set di dati di grandi dimensioni

I ricercatori hanno inoltre concentrato i loro sforzi sul miglioramento della capacità di Med-Gemini di elaborare e analizzare enormi quantità di informazioni mediche complesse. Per testare questa capacità, hanno utilizzato un ampio database pubblico di cartelle cliniche anonime.

Nell'ambito di questo esperimento, da questa fonte sono stati preparati circa 200 set di dati, ciascuno contenente tra 200.000 e 700.000 parole. La missione di Med-Gemini era identificare e recuperare informazioni accurate, come condizioni mediche e sintomi specifici, all'interno di questi gruppi. Una volta estratte queste informazioni, l’IA ha dovuto valutarne la rilevanza, classificarle e determinare se riflettevano la storia del paziente correlata alla condizione o ai sintomi in questione. Secondo i ricercatori l’esperimento ha dato buoni risultati.

Gli esami pratici sono stati superati con successo

Med-Gemini è stato anche testato in situazioni pratiche che ne hanno dimostrato l'utilità e le capacità multimodali in un contesto medico reale. Nel primo scenario, un paziente lo ha utilizzato per ottenere consigli su un rigonfiamento cutaneo che gli provocava prurito. Nel modulo si chiedeva al paziente di fornire una foto della lesione per una migliore valutazione. Dopo aver ricevuto l'immagine, Med-Gemini ha posto ulteriori domande per migliorare la sua diagnosi. È stato in grado di diagnosticare correttamente la rara lesione e fornire raccomandazioni sui passaggi successivi.

Guarda anche

Diagnosi di gemelli med

Esempio di conversazione tra un paziente e Med-Gemini durante un esame. © Khaled Saab e IL.

In un altro test, Med-Gemini è stato utilizzato da un medico per interpretare le radiografie del torace prima del rapporto ufficiale del radiologo. Il modello non solo ha fornito un'interpretazione dell'immagine, ma ha anche redatto una versione semplificata del rapporto in un inglese semplice, adattata alla comprensione del paziente.

Med Gemelli Ai

Una conversazione tra Med-Gemini e un medico a cui viene chiesto di analizzare una radiografia polmonare. © Khaled Saab e
IL.

Nonostante i risultati ottenuti, i ricercatori si rendono conto che sono necessari ulteriori studi per migliorare le capacità di conversazione clinica di Med-Gemini. Ciò ha lo scopo di garantire l'affidabilità e l'efficacia del modello in tutti gli scenari di uso medico.

fonte : arXiv

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *