(Adnkronos) – La super Ai in camice bianco batte Dr House. Messa alla prova su più di 300 casi impossibili è in grado di raggiungere un'accuratezza nella diagnosi 4 volte superiore a quella ottenuta in media dai 'colleghi' medici umani (con costi minori). La sfida è stata lanciata da un team di Microsoft Ai che ha provato a mettere a punto un sistema che riuscisse a emulare il processo diagnostico iterativo, cioè un percorso che parte da un punto, e poi perfeziona e migliora il risultato, testando ipotesi e aggiungendo man mano nuove informazioni. Proprio come farebbe un gruppo di esperti in carne e ossa. L'intelligenza artificiale, spiegano gli autori dello studio nell'ambito del quale è stato valutato il sistema (disponibile in versione preprint, cioè non ancora sottoposto a revisione paritaria), promette grandi possibilità nell'ambizione di ampliare l'accesso alle conoscenze e al ragionamento medico specialistico. Tuttavia, è la riflessione di partenza, la maggior parte delle valutazioni di modelli linguistici si basa su vignette statiche e domande a risposta multipla che non riflettono la complessità e le sfumature della medicina basata sulle prove di efficacia in contesti reali. Nella pratica clinica, i medici formulano e rivedono iterativamente ipotesi diagnostiche, adattando ogni domanda e test successivo a ciò che hanno appena appreso, e valutano l'evoluzione delle evidenze prima di formulare una diagnosi definitiva. Per emulare questo processo, il team di scienziati ha introdotto un sistema: il 'Sequential Diagnosis Benchmark', che trasforma 304 casi clinici difficili da diagnosticare, presentati alla conferenza clinico-patologica del 'New England Journal of Medicine', in incontri diagnostici graduali. Come si è svolto il 'test'? Un medico o un'Ia iniziano ad analizzare un breve abstract del caso e devono richiedere ulteriori dettagli a un modello 'gatekeeper' che rivela determinati risultati solo quando esplicitamente interrogato. La performance viene valutata non solo in base all'accuratezza diagnostica, ma anche in base al costo delle visite mediche e degli esami eseguiti. Da questo percorso nasce il MAI Diagnostic Orchestrator (MAI-DxO), un orchestratore indipendente dal modello che simula l'attività di un panel di medici, propone probabili diagnosi differenziali e seleziona strategicamente test di alto valore e convenienti. I risultati ottenuti promuovono la 'macchina'. In abbinamento al modello di OpenAI, spiegano gli esperti, il sistema in questione – una sorta di intelligenza artificiale 'agentica', autonoma – raggiunge un'accuratezza diagnostica dell'80%, quattro volte superiore cioè alla media del 20% dei medici generalisti. Riduce inoltre i costi diagnostici del 20% rispetto ai medici e del 70% rispetto al modello standard di Ai. E se configurato per la massima accuratezza, raggiunge quota 85,5%. In altre parole, gli attuali modelli di Ai possono essere utilizzati in modo che adottino un processo di ragionamento simile a quello che seguirebbe un gruppo di specialisti umani e i miglioramenti delle prestazioni sono generalizzati, indipendentemente dai modelli utilizzati, che siano delle famiglie OpenAI, Gemini, Claude, Grok, DeepSeek e Llama. "Evidenziamo – concludono gli autori – come i sistemi di intelligenza artificiale, se guidati a pensare in modo iterativo e ad agire giudiziosamente, possano migliorare sia la precisione diagnostica che il rapporto costo-efficacia nell'assistenza clinica". —cronacawebinfo@adnkronos.com (Web Info)
Intelligenza artificiale ‘batte’ Dr House, diagnosi 4 volte più precise su casi impossibili
© Riproduzione riservata