‘AI faalt in 80 procent van eerste medische diagnose’

Publicatiedatum: 20 april 2026

Het lijkt makkelijk: even een chatbot raadplegen voor medisch advies. Niet gek dat steeds meer mensen dat ook doen wanneer ze last hebben van een pijntje of een kwaaltje. Maar AI-taalmodellen slagen er in meer dan 80 procent van de gevallen niet in om een passende vroege diagnose te stellen, blijkt uit een nieuwe studie waar Euronews over schrijft.

AI-taalmodellen slagen er in meer dan 80 procent van de gevallen niet in om een passende vroege diagnose te stellen, blijkt uit onderzoek.

Onderzoekers van Mass General Brigham – een non-profit ziekenhuis- en onderzoeksnetwerk in Boston en een van de grootste zorgsystemen in de VS – zeggen dat AI-chatbots nauwkeuriger diagnosticeren met klinische informatie. Desondanks slagen de chatbots er nog niet in om in meer dan 80 procent van de gevallen een differentiële diagnose te stellen. Een differentiële diagnose is voor zorgprofessionals de eerste stap om een aandoening vast te stellen en te onderscheiden van ziekten met vergelijkbare symptomen.

Medisch advies

Een nieuwe studie, waarvan de resultaten zijn gepubliceerd in het medische tijdschrift JAMA Network Open, toont aan dat grote taalmodellen – ook wel LLM’s – tekortschieten in het redeneringsvermogen dat nodig is voor klinisch gebruik. Volgens een van de auteurs van het stuk, Marc Succi, zijn grootschalige taalmodellen daardoor nog niet geschikt zelfstandig in de praktijk te gebruiken wanneer het gaat over medisch advies.

Bron: Academie Nieuwe Zorg