ChatGPT beschikt over een AI-assistent die gedegen data-analyses kan uitvoeren. Het kan medisch onderzoek versnellen. Is dit een gamechanger voor de zorgsector?
Vergeet het Chinese DeepSeek, dat met een gratis AI-model de beurskoersen van de Amerikaanse techgiganten deed kelderen. OpenAI slaat terug met de lancering van Deep Research, een AI-assistent die data verzamelt, bronnen valideert en rapportages maakt. Deze assistent gaat na een chat met de opdrachtgever aan de slag. Het struint het internet af, op zoek naar specifieke informatie, waarna het cijfers analyseert en een uitgebreid rapport maakt.
Primeur
Experts zijn lyrisch over de tool. Professor Ethan Mollick vroeg Deep Research naar onderwerpen waar hij wetenschappelijke artikelen over schrijft. “De eerste keer dat een AI-tool op universitair niveau werkt. Het doet geweldig werk door theorieën en belangrijke trends in de literatuur te synthetiseren,” zegt Mollick op LinkedIn. Hij raadt anderen aan om de tool te gebruiken bij het zoeken naar waardevolle papers die gratis beschikbaar zijn, zoals op ResearchGate en arXiv.
Gamechanger
Volgens biomedisch wetenschapper Derya Unutmaz is Deep Research een gamechanger. Hij liet de tool los op zijn specialisme. “Ik vroeg de tool om me te helpen met twee gevallen van kanker. Eén viel binnen mijn vakgebied en de andere viel er net buiten. Beide rapporten waren gewoonweg onberispelijk, zoals alleen een gespecialiseerde arts ze zou kunnen schrijven,” zegt Unutmaz op X. In zijn vakgebied scoort de tool gemakkelijk boven de 90 procent, zegt hij op X.
Hoe slim is Deep Research?
Volgens de GAIA-benchmark haalt Deep Research een score van 67 procent bij eerste pogingen en 72 procent na meerdere pogingen. Dat is een forse sprong vooruit ten opzichte van GPT-4, al blijven mensen met 92 procent nog steeds aan kop. Dat melden Alexander Klöpping en zijn collega-nerds in AI Report. Deep Research kan volgens hen in vijf tot dertig minuten een uitgebreid rapport maken van enkele duizenden tot 16.000 woorden, compleet met bronvermeldingen.
Helaas is de tool voorlopig alleen beschikbaar voor Amerikaanse Pro-gebruikers, tegen 200 dollar per maand. Later dit jaar volgt een bredere uitrol, meldt Klöpping.
OpenAI-medewerker Felipe Millon (foto van z’n profiel op X)
Persoonlijk verhaal
Felipe Millon, sales werknemer bij OpenAI, deelt op LinkedIn een persoonlijk verhaal waaruit tevens het succes blijkt van Deep research. Hij vertelt dat eind oktober zijn vrouw de diagnose borstkanker kreeg. Chirurgen verwijderden het weefsel bij beide borsten. Begin december onderging ze een chemokuur. Op de vraag of ze na de chemo moest worden bestraald, konden de artsen geen eenduidig antwoord geven.
Second opinion
Millon had als OpenAI-medewerker interne preview-toegang tot Deep Research. Hij besloot de AI-tool te voeden met het chirurgische pathologierapport van zijn vrouw, en vroeg daarna in hoeverre bestraling nodig zou zijn. “We wilden met name de voor- en nadelen begrijpen, de waarschijnlijkheid van het verminderen van recidief en of de voordelen opwegen tegen de potentiële risico’s op de lange termijn.”
Dieper in de materie
Het resultaat verbijsterde Millon. “Deep research bevestigde niet alleen de belangrijkste punten die door onze oncologen waren genoemd, het ging verder. Het citeerde studies waarvan ik nog nooit had gehoord. Toen we persoonlijke factoren toevoegden, zoals haar leeftijd en genetische risico’s, paste het zijn antwoorden aan met een indrukwekkend niveau van detail en nuance. We hebben die studies gecontroleerd op feiten en ze waren helemaal raak.”
Doorbraak in de zorg
Techondernemer Denys Tsvaig van DeHealth spreekt over Deep research als een doorbraak in de zorg. Volgens hem laat het verhaal van Millon zien dat de tool daadwerkelijk impact heeft. “Deep Research heeft pathologierapporten beoordeeld, behandelingsaanbevelingen gecontroleerd en aanvullende onderzoeken naar boven gehaald, waardoor de familie met vertrouwen een weloverwogen beslissing kon nemen. Dit is nog maar het begin. AI helpt nu niet alleen onderzoekers, maar doet ook zelf het onderzoek.”
Hallucineren
Betekent dit dat Deep Research foutloos is? Nee, zeker niet. Medisch onderzoeker Sergey Kornilov waarschuwt op LinkedIn voor het hallucineren van het Deep research-model o3. Hij heeft het model betrapt op een ‘leugen’ en raadt gebruikers aan om te vragen aan het model de resultaten dubbel te checken. Ook ondernemer Dan Shipper waarschuwt voor hallucinaties, ook al acht hij Deep Research over het algemeen betrouwbaar.
Wat zegt Open AI?
Deep Research is nog niet klaar om kanker te genezen, maar kan de efficiëntie van onderzoek verhogen. Dat zei Sam Altman, ceo van Open AI, tijdens een gesprek met de Indiase IT-minister Ashwini Vaishnaw, meldt Moneycontrol. “Dit kan iemand helpen de bestaande literatuur te beoordelen en verbanden te vinden. Maar het is nog geen innovator,” aldus Altman. Wel denkt hij dat het onderzoekers kan helpen om veel productiever te zijn in wat ze doen.
Efficiëncywinst
Altman schat in dat wetenschappers gemiddeld twee keer zo efficiënt kunnen worden met de tool. Hij verwacht dat onderzoekers zich snel zullen aanpassen en AI zullen inzetten om hun productiviteit te maximaliseren. “Het duurde maanden, geen jaren, voordat de wereld erachter kwam hoe ChatGPT gebruikt moest worden. Ik denk dat het ook maanden gaat duren om te ontdekken hoe mensen echt productief worden met Deep Research.”
Reem Anchassi, director research & data services bij Open AI, vertelt over Deep Research