Roboții de chat mai vechi, la fel ca oamenii, prezintă semne de deteriorare cognitivă, eșuând la mai mulți parametri importanți într-un test utilizat în mod normal pe oameni.
Oamenii se bazează din ce în ce mai mult pe inteligența artificială pentru diagnosticele medicale datorită rapidității și eficienței de care dau dovadă aceste instrumente în detectarea anomaliilor și semnelor de avertizare în istoricul medical, radiografii și alte seturi de date înainte ca acestea să devină evidente cu ochiul liber.
Dar un nou studiu publicat în BMJ ridică îngrijorări cu privire la faptul că tehnologiile de inteligență artificială, cum ar fi modelele lingvistice mari (LLM) și chatboții, la fel ca oamenii, prezintă semne de deteriorare a capacităților cognitive odată cu vârsta.
„Aceste constatări pun la îndoială ipoteza că inteligența artificială va înlocui în curând medicii umani”, au scris autorii studiului în lucrare.
„Deteriorarea cognitivă evidentă la chatbot-urile de vârf poate afecta fiabilitatea lor în diagnosticarea medicală și poate submina încrederea pacienților”.
Oamenii de știință au testat chatbot-urile bazate pe LLM disponibile public, inclusiv ChatGPT de la OpenAI, Sonnet de la Anthropic și Gemini de la Alphabet, utilizând testul de evaluare cognitivă de la Montreal (MoCA) – o serie de sarcini pe care neurologii le utilizează pentru a testa abilitățile de atenție, memorie, limbaj, abilități spațiale și funcții mentale executive.
MoCA este cel mai frecvent utilizat pentru a evalua sau testa debutul afectării cognitive în afecțiuni precum boala Alzheimer sau demența.
Subiecților li se atribuie sarcini precum desenarea unei ore specifice pe cadranul unui ceas, începerea de la 100 și scăderea repetată a șapte, memorarea a cât mai multe cuvinte dintr-o listă vorbită și așa mai departe, scrie LiveScience.
La om, 26 din 30 este considerat un scor de trecere (adică subiectul nu are nicio afectare cognitivă).
În timp ce unele aspecte ale testării, cum ar fi numirea, atenția, limbajul și abstractizarea, au fost aparent ușoare pentru majoritatea LLM-urilor utilizate, toate acestea au avut rezultate slabe în ceea ce privește abilitățile vizuale/spațiale și sarcinile executive, câteva dintre ele având rezultate mai slabe decât altele în domenii precum reamintirea întârziată.
În mod crucial, în timp ce cea mai recentă versiune a ChatGPT (versiunea 4) a obținut cel mai mare punctaj (26 din 30), LLM-ul mai vechi Gemini 1.0 a obținut doar 16 – ceea ce conduce la concluzia că LLM-urile mai vechi prezintă semne de declin cognitiv.
Autorii studiului notează că rezultatele lor sunt doar observaționale – diferențele critice dintre modul în care funcționează inteligența artificială și mintea umană înseamnă că experimentul nu poate constitui o comparație directă.
Dar ei avertizează că ar putea indica ceea ce ei numesc o „zonă semnificativă de slăbiciune” care ar putea pune frână implementării inteligenței artificiale în medicina clinică. În special, ei au argumentat împotriva utilizării în sarcini care necesită abstractizare vizuală și funcție executivă.
Inteligența Artificială ar putea deveni o armă periculoasă, avertizează fostul șef Google
Experții sunt îngroziți! Inteligența Artificială s-a clonat singură
Câți dintre angajații români folosesc Inteligența Artificială la locul de muncă?
Inteligența Artificială ar putea manipula, în curând, deciziile online ale oamenilor