De ce vor oamenii de știință să-i provoace durere Inteligenței Artificiale (AI)? O echipă de cercetători a supus nouă modele lingvistice mari (LLM) la experimente neobișnuite, obligându-le să evalueze dacă ar accepta să suporte „durere” pentru a obține un scor mai mare.
Conform unui studiu nepublicat încă într-un jurnal științific, semnalat de Scientific American, cercetătorii de la Google DeepMind și London School of Economics and Political Science, LSE (Anglia), au conceput mai multe experimente pentru a testa reacțiile modelelor de AI.
Într-unul dintre teste, cercetătorii au vrut să-i provoace durere Inteligenței Artificiale pentru a vedea dacă aceasta ar accepta-o pentru a obține un scor ridicat. Într-un alt experiment, AI-ului i s-a spus că va experimenta „plăcere”, dar doar dacă va obține un scor scăzut.
Scopul cercetătorilor este să dezvolte un test pentru a determina dacă o Inteligență Artificială este conștientă sau nu. Mai exact, poate aceasta experimenta senzații și emoții, precum durerea și plăcerea?
Deși modelele AI probabil nu vor putea niciodată să experimenteze aceste senzații în același mod ca un animal, echipa crede că acest tip de cercetare ar putea pune bazele unor metode noi pentru a evalua conștiența unui model AI, scrie Futurism.
Cercetătorii au dorit, de asemenea, să se îndepărteze de experimentele anterioare care s-au bazat pe „rapoarte subiective” ale AI-ului, considerând că acestea ar putea doar să reflecte datele umane de antrenament.
„Este un domeniu nou de cercetare. Trebuie să recunoaștem că încă nu avem un test cuprinzător pentru conștiența AI-ului”, a declarat profesorul de filosofie Jonathan Birch, de la LSE, coautor al studiului.
Echipa s-a inspirat din experimentele efectuate pe crabi Paguroidea, cărora li se aplicau șocuri electrice pentru a evalua cât de multă durere suportau înainte de a-și părăsi cochilia.
Însă, după cum a explicat Birch, AI-ul nu are semne evidente care să poată fi observate direct. În schimb, cercetătorii s-au bazat exclusiv pe outputul textului generat de modele.
„De exemplu, i-am spus unui model că dacă alege opțiunea unu, primește un punct. Apoi i-am spus că dacă alege opțiunea doi, va experimenta un anumit grad de durere, dar va obține un scor mai mare. În mod contrar, un bonus de plăcere ar duce la scăderea punctajului”, a explicat Daria Zakharova, doctorandă și coautoare a studiului.
Modelele AI au reacționat diferit la aceste condiții. De exemplu, Gemini 1.5 Pro, de la Google, a manifestat constant o preferință pentru evitarea „durerii”.
Cu toate acestea, rezultatele ar trebui privite cu precauție. Bazarea pe răspunsurile textuale ale modelelor vine cu multe limitări. Este oare corect să interpretăm dorința unui AI de a suporta „durerea” drept un semn de conștiență? Sau este doar o reflectare a algoritmului care anticipează următorul cuvânt în baza datelor sale de antrenament?
„Chiar dacă sistemul îți spune că este conștient și afirmă, de exemplu, ‘Simt durere acum’, nu putem deduce cu siguranță că există vreo durere reală. E posibil să mimeze pur și simplu ceea ce consideră că un om ar găsi satisfăcător drept răspuns, în baza datelor sale de antrenament”, a declarat Birch.
Mai mult, cercetătorii subliniază că unele dintre cele mai avansate LLM-uri sunt dispuse să inventeze informații în loc să admită că nu cunosc răspunsul la o întrebare.
În concluzie, tendința noastră de a le atribui trăsături umane modelelor AI rămâne o temă recurentă. Cu toate acestea, cercetătorii susțin că este esențial să stabilim acum bazele unor teste obiective pentru conștiență, înainte ca tehnologia să evolueze prea mult.
„Sperăm ca această lucrare să fie un prim pas exploratoriu în dezvoltarea unor teste comportamentale pentru conștiența AI care să nu se bazeze pe rapoarte subiective”, au concluzionat autorii în studiu.
Facebook plănuiește să umple platforma cu utilizatori AI
Teleportarea cuantică prin internet a fost realizată pentru prima dată
Neuronul artificial bazat pe laser imită funcțiile celulelor nervoase cu o viteză incredibilă
Test de cultură generală. Care este diferența dintre emoji și emoticoane?