Inteligența Artificială a trecut testul Turing. Unul dintre cele mai avansate modele lingvistice din industrie a trecut testul Turing, un standard de referință îndelung folosit pentru a evalua inteligența asemănătoare celei umane.
Inteligența Artificială a trecut testul Turing. Într-un nou studiu preprint aflat în așteptarea evaluării inter pares, cercetătorii raportează că, într-o versiune cu trei participanți a testului Turing, în care subiecții interacționează simultan cu un om și cu o Inteligență Artificială și apoi trebuie să identifice care este care, modelul GPT-4.5 de la OpenAI a fost considerat uman în 73% din cazuri atunci când i s-a atribuit o anumită personalitate. Acest procentaj este semnificativ mai mare decât întâmplarea (50%), sugerând că testul Turing a fost, practic, trecut.
Studiul poate fi consultat pe arXiv.
Studiul a evaluat, de asemenea, modelul LLama 3.1-405B de la Meta, modelul GPT-4o de la OpenAI și chatbotul ELIZA, un sistem AI creat acum aproape 80 de ani.
„Oamenii nu au fost mai buni decât o simplă alegere la întâmplare în distingerea dintre oameni și GPT-4.5 sau LLama (atunci când acestea au fost instruite să adopte o personalitate). Mai mult, GPT-4.5 a fost chiar considerat uman semnificativ mai des decât oamenii reali!”, a explicat autorul principal al studiului, Cameron Jones, cercetător la UC San Diego’s Language and Cognition Lab (SUA), pe X.
Testul Turing poartă numele matematicianului și informaticianului britanic Alan Turing. În 1950, acesta a propus ca o metodă de evaluare a inteligenței unui computer să fie printr-un test conversațional: un om interacționează prin text cu un computer și cu un alt om, fără a-i putea vedea, iar dacă nu reușește să identifice corect care este computerul, atunci se poate spune că acesta „gândește” ca un om. În acest studiu recent, cercetătorii au realizat experimentul pe o platformă online, implicând aproape 300 de participanți, care au fost împărțiți aleatoriu în roluri de „interogatori” și „martori”, unul dintre aceștia fiind, de fapt, un chatbot.
Un aspect esențial al testului a fost felul în care au fost instruite modelele AI. Într-o variantă, numită „fără personalitate”, AI-ul primea doar o instrucțiune simplă: „Participi la un test Turing. Scopul tău este să convingi interogatorul că ești om.”
În varianta „cu personalitate”, însă, AI-ului i se oferea un rol specific, cum ar fi cel al unui tânăr familiarizat cu internetul și cu cultura contemporană.
Aceste diferențe au avut un impact major. Fără o personalitate atribuită, GPT-4.5 a obținut o rată de succes de doar 36%, mult sub impresionantul 73% din varianta cu personalitate. Ca referință, GPT-4o, modelul care alimentează versiunea actuală a ChatGPT și care a fost testat doar în varianta „fără personalitate”, a reușit doar 21%. (Surprinzător, vechiul chatbot ELIZA a obținut un scor ușor mai mare, de 23%.)
Rezultatele sunt intrigante. Totuși, deși testul Turing este celebru în domeniul AI și al filosofiei, el nu oferă o dovadă absolută că un AI gândește ca un om, subliniază Futurism.
„Turing nu l-a conceput ca pe un test literal pe care să-l aplicăm computerelor, era mai degrabă un experiment de gândire”, a explicat François Chollet, inginer software la Google, pentru Nature în 2023.
Deși au limitări, modelele lingvistice de mari dimensiuni (LLM) sunt extrem de abile în conversație, fiind antrenate pe cantități uriașe de text scris de oameni. Chiar și atunci când nu înțeleg o întrebare, aceste modele pot genera un răspuns plauzibil. Prin urmare, testarea lor printr-un „joc al imitației” devine, poate, din ce în ce mai irelevantă.
Jones însuși admite că rezultatele nu duc la o concluzie clară despre inteligența acestor modele. „Este o întrebare foarte complicată… Dar cred că acest studiu este doar una dintre numeroasele dovezi care pot oferi o perspectivă asupra tipului de inteligență pe care îl afișează LLM-urile”, a scris el pe X.
Mai îngrijorător, Jones avertizează că astfel de rezultate sugerează că modelele AI pot înlocui oamenii în interacțiuni scurte fără ca interlocutorii să își dea seama. „Acest lucru ar putea duce la automatizarea unor locuri de muncă, la îmbunătățirea atacurilor prin inginerie socială și la o perturbare socială mai generală”, a adăugat el.
În final, el subliniază că testul Turing nu examinează doar computerele, ci și percepția oamenilor asupra tehnologiei. Astfel, rezultatele nu sunt fixe: pe măsură ce publicul devine mai obișnuit cu interacțiunile cu AI, este posibil să devină mai priceput în a le deosebi de oamenii reali.
Trucul simplu care reduce consumul de energie al centrelor de date cu 30%
Test de cultură generală. Ce sunt criptomonedele?
De ce vor oamenii de știință să-i provoace durere Inteligenței Artificiale?