Inteligența Artificială face glume mai bune decât oamenii. Într-un nou studiu conceput pentru a testa capacitățile de co-creare ale modelelor lingvistice mari (LLM-uri), memele create de modelul GPT-4o de la OpenAI au fost, în medie, evaluate ca fiind mai amuzante, mai creative și mai ușor de distribuit decât cele create de oameni sau de oameni asistați de chatbot. Cu toate acestea, în ceea ce privește calitatea memelor de top, umorul generat de oameni a prevalat în continuare.
Descoperirile au fost încărcate pe serverul de prepublicări arXiv și prezentate la cea de-a 30-a Conferință Internațională privind Interfețele Inteligente cu Utilizatorul, care a avut loc între 24 și 27 martie, în Cagliari, Italia.
Comentând rezultatele pe rețeaua socială BlueSky, Ethan Mollick, profesor și codirector al laboratorului de AI generativ de la Wharton University of Pennsylvania (SUA), a declarat: „Regret să anunț că testul Turing al memelor a fost trecut.” Testul Turing original a fost propus în 1950 de matematicianul britanic Alan Turing ca un punct de referință pentru inteligența computerelor: dacă un om nu ar putea face diferența dintre un om și un computer într-o conversație, s-ar putea spune că computerul manifestă o inteligență de nivel uman.
Deși studiul nu a evaluat dacă memele generate de AI puteau fi diferențiate de cele create de oameni, ridică întrebări interesante despre modul în care evaluăm creativitatea, mai ales că participanții au evaluat adesea mai favorabil conținutul generat de AI. Cercetătorii de la Institutul Regal de Tehnologie KTH (Suedia), LMU München și TU Darmstadt (ambele din Germania) nu și-au propus să demonstreze capacitățile comice ale AI-ului. În schimb, au dorit să exploreze co-creativitatea, în special modul în care LLM-urile îi pot sprijini pe oameni în sarcini creative precum scrierea de glume.
Oamenii de știință au identificat crearea de meme, cu amestecul său de referințe culturale, sarcasm și presiune scăzută a performanței, ca fiind cazul de testare perfect. Memele iau de obicei forma unor imagini cu subtitrări care fac aluzie la situații familiare sau la cultura populară. Ele au devenit un fel de „scurtătură” comună pe internet, folosită pentru a face glume sau pentru a răspunde la evenimentele actuale într-un format ușor de înțeles și adesea ireverențios, scrie Live Science.
„Complexitatea umorului îl face un domeniu bogat pentru explorarea dinamicii co-creativității, deoarece colaboratorii trebuie să navigheze prin aceste nuanțe pentru a produce conținut care rezonează cu ceilalți”, au scris cercetătorii în lucrare.
Experimentul a avut două părți. În prima, cercetătorii au recrutat 124 de participanți și i-au repartizat în două grupuri: unul care lucra singur și celălalt care lucra cu un asistent chatbot AI.
Participanților li s-au oferit apoi trei runde pentru a genera subtitrări pentru șabloane clasice de meme pe temele muncă, mâncare și sport, printre acestea numărându-se șabloanele Fry din Futurama, Doge și Boromir („one does not simply walk into Mordor”). Cei din grupul asistat de AI au putut folosi un chatbot pentru a face brainstorming de idei, dar au fost responsabili pentru selectarea celor mai bune idei și crearea memelor finale.
Grupul format doar din oameni a creat 335 de meme, în timp ce 307 au fost produse de echipe hibride om-AI. Pentru comparație, GPT-4o a generat suplimentar 150 de meme.
Un al doilea grup de 98 de persoane a evaluat apoi memele în funcție de cât de amuzante, creative și ușor de distribuit erau. Memele au fost randomizate, astfel încât evaluatorii să nu știe cine sau ce le-a creat. În toate cele trei categorii, memele generate de AI au ieșit pe primul loc.
„Interesant este că Inteligența Artificială face glume mai bune decât oamenii și decât cele create în colaborare om-AI în toate domeniile, în medie. Cu toate acestea, atunci când ne uităm la memele cu cele mai bune performanțe, cele create de oameni au fost mai bune în umor, în timp ce colaborările om-AI s-au remarcat în creativitate și ușurință de distribuire”, au scris cercetătorii în lucrare.
Cu alte cuvinte, deși memele generate de AI au obținut cele mai mari scoruri în medie, memele identificate ca fiind „cele mai amuzante” au fost de cele mai multe ori create de oameni. Cercetătorii au atribuit scorurile medii ridicate ale AI-ului faptului că LLM-urile sunt antrenate pe volume uriașe de conținut de pe internet, ceea ce le face bune la imitarea umorului popular în general, dar nu atât de bune la plasarea unei replici cu adevărat ingenioase.
„LLM-urile atrag un gust larg în materie de umor, dar oamenii pot fi și mai spirituali”, au scris ei.
Studiul a examinat, de asemenea, impactul asistenței AI-ului asupra productivității și efortului perceput. Participanții care au lucrat cu chatbotul au generat mai multe idei decât cei care au lucrat singuri, dar acest lucru nu s-a tradus întotdeauna în conținut mai amuzant. Potrivit cercetătorilor, acest lucru este cauzat de faptul că, deși LLM-urile pot ajuta la generarea de idei, nu ridică neapărat standardul calității creative. Acest lucru este valabil mai ales pentru umor, despre care cercetătorii au spus că necesită „sincronizare, context cultural, cunoștințe comune și capacitatea de a submina așteptările”.
„Deși LLM-urile pot genera meme amuzante și adecvate contextului, ele se confruntă adesea cu dificultăți în capturarea referințelor culturale nuanțate și a subtilităților emoționale inerente creativității umane. În timp ce AI-ul poate spori productivitatea și poate crea conținut care atrage un public larg, creativitatea umană rămâne crucială pentru conținutul care conectează la un nivel mai profund”, au concluzionat cercetătorii.
Pericolele expunerii online: De ce tot mai mulți oameni își reduc prezența digitală
Modul în care prepari cafeaua ar putea influența nivelurile de colesterol
Creierul începe „să se mănânce singur” în timpul exercițiilor fizice intense