Un nou studiu dezvăluie că adoptarea la scară largă a modelelor lingvistice mari (LLM), cum ar fi ChatGPT, a dus la o scădere semnificativă a schimbului public de cunoștințe pe platforme precum Stack Overflow. Cum a influențat creșterea utilizării lui ChatGPT schimbul de cunoștințe?
Studiul evidențiază o reducere cu 25% a activității utilizatorilor pe populara platformă de întrebări și răspunsuri din domeniul programării, în termen de șase luni de la lansarea lui ChatGPT, comparativ cu platformele similare unde accesul la ChatGPT este restricționat.
Studiul este publicat în PNAS Nexus.
„Modelele lingvistice mari sunt atât de puternice, au o valoare enormă și un impact major asupra lumii. Începem să ne întrebăm care va fi viitorul lor”, afirmă Maria del Rio-Chanona, autoarea principală a studiului și membră asociată a Complexity Science Hub (CSH).
„Studiul nostru a emis ipoteza că, în loc să posteze întrebări și să primească răspunsuri pe platforme publice precum Stack Overflow, unde toată lumea poate învăța din ele, oamenii aleg să-l întrebe în mod privat pe ChatGPT. Totuși, aceste LLM-uri, inclusiv ChatGPT, sunt antrenate pe aceste date deschise și publice, pe care, într-un fel, le înlocuiesc. Deci, ce se va întâmpla?”, adaugă Del Rio-Chanona, care este, de asemenea, profesoară asistentă la University College London și cercetătoare asociată la Oxford Martin School și Bennett Institute for Public Policy, University of Cambridge (Anglia).
„În concluziile noastre, am observat din ce în ce mai puține întrebări și răspunsuri pe Stack Overflow odată cu creșterea utilizării lui ChatGPT. Acest lucru are implicații destul de mari. Înseamnă că s-ar putea să nu mai existe suficiente date publice pentru a antrena modelele în viitor”, avertizează Del Rio-Chanona. În acest studiu, ea a colaborat cu Nadzeya Laurentsyeva, de la Universitatea Ludwig Maximilian din München (Germania), și cu Johannes Wachs, membru al facultății la CSH și profesor la Universitatea Corvinus din Budapesta (Ungaria).
„Stack Overflow este o bază de date de cunoștințe valoroasă, accesibilă oricărei persoane cu conexiune la internet. Oameni din întreaga lume învață din întrebările și răspunsurile postate de alții”, spune Wachs, citat de Tech Xplore.
De fapt, chiar și modelele AI precum ChatGPT sunt antrenate pe conținut generat de oameni, cum ar fi postările de pe Stack Overflow. Ironia face ca înlocuirea conținutului generat de oameni cu cel generat de AI să îngreuneze antrenarea viitoarelor modele AI. Utilizarea datelor generate de AI pentru a antrena noi modele este, în general, considerată ineficientă, un proces comparat cu realizarea unei copii după o altă copie.
De asemenea, descoperirile evidențiază scenarii care depășesc schimbările tehnologice și ating structurile economice și sociale. Pe măsură ce utilizatorii interacționează tot mai mult cu LLM-urile precum ChatGPT, ei pot deveni mai puțin dispuși să contribuie la platformele publice de cunoștințe, ceea ce va duce la transferul de date valoroase din depozitele publice către sisteme AI deținute privat, explică Del Rio-Chanona și colegii săi.
„Acesta reprezintă un transfer semnificativ de cunoștințe din domeniul public în cel privat”, argumentează cercetătorii. Potrivit acestora, acest fenomen ar putea accentua avantajul competitiv al primilor dezvoltatori în domeniul AI, concentrând și mai mult cunoștințele și puterea economică.
Del Rio-Chanona și colegii săi au descoperit că scăderea creării de conținut pe Stack Overflow a afectat utilizatori de toate nivelurile de experiență, de la începători la experți. De asemenea, s-a observat că nu s-a înregistrat o scădere semnificativă a calității postărilor, conform feedback-ului utilizatorilor, ceea ce sugerează că atât contribuțiile de calitate scăzută, cât și cele de înaltă calitate sunt înlocuite de LLM-uri.
În plus, studiul a arătat că activitatea de postare în anumite limbaje de programare, cum ar fi Python și Javascript, a scăzut semnificativ mai mult decât media platformei.
„Rezultatele sugerează că oamenii pun întrebări despre Python și Javascript, două dintre cele mai folosite limbaje de programare, pe ChatGPT în loc de Stack Overflow”, concluzionează Del Rio-Chanona.
Cel mai rapid încărcător din lume poate încărca complet smartphone-ul în mai puțin de 5 minute
Declinul digital: aproape 40% dintre paginile de Internet au dispărut
Cum reducem amprenta de carbon digitală?
Microsoft propune o funcție „Big Brother” care înregistrează tot ce facem pe computer