Sarcasmul, un fenomen lingvistic complex întâlnit adesea în comunicarea online, servește adesea ca mijloc de exprimare a opiniilor sau a emoțiilor adânc înrădăcinate și este realizat într-un mod care poate fi amuzant, pasiv-agresiv sau, de multe ori, denigrator sau ridiculizant față de persoana căreia i se adresează. Dar pot algoritmii să detecteze sarcasmul?
Recunoașterea sarcasmului în scris este crucială pentru înțelegerea adevăratei intenții din spatele unei afirmații, în special atunci când avem în vedere rețelele sociale sau recenziile online ale clienților.
Pot algoritmii să detecteze sarcasmul? Deși observarea sarcasmului în lumea offline este de obicei destul de ușoară, după expresia facială, limbajul trupului și alte indicii, este mai dificil să descifrezi sarcasmul în textele online.
Un nou studiu, publicat în International Journal of Wireless and Mobile Computing, speră să-i facă față acestei provocări. Geeta Abakash Sahu și Manoj Hudnurkar, de la Universitatea Internațională Symbiosis din Pune (India), au dezvoltat un model avansat de detectare a sarcasmului destinat identificării precise a remarcilor sarcastice în conversațiile digitale, o sarcină crucială pentru înțelegerea adevăratei intenții din spatele declarațiilor online.
Modelul echipei cuprinde patru faze principale. Începe cu prelucrarea textului, care implică filtrarea cuvintelor comune („zgomot”), cum ar fi „și”, „de” și „la”. Apoi descompune textul în unități mai mici. Pentru a-i face față provocării de a trata un număr mare de caracteristici, echipa a folosit tehnici de selecție optimă a caracteristicilor pentru a asigura eficiența modelului, prioritizându-le doar pe cele mai relevante. Caracteristicile indicative ale sarcasmului, cum ar fi câștigul de informații, testul Chi pătrat, informația mutuală și incertitudinea simetrică, sunt apoi extrase din aceste date prelucrate de algoritm.
Pentru detectarea sarcasmului, echipa a folosit un clasificator de ansamblu care cuprinde diverși algoritmi, cum ar fi rețele neurale (NN), „păduri aleatorii” (RF), mașini cu suport vectorial (SVM) și o rețea neuronală convoluțională profundă (DCNN). Performanța acesteia din urmă a fost optimizată folosind un algoritm de optimizare nou propus, numit Clan Updated Grey Wolf Optimization (CU-GWO), notează Tech Xplore.
Echipa a constatat că abordarea lor poate depăși metodele existente în diverse măsurători de performanță. În mod specific, noua abordare îmbunătățește specificitatea, reduce ratele de fals negativ și are valori de corelație superioare în comparație cu abordările standard.
Mai presus de implicațiile sale imediate pentru procesarea limbajului natural și analiza sentimentelor, cercetarea promite să îmbunătățească algoritmul de analiză a sentimentelor, instrumentele de monitorizare a rețelelor sociale și sistemele automate de sprijin pentru clienți.
A fost creat Copilul AI! Cine și de ce a făcut asta?
Oamenii de știință susțin că chatboții încep să înțeleagă lumea
Duolingo concediază traducători în favoarea Inteligenței Artificiale