O nouă abordare matematică poate simplifica modul în care sunt antrenați algoritmii de inteligență artificială
Această nouă abordare va permite antrenarea unor algoritmi folosind seturi de date mai mici.
O pereche de statisticieni de la Universitatea Waterloo, Canada, a propus o idee de proces matematic care ar putea permite antrenarea algoritmilor de inteligență artificială (AI) fără a fi nevoie de un set de date extins. Ilia Sucholutsky și Matthias Schonlau au scris o lucrare care descrie ideea lor și a publicat-o pe serverul de arXiv, notează Tech Xplore.
Aplicațiile inteligenței artificiale au făcut obiectul multor cercetări în ultima vreme. Odată cu dezvoltarea rețelelor de deep learning, cercetătorii dintr-o gamă largă de domenii au început să găsească utilizări pentru aceasta, inclusiv crearea de videoclipuri deepfake, jocuri video și stabilirea diagnosticelor medicale.
Limitările actuale ale tehnologiei
Rețelele de deep learning necesită seturi de date mari pentru a detecta modele care dezvăluie modurile în care poate fi realizată o sarcină, cum ar fi identificarea unui anumit chip dintr-o mulțime, iar în acest nou studiu cercetătorii au căutat o modalitate de a reduce dimensiunea setului de date. Aceștia au plecat de la observația simplă că copiii trebuie să vadă doar câteva poze cu un animal pentru a recunoaște alte exemple. Fiind statisticieni, s-au întrebat dacă ar putea exista o modalitate de a folosi matematica pentru a rezolva această problema.
Cercetătorii s-au bazat pe o cercetare recentă a unei echipe de la MIT, care a demonstrat că selectarea celor mai pertinente informații care descriu numere scrise de mână într-un set de date cunoscut sub numele de MNIST și împachetarea lor a redus mult numărul de caractere de care sistemul lor AI avea nevoie pentru a învăța să recunoască literele într-un nou set de date.
Rezultatele noii abordări
Oamenii de știință au remarcat faptul că motivul pentru care sistemul a reușit să învețe cu mult mai puține date este faptul că a fost instruit să recunoască numerele într-un mod nou: în loc să-i arate numărul de 3 mii de ori, l-au instruit să recunoască faptul că ținta era un număr care arăta oarecum, 30% ca cifra 8, și așa mai departe cu alte cifre. Ei au numit aceste indicii „soft labels” (etichete slabe).
Apoi au dus această idee mai departe, aplicând-o unui tip de învățare automată numit kNN, k-nearest, care le-a permis să-și transfere ideea într-o abordare grafică. Folosind această abordare, au reușit să aplice etichete diferitelor seturi de date care descriu coordonatele XY pe un grafic. Ca rezultat, sistemul AI a fost antrenat să plaseze puncte pe un grafic pe partea corectă a unei linii pe care au trasat-o fără a fi nevoie de un set de date mare.
Autorii studiului sugerează că ar putea fi posibilă extinderea acestei abordări în alte domenii, deși recunosc că există încă un obstacol major de depășit. Sistemul necesită în continuare un set de date mare pentru a începe procesul de selectare a datelor relevante.
Studiul citat a fost publicat pe serverul arXiv.
Citește și:
Microsoft a creat un algoritm care detectează deepfake-ul
Măștile ne protejează de algoritmii de recunoaștere facială
O bună înțelegere a fizicii ar putea duce la crearea unor algoritmi mai performanți