Acest algoritm poate să prezinte ideea centrală a unui articol pe care cercetătorii îl consideră foarte lung.
Institutul Allen pentru Inteligență Artificială din Seattle a prezentat recent un sistem care oferă o condensare extremă a unor studii lungi pentru a reduce timpul necesar pentru a analiza literatura de specialitate, notează Tech Xplore.
Semantic Scholar este un instrument de cercetare care folosește inteligența artificială (AI) și este utilizat pentru cercetarea științifică. Cu noua sa caracteristică de rezumare, studiază un număr mare de lucrări de cercetare științifică și le reduce la o singură frază. Peste 7 milioane de utilizatori pe lună au accesat Semantic Scholar până acum.
În prezent, există 10 milioane de lucrări de informatică în baza de date a Semantic Scholar. Potrivit lui Dan Weld, care supraveghează baza de date, vor fi adăugate treptat lucrări și din alte discipline.
Sistemul oferă un mare avantaj cercetătorilor care până acum au trebuit să se bazeze pe scanarea a numeroase titluri și a rezumatelor deseori lungi, o sarcină deosebit de dificilă pe dispozitivele mobile. În urma testelor inițiale, reacția a fost pozitivă. „Oamenilor par să fie încântați”, explică Weld.
Au existat o varietate de programe de procesare a limbajului natural dezvoltate de-a lungul anilor pentru a rezuma documentele. În general, utilizează una dintre cele două abordări: abordarea extractivă se concentrează pe selectarea textului reprezentativ și utilizarea acestuia textual în rezumat. De exemplu, Paper Digest, dezvoltat în 2018, pare să extragă propoziții cheie mai degrabă decât să rescrie concluziile în propriile sale cuvinte.
Cealaltă abordare este abstractivă și folosește algoritmi de generare a limbajului natural pentru a crea rezumate cu o formulare originală. Îmbunătățirile în generarea limbajului natural al algoritmilor în ultimii ani au făcut ca această abordare să fie cea preferată în rândul programatorilor.
Semantic Scholar iese în evidență pentru obținerea celei mai mari rate de compresie dintre toate instrumentele din aceeași gamă. Cu lucrări științifice în medie de 5.000 de cuvinte, rezumatele Semantic Scholar sunt în jur de 21 de cuvinte. Aceasta înseamnă în medie la rezumatele 1/238 din dimensiunea articolelor inițiale. Cel mai apropiat competitor Semantic Scholar comprimă documentele doar la 1/36 din dimensiunea raportului.
MIT a creat un algoritm care poate descifra limbile antice
O bună înțelegere a fizicii ar putea duce la crearea unor algoritmi mai performanți
Un algoritm permite obținerea unui portret pornind de la imagine pixelată