Biblia ajută cercetătorii în elaborarea algoritmilor mai buni de traducere
Instrumentele digitale pentru traducerea textelor între limbi precum engleză şi spaniolă sunt disponibile la scară mare. Crearea translatorilor de stil – instrumente care păstrează textul în aceeaşi limbă dar transformă stilul – au fost mai dificil de creat. Eforturile de a crea astfel de translatori a fost încetinit, în parte, de dificultatea de a obţine volumul enorm necesar de date. Aici, echipa de cercetare a apelat la Biblie, scrie Tech Xplore.
Conform studiului publicat recent în jurnalul Royal Society Open Science, nu este primul set de date parelele creat pentru traducerea stilului, dar este primul care foloseşte Biblia ca sursă de date. Motivul care face ca Biblia să fie o sursă ideală este simplă: cărţile cuprinse în aceasta au fost traduse de multe ori, în diferite stiluri. „Biblia în limba engleză vine în diferite stiluri scrise, făcând din ea o sursă perfectă pentru traducerea de stil”, a precizat Keith Carlson, autorul principal al studiului.
Un alt avantaj al Bibliei este acela că este indexată foarte bine de utilizarea consistentă şi frecventă a lucrării şi de numerotarea capitolelor şi versetelor, eliminând astfel riscul erorilor de aliniere care ar fi cauzate de metodele automatice de a compara diferitele versiuni ale aceluiaşi text.
„Biblia este un set de date ‘divin’ cu care poţi lucra pentru această sarcină. Oamenii au organizat textele biblice timp de secole, astfel că nu trebuia să ne bazăm pe algoritmii de aliniere ineficienţi”, a precizat Daniel Rockmore, un membru al echipei de cercetare.
Vă recomandăm să citiţi şi următoarele articole:
5 dintre cele mai mari controverse legate de informaţiile prezentate în Biblie – FOTO+VIDEO
Textul secret ascuns sub un pasaj din Biblie. Experţii speră să rezolve un mister de sute de ani
Mai multe texte scrise în limbi dispărute au fost descoperite în cea mai veche bibliotecă din lume
Inteligenţa Artificială a transformat Google Translate şi are capacitatea să reinventeze IT-ul