Home » Știință » Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi

Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi

Inteligența Artificială de la Meta, fostul Facebook, poate recunoaște peste 4.000 de limbi
Sursa foto: Shutterstock
Publicat: 28.05.2023

Meta a creat un model de limbaj bazat pe Inteligența Artificială (AI) care, în mod surprinzător, nu este o clonă ChatGPT. Proiectul Massively Multilingual Speech (MMS) al companiei poate recunoaște peste 4.000 de limbi și poate comunica în peste 1.100 de limbi. La fel ca majoritatea celorlalte proiecte de Inteligență Artificială anunțate public, Meta a creat MMS pentru a contribui la păstrarea diversității lingvistice și pentru a încuraja cercetătorii să se bazeze pe fundația sa.

„Împărtășim în mod public modelele și codul nostru, astfel încât și alte persoane din comunitatea de cercetare să poată construi pe baza muncii noastre. Prin această muncă, sperăm să aducem o mică contribuție la conservarea diversității lingvistice incredibile din lume”, a scris compania, potrivit Engadget.

Modelele de recunoaștere a vorbirii și de transformare a textului în vorbire necesită, de obicei, o pregătire pe mii de ore de înregistrări audio cu etichete de transcriere însoțitoare. Etichetele sunt esențiale pentru învățarea automată, deoarece permit algoritmilor să clasifice corect și să „înțeleagă” datele. Dar pentru limbile care nu sunt utilizate pe scară largă în țările industrializate – multe fiind în pericol de dispariție în următoarele decenii – „aceste date pur și simplu nu există”, după cum a transmis Meta.

Meta a folosit o abordare neconvențională

Meta a folosit o abordare neconvențională pentru colectarea datelor audio: a apelat la înregistrări audio ale textelor religioase traduse.

„Ne-am orientat către texte religioase, cum ar fi Biblia, care au fost traduse în multe limbi diferite și ale căror traduceri au fost studiate pe scară largă pentru cercetarea traducerilor bazate pe text. Aceste traduceri au și înregistrări audio disponibile public ale unor persoane care citesc aceste texte în diferite limbi”, a declarat compania.

Prin încorporarea înregistrărilor neetichetate ale Bibliei și ale unor texte similare, cercetătorii Meta au crescut numărul de limbi disponibile ale modelului la peste 4.000.

„Deși conținutul înregistrărilor audio este religios, analiza noastră arată că acest lucru nu influențează modelul să producă un limbaj mai religios. Credem că acest lucru se datorează faptului că folosim o abordare de clasificare temporală conectică (CTC), care este mult mai constrânsă în comparație cu modelele mari de limbaj (LLM) sau modelele secvență-la-secvență pentru recunoașterea vorbirii”, a scris Meta.

Meta a avertizat că noile sale modele nu sunt perfecte

Combinarea surselor de date neconvenționale și a unui model de vorbire autosupravegheat a condus la rezultate impresionante.

„Rezultatele noastre arată că modelele Massively Multilingual Speech au performanțe bune în comparație cu modelele existente și acoperă de zece ori mai multe limbi”, a transmis Meta.

Totuși, Meta a avertizat că noile sale modele nu sunt perfecte.

„De exemplu, există un anumit risc ca modelul speech-to-text să transcrie greșit anumite cuvinte sau fraze. În funcție de rezultat, acest lucru ar putea duce la un limbaj ofensator și/sau inexact. Continuăm să credem că o colaborare în cadrul comunității de Inteligență Artificială este esențială pentru dezvoltarea responsabilă a tehnologiilor de AI”, a scris compania.

Vă mai recomandăm și: 

Omul din spatele ChatGPT vrea să scaneze ochii tuturor oamenilor de pe Pământ

Inteligența Artificială îi va prinde pe cei care aruncă gunoiul din mașină

Ar putea Inteligența Artificială să egaleze vreodată inteligența umană?

Chatbotul Bard de la Google a vorbit într-o limbă în care nu a fost antrenat

Claudia Cociug
Claudia Cociug
Claudia Cociug, absolventă a Facultății de Litere, specializarea Jurnalism și Științe ale Comunicării din cadrul Universității „Alexandru Ioan Cuza” din Iași, a făcut parte din echipa DESCOPERĂ.ro din noiembrie 2022 și până în iunie 2023. citește mai mult
Urmărește DESCOPERĂ.ro pe
Google News și Google Showcase
Cele mai noi articole
Apa minerală carbogazoasă poate ajuta la slăbit, susțin cercetătorii din Japonia
Apa minerală carbogazoasă poate ajuta la slăbit, susțin cercetătorii din Japonia
Arheologii au scos la lumină noi indicii despre Templul Mortuar al Reginei Hatșepsut
Arheologii au scos la lumină noi indicii despre Templul Mortuar al Reginei Hatșepsut
Vești proaste pentru călătoriile interstelare! Navele spațiale ar putea pierde contactul cu Pământul
Vești proaste pentru călătoriile interstelare! Navele spațiale ar putea pierde contactul cu Pământul
Mega-evenimentul care ar fi reumplut Marea Mediterană în urmă cu 5 milioane de ani
Mega-evenimentul care ar fi reumplut Marea Mediterană în urmă cu 5 milioane de ani
Cele mai frecvente greșeli în timpul examenelor de matematică și cum să le eviți (P)
Cele mai frecvente greșeli în timpul examenelor de matematică și cum să le eviți (P)
De unde provin piesele din mozaicul lui Alexandru cel Mare? Iată ce arată cele mai noi analize!
De unde provin piesele din mozaicul lui Alexandru cel Mare? Iată ce arată cele mai noi analize!
102 ani mai târziu, Nosferatu de atunci și Nosferatu de acum
102 ani mai târziu, Nosferatu de atunci și Nosferatu de acum
Robert Eggers, regizorul filmului Nosferatu. „Cu cât încerci mai mult să te îndepărtezi de întuneric, cu atât mai mult întunericul este chiar în spatele tău”
Robert Eggers, regizorul filmului Nosferatu. „Cu cât încerci mai mult să te îndepărtezi de întuneric, cu atât mai ...
Primul chatbot din lume, ELIZA, a fost „reînviat” folosind cod vechi de 60 de ani
Primul chatbot din lume, ELIZA, a fost „reînviat” folosind cod vechi de 60 de ani
Este oficial: un sondaj global confirmă că lumea are încredere în știință!
Este oficial: un sondaj global confirmă că lumea are încredere în știință!
Test de cultură generală. Care este cel mai scump lichid din lume?
Test de cultură generală. Care este cel mai scump lichid din lume?
„Majoronul”, particula bizară care ar putea explica cele mai mari mistere ale Universului
„Majoronul”, particula bizară care ar putea explica cele mai mari mistere ale Universului
Elefanții nu au dreptul la eliberare din captivitate pentru că nu sunt oameni, a decis o instanță americană
Elefanții nu au dreptul la eliberare din captivitate pentru că nu sunt oameni, a decis o instanță americană
Amendă uriașă pentru Google în Indonezia! Cum ar fi abuzat gigantul tehnologic de poziția sa pe piață?
Amendă uriașă pentru Google în Indonezia! Cum ar fi abuzat gigantul tehnologic de poziția sa pe piață?
O pisică a avut parte de voiajul vieții sale după ce a fost uitată în cala unui avion
O pisică a avut parte de voiajul vieții sale după ce a fost uitată în cala unui avion
Unul dintre cei mai culţi domni ai Ţării Româneşti
Unul dintre cei mai culţi domni ai Ţării Româneşti
OpenAI şi SoftBank își unesc forțele într-un proiect masiv de infrastructură pentru inteligenţa artificială
OpenAI şi SoftBank își unesc forțele într-un proiect masiv de infrastructură pentru inteligenţa artificială
Doar jumătate de felie de bacon pe zi poate crește riscul de demență
Doar jumătate de felie de bacon pe zi poate crește riscul de demență