Upitno porijeklo podataka Metinog AI modela za prijevode i transkripciju govora

Facebookova matična tvrtka Meta Platforms danas je objavila model umjetne inteligencije sposoban za prijevode i transkripciju govora na više desetaka jezika, što je potencijalni temelj za alate koji omogućuju komunikaciju u stvarnome vremenu premošćujući jezične podjele.

Takve podjele predstavljaju jaz među različitim jezicima s obzirom na njihovu funkcionalnu održivost i zastupljenost na internetu.

Model koji podržava prijevode teksta i govora na skoro sto jezika

Tvrtka je u postu na svome blogu objavila da njezin model SeamlessM4T podržava prijevode teksta i govora na gotovo stotinu jezika, kao i potpuni prijevod govora u govor za 35 jezika, kombinirajući pritom tehnologiju koja je prije bila dostupna samo u zasebnim modelima.

Izvršni direktor Mete Mark Zuckerberg rekao je da ima viziju alata koji olakšavaju interakcije među korisnicima iz cijelog svijeta u metaverzumu.

U postu na blogu stoji i to da Meta stavlja svoj model na raspolaganje javnosti za nekomercijalnu upotrebu.

Zuckerberg: Otvoreni ekosustav umjetne inteligencije ide u korist Mete

Najveća svjetska tvrtka za društvene medije ove je godine objavila mnoštvo uglavnom besplatnih AI modela. Među njima je i veliki jezični model LLaMA (Large Language Model Meta AI), osmišljen kako bi pomogao istraživačima umjetne inteligencije da unaprijede svoj rad na ovome polju.

Zuckerberg kaže da otvoreni ekosustav umjetne inteligencije ide u korist Mete, s obzirom na to da tvrtka dobiva više učinkovitim crowd-sourcingom za stvaranje alata namijenjenih korisnicima za svoje društvene platforme nego naplaćivanjem pristupa modelima.

Unatoč tomu Meta je suočena sa sličnim pravnim pitanjima kao i ostatak industrije kada su posrijedi podaci o poduci uneseni za izradu modela.

Porijeklo audiopodataka

U srpnju su stand-up komičarka Sarah Silverman i još dvoje autora podnijeli tužbe za kršenje autorskih prava protiv Mete i OpenAI-ja, optuživši ih da su neovlašteno koristili njihov sadržaj za jezičnu poduku umjetne inteligencije. Sadržaj je bio zaštićen autorskim pravima, a Meta i OpenAI koristili su ga za poduku robota za chat.

Kada je riječ o modelu SeamlessM4T, istraživači Mete u svome istraživačkom radu tvrde da su podatke o audiopoduci prikupili s četiri milijuna sati "sirovog zvuka koji potječe iz javno dostupnog repozitorija indeksiranih internetskih podataka", no nisu naveli o kojem se repozitoriju radi.

Glasnogovornik Mete nije odgovorio na pitanja o porijeklu audiopodataka. U njihovom istraživačkom radu stoji i to da tekstualni podaci potječu iz skupova podataka koji su kreirani prošle godine, a sadržaje su izvukli s Wikipedije i sličnih internetskih stranica.

Upitno porijeklo podataka Metinog AI modela za prijevode i transkripciju govora

Model koji podržava prijevode teksta i govora na skoro sto jezika

Zuckerberg: Otvoreni ekosustav umjetne inteligencije ide u korist Mete

Porijeklo audiopodataka

Pročitajte više

Rusi srušili putnički avion sa 67 ljudi? "Pogodili su ga i poslali u Kazahstan"

Umro bivši indijski premijer

Objavljena jedna od zadnjih anketa prije izbora, pogledajte rezultate

Finska obalna straža upala na ruski tanker zbog sabotaže, objavili fotografije

Niko Tokić Kartelo piše za Index: Zašto bi građani trebali glasati za mene

Tročlana obitelj otrovala se monoksidom u BiH

Najmanje 6000 zatvorenika pobjeglo iz najbolje čuvanog zatvora u Mozambiku

Nikica Jelavić najavio presicu, tvrdi da će objaviti dokaze da Kekin i Benčić lažu

Primorac: Milanović više ne može voditi Hrvatsku

Peru proglasio ekološku nepogodu nakon izlijevanja nafte u ocean

Putin optužio Ukrajinu za prekid isporuke plina Europi

Zoran Milanović piše za Index: Zašto bi građani trebali glasati za mene

Trebalo je skoro 2 godine, ali velik broj njemačkih Leoparda konačno stiže u Ukrajinu

Zelenski: Razgovarao sam s Vučićem, hvala Srbiji

Bivši američki ambasador u Hrvatskoj i Srbiji: SAD-u nije u interesu rušenje Vučića

Vrijeme se konačno stabilizira, ali jutra će biti hladna

Nova sabotaža važnog kabela u Baltiku? Finska obalna straža upala na ruski brod

Trump nakon izjava o preuzimanju Panamskog kanala imenovao ambasadora za Panamu

Zatvoreni svi aerodromi u Moskvi

U Sloveniji nađeno tijelo nestalog mađarskog planinara

Žrnovnica obranjena od požara, situacija se smiruje. Vatrogasci ostaju na terenu

Uhićen Dodikov ministar

Muškarac ušao u crkvu kod Pariza i počeo vikati "Allahu Akbar"

Ivana Kekin piše za Index: Zašto bi građani trebali glasati za mene

Milanović: Spriječit ću svaki pokušaj stranačkog ovladavanja institucijama

Od sutra se smije koristiti pirotehnika. Policija objavila što je dozvoljeno

Izvori iz vlade Azerbajdžana: Pad aviona uzrokovala je ruska raketa

Izraelci žestoko napali aerodrom u Jemenu. U trenutku napada tamo je bio i šef WHO-a

Amerika potiče utrku u svemirskom naoružanju, tvrdi Kina

Lozo: Možda bi se trebala povući statistika o tome koliko djece imaju svi kandidati

Niko Tokić Kartelo piše za Index: Zašto bi građani trebali glasati za mene

Peru proglasio ekološku nepogodu nakon izlijevanja nafte u ocean

Umro bivši indijski premijer

Najmanje 6000 zatvorenika pobjeglo iz najbolje čuvanog zatvora u Mozambiku

Finska obalna straža upala na ruski tanker zbog sabotaže, objavili fotografije