CJVT, ki gradi veliki jezikovni model za slovenščino GaMS, je z dopisom pozval k sodelovanju v zbiralni akciji besedil. V okviru akcije je mogoče prispevati pisna in govorjena besedila. Foto: CJVT
CJVT, ki gradi veliki jezikovni model za slovenščino GaMS, je z dopisom pozval k sodelovanju v zbiralni akciji besedil. V okviru akcije je mogoče prispevati pisna in govorjena besedila. Foto: CJVT

Kot so zapisali pri Zbornici knjižnih založnikov in knjigotržcev, hiter razvoj umetne inteligence odpira številna nova vprašanja glede uporabe založniških del, ki se dotikajo temeljnih dilem avtorstva, pravic uporabe in pravične delitve vrednosti, pri čemer je med najbolj perečimi vprašanji raba avtorskih del v velikih jezikovnih modelih. Slednji za svoje delovanje potrebujejo obsežne korpuse besedil, ki pogosto vključujejo članke in knjižna dela, za katera podjetja, ki razvijajo te modele, nimajo vselej niti soglasja imetnikov avtorskih pravic.

Sorodna novica ChatGPT-ju podoben slovenski jezikovni model, ki bo na vprašanja odgovarjal v slovenščini

Imetniki avtorskih pravic ne dobijo nobenega nadomestila
Poudarili so, da so avtorska besedila rezultat dolgotrajnega ustvarjalnega in intelektualnega procesa, v katerem sodelujejo avtorji, uredniki, prevajalci, lektorji, založniki in drugi. Čeprav veliki jezikovni modeli pogosto črpajo iz tovrstnih del za tehnološke in komercialne cilje, deležniki v knjižni verigi ne prejemajo nadomestila za njihovo uporabo. Obenem ostaja meja med javnim interesom in znanstveno rabo velikih jezikovnih modelov na eni strani ter komercialnimi interesi zasebnih podjetij na drugi pogosto nejasna. Menijo, da vse večja razširjenost velikih jezikovnih modelov, postavlja vprašanje pravične in trajnostne ureditve tega razmerja ter ustreznega priznanja prispevka imetnikov avtorskih pravic k razvoju nove tehnologije.

Poziv k dialogu in odprta vprašanja
Opozarjajo, da je za oblikovanje pravičnih rešitev potreben dialog med vsemi deležniki ter da je ključno, da se založniki proaktivno vključijo v oblikovanje rešitev, ki bodo ščitile interese avtorjev, založnikov in drugih deležnikov ter hkrati omogočale odgovorno in zakonito uporabo književnih in drugih založniških del pri razvoju umetne inteligence.

Na Društvu slovenskih književnih prevajalcev (DSKP) pa so na Center za jezikovne vire in tehnologije (CJVT) v zvezi z akcijo zbiranja besedila za razvoj slovenskega velikega jezikovnega modela naslovili nekaj vprašanj, prav tako povezanih z avtorskimi pravicami ter zaščito del pred nepooblaščeno rabo in širjenjem. Med drugim jih zanima tudi, kakšna je metodologija, na kakšen način bodo upoštevani etični standardi ter ali se za uporabo besedil, npr. celotnih knjig, predvideva denarno nadomestilo.

Kot so zapisali, odgovorov še niso prejeli, prav tako še čakajo na termin sestanka s predstavniki CJVT-ja. Z zadevo so sicer seznanili tudi druga avtorska združenja – Društvo slovenskih pisateljev, Slovenski center PEN, Društvo slovenskih literarnih kritikov ter večino prevajalskih in tolmaških društev.

Ker, kot so zapisali, ostajajo, tudi če gre za javno dostopen, nekomercialen model, številna vprašanja v zvezi z avtorsko zaščitenim gradivom še odprta, se do zbiralne akcije opredeljujejo s pridržkom.

CJVT, ki gradi veliki jezikovni model za slovenščino GaMS, je z dopisom pozval k sodelovanju v zbiralni akciji besedil. V okviru akcije, ki jo koordinira Fakulteta za računalništvo in informatiko v Ljubljani, je mogoče prispevati pisna in govorjena besedila. Akcija poteka v letih 2024 in 2025 v okviru raziskovalnega programa PoVeJMo (Prilagodljiva obdelava naravnega jezika s pomočjo velikih jezikovnih modelov), ki ga sofinancira Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost RS.