Zavod AI-D je prispeval besedila velikemu jezikovnemu modelu za slovenščino GaMS, ki ga v okviru projekta PoVeJMo razvijajo na Centru za jezikovne vire in tehnologije Univerze v Ljubljani.
Velik generativi jezikovni model za slovenščino GaMS (generativni model za slovenščino) s tem zanimivim imenom stoji ob drugih odprtokodnih jezikovnih modelih, kot so LLaMA, Alpaca in Koala.
Da bo veliki jezikovni model dobro znal slovensko, raziskovalci zbirajo besedila v obsegu 40 milijard besed, kar pa jim predstavlja velik izziv, saj govori slovensko le 2 milijonoma ljudi. Virov je malo, podatki so omejeni in v tej luči vodje projekta organizirajo nacionalne zbiralne akcije pisnih in govorjenih besedil v slovenščini.
Zavod AI-D je prispeval besedila, ki so nastala v okviru njegovega delovanja, kot so novičniki za člane in članice ter objave na spletni strani.
Raziskovalci s FRI k prispevanju besedil vabijo prav vsakogar, tudi vas. Besedila so že prispevali medijske hiše Dnevnik, Vestnik in nedavno tudi Slovenska tiskovna agencija (STA), predsednica Republike Slovenije dr. Nataša Pirc Musar, … Če milijon Slovencev prispeva besedila, bi moral vsak oddati 80 Wordovih strani (Times New Roman, velikost 12, enojni razmik).
Dobrodošla so vsa pisna besedila v digitalni obliki, posneta govorjena besedila in tudi rokopisno gradivo. Oddajate lahko zabeležke, elektronska sporočila, prošnje, blogovske zapise, zapise na družbenih omrežjih ipd., ali specializirana besedila z določenega strokovnega področja, članke, poročila ipd. Ni važno, ali so besedila standardna, nestandardna, lektorirana ali nelektorirana. Pomembno je le, da imate za oddana besedila avtorske pravice.
Kje oddajti? Na Povejmo.si.