Gre za obsežen korpus na 12.945 straneh, kolikor zasedejo prepisi 45 knjižnih del besedil slovenskih protestantskih piscev 16. stoletja.

Če bomo iskali kakšen citat, ga bomo zdaj brez težav našli z iskalnikom, pravi Kozma Ahačič. Foto: BoBo
Če bomo iskali kakšen citat, ga bomo zdaj brez težav našli z iskalnikom, pravi Kozma Ahačič. Foto: BoBo

Začetek prepisovanja del slovenskih protestantskih piscev sega v leto 2010. Razen za prepis svetopisemskih knjig Biblije Jurija Dalmatina, ki jih je odstopila Svetopisemska družba Slovenije, so za vse poskrbeli v podjetju CyberData India iz New Delhija. Delo prepisa tako zajetnega volumna je potekalo v več fazah. Najprej je bil na vrsti ročni prepis besedil s pomočjo omenjenega indijskega podjetja po metodi dvojnega prepisa, kar pomeni, da dva prepisovalca prepišeta enako besedilo, tretji pa uskladi mesta, kjer je prepis različen. Sledilo je pregledovanje prepisov, ki je potekalo primerjalno z besedilnimi viri, nato pa še postopek, ki omogoča večjo povezljivost in lažje strojno branje besedil.

Korpus besedil slovenskih protestantskih piscev 16. stoletja obsega prepise 45 knjižnih del na 12.945 straneh. Foto: BoBo
Korpus besedil slovenskih protestantskih piscev 16. stoletja obsega prepise 45 knjižnih del na 12.945 straneh. Foto: BoBo

"Tako pripravljena besedila so objavljena kot korpus na spletni strani, ki ima poleg korpusne tudi izobraževalno funkcijo, saj si lahko na enem mestu pregledno ogledamo tako rekoč celotno slovensko knjižno produkcijo 16. stoletja," pravi Kozma Ahačič, predstojnik Inštituta za slovenski jezik Frana Ramovša ZRC SAZU.

Ahačič je bil hkrati glavni urednik prepisa. Področni urednici sta bili Andreja Legan Ravnikar in Alenka Jelovšek, obe prav tako z Inštituta za slovenski jezik Frana Ramovša ZRC SAZU.

"Sodobnega Slovenca bo zanimala naslovnica knjige: kaj je bilo napisano, kdo je kaj napisal itd. Če bomo iskali kakšen citat, ga bomo zdaj brez težav našli z iskalnikom. V šolah bodo lahko učitelji izbrali poljuben odlomek in ga natisnili," je o prednostih novega spletišča dejal Ahačič, ki je tudi sam strokovnjak za jezik slovenskih protestantskih piscev v 16. stoletju. Še bolj pa bo, kot so zapisali na Inštitutu za slovenski jezik Frana Ramovša ZRC SAZU, korpus uporaben za raziskovanje slovenščine in slovenske književnosti.

Ahačič je ob tem poudaril, da so vsa besedila na voljo brezplačno, kakor bi si želel tudi Trubar.

Profil: dr. Kozma Ahačič