Princ Evgen Savojski je imel eno največjih baročnih knjižnic in menda je vse knjige v njej vsaj prelistal. Foto: Wikipedia
Princ Evgen Savojski je imel eno največjih baročnih knjižnic in menda je vse knjige v njej vsaj prelistal. Foto: Wikipedia

Leta 1716 je francoski pesnik in dramatik Jean-Baptiste Rousseau, ki se je kot domnevni avtor žaljivih verzov znašel v izgnanstvu in bil nekaj časa varovanec princa Evgena Savojskega (1663–1736), v pismu nekemu prijatelju zapisal, da "ne obstaja skorajda nič, česar princ ne prebere ali vsaj prelista, preden gre h knjigovezu (da bi si zagotovil svojo kopijo, op. P. B.)." Prav tako se mu je zdelo skoraj neverjetno, da mož, ki ga pestijo 'vse' skrbi Evrope, ki je generalni poročnik cesarstva in cesarjev prvi minister, bere tako veliko kot nekdo, ki nima nič drugega početi.

Knjižnica princa Evgena Savojskega je bila ogromna: obsegala je več kot 15.000 knjig, 237 rokopisov in tudi izjemno zbirko grafik. Tudi sicer je bil princ Evgen Savojski velik podpornik umetnosti. Nagrade za izbojevane vojaške zmage, deleži vojnega plena, dohodki iz opatij, ki jih je posedoval, stalen dotok dohodkov iz različnih funkcionarskih položajev – vse to mu je omogočalo investicije v umetnost; med drugim v razvoj baročne arhitekturne krajine, česar krasen primerek je dvorec Belvedere na Dunaju.

Digitalna rekonstrukcija baročne knjižnice
Evgen Savojski ni imel otrok. Vse njegovo premoženje je dobila princesa Maria Anna Victoria, ki pa je dediščino razprodala in postopoma so se Evgenove zbirke znašle v več avstrijskih nacionalnih zbirkah. Skupina strokovnjakov, ki delujejo v različnih znanostih, pa že nekaj časa pripravlja projekt avstrijske akademije znanosti Bibliotheca Eugeniana Digital. Razvijajo digitalno rekonstrukcijo te znamenite baročne knjižnice.

Od leta 1738 je bila knjižnica del habsburške dvorne knjižnice, danes jo hrani avstrijska narodna knjižnica. Obiskovalcem te knjižnice je rečeno, da lahko knjižnico vidijo v sijajni ovalni dvorani (Prunksaal), vendar to ne drži povsem. Popolnih podatkov o tem, kaj vse je knjižnica obsegala in kolikšen del je dejansko na ogled v avstrijski narodni knjižnici (ANK), namreč ni.

Ekipa projekta poskuša predvsem s pomočjo opreme za strojno učenje digitalizirati na roke napisan historični katalog in arhivsko gradivo, povezano s preureditvijo knjižnice v 19. stoletju. Prav tako poteka primerjanje historičnega kataloga z modernim katalogom avstrijske narodne knjižnice, kar pa je zahtevno tudi zaradi različnih sistemov katalogiziranja v preteklosti in v današnjem času.

Neprecenljivi stari katalogi
Kot je povedala ena od predstavnic ekipe, poskušajo sestaviti zgodbe o posameznih knjigah; kaj se je z njimi zgodilo, kam vse so potovale. Raziskovalni ekipi sicer ni treba fizično premikati knjig in jih skenirati; večina knjig je bila namreč že digitalizirana v okviru projekta Austrian Books Online. Kot smo slišali na konferenci, je eno ključnih orodij ekipe digitalizirani historični katalog z začetka 18. stoletja. Pri identifikaciji knjig princa Evgena pomaga tudi to, da so bile tako rekoč vse vezane na enak način, na sredini naslovnice pa so imele grb princa Evgena.

Tokratno konferenco je pripravila ekipa NUK-a, ustanove, ki je prvi večji projekt digitalizacije kulturne dediščine izvedla v letu 1996, kar pomeni, da je bila Slovenija že od samih začetkov razvoja digitalnih vsebin v kulturi med vodilnimi državami. Foto: NUK
Tokratno konferenco je pripravila ekipa NUK-a, ustanove, ki je prvi večji projekt digitalizacije kulturne dediščine izvedla v letu 1996, kar pomeni, da je bila Slovenija že od samih začetkov razvoja digitalnih vsebin v kulturi med vodilnimi državami. Foto: NUK

Kako obsežen je projekt rekonstrukcije knjižnice princa Evgena, pove tudi to, da zbirka knjig, ki so bile natisnjene med začetkom 16. stoletja in letom 1736, ko je princ Evgen umrl, in ki jo danes poseduje ANK, obsega okoli 120.000 knjig. Ročno jih toliko ne bi mogli pregledati. S pomočjo strojnega učenja pa lahko identificirajo naslovnice, ki dopuščajo sklep, da gre za knjige iz knjižnice princa Evgena.

Pri identifikaciji knjig se pojavljajo še drugi izzivi: denimo zapis avtorjev knjige, ki so v historičnem katalogu zapisani v genitivu in tako oprema za identifikacijo podob ne zna povezati imen iz historičnega kataloga z zapisom imen v sodobnem katalogu. Prav tako je bila lokacija izdaje nekoč praviloma zapisana s kratico imena kraja, česar računalnik ponovno ne zna povezati z zapisom v sodobnem katalogu.

Barva naslovnic razkriva temo
Zanimiv je bil tudi podatek o tem, da je nekoč barva vezave razkrivala tematiko oziroma polje vedenja, v katero je sodila vsebina posamezne knjige. To sicer ni veljalo v vseh primerih, vendar v primeru knjig iz knjižnice princa Evgena in sploh za tisti čas je bilo značilno, da so bile v rdečo barvo vezane knjige iz tematike zgodovine in poezije, rumene so bile naravoslovne znanosti, modre pa teološke knjige in knjige s področja prava. A, kot rečeno, to ne drži vedno.

Prispevek avstrijske ekipe je izpostavil pomen uporabe umetne inteligence v raziskovalnem delu, povezanem z ugotavljanjem provenience knjižnega gradiva. In ni bil edini. Ines Vodopivec, vodja organizacije dogodka v Ljubljani, v. d. pomočnice za strokovno delo Narodne in univerzitetne knjižnice in članica upravnega odbora mreže Europeana, nam je povedala: "Razvoj digitalnih knjižnic je šel čez vsaj tri faze – najprej so bili posamezni projekti digitalizacije, potem je bilo obdobje množične digitalizacije, ko je bilo digitaliziranih milijone objektov in podatkov, zdaj pa smo v fazi, ko moramo biti sposobni po teh podatkih primerno iskati in prikazati za uporabnike smiselne rezultate. Ali še več, razumeti uporabnike in njihove zahteve ter jih uspešno voditi po naših digitalnih zbirkah. Sodobna orodja in tehnologije nam namreč omogočajo boljšo obdelavo podatkov, oblikovanje zbirk podatkov, ne samo iz digitalizirane dediščine, temveč tudi iz izvorno digitalnih zapisov, na primer iz arhiva spleta, torej iz podatkov iz zajema spleta, kar NUK dela na nacionalni ravni."

Ines Vodopivec iz NUK-a, nam je povedala, da je šel razvoj digitalnih knjižnic čez vsaj tri faze – najprej so bili posamezni projekti digitalizacije, potem je bilo obdobje množične digitalizacije, ko je bilo digitaliziranih milijone objektov in podatkov, zdaj pa smo v fazi, ko moramo biti sposobni po teh podatkih primerno iskati in prikazati za uporabnike smiselne rezultate. Foto: NUK
Ines Vodopivec iz NUK-a, nam je povedala, da je šel razvoj digitalnih knjižnic čez vsaj tri faze – najprej so bili posamezni projekti digitalizacije, potem je bilo obdobje množične digitalizacije, ko je bilo digitaliziranih milijone objektov in podatkov, zdaj pa smo v fazi, ko moramo biti sposobni po teh podatkih primerno iskati in prikazati za uporabnike smiselne rezultate. Foto: NUK

Začetki digitalizacije v 90. letih
Osrednji slovenski projekt na področju digitaliziranja in omogočanja dostopnosti raznovrstnega gradiva na spletu je dLIB – Digitalna knjižnica Slovenija, ki deluje v okviru NUK-a. "Narodna in univerzitetna knjižnica je prvi večji projekt digitalizacije kulturne dediščine izvedla v letu 1996, kar pomeni, da je bila Slovenija že od samih začetkov razvoja digitalnih vsebin v kulturi med vodilnimi državami. Takrat smo v knjižnici digitalizirali tako imenovano Kopitarjevo zbirko slovanskih kodeksov," pove Vodopivec, pomočnica ravnatelja NUK-a.

V drobni zastranitvi teme tega članka lahko dodamo, da je v NUK-u trenutno na ogled Supraseljski kodeks, najstarejši ohranjeni kodeks, prepisan v starocerkveno slovanščino, katerega transkripcijo in transliteracijo (nekaterih folijev) je v 19. stoletju naredil prav Jernej Kopitar in ki je ta čas na ogled v NUK-u. Ines Vodopivec, ki se ukvarja z digitalizacijo, je o omenjenem projektu digitaliziranja Kopitarjeve zbirke slovanskih kodeksov nadaljevala: "Delo je bilo izjemno kvalitetno opravljeno, saj je zbirka, četudi digitalizirana pred 28 leti, še vedno dosegljiva in uporabna. Kodeksi so objavljeni v sodobnih formatih na dLIB, a raziskovalci še vedno uporabljajo tudi primarno zbirko iz leta 1996. Od tedaj je bila torej razvita Digitalna knjižnica Slovenije, dobili smo nacionalni agregator za kulturo pri NUK-u, skupaj z drugimi državami Evropske unije smo ustanovili Europeano, digitalno knjižnico Evrope. In danes smo v samem vrhu Evrope, natančneje na četrtem mestu, po številu digitaliziranih objektov na prebivalca."

Kot je še povedala, se ob tem povezujejo tudi z "najrazvitejšimi državami zunaj Evropske unije. Trenutno poteka bilateralni projekt z Norveško na podlagi sofinanciranja ministrstva za kohezijo in regionalni razvoj. Bilateralni projekt za pripravo nadaljnjega strateškega razvoja digitalne infrastrukture za kulturo vključuje razvoj jezikovnih tehnologij za nacionalne jezike, kar Norveška izjemno uspešno gradi. Tovrstne razvojne smeri pa so tudi iniciativa za povezovanje Narodne in univerzitetne knjižnice z drugimi slovenskimi partnerji za podporo razvoja digitalne transformacije, kot je na primer najnovejše sodelovanje s predstavniki na projektu PoVeJMo za razvoj velikih jezikovnih modelov (za slovenski jezik)."

Raziskovanje registrov knjižničnih izposoj lahko pripomore k vedenju o intelektualnem življenju in kroženju informacij v preteklosti. Foto: Wikipedia
Raziskovanje registrov knjižničnih izposoj lahko pripomore k vedenju o intelektualnem življenju in kroženju informacij v preteklosti. Foto: Wikipedia

Kako so v 19. stoletju v Parizu krožile knjige
Ker je Ines Vodopivec omenila nekaj projektov, povezanih z digitalizacijo arhivskih in knjižničnih gradiv, omenimo, da včasih digitalizacija zasleduje konkreten raziskovalni cilj. Na konferenci so predstavili projekt PRET19: Avtomatično prepoznavanje in indeksiranje na roke napisanih registrov izposoj. Na prvi pogled ozko zastavljen projekt lahko v resnici pomembno obogati gradivo za preučevanje zgodovine intelektualnega življenja v Parizu.

Gre namreč za digitalizacijo registrov izposoj v treh knjižnicah v pariški latinski četrti – knjižnici univerze Sorbona, knjižnici sv. Genovefe in knjižnici prestižne fakultete École normale supérieure, pogosto imenovane tudi 'valilnica' kadrov za visoke položaje v francoski upravi.

Registri izposoj so pisani ročno, zato si je raziskovalna ekipa pomagala s tehnologijo za optično prepoznavanje znakov oziroma pisave. Nekoliko težav je povzročilo spreminjanje zapisovanja izposoj čez čas in pa različni sistemi registriranja izposoj v različnih knjižnicah.

Izposoje knjig razkrivajo intelektualno življenje v Parizu 19. stoletja
Projekt PRET19 naj bi pomagal razkriti, kako so knjige krožile med intelektualci in kako so torej krožili tudi nove informacije in nova znanstvena spoznanja. Na novo pridobljeni podatki in njihova analiza bi lahko prispevali tudi k odkrivanju stikov med intelektualci ter specifik intelektualnega življenja in akademske srenje v francoski prestolnici v 19. stoletju. Izhodišče projekta je bilo sicer praznovanje 250-letnice Sorbone leta 2020, ko so zagnali program digitaliziranja in raziskovanja arhivov in zgodovine univerzitetne knjižnice. Podatki naj bi v naslednjih mesecih postali tudi javno dostopni na spletu

Do zdaj omenjeni projekti so le nekateri od predstavljenih na 28. Mednarodni konferenci o teoriji in praksi digitalnih knjižnic, ki je v organizaciji NUK-a potekala v Ljubljani. Ta dogodek vsako leto poteka v drugi državi, konference pa so tematsko izjemno široko zastavljene. Kot so zapisali letošnji organizatorji, konferenca "črpa iz različnih raziskovalnih področij, vključno z računalništvom, informatiko, podatkovno znanostjo, knjižničarstvom, arhivistiko in prakso, muzejskimi študijami in prakso, tehnologijo, družbenimi vedami, kulturno dediščino, digitalno humanistiko in znanstvenimi skupnostmi".

Kako trajni so digitalni arhivi
Ines Vodopivec je konferenco označila za eno pomembnejših znanstvenih konferenc s področja digitalizacije v kulturi: "To, da je konferenca znanstvena, pomeni, da prispevke recenzirajo akademiki in raziskovalci, ki sledijo najnovejšim trendom v razvoju digitalnih knjižnic. V letu 2024 je bilo prijavljenih 83 prispevkov, vsak prispevek je imel 3 do 4 recenzije, kar pomeni več kot 200 opravljenih recenzij za izbor najbolj kvalitetnih prispevkov. S temi podatki je konferenco odprla redna profesorica. Annika Hinze iz Univerze Waikato in vodja Fakultete za matematiko in računalništvo na Novi Zelandiji.

Z razvojem znanosti na tem področju pa se seveda spreminjajo tudi teme. Morda se na prvi pogled zdi, da se v zadnjem desetletju pretežno ukvarjamo s podobnimi temami na področju digitalizacije kulturne dediščine, a fokus se neprestano spreminja. Če smo se pred desetletjem ukvarjali z velikimi projekti digitalizacije in so bili v ospredju metapodatkovnimi modeli, povezovanje podatkov, podatkovni repozitoriji, razvoj in kvaliteta OCR-tehnologij (optično prepoznavanje znakov za branje besedil iz skenogramov), so zdaj v ospredju dolgotrajna hramba digitalnih podatkov in objektov, repozitoriji ter arhiviranje spleta in podatkov, razvoj jezikovnih tehnologij in podpora večjezičnosti ter uporabniške izkušnje v digitalnem okolju za ustvarjanje znanja. Digitalna kulturna dediščina se povezuje z odprto znanostjo."

Christine Borgman je dejala, da se za izstrelitev novega teleskopa vedno najde denar, za vzdrževanje podatkov, ki jih posreduje, pa ne. Foto: EPA
Christine Borgman je dejala, da se za izstrelitev novega teleskopa vedno najde denar, za vzdrževanje podatkov, ki jih posreduje, pa ne. Foto: EPA

Za nov teleskop se vedno najde denar
Omemba dolgotrajne hrambe podatkov oziroma vzdrževanje podatkovnih baz je bistvenega pomena in slikovito jo je ponazorila avtorica enega osrednjih prispevkov ugledne profesorice informacijskih študij na univerzi UCLA Christine L. Borgman: "Ko gre za projekte, povezane z izstrelitvijo novega teleskopa, se hitro dobi denar, če pa gre 'zgolj' za raziskave na Zemlji in vzdrževanje podatkovnih baz oziroma arhivov, je denarja precej manj. Pogosto ni čisto jasno, kdo je odgovoren za vzdrževanje digitalnih knjižnic."

Borgman je govorila še o eni 'zagati', ko gre za vzpostavljanje neke vrste globalne knjižnice oziroma globalnega omrežja registrov. V svetu 'materialnih' ustanov je jasno, da vsaka ustanova poseduje gradivo, ki ga inventarizira na svoj način, če pa želimo imeti globalni sistem, je potrebno določeno poenotenje registrov. Christine Borgman je omenila skoraj bizaren primer registriranja odkritij nebesnih teles. Astronomski podatkovni center v Strasbourgu (CDS) zabeleži vsak objekt, ki so ga odkrili v vesolju. A sčasoma se je izkazalo, da so številne 'odkrili' večkrat, ker so bili preprosto različno opredeljeni in vneseni v različne zbirke. Torej "isti objekti so lahko katalogizirani različno v različnih zbirkah različnih ustanov".

Digitalne knjižnice so multidisciplinarne
Primer tovrstne 'vsebinske zagate' je Borgman ponazorila na primeru specifičnega eksponata, opeke v oxfordskem muzeju Ashmolean. Tam imajo opeko, v katero je vklesana sutra, ki jo datirajo v 5. ali 6. stoletje. Kako naj jo obravnavamo? Je to kos gradbenega materiala? Je verski predmet? Je primer zgodnje pisave? Gre za filologijo? Vse to je. Torej katera ustanova naj ta predmet katalogizira in kako naj bo predstavljen? Vse to na primer govori o tem, kako multidisciplinarna zadeva so digitalne knjižnice. In govori tudi o tem, da je iskanje po digitalnih arhivih zahtevno, velikokrat podvrženo naključnim najdbam.

Zagata digitalnih knjižnic je tudi njihova interdisciplinarnost. Isti objekt lahko različne ustanove, denimo muzeju ali knjižnice, zabeležijo na različne načine, zato se je včasih težko dokopati do čim bolj popolnih podatkov o enem predmetu oziroma enoti v knjižnici ali arhivu. Foto: EPA
Zagata digitalnih knjižnic je tudi njihova interdisciplinarnost. Isti objekt lahko različne ustanove, denimo muzeju ali knjižnice, zabeležijo na različne načine, zato se je včasih težko dokopati do čim bolj popolnih podatkov o enem predmetu oziroma enoti v knjižnici ali arhivu. Foto: EPA

Mit o letu 1994
Pravzaprav je bila letošnja konferenca pomembna tudi zaradi pomenljive obletnice – leto 1994 ima namreč pomembno mesto v zgodovini razvoja digitalnih knjižnic. Z letom 1994 je povezan poseben mit. Tega leta naj bi tedanji ameriški podpredsednik Al Gore 'izumil' internet; v resnici je z govorom na konferenci o informacijski 'superavtocesti' spodbudil njegov razvoj in razširjanje njegove uporabe. Dejal je: "Sanjamo o … informacijski superavtocesti, ki lahko rešuje življenja, ustvarja delovna mesta in da vsakemu Američanu, mlademu in staremu, možnost za najboljšo razpoložljivo izobrazbo." Gore naj bi tudi spodbudil tehnične in ekonomske spremembe, povezane z uporabo svetovnega spleta.

Glede na zgodovino digitalnih knjižnic je zanimiv podatek, ki ga je omenila Borgman, da so že v 80. letih obstajali računalniški integrirani knjižnični sistemi, ki so nadzirali 'poti' knjižničnih enot, zamudnine, sčasoma pa so bili uporabljeni tudi za katalogiziranje, nadzor pridobitev, pregledovaje rezervacij in še za druge naloge. Eksperimentalne računalniške knjižnične kataloge so sicer razvijali že v 60. letih; običajno se omenja predvsem 'online' kataloga državne univerze v Ohiu (1975) in javne knjižnice v Dallasu (1978).

Na tovrstno zgodovino je opozoril tudi redni profesor Stefano Ferilli iz Univerze v italijanskem Bariju: "Kolikor vem, zgodovina digitalnih knjižnic na splošno sega nekaj desetletij nazaj, saj so se prvi operativni projekti digitalizacije začeli že v sedemdesetih letih prejšnjega stoletja, v poznih devetdesetih pa sta bila krajina in skupnost dovolj zrela za začetek raziskav na tem področju, ki so spodbudile tudi zasnovo konferenc, kot je bila ECDL, kasneje TPDL, katere prva izdaja je bila leta 1997."

Računalničarji in humanisti se ne razumejo vedno
Zanimiva je bila opazka Borgman o razcepljenosti skupin znanstvenikov, ki se ukvarjata z razvojem digitalnih knjižnic: računalničarji in informatiki na zadevo gledajo drugače kot knjižničarji. Prvi spletne knjižnice vidijo predvsem kot baze podatkov, informacijske sisteme, drugi pa so veliko več razmišljajo o socialnih in tehničnih vidikih, o uporabnikih, o tem, da se okoli knjižnic oblikuje neka skupnost. Prvi k razvoju digitalnih knjižnic pristopajo zgolj tehnološko, drugi v središče postavljajo pojem skupnosti in njene potrebe. Ne tem mestu velja omeniti ugotovitev rednega profesorja z univerze v francoskem La Rochellu Antoina Douceta: "Tako smo prešli iz pretežno organizacije podatkov in omogočanja njihove dostopnosti do poskusov razumevanja, kako se javnost odziva na digitalno okolje oziroma kako lahko slednje vpliva na družbo."

Eno najbolj želenih je bilo predavanje Christine Borgman, velike avtoritete na področju informacijskih znanosti. Foto: NUK
Eno najbolj želenih je bilo predavanje Christine Borgman, velike avtoritete na področju informacijskih znanosti. Foto: NUK

Tudi 'pradavni' programi včasih delujejo
Izziv za obstoj vseh digitalnih arhivov in baz podatkov je seveda nenehno posodabljanje in razvijanje novih programov. Christine Borgman je navedla zanimiv primer, ko znanstveniki vztrajajo pri 'pradavnem' programu. Govorila je o zanimivem primeru astronomov, s katerimi sodeluje in ki še vedno uporabljajo fortran, enega najstarejših računalniških jezikov. IBM ga je razvil sredi petdesetih let prejšnjega stoletja in se zelo dobro obnese pri matematičnih problemih in pri pisanju statistik. Borgman je povedala, da se številni čudijo, zakaj vendar vrhunski znanstveniki uporabljajo zastarel program. Ker pač deluje. In vzpostavljanje digitalnih knjižnic vključuje tudi spopadanje z zagato, kako v podatkovni sistem vključiti v različnih računalniških jezikih zapisane informacije.

Ta format objavljenega besedila seveda ne dopušča podrobnega poročanja o vseh prispevkih. Obseg konference razkrivajo že ti podatki. "Skupaj je bilo v Ljubljani te dni 100 udeležencev iz 19. držav, ki so zastopali 15 jezikov (Anglija, Avstrija, Češka, Francija, Italija, Japonska, Kanada, Madžarska, Nemčija, Nizozemska, Norveška, Nova Zelandija, Poljska, Portugalska, Slovenija, Španija, Švica, Velika Britanija in ZDA)".

Zaključimo z mislijo Christine Borgman, da bi zbirke knjižnic morale biti dostopne vsem, da je cilj digitaliziranih arhivov, da lahko podatke najdemo, da so dostopni, da jih je mogoče uporabljati v različnih (digitalnih) okoljih, da ne izginejo oziroma jih lahko in smemo ponovno uporabiti.