Proces digitalizacije u NBS
Proces digitalizacije građe u Narodnoj biblioteci Srbije obavlja se u nekoliko faza, počev od skeniranja, preko obrade i pripreme za postavljanje na sajt Digitalne biblioteke, te ubacivanja metapodataka iz elektronskog kataloga.
Prva faza digitalizacije
Prva faza digitalizacije podrazumeva upotrebu velikog skenera koji se koristi za osetljive stvari i za veće formate (mape, karte), što su i demonstrirali bibliotekari NBS za projekat Vodič kroz digitalizaciju kulture u Srbiji.
Građa se skenira, obrađuje i priprema za podizanje na sajt, znači da se smanjuje na veličinu koja je dostupna korisnicima. Zatim se šalje kolegama u drugoj prostoriji, koji postavljaju metapodatke uz skeniranu građu, koja se potom podiže na sajt i korisnici mogu da je čitaju.
Druga faza digitalizacije
Kada se obradi slika, odnosno skenirani materijal, on se postavlja na sajt i dodeljuju mu se metapodaci koji se preuzimaju iz elektronskog kataloga NBS.
Metapodatak može biti naslov ili fizički opis dimenzije samog objekta, pri čemu se misli na objekat u fizičkom smislu, a ne na sliku. Za jedan objekat ima više podataka - naslov, autor, izdavač... sve što se može pronaći o njemu u elektronskom katalogu.
Postavljanje na sajt obavlja se u platformi koju obezbeđuje Matematički institut.
Dodavanje metapodataka za digitalizovana dela Bore Stankovića
Raščitavanje teksta
Program Docworks omogućava obradu publikacija, novina, knjiga, časopisa, ali “dubinski” - izdvaja, separatiše članke, naslove. Skenirana građa se ubacuje u program koji je obradi tako da bude moguće pretraživanje po člancima, odnosno da ne bude samo dostupna kao slika - fotografija.
Docworks ne samo da raščitava tekst zahvaljujući procesu optičkog prepoznavanja karaktera (OCR), koji omogućava i da se uradi separacija, da se izdvoji naslov, međunaslov, podnaslov, autor, reklame... Sve to se izdvoji da bi moglo da bude pretraživo. Program ume sam da prepozna nešto, a nekad mu bibliotekar „kaže“ da je to reklama, recimo. Krajnji proizvod je, na primer, časopis Zenit u pdf-u.
U bazi su izlistani svi naslovi članaka, koje je moguće izdvojiti i učiniti upotrebljivim za dalju doradu ili preradu, odnosno za pretraživanje, što je najvažnije.
Obrada materijala u programu Docworks
(SEEcult.org)
*Tekst je nastao u okviru projekta Vodič kroz digitalizaciju kulture u Srbiji, koji SEEcult.org realizuje u saradnji sa Centrom za medijsko obrazovanje i kulturu, uz podršku Ministarstva kulture i informisanja Srbije