Дигитализација на весниците

Од Википедија — слободната енциклопедија

Дигитализацијата на весниците е постапка на претворање на старите весници од аналогна форма во дигитални слики. Најчестите аналогни форми за старите весници се хартија и микрофилм. Дигитализираните слики од страниците на весниците обично (иако не секогаш) се анализираат со специјален софтвер OCR со цел да се произведат текстуални податотеки со содржината на весникот.

Весниците зачувуваат богат запис за минатото, а од појавата на дигиталните медиуми, многу институции ширум светот започнаа да ги дигитализираат и дигиталните податотеки да бидат јавно достапни. Сепак, над 90% од весниците останаа нескенирани во 2015 година.[1] Дигитализираните весници можат да бидат достапни бесплатно или за одреден надомест.

Успешното скенирање весници е комплексна активност. Иако е можно скенирање од хартија, скенирањето на микрофилмот е поевтино и добриот микрофилм е наречен „единствениот најкритичен фактор за успехот на дигитализацијата на весникот“.[2] Анализата на OCR на скенирани страници претставува голем број технички предизвици, а текстот на старите весници е често тежок за читање, што воведува грешки и го отежнува пребарувањето. Прикачувањето метаподатоци на сликите за да може полесно да се пронајдат е уште еден важен чекор. Конечно, мора да се развијат интерфејси за пребарување. Голем број на компании се специјализирани за скенирање весници, а некои произведуваат софтвер специјално дизајниран за процесот.

Трошоците за чување на печатени весници и релативно малата побарувачка за оригинали по микрофилмирање и скенирање значи дека печатените весници, еднаш микрофилмирани или скенирани, често биле исфрлени. Некои луѓе сметаат дека ова е загуба за истражувачите или едноставно дека постои потрес кога ќе исчезне искуството со читање на хартија. Авторот Николсон Бејкер отиде дотаму што создаде архива на хартиени весници, која ја нарече американско складиште за весници, со цел да зачува хартиени весници кои инаку би биле отфрлени.

Последните весници можеби се „родени како дигитални“, што значи дека тие биле отпечатени од компјутерски податотеки отколку со буква или фототипови. Тие можат да се архивираат со зачувување на дигиталните податотеки на издавачот на секоја слика на страницата, наместо со скенирање на страниците.

Наоѓање на помагала и двигатели за метапребарување[уреди | уреди извор]

Поврзано[уреди | уреди извор]

Наводи[уреди | уреди извор]

  1. „Center for Research Libraries, "The state of the art: a comparative analysis of newspaper digitization to date", 10 април 2015“ (PDF).
  2. „Best Practices for Newspaper Digitization, chapter 4 in Best Practices for Creating Digital Collections, University of Illinois at Urbana-Champaign“.

Надворешни врски[уреди | уреди извор]