Научно-справочный аппарат архивов России. Мониторинг-2020. Надежда Максимова

Чтение книги онлайн.

Читать онлайн книгу Научно-справочный аппарат архивов России. Мониторинг-2020 - Надежда Максимова страница 27

Научно-справочный аппарат архивов России. Мониторинг-2020 - Надежда Максимова

Скачать книгу

данных, которые, при наличии на то доброй воли, могут быть сделаны общедоступными. В настоящее время выполняется целый ряд вполне успешных пилотных проектов такого рода.

      • В отдельные пилотных проектах изучается возможность использования при составлении и совершенствовании НСА технологий искусственного интеллекта, машинного обучения и больших данных.

      • Коммерческий сектор в настоящее время, помимо прочего, предоставляет услуги по оцифровке документов и созданию НСА, посредством обработки как физических, так и электронных материалов, в том числе в виде облачных услуг. Подобные услуги делают инновационные технологии в принципе доступными даже для небольших архивов со слабой материально-технической и финансовой базой.

      Что нас ожидает в ближайшем будущем?

      В настоящее время в тех случаях, когда у исследователя имеется доступ к полнотекстовым базам данных, полнотекстовой поиск самым активным образом уже используется для поиска нужных материалов среди сотен миллионов документов, позволяя выделить те, в которых упоминается тот или иной термин, организация, человек, место и т. д.

      Но прогресс на этом не останавливается, быстро развиваются технологии распознавания рукописного текста, распознавания речи, лиц и изображений, поиска по изображению-шаблону и т.п., что в перспективе приведёт к появлению новых интересных методов поиска и изучения архивных материалов.

      Не менее интересны пилотные проекты в области больших данных, в рамках которых уже в течение ряда лет опробуются новые методы классификации и систематизации документов, проведения экспертизы ценности, установления степени секретности, а также выявления персональных данных и их анонимизации.

      В результате появляются новые возможности для формирования и обогащения научно-справочного аппарата архива, однако одновременно встает вопрос о пересмотре состава НСА и определении того, какие задачи эффективнее решать с помощью НСА, а какие – средствами прямого поиска. В современных условиях НСА, с моей точки зрения, в первую очередь является инструментом сохранения сведений о контексте создания архивных материалов. В идеальных системах поиска вместе с результатом поиска обязательно должна выдаваться информация, позволяющая установить контекст (типа архивных шифров).

      Во всём мире сейчас ведутся краудсорсинговые проекты оцифровки как архивных материалов, так и бумажного и рукописного НСА. Повсеместно наблюдается отказ от бумажного и бумагоподобного НСА и переход к современным решениям на основе баз данных, которые, помимо прочего, позволяют пользователям архивных материалов отставлять свои замечания и комментарии к НСА. Таким образом, постепенно усиливается тенденция привлечения к составлению и развитию НСА как фондообразователей, так и исследователей.

      Проблемы и риски

Скачать книгу