Кто есть кто в робототехнике. Выпуск I. Компоненты и решения для создания роботов и робототехнических систем. Александр Барсуков
Чтение книги онлайн.
Читать онлайн книгу Кто есть кто в робототехнике. Выпуск I. Компоненты и решения для создания роботов и робототехнических систем - Александр Барсуков страница 5
1. Excalibur: технология распознавания видеоизображений
Эффективность данной системы обусловлена применением в ней как традиционной для фирмы Excalibur Technologies технологии нечёткого поиска APRP, так и оригинальной технологии анализа видеоинформации VAE.
VAE (Video Analysis Engine) обеспечивает автоматическое построение StoryBoard (последовательности кадров, наиболее адекватно отражающих суть видеофрагмента) для вводимой видеоинформации, выделяя набор характерных (по тому или иному критерию) кадров.
APRP (Adaptive Pattern Recognition Process), технология адаптивного распознавания образов, производит так называемый «нечёткий поиск», при котором для поиска изображения не требуется ни словесного описания, ни ключевых слов, ни других специальных приёмов. В данной технологии под нечётким поиском понимается операция нахождения объекта по его достаточно близкому образу (например, по фотографии человека, на лице которого время оставило свои следы). Любого рода данные технология обрабатывает одинаково – в виде нулей и единиц, поэтому она равным образом применяется для индексации и нечёткого поиска как текстов (библиотека TRS), так и звукозаписей (библиотека SRS) и видеозаписей (библиотека VRS). Это обстоятельство позволяет воспользоваться для понимания алгоритмов технологии примером из области обработки текстов. Поскольку APRP работает не с ключевыми словами, а с образами, две-три изменённые (или ошибочные) буквы в слове или фразе не могут существенно изменить базовую картину текста. Таким образом, автоматически становится допустимой ошибка как во входных данных, так и в терминах запроса. Например, если мы напишем в запросе: «ЦЦЦТЕР МАРГМАСАРИТАЭЭЭЭЭЭ», имея в виду название романа Булгакова, то получим правильный ответ – «Мастер и Маргарита».
Поиск происходит так:
• запрос конвертируется в бинарную форму;
• игнорируется шум (т. е. отбрасываются «ЦЦЦ» и «ЭЭЭЭЭЭ»);
• проводится нечёткий поиск, представляющий собой комплекс операций сравнения комбинаций нулей и единиц, по результатам которых осуществляется выбор наиболее близких вариантов искомого образа. Описанный алгоритм поиска по существенным признакам применяется при сравнении почерков, отпечатков пальцев, голосов и фотографий.
Обеспечиваемая технологией скорость поиска видеоинформации по индексированному массиву объёмом 5 Тбайт составляет 5-15 с при степени достоверности, соответствующей сертификату, выдаваемому подобным системам. Под «индексированным массивом» в данном случае понимается вышеупомянутый набор характерных кадров, 1 Мбайт которых соответствует примерно