Искусственный интеллект в здравоохранении. Коллектив авторов
Чтение книги онлайн.
Читать онлайн книгу Искусственный интеллект в здравоохранении - Коллектив авторов страница 6
– разметка проведена с использованием тезауруса (кодированной библиотеки типовых формулировок, соответствующих рекомендации ассоциации специалистов в данной области по ГОСТ 7.24, ГОСТ 7.25[7]).
В ходе первичной разметки отмечаются все целевые структуры в подготовленном наборе данных. Специалисты, проводящие разметку, должны быть компетентны в области конкретных типов данных (изображения, текстовые или сигнальные (ЭКГ, ЭЭГ, спирометрия), количественные (ЧСС, артериальное давление, спирометрия), бинарные данные (да/нет)). Экспертная разметка осуществляется специалистами с большим опытом работы (не менее трех лет) в областях, соответствующих решаемым задачам.
На всех этапах жизненного цикла системы ИИ важно обеспечить хранение верифицированного набора данных и доступ к нему. В решении этой задачи ключевую роль играют метаданные (metadata) – информация о ресурсе.
Метаданные применяют для классификации, упорядочения и описания. Они составляются для улучшения возможностей поиска, обеспечения доступа к данным, их совместимости и повторного использования.
Метаданные бывают трех типов:
– описательные (служат для обнаружения, сбора или группирования данных по общим для них характеристикам);
– структурные (определяют состав или организацию набора данных);
– административные (используются для управления базой данных).
Выбор зависит от типа данных. Например, метаданные для хранения верифицированного набора медицинских изображений могут включать:
1. Тип изображения:
– вид исследования (например, компьютерная томография);
– разрешение;
– общее число изображений и по сериям.
2. Число исследований.
3. Источники исследований:
– оборудование;
– типы оборудования;
– медицинскую организацию.
4. Параметры сканирования изображений.
5. Параметры хранения изображений:
– формат данных;
– уровень и тип сжатия данных.
6. Аннотацию (разметку):
– тип;
– что и как описано;
– привлеченную экспертную группу.
7. Контекст.
8. Как определена и промаркирована истинная разметка.
9. Связанные данные:
– демографические;
– клинические;
– лабораторные;
– геномные;
– временны́е;
– принимаемые препараты (лекарства);
– другие.
10. Временной диапазон сбора изображений (дата и время исследования).
11. Использование данных (какое программное обеспечение использовать для просмотра данных).
7
https://docs.cntd.ru/document/1200057506.