Глоссариум по искусственному интеллекту: 2500 терминов. Александр Юрьевич Чесалов
Чтение книги онлайн.
Читать онлайн книгу Глоссариум по искусственному интеллекту: 2500 терминов - Александр Юрьевич Чесалов страница 14
Бустинг (Boosting) – это мета-алгоритм ансамбля машинного обучения, предназначенный в первую очередь для уменьшения предвзятости и дисперсии в обучении с учителем, а также семейство алгоритмов машинного обучения, которые превращают слабых учеников в сильных132.
Буфер воспроизведения (Replay buffer) – это память, используемая для хранения данных в промежутке между использованием или воспроизведением133.
Быстрое кодирование (One-hot encoding) – это процесс, с помощью которого категориальные переменные преобразуются в подходящую алгоритмам Машинного обучения (ML) форму. Большая часть предварительной обработки данных – это кодирование в понятный компьютеру язык чисел. Отсюда и название «encode», что буквально означает «преобразовать в компьютерный код». Существует множество различных способов кодирования, таких как Ярлычное (Label Encoding) или Быстрое кодирование134.
Быстрые и экономичные деревья (Fast-and-frugal trees) – это тип дерева классификации. FFTS можно использовать в качестве инструментов принятия решений, которые действуют как лексикографические классификаторы и, при необходимости, связывают действие (решение) с каждым классом или категорией.
Бытовой искусственный интеллект (Consumer artificial intelligence) – это специализированные программы искусственного интеллекта, внедрённые в бытовые устройства и процессы135.
«В»
Валидационные данные (Holdout data) или «выделенные, удержанные» данные, являющиеся частью Датасета (Dataset), предназначенного для тестирования, проверки работоспособности машинного обучения. Тестовые данные относятся к части предварительно размеченных данных, которые хранятся вне наборов данных, используемых для обучения и проверки контролируемых моделей машинного обучения. Их также можно назвать эталонными данными. Первым шагом в обучении с учителем является тестирование различных моделей на тестовых данных и оценка моделей на предмет прогнозируемой производительности. После того, как модель проверена и настроена с помощью набора проверочных данных, она тестируется с набором данных, чтобы выполнить окончательную оценку ее точности, чувствительности, специфичности и согласованности при прогнозировании правильных результатов136,137.
Вариативность данных (Data variability) этот термин описывает, насколько далеко точки данных расположены друг от друга и от центра распределения. Наряду с мерами центральной тенденции меры изменчивости дают вам описательную статистику, которая обобщает ваши данные138.
Ввод данных (Data entry) – это процесс преобразования устных или письменных ответов в электронную форму139.
Вес (Weight) в обзорных исследованиях –
132
Boosting [Электронный ресурс] https://en.wikipedia.org URL: https://en.wikipedia.org/wiki/Boosting_(machine_learning) (дата обращения: 28.03.2023)
133
Replay buffer [Электронный ресурс] https://developers.google.com URL: https://developers.google.com/machine-learning/glossary#replay-buffer (дата обращения: 28.03.2023)
134
Быстрое кодирование [Электронный ресурс] www.helenkapatsa.ru URL: https://www.helenkapatsa.ru/bystroie-kodirovaniie/ (дата обращения: 07.07.2022)
135
Бытовой искусственный интеллект [Электронный ресурс] https://apr.moscow URL: https://apr.moscow/content/data/6/11 Технологии искусственного интеллекта. pdf (дата обращения: 28.03.2023)
137
Holdout data [Электронный ресурс] https://www.primeclasses.in URL: https://www.primeclasses.in/glossary/data-science-course/machine-learning/holdout-data (дата обращения: 28.03.2023)
138
Data variability [Электронный ресурс] www.investopedia.com URL: https://www.investopedia.com/terms/v/variability.asp (дата обращения: 07.07.2022)
139
Data entry [Электронный ресурс] www.umich.edu URL: https://www.icpsr.umich.edu/web/ICPSR/cms/2042#D (дата обращения: 07.07.2022)