Нейросети. Основы. Дэвид Рид

Чтение книги онлайн.

Читать онлайн книгу Нейросети. Основы - Дэвид Рид страница 7

Автор:
Жанр:
Серия:
Издательство:
Нейросети. Основы - Дэвид Рид

Скачать книгу

style="font-size:15px;">      plt.show()

      # График потерь обучения и валидации

      plt.plot(history.history['loss'], label='Training Loss')

      plt.plot(history.history['val_loss'], label='Validation Loss')

      plt.title('Training and Validation Loss')

      plt.legend()

      plt.show()

      ```

      Описание шагов

      – Сбор данных: Использовали `ImageDataGenerator` для загрузки изображений кошек и собак, и автоматического разделения на обучающий и валидационный наборы.

      – Разделение данных: Произошло в процессе генерации данных с использованием параметра `validation_split`.

      – Обучение модели: Создали и обучили простую сверточную нейронную сеть (CNN) для классификации изображений.

      – Оценка модели: Оценили точность модели на валидационном наборе данных.

      – Корректировка и оптимизация: Визуализировали графики точности и потерь для определения возможностей улучшения модели.

      Этот пример демонстрирует базовый процесс супервайзингового обучения для задачи классификации изображений, используя библиотеку Keras для построения и обучения нейронной сети.

Обучение без учителя

      Обучение без учителя (unsupervised learning) – это тип машинного обучения, при котором модель обучается на неразмеченных данных. В отличие от супервайзингового обучения, здесь нет правильных ответов, и модель должна самостоятельно выявлять скрытые структуры и закономерности в данных.

      Основные методы обучения без учителя:

      Обучение без учителя – это подход, при котором модель обучается на неразмеченных данных. Этот метод позволяет выявлять скрытые структуры и закономерности в данных без необходимости в предварительной разметке. Основные методы обучения без учителя включают кластеризацию, снижение размерности и ассоциативные правила.

      1. Кластеризация

      Кластеризация – это метод группировки данных в кластеры таким образом, чтобы данные внутри одного кластера были более схожи друг с другом, чем с данными из других кластеров. Этот метод широко используется для сегментации клиентов, анализа текстов, выявления аномалий и многих других задач.

      K-means

      K-means – один из наиболее популярных и простых в реализации алгоритмов кластеризации. Основная идея заключается в разделении данных на ( K ) кластеров, минимизируя внутрикластерное расстояние, то есть расстояние между точками внутри каждого кластера и их соответствующим центроидом. Процесс начинается с выбора ( K ) начальных центроидов, которые могут быть выбраны случайным образом или на основе других методов. Затем алгоритм итеративно выполняет следующие шаги:

      1. Назначение точек кластерам: Каждая точка данных присваивается тому кластеру, центроид которого находится ближе всего.

      2. Обновление центроидов: После распределения всех точек данные центроиды пересчитываются как среднее всех точек, принадлежащих каждому кластеру.

      3. Конвергенция: Шаги назначения и обновления повторяются до тех пор, пока изменения в позициях центроидов не станут незначительными, что означает, что центроиды стабилизировались и алгоритм достиг сходимости.

      Преимущества K-means включают его простоту и эффективность при работе с большими наборами данных. Однако алгоритм чувствителен к выбору начальных центроидов и может застревать в локальных минимумах. Кроме того,

Скачать книгу