Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста. Алексей Михнин

Чтение книги онлайн.

Читать онлайн книгу Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста - Алексей Михнин страница 3

Жанр:
Серия:
Издательство:
Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста - Алексей Михнин

Скачать книгу

style="font-size:15px;">      Клонируем ранее созданный репозиторий на GitHub на локальный компьютер. В результате копирования на компьютере создаётся новая папка с названием репозитория.

      Запускаем VSC (Visual studio code) среды разработки – для последующей работы над нашим проектом

      Открыв VSC, в проводнике мы видим все наши файлы, которые мы клонировали с репозитория. Теперь приступаем к шагу 2: созданию скрипта на Python, содержащего будущую структуру папок и файлов нашего проекта.

      Создание шаблона структуры папок и файлов

      Краткое пояснение кода:

      Данный код является простым и эффективным способом создания списка папок и файлов, связанных с проектом, для их последующего автоматического создания.

      Он легко читается и понимается, и может быть легко настроен для разных проектов, изменив значение переменной `project_name`.

      `src` – это сокращение от английского слова "source" (исходный код). В контексте данного кода, `src` – это директория, в которой хранится исходный код проекта. В этой директории могут находиться поддиректории, содержащие модули и компоненты проекта. Обычно, исходный код проекта хранится в директории `src`, чтобы отделить его от других файлов и директорий, связанных с проектом, таких как документация, конфигурационные файлы, тесты и т.д.

      Если в будущем необходимо досоздать новые папки и файлы, то необходимо отредактировать список `list_of_files`, добавив новые пути к файлам и папкам, которые необходимо создать. При этом необходимо убедиться, что пути к файлам и папкам заданы корректно и соответствуют структуре проекта.

      Структура папок, представленная в данном коде, напоминает внутреннюю библиотеку, которую можно использовать в текущем проекте. В данном случае, проект разделен на модули и компоненты, которые хранятся в соответствующих папках. Это позволяет легко организовать код проекта и упростить его поддержку и развитие.

      Например, папка `conponents` содержит компоненты проекта, такие как модуль для предобработки данных или модуль для обучения модели.

      Папка `utils` содержит утилиты, которые могут быть использованы в разных компонентах проекта.

      Папка `config` содержит файлы конфигурации, которые используются для настройки параметров проекта.

      Папка `pipeline` содержит модули, которые отвечают за обработку данных в конвейере.

      Такая структура папок позволяет легко найти нужный модуль или компонент проекта, а также упрощает его тестирование и отладку. Кроме того, такая структура папок может быть использована для создания библиотеки, которую можно переиспользовать в других проектах.

      Создание виртуального окружения

      `conda create` – это команда менеджера пакетов Conda, которая создает новое виртуальное окружение и устанавливает в него пакеты и зависимости.

      `-n project_1` – это опция команды `conda create`, которая задает имя нового виртуального окружения. В данном случае, имя виртуального окружения – `project_1`.

      `python=3.11.4` – это опция

Скачать книгу