Chat GPT и Революция Искусственного Интеллекта. Тимур Казанцев
Чтение книги онлайн.
Читать онлайн книгу Chat GPT и Революция Искусственного Интеллекта - Тимур Казанцев страница 9
Основное отличие Kandinsky 2.1 от ее основных конкурентов Midjourney, Stable Diffusion и DALL-E, в том, что она способна понимать более 100 языков, включая русский, а также в том, что ее можно попробовать сразу на нескольких платформах:
сберовской облачной платформе ML Space
На сайте Rudalle
а также в мобильном приложении Салют и на умных устройствах Sber при помощи команды «Запусти художника».
Что нейросеть Kandinsky 2.1 умеет делать?
самая стандартная функция – сгенерировать изображение на основе текстового запроса. Причем можно выбрать более 20 вариантов стилей, от ренессанса и классицизма до реальных 3д фотографий, киберпанка и советских мультфильмов
нейросеть умеет смешивать несколько рисунков в один
может дорисовывать изображения
а также создать картину в режиме бесконечного полотна
Все четыре режима генерации пока доступны только в телеграм боте
Периодически в некоторых случаях нейросеть может не сработать, часто приходится долго ждать пока будет сгенерировано изображение, иногда появляются ошибки и на сайтах, и в телеграм-боте. Сбер объясняет это большой нагрузкой на сервис.
Из минусов – все картинки генерируются в разрешении 768 × 768 пикселей. Большее разрешение выставить нельзя, хотя современные нейросети уже рисуют картинки качественнее.
Как и в большинстве нейросетей, у Кандинского тоже иногда возникают проблемы при генерировании изображений людей, особенно если их несколько на картинке, и особенно прорисовка их пальцев, и когда они смотрят не прямо на вас, а в профиль.
Таким образом, если резюмировать, Kandinsky 2.1. – достаточно интересная нейросеть, которая может составить вполне себе конкуренцию Midjourney, Dall-E и Stable Diffusion.
Из плюсов – то что можно вводить промпты на русском языке и еще 100 других. Кроме того, нейросеть можно использовать через телеграм бот или даже голосовго помощника Сбера.
Из минусов – изображения относительно невысокого разрешения, прорисовка людей в определенных стилях, особенно если на картинке несколько персонажей, иногда оставляет желать лучшего.
Но в целом первое впечатление положительное, думаю буду пользоваться и дальше.
Вывод
Эти генераторы изображений с искусственным интеллектом могут революционизировать то, как мы