Категория
ТехноГид Онлайн
Дата публикации

Нейросети для генерации изображений

Источник:  online.ua
Нейросети для генерации изображений

Правда ли, что художником может стать абсолютно любой человек? Раньше ответ на этот вопрос был однозначным – нет. Ведь для того, чтобы просто научиться прилично рисовать, нужно было потратить несколько лет в художественной академии, не говоря о том, чтобы постоянно тренироваться, чтобы просто «набить руку». Но теперь ситуация изменилась. Абсолютно любой человек может практически без подготовки создавать довольно приличные цифровые изображения, используя нейросети для генерации картинок. Теоретически.

На деле же, использовать нейросети для рисования тоже нужно учиться. Правда, это требует несколько иных навыков. Например, умения чётко формулировать запросы в рамках конкретной программы. Ведь каждая нейросеть рисует по-своему, поскольку для её обучения были использованы уникальные наборы данных, на основании которых возникли уникальные же закономерности. И сейчас мы вам расскажем о некоторых наиболее удачных подобных проектах, а также поговорим о перспективах развития нейросетей для рисования в целом.

Midjourney

Нейросеть Midjourney для генерации изображений
Нейросеть Midjourney

На данный момент, лучший генератор изображений, поскольку способен работать со сложными описаниями – так называемыми «промтами». Это что-то типа списка тегов или сео-запросов, которые обязательно должны присутствовать или отсутствовать на картинке. В результате получается настолько сложное изображение, что создаётся впечатление, что искусственный интеллект рисует его в реальном времени.

После обработки запроса вы получаете несколько вариантов картинки, из которых можно выбрать один и продолжить работать с ним дальше – повышать качество, добавлять новые элементы, редактировать. Всё это происходит в Discord-канале проекта. Первоначально вам будет доступно 25 изображений в низком качестве, но за деньги можно приобрести дополнительные пакеты услуг.

Что же касается недостатков этой нейросети для рисования, то их не так уж много. Это необходимость использовать исключительно английский язык, ограниченный стилистический потенциал, обязательная покупка премиального пакета для того, чтобы использовать полученные изображения в коммерческих целях и сложность создания «промтов». И да, Midjourney не очень хорошо справляется с пейзажами и многокомпонентными изображениями, а вот как генератор лиц онлайн она, пожалуй, лучшее из того, что есть сейчас на рынке. Особенно для серьёзных художников и дизайнеров, поскольку после неё картинки практически не приходится «допиливать в фотошопе».

Stable Diffusion

Нейросеть Stable Diffusion для генерации изображений
Нейросеть Stable Diffusion

Главный конкурент Midjourney, со своими преимуществами и недостатками. Начнём с плюсов. Данная нейросеть создаёт картинку по вашему запросу бесплатно, в режиме онлайн и без необходимости использования сложных промтов. Достаточно относительно простого текстового описания. Но работает она медленнее Midjourney, а детализация изображения, особенно если речь идёт о портретах, у неё хуже. Однако она поддерживает куда больше различных стилей, а также позволяет добавлять собственные, довольно эффективно «дорабатывает» картинки и даже может применяться при реставрации старых фотографий.

Кроме того, большинство недостатков бесплатной версии исправляется в платных «надстройках». Ведь код у Stable Diffusion открытый, так что многие талантливые программисты уже придумали, как его можно доработать и улучшить. Что касается основной нейросети, то она всё ещё является отличным ии-генератором картинок, который постоянно совершенствуется.

DALL-E 2

Нейросеть DALL-E 2 для генерации изображений
Нейросеть DALL-E 2

Пожалуй, лучшая нейросеть для генерации картинок по простому текстовому запросу. При её разработке использовалась языковая модель GPT-3 и несколько миллиардов пар «текстовое описание – изображение». Первоначально создавала небольшие картинки, затем – более масштабные в разрешении 1024х1024. А потом была добавлена ещё и функция Outpainting, позволяющая «достраивать» недостающие элементы, ориентируясь на стиль изображения и его внутреннюю логику, а также другие дополнительные возможности.

Однако генерация картинок нейросетью DALL-E 2 всё ещё далека от идеала. Длинный текст не всегда воспринимается полностью, особенно «слова-исключения» и профессиональные термины. Да и работать с ней лучше на английском языке. Также часто встречаются визуальные искажения и сочетание несочетаемых элементов, да и логика доработки изображений далеко не всегда верна. Тем не менее, проект дорабатывается. Например, в нём уже есть функция редактирования части картинки, которая позволяет исправлять отдельные элементы. Также в число недостатков можно отнести то, что эта нейросеть онлайн платная. По крайней мере, для новых пользователей. У тех же, кто зарегистрировался давно, есть до 15 ежемесячных бесплатных изображений.

Bing Image Creator

Нейросеть Bing Image Creator для генерации изображений
Нейросеть Bing Image Creator

Нейросеть для генерации изображений, созданная компанией Microsoft на основе DALL-E и интегрированная в их чат-бот Bing и браузер Edge. Работает быстро, по запросу выдаёт 4 варианта картинки. В день доступно бесплатно 25 генераций, но это количество можно увеличить, перейдя на платную версию программы. Что касается детализации, то данная нейросеть для создания изображений прекрасно работает в жанре «реализм». Можно даже сказать, что это «генератор фото». Полученные картинки почти не требуют доводки, даже если речь идёт о пальцах.

А ведь именно с ними у большинства нейросетей наблюдаются большие проблемы. Просто потому, что для нормальной их проработки нужны либо крайне высокая разрешающая способность (генерация изображения – обратный процесс к распознаванию, использующий те же самые алгоритмы), либо какие-то оригинальные программные решения. Майкрософт может позволить себе использовать большие вычислительные мощности, так что проблем с пальцами у Bing Image Creator практически нет.

GauGAN2

Нейросеть GauGAN2 для генерации изображений
Нейросеть GauGAN2

Бесплатная нейросеть для генерации пейзажей от компании Nvidia. Для пользователей доступна в виде приложения NVIDIA Canvas. Регистрация не нужна, каких-то дополнительных танцев с бубном не требуется. Нужны лишь видеокарты серии GeForce RTX, NVIDIA RTX, Quadro RTX, TITAN RTX и чуть более 1 ГБ свободного пространства на диске. Главная фишка данного проекта – одновременное использование и текстовых описаний, и графической основы. То есть вы можете просто ввести запрос «океан и песчаный пляж», а нейросеть нарисует максимально усреднённый и упрощённый результат.

А далее можно на полученной картинке с помощью простых инструментов, несколько напоминающих самый обычный Paint, начать вносить дальнейшие изменения. Результат получается довольно детализированным и реалистичным, если постараться. Сюрреалистичное сочетание, впрочем, создать намного проще. Генерация идёт быстро, интерфейс довольно простой и интуитивно понятный.

Lexica Aperture

Нейросеть Lexica Aperture для генерации изображений
Нейросеть Lexica Aperture

Ещё одна довольно интересная нейросеть для создания картинок с высокой степенью детализации в жанре цифровая живопись или фотореализм. Работает за счёт сложных промтов, принимает референсы, позволяет значительно редактировать полученное изображение. Даже некоторую стилизацию допускает. Из минусов – проблемы с пальцами и не всегда полное следование промтам. Словом, типичные проблемы, которые возникают, когда нейросеть генерирует картинки.

Однако простота работы (запрос вводится в браузере, логиниться можно через аккаунт Гугл), 25 бесплатных генераций на пользователя и высокое качество полученных результатов делают Lexica Aperture весьма популярной. Ах да, для коммерческого использования созданных картинок нужно приобрести платную версию – как и в почти всех аналогичных проектах.

Deep Dream

Нейросеть Deep Dream для генерации изображений
Нейросеть Deep Dream

Ещё одна бесплатная нейросеть для создания картинок. Преимущественно – сюрреалистических. Нагляднее всего демонстрирует принцип построения изображения подобными программами. То есть, если некая комбинация точек типична для закономерности «глаз», то она и будет доработана как глаз. И не важно, что с другими элементами изображения она не сочетается. Называется такой режим «Deep Dream», а описанный приём – так называемое ИИ-усиление. Именно он и сделал данную нейросеть для генерации изображений известной. А более «реалистичные» режимы, такие как Text 2 Dream, были созданы позднее.

Программа формально бесплатная - нейросеть рисует за счёт «внутренней валюты», которую можно докупать за реальные деньги (от 19 долларов). Но никто не мешает просто зарегистрировать новый аккаунт. Работает и с фотографиями, и с текстовым описанием. Текст, впрочем, интерпретирует хуже, чем другие аналогичные проекты – может просто игнорировать большинство слов, цепляясь за что-то одно.

Dream by WOMBO

Нейросеть Dream by WOMBO для генерации изображений
Нейросеть Dream by WOMBO

Нейросеть для генерации картинок, которая по простому текстовому запросу (до 200 символов на английском) выдаёт абстрактное изображение с относительно низкой детализацией. Зато быстро, бесплатно и в разных стилях. Плюс можно менять степень «абстрактности», немного редактировать полученное изображение и дополнять его. Есть платная версия с большим функционалом, возможностью изучать чужие промты и исправлять созданную по вашему запросу картинку. Главный минус этой нейросети для создания картинок – плохая детализация и нехватка чёткости. Да и текстовые запросы она далеко не всегда понимает правильно. Тем не менее, абстракции у неё получаются просто превосходные.

Заключение

Так какие выводы можно сделать из всего вышесказанного? Довольно интересные.

  • Во-первых, нейросеть для рисования уже стала одним из важных инструментов работы цифровых художников. Она действительно помогает ускорить работу и оптимизировать рутинные процессы. С разной степенью эффективности – как и ранее разные программы для графического дизайна.

  • Во-вторых, вполне возможно появление радикально новых и успешных проектов. Просто потому, что процесс обучения каждой отдельно взятой нейросети для генерации картинок может приводить к непредсказуемым по своей эффективности результатам. Так что создателям и владельцам Midjourney или DALL-E 2 почивать на лаврах нельзя – конкуренция никуда не пропадает.

  • В-третьих, нас ожидают новые скандалы, особенно связанные с интеллектуальной собственностью. Ведь уже сейчас многие художники недовольны тем, что нейросеть рисует, копируя их фирменный стиль. И чем дальше – тем активнее они будут этому противиться.

  • Ну и в-четвёртых, искусственный интеллект обязательно научится нормально рисовать пальцы – просто дайте ему больше данных или времени, а также повысьте вычислительную мощность.

Так что да, мир цифрового творчества изменился окончательно и бесповоротно. И нам, как потребителям этого самого творчества, от этого будет только лучше. Как и создателям контента, которые готовы идти в ногу со временем и принимать новые технологии.

Оставаясь на онлайне вы даете согласие на использование файлов cookies, которые помогают нам сделать ваше пребывание здесь более удобным.

Based on your browser and language settings, you might prefer the English version of our website. Would you like to switch?