Как пользоваться Midjourney: простая инструкция, чтобы опробовать нейросеть с картинками

В соцсетях множатся посты в духе «нейросеть представила, как выглядели бы...» — и нередко у генератора картинок получается весьма неплохо, красиво, реалистично и забавно. Попробовать создать свои изображения при помощи самой популярной нейросети Midjourney может каждый — делимся пошаговой инструкцией для начинающих.
Как пользоваться Midjourney: простая инструкция, чтобы опробовать нейросеть с картинками
«Правила жизни»

Как начать работу

Работать с Midjourney можно через мессенджер Discord, популярный среди любителей компьютерных игр, — скачайте его в виде приложения или откройте в браузере веб-версию. Зарегистрируйтесь, если у вас еще нет аккаунта. Затем присоединитесь к серверу Midjourney по ссылке-приглашению.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Не пугайтесь: вы сразу попадете в огромный общий чат, где ежесекундно появляются сообщения пользователей. Нейросеть публичная, все происходит в одном пространстве, и вы можете видеть изображения, «заказанные» другими, а они — ваши.

Сервер устроен следующим образом: в левой части экрана можно выбрать каналы внутри него, там есть раздел Newcomer Rooms, содержащий сотни чатов Newbies. Вам как раз и нужен один из них — выбирайте такой, где не очень много пользователей: и генерироваться картинки будут быстрее, и ваши сообщения не потонут в общей массе. Если что, вам поможет кнопка «Почта» в правом верхнем углу окна Discord: там будут храниться уведомления, касающиеся именно ваших запросов нейросети.

Так выглядит диалоговое окно Midjourney в Discord
Так выглядит диалоговое окно Midjourney в Discord
Скриншот из Discord

Ограничения Midjourney

Первое и самое главное: нейросеть бесплатная, но количество попыток от каждого аккаунта ограничено — всего 25. Так что используйте их с умом! Платная подписка стоит $30, а за $10 вы можете получить 200 попыток. К сожалению, оплатить с российской карты не получится.

Во-вторых, у Midjourney есть запрет на ряд слов и тем: картинки с жестокостью и порнографией она генерировать не будет. Если ваш запрос «не понравится» по каким-либо критериям, выскочит соответствующее предупреждение. Но лучше сразу почитать правила сообщества (на сервере они находятся в канале Rules), чтобы избежать конфликтов и возможного бана.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как генерировать картинки

Теперь можно приступать собственно к картинкам. Сообщение для нейросети нужно начать с формулировки /imagine — тогда появится окошко Prompt для ввода запроса. Все, что будет написано в поле Prompt, Midjourney распознает как задачу для создания изображения. Писать лучше на английском языке — пока нейросеть плохо распознает другие. Можно указать, что вы хотите видеть на картинке, добавить описание стиля (например, «фотореализм» или «как в мультфильме»).

Промпт «Счастливая корги, которая ест булочку, в мультипликационном стиле»
Промпт «Счастливая корги, которая ест булочку, в мультипликационном стиле»
Скриншот из Discord

Когда запрос сформулирован, нажимайте «Отправить», и нейросеть начнет генерировать. В ответ на ваше сообщение появятся четыре расплывчатые картинки, которые постепенно начнут обретать черты. Сколько времени это займет, зависит от нагрузки на сервер — обычно нужно пару минут.

Четыре полученных варианта — не финальные. Под ними будет по четыре кнопки с буквами U и V — для улучшения качества (Upscale) и для создания вариаций (Variation) соответственно (помните про ограничение в 25 попыток: вместо формулировки нового промпта лучше поработать с уже созданными изображениями). То есть если вы нажмете U1, то получите более детализированную версию первой из четырех картинок, а V2 позволит сгенерировать еще четыре картинки, в основе которых лежит второе из изначальных четырех изображений. Кстати, это можно делать не только со своими, но и с чужими изображениями вдруг вам понравится чей-то запрос?

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Как Midjourney видит мультяшную корги с булочкой
Как Midjourney видит мультяшную корги с булочкой
Скриншот из Discord

После создания изображения через кнопки U, у вас под картинкой появятся новые кнопки: Make Variations (получить еще четыре версии этой детализированной картинки), Light / Beta Upscale Redo (вариации увеличения — с меньшим количеством деталей и с большим разрешением соответственно), Web (ссылка на галерею на сайте Midjourney) и эмодзи, чтобы оценить результат.

Вот что может получиться в итоге
Вот что может получиться в итоге
Скриншот из Discord

Если вам понравилось, нажимайте на изображение, затем «Открыть в браузере», и сохраняйте картинку в хорошем качестве.

Как настроить нейросеть

Если в поле сообщений ввести /settings, то появится меню настроек.

Меню настроек Midjourney
Меню настроек Midjourney
Скриншот из Discord
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
  • Первый блок кнопок с буквами MJ — версии «движка» (чем новее, тем лучше). MJ Test будет выдавать два экспериментальных изображения вместо четырех, MJ Test Photo специализируется на фотореализме.
  • Настройки Quality влияют на качество изображения (для начала Base quality, то есть базового, будет достаточно).
  • Style отвечает за уровень стилизации (опять же, пробуйте средний, на более высоком нейросети сложнее попасть в ваш запрос, будет слишком фантазийно).
  • Upscale — это алгоритм увеличения изображения. Regular upscale — стандартный; Light upscale добавляет меньше деталей при увеличении разрешения; Beta выдает размер вдвое больше Regular (но, как любая бета-версия, может сбоить).
  • Режимы Mode отвечают за разный доступ. Сразу предупредим: Private mode, при котором ваши запросы не видны остальным, — платный, равно как и Relax mode без счетчика попыток. А вот Remix mode позволяет «скрещивать» картинки и работать с готовым изображением — ниже покажем, как это делать.

Как объединять изображения

Пара слов про Remix mode — ту самую опцию, позволяющую превратить вашу фотографию в героя аниме или скрестить дроидов из «Звездных войн» с персонажами «Гарри Поттера». Для стилизации одного исходного изображения в поле Prompt нужно дать ссылку на него и дальше прописать параметры — например, «в стиле картины Ван Гога» или «как в "Симпсонах". Чтобы "скрещивать" изображения, в промпт вставляются ссылки на каждое из них (последовательность ссылок не особо влияет на результат). Нейросеть также выдаст четыре версии, с которыми можно дальше работать.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
То, что получилось при объединении изображений R2D2 и Гарри Поттера
То, что получилось при объединении изображений R2D2 и Гарри Поттера
Midjourney
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как правильно писать промпты

Общение с Midjourney на поверку оказывается не таким уж простым. Свой запрос лучше делать максимально емким и конкретным. Чтобы нейросети было понятнее ваше обращение, можно использовать внутри промпта своеобразный синтаксис в виде двух двоеточий с пробелами с обеих сторон. В основном промпт лучше формулировать таким образом: «Описание объекта :: стилистика :: дополнительные параметры :: --короткие команды».

Команды, прописанные через двоеточия, дают более качественный результат
Команды, прописанные через двоеточия, дают более качественный результат
Скриншот Discord

Вот некоторые полезные команды, которые можно прописать при генерации картинки:

--ar — aspect ratio, то есть соотношение сторон: позволяет создать не только квадратную картинку, которая получается по умолчанию. Можно задать конкретные размеры картинки в пикселях при помощи команд ​​-‎-w для ширины и -‎-h для высоты;

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

--wallpaper позволяет создать более детальное и качественное изображение для обоев рабочего стола и работает лучше, чем другие настройки качества в Midjourney;

-‎-no указывает, чего на картинке быть не должно;

-‎-chaos <от 0 до 100> изменяет «хаотичность» результатов: чем выше значение, тем более непохожими друг на друга будут варианты;

-‎-test -‎-creative добавляет результатам креативности.

-‎-video — записывает видео процесса генерации. Потом нужно будет ответить на сгенерированное изображение эмодзи конверта, и бот пришлет его вам в личные сообщения.

Если хочется более углубленной работы со стилистикой изображений, вот тут можно найти лайфхаки, как правильно формулировать запросы. А для тех, кто хочет глубже погрузиться в работу с нейросетью и написание правильных запросов, есть специальные сервисы для составления идеальных промптов — например, Phraser, Prompter, Promptomania, Noonshot.