# Урок №2: Midjourney, Flux или Stable Diffusion?

На данный момент существует целое множество нейросетей, способных генерировать изображения, но в этом уроке мы сравним три самых мощных и популярных нейросети - MidJourney, Flux и Stable Diffusion. Каждая из них имеет уникальные особенности, сильные и слабые стороны. Мы разберём их возможности, сравним по ключевым параметрам и протестируем на одинаковых промптах, чтобы вы могли выбрать подходящий инструмент именно для своих задач.

### MidJourney

**Описание**: MidJourney — это облачная нейросеть для генерации изображений. Она известна своим интуитивным интерфейсом и высоким качеством художественных изображений.

**Ключевые особенности**:

* **Доступ**: Через Discord, требуется подписка (от $10/месяц) или агрегаторы нейросетей, такие как BotHub (от $2)
* **Интерфейс**: Команды в чате (например, /imagine prompt).
* **Стили**: Отлично подходит для художественных стилей (фэнтези, сюрреализм, реализм).
* **Параметры**: Поддерживает настройку качества (--q 2), стиля (--s 100), соотношения сторон (--ar 16:9).
* **Ограничения**: Нет локального запуска, ограниченное количество генераций в бесплатной версии.

**Применение**: Создание цифрового искусства, концепт-арта, NFT.

### Flux

**Описание**: Flux, разработанный Black Forest Labs, — это современная нейросеть для генерации изображений, доступная как в облаке, так и для локального запуска. Она конкурирует с MidJourney по качеству и предлагает open-source возможности.

**Ключевые особенности**:

* **Доступ**: Облако (например, через BotHub, от $0.0024/генерация) или локально (Hugging Face, бесплатно с GPU).
* **Интерфейс**: API или веб-платформы.
* **Стили**: Высокая детализация, поддержка реализма, аниме, абстракции.
* **Параметры**: Настройка числа шагов (num\_steps), cfg\_scale (степень соответствия промпту), разрешения.
* **Ограничения**: Локальный запуск требует мощного оборудования (GPU с 12+ ГБ).

**Применение**: Генерация изображений для коммерческих проектов, NFT, локальная разработка.

### Stable Diffusion

**Описание**: Stable Diffusion — open-source нейросеть от Stability AI, широко используемая для генерации изображений. Модель оставляет возможность для fine-tuning (дообучения модели), что позволяет в точности повторять желаемые стили. Она популярна благодаря гибкости и бесплатному локальному запуску.

**Ключевые особенности**:

* **Доступ**: Бесплатно локально (Hugging Face) или через облачные сервисы (DreamStudio, BotHub).
* **Интерфейс**: Веб-интерфейсы, API, GUI (например, Stable Diffusion WebUI).
* **Стили**: Универсальна, хорошо работает с кастомными моделями (LoRA, DreamBooth).
* **Параметры**: Поддержка negative prompts, seed, sampling methods (DDIM, Euler).
* **Ограничения**: Качество может быть ниже MidJourney без тонкой настройки, сложнее для новичков.

**Применение**: Кастомизация моделей, создание уникальных стилей, исследования.

{% hint style="info" %}
Подведем краткий итог:&#x20;

* **MidJourney**: Если нужен быстрый старт, высокое качество и вы готовы платить.
* **Flux**: Если важна детализация, гибкость и возможность локального запуска.
* **Stable Diffusion**: Если требуется кастомизация и бесплатное решение.
  {% endhint %}

### **Сравним на практике**

Мы протестируем нейросети на трёх промптах, чтобы сравнить их результаты. Для каждой нейросети мы используем одинаковые запросы и настройки (где возможно). Промпты выбраны для разных стилей: реализм, фэнтези и абстракция.

**Первый промпт:** "A serene Japanese garden at sunrise, with a wooden bridge over a pond, cherry blossoms falling, highly detailed, photorealistic"

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2Fwey8V4lJDM5T6aHdxBm3%2Fimage.png?alt=media&#x26;token=9d42142f-e997-4050-b55e-10b09cf990d9" alt=""><figcaption><p>Результат от Flux Pro</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FAdYCepkf0cedK3dVCfbh%2Fimage.png?alt=media&#x26;token=29191029-d65d-46a8-a598-0cca2eef7efc" alt=""><figcaption><p>Результат от Stable Diffusion</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2F4t9VM7CcDhrTjTif5deJ%2Fimage.png?alt=media&#x26;token=0e918465-b163-4088-8ac3-10a6d5e42965" alt=""><figcaption><p>Результат от Midjourney v7</p></figcaption></figure>

Как видите, самым неудовлетворительным стал результат от Stable Diffusion - он весьма резкий по цветам и имеет странную детализацию, как например мост переходящий в воду. Это не значит, что модель некачественная, просто она требует большой предварительной работы по дообучению. Flux dev хорошо справилась с промптом - указала все детали, не нарушена логика и стиль приближен к реализму. Midjourney - очевидный победитель в реализме, сгенерированное изображение выглядит как полноценная картина маслом или фотография.

**Второй промпт:** "A majestic dragon flying over a medieval castle at twilight, glowing scales, cinematic lighting, epic fantasy style".

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FeC3lDPW5WpTxLuWDe8XK%2Fimage.png?alt=media&#x26;token=e81ac79c-36e5-488b-aad6-7f8baf0a924b" alt=""><figcaption><p>Результат от Flux Pro</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2F4MaJpJ0hlTGfn4nYTeFE%2Fimage.png?alt=media&#x26;token=ddf47eb7-7176-4934-a736-351e74c1dfbe" alt=""><figcaption><p>Результат от Stable Diffusion</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FU0EEmNa4AZbrA5CgUTjI%2Fimage.png?alt=media&#x26;token=8be6ef41-1341-4bed-a4d7-2b50d9d06610" alt=""><figcaption><p>Результат от Midjourney v7</p></figcaption></figure>

**Третий промпт:** "An abstract representation of human emotions, vibrant colors, surreal shapes, inspired by Kandinsky".

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FhKjsYm0B8N3HYeGEpBJB%2Fimage.png?alt=media&#x26;token=9bd0ad72-e8b9-4087-b11e-118575027610" alt=""><figcaption><p>Результат от Flux Pro</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FZF6Pf8AZoptCJP1bfEOP%2Fimage.png?alt=media&#x26;token=598398da-f573-4a77-a23f-ef86e297f5e4" alt=""><figcaption><p>Результат от Stable Diffusion</p></figcaption></figure>

<figure><img src="https://113300735-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FwImEff4lsN1NRsCNByAQ%2Fuploads%2FKMTFPC0eKuh4OoiY4Mjx%2Fimage.png?alt=media&#x26;token=01110e52-8dd6-4f79-967d-3ba5d3e315f5" alt=""><figcaption><p>Результат от Midjourney v7</p></figcaption></figure>

MidJourney, Flux и Stable Diffusion предлагают мощные инструменты для генерации изображений, но их выбор зависит от ваших целей, бюджета и уровня технической подготовки. MidJourney прост в использовании и быстро дает качественный результат, особенно в реализме, Flux балансирует качество и гибкость, а Stable Diffusion идеален для кастомизации, но без нее совершает достаточно много ошибок. Попробуйте все три нейросети, чтобы понять, какая лучше подходит для ваших проектов!
