Почему эти модели принципиально разные, а не просто конкуренты
Midjourney v7 и FLUX 1.1 Pro Ultra решают схожую задачу — генерацию изображений — но исходят из разных архитектурных и исследовательских приоритетов. Midjourney построен на проприетарной диффузионной архитектуре, которую команда многократно итерировала под конкретный результат: эстетически выверенные изображения с характерной «живописностью». Модель обучалась с акцентом на художественное качество, причём кураторский отбор обучающих данных исторически делался с упором на иллюстративность, концептуальный арт и фотографию высокого класса. Итог — стабильное «чувство кадра», которое модель воспроизводит даже на размытых промптах.
FLUX 1.1 Pro Ultra от Black Forest Labs (команда, вышедшая из Stability AI и стоящая за Stable Diffusion 3) построен на архитектуре Rectified Flow Transformer. Это принципиально другой подход к диффузии: вместо классических U-Net-подобных сетей используются трансформеры с потоковым выпрямлением, что даёт более предсказуемое управление деталями и, в частности, лучшую обработку текста внутри изображений — задачи, где классические диффузионные модели традиционно слабы из-за того, как они кодируют семантику токенов.
Фактически FLUX оптимизирован под точность исполнения промпта и детализацию, Midjourney — под художественную интерпретацию с собственным «авторским голосом». Это не недостаток ни одной из моделей — это разные дизайн-решения под разные сценарии.