Почему фотореализм — одна из сложнейших задач для генеративных моделей
Человеческий глаз натренирован замечать артефакты, которые мозг мгновенно классифицирует как «ненастоящее»: неправильное преломление света в зрачке, симметрия кожных пор, которой не бывает в природе, пальцы с анатомически невозможными суставами, текстура ткани, у которой отсутствует направление нити. Генеративные модели работают с вероятностным распределением пикселей, а не с физикой материального мира — отсюда системные проблемы. Блики на металлических поверхностях часто игнорируют источник освещения. Волосы на границе с фоном теряют структуру. Кожа либо слишком «глянцевая» (модель усредняет текстуры), либо покрыта случайным шумом, имитирующим поры без логики распределения. Для оценки результата в профессиональном контексте используют несколько критериев: согласованность источников света во всех элементах кадра, читаемость материалов (металл vs пластик vs кожа без подсказки текста), физически корректные тени и глубина резкости, отсутствие «AI-лица» — характерного усреднённого типажа без индивидуальных черт. Дополнительная сложность: один и тот же промпт в разных моделях даёт результаты с разрывом в качестве от «можно публиковать» до «явный AI». Это означает, что выбор модели для задач фотореализма влияет на результат сильнее, чем для иллюстрации или арта.