Top.Mail.Ru

Генерация неонового автомобиля тестируем возможности модели

  • Алгоритм создания киберпанк-автомобилей нейросетью | Параметры генерации и работа с текстовыми запросами
Генерация неонового концепт-кара искусственным интеллектом в Тензор Арт: тестируем возможности архитектуры ФЛАКС Фьюжн Ви-2
Результат генерации футуристического автомобиля с неоновой подсветкой в Тензор Арт

Недавно экспериментировал с нейросетевой генерацией изображений на платформе Тензор Арт (Tensor Art) — сервисе для создания картинок с помощью искусственного интеллекта. Решил попробовать создать концепт спорткара в неоновом стиле — что-то вроде реинкарнации футуристического суперкара для вселенной киберпанка. Получился интересный результат: агрессивный силуэт, глянцевый кузов, пульсирующий красным светом на фоне ночного мегаполиса.

Результат эксперимента

Финальное изображение напоминает кадр из фантастического фильма: чёрный кузов с красными акцентами отражает неоновые вывески, под колёсами клубится дым, а влажный асфальт зеркалит огни вымышленного города. Машина будто дрифтует на повороте — это ощущение динамики передано через низкий угол съёмки и размытие движения.

Еще один вариант генерации неонового концепт-кара
Еще один вариант генерации футуристического автомобиля

Меня впечатлила детализация колёсных дисков и интерьера — виден каркас безопасности, что добавляет реализма гоночному автомобилю.

Как составлял текстовый запрос для генерации неонового концепт-кара

Писал описание на русском языке, структурируя его по принципу от общего к частному: сначала композиция и ракурс, затем описание объекта, потом окружение и освещение.

Использованный текстовый запрос на русском:

Динамичный средний план с низкой угловой точки съёмки, освещающий чёрно-красный футуристический автомобиль с гипердетализированной глянцевой краской, отражающей красный неон. Автомобиль дрифтует на повороте мокрой улицы вымышленного мегаполиса с клубящимся белым дымом, замысловатыми колёсами и видимым интерьером с каркасом безопасности. Детализированные фары и задние огни, аэродинамический обвес и размытие движения. На фоне — яркий городской пейзаж в стиле "готэмпанк" (придуманный мной термин для смеси готики и киберпанка) с высокими готическими небоскрёбами и разноцветными неоновыми вывесками, создающими динамичные тени. Яркое искусственное освещение подчёркивает сцену.

Что сработало в текстовом запросе

  • Низкий угловой ракурс — делает автомобиль массивным и доминирующим в кадре.
  • Влажная улица вымышленного мегаполиса — создаёт естественные отражения неона.
  • Готэмпанк — придуманное мной слово, смесь готики и киберпанка. Модель интерпретировала его как сочетание готической архитектуры с киберпанк-эстетикой.
  • Клубящийся белый дым — добавляет драматичности и ощущения скорости.
  • Размытие движения — для передачи динамики.
Интерфейс генератора изображений
Интерфейс генератора изображений

Какие модели использовал

Основная модель: ФЛАКС Фьюжн Ви-2 (FLUX Fusion V2) [фп8]

Оптимизированная версия архитектуры ФЛАКС (FLUX), которая в моём тесте показала хороший результат при минимальном количестве шагов. Доступна в сообществе Тензор Арт.

Дополнительная модель для детализации: Гипер Текстур Детейлс (Hyper Texture Details) для ФЛАКС

Усиливает микродетали и текстурную глубину. Помог проработать фактуру металла и отражения.

Дополнительная модель для металлических поверхностей: Металлик Сёрфейс (Metallic Surface) для ФЛАКС — вес 1.3

Специализируется на металлических поверхностях. При таком весе дал нужный глянцевый эффект без перебора.

Технические параметры генерации

В таблице ниже собрал все настройки, которые использовал для этого изображения. Экспериментировал с минимальным количеством шагов — интересно было проверить, сохранится ли качество при ускоренной генерации.

ПараметрЗначениеМои наблюдения
Метод дискретизацииДПМ++ 2М Каррас (DPM++ 2M Karras)Быстрая сходимость даже на минимальном количестве итераций. Расписание Каррас даёт плавные переходы.
Количество шагов5Экстремально низкое значение, но модель справилась. Обычно используют 20-30, здесь сработало и так.
Коэффициент следования запросу7Среднее значение — баланс между точным следованием описанию и креативной свободой модели.
Начальное значение1000996239Фиксировал для возможности повторить результат. При тех же параметрах получится идентичная картинка.
Пропуск слоёв энкодера2Пропуск последнего слоя. Даёт более «художественный», менее буквальный результат.
Разрешение1707×2560Вертикальный формат 2:3. Высокое разрешение позволило сохранить детализацию колёс и вывесок.

Что такое ФЛАКС и почему эта нейросеть

ФЛАКС (FLUX) — это относительно новая архитектура для генерации изображений. На момент тестирования меня интересовала способность этой модели работать с освещением и отражениями — критично для автомобильной съёмки в ночных условиях.

В отличие от более ранних моделей, ФЛАКС демонстрирует более точное понимание физики света и материалов. Это особенно заметно при генерации металлических поверхностей и неонового освещения.

Особенности рабочего процесса

Комбинация метода ДПМ++ 2М Каррас (DPM++ 2M Karras) с всего 5 шагами и пропуском слоёв на 2 создаёт интересный эффект: скорость ультра-быстрой генерации плюс некоторая «мягкость» в интерпретации мелких деталей.

Архитектура ФЛАКС порадовала работой с освещением — отражения на кузове выглядят физически правдоподобно, неоновые источники света дают реалистичные блики на глянцевой поверхности.

Почему сработал термин «Готэмпанк»

Интересный момент: я использовал самодельное слово «Готэмпанк» — придуманный мной термин для смеси готики и киберпанка. Модель восприняла его как сочетание готической архитектуры с киберпанк-эстетикой — и выдала именно то, что задумывал: высокие готические небоскрёбы, но с яркими неоновыми вывесками. Это показывает гибкость современных нейросетей в интерпретации неологизмов.

Альтернативы и сравнение

Этот же текстовый запрос можно попробовать в других сервисах и с другими моделями:

  • На платформе Хаггинг Фейс (Hugging Face) — сообществе разработчиков машинного обучения — доступны базовые версии ФЛАКС для сравнения результатов.
  • В сервисе Репликейт (Replicate) — облачной платформе для запуска моделей — можно протестировать разные варианты модели с похожими параметрами.
  • Для сравнения с другими архитектурами можно использовать аналогичные адаптеры.

В моём случае выбор пал на Тензор Арт из-за удобства работы с сообщественными моделями и возможности быстро перебирать варианты без локальной установки.

Итоги тестирования

Получился рабочий алгоритм для генерации автомобилей в ночной городской среде. Основная фишка — минимальное количество шагов без потери качества благодаря оптимизированной модели.

Если интересуетесь экспериментами с генеративной графикой, такой подход позволяет сократить время на рендере. Лично мне понравилась способность модели работать со сложным освещением и отражениями — это открывает возможности для создания атмосферных автомобильных сцен.

Похожие материалы 🔥

Оцените статью
Новости нейронных сетей