- Алгоритм создания киберпанк-автомобилей нейросетью | Параметры генерации и работа с текстовыми запросами

Недавно экспериментировал с нейросетевой генерацией изображений на платформе Тензор Арт (Tensor Art) — сервисе для создания картинок с помощью искусственного интеллекта. Решил попробовать создать концепт спорткара в неоновом стиле — что-то вроде реинкарнации футуристического суперкара для вселенной киберпанка. Получился интересный результат: агрессивный силуэт, глянцевый кузов, пульсирующий красным светом на фоне ночного мегаполиса.
Результат эксперимента
Финальное изображение напоминает кадр из фантастического фильма: чёрный кузов с красными акцентами отражает неоновые вывески, под колёсами клубится дым, а влажный асфальт зеркалит огни вымышленного города. Машина будто дрифтует на повороте — это ощущение динамики передано через низкий угол съёмки и размытие движения.

Меня впечатлила детализация колёсных дисков и интерьера — виден каркас безопасности, что добавляет реализма гоночному автомобилю.
Как составлял текстовый запрос для генерации неонового концепт-кара
Писал описание на русском языке, структурируя его по принципу от общего к частному: сначала композиция и ракурс, затем описание объекта, потом окружение и освещение.
Использованный текстовый запрос на русском:
Динамичный средний план с низкой угловой точки съёмки, освещающий чёрно-красный футуристический автомобиль с гипердетализированной глянцевой краской, отражающей красный неон. Автомобиль дрифтует на повороте мокрой улицы вымышленного мегаполиса с клубящимся белым дымом, замысловатыми колёсами и видимым интерьером с каркасом безопасности. Детализированные фары и задние огни, аэродинамический обвес и размытие движения. На фоне — яркий городской пейзаж в стиле "готэмпанк" (придуманный мной термин для смеси готики и киберпанка) с высокими готическими небоскрёбами и разноцветными неоновыми вывесками, создающими динамичные тени. Яркое искусственное освещение подчёркивает сцену.
Что сработало в текстовом запросе
- Низкий угловой ракурс — делает автомобиль массивным и доминирующим в кадре.
- Влажная улица вымышленного мегаполиса — создаёт естественные отражения неона.
- Готэмпанк — придуманное мной слово, смесь готики и киберпанка. Модель интерпретировала его как сочетание готической архитектуры с киберпанк-эстетикой.
- Клубящийся белый дым — добавляет драматичности и ощущения скорости.
- Размытие движения — для передачи динамики.

Какие модели использовал
Основная модель: ФЛАКС Фьюжн Ви-2 (FLUX Fusion V2) [фп8]
Оптимизированная версия архитектуры ФЛАКС (FLUX), которая в моём тесте показала хороший результат при минимальном количестве шагов. Доступна в сообществе Тензор Арт.
Дополнительная модель для детализации: Гипер Текстур Детейлс (Hyper Texture Details) для ФЛАКС
Усиливает микродетали и текстурную глубину. Помог проработать фактуру металла и отражения.
Дополнительная модель для металлических поверхностей: Металлик Сёрфейс (Metallic Surface) для ФЛАКС — вес 1.3
Специализируется на металлических поверхностях. При таком весе дал нужный глянцевый эффект без перебора.
Технические параметры генерации
В таблице ниже собрал все настройки, которые использовал для этого изображения. Экспериментировал с минимальным количеством шагов — интересно было проверить, сохранится ли качество при ускоренной генерации.
| Параметр | Значение | Мои наблюдения |
|---|---|---|
| Метод дискретизации | ДПМ++ 2М Каррас (DPM++ 2M Karras) | Быстрая сходимость даже на минимальном количестве итераций. Расписание Каррас даёт плавные переходы. |
| Количество шагов | 5 | Экстремально низкое значение, но модель справилась. Обычно используют 20-30, здесь сработало и так. |
| Коэффициент следования запросу | 7 | Среднее значение — баланс между точным следованием описанию и креативной свободой модели. |
| Начальное значение | 1000996239 | Фиксировал для возможности повторить результат. При тех же параметрах получится идентичная картинка. |
| Пропуск слоёв энкодера | 2 | Пропуск последнего слоя. Даёт более «художественный», менее буквальный результат. |
| Разрешение | 1707×2560 | Вертикальный формат 2:3. Высокое разрешение позволило сохранить детализацию колёс и вывесок. |
Что такое ФЛАКС и почему эта нейросеть
ФЛАКС (FLUX) — это относительно новая архитектура для генерации изображений. На момент тестирования меня интересовала способность этой модели работать с освещением и отражениями — критично для автомобильной съёмки в ночных условиях.
В отличие от более ранних моделей, ФЛАКС демонстрирует более точное понимание физики света и материалов. Это особенно заметно при генерации металлических поверхностей и неонового освещения.
Особенности рабочего процесса
Комбинация метода ДПМ++ 2М Каррас (DPM++ 2M Karras) с всего 5 шагами и пропуском слоёв на 2 создаёт интересный эффект: скорость ультра-быстрой генерации плюс некоторая «мягкость» в интерпретации мелких деталей.
Архитектура ФЛАКС порадовала работой с освещением — отражения на кузове выглядят физически правдоподобно, неоновые источники света дают реалистичные блики на глянцевой поверхности.
Почему сработал термин «Готэмпанк»
Интересный момент: я использовал самодельное слово «Готэмпанк» — придуманный мной термин для смеси готики и киберпанка. Модель восприняла его как сочетание готической архитектуры с киберпанк-эстетикой — и выдала именно то, что задумывал: высокие готические небоскрёбы, но с яркими неоновыми вывесками. Это показывает гибкость современных нейросетей в интерпретации неологизмов.
Альтернативы и сравнение
Этот же текстовый запрос можно попробовать в других сервисах и с другими моделями:
- На платформе Хаггинг Фейс (Hugging Face) — сообществе разработчиков машинного обучения — доступны базовые версии ФЛАКС для сравнения результатов.
- В сервисе Репликейт (Replicate) — облачной платформе для запуска моделей — можно протестировать разные варианты модели с похожими параметрами.
- Для сравнения с другими архитектурами можно использовать аналогичные адаптеры.
В моём случае выбор пал на Тензор Арт из-за удобства работы с сообщественными моделями и возможности быстро перебирать варианты без локальной установки.
Итоги тестирования
Получился рабочий алгоритм для генерации автомобилей в ночной городской среде. Основная фишка — минимальное количество шагов без потери качества благодаря оптимизированной модели.
Если интересуетесь экспериментами с генеративной графикой, такой подход позволяет сократить время на рендере. Лично мне понравилась способность модели работать со сложным освещением и отражениями — это открывает возможности для создания атмосферных автомобильных сцен.







