Исследователи из НИУ ВШЭ и «Яндекса» представили метод Scale-wise Distillation of Diffusion Models (SwD), позволяющий создавать изображения за 0,3–0,4 секунды. Технология оптимизирует нагрузку на вычислительные мощности, сохраняя качество детализации популярных нейросетей.
Традиционные диффузионные модели тратят десятки циклов вычислений на создание одного кадра. На первых этапах ресурсы часто расходуются неэффективно: система обрабатывает высокое разрешение там, где еще нет четких контуров. Метод SwD меняет этот алгоритм: генерация начинается с низкого разрешения и постепенно уточняется по мере снижения «шума».Дистилляция и упрощение вычислений
Разработчики применили механизм «дистилляции», при котором упрощенная модель-ученик перенимает опыт у тяжелых систем вроде FLUX или Stable Diffusion 3.5. Это позволяет сократить количество шагов генерации до 4–6 вместо стандартных нескольких десятков.





Комментарии (0)
Пока нет комментариев. Будьте первым!