"Записки научных семинаров ПОМИ"
Том 530, стр. 6-23
Векторизация изображений: обзор
М. Дзюба, И. Жарский, В. Ефимова, А. Фильченков
ITMO University
dziuba.maria@niuitmo.ru
ivanjarsky@niuitmo.ru
vefimova@itmo.ru
GO AI LAB
aaafil@gmail.com
- Аннотация:
В настоящее время существует множество диффузионных и авторегрессионных моделей,
которые показывают впечатляющие результаты для порождения изображений из текста
и других входных областей. Однако эти методы не предназначены для синтеза изображений
сверхвысокого разрешения. Векторная графика лишена этого недостатка, поэтому создание
изображений в этом формате представляется весьма перспективным направлением.
Вместо непосредственного создания векторных изображений можно сначала синтезировать
растровое изображение, а затем применить векторизацию.
Векторизация --- это процесс преобразования растрового изображения в аналогичное
векторное изображение с использованием примитивных форм. Помимо схожести, сгенерированное
векторное изображение также должно содержать минимальное количество фигур для рендеринга.
В этой работе мы фокусируемся конкретно на методах векторизации, совместимых с машинным обучением.
Мы рассматриваем модели Mang2Vec, Deep Vectorization of Technical Drawings, DiffVG и LIVE.
Мы также даем краткий обзор существующих решений, доступных онлайн. Мы также рассматриваем другие
алгоритмические методы --- модели Im2Vec и ClipGEN --- но они не участвуют в сравнении,
так как либо открытой реализации этих методов нет, либо их официальные реализации работают некорректно.
Наши исследования показывают, что, несмотря на возможность напрямую указывать число и тип фигур,
существующие методы машинного обучения работают очень долго и не воссоздают точно исходное изображение.
Мы считаем, что не существует быстрого универсального автоматического подхода,
и для каждого метода необходим человеческий контроль.
Библ. -- 38 назв.
- Ключевые слова: векторная графика, векторизация изображений, компьютерное зрение
[vector graphics, image vectorization, computer vision]
Полный текст(.pdf)