Telegram Group & Telegram Channel
SVGDreamer: Text Guided SVG Generation with Diffusion Model

⚡️ В этом году на CVPR была представлена статья SVGDreamer, посвященная text-to-svg генерации. Предложенная модель обладает более высоким визуальным качеством и разнородностью генерации, а благодаря разделению на семантические слои сгенерированные изображения легко редактировать.

Что внутри:

💠 Semantic-driven Image Vectorization (SIVE) разделяет семантические слои на изображении, что позволяет отдельно векторизовать объекты и фон картинки. Такое разделение необходимо, чтобы передний план и фон не были связаны друг с другом, и каждый объект на картинке мог легко редактироваться независимо от остальных. Контрольные точки кривых, задающих объекты в векторной графике, инициализируются на основе cross-attention map, после чего оптимизируются с помощью SIVE-лосса.

💠 Vectorized Particle-based Score Distillation (VPSD) для синтеза изображения. Авторы моделируют SVG-изображение распределением контрольных точек и их цветовых значений. Растеризованная с помощью дифференцируемого растеризатора diffvg картинка вместе с текстовым промптом подается на вход в предобученную text-to-image диффузионную модель и дообучаемую LoRA.

💠 Также авторы используют предобученную reward-модель, выставляющую скоры сэмплам из LoRA, и дополнительно считают reward-лосс.

🖼️ Для генерации доступны различные стили изображения, такие как скетч, пиксель-арт и рисунок. По метрикам модель обходит существующие решения, такие как DiffSketcher и VectorFusion.

🎉 В открытый доступ выложен код SVGDreamer, который (мы проверили) запускается из коробки.

💻 GitHub
📜 ArXiv
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍95



group-telegram.com/rndcv_team/134
Create:
Last Update:

SVGDreamer: Text Guided SVG Generation with Diffusion Model

⚡️ В этом году на CVPR была представлена статья SVGDreamer, посвященная text-to-svg генерации. Предложенная модель обладает более высоким визуальным качеством и разнородностью генерации, а благодаря разделению на семантические слои сгенерированные изображения легко редактировать.

Что внутри:

💠 Semantic-driven Image Vectorization (SIVE) разделяет семантические слои на изображении, что позволяет отдельно векторизовать объекты и фон картинки. Такое разделение необходимо, чтобы передний план и фон не были связаны друг с другом, и каждый объект на картинке мог легко редактироваться независимо от остальных. Контрольные точки кривых, задающих объекты в векторной графике, инициализируются на основе cross-attention map, после чего оптимизируются с помощью SIVE-лосса.

💠 Vectorized Particle-based Score Distillation (VPSD) для синтеза изображения. Авторы моделируют SVG-изображение распределением контрольных точек и их цветовых значений. Растеризованная с помощью дифференцируемого растеризатора diffvg картинка вместе с текстовым промптом подается на вход в предобученную text-to-image диффузионную модель и дообучаемую LoRA.

💠 Также авторы используют предобученную reward-модель, выставляющую скоры сэмплам из LoRA, и дополнительно считают reward-лосс.

🖼️ Для генерации доступны различные стили изображения, такие как скетч, пиксель-арт и рисунок. По метрикам модель обходит существующие решения, такие как DiffSketcher и VectorFusion.

🎉 В открытый доступ выложен код SVGDreamer, который (мы проверили) запускается из коробки.

💻 GitHub
📜 ArXiv

BY RnD CV Team





Share with your friend now:
group-telegram.com/rndcv_team/134

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred." False news often spreads via public groups, or chats, with potentially fatal effects. "He has to start being more proactive and to find a real solution to this situation, not stay in standby without interfering. It's a very irresponsible position from the owner of Telegram," she said. This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. READ MORE
from no


Telegram RnD CV Team
FROM American