Telegram Group & Telegram Channel
SVGDreamer: Text Guided SVG Generation with Diffusion Model

⚡️ В этом году на CVPR была представлена статья SVGDreamer, посвященная text-to-svg генерации. Предложенная модель обладает более высоким визуальным качеством и разнородностью генерации, а благодаря разделению на семантические слои сгенерированные изображения легко редактировать.

Что внутри:

💠 Semantic-driven Image Vectorization (SIVE) разделяет семантические слои на изображении, что позволяет отдельно векторизовать объекты и фон картинки. Такое разделение необходимо, чтобы передний план и фон не были связаны друг с другом, и каждый объект на картинке мог легко редактироваться независимо от остальных. Контрольные точки кривых, задающих объекты в векторной графике, инициализируются на основе cross-attention map, после чего оптимизируются с помощью SIVE-лосса.

💠 Vectorized Particle-based Score Distillation (VPSD) для синтеза изображения. Авторы моделируют SVG-изображение распределением контрольных точек и их цветовых значений. Растеризованная с помощью дифференцируемого растеризатора diffvg картинка вместе с текстовым промптом подается на вход в предобученную text-to-image диффузионную модель и дообучаемую LoRA.

💠 Также авторы используют предобученную reward-модель, выставляющую скоры сэмплам из LoRA, и дополнительно считают reward-лосс.

🖼️ Для генерации доступны различные стили изображения, такие как скетч, пиксель-арт и рисунок. По метрикам модель обходит существующие решения, такие как DiffSketcher и VectorFusion.

🎉 В открытый доступ выложен код SVGDreamer, который (мы проверили) запускается из коробки.

💻 GitHub
📜 ArXiv
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍95



group-telegram.com/rndcv_team/134
Create:
Last Update:

SVGDreamer: Text Guided SVG Generation with Diffusion Model

⚡️ В этом году на CVPR была представлена статья SVGDreamer, посвященная text-to-svg генерации. Предложенная модель обладает более высоким визуальным качеством и разнородностью генерации, а благодаря разделению на семантические слои сгенерированные изображения легко редактировать.

Что внутри:

💠 Semantic-driven Image Vectorization (SIVE) разделяет семантические слои на изображении, что позволяет отдельно векторизовать объекты и фон картинки. Такое разделение необходимо, чтобы передний план и фон не были связаны друг с другом, и каждый объект на картинке мог легко редактироваться независимо от остальных. Контрольные точки кривых, задающих объекты в векторной графике, инициализируются на основе cross-attention map, после чего оптимизируются с помощью SIVE-лосса.

💠 Vectorized Particle-based Score Distillation (VPSD) для синтеза изображения. Авторы моделируют SVG-изображение распределением контрольных точек и их цветовых значений. Растеризованная с помощью дифференцируемого растеризатора diffvg картинка вместе с текстовым промптом подается на вход в предобученную text-to-image диффузионную модель и дообучаемую LoRA.

💠 Также авторы используют предобученную reward-модель, выставляющую скоры сэмплам из LoRA, и дополнительно считают reward-лосс.

🖼️ Для генерации доступны различные стили изображения, такие как скетч, пиксель-арт и рисунок. По метрикам модель обходит существующие решения, такие как DiffSketcher и VectorFusion.

🎉 В открытый доступ выложен код SVGDreamer, который (мы проверили) запускается из коробки.

💻 GitHub
📜 ArXiv

BY RnD CV Team





Share with your friend now:
group-telegram.com/rndcv_team/134

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed. If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats. The news also helped traders look past another report showing decades-high inflation and shake off some of the volatility from recent sessions. The Bureau of Labor Statistics' February Consumer Price Index (CPI) this week showed another surge in prices even before Russia escalated its attacks in Ukraine. The headline CPI — soaring 7.9% over last year — underscored the sticky inflationary pressures reverberating across the U.S. economy, with everything from groceries to rents and airline fares getting more expensive for everyday consumers.
from us


Telegram RnD CV Team
FROM American