🗣Dia — это новаяоткрытая модель текст‑в‑речь от Nari Labs с 1.6 млрд параметров, способная генерировать полноценный диалог с богатой экспрессией.
Ключевые возможности: - Ультра‑реалистичный диалог. Генерация согласованных реплик двух «говорящих» персонажей, помеченных тэгами [S1] и [S2] в одном тексте.
- Эмоции и тон. Можно задавать тональность и интонацию через акустический запрос (audio prompt), а также управлять «невербалкой»: смех, кашель, вздохи и т. д.
- Voice cloning. Клонирование голоса по короткому образцу: подгрузите аудио и его транскрипт, и модель адаптируется под заданный тембр GitHub
Модель написана на Python (100 % кода) с использованием PyTorch 2.0 и CUDA 12.6
Производительность и требования:
Полная версия требует ≈10 GB VRAM; в будущем планируется квантование модели.
Установка и запуск:
pip install git+https://github.com/nari-labs/dia.git git clone https://github.com/nari-labs/dia.git cd dia uv run app.py # или python app.py
В интерфейсе Gradio сразу можно оценить разницу с ElevenLabs и Sesame CSM‑1B
Лицензия: Apache 2.0.
Dia отлично подходит для ML‑исследований в TTS: вы получаете открытые весовые файлы, гибкий API для скриптов и UI для быстрой проверки гипотез.
На данный момент Dia поддерживает генерацию речи только на английском языке
🗣Dia — это новаяоткрытая модель текст‑в‑речь от Nari Labs с 1.6 млрд параметров, способная генерировать полноценный диалог с богатой экспрессией.
Ключевые возможности: - Ультра‑реалистичный диалог. Генерация согласованных реплик двух «говорящих» персонажей, помеченных тэгами [S1] и [S2] в одном тексте.
- Эмоции и тон. Можно задавать тональность и интонацию через акустический запрос (audio prompt), а также управлять «невербалкой»: смех, кашель, вздохи и т. д.
- Voice cloning. Клонирование голоса по короткому образцу: подгрузите аудио и его транскрипт, и модель адаптируется под заданный тембр GitHub
Модель написана на Python (100 % кода) с использованием PyTorch 2.0 и CUDA 12.6
Производительность и требования:
Полная версия требует ≈10 GB VRAM; в будущем планируется квантование модели.
Установка и запуск:
pip install git+https://github.com/nari-labs/dia.git git clone https://github.com/nari-labs/dia.git cd dia uv run app.py # или python app.py
В интерфейсе Gradio сразу можно оценить разницу с ElevenLabs и Sesame CSM‑1B
Лицензия: Apache 2.0.
Dia отлично подходит для ML‑исследований в TTS: вы получаете открытые весовые файлы, гибкий API для скриптов и UI для быстрой проверки гипотез.
На данный момент Dia поддерживает генерацию речи только на английском языке
Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. Pavel Durov, Telegram's CEO, is known as "the Russian Mark Zuckerberg," for co-founding VKontakte, which is Russian for "in touch," a Facebook imitator that became the country's most popular social networking site. The regulator said it had received information that messages containing stock tips and other investment advice with respect to selected listed companies are being widely circulated through websites and social media platforms such as Telegram, Facebook, WhatsApp and Instagram. Multiple pro-Kremlin media figures circulated the post's false claims, including prominent Russian journalist Vladimir Soloviev and the state-controlled Russian outlet RT, according to the DFR Lab's report. The news also helped traders look past another report showing decades-high inflation and shake off some of the volatility from recent sessions. The Bureau of Labor Statistics' February Consumer Price Index (CPI) this week showed another surge in prices even before Russia escalated its attacks in Ukraine. The headline CPI — soaring 7.9% over last year — underscored the sticky inflationary pressures reverberating across the U.S. economy, with everything from groceries to rents and airline fares getting more expensive for everyday consumers.
from sg