Наши разработчики радикально расширили эмоциональный диапазон Алисы. Теперь она может увлечённо слушать, сопереживать, радоваться и даже ругаться (но мы попросили её этого не делать).
Ребята рассказали, почему в этой задаче нельзя просто дать модели больше данных, а приходится модернизировать архитектуру. Дело в том, что у нейронной сети нет человеческой интуиции и понимания важности оттенка речи. Поэтому информацию о новых эмоциях она воспринимает как менее значимую, чем, например, параметры реверберации звука.
🔳Какую архитектуру в итоге выбрали и почему, как выглядят схемы модели синтеза до и после модернизации нейросети и дизайна функции потерь, а ещё аудиопримеры голоса — ищите в статье на Хабре.
⚪️ Эта история будет интересна инженерам, которые занимаются синтезом речи или созданием архитектуры обучения LLM. А ещё всем, кто следит за развитием звуковых нейросетей.
Наши разработчики радикально расширили эмоциональный диапазон Алисы. Теперь она может увлечённо слушать, сопереживать, радоваться и даже ругаться (но мы попросили её этого не делать).
Ребята рассказали, почему в этой задаче нельзя просто дать модели больше данных, а приходится модернизировать архитектуру. Дело в том, что у нейронной сети нет человеческой интуиции и понимания важности оттенка речи. Поэтому информацию о новых эмоциях она воспринимает как менее значимую, чем, например, параметры реверберации звука.
🔳Какую архитектуру в итоге выбрали и почему, как выглядят схемы модели синтеза до и после модернизации нейросети и дизайна функции потерь, а ещё аудиопримеры голоса — ищите в статье на Хабре.
⚪️ Эта история будет интересна инженерам, которые занимаются синтезом речи или созданием архитектуры обучения LLM. А ещё всем, кто следит за развитием звуковых нейросетей.
Anastasia Vlasova/Getty Images However, the perpetrators of such frauds are now adopting new methods and technologies to defraud the investors. Telegram was founded in 2013 by two Russian brothers, Nikolai and Pavel Durov. The gold standard of encryption, known as end-to-end encryption, where only the sender and person who receives the message are able to see it, is available on Telegram only when the Secret Chat function is enabled. Voice and video calls are also completely encrypted. The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice.
from us