Наши разработчики радикально расширили эмоциональный диапазон Алисы. Теперь она может увлечённо слушать, сопереживать, радоваться и даже ругаться (но мы попросили её этого не делать).
Ребята рассказали, почему в этой задаче нельзя просто дать модели больше данных, а приходится модернизировать архитектуру. Дело в том, что у нейронной сети нет человеческой интуиции и понимания важности оттенка речи. Поэтому информацию о новых эмоциях она воспринимает как менее значимую, чем, например, параметры реверберации звука.
🔳Какую архитектуру в итоге выбрали и почему, как выглядят схемы модели синтеза до и после модернизации нейросети и дизайна функции потерь, а ещё аудиопримеры голоса — ищите в статье на Хабре.
⚪️ Эта история будет интересна инженерам, которые занимаются синтезом речи или созданием архитектуры обучения LLM. А ещё всем, кто следит за развитием звуковых нейросетей.
Наши разработчики радикально расширили эмоциональный диапазон Алисы. Теперь она может увлечённо слушать, сопереживать, радоваться и даже ругаться (но мы попросили её этого не делать).
Ребята рассказали, почему в этой задаче нельзя просто дать модели больше данных, а приходится модернизировать архитектуру. Дело в том, что у нейронной сети нет человеческой интуиции и понимания важности оттенка речи. Поэтому информацию о новых эмоциях она воспринимает как менее значимую, чем, например, параметры реверберации звука.
🔳Какую архитектуру в итоге выбрали и почему, как выглядят схемы модели синтеза до и после модернизации нейросети и дизайна функции потерь, а ещё аудиопримеры голоса — ищите в статье на Хабре.
⚪️ Эта история будет интересна инженерам, которые занимаются синтезом речи или созданием архитектуры обучения LLM. А ещё всем, кто следит за развитием звуковых нейросетей.
Right now the digital security needs of Russians and Ukrainians are very different, and they lead to very different caveats about how to mitigate the risks associated with using Telegram. For Ukrainians in Ukraine, whose physical safety is at risk because they are in a war zone, digital security is probably not their highest priority. They may value access to news and communication with their loved ones over making sure that all of their communications are encrypted in such a manner that they are indecipherable to Telegram, its employees, or governments with court orders. In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. Telegram, which does little policing of its content, has also became a hub for Russian propaganda and misinformation. Many pro-Kremlin channels have become popular, alongside accounts of journalists and other independent observers. During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons. At the start of 2018, the company attempted to launch an Initial Coin Offering (ICO) which would enable it to enable payments (and earn the cash that comes from doing so). The initial signals were promising, especially given Telegram’s user base is already fairly crypto-savvy. It raised an initial tranche of cash – worth more than a billion dollars – to help develop the coin before opening sales to the public. Unfortunately, third-party sales of coins bought in those initial fundraising rounds raised the ire of the SEC, which brought the hammer down on the whole operation. In 2020, officials ordered Telegram to pay a fine of $18.5 million and hand back much of the cash that it had raised.
from kr