group-telegram.com/artificial_stupid/437
Last Update:
#audio
Коль у нас новый год, держите небольшую прохладную историю про взлом Жепы Алисы (ну как взлом, просто эксперимент с обходом детского режима).
В прошлом году (несколько дней назад), когда салаты еще нарезались, а не доедались, мы с сыном друзей (Ярослав, привет!) от нечего делать (и от праведного гнева Ярослава из-за того, что Алиса не дает детям слушать Linkin Park) решили попробовать обойти детский режим.
Идея была простой. Вероятно, там стоит классификатор голоса (ребенок/взрослый). А это значит, что нужно понять, что определяет "детский" голос. Логичным предположением был тембр и высота голоса. Поэтому наш военный совет выбрал основной целью атаки изменение голоса.
Качать приложение для изменения голоса мне было лень. Потому быстро была сделана проверка концепции в виде озвучки текста голосом рандомного персонажа в silero. Но, увы, разработчики сделали так, что воспроизведение с устройства Алису не триггерит.
Потому пришлось искать обходные пути. К счастью, мы быстро придумали обходной путь в виде первого обращения к Алисе человеком и последующего запуска синтетического голоса для запроса. Но, увы, и здесь нас ждала засада. Модель не хотела воспринимать запись за взрослого.
Мы уже было отчаялись. Но оставалась еще одна идея. А что, если мы попробуем разные голоса (мало ли, вдруг там есть что-то для их разделения или оценки их естественности)? Наш маневр оказался успешным, враг в лице Алисы не заметил наших гусар у себя в тылу.
"Нашими гусарами" оказался синтетический голос гугл-переводчика. То есть, итоговый рецепт победы получился такой: обращение к Алисе детским голосом (чтобы активировать считывание) + остальной текст, озвученный гугл-переводчиком.
Впрочем, я думаю, что это когда-то поправят. А может быть нам просто повезло (еще я буду тратить больге времени на более разнообразные эксперименты, свое эго я уже почесал, хехе). Ну и, конечно же, это все в ознакомительных целях. Дети, не слушайте глупых взрослых (вроде меня), детский режим спасает вас от внезапного столкновения со взрослой реальностью (и потенциальным выходом на работу, чего стоит избегать всеми детскими силами).
В итоге, данный рецепт позволил запустить столь желанный Liknin Park. И мы, довольные стратегическим гением уровня Сунь-Цзы, весело выдвинулись в новый 2025 год. Следующей нашей целью было оперативное опустошение запасов салатов. Но это уже другая история...
P.S. Результаты прошлого голосования я увидел. Старый кот остается! (люблю демократию, ведь мне буквально ничего не нужно делать по итогам голосования)
BY Artificial stupidity

Share with your friend now:
group-telegram.com/artificial_stupid/437