Telegram Group & Telegram Channel
Итак, на новой работе от меня не требовалось обучать модели машинного обучения с нуля, а требовалось только поддерживать правильную работу Nuance. Для этого нужно было делать следующее.

- Скачивать с сервера некоторое количество звонков и их логов каждый день (я не помню сколько, по 100 на каждом языке и для каждой компании, наверное). Логи были сохранены в огромные текстовые файлы, и из них нужно было делать таблицы csv. Это все делалось через баш-скрипты, потому что сервера были на Windows и питона там не было, и ставить его не разрешалось. Поэтому мне пришлось освоить основы bash.

- Звонки нужно было прослушать и сопоставить с логами. В логах был автоматически транскрибированный текст звонка и то, как звонок был маршрутизирован. Нужно было оценить, правильно ли распознан текст, если неправильно, то предположить почему (шумно, человек говорит что-то не по теме и так далее). И правильно ли звонок маршрутизирован, то есть получил ли звонящий то, что хотел. В каждой компании было по 15-20 интентов: оплатить фактуру, перерегистрировать услуги на другого человека, авария, пожаловаться и так далее.

- Звонки были почти на всех испанских языках: на кастельяно, каталанском, галисийском, баскском (не было валенсийского). У каждого в отделе лингвистов были свои компании и языки, за которые он отвечал. У меня были две энергетические компании и звонки на испанском и галисийском (он очень похож на испанский, и слушать его было несложно).

- Если компания-клиент хотела добавить или убрать какие-то интенты, то нам нужно было сделать тематический корпус, поместить его в Nuance и переобучить модели. Сперва этот корпус был синтетический, а затем туда добавлялись реальные звонки.

- Также нужно было генерировать голос для ответов бота, и мы очень мучались, когда модель для синтеза голоса на испанском не могла произнести какой-нибудь звук из иностранного слова, как в названии Naturgy. В испанском нет фонемы /dʒ/, и Nuance читал это как “натурхи”.

- Всякое по мелочам, где требовалось “не бояться командной строки”.



group-telegram.com/about_nlp/131
Create:
Last Update:

Итак, на новой работе от меня не требовалось обучать модели машинного обучения с нуля, а требовалось только поддерживать правильную работу Nuance. Для этого нужно было делать следующее.

- Скачивать с сервера некоторое количество звонков и их логов каждый день (я не помню сколько, по 100 на каждом языке и для каждой компании, наверное). Логи были сохранены в огромные текстовые файлы, и из них нужно было делать таблицы csv. Это все делалось через баш-скрипты, потому что сервера были на Windows и питона там не было, и ставить его не разрешалось. Поэтому мне пришлось освоить основы bash.

- Звонки нужно было прослушать и сопоставить с логами. В логах был автоматически транскрибированный текст звонка и то, как звонок был маршрутизирован. Нужно было оценить, правильно ли распознан текст, если неправильно, то предположить почему (шумно, человек говорит что-то не по теме и так далее). И правильно ли звонок маршрутизирован, то есть получил ли звонящий то, что хотел. В каждой компании было по 15-20 интентов: оплатить фактуру, перерегистрировать услуги на другого человека, авария, пожаловаться и так далее.

- Звонки были почти на всех испанских языках: на кастельяно, каталанском, галисийском, баскском (не было валенсийского). У каждого в отделе лингвистов были свои компании и языки, за которые он отвечал. У меня были две энергетические компании и звонки на испанском и галисийском (он очень похож на испанский, и слушать его было несложно).

- Если компания-клиент хотела добавить или убрать какие-то интенты, то нам нужно было сделать тематический корпус, поместить его в Nuance и переобучить модели. Сперва этот корпус был синтетический, а затем туда добавлялись реальные звонки.

- Также нужно было генерировать голос для ответов бота, и мы очень мучались, когда модель для синтеза голоса на испанском не могла произнести какой-нибудь звук из иностранного слова, как в названии Naturgy. В испанском нет фонемы /dʒ/, и Nuance читал это как “натурхи”.

- Всякое по мелочам, где требовалось “не бояться командной строки”.

BY NLP Master


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/about_nlp/131

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On Feb. 27, however, he admitted from his Russian-language account that "Telegram channels are increasingly becoming a source of unverified information related to Ukrainian events." Some people used the platform to organize ahead of the storming of the U.S. Capitol in January 2021, and last month Senator Mark Warner sent a letter to Durov urging him to curb Russian information operations on Telegram. "The result is on this photo: fiery 'greetings' to the invaders," the Security Service of Ukraine wrote alongside a photo showing several military vehicles among plumes of black smoke. Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. To that end, when files are actively downloading, a new icon now appears in the Search bar that users can tap to view and manage downloads, pause and resume all downloads or just individual items, and select one to increase its priority or view it in a chat.
from in


Telegram NLP Master
FROM American