Telegram Group & Telegram Channel
Итак, на новой работе от меня не требовалось обучать модели машинного обучения с нуля, а требовалось только поддерживать правильную работу Nuance. Для этого нужно было делать следующее.

- Скачивать с сервера некоторое количество звонков и их логов каждый день (я не помню сколько, по 100 на каждом языке и для каждой компании, наверное). Логи были сохранены в огромные текстовые файлы, и из них нужно было делать таблицы csv. Это все делалось через баш-скрипты, потому что сервера были на Windows и питона там не было, и ставить его не разрешалось. Поэтому мне пришлось освоить основы bash.

- Звонки нужно было прослушать и сопоставить с логами. В логах был автоматически транскрибированный текст звонка и то, как звонок был маршрутизирован. Нужно было оценить, правильно ли распознан текст, если неправильно, то предположить почему (шумно, человек говорит что-то не по теме и так далее). И правильно ли звонок маршрутизирован, то есть получил ли звонящий то, что хотел. В каждой компании было по 15-20 интентов: оплатить фактуру, перерегистрировать услуги на другого человека, авария, пожаловаться и так далее.

- Звонки были почти на всех испанских языках: на кастельяно, каталанском, галисийском, баскском (не было валенсийского). У каждого в отделе лингвистов были свои компании и языки, за которые он отвечал. У меня были две энергетические компании и звонки на испанском и галисийском (он очень похож на испанский, и слушать его было несложно).

- Если компания-клиент хотела добавить или убрать какие-то интенты, то нам нужно было сделать тематический корпус, поместить его в Nuance и переобучить модели. Сперва этот корпус был синтетический, а затем туда добавлялись реальные звонки.

- Также нужно было генерировать голос для ответов бота, и мы очень мучались, когда модель для синтеза голоса на испанском не могла произнести какой-нибудь звук из иностранного слова, как в названии Naturgy. В испанском нет фонемы /dʒ/, и Nuance читал это как “натурхи”.

- Всякое по мелочам, где требовалось “не бояться командной строки”.



group-telegram.com/about_nlp/131
Create:
Last Update:

Итак, на новой работе от меня не требовалось обучать модели машинного обучения с нуля, а требовалось только поддерживать правильную работу Nuance. Для этого нужно было делать следующее.

- Скачивать с сервера некоторое количество звонков и их логов каждый день (я не помню сколько, по 100 на каждом языке и для каждой компании, наверное). Логи были сохранены в огромные текстовые файлы, и из них нужно было делать таблицы csv. Это все делалось через баш-скрипты, потому что сервера были на Windows и питона там не было, и ставить его не разрешалось. Поэтому мне пришлось освоить основы bash.

- Звонки нужно было прослушать и сопоставить с логами. В логах был автоматически транскрибированный текст звонка и то, как звонок был маршрутизирован. Нужно было оценить, правильно ли распознан текст, если неправильно, то предположить почему (шумно, человек говорит что-то не по теме и так далее). И правильно ли звонок маршрутизирован, то есть получил ли звонящий то, что хотел. В каждой компании было по 15-20 интентов: оплатить фактуру, перерегистрировать услуги на другого человека, авария, пожаловаться и так далее.

- Звонки были почти на всех испанских языках: на кастельяно, каталанском, галисийском, баскском (не было валенсийского). У каждого в отделе лингвистов были свои компании и языки, за которые он отвечал. У меня были две энергетические компании и звонки на испанском и галисийском (он очень похож на испанский, и слушать его было несложно).

- Если компания-клиент хотела добавить или убрать какие-то интенты, то нам нужно было сделать тематический корпус, поместить его в Nuance и переобучить модели. Сперва этот корпус был синтетический, а затем туда добавлялись реальные звонки.

- Также нужно было генерировать голос для ответов бота, и мы очень мучались, когда модель для синтеза голоса на испанском не могла произнести какой-нибудь звук из иностранного слова, как в названии Naturgy. В испанском нет фонемы /dʒ/, и Nuance читал это как “натурхи”.

- Всякое по мелочам, где требовалось “не бояться командной строки”.

BY NLP Master


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/about_nlp/131

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Groups are also not fully encrypted, end-to-end. This includes private groups. Private groups cannot be seen by other Telegram users, but Telegram itself can see the groups and all of the communications that you have in them. All of the same risks and warnings about channels can be applied to groups. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. Messages are not fully encrypted by default. That means the company could, in theory, access the content of the messages, or be forced to hand over the data at the request of a government. "There is a significant risk of insider threat or hacking of Telegram systems that could expose all of these chats to the Russian government," said Eva Galperin with the Electronic Frontier Foundation, which has called for Telegram to improve its privacy practices. And while money initially moved into stocks in the morning, capital moved out of safe-haven assets. The price of the 10-year Treasury note fell Friday, sending its yield up to 2% from a March closing low of 1.73%.
from us


Telegram NLP Master
FROM American