Telegram Group & Telegram Channel
This media is not supported in your browser
VIEW IN TELEGRAM
Уникальные наушники позволяют одновременно переводить речь нескольких людей, сохраняя их голосовые особенности и пространственные характеристики речи

Исследователи из Университета Вашингтона разработали систему на основе наушников, которая способна одновременно переводить речь нескольких говорящих, при этом сохраняя направление и особенности голосов. Эта система, получившая название Spatial Speech Translation, использует обычные шумоподавляющие наушники, оснащённые микрофонами, и алгоритмы, которые выделяют речь каждого человека в пространстве, следят за их перемещениями и переводят речь с задержкой в 2-4 секунды. При этом сохраняется естественное звучание голосов и их направление, что позволяет более точно передавать информацию в многолюдных и шумных условиях.

Первым шагом система определяет, сколько человек говорит в помещении или на улице, благодаря алгоритмам, работающим по принципу, аналогичному радару, постоянно сканирующим окружение и обновляющим данные о количестве говорящих. После этого она переводит речь, сохраняя ее выразительные характеристики и громкость, и воспроизводит её через наушники. В процессе перемещения говорящих или их голов, система продолжает отслеживать изменение направления и качества голосов, что позволяет сохранять естественное восприятие происходящего.

Тестирование системы проходило в различных условиях, как внутри помещений, так и на улице, с участием 29 человек, и результаты показали предпочтение пользователей к системе, которая отслеживает речь говорящих в пространстве. Пользователи отметили, что оптимальной является задержка в 3-4 секунды, так как меньшая — 1-2 секунды — приводила к ошибкам при переводе. На данный момент система работает с обычной речью на нескольких языках, включая испанский, немецкий и французский, а в будущем планируется расширить её до большего числа языков и улучшить скорость перевода. Эта разработка представляет собой шаг к преодолению языковых барьеров и позволяет, например, туристам или деловым людям в чужой стране получать точный перевод речи собеседников в реальном времени, даже в шумных условиях.

https://dl.acm.org/doi/10.1145/3706598.3713745
👍4🔥3🤗1



group-telegram.com/augmented_brain/9927
Create:
Last Update:

Уникальные наушники позволяют одновременно переводить речь нескольких людей, сохраняя их голосовые особенности и пространственные характеристики речи

Исследователи из Университета Вашингтона разработали систему на основе наушников, которая способна одновременно переводить речь нескольких говорящих, при этом сохраняя направление и особенности голосов. Эта система, получившая название Spatial Speech Translation, использует обычные шумоподавляющие наушники, оснащённые микрофонами, и алгоритмы, которые выделяют речь каждого человека в пространстве, следят за их перемещениями и переводят речь с задержкой в 2-4 секунды. При этом сохраняется естественное звучание голосов и их направление, что позволяет более точно передавать информацию в многолюдных и шумных условиях.

Первым шагом система определяет, сколько человек говорит в помещении или на улице, благодаря алгоритмам, работающим по принципу, аналогичному радару, постоянно сканирующим окружение и обновляющим данные о количестве говорящих. После этого она переводит речь, сохраняя ее выразительные характеристики и громкость, и воспроизводит её через наушники. В процессе перемещения говорящих или их голов, система продолжает отслеживать изменение направления и качества голосов, что позволяет сохранять естественное восприятие происходящего.

Тестирование системы проходило в различных условиях, как внутри помещений, так и на улице, с участием 29 человек, и результаты показали предпочтение пользователей к системе, которая отслеживает речь говорящих в пространстве. Пользователи отметили, что оптимальной является задержка в 3-4 секунды, так как меньшая — 1-2 секунды — приводила к ошибкам при переводе. На данный момент система работает с обычной речью на нескольких языках, включая испанский, немецкий и французский, а в будущем планируется расширить её до большего числа языков и улучшить скорость перевода. Эта разработка представляет собой шаг к преодолению языковых барьеров и позволяет, например, туристам или деловым людям в чужой стране получать точный перевод речи собеседников в реальном времени, даже в шумных условиях.

https://dl.acm.org/doi/10.1145/3706598.3713745

BY Расширение функций мозга


Share with your friend now:
group-telegram.com/augmented_brain/9927

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons. Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. At the start of 2018, the company attempted to launch an Initial Coin Offering (ICO) which would enable it to enable payments (and earn the cash that comes from doing so). The initial signals were promising, especially given Telegram’s user base is already fairly crypto-savvy. It raised an initial tranche of cash – worth more than a billion dollars – to help develop the coin before opening sales to the public. Unfortunately, third-party sales of coins bought in those initial fundraising rounds raised the ire of the SEC, which brought the hammer down on the whole operation. In 2020, officials ordered Telegram to pay a fine of $18.5 million and hand back much of the cash that it had raised. Meanwhile, a completely redesigned attachment menu appears when sending multiple photos or vides. Users can tap "X selected" (X being the number of items) at the top of the panel to preview how the album will look in the chat when it's sent, as well as rearrange or remove selected media. Lastly, the web previews of t.me links have been given a new look, adding chat backgrounds and design elements from the fully-features Telegram Web client.
from us


Telegram Расширение функций мозга
FROM American