Telegram Group & Telegram Channel
Институт AIRI
AIRI Seminars в эфире, ссылки на трансляции: VK Видео, YouTube 🍿
На семинаре AIRI рассказали про работу трансформеров в рамках доклада «Современные трансформеры для видео и не только».

На презентации (см. фото) сравнили три подхода: RNN, Attention, SSM.

Особое внимание привлекают SSM — модели, которые могут стать альтернативой классическим трансформерам.

SSM (State Space Models) и новая модель Mamba предлагают линейную сложность и локальную рекурсию, что делает их особенно эффективными для длинных последовательностей. Это открывает путь к более быстрому и экономичному инференсу, что особенно важно для работы с видео, аудио и другими типами данных, требующих мгновенного анализа в режиме реального времени.

👉 Важно: исследование Гарварда указывает, что трансформеры по-прежнему лучше показывают себя в задачах с долгосрочной памятью (например, копирование и повтор). Так что SSM пока — не полноценная замена, а скорее мощное дополнение.

Репозиторий:
Mamba на GitHub — с туториалами, Colab-ноутбуками и готовыми весами.

Что почитать:
https://huggingface.co/blog/lbourdois/get-on-the-ssm-train
https://arxiv.org/abs/2312.00752

#ssm #инференс #трансформеры

🚀 ©ТехноТренды



group-telegram.com/technologies_trends/257
Create:
Last Update:

На семинаре AIRI рассказали про работу трансформеров в рамках доклада «Современные трансформеры для видео и не только».

На презентации (см. фото) сравнили три подхода: RNN, Attention, SSM.

Особое внимание привлекают SSM — модели, которые могут стать альтернативой классическим трансформерам.

SSM (State Space Models) и новая модель Mamba предлагают линейную сложность и локальную рекурсию, что делает их особенно эффективными для длинных последовательностей. Это открывает путь к более быстрому и экономичному инференсу, что особенно важно для работы с видео, аудио и другими типами данных, требующих мгновенного анализа в режиме реального времени.

👉 Важно: исследование Гарварда указывает, что трансформеры по-прежнему лучше показывают себя в задачах с долгосрочной памятью (например, копирование и повтор). Так что SSM пока — не полноценная замена, а скорее мощное дополнение.

Репозиторий:
Mamba на GitHub — с туториалами, Colab-ноутбуками и готовыми весами.

Что почитать:
https://huggingface.co/blog/lbourdois/get-on-the-ssm-train
https://arxiv.org/abs/2312.00752

#ssm #инференс #трансформеры

🚀 ©ТехноТренды

BY 📈 ТехноТренды: Технологии, Тренды, IT





Share with your friend now:
group-telegram.com/technologies_trends/257

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

As a result, the pandemic saw many newcomers to Telegram, including prominent anti-vaccine activists who used the app's hands-off approach to share false information on shots, a study from the Institute for Strategic Dialogue shows. "There are several million Russians who can lift their head up from propaganda and try to look for other sources, and I'd say that most look for it on Telegram," he said. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. NEWS The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides.
from us


Telegram 📈 ТехноТренды: Технологии, Тренды, IT
FROM American