ai_newz Telegram Group

Embodied Avatar — пора вспомнить Живую Сталь

Unitree показали собственную систему телеуправления роботами. В отличие от большинства подобных систем она позволяет управлять всем телом, а не только верхней частью робота. Выглядит она как довольно лёгкий экзоскелет, который цепляется поверх одежды.

Кроме аппаратного захвата движений, компания экспериментируют с повторением движений прямо с видео, в реальном времени с минимальной задержкой. При обучении моделей из видео можно получать огромное количество данных для обучения базовой модели, которую потом будут тюнить на данных с полноценных систем телеуправления.

@ai_newz

1🔥152😍26🤯11👍8❤7😱5❤‍🔥1

31.7K viewsedited 11:06

эйай ньюз

Kimi K2 Thinking

Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.

Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.

Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.

Блогпост
Веса

@ai_newz

❤97👍40🔥23❤‍🔥1

26.8K views16:13

эйай ньюз

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Прямое включение из Сан Франциско.

Погода солнечная, AI тусовка очень плотная. Раньше я сюда приезжал пообщаться с директорами и VP в Мете, а теперь как фаундер. Ещё раз убеждаюсь (сейчас уже точно), что каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал, иначе вы много чего упускаете!

П.с. если вы в AI/стартап тусовке - пишите, пересечемся на кофе.

#personal @ai_newz

20❤131👍56🦄28😁17🔥5🤯3💯3⚡2🤩2😱1

24.1K viewsedited 22:15

эйай ньюз

2:04

This media is not supported in your browser

VIEW IN TELEGRAM

Google Opal — убийца n8n? (еще нет)

Google тихо выкатил Opal — свой клон n8n с визуальным редактором и нодами для автоматизации. Многие уже успели заклеймить его убийцей n8n и AgentKit, но пока это скорее очередной эксперимент. Често говоря, я изначально думал что n8n придется несладко, т.к. очевидно было, что все LLM лабы в какой-то момент сделают свою обвязку для пайаплайна агентов, это было делом времени.

UI в Opal приятный, можно изменять воркфлоу промптом (даже голосом), и всё это бесплатно. Правда, там только сервисы Google: Gemini, Imagen 4, Veo (бесплатно!), Lyria 2 и т.д. Подключить что-то стороннее нельзя.

Но на практике всё сыро. Я попробовал собрать на нём контент-завод для "рекламы", но Opal забыл объединить сгенерированные видео. Попытка решить проблему через Python-скрипт провалилась — ffmpeg туда не завезли, хотя функция execute code предусмотрена.

Самый полезный юзкейс сейчас — собирать сложные цепочки из нескольких LLM. Например, одна модель пишет план отчёта, три другие параллельно генерируют части, а в конце всё собирается вместе (если вам не хватает длины ответа обычной Gemini). Или можно выстроить пайплайн: сценарий → раскадровка → картинки → видео, правда, помним про лимиты.

Итог: Opal пока может делать не больше, чем Canvas в Gemini App. Это не убийца n8n, а скорее эксперимент (так он и называется) и хороший способ вкатиться в "нодовую культуру" благодаря простому интерфейсу и ограниченному функционалу — n8n поначалу может пугать. Побаловаться вечерок можно, но для серьёзных задач инструмент пока не готов.

Кстати, Google завезли ещё кучу подобных мини-аппов, которым не суждено стать полноценными продуктами. Pomelli, кстати, как раз один из них. Ставьте единорога 🦄, если интересен обзор и на другие.

Попробовать

@ai_newz

🦄363👍36❤28🔥6⚡1🙏1

23.7K viewsedited 11:04

эйай ньюз

Разработчики все чаще используют ИИ-агентов — SourceCraft от Yandex B2B Tech за квартал вырос по активности на 50%. Почему это важно? Агенты могут сами собирать проект: от создания репозитория, до написания кода, тестов и деплоя. 60% используют их для рутины и рефакторинга, а 15% для проектирования архитектуры. По этому поводу SourceCraft увеличил лимиты в 2.5 раза — теперь можно делать до 1000 операций с агентом в неделю. И использовать его в вебе или как плагин.

По данным Google Cloud/DORA — 80% отмечают рост продуктивности, 59% видят плюс в качестве кода.

От себя могу добавить, что на деле до замены агентами джунов еще далековато, и все еще стоит очень внимательно проверять ai-generated код, и стараться не писать вермешели на тысячи строк. Лично я использую ИИ как умный автокомплит для небольших блоков кода или тестов, ну либо для одноразового boilerplate код, который не планирую поддерживать. А вы как используете ИИ в разработке? Доверяете агентам писать продакшен-код?

@ai_newz

😁109👍43🫡14🦄11❤10🔥5💯5💔3

21.9K views15:47

эйай ньюз

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

Генеративные инструменты всё больше ориентируются на профессионалов.

Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI. Они позволяют комбинировать несколько моделей в кастомный пайплайн и делать куда более сложные генерации. По фичам это конечно же отстаёт от Comfy, но сильно лучше по юзабельности — не нужно качать веса, играться с API ключами и т.д.

Больше всего появление таких тулов показывает наличие спроса — студии и фрилансеры готовы платить за дополнительный контроль, который даёт возможность создавать более предсказуемые и качественные результаты для коммерческих проектов, экономя время на итерациях и правках. Если хотите попробовать новые инструменты, то Runway Workflows уже доступен всем подписчикам, а вот Krea Nodes пока ещё в раннем доступе.

@ai_newz

4👍75❤39🔥24❤‍🔥3

31.8K views18:00

эйай ньюз

Нейродайджест за неделю (#93)

LLM
- Kimi K2 Thinking — Новая модель от Moonshot, крайне сильные бенчи, может выполнять сотни последовательных тул-колов.

Генеративные модели
- Нодовые редакторы — Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI, для большего контроля над генерацией. Закос на про-тулы.

Прочее
- Google Opal — Google раскатали клон n8n с визуальным редактором на кучу стран. Пока сырой и ограничен экосистемой, но хороший способ вкатиться в "нодовую культуру" или сплести бесконечную паутину из нод gemini.
- Embodied Avatar — Unitree показали систему телеуправления роботами. Позволяет управлять всем телом робота через лёгкий экзоскелет или даже повторять движения с видео в реальном времени.

Личное
- Прямое включение из Сан-Франциско — AI-тусовка очень плотная, каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал.

> Читать дайджест #92

#дайджест
@ai_newz

эйай ньюз

Kimi K2 Thinking

Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с…

1❤26👍13⚡3🔥1🦄1

22.1K views19:23

эйай ньюз

В X тизерят nano-banana2. По слухам модель будет генерить в разрешении до 4к и будет использовать Gemini 3.0 как текстовый энкодер. Возможно выйдет сегодня (11 ноября).

@ai_newz

🤯340🔥130👍21❤‍🔥14❤14😁3

27K views07:17

эйай ньюз

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

Обновление Flow

Пока все следят за хайпом вокруг Sora, Google продолжает тихо, но методично прокачивать Veo. В Flow появился полноценный контроль над камерой, причём уже в готовых генерациях.

Другие модели тоже воспринимают инструкции по движению камеры, но обычно это делается до генерации. Google же добавили возможность делать это после: сначала генерируешь ролик, а потом можешь изменить положение камеры, траекторию её движения или добавить детали через Insert (первые два работают лучше на кадрах со статичной камерой, что логично). Insert, кстати, это буквально видео-инпейнт — выделяешь зону и пишешь, что изменить. И это ещё один камень в огород Runway Aleph, который теперь выигрывает только тем, что в него можно загружать реальное видео.

Insert — очевидно, золотой инструмент для доработки шотов и чистки артефактов. А вот зачем нужны остальные две функции, пока не очень понятно, ведь у Veo с контролем камеры и так всё хорошо, ему не нужен этот костыль, как у старых версий Kling. Пайплайн "генерация статики → добавление движения" звучит странно, разве что для мультикамерного монтажа. Возможно, дельцы в комментариях подскажут зачем это в нейропродакшене. А вот как способ получать дополнительные ракурсы на реальном уже отснятом материале звучит очень интересно. Про бесплатный VFX с Insert, я вообще молчу.

Sora, конечно, подкупает своими мультишот-видео по 25 секунд, но Veo делает ставку на контроль и предсказуемость, а для этого мультишот не нужен.

К слову, Krea и Runway недавно запустили свои ноды, но ведь, по сути, Opal уже имеет такой же функционал. Да, скриптов не хватает, но какие-то простейшие автоматизации по работе с Nano Banana × Veo уже можно строить.

Единственное что смущает, это то что рано или поздно все продукты Гугла оказываются на свалке. Вот не умеют они строить хорошие новые продукты для энд-юзера.

Пока доступно только подписчикам Ultra, но зато безлимитно.

Flow

@ai_newz

❤86🔥47👍17❤‍🔥10⚡3🦄2🫡1

21.8K views11:31

эйай ньюз

GPT 5.1 — вайбы получше 🎧

С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.

Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.

Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.

Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

❤108👍47😁24🔥15🦄5

22.9K viewsedited 19:42

Google DeepMind выкатили SIMA 2 — апгрейднутую версию AI агента для игр. В отличие от первой версии, которая могла выполнять лишь базовые действия, SIMA 2 может рассуждать о высокоуровневых целях и достигать их, болтать с игроком и даже играть в игры, которые никогда не видел — типа ASKA или MineDojo. Ну и конечно может ориентироваться в энвайроментах, которые создаёт Genie 3. Это стало возможно во многом из-за интеграции Gemini с более лайтовой агентной моделью, которая и занимается непосредственным управлением (Система 1 и Система 2 в действии).

Главная новая возможность — самообучение: SIMA 2 сама набивает опыт, оценивает его через Gemini и улучшается без помощи человека. По бенчмаркам уже довольно близко подобралась к человеческой производительности. Конечно, есть косяки — с длинными многоходовками пока туго, длины контекста не хватает, да и с точным управлением мышкой проблемы. В любом случае это серьезный шаг к универсальным ИИ-агентам, которых можно будет засунуть куда угодно. Техрепорта пока нет, но обещают

@ai_newz

🔥114👍28❤‍🔥16❤14🦄2

68K viewsedited 15:27

эйай ньюз

Нейродайджест за неделю (#94)

LLM
- GPT 5.1 — Большой упор на пользователей, которым не понравилась личность GPT-5. Модель стала дружелюбнее, лучше следует инструкциям, а Thinking-версия теперь эффективнее распределяет ресурсы.

Генеративные модели
- Обновление Flow — Google продолжает прокачивать Veo. Появился контроль над камерой и видео-инпейнт (Insert) в уже готовых генерациях.
- Тизер nano-banana2 — В X тизерят новую версию. По слухам, будет генерить в 4к и использовать Gemini 3.0 как текстовый энкодер.

Прочее
- SIMA 2 — Апгрейд AI-агента для игр от Google DeepMind. Может рассуждать о целях, играть в незнакомые игры и самообучаться. Серьёзный шаг к универсальным ИИ-агентам.

> Читать дайджест #93

#дайджест
@ai_newz

👍17❤9⚡4💔2🫡1

9.02K views19:05

2025/11/17 03:21:45
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>