Telegram Group Search
Media is too big
VIEW IN TELEGRAM
Embodied Avatar — пора вспомнить Живую Сталь

Unitree показали собственную систему телеуправления роботами. В отличие от большинства подобных систем она позволяет управлять всем телом, а не только верхней частью робота. Выглядит она как довольно лёгкий экзоскелет, который цепляется поверх одежды.

Кроме аппаратного захвата движений, компания экспериментируют с повторением движений прямо с видео, в реальном времени с минимальной задержкой. При обучении моделей из видео можно получать огромное количество данных для обучения базовой модели, которую потом будут тюнить на данных с полноценных систем телеуправления.

@ai_newz
1🔥152😍26🤯11👍87😱5❤‍🔥1
Kimi K2 Thinking

Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.

Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.

Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.

Блогпост
Веса

@ai_newz
97👍40🔥23❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Прямое включение из Сан Франциско.

Погода солнечная, AI тусовка очень плотная. Раньше я сюда приезжал пообщаться с директорами и VP в Мете, а теперь как фаундер. Ещё раз убеждаюсь (сейчас уже точно), что каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал, иначе вы много чего упускаете!

П.с. если вы в AI/стартап тусовке - пишите, пересечемся на кофе.

#personal @ai_newz
20131👍56🦄28😁17🔥5🤯3💯32🤩2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Google Opal — убийца n8n? (еще нет)

Google тихо выкатил Opal — свой клон n8n с визуальным редактором и нодами для автоматизации. Многие уже успели заклеймить его убийцей n8n и AgentKit, но пока это скорее очередной эксперимент. Често говоря, я изначально думал что n8n придется несладко, т.к. очевидно было, что все LLM лабы в какой-то момент сделают свою обвязку для пайаплайна агентов, это было делом времени.

UI в Opal приятный, можно изменять воркфлоу промптом (даже голосом), и всё это бесплатно. Правда, там только сервисы Google: Gemini, Imagen 4, Veo (бесплатно!), Lyria 2 и т.д. Подключить что-то стороннее нельзя.

Но на практике всё сыро. Я попробовал собрать на нём контент-завод для "рекламы", но Opal забыл объединить сгенерированные видео. Попытка решить проблему через Python-скрипт провалилась — ffmpeg туда не завезли, хотя функция execute code предусмотрена.

Самый полезный юзкейс сейчас — собирать сложные цепочки из нескольких LLM. Например, одна модель пишет план отчёта, три другие параллельно генерируют части, а в конце всё собирается вместе (если вам не хватает длины ответа обычной Gemini). Или можно выстроить пайплайн: сценарий → раскадровка → картинки → видео, правда, помним про лимиты.

Итог: Opal пока может делать не больше, чем Canvas в Gemini App. Это не убийца n8n, а скорее эксперимент (так он и называется) и хороший способ вкатиться в "нодовую культуру" благодаря простому интерфейсу и ограниченному функционалу — n8n поначалу может пугать. Побаловаться вечерок можно, но для серьёзных задач инструмент пока не готов.

Кстати, Google завезли ещё кучу подобных мини-аппов, которым не суждено стать полноценными продуктами. Pomelli, кстати, как раз один из них. Ставьте единорога 🦄, если интересен обзор и на другие.

Попробовать

@ai_newz
🦄363👍3628🔥61🙏1
Разработчики все чаще используют ИИ-агентов — SourceCraft от Yandex B2B Tech за квартал вырос по активности на 50%. Почему это важно? Агенты могут сами собирать проект: от создания репозитория, до написания кода, тестов и деплоя. 60% используют их для рутины и рефакторинга, а 15% для проектирования архитектуры. По этому поводу SourceCraft увеличил лимиты в 2.5 раза — теперь можно делать до 1000 операций с агентом в неделю. И использовать его в вебе или как плагин.

По данным Google Cloud/DORA — 80% отмечают рост продуктивности, 59% видят плюс в качестве кода.

От себя могу добавить, что на деле до замены агентами джунов еще далековато, и все еще стоит очень внимательно проверять ai-generated код, и стараться не писать вермешели на тысячи строк. Лично я использую ИИ как умный автокомплит для небольших блоков кода или тестов, ну либо для одноразового boilerplate код, который не планирую поддерживать. А вы как используете ИИ в разработке? Доверяете агентам писать продакшен-код?

@ai_newz
😁109👍43🫡14🦄1110🔥5💯5💔3
Генеративные инструменты всё больше ориентируются на профессионалов.

Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI. Они позволяют комбинировать несколько моделей в кастомный пайплайн и делать куда более сложные генерации. По фичам это конечно же отстаёт от Comfy, но сильно лучше по юзабельности — не нужно качать веса, играться с API ключами и т.д.

Больше всего появление таких тулов показывает наличие спроса — студии и фрилансеры готовы платить за дополнительный контроль, который даёт возможность создавать более предсказуемые и качественные результаты для коммерческих проектов, экономя время на итерациях и правках. Если хотите попробовать новые инструменты, то Runway Workflows уже доступен всем подписчикам, а вот Krea Nodes пока ещё в раннем доступе.

@ai_newz
4👍7539🔥24❤‍🔥3
Нейродайджест за неделю (#93)

LLM
- Kimi K2 Thinking — Новая модель от Moonshot, крайне сильные бенчи, может выполнять сотни последовательных тул-колов.

Генеративные модели

- Нодовые редакторы — Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI, для большего контроля над генерацией. Закос на про-тулы.

Прочее
- Google Opal — Google раскатали клон n8n с визуальным редактором на кучу стран. Пока сырой и ограничен экосистемой, но хороший способ вкатиться в "нодовую культуру" или сплести бесконечную паутину из нод gemini.
- Embodied Avatar — Unitree показали систему телеуправления роботами. Позволяет управлять всем телом робота через лёгкий экзоскелет или даже повторять движения с видео в реальном времени.

Личное
- Прямое включение из Сан-Франциско — AI-тусовка очень плотная, каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал.

> Читать дайджест #92

#дайджест
@ai_newz
126👍133🔥1🦄1
В X тизерят nano-banana2. По слухам модель будет генерить в разрешении до 4к и будет использовать Gemini 3.0 как текстовый энкодер. Возможно выйдет сегодня (11 ноября).

@ai_newz
🤯340🔥130👍21❤‍🔥1414😁3
Обновление Flow

Пока все следят за хайпом вокруг Sora, Google продолжает тихо, но методично прокачивать Veo. В Flow появился полноценный контроль над камерой, причём уже в готовых генерациях.

Другие модели тоже воспринимают инструкции по движению камеры, но обычно это делается до генерации. Google же добавили возможность делать это после: сначала генерируешь ролик, а потом можешь изменить положение камеры, траекторию её движения или добавить детали через Insert (первые два работают лучше на кадрах со статичной камерой, что логично). Insert, кстати, это буквально видео-инпейнт — выделяешь зону и пишешь, что изменить. И это ещё один камень в огород Runway Aleph, который теперь выигрывает только тем, что в него можно загружать реальное видео.

Insert — очевидно, золотой инструмент для доработки шотов и чистки артефактов. А вот зачем нужны остальные две функции, пока не очень понятно, ведь у Veo с контролем камеры и так всё хорошо, ему не нужен этот костыль, как у старых версий Kling. Пайплайн "генерация статики → добавление движения" звучит странно, разве что для мультикамерного монтажа. Возможно, дельцы в комментариях подскажут зачем это в нейропродакшене. А вот как способ получать дополнительные ракурсы на реальном уже отснятом материале звучит очень интересно. Про бесплатный VFX с Insert, я вообще молчу.

Sora, конечно, подкупает своими мультишот-видео по 25 секунд, но Veo делает ставку на контроль и предсказуемость, а для этого мультишот не нужен.

К слову, Krea и Runway недавно запустили свои ноды, но ведь, по сути, Opal уже имеет такой же функционал. Да, скриптов не хватает, но какие-то простейшие автоматизации по работе с Nano Banana × Veo уже можно строить.

Единственное что смущает, это то что рано или поздно все продукты Гугла оказываются на свалке. Вот не умеют они строить хорошие новые продукты для энд-юзера.

Пока доступно только подписчикам Ultra, но зато безлимитно.

Flow

@ai_newz
86🔥47👍17❤‍🔥103🦄2🫡1
GPT 5.1 — вайбы получше 🎧

С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.

Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.

Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.

Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
108👍47😁24🔥15🦄5
Media is too big
VIEW IN TELEGRAM
Google DeepMind выкатили SIMA 2 — апгрейднутую версию AI агента для игр. В отличие от первой версии, которая могла выполнять лишь базовые действия, SIMA 2 может рассуждать о высокоуровневых целях и достигать их, болтать с игроком и даже играть в игры, которые никогда не видел — типа ASKA или MineDojo. Ну и конечно может ориентироваться в энвайроментах, которые создаёт Genie 3. Это стало возможно во многом из-за интеграции Gemini с более лайтовой агентной моделью, которая и занимается непосредственным управлением (Система 1 и Система 2 в действии).

Главная новая возможность — самообучение: SIMA 2 сама набивает опыт, оценивает его через Gemini и улучшается без помощи человека. По бенчмаркам уже довольно близко подобралась к человеческой производительности. Конечно, есть косяки — с длинными многоходовками пока туго, длины контекста не хватает, да и с точным управлением мышкой проблемы. В любом случае это серьезный шаг к универсальным ИИ-агентам, которых можно будет засунуть куда угодно. Техрепорта пока нет, но обещают

@ai_newz
🔥114👍28❤‍🔥1614🦄2
Нейродайджест за неделю (#94)

LLM
- GPT 5.1 — Большой упор на пользователей, которым не понравилась личность GPT-5. Модель стала дружелюбнее, лучше следует инструкциям, а Thinking-версия теперь эффективнее распределяет ресурсы.

Генеративные модели
- Обновление Flow — Google продолжает прокачивать Veo. Появился контроль над камерой и видео-инпейнт (Insert) в уже готовых генерациях.
- Тизер nano-banana2 — В X тизерят новую версию. По слухам, будет генерить в 4к и использовать Gemini 3.0 как текстовый энкодер.

Прочее
- SIMA 2 — Апгрейд AI-агента для игр от Google DeepMind. Может рассуждать о целях, играть в незнакомые игры и самообучаться. Серьёзный шаг к универсальным ИИ-агентам.

> Читать дайджест #93

#дайджест
@ai_newz
👍1794💔2🫡1
2025/11/17 03:21:45
Back to Top
HTML Embed Code: