Telegram Group Search
Привет! Я редактор канала и ищу героев с кейсами по разработке и внедрению ИИ-решений и роботов в любой из этапов девелоперского процесса

Интересное, к примеру — ИИ для автоматизации проектирования, квартирографии, продаж, закупок, техподдержки, HR, разработки, обучения. Разработка платформ для генеративного проектирования на ИИ. Использование робототехнике на стройке, на готовых проектах для видеонаблюдения, разработка решений для умных домов и пр. и т.п.

Не стесняйтесь, пишите в бот @alliance_of_digital_leaders_bot или в комментариях. Жду ваших историй, пресс-релизов, научных статей и сообщений😊
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan 3D 2.1 прикрутили в Krea.ai

PBR-текстуры и все такое. Интересно, что у Креа уже есть свое 3Д. Но ещё интереснее, как они будут встраивать 3Д в общий пайплайн создания контента. Будут ли упираться в риг или текстурирование. Что будут делать с релайтом на совмещениях.

Креа, конечно, превращается в этакий закрытый хаггинг фейс - они интегрируют вовнутрь все, что шевелится по API.

@cgevent
#unrealneural #умныйассистент
Попросил своего "умного ассистента" делать подборку самых интересных публикаций на arxiv.org за сегодня 🧐
Делюсь результатами, пока глубоко их не изучал

Сегодня, 25 июня 2025 г., на arXiv (раздел Computer Science) появилось 775 новых работ. Ниже – субъективная подборка семи наиболее любопытных публикаций с указанием области исследования и прямых ссылок:

HI‑SQL – arXiv: 2506.18916 (LLM / Text‑to‑SQL)
https://arxiv.org/abs/2506.18916

MemeMind – arXiv: 2506.18919 (CV / Multimodal ML)
https://arxiv.org/abs/2506.18919

GenHSI – arXiv: 2506.19840 (Video Generation)
https://arxiv.org/abs/2506.19840

SimpleGVR – arXiv: 2506.19838 (Video Super‑Resolution)
https://arxiv.org/abs/2506.19838

ManiGaussian++ – arXiv: 2506.19842 (Robotics / Manipulation)
https://arxiv.org/abs/2506.19842

MAM – arXiv: 2506.19835 (Medical AI / Multi‑Agent LLM)
https://arxiv.org/abs/2506.19835

Temporal‑IRL – arXiv: 2506.19843 (Reinforcement Learning / Logistics)
https://arxiv.org/abs/2506.19843

Эти работы охватывают актуальные направления – от улучшения LLM‑интеракций с БД и мультимодальных датасетов до генерации видео, робототехники и прикладного RL.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini CLI

Легкий и мощный ИИ-агент с открытым исходным кодом, который позволяет использовать Gemini прямо в вашем терминале.

Бесплатно.

https://github.com/google-gemini/gemini-cli
Forwarded from Data Secrets
Google анонсировали AlphaGenome – модель для понимания генетики

Она может предсказывать, какое влияние окажут те или иные изменения в ДНК.

При достаточной точности такая модель может абсолютно перевернуть наше понимание болезней и биологии в целом, потому что геном человека, по сути, управляет в нашем организме всем. Небольшие вариации на молекулярном уровне в ДНК могут повлиять на что угодно: внешность, иммунитет, возникновение заболевания. Но как именно устроена эта связь – для людей, по большому счету, до сих пор загадка.

Основное, за счет чего работает AlphaGenome – это длинное контекстное окно в 1 миллион токенов. Без такого контекста модели бы просто не хватило информации для предсказания (и даже 1 миллиона иногда очень мало).

AG принимает на вход огромные последовательности пар оснований ДНК и предсказывает тысячи молекулярных свойств последовательности. Например, сколько вырабатывается РНК, как гены расположены в разных видах тканей, как они реплицируются и тд. Ну а сравнивая свойства одних последовательности с другими, можно оценить эффекты генетических мутаций.

Google утверждают, что по точности предсказаний они достигли SOTA. Обучали модель на открытых данных крупных лабораторий (в которых все это проверяли экспериментально). Под капотом – свертки, трансформер и декодер в нужные модальности.

Самое интересное, что Google уже открыли модель для использования через API – попробовать может каждый желающий. Так они хотят собрать больше фидбэка от ученых.

Блогпост | Статья (103 страницы на секундочку) | GitHub
#ЛабораторияИИ #AILAB
Это насыщенная неделя превратилась в целый марафон выступлений 🙃
Почему, на мой взгляд, важно рассказывать об экспериментах (даже сырых), делиться своими идеями и мыслями и общаться с коллегами по цеху (и, возможно, даже с прямыми конкурентами)? Мой пост сегодня будет об этом.

Наша отрасль пока не столь богата на успешны R&D истории, в том числе в больших компаниях, Однако многие, решая днём обычные рабочие задачи, вечерами дома экспериментируют и переосмысляют подходы к обычным задачам (сужу по себе 😃😃😃).

Желание попробовать новое иногда вызвано личными интересами и увлечениями, иногда более глобальными целями, но далеко не всегда в этом есть бизнес-мотивация.
Если же в одной компании появляется новое экспериментальное направление или отдел, то как иначе разжечь интерес у «гаражных стартапов», у коллег по цеху из других компаний, кроме как показывать им свои эксперименты и рассказывать, что это может иметь ценность? На этапе создания новой ценности для бизнеса эксперименты и открытость помогают общему росту.

Я работаю в ПИК давно, это большая компания — и я очень рад, что в одном из лидеров российского девелопмента возможна такая открытость. Когда такой крупный игрок идёт на эксперименты с новыми технологиями, делится своими исследованиями, это возбуждает интерес.

За последние дни я посетил много компаний-девелоперов (в некоторых случаях напросился сам 😄), участвовал в мероприятиях разного формата. То, что тему искусственного интеллекта активно обсуждают, показывает, как сильно меняется наша индустрия — все хотят пробовать новое, в том числе в девелоперских задачах. Если благодаря открытости у нас появится большое сообщество с профессионалами из крупных компаний отрасли, где тебя могут почелленджить или предложить новые идеи и инструменты, то это будет суперсильным бустом. Вероятность «попасть в цель» при новых разработках будет многократно возрастать, а не гаситься закрытостью исследований.

А ещё, возможно, открытость в отрасли, желание делиться экспериментами с нейросетями и ИИ могут привести к появлению новых идей и подходов в проектировании, в архитектуре, в создании новых стилей или типов жилья (эффективного, доступного, эстетичного). Жилья, которое позволит каждому создавать вокруг себя пространство, подходящее именно ему, без противоречий между целями и другими факторами.
#unrealneural
Это исследование рассматривает трудоемкую и подверженную ошибкам природу ручной проверки соответствия кода в информационном моделировании зданий (BIM) путем внедрения подхода, основанного на большой языковой модели (LLM), для полуавтоматизации этого критического процесса. Разработанная система интегрирует LLM, такие как GPT, Claude, Gemini и Llama, с программным обеспечением Revit для интерпретации строительных норм, генерации скриптов Python и выполнения полуавтоматических проверок соответствия в среде BIM.

https://arxiv.org/abs/2506.20551
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #пытаюсьпонять
Continuous Thought Machines (CTM) и «Foveated Active Vision» (фовеальная зрительная система)

1. CTM определяет, куда смотреть, и насколько "приближен" его эффективный объектив. Внутренняя и постоянная обратная связь позволяет достичь fascinating (захватывающего) поведения.

2. Эмерджентность и простота: Все это достигается без дополнительных вспомогательных потерь и без использования обучения с подкреплением (RL). Основной целью является просто контролируемая кросс-энтропийная потеря.

3. Фовеальное зрение широко распространено в природе. CTM получает небольшую «фовею» (фокус) и сжатый, низкоразрешенный вид «периферии». Это позволяет ему динамически выбирать между изучением деталей и пониманием контекста.

4. Преимущества для CNN: Сверточные нейронные сети (CNN) обычно представляют собой крупные модели, которым приходится обрабатывать множество разрешений, где объекты могут казаться близкими или далекими. Предоставление CTM возможности эффективно «выбирать собственное разрешение» может позволить использовать гораздо меньшие и более эффективные базовые сети.

Видео автор описывает так:
1. Исходное изображение находится в верхнем левом углу. На нем наложена полярная сетка, обозначающая фовеальную выборку.

2. В центре показано то, что видит CTM (то есть, данные, которые поступают в базовую сеть).

3. Справа представлена фовеальная перспектива, перепроецированная в евклидово пространство.

4. Средний ряд показывает фовеальную информацию, «ворота», прогнозы, а также внимание (как в модельном пространстве, так и перепроецированное в евклидово пространство).

5. Нижний ряд демонстрирует нейронную динамику случайно выбранных нейронов.

http://pub.sakana.ai/ctm
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #вкопилкуэрудита
Continuous Thought Machines

Видео-пояснение работы Continuous Thought Machines. Искусственный интеллект, архитектура которого вдохновлена биологическим мозгом

https://www.youtube.com/watch?v=dYHkj5UlJ_E&feature=youtu.be
Forwarded from Data Secrets
Google уверены, что с помощью ИИ вот-вот решат одну из главных математических загадок человечества

Оказывается, в DeepMind целая команда из 20 человек уже три года тайно работает над задачей Навье - Стокса. Это одна из семи математических задач, удостоенных звания проблемы тысячелетия. За ее решение положена премия в 1 миллион долларов (ну и вечная слава).

До сих пор инженеры работали полностью конфиденциально. Впервые публично об «операции» заговорил сегодня испанский математик Гомес Серрано, с которым Google собираются объединиться для того, чтобы дорешать задачу.

Корни задачи уходят корнями еще в 19 век. Тогда два математика – Анри Навье и Джордж Стокс – независимо друг от друга опубликовали дифференциальные уравнения, описывающие движение жидкостей и воды. И вот, спустя два века, до сих пор не существует общего аналитического решения этой системы.

Если бы оно нашлось, люди смогли бы предсказывать турбулентность и цунами, точнее прогнозировать погоду, лучше понимать кровообращение и даже улучшить современные двигатели. Решение станет настоящим прорывом в физике и математике.

Сейчас в мире за решение конкурируют три группы математиков. В составе одной из них как раз и был Гомес Серрано. Его группа отличалась тем, что они еще несколько лет назад пытались применять ИИ для решения задачи.

Теперь же Гомес объединяется с той самой секретной командой из DeepMind. Они надеятся, что вместе и с помощью ИИ (видимо, имеется в виду AlphaEvolve) они продвинутся в решении уже до конца этого года.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
QWEN-VLO - генерация картинок, видео, и редактирование всего, что шевелится.

Обновился Qwen3.


Чат у него весь из себя мультимодальный, принимает на вход документы, картинки, видео и даже звук.

А генерит вообще все, что шевелится. Включая видео, анализ изображений и даже брейншторм.

Го тестировать, пока быстро отвечает. Генерация видео довольно шустрая.

https://chat.qwen.ai/

Вот что пишут разрабы:

Сегодня мы рады представить новую модель - Qwen VLo, единую мультимодальную модель понимания и генерации. Эта обновленная модель не только "понимает" мир, но и генерирует высококачественные "воссоздания" на основе этого понимания, действительно преодолевая разрыв между восприятием и творчеством. Обратите внимание, что это предварительная версия, и вы можете получить доступ к ней через Qwen Chat. Вы можете напрямую отправить запрос типа "Создать изображение милой кошки", чтобы сгенерировать изображение, или загрузить изображение кошки и попросить "Добавить шапочку на голову кошки", чтобы изменить изображение.

Подробнее тут:
https://qwenlm.github.io/blog/qwen-vlo/ - поглядите примеры, они довольно убойные

@cgevent
2025/06/28 02:35:06
Back to Top
HTML Embed Code: