Telegram Group Search
#ЛабораторияИИ #AILAB
Прошла встреча-знакомство с командой Института AIRI ⚡️⚡️⚡️ Обсудили подходы наших команд и как именно с пользой взаимодействовать и решать актуальные задачи проектирования. Наметили следующие шаги сотрудничества
Спасибо всем за встречу 🙃🙃🙃
Привет! Я редактор канала и ищу героев с кейсами по разработке и внедрению ИИ-решений и роботов в любой из этапов девелоперского процесса

Интересное, к примеру — ИИ для автоматизации проектирования, квартирографии, продаж, закупок, техподдержки, HR, разработки, обучения. Разработка платформ для генеративного проектирования на ИИ. Использование робототехнике на стройке, на готовых проектах для видеонаблюдения, разработка решений для умных домов и пр. и т.п.

Не стесняйтесь, пишите в бот @alliance_of_digital_leaders_bot или в комментариях. Жду ваших историй, пресс-релизов, научных статей и сообщений😊
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan 3D 2.1 прикрутили в Krea.ai

PBR-текстуры и все такое. Интересно, что у Креа уже есть свое 3Д. Но ещё интереснее, как они будут встраивать 3Д в общий пайплайн создания контента. Будут ли упираться в риг или текстурирование. Что будут делать с релайтом на совмещениях.

Креа, конечно, превращается в этакий закрытый хаггинг фейс - они интегрируют вовнутрь все, что шевелится по API.

@cgevent
#unrealneural #умныйассистент
Попросил своего "умного ассистента" делать подборку самых интересных публикаций на arxiv.org за сегодня 🧐
Делюсь результатами, пока глубоко их не изучал

Сегодня, 25 июня 2025 г., на arXiv (раздел Computer Science) появилось 775 новых работ. Ниже – субъективная подборка семи наиболее любопытных публикаций с указанием области исследования и прямых ссылок:

HI‑SQL – arXiv: 2506.18916 (LLM / Text‑to‑SQL)
https://arxiv.org/abs/2506.18916

MemeMind – arXiv: 2506.18919 (CV / Multimodal ML)
https://arxiv.org/abs/2506.18919

GenHSI – arXiv: 2506.19840 (Video Generation)
https://arxiv.org/abs/2506.19840

SimpleGVR – arXiv: 2506.19838 (Video Super‑Resolution)
https://arxiv.org/abs/2506.19838

ManiGaussian++ – arXiv: 2506.19842 (Robotics / Manipulation)
https://arxiv.org/abs/2506.19842

MAM – arXiv: 2506.19835 (Medical AI / Multi‑Agent LLM)
https://arxiv.org/abs/2506.19835

Temporal‑IRL – arXiv: 2506.19843 (Reinforcement Learning / Logistics)
https://arxiv.org/abs/2506.19843

Эти работы охватывают актуальные направления – от улучшения LLM‑интеракций с БД и мультимодальных датасетов до генерации видео, робототехники и прикладного RL.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini CLI

Легкий и мощный ИИ-агент с открытым исходным кодом, который позволяет использовать Gemini прямо в вашем терминале.

Бесплатно.

https://github.com/google-gemini/gemini-cli
Forwarded from Data Secrets
Google анонсировали AlphaGenome – модель для понимания генетики

Она может предсказывать, какое влияние окажут те или иные изменения в ДНК.

При достаточной точности такая модель может абсолютно перевернуть наше понимание болезней и биологии в целом, потому что геном человека, по сути, управляет в нашем организме всем. Небольшие вариации на молекулярном уровне в ДНК могут повлиять на что угодно: внешность, иммунитет, возникновение заболевания. Но как именно устроена эта связь – для людей, по большому счету, до сих пор загадка.

Основное, за счет чего работает AlphaGenome – это длинное контекстное окно в 1 миллион токенов. Без такого контекста модели бы просто не хватило информации для предсказания (и даже 1 миллиона иногда очень мало).

AG принимает на вход огромные последовательности пар оснований ДНК и предсказывает тысячи молекулярных свойств последовательности. Например, сколько вырабатывается РНК, как гены расположены в разных видах тканей, как они реплицируются и тд. Ну а сравнивая свойства одних последовательности с другими, можно оценить эффекты генетических мутаций.

Google утверждают, что по точности предсказаний они достигли SOTA. Обучали модель на открытых данных крупных лабораторий (в которых все это проверяли экспериментально). Под капотом – свертки, трансформер и декодер в нужные модальности.

Самое интересное, что Google уже открыли модель для использования через API – попробовать может каждый желающий. Так они хотят собрать больше фидбэка от ученых.

Блогпост | Статья (103 страницы на секундочку) | GitHub
#ЛабораторияИИ #AILAB
Эта неделя была насыщенной выступлениями — превратилась в целый марафон 🙃🙃🙃 Почему, на мой взгляд, важно это делать — рассказывать об экспериментах (даже сырых), делиться своими идеями и мыслями, общаться с коллегами по цеху (а возможно, даже с прямыми конкурентами)? Вот об этом пост.

Наша отрасль пока не настолько богата успешными R&D-историями — в том числе в рамках больших компаний. При этом многие экспериментируют дома по вечерам, переосмысляют подходы, днем решая свои рутинные задачи (сужу по прошлому себе 😃😃😃). И желание пробовать новое вызвано иногда просто интересом, личными увлечениями, иногда более глобальными целями — но далеко не всегда бизнес-мотивацией 🙂. Однако когда в одной компании это становится большим направлением или отделом, то как иначе разжечь интерес у «гаражных» стартапов, у коллег по цеху, если не показывать им, что это может иметь ценность? Почему бы не демонстрировать новые инструменты и подходы — а может, вовсе делиться ими и данными?

Я давно работаю в ПИК и очень рад, что сейчас подобная открытость возможна — именно такой крупный игрок может возбуждать интерес вокруг подобных исследований и помогать им, даже за пределами контура компании.

За последние дни я посетил много компаний-девелоперов (в некоторых случаях напросился сам 😄) и участвовал во множестве мероприятий самого разного формата — это показывает, как сильно меняется индустрия, что все хотят пробовать новые подходы, переосмысляют технологии, в том числе в девелоперских задачах. И если всё это может превратиться в большое сообщество гигантов отрасли, где тебя покритикуют, остановят на уже проверенном пути или подкинут новые инструменты, — то это суперсильный буст, ведь вероятность «попасть в цель» многократно возрастает, а не гасится закрытостью исследований.

А ещё, возможно, всё это приведет к переосмыслению процесса проектирования, архитектурного пространства, появлению нового стиля или типа жилья — эффективного, недорогого, доступного, эстетичного — и при этом совершенно нового способа жизни. Жилья, которое позволит каждому создавать вокруг себя пространство, идеально подходящее именно ему, без взаимных противоречий между бизнес-целями и другими факторами.
#unrealneural
Это исследование рассматривает трудоемкую и подверженную ошибкам природу ручной проверки соответствия кода в информационном моделировании зданий (BIM) путем внедрения подхода, основанного на большой языковой модели (LLM), для полуавтоматизации этого критического процесса. Разработанная система интегрирует LLM, такие как GPT, Claude, Gemini и Llama, с программным обеспечением Revit для интерпретации строительных норм, генерации скриптов Python и выполнения полуавтоматических проверок соответствия в среде BIM.

https://arxiv.org/abs/2506.20551
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #пытаюсьпонять
Continuous Thought Machines (CTM) и «Foveated Active Vision» (фовеальная зрительная система)

1. CTM определяет, куда смотреть, и насколько "приближен" его эффективный объектив. Внутренняя и постоянная обратная связь позволяет достичь fascinating (захватывающего) поведения.

2. Эмерджентность и простота: Все это достигается без дополнительных вспомогательных потерь и без использования обучения с подкреплением (RL). Основной целью является просто контролируемая кросс-энтропийная потеря.

3. Фовеальное зрение широко распространено в природе. CTM получает небольшую «фовею» (фокус) и сжатый, низкоразрешенный вид «периферии». Это позволяет ему динамически выбирать между изучением деталей и пониманием контекста.

4. Преимущества для CNN: Сверточные нейронные сети (CNN) обычно представляют собой крупные модели, которым приходится обрабатывать множество разрешений, где объекты могут казаться близкими или далекими. Предоставление CTM возможности эффективно «выбирать собственное разрешение» может позволить использовать гораздо меньшие и более эффективные базовые сети.

Видео автор описывает так:
1. Исходное изображение находится в верхнем левом углу. На нем наложена полярная сетка, обозначающая фовеальную выборку.

2. В центре показано то, что видит CTM (то есть, данные, которые поступают в базовую сеть).

3. Справа представлена фовеальная перспектива, перепроецированная в евклидово пространство.

4. Средний ряд показывает фовеальную информацию, «ворота», прогнозы, а также внимание (как в модельном пространстве, так и перепроецированное в евклидово пространство).

5. Нижний ряд демонстрирует нейронную динамику случайно выбранных нейронов.

http://pub.sakana.ai/ctm
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #вкопилкуэрудита
Continuous Thought Machines

Видео-пояснение работы Continuous Thought Machines. Искусственный интеллект, архитектура которого вдохновлена биологическим мозгом

https://www.youtube.com/watch?v=dYHkj5UlJ_E&feature=youtu.be
2025/06/27 07:42:46
Back to Top
HTML Embed Code: