unrealneural Telegram Group

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:14

Hunyuan 3D 2.1 прикрутили в Krea.ai

PBR-текстуры и все такое. Интересно, что у Креа уже есть свое 3Д. Но ещё интереснее, как они будут встраивать 3Д в общий пайплайн создания контента. Будут ли упираться в риг или текстурирование. Что будут делать с релайтом на совмещениях.

Креа, конечно, превращается в этакий закрытый хаггинг фейс - они интегрируют вовнутрь все, что шевелится по API.

@cgevent

259 viewsАртур Ишмаев, 18:48

#unrealneural #умныйассистент
Попросил своего "умного ассистента" делать подборку самых интересных публикаций на arxiv.org за сегодня 🧐
Делюсь результатами, пока глубоко их не изучал

Сегодня, 25 июня 2025 г., на arXiv (раздел Computer Science) появилось 775 новых работ. Ниже – субъективная подборка семи наиболее любопытных публикаций с указанием области исследования и прямых ссылок:

HI‑SQL – arXiv: 2506.18916 (LLM / Text‑to‑SQL)
https://arxiv.org/abs/2506.18916

MemeMind – arXiv: 2506.18919 (CV / Multimodal ML)
https://arxiv.org/abs/2506.18919

GenHSI – arXiv: 2506.19840 (Video Generation)
https://arxiv.org/abs/2506.19840

SimpleGVR – arXiv: 2506.19838 (Video Super‑Resolution)
https://arxiv.org/abs/2506.19838

ManiGaussian++ – arXiv: 2506.19842 (Robotics / Manipulation)
https://arxiv.org/abs/2506.19842

MAM – arXiv: 2506.19835 (Medical AI / Multi‑Agent LLM)
https://arxiv.org/abs/2506.19835

Temporal‑IRL – arXiv: 2506.19843 (Reinforcement Learning / Logistics)
https://arxiv.org/abs/2506.19843

Эти работы охватывают актуальные направления – от улучшения LLM‑интеракций с БД и мультимодальных датасетов до генерации видео, робототехники и прикладного RL.

276 viewsАртур Ишмаев, edited 19:35

0:30

#unrealneural
Gemini CLI

Легкий и мощный ИИ-агент с открытым исходным кодом, который позволяет использовать Gemini прямо в вашем терминале.

Бесплатно.

https://github.com/google-gemini/gemini-cli

275 viewsАртур Ишмаев, 05:42

Forwarded from Data Secrets

0:18

Google анонсировали AlphaGenome – модель для понимания генетики

Она может предсказывать, какое влияние окажут те или иные изменения в ДНК.

При достаточной точности такая модель может абсолютно перевернуть наше понимание болезней и биологии в целом, потому что геном человека, по сути, управляет в нашем организме всем. Небольшие вариации на молекулярном уровне в ДНК могут повлиять на что угодно: внешность, иммунитет, возникновение заболевания. Но как именно устроена эта связь – для людей, по большому счету, до сих пор загадка.

Основное, за счет чего работает AlphaGenome – это длинное контекстное окно в 1 миллион токенов. Без такого контекста модели бы просто не хватило информации для предсказания (и даже 1 миллиона иногда очень мало).

AG принимает на вход огромные последовательности пар оснований ДНК и предсказывает тысячи молекулярных свойств последовательности. Например, сколько вырабатывается РНК, как гены расположены в разных видах тканей, как они реплицируются и тд. Ну а сравнивая свойства одних последовательности с другими, можно оценить эффекты генетических мутаций.

Google утверждают, что по точности предсказаний они достигли SOTA. Обучали модель на открытых данных крупных лабораторий (в которых все это проверяли экспериментально). Под капотом – свертки, трансформер и декодер в нужные модальности.

Самое интересное, что Google уже открыли модель для использования через API – попробовать может каждый желающий. Так они хотят собрать больше фидбэка от ученых.

Блогпост | Статья (103 страницы на секундочку) | GitHub

246 viewsАртур Ишмаев, 09:50

#ЛабораторияИИ #AILAB
Это насыщенная неделя превратилась в целый марафон выступлений 🙃
Почему, на мой взгляд, важно рассказывать об экспериментах (даже сырых), делиться своими идеями и мыслями и общаться с коллегами по цеху (и, возможно, даже с прямыми конкурентами)? Мой пост сегодня будет об этом.

Наша отрасль пока не столь богата на успешны R&D истории, в том числе в больших компаниях, Однако многие, решая днём обычные рабочие задачи, вечерами дома экспериментируют и переосмысляют подходы к обычным задачам (сужу по себе 😃😃😃).

Желание попробовать новое иногда вызвано личными интересами и увлечениями, иногда более глобальными целями, но далеко не всегда в этом есть бизнес-мотивация.
Если же в одной компании появляется новое экспериментальное направление или отдел, то как иначе разжечь интерес у «гаражных стартапов», у коллег по цеху из других компаний, кроме как показывать им свои эксперименты и рассказывать, что это может иметь ценность? На этапе создания новой ценности для бизнеса эксперименты и открытость помогают общему росту.

Я работаю в ПИК давно, это большая компания — и я очень рад, что в одном из лидеров российского девелопмента возможна такая открытость. Когда такой крупный игрок идёт на эксперименты с новыми технологиями, делится своими исследованиями, это возбуждает интерес.

За последние дни я посетил много компаний-девелоперов (в некоторых случаях напросился сам 😄), участвовал в мероприятиях разного формата. То, что тему искусственного интеллекта активно обсуждают, показывает, как сильно меняется наша индустрия — все хотят пробовать новое, в том числе в девелоперских задачах. Если благодаря открытости у нас появится большое сообщество с профессионалами из крупных компаний отрасли, где тебя могут почелленджить или предложить новые идеи и инструменты, то это будет суперсильным бустом. Вероятность «попасть в цель» при новых разработках будет многократно возрастать, а не гаситься закрытостью исследований.

А ещё, возможно, открытость в отрасли, желание делиться экспериментами с нейросетями и ИИ могут привести к появлению новых идей и подходов в проектировании, в архитектуре, в создании новых стилей или типов жилья (эффективного, доступного, эстетичного). Жилья, которое позволит каждому создавать вокруг себя пространство, подходящее именно ему, без противоречий между целями и другими факторами.

375 viewsАртур Ишмаев, 17:20

#unrealneural
Это исследование рассматривает трудоемкую и подверженную ошибкам природу ручной проверки соответствия кода в информационном моделировании зданий (BIM) путем внедрения подхода, основанного на большой языковой модели (LLM), для полуавтоматизации этого критического процесса. Разработанная система интегрирует LLM, такие как GPT, Claude, Gemini и Llama, с программным обеспечением Revit для интерпретации строительных норм, генерации скриптов Python и выполнения полуавтоматических проверок соответствия в среде BIM.

https://arxiv.org/abs/2506.20551

234 viewsАртур Ишмаев, 19:28

AI LAB | Лаборатория ИИ pinned a photo

19:39

#unrealneural #пытаюсьпонять
Continuous Thought Machines (CTM) и «Foveated Active Vision» (фовеальная зрительная система)

1. CTM определяет, куда смотреть, и насколько "приближен" его эффективный объектив. Внутренняя и постоянная обратная связь позволяет достичь fascinating (захватывающего) поведения.

2. Эмерджентность и простота: Все это достигается без дополнительных вспомогательных потерь и без использования обучения с подкреплением (RL). Основной целью является просто контролируемая кросс-энтропийная потеря.

3. Фовеальное зрение широко распространено в природе. CTM получает небольшую «фовею» (фокус) и сжатый, низкоразрешенный вид «периферии». Это позволяет ему динамически выбирать между изучением деталей и пониманием контекста.

4. Преимущества для CNN: Сверточные нейронные сети (CNN) обычно представляют собой крупные модели, которым приходится обрабатывать множество разрешений, где объекты могут казаться близкими или далекими. Предоставление CTM возможности эффективно «выбирать собственное разрешение» может позволить использовать гораздо меньшие и более эффективные базовые сети.

Видео автор описывает так:
1. Исходное изображение находится в верхнем левом углу. На нем наложена полярная сетка, обозначающая фовеальную выборку.

2. В центре показано то, что видит CTM (то есть, данные, которые поступают в базовую сеть).

3. Справа представлена фовеальная перспектива, перепроецированная в евклидово пространство.

4. Средний ряд показывает фовеальную информацию, «ворота», прогнозы, а также внимание (как в модельном пространстве, так и перепроецированное в евклидово пространство).

5. Нижний ряд демонстрирует нейронную динамику случайно выбранных нейронов.

http://pub.sakana.ai/ctm

196 viewsАртур Ишмаев, edited 06:17

1:34

#unrealneural #вкопилкуэрудита
Continuous Thought Machines

Видео-пояснение работы Continuous Thought Machines. Искусственный интеллект, архитектура которого вдохновлена биологическим мозгом

https://www.youtube.com/watch?v=dYHkj5UlJ_E&feature=youtu.be

211 viewsАртур Ишмаев, edited 06:35

Forwarded from Data Secrets

Google уверены, что с помощью ИИ вот-вот решат одну из главных математических загадок человечества

Оказывается, в DeepMind целая команда из 20 человек уже три года тайно работает над задачей Навье - Стокса. Это одна из семи математических задач, удостоенных звания проблемы тысячелетия. За ее решение положена премия в 1 миллион долларов (ну и вечная слава).

До сих пор инженеры работали полностью конфиденциально. Впервые публично об «операции» заговорил сегодня испанский математик Гомес Серрано, с которым Google собираются объединиться для того, чтобы дорешать задачу.

Корни задачи уходят корнями еще в 19 век. Тогда два математика – Анри Навье и Джордж Стокс – независимо друг от друга опубликовали дифференциальные уравнения, описывающие движение жидкостей и воды. И вот, спустя два века, до сих пор не существует общего аналитического решения этой системы.

Если бы оно нашлось, люди смогли бы предсказывать турбулентность и цунами, точнее прогнозировать погоду, лучше понимать кровообращение и даже улучшить современные двигатели. Решение станет настоящим прорывом в физике и математике.

Сейчас в мире за решение конкурируют три группы математиков. В составе одной из них как раз и был Гомес Серрано. Его группа отличалась тем, что они еще несколько лет назад пытались применять ИИ для решения задачи.

Теперь же Гомес объединяется с той самой секретной командой из DeepMind. Они надеятся, что вместе и с помощью ИИ (видимо, имеется в виду AlphaEvolve) они продвинутся в решении уже до конца этого года.

178 viewsАртур Ишмаев, 14:36

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:20