Telegram Group Search
#проархитектуру #пытаюсьпонять #ЛабораторияИИ
Про «архитектон» современного проектирования

Казимир Малевич создавал архитектоны как абстрактные модели будущей архитектуры. Это были не здания, а композиции, формы - попытка нащупать основу пространства, до наполнения функцией, до фасада, до планировок, до стройки.
Сегодня, спустя большие этапы развития технологий, подходов, появления такого количества проектов и форм зданий, архитектон уже не может быть как физический объём. Он скорее не физическая композиция, а логика архитектурного процесса, проектирования вне зависимости где это действие совершается (на компьютере или на бумаге).

В реальности ИИ-агентов и автоматизированных платформ становится ясно: архитектуру порождает не результат, а последовательность решений, принятых по пути. И если у Малевича архитектоны были телами, то сегодня — это единицы проектного действия, то, из чего рождается пространство, как мне кажется. Ведь построенный объект это не всегда единственно верное решение на данном куске пространство, даже если к нему пришла группа хороших архитекторов.

Такое большое разнообразие архпространства порождается комбинацией ограниченного множества действий. Особенно если это происходит в рамках API определенного софта 🧐
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Kyvo

В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.

https://glab-caltech.github.io/kyvo/
Forwarded from Complete AI
⚡️⚡️⚡️На прошлой неделе мы зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.

В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪

📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍
Hugging Face
📍
На Papers With Code уверенная SoTA на DeepCAD бенчмарке

Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!

P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉

@complete_ai
Forwarded from NN
Krea выпустили свою первую модель для генерации изображений Krea 1. Работает бесплатно для всех пользователей.

Умеет на ходу переключаться между разными стилями, от фотореализма до простого рисунка. Можно натренировать нейронку на собственных снимках.

Уже раздают бета-доступ. До полноценного релиза меньше недели.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Text-to-LoRA

Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.

Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.

https://github.com/SakanaAI/Text-to-Lora
Forwarded from эйай ньюз
Авито показали технологическую внутрянку компании

На фестивале Data Fest Авито показали, как работают языковые и визуальные модели, обучаются агенты поддержки, функционируют бизнес-метрики внедрения. А еще — чем занимаются стажеры в компании.

Выяснилось, что собственный токенизатор модели требует на русском языке в среднем на 29% меньше токенов. Это делает модель до двух раз быстрее чем Qwen такого же размера. В итоге на фесте A-Vibe заняла первое место среди небольших моделей в бенчмарке MERA. Кстати, стажеры в компании тоже занимаются обучением A-Vibe. Для них нет тестовых проектов — ребята сразу попадают в гущу событий.

Визуальная модель не отстает от языковой: она умеет делать описание изображения, распознавать текст, считать объекты на фото и даже определять названия брендов. Быстрый токенизатор опять же помогает выполнять все эти задачи в ускоренном режиме.

А для автоматизации 80-95% рутинных задач Авито создал ML-платформу. Платформа объединяет хранилище готовых признаков, систему разметки с взаимным контролем качества между людьми и ИИ, а также open-source решение Aqueduct для оптимизации инференса, экономящее до 30% ресурсов. Конечная цель ー no-code интерфейс, позволяющий любому сотруднику запускать модели без написания кода.

@ai_newz
#unrealneural #ЛабораторияИИ
Наша лаборатория ИИ работает и в праздничные дни ⚡️⚡️⚡️

Поздравляем всех с праздником
Опубликовали статью "Confidence Is All You Need" о способности языковых моделей выполнять роль функции наград (применяются в обучении с подкреплением — DeepSeek R1 яркий тому пример) для самостоятельного улучшения качества генерации текста на основе внутренней уверенности в своих ответах.

В этой работе получилась интересная (хоть и простая) математика, и потенциально такая работа может дать возможность улучшать качество моделей даже без награды.

Апвоутнуть можно тут.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
V-JEPA 2

Новые модели для работы с изображениями и видео и их восприятия с открытым исходным кодом

- на основе ViT, разных размеров и разрешений
- поддержка в трансформаторах
- есть тест физического мышления

https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6
Media is too big
VIEW IN TELEGRAM
#unrealneural
Sparc3D — генерация 3D-фигур следующего поколения с ультра-разрешением

- Детализация сетки до разрешения 1536³
- Готовая к 3D-печати модель
https://lizhihao6.github.io/Sparc3D/
#unrealneural
GeoCAD: Local Geometry-Controllable CAD Generation

Модель для создания и изменения CAD-моделей. Она позволяет точно редактировать отдельные части 3D-моделей, следуя текстовым описаниям. Использует машинное обучение для генерации качественных моделей с акцентом на управление локальными деталями, что полезно для дизайна и проектирования.
https://arxiv.org/abs/2506.10337
Media is too big
VIEW IN TELEGRAM
#unrealneural
Hunyuan 3D 2.1

Новая версия генератора 3д геометрии Hunyuan 3D.
- Визуальные эффекты кинематографического уровня: синтез материалов PBR оживляет кожу, бронзу и многое другое благодаря потрясающему взаимодействию света.
- Полностью открытый исходный код: веса моделей, код обучения/вывода, конвейеры данных и архитектура — все это можно настроить самостоятельно!
- Работает на персональных графических процессорах, расширяя возможности создателей, разработчиков и небольших команд.
https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MeshArt

Модель на основе трансформеров для генерации чистой меш геометрии.
https://daoyig.github.io/Mesh_Art/
2025/06/14 06:46:21
Back to Top
HTML Embed Code: