Forwarded from Китай.AI
🤖 Искусственный интеллект и будущее Китая: взгляд основателя Huawei
Основатель Huawei Жэнь Чжэнфэй в эксклюзивном интервью поделился мнением о развитии ИИ, проблемах полупроводниковой отрасли и роли фундаментальной науки.
🔹 О вызовах и инновациях
- В ответ на санкции США: "Не думаем о трудностях — просто работаем"
- Признает отставание в одно поколение в производстве чипов, но отмечает компенсацию через:
• Математические методы (восполнение физических ограничений)
• Кластерные вычисления
• Развитие альтернатив кремнию
🧠 Будущее ИИ по версии Huawei
• Главные условия развития: мощные энергосистемы и инфраструктура передачи данных
• "Алгоритмы принадлежат не IT-специалистам, а экспертам в энергетике, медицине и т.д."
• Преимущества Китая:
- Крупнейший в мире пул молодых талантов
- Передовые электросети и телекоммуникации
- Программа "Восточные данные — западные вычисления"
🌍 Социальный аспект
Подчеркивает важность государственной поддержки нерентабельных, но социально значимых проектов (как в случае с китайской сетью ВСМ), что возможно только при социалистической модели.
Вывод: Несмотря на технологические вызовы, Китай делает стратегические ставки на ИИ и фундаментальную науку, используя системные преимущества своей экономической модели.
Источник (People's Daily)
#КитайскийИИ #КитайAI #Huawei #Технологии
Основатель Huawei Жэнь Чжэнфэй в эксклюзивном интервью поделился мнением о развитии ИИ, проблемах полупроводниковой отрасли и роли фундаментальной науки.
🔹 О вызовах и инновациях
- В ответ на санкции США: "Не думаем о трудностях — просто работаем"
- Признает отставание в одно поколение в производстве чипов, но отмечает компенсацию через:
• Математические методы (восполнение физических ограничений)
• Кластерные вычисления
• Развитие альтернатив кремнию
Huawei инвестирует $25 млрд в R&D ежегодно, из них $8 млрд — в фундаментальные исследования без KPI.
🧠 Будущее ИИ по версии Huawei
• Главные условия развития: мощные энергосистемы и инфраструктура передачи данных
• "Алгоритмы принадлежат не IT-специалистам, а экспертам в энергетике, медицине и т.д."
• Преимущества Китая:
- Крупнейший в мире пул молодых талантов
- Передовые электросети и телекоммуникации
- Программа "Восточные данные — западные вычисления"
🌍 Социальный аспект
Подчеркивает важность государственной поддержки нерентабельных, но социально значимых проектов (как в случае с китайской сетью ВСМ), что возможно только при социалистической модели.
Вывод: Несмотря на технологические вызовы, Китай делает стратегические ставки на ИИ и фундаментальную науку, используя системные преимущества своей экономической модели.
Источник (People's Daily)
#КитайскийИИ #КитайAI #Huawei #Технологии
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
PartCrafter
Еще один инструмент 3D-генерации.
Из одного изображения он генерирует несколько структурированных, семантически значимых 3D-деталей — все за один проход.
https://arxiv.org/abs/2506.05573
PartCrafter
Еще один инструмент 3D-генерации.
Из одного изображения он генерирует несколько структурированных, семантически значимых 3D-деталей — все за один проход.
https://arxiv.org/abs/2506.05573
#проархитектуру #пытаюсьпонять #ЛабораторияИИ
Про «архитектон» современного проектирования
Казимир Малевич создавал архитектоны как абстрактные модели будущей архитектуры. Это были не здания, а композиции, формы - попытка нащупать основу пространства, до наполнения функцией, до фасада, до планировок, до стройки.
Сегодня, спустя большие этапы развития технологий, подходов, появления такого количества проектов и форм зданий, архитектон уже не может быть как физический объём. Он скорее не физическая композиция, а логика архитектурного процесса, проектирования вне зависимости где это действие совершается (на компьютере или на бумаге).
В реальности ИИ-агентов и автоматизированных платформ становится ясно: архитектуру порождает не результат, а последовательность решений, принятых по пути. И если у Малевича архитектоны были телами, то сегодня — это единицы проектного действия, то, из чего рождается пространство, как мне кажется. Ведь построенный объект это не всегда единственно верное решение на данном куске пространство, даже если к нему пришла группа хороших архитекторов.
Такое большое разнообразие архпространства порождается комбинацией ограниченного множества действий. Особенно если это происходит в рамках API определенного софта 🧐
Про «архитектон» современного проектирования
Казимир Малевич создавал архитектоны как абстрактные модели будущей архитектуры. Это были не здания, а композиции, формы - попытка нащупать основу пространства, до наполнения функцией, до фасада, до планировок, до стройки.
Сегодня, спустя большие этапы развития технологий, подходов, появления такого количества проектов и форм зданий, архитектон уже не может быть как физический объём. Он скорее не физическая композиция, а логика архитектурного процесса, проектирования вне зависимости где это действие совершается (на компьютере или на бумаге).
В реальности ИИ-агентов и автоматизированных платформ становится ясно: архитектуру порождает не результат, а последовательность решений, принятых по пути. И если у Малевича архитектоны были телами, то сегодня — это единицы проектного действия, то, из чего рождается пространство, как мне кажется. Ведь построенный объект это не всегда единственно верное решение на данном куске пространство, даже если к нему пришла группа хороших архитекторов.
Такое большое разнообразие архпространства порождается комбинацией ограниченного множества действий. Особенно если это происходит в рамках API определенного софта 🧐
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Kyvo
В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.
https://glab-caltech.github.io/kyvo/
Kyvo
В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.
https://glab-caltech.github.io/kyvo/
Forwarded from Complete AI
⚡️⚡️⚡️На прошлой неделе мы зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning
Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.
В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪
📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍Hugging Face
📍На Papers With Code уверенная SoTA на DeepCAD бенчмарке
Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!
P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉
@complete_ai
Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.
В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪
📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍Hugging Face
📍На Papers With Code уверенная SoTA на DeepCAD бенчмарке
Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!
P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉
@complete_ai
Forwarded from NN
Krea выпустили свою первую модель для генерации изображений Krea 1. Работает бесплатно для всех пользователей.
Умеет на ходу переключаться между разными стилями, от фотореализма до простого рисунка. Можно натренировать нейронку на собственных снимках.
Уже раздают бета-доступ. До полноценного релиза меньше недели.
Умеет на ходу переключаться между разными стилями, от фотореализма до простого рисунка. Можно натренировать нейронку на собственных снимках.
Уже раздают бета-доступ. До полноценного релиза меньше недели.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Text-to-LoRA
Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.
Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.
https://github.com/SakanaAI/Text-to-Lora
Text-to-LoRA
Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.
Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.
https://github.com/SakanaAI/Text-to-Lora
Forwarded from эйай ньюз
Авито показали технологическую внутрянку компании
На фестивале Data Fest Авито показали, как работают языковые и визуальные модели, обучаются агенты поддержки, функционируют бизнес-метрики внедрения. А еще — чем занимаются стажеры в компании.
Выяснилось, что собственный токенизатор модели требует на русском языке в среднем на 29% меньше токенов. Это делает модель до двух раз быстрее чем Qwen такого же размера. В итоге на фесте A-Vibe заняла первое место среди небольших моделей в бенчмарке MERA. Кстати, стажеры в компании тоже занимаются обучением A-Vibe. Для них нет тестовых проектов — ребята сразу попадают в гущу событий.
Визуальная модель не отстает от языковой: она умеет делать описание изображения, распознавать текст, считать объекты на фото и даже определять названия брендов. Быстрый токенизатор опять же помогает выполнять все эти задачи в ускоренном режиме.
А для автоматизации 80-95% рутинных задач Авито создал ML-платформу. Платформа объединяет хранилище готовых признаков, систему разметки с взаимным контролем качества между людьми и ИИ, а также open-source решение Aqueduct для оптимизации инференса, экономящее до 30% ресурсов. Конечная цель ー no-code интерфейс, позволяющий любому сотруднику запускать модели без написания кода.
@ai_newz
На фестивале Data Fest Авито показали, как работают языковые и визуальные модели, обучаются агенты поддержки, функционируют бизнес-метрики внедрения. А еще — чем занимаются стажеры в компании.
Выяснилось, что собственный токенизатор модели требует на русском языке в среднем на 29% меньше токенов. Это делает модель до двух раз быстрее чем Qwen такого же размера. В итоге на фесте A-Vibe заняла первое место среди небольших моделей в бенчмарке MERA. Кстати, стажеры в компании тоже занимаются обучением A-Vibe. Для них нет тестовых проектов — ребята сразу попадают в гущу событий.
Визуальная модель не отстает от языковой: она умеет делать описание изображения, распознавать текст, считать объекты на фото и даже определять названия брендов. Быстрый токенизатор опять же помогает выполнять все эти задачи в ускоренном режиме.
А для автоматизации 80-95% рутинных задач Авито создал ML-платформу. Платформа объединяет хранилище готовых признаков, систему разметки с взаимным контролем качества между людьми и ИИ, а также open-source решение Aqueduct для оптимизации инференса, экономящее до 30% ресурсов. Конечная цель ー no-code интерфейс, позволяющий любому сотруднику запускать модели без написания кода.
@ai_newz
#unrealneural #ЛабораторияИИ
Наша лаборатория ИИ работает и в праздничные дни ⚡️⚡️⚡️
Поздравляем всех с праздником
Наша лаборатория ИИ работает и в праздничные дни ⚡️⚡️⚡️
Поздравляем всех с праздником
Forwarded from Ivan Oseledets’ Channel
Опубликовали статью "Confidence Is All You Need" о способности языковых моделей выполнять роль функции наград (применяются в обучении с подкреплением — DeepSeek R1 яркий тому пример) для самостоятельного улучшения качества генерации текста на основе внутренней уверенности в своих ответах.
В этой работе получилась интересная (хоть и простая) математика, и потенциально такая работа может дать возможность улучшать качество моделей даже без награды.
Апвоутнуть можно тут.
В этой работе получилась интересная (хоть и простая) математика, и потенциально такая работа может дать возможность улучшать качество моделей даже без награды.
Апвоутнуть можно тут.
arXiv.org
Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models
Large language models (LLMs) excel at reasoning, yet post-training remains critical for aligning their behavior with task goals. Existing reinforcement learning (RL) methods often depend on costly...
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
V-JEPA 2
Новые модели для работы с изображениями и видео и их восприятия с открытым исходным кодом
- на основе ViT, разных размеров и разрешений
- поддержка в трансформаторах
- есть тест физического мышления
https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6
V-JEPA 2
Новые модели для работы с изображениями и видео и их восприятия с открытым исходным кодом
- на основе ViT, разных размеров и разрешений
- поддержка в трансформаторах
- есть тест физического мышления
https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6
Media is too big
VIEW IN TELEGRAM
#unrealneural
Sparc3D — генерация 3D-фигур следующего поколения с ультра-разрешением
- Детализация сетки до разрешения 1536³
- Готовая к 3D-печати модель
https://lizhihao6.github.io/Sparc3D/
Sparc3D — генерация 3D-фигур следующего поколения с ультра-разрешением
- Детализация сетки до разрешения 1536³
- Готовая к 3D-печати модель
https://lizhihao6.github.io/Sparc3D/