ArtificialIntelligencedl 2176 Telegram Group

Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement

RAG-Diffusion now supports FLUX.1 Redux!

🔥 Ready to take control? Customize your region-based images with our training-free solution and achieve powerful, precise results!

🔗 Code: https://github.com/NJU-PCALab/RAG-Diffusion

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5.4K views17:28

Artificial Intelligence

Forwarded from Machinelearning

✔️

Венчурный фонд a16z представил прогноз ключевых технологических трендов на 2025 год.

Эксперты Andreessen Horowitz ожидают рост спроса на ядерную энергию для обеспечения растущих потребностей центров обработки данных искусственного интеллекта. Появятся новые профессии, требующие навыков в области аппаратного и программного обеспечения, робототехники и автоматизации.

XR-устройства получат развитие как инструменты для разработчиков, создающих приложения для реального мира. В сфере здравоохранения ИИ будет использоваться для демократизации доступа к медицинской информации и решения кадрового кризиса. Ожидается рост популярности периферийного ИИ и создание крупных вычислительных центров для обучения и развертывания моделей ИИ.
a16z.com

✔️

В Китае создан ИИ для написания политически корректных документов.

Китайский интернет-гигант Baidu совместно с партийным приложением Xuexi разработал инструмент на основе искусственного интеллекта, который помогает чиновникам создавать политически корректные документы. Xuexi – это приложение, посвященное жизни и идеям Си Цзиньпина.

Новый инструмент проверяет документы на соответствие идеям Си Цзиньпина и гарантирует, что ссылки на его высказывания взяты из проверенных источников. Инструмент также может использоваться для создания документов с цитированием государственной статистики и политики.
theregister.com

✔️

Бывший сотрудник OpenAI создает стартап в области AI-аудио.

Алексис Конно, один из разработчиков Advanced Voice Mode для ChatGPT, основал стартап WaveForm, который занимается созданием системы AI-аудио, способной улавливать больше нюансов речи, чем существующие технологии. WaveForm, получивший начальное финансирование в размере 40 млн. долл. от Andreessen Horowitz, стремится создать систему, которая пройдет "речевой тест Тьюринга", то есть сможет имитировать человеческую речь настолько точно, что пользователи не смогут отличить ее от живого собеседника. В настоящее время WaveForm, состоящий из 5 сотрудников, находится на стадии разработки своих моделей.
axios.com

✔️

Ultralytics YOLO11 была взломана и содержит криптомайнер.

Ultralytics YOLO11, модель, предназначенная для обнаружения объектов, была скомпрометирована в результате атаки на цепочку поставок. Вредоносный код, внедренный в версии 8.3.41 и 8.3.42, устанавливал криптомайнер на устройства пользователей, скачавших библиотеку с через Python Package Index (PyPI). Ultralytics, используемая в популярных проектах SwarmUI и ComfyUI, загружалась более 260 000 раз за сутки. Вредоносный код запускал майнер XMRig, подключающийся к пулу "connect.consrensys[.]com:8080".

Разработчики Ultralytics удалили скомпрометированные версии и выпустили обновление 8.3.43, устраняющее уязвимость. Расследование показало, что атака, возможно, была осуществлена через два вредоносных запроса на внесение изменений в код от пользователя из Гонконга. В настоящее время проводится полный аудит безопасности для предотвращения подобных инцидентов в будущем.
bleepingcomputer.com

✔️ OpenAI представила Sora: новую модель для создания видеороликов по текстовому описанию.

Компания OpenAI на онлайн-стриме анонсировала запуск Sora – инструмента для создания видео по текстовому запросу. Sora доступна подписчикам ChatGPT Plus и Pro, с ограничениями по региону (недоступна на территории ЕС и Великобритании), количеству генераций и качеству видео. Plus-пользователи смогут создавать до 5 видео в месяц длиной до 5 секунд в разрешении до 720p.

Pro-подписка позволяет сгенерировать до 500 коротких видео длиной до 20 секунд в разрешении до 1080p. Sora предлагает различные инструменты для редактирования и управления процессом создания видео: Storyboard для покадровой режиссуры и функции для добавления начала, концовки и объединения нескольких видео.
openai.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

3.5K views22:30

Artificial Intelligence

OmniDocBench is a benchmark for evaluating diverse document parsing in real-world scenarios, featuring the following characteristics

🖥

Github: https://github.com/opendatalab/OmniDocBench

📕

Paper: https://arxiv.org/abs/2412.07626

🌟 Dataset: https://huggingface.co/datasets/opendatalab/OmniDocBench

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

4.0K views22:40

Artificial Intelligence

2DMatGMM: An open-source robust machine learning platform for real-time detection and classification of 2D material flakes

🖥

Github: https://github.com/jaluus/2dmatgmm

📕

Paper: https://arxiv.org/abs/2412.09333v1

🌟 Dataset: https://paperswithcode.com/task/instance-segmentation

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

4.5K views11:01

Artificial Intelligence

⚡️ Byte Latent Transformer: Patches Scale Better Than Tokens

Byte Latent Transformer architecture (BLTs), a new byte-level LLM architecture that for the first time, matches tokenization-based LLM performance at scale, with significant improvements in inference efficiency and robustness.

🖥

Github: https://github.com/facebookresearch/blt

📕

Paper: https://arxiv.org/abs/2412.09871v1

🌟 Dataset: https://paperswithcode.com/dataset/mmlu

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

5.8K views21:05

Artificial Intelligence

🀄 GuoFeng Webnovel: A Discourse-Level and Multilingual Corpus of Web Fiction

🖥

Github: https://github.com/longyuewangdcu/guofeng-webnovel

📕

Paper: https://arxiv.org/abs/2412.11732v1

🌟 Dataset: www2.statmt.org/wmt24/literary-trans

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

6.5K views12:00

Artificial Intelligence

Large Language Models Course: Learn by Doing LLM Projects

🖥

Github: https://github.com/peremartra/Large-Language-Model-Notebooks-Course

📕

Paper: https://doi.org/10.31219/osf.io/qgxea

@ArtificialIntelligencedl

Please open Telegram to view this post

VIEW IN TELEGRAM

6.4K views10:34

2025/05/23 06:25:00
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>