Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs
🖥 Github: https://github.com/zhouyiks/CoLVA/tree/main
📕 Paper: https://arxiv.org/pdf/2501.04670v1.pdf
🌟 Dataset: https://paperswithcode.com/dataset/bdd100k
@ArtificialIntelligencedl
🌟 Dataset: https://paperswithcode.com/dataset/bdd100k
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Parameter-Inverted Image Pyramid Networks for Visual Perception and Multimodal Understanding
🖥 Github: https://github.com/opengvlab/piip
📕 Paper: https://arxiv.org/abs/2501.07783v1
🌟 Dataset: https://paperswithcode.com/dataset/gqa
@ArtificialIntelligencedl
🌟 Dataset: https://paperswithcode.com/dataset/gqa
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Continual Forgetting for Pre-trained Vision Models (CVPR2024)
🖥 Github: https://github.com/bjzhb666/GS-LoRA
📕 Paper: https://arxiv.org/abs/2501.09705v1
🧠 Dataset: https://paperswithcode.com/dataset/coco
@ArtificialIntelligencedl
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: www.group-telegram.com/ai_machinelearning_big_data
C++ www.group-telegram.com/cpluspluc
Python: www.group-telegram.com/pythonl
Linux: www.group-telegram.com/linuxacademiya
Хакинг: https://www.group-telegram.com/+i__6ED-eRfkwOTYy
Devops: www.group-telegram.com/DevOPSitsec
Data Science: www.group-telegram.com/data_analysis_ml
Javascript: www.group-telegram.com/javascriptv
C#: www.group-telegram.com/csharp_ci
Java: www.group-telegram.com/javatg
Базы данных: www.group-telegram.com/sqlhub
Python собеседования: www.group-telegram.com/python_job_interview
Мобильная разработка: www.group-telegram.com/mobdevelop
Docker: www.group-telegram.com/DevopsDocker
Golang: www.group-telegram.com/Golang_google
React: www.group-telegram.com/react_tg
Rust: www.group-telegram.com/rust_code
ИИ: www.group-telegram.com/vistehno
PHP: www.group-telegram.com/phpshka
Android: www.group-telegram.com/android_its
Frontend: www.group-telegram.com/front
Big Data: www.group-telegram.com/bigdatai
Собеседования МЛ: www.group-telegram.com/machinelearning_interview
МАТЕМАТИКА: www.group-telegram.com/data_math
Kubernets: www.group-telegram.com/kubernetc
Разработка игр: https://www.group-telegram.com/gamedev
Haskell: www.group-telegram.com/haskell_tg
Физика: www.group-telegram.com/fizmat
💼 Папка с вакансиями: www.group-telegram.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.group-telegram.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.group-telegram.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.group-telegram.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://www.group-telegram.com/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: www.group-telegram.com/memes_prog
🇬🇧Английский: www.group-telegram.com/english_forprogrammers
🧠ИИ: www.group-telegram.com/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://www.group-telegram.com/addlist/BkskQciUW_FhNjEy
МАШИННОЕ ОБУЧЕНИЕ: www.group-telegram.com/ai_machinelearning_big_data
C++ www.group-telegram.com/cpluspluc
Python: www.group-telegram.com/pythonl
Linux: www.group-telegram.com/linuxacademiya
Хакинг: https://www.group-telegram.com/+i__6ED-eRfkwOTYy
Devops: www.group-telegram.com/DevOPSitsec
Data Science: www.group-telegram.com/data_analysis_ml
Javascript: www.group-telegram.com/javascriptv
C#: www.group-telegram.com/csharp_ci
Java: www.group-telegram.com/javatg
Базы данных: www.group-telegram.com/sqlhub
Python собеседования: www.group-telegram.com/python_job_interview
Мобильная разработка: www.group-telegram.com/mobdevelop
Docker: www.group-telegram.com/DevopsDocker
Golang: www.group-telegram.com/Golang_google
React: www.group-telegram.com/react_tg
Rust: www.group-telegram.com/rust_code
ИИ: www.group-telegram.com/vistehno
PHP: www.group-telegram.com/phpshka
Android: www.group-telegram.com/android_its
Frontend: www.group-telegram.com/front
Big Data: www.group-telegram.com/bigdatai
Собеседования МЛ: www.group-telegram.com/machinelearning_interview
МАТЕМАТИКА: www.group-telegram.com/data_math
Kubernets: www.group-telegram.com/kubernetc
Разработка игр: https://www.group-telegram.com/gamedev
Haskell: www.group-telegram.com/haskell_tg
Физика: www.group-telegram.com/fizmat
💼 Папка с вакансиями: www.group-telegram.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.group-telegram.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.group-telegram.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.group-telegram.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://www.group-telegram.com/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: www.group-telegram.com/memes_prog
🇬🇧Английский: www.group-telegram.com/english_forprogrammers
🧠ИИ: www.group-telegram.com/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://www.group-telegram.com/addlist/BkskQciUW_FhNjEy
WILDCHAT-50M: A Deep Dive Into the Role of Synthetic Data in Post-Training
🖥 Github: https://github.com/penfever/wildchat-50m
📕 Paper: https://arxiv.org/abs/2501.18511v1
🧠 Dataset: https://huggingface.co/collections/nyu-dice-lab/wildchat-50m-679a5df2c5967db8ab341ab7
@ArtificialIntelligencedl
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
CycleGuardian: A Framework for Automatic RespiratorySound classification Based on Improved Deep clustering and Contrastive Learning
🖥 Github: https://github.com/chumingqian/CycleGuardian
📕 Paper: https://arxiv.org/abs/2502.00734v1
🌟 Dataset: https://paperswithcode.com/dataset/icbhi-respiratory-sound-database
@ArtificialIntelligencedl
🌟 Dataset: https://paperswithcode.com/dataset/icbhi-respiratory-sound-database
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Dataset: https://paperswithcode.com/task/image-relighting
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
FinRL-DeepSeek: LLM-Infused Risk-Sensitive Reinforcement Learning for Trading Agents
🖥 Github: https://github.com/benstaf/finrl_deepseek
📕 Paper: https://arxiv.org/abs/2502.08590v1
🌟 Colab: https://colab.research.google.com/github/benstaf/FinRL_DeepSeek/blob/main/FinRL_DeepSeek_backtest.ipynb
@ArtificialIntelligencedl
🌟 Colab: https://colab.research.google.com/github/benstaf/FinRL_DeepSeek/blob/main/FinRL_DeepSeek_backtest.ipynb
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Bayesian Sample Inference
🖥 Github: https://github.com/martenlienen/bsi
📕 Paper: https://arxiv.org/abs/2502.07580
🌟 Dataset: https://paperswithcode.com/dataset/cifar-10
@ArtificialIntelligencedl
🌟 Dataset: https://paperswithcode.com/dataset/cifar-10
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
GitHub Copilot для Xcode Chat стал доступен для публичного превью. Для начала работы достаточно учетной записи GitHub.
GitHub Copilot – это ИИ-ассистент, который помогает разработчикам писать код быстрее и точнее. Теперь, помимо дописывания кода, GitHub Copilot для Xcode предлагает интеллектуальные предложения для конкретных задач через интерактивный чат.
Для доступа к GitHub Copilot для Xcode потребуется лицензия Copilot. Есть бесплатный доступ, включающий 2000 итераций автозавершения кода и 50 чат-запросов в месяц.
devblogs.microsoft.com
SWE-Lancer позиционируется как инструмент оценки производительности языковых моделей в задачах программирования для фрилансеров. Он основан на 1400 фриланс-задачах, собранных из Upwork и репозитория Expensify. Задания варьируются от исправления незначительных ошибок до внедрения крупных функций.
SWE-Lancer предназначен для оценки как отдельных исправлений кода, так и управленческих решений, где модели должны выбирать лучшее предложение из нескольких вариантов. Одной из сильных сторон SWE-Lancer является использование сквозных тестов вместо изолированных модульных операций. Репозиторий бенчмарка ожидается в ближайшее время.
arxiv.org
X (ех-Twitter) значительно повысила цену на план подписки Premium+, дающий доступ к Grok 3 от xAI. Она подорожала почти до 50 долларов в месяц.
Теперь, чтобы пользоваться "deep search" и "reasoning", надо оформить отдельный план SuperGrok через приложение Grok.
Согласно сайту поддержки X, месячная подписка на Premium+ в США теперь стоит 50 долларов, а годовая – 350 долларов. Это уже второе повышение цен на план Premium+ за последние пару месяцев. В декабре компания подняла цену с 16 до 22 долларов в месяц. Таким образом, новая цена более чем вдвое превышает текущую стоимость подписки.
techcrunch.com
NSA (Natively Sparse Attention) — новый механизм внимания, предложенный на заменуFull Attention, который значительно ускоряет обработку длинных последовательностей текста без потери качества модели.
NSA использует динамическую иерархическую стратегию, которая сочетает сжатие токенов на грубом уровне с точным отбором ключевых токенов. Это позволяет сохранить глобальное понимание контекста и локальную точность. NSA поддерживает сквозное обучение, совместим с GQA и MQA, что делает его пригодным не только для инференса, но и для обучения.
Модели, обученные с использованием NSA показали 9х ускорение при прямом распространении и 6х при обратном для последовательностей длиной 64к токенов относительно Full Attention. В декодировании - 11х.
arxiv.org
Мира Мурати, ex-CTO OpenAI, покинула свой пост в сентябре 2024, заявив о желании "создать время и пространство для собственных исследований". И вот стало известно, что она – CEO компании Thinking Machines Lab. Ее миссия – разработка первоклассного AI, полезного и доступного для всех.
В команду Thinking Machines Lab вошли известные исследователи и ученые, в основном из OpenAI. Среди них – экс-вице-президент по исследованиям Баррет Зоф, руководитель по мультимодальным исследованиям Александр Кириллов, руководитель специальных проектов Джон Лакман и ведущий исследователь Люк Мец. Главным научным сотрудником станет Джон Шульман, один из ключевых создателей ChatGPT, ранее работавший в OpenAI и Anthropic. Есть специалисты из Google и Mistral AI.
Команда уже работает над рядом проектов в офисе в Сан-Франциско. Хотя конкретные продукты пока неясны, Thinking Machines Lab не планирует создавать копии ChatGPT или Claude. Цель – AI-модели, оптимизирующие сотрудничество между человеком и AI, что Мурати считает главным препятствием в развитии отрасли.
wired.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Bridging Text and Vision: A Multi-View Text-Vision Registration Approach for Cross-Modal Place Recognition
🖥 Github: https://github.com/nuozimiaowu/Text4VPR
📕 Paper: https://arxiv.org/abs/2502.14195v1
🌟 Dataset: https://paperswithcode.com/task/cross-modal-place-recognition
@ArtificialIntelligencedl
🌟 Dataset: https://paperswithcode.com/task/cross-modal-place-recognition
@ArtificialIntelligencedl
Please open Telegram to view this post
VIEW IN TELEGRAM