Что-то HF в последнее время сбоит. И вроде пишут, что на 5-10 минут, а по факту часто 503-е пошли.
Видимо, что-то полезное выпилили из своих библиотек.
Видимо, что-то полезное выпилили из своих библиотек.
MiniMax выпустили своего агента, который умеет стряпать сайты с озвученными аудиоматериалами (!), с картинками, писать код и т.д.
Сайты делает объемные. Попросил у него сделать сайт для Linkin Park, сделал красиво, нагуглил актуальных картинок, упаковал все в архив для деплоя и развернул у себя.
//Даже как-то тревожно с точки зрения создания фишинговых сайтов.
👉 Linkin Park
Сайты делает объемные. Попросил у него сделать сайт для Linkin Park, сделал красиво, нагуглил актуальных картинок, упаковал все в архив для деплоя и развернул у себя.
//Даже как-то тревожно с точки зрения создания фишинговых сайтов.
👉 Linkin Park
🔺 Как Cursor устроен изнутри
Перевожу любопытную статью про то, как устроен Курсор, из первых уст.
Статья в целом платная, но автор любезно разрешил опубликовать перевод.
Из любопытного там: тех. стек, который использует команда; детали того, как искать по коду и запускать на нем агентов, если код они нигде не хранят и разные другие мелочи. Это первая часть, вторая будет чуть позже.
👉 https://habr.com/ru/articles/919636/
Перевожу любопытную статью про то, как устроен Курсор, из первых уст.
Статья в целом платная, но автор любезно разрешил опубликовать перевод.
Из любопытного там: тех. стек, который использует команда; детали того, как искать по коду и запускать на нем агентов, если код они нигде не хранят и разные другие мелочи. Это первая часть, вторая будет чуть позже.
👉 https://habr.com/ru/articles/919636/
Хабр
Как Cursor устроен изнутри. Часть 1
Вторая часть статьи . Всего за год нагрузка на Cursor выросла в 100 раз: более 1 млн запросов в секунду и миллиарды автодополнений кода каждый день. Подробный разбор архитектуры — вместе с...
Я, наверное, слоупок, но только сейчас узнал, что есть проект с картой GitHub'а.
Кластеры окрашены ровно в 4 цвета (все по науке) и забавно проименованы.
Мой lingtrain-aligner и пару NLP проектов, типа natasha, которые сходу вспомнил, находятся на материке Code Slavica в доминионе RusAI 😄
Еще нашел остров с торрентами (по соседству с порно-репозиториями).
👉 https://anvaka.github.io/map-of-github
//Что-то я пригляделся и, по-моему, там 5 цветов)
Кластеры окрашены ровно в 4 цвета (все по науке) и забавно проименованы.
Мой lingtrain-aligner и пару NLP проектов, типа natasha, которые сходу вспомнил, находятся на материке Code Slavica в доминионе RusAI 😄
Еще нашел остров с торрентами (по соседству с порно-репозиториями).
👉 https://anvaka.github.io/map-of-github
//Что-то я пригляделся и, по-моему, там 5 цветов)
🔺 Как Cursor устроен изнутри. Часть 2
🔸 Допереводил вторую часть статьи, тут уже пободрее — про то, с какими проблемами сталкивается команда при лавинообразном притоке пользователей (помимо проблемы, куда девать столько денег).
🔸 Про то, как мигрировали БД на 22TB, когда Курсор 10 часов лежал из-за текущего решения, которое оказалось ненадежным.
🔸 Хвалят стартап Turbopuffer, на который скинули хранение всех эмбеддингов, и он справился.
+ Различные мелочи по культуре разработки и экспов.
👉 https://habr.com/ru/articles/920660/
🔸 Допереводил вторую часть статьи, тут уже пободрее — про то, с какими проблемами сталкивается команда при лавинообразном притоке пользователей (помимо проблемы, куда девать столько денег).
🔸 Про то, как мигрировали БД на 22TB, когда Курсор 10 часов лежал из-за текущего решения, которое оказалось ненадежным.
🔸 Хвалят стартап Turbopuffer, на который скинули хранение всех эмбеддингов, и он справился.
+ Различные мелочи по культуре разработки и экспов.
👉 https://habr.com/ru/articles/920660/
Интересный доклад идет на GigaConf. Костя рассказывает про агентов и MCP сервера.
👉 https://gigaconf.ru/program (Зал GenAI)
👉 https://gigaconf.ru/program (Зал GenAI)
🔺 LLM-митап в Питере
Тут со мной поделились ссылкой на митап в Питере. Выглядит прикольно, решил поддержать ребят информационно.
Бросается в глаза выступлениегосподина Сергея Николенко, автора первой книжки про машинное обучение, которую я прочитал («Глубокое обучение. Погружение в мир нейронных сетей»). Будет еще несколько докладов про LLM в математике.
Проходит все в баре неподалеку от Исаакиевского❤️
🔸 Обещают развлечения:
• Квиз против LLM от Сергея Николенко
• LLM math frontier: где граница рассуждающих возможностей?
• VibeCoding: творческое программирование!
• AI Safety Challenge: сможете ли вы обойти защиту модели?
🔸 5 июля (сб) в 17:00
👉 https://www.group-telegram.com/csspace/94
Тут со мной поделились ссылкой на митап в Питере. Выглядит прикольно, решил поддержать ребят информационно.
Бросается в глаза выступление
Проходит все в баре неподалеку от Исаакиевского
🔸 Обещают развлечения:
• Квиз против LLM от Сергея Николенко
• LLM math frontier: где граница рассуждающих возможностей?
• VibeCoding: творческое программирование!
• AI Safety Challenge: сможете ли вы обойти защиту модели?
🔸 5 июля (сб) в 17:00
👉 https://www.group-telegram.com/csspace/94
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
CS Space
Митап: LLM в математике и алгоритмах ⤵️
Развитие и внедрение рассуждающих языковых моделей всё больше влияет на фундаментальные области науки, образования и индустрии. Мы приглашаем исследователей, математиков и алгоритмистов, интересующихся, как LLM справляются…
Развитие и внедрение рассуждающих языковых моделей всё больше влияет на фундаментальные области науки, образования и индустрии. Мы приглашаем исследователей, математиков и алгоритмистов, интересующихся, как LLM справляются…
#gemini_cli
Накидал простой MCP сервер и прописал его в settings.json gemini cli.
Теперь он умеет ходить по проекту, рисовать по нему постеры, комиксы и т.д. и вставлять их readme.
Накидал простой MCP сервер и прописал его в settings.json gemini cli.
Теперь он умеет ходить по проекту, рисовать по нему постеры, комиксы и т.д. и вставлять их readme.
Forwarded from Вселенная Плюс
ПРЕМЬЕРА НОВОГО ВЫПУСКА НА КАНАЛЕ «ВСЕЛЕННАЯ ПЛЮС».
Искусственный интеллект решает задачи лучше или хуже мозга?
Способен ли он думать, как мы?
И возможно ли восстание нейросетей?
Обсуждают физик Алексей Семихатов, астроном Владимир Сурдин и специалист в области машинного обучения и директор по развитию технологий ИИ в Сбере Сергей Марков.
Ставьте лайк под видео (если Вы за людей) или дизлайк (если Вы за машины) и смотрите:
https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg
Искусственный интеллект решает задачи лучше или хуже мозга?
Способен ли он думать, как мы?
И возможно ли восстание нейросетей?
Обсуждают физик Алексей Семихатов, астроном Владимир Сурдин и специалист в области машинного обучения и директор по развитию технологий ИИ в Сбере Сергей Марков.
Ставьте лайк под видео (если Вы за людей) или дизлайк (если Вы за машины) и смотрите:
https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg
https://www.youtube.com/watch?v=WrmW_d5NHOg
YouTube
МОЗГ ПРОТИВ НЕЙРОСЕТЕЙ. КТО УМНЕЕ? Семихатов, Сурдин, Марков
Поступай в магистратуру в Центральном университете — https://l.tbank.ru/vselennayajun
Подключайся к семейной группе от МТС - https://l.mts.ru/tlc_vselennayaplus
Искусственный интеллект решает задачи лучше или хуже мозга? Способен ли он думать как мы? И…
Подключайся к семейной группе от МТС - https://l.mts.ru/tlc_vselennayaplus
Искусственный интеллект решает задачи лучше или хуже мозга? Способен ли он думать как мы? И…
Forwarded from ̶с̶а̶м̶̶о̶изолента мёбиуса
Мы тут обновили датасет FLORES+ до версии 3.0, вмёржив ряд правок, накопившихся за последние месяцы:
1) Добавили ладинский язык, на котором говорят в районе Доломитовых Альп. Он выглядит похоже на итальянский с лёгким вайбом французского и немецкого, и там есть буквы öëü 🙃
2) Обновили орфографию для чувашского и даргинского (там прежде было много случаев использования латинских букв, например, Ă и I, вместо похоже выглядящих кириллических Ӑ и Ӏ*).
3) Обновили номера предложений для аранского диалекта (это вариант окситанского языка, на котором говорят в одной долине в Пиренеях); прежде они неправильно сопоставлялись с предложениями на других языках.
С ладинским, в датасете теперь 222 различных вариаций языков, и можно оценивать качество перевода с любого на любой**!
Ну и да, мы всё ещё предлагаем добавлять новые языки и отправлять статью про это на нашу shared task.
А ещё мы завели substack, поэтому, если вы хотите получать новости о FLORES и других мультиязычных датасетах на электронную почту (на английском), то подписывайтесь на https://openlanguagedata.substack.com 😎
* Для тех, кто не знаком с северокавказскими языками: буква Ӏ обозначает горловой звук (разный в разных языках) и носит официальное название CYRILLIC LETTER PALOCHKA.
** Ну, почти. Датасет состоит из двух сплитов,
1) Добавили ладинский язык, на котором говорят в районе Доломитовых Альп. Он выглядит похоже на итальянский с лёгким вайбом французского и немецкого, и там есть буквы öëü 🙃
2) Обновили орфографию для чувашского и даргинского (там прежде было много случаев использования латинских букв, например, Ă и I, вместо похоже выглядящих кириллических Ӑ и Ӏ*).
3) Обновили номера предложений для аранского диалекта (это вариант окситанского языка, на котором говорят в одной долине в Пиренеях); прежде они неправильно сопоставлялись с предложениями на других языках.
С ладинским, в датасете теперь 222 различных вариаций языков, и можно оценивать качество перевода с любого на любой**!
Ну и да, мы всё ещё предлагаем добавлять новые языки и отправлять статью про это на нашу shared task.
А ещё мы завели substack, поэтому, если вы хотите получать новости о FLORES и других мультиязычных датасетах на электронную почту (на английском), то подписывайтесь на https://openlanguagedata.substack.com 😎
* Для тех, кто не знаком с северокавказскими языками: буква Ӏ обозначает горловой звук (разный в разных языках) и носит официальное название CYRILLIC LETTER PALOCHKA.
** Ну, почти. Датасет состоит из двух сплитов,
dev
и devtest
, и небольшое число языков есть только в одном из сплитов. Но большая часть - в обоих.Прочитал тут, что Anthropic для обучения своих моделей заморочился и скупил миллионы бумажных книг, порезал их на страницы, отсканил, а потом уничтожил.
С купленной тобой бумажной книгой можно делать все, что угодно, в том числе и модели обучать, так что типа все законно.
https://www.reddit.com/r/singularity/comments/1ljs8np/anthropic_purchased_millions_of_physical_print/
С купленной тобой бумажной книгой можно делать все, что угодно, в том числе и модели обучать, так что типа все законно.
https://www.reddit.com/r/singularity/comments/1ljs8np/anthropic_purchased_millions_of_physical_print/
Reddit
From the singularity community on Reddit: Anthropic purchased millions of physical print books to digitally scan them for Claude
Explore this post and more from the singularity community
Заметил, что с использованием агентов в разработке у меня появляется отторжение к ручному выполнению простых муторных задач, которые я раньше просто брал и делал.
То ли я обленился, то ли тупею, то ли всего понемножку.
//Пишу этот пост пока курсор прокидывает поля с бэкенда на фронтенд.
То ли я обленился, то ли тупею, то ли всего понемножку.
//Пишу этот пост пока курсор прокидывает поля с бэкенда на фронтенд.