Перси Лианг, действующий преподаватель Стэнфорда, опубликовал подробный технический отчёт о том, как они с командой обучали модель Marin 8B с нуля. По словам Перси, их модель даже превзошла Llama 3.1 8B 📃
Отчет примечателен тем, что ребята честно говорили о своих ошибках в обучении и о том, как они решались, например, то как ребята решили проблему с увеличением потерь с помощью добавления z-loss.
Отчет примечателен тем, что ребята честно говорили о своих ошибках в обучении и о том, как они решались, например, то как ребята решили проблему с увеличением потерь с помощью добавления z-loss.
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Engineer в Иннотех
Офис / Гибрид / Удаленно в Екатеринбурге
Предстоит: Расчет метрик качества моделей для оценки их деградации; Оценка экономических эффектов работы моделей и влияния на портфель; Разработка новых методов оценки качества ML-моделей... Узнать подробнее🔵
Офис / Гибрид / Удаленно в Екатеринбурге
Предстоит: Расчет метрик качества моделей для оценки их деградации; Оценка экономических эффектов работы моделей и влияния на портфель; Разработка новых методов оценки качества ML-моделей... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Analyst в WIT REC
От 4.000 до 5.000$
После релокации — офис
Предстоит: Анализ клиентского пути (воронка, UX, KPI); Построение стратегий коммуникации (email, push, sms); Оптимизация затрат (CPL, Retention, DCPL и др.); Разработка дашбордов в Power BI... Узнать подробнее🔵
От 4.000 до 5.000$
После релокации — офис
Предстоит: Анализ клиентского пути (воронка, UX, KPI); Построение стратегий коммуникации (email, push, sms); Оптимизация затрат (CPL, Retention, DCPL и др.); Разработка дашбордов в Power BI... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
150 000 ₽ за рекомендацию senior-специалиста — Ozon Tech запускает программу для тех, кто знает сильных Data Science-экспертов. Если в вашем окружении есть такие, предложите им присоединиться к команде одного из лидеров e-com.
Как это работает?
✅ Рекомендовать может любой человек (кроме сотрудников Ozon, для них своя программа), даже рекрутеры.
✅ За каждого друга, успешно прошедшего испытательный срок, вы получите вознаграждение.
✅ Количество рекомендаций не ограничено — отправляйте столько кандидатов, сколько считаете нужными.
🔗 Отличный способ помочь другу с карьерой и заработать! За какие вакансии платят? Узнать подробнее 🔵
Как это работает?
✅ Рекомендовать может любой человек (кроме сотрудников Ozon, для них своя программа), даже рекрутеры.
✅ За каждого друга, успешно прошедшего испытательный срок, вы получите вознаграждение.
✅ Количество рекомендаций не ограничено — отправляйте столько кандидатов, сколько считаете нужными.
🔗 Отличный способ помочь другу с карьерой и заработать! За какие вакансии платят? Узнать подробнее 🔵
Data Analyst в Центральный Банк
От 190.000₽
Офис в Москве
Предстоит: Разработка и оптимизация автоматизированных алгоритмов выявления подозрительных и высокорисковых операций; Мониторинг и анализ качества применяемых скоринговых моделей... Узнать подробнее🔵
От 190.000₽
Офис в Москве
Предстоит: Разработка и оптимизация автоматизированных алгоритмов выявления подозрительных и высокорисковых операций; Мониторинг и анализ качества применяемых скоринговых моделей... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
ML-Разработчик в Prosegur
От 2.500$ До 3.500$
Удаленно
Предстоит: Разработка и доработка моделей детекции и трекинга объектов; Распознавание лиц, поз и действий в реальном времени; Оптимизация инференса под real-time, включая TPU/NPU... Узнать подробнее🔵
От 2.500$ До 3.500$
Удаленно
Предстоит: Разработка и доработка моделей детекции и трекинга объектов; Распознавание лиц, поз и действий в реальном времени; Оптимизация инференса под real-time, включая TPU/NPU... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Вам предстоит анализировать рост нагрузки на хранилище данных, искать узкие места и способы оптимизации хранения и использования данных, гарантировать работу пользователей при отключении одного ДЦ с минимальным влиянием на отклик, а также оптимизировать работу аналитических баз данных под характер нагрузки и объём трафика.
Что вас ждёт:
- интересные и важные задачи на очень крупном проекте
- передовые технологии и подходы, возможность пробовать новое
- опытные и заинтересованные коллеги, готовые оказать поддержку
- возможность приносить пользу миллионам пользователей, реализуя решения, основанные на данных
- личный бюджет на обучение, который можно тратить на книги, курсы и конференции
- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист
- возможность работать удалённо и по желанию посещать комфортный офис в Москве или Санкт-Петербурге.
Оставляйте отклики по ссылке!
Please open Telegram to view this post
VIEW IN TELEGRAM
Senior ML-Разработчик в Яндекс
Предстоит: участвовать в проработке решений для улучшения ранжирования, помогать сводить бизнес-требования к ML-задаче, разрабатывать и валидировать корректность работы ML-пайплайнов... Узнать подробнее🔵
Предстоит: участвовать в проработке решений для улучшения ранжирования, помогать сводить бизнес-требования к ML-задаче, разрабатывать и валидировать корректность работы ML-пайплайнов... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Есть два типа обучения Data Science.
1️⃣ Смотреть лекции и повторять за ментором.
2️⃣ Сразу брать реальные задачи и учиться на практике.
Если вам ближе второй тип, симулятор Data Science от karpovꓸcourses — для вас. Этот курс для тех, кто не ищет легких путей, и знает: на одной теории мидлом не стать.
Вас ждет интенсивное погружение в аналитику с первых дней.
🔹 Решите 80+ бизнес-задач — от простых и быстрых до заданий со звездочкой.
🔹 Поработаете над кейсами из разных сфер: Retail, E-commerce, FinTech, FoodTech, EdTech.
🔹 Создадите проект для портфолио под руководством опытным аналитиков.
🔹 Прокачаете самые нужные навыки и работу с инструментами: Python, SQL, ClickHouse, FastAPI, MLFlow, DVC, Spark, LLM, рекомендательные системы, прогнозирование, метрики, A/B-тесты.
С 12 по 31 мая записываться на обучение еще выгоднее. Если купите доступ на 6 месяцев, получите 7-ой — в подарок. А если на 9 месяцев — два в подарок.
Пора решать задачи, а не смотреть, как это делают другие.
Записаться на курс
Реклама. ООО «Карпов Курсы», ИНН: 7811764627, erid: 2Vtzqw5FhXr
1️⃣ Смотреть лекции и повторять за ментором.
2️⃣ Сразу брать реальные задачи и учиться на практике.
Если вам ближе второй тип, симулятор Data Science от karpovꓸcourses — для вас. Этот курс для тех, кто не ищет легких путей, и знает: на одной теории мидлом не стать.
Вас ждет интенсивное погружение в аналитику с первых дней.
🔹 Решите 80+ бизнес-задач — от простых и быстрых до заданий со звездочкой.
🔹 Поработаете над кейсами из разных сфер: Retail, E-commerce, FinTech, FoodTech, EdTech.
🔹 Создадите проект для портфолио под руководством опытным аналитиков.
🔹 Прокачаете самые нужные навыки и работу с инструментами: Python, SQL, ClickHouse, FastAPI, MLFlow, DVC, Spark, LLM, рекомендательные системы, прогнозирование, метрики, A/B-тесты.
С 12 по 31 мая записываться на обучение еще выгоднее. Если купите доступ на 6 месяцев, получите 7-ой — в подарок. А если на 9 месяцев — два в подарок.
Пора решать задачи, а не смотреть, как это делают другие.
Записаться на курс
Реклама. ООО «Карпов Курсы», ИНН: 7811764627, erid: 2Vtzqw5FhXr
Собрали небольшую подборку статей:
1️⃣ Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning
2️⃣ FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees
3️⃣ Self-Consistency Preference Optimization
4️⃣ Thinking LLMs: General Instruction Following with Thought Generation
Также будет полезным сохранить шпаргалку от Стенфорда — Transformers & LLMs cheatsheet
Также будет полезным сохранить шпаргалку от Стенфорда — Transformers & LLMs cheatsheet
Please open Telegram to view this post
VIEW IN TELEGRAM
CTO / Head of R&D в BlueCheese
Предстоит: Проектировать и выводить в продакшен core-pipeline нового AI-сервиса; Собрать и развивать команду LLM- и DevOps-инженеров... Узнать подробнее🔵
Предстоит: Проектировать и выводить в продакшен core-pipeline нового AI-сервиса; Собрать и развивать команду LLM- и DevOps-инженеров... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Создавай технологии, которые меняют рынок 💻
На AIFT учат не просто ИИ. Здесь создают людей, которые меняют финтех.
Магистратура от Сбера, РЭШ и Сколтеха — это экономика, финансы, машинное обучение, цифровой банкинг и реальный опыт.
Что ты получишь ⤵️
— проектную работу со Сбером
— самых сильных экспертов рынка
— доступ к инфраструктуре и карьерным возможностям
— стипендию и сразу два диплома
Поступай, пока набор открыт: до сентября 2025 👌
На AIFT учат не просто ИИ. Здесь создают людей, которые меняют финтех.
Магистратура от Сбера, РЭШ и Сколтеха — это экономика, финансы, машинное обучение, цифровой банкинг и реальный опыт.
Что ты получишь ⤵️
— проектную работу со Сбером
— самых сильных экспертов рынка
— доступ к инфраструктуре и карьерным возможностям
— стипендию и сразу два диплома
Поступай, пока набор открыт: до сентября 2025 👌
Открытые вакансии💼
Индийская компания в поисках Data Analysts:
➡️ Data Analyst Sr-Lead с релокацией в Индию - Гургаон
➡️ Data Analyst Jn-Md с релокацией в Индию - Гургаон
➡️ Data Analyst Md с релокацией во Вьетнам - Хошимин
На позиции аналитика Вас ждет: 60% анализ данных, 10% визуализация данных, 30% бизнес анализ.
Компания рассматривает ЗП пожелания кандидатов.
Индийская компания в поисках Data Analysts:
На позиции аналитика Вас ждет: 60% анализ данных, 10% визуализация данных, 30% бизнес анализ.
Компания рассматривает ЗП пожелания кандидатов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Джунам все тяжелее находить работу: новое исследование показывает, что ИИ сокращает количество мест начального уровня
🔷 Компания SignalFire, отслеживающая перемещения более 600 млн сотрудников и 80 млн компаний на LinkedIn, недавно опубликовала отчёт, в котором говорится, что в 2024 году компании наняли меньше выпускников, чем в 2023 году. При этом технологические компании увеличили найм опытных специалистов.
🔷 SignalFire обнаружила, что крупные компании сократили найм выпускников на 25% в 2024 году по сравнению с 2023 годом, а набор выпускников в стартапы сократился на 11% по сравнению с предыдущим годом.
🔷 В то же время крупные технологические компании увеличили найм специалистов с опытом работы от двух до пяти лет на 27%, а стартапы – на 14%.
🔷 При этом, если верить The New York Times: то уровень безработицы среди выпускников колледжей вырос на 30% с сентября 2022 года, в то время как среди всех работников этот показатель вырос на 18%.
Джуны не отчаиваетесь, в NYT также пишут, что во многих компаниях появились новые возможности и задачи для начинающих специалистов, которые раньше поручали более опытным сотрудникам, но благодаря ИИ со сложными задачами могут справиться и джуны👍
Джуны не отчаиваетесь, в NYT также пишут, что во многих компаниях появились новые возможности и задачи для начинающих специалистов, которые раньше поручали более опытным сотрудникам, но благодаря ИИ со сложными задачами могут справиться и джуны
Please open Telegram to view this post
VIEW IN TELEGRAM
Подборка открытых вакансий 🔵
Data Scientist в HomeBuddy
Eastern Europe (remote)
Senior Data Scientist в НЛМК
Удаленно / Офис / Гибрид в Липецке
Middle/Senior Data Engineer в VK Team
Офис / Гибрид
Middle Data Analyst в СовкомБанк
Офис в Москве
Senior Data Scientist в ЦИАН
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге и Новосибирске
Data Scientist в HomeBuddy
Eastern Europe (remote)
Senior Data Scientist в НЛМК
Удаленно / Офис / Гибрид в Липецке
Middle/Senior Data Engineer в VK Team
Офис / Гибрид
Middle Data Analyst в СовкомБанк
Офис в Москве
Senior Data Scientist в ЦИАН
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге и Новосибирске
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯 Грустный факт: 90% дата-сайентистов тратят больше времени на очистку данных, чем на сам анализ.
А знаете, что еще хуже? Даже после всей этой работы модель может не показать хороших метрик.
❓Когда последний раз вы:
— Объясняли, почему результаты модели зависят от качества данных, а не только от самой модели?
— Оптимизировали код, но модель всё равно не показывала нужных метрик и работала медленно?
— Тратили время на изучение нового инструмента, а он уже успел устареть?
Чтобы стать востребованным специалистом и быстро решать реальные проблемы DS, подписывайтесь на Библиотеку Data Science.
Там публикуют только годный контент:
→ Шпаргалки по работе с популярными библиотеками
→ Лайфхаки для оптимизации кода и моделей
→ Мемы, которые поймут только настоящие дата-сайентисты
➡️ Подписывайтесь, чтобы прокачать скиллы: @dsproglib
P.S. В закрепе канала — шпаргалка по структурированию проектов Data Science, которая сэкономит вам часы работы.
Реклама. ИП Дрёмов Артём Сергеевич, ИНН 771391651571. Erid 2VtzqwE4VHw
А знаете, что еще хуже? Даже после всей этой работы модель может не показать хороших метрик.
❓Когда последний раз вы:
— Объясняли, почему результаты модели зависят от качества данных, а не только от самой модели?
— Оптимизировали код, но модель всё равно не показывала нужных метрик и работала медленно?
— Тратили время на изучение нового инструмента, а он уже успел устареть?
Чтобы стать востребованным специалистом и быстро решать реальные проблемы DS, подписывайтесь на Библиотеку Data Science.
Там публикуют только годный контент:
→ Шпаргалки по работе с популярными библиотеками
→ Лайфхаки для оптимизации кода и моделей
→ Мемы, которые поймут только настоящие дата-сайентисты
P.S. В закрепе канала — шпаргалка по структурированию проектов Data Science, которая сэкономит вам часы работы.
Реклама. ИП Дрёмов Артём Сергеевич, ИНН 771391651571. Erid 2VtzqwE4VHw
Please open Telegram to view this post
VIEW IN TELEGRAM