Telegram Group Search
Большие данные — большие возможности

Без Big Data («больших данных») сегодня не обходится ни один крупный бизнес. Информация поступает из разных источников: быстро, в огромных объёмах и в самых разных форматах.

Большие данные помогают находить закономерности, видеть риски заранее и понимать, что происходит с клиентами, процессами и продуктами.

Мы разобрали по шагам: что такое Big Data и где она применяется. Читай в карточках →

Какие у тебя отношения с большими данными?
🏆 Я в Big Data — как рыба в воде
🔥 Знаю основы, продолжаю развивать свои скиллы
🤔 Тема интересная, но в работе пока не пригодилась
👍 Хочу разобраться и применять в своей сфере


#полезное@pmiru_job

@pmiru_job | Твоя история — в твоих руках
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Как написать научную статью так, чтобы её приняли к публикации. Заключительная часть 3.

Надеемся, вы еще не успели забыть, как в прошлые разы делились своей находкой — один из научных энтузиастов рассказывал о своих лайфхаках: как правильно оформлять научные работы и как ему удалось поднять оценки с 2 баллов до 4,5. Сегодня мы делимся последними советами:

1️⃣ Мы уже достаточно много рассказали об иллюстрациях, тем не менее, напоминаем, что они должны быть яркими и презентабельными. Но тут не все так просто, многие из нас могут увлечься и сделать картинки или схемы слишком громоздкими 😟

Если у вас, как и у автора, получаются слишком объемные схемы — сократите! На примере первой картинки в посте: декодеры и энкодеры были заменены на зеленые и красные цвета соответственно. Архитектура стала более читаемой, а об остальных особенностях, не учтенных на картинке, автор написал в основном тексте.

Совет. Некоторым исследователям почему-то нравится подолгу держать интригу и скрывать самую интересную информацию для читателя. Но многим такой подход не нравится. Поэтому не скрывайте информацию, которая кажется вам интересной в вашей работе. Читателям нравится узнавать всё как можно раньше и чаще.

2️⃣ Примеры — хорошо. Много примеров — плохо. Исследователи часто пренебрегают примерами того, что они улучшили, но есть и обратная сторона медали — это их обилие. Чтобы легче было понять, сколько примеров привести, подойдет правило 2/3. То есть одна треть листа — это примеры, а остальная часть — основной текст. См вторую пикчу в посте.

3️⃣ Избегаем того, что может не понравиться рецензистам. Самые внимательные вспомнят, что уже говорили об этом в первой части. Но это действительно важный нюанс. Из обычных причин, почему вашу работу могут не принять: отсутствие исходных данных, отсутствие абляции и отсутствие человеческой оценки. При этом также не стоит перебарщивать с большим количеством абляций. См третью и четвертые пикчи.

Совет. Вы могли заметить, что на четвертой картинке некоторые результаты выделены полужирным шрифтом, так вот — не забывайте проводить тесты на статистическую значимость. Выделение высоких результатов без соответствующих тестов — дурной тон.

4️⃣ Заключение. Чтобы написать часть с выводом, вспомните советы из аннотации и введения, а также воспользуйтесь тремя вопросами:
Что мы сделали?
Почему это здорово?
Почему это важно?

Совет. Исследовательские работы — это акты коммуникации. И вся наука — это тоже коммуникация между учеными. То, как вы "общаетесь" в своей работе с читателем, определяет ценность вашего исследования. Если вы неинтересно расскажете о своей работе, значит, с высокой вероятностью рецензенты подумают также, но если читатель смог взять для себя хотя бы одну новую идею, то это уже огромное дело!

Надеемся, что с этими советами ваши статьи будут публиковаться чаще ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
AIRI и Авито поддержит молодых ученых в области ИИ и предложит разработать решения для классифайда

Научный институт AIRI специализируется на фундаментальных и прикладных исследованиях в области искусственного интеллекта. Ежегодно институт поддерживает молодых ученых и студентов, организует лекции с экспертами и интенсивные курсы в рамках Летней школы по искусственному интеллекту.

В этом году Летняя школа проходит на базе Томского государственного университета при поддержке Авито. Участники будут решать различные задания, в том числе реальный бизнес-кейс Авито, а лучшие решения могут быть внедрены на практике.

Помимо работы над бизнес-задачами, студенты получат карьерные консультации от HR-специалистов Авито и научатся презентовать свои навыки в соответствии с требованиями рынка. Ранее Авито анонсировал, что в планах компании до 2028 года инвестировать до 12 млрд рублей в GenAI и подготовить 3000 специалистов этой области.
Senior MLOps в Самолет
Удаленно

Предстоит: Участие в построении MLOps-процессов на всех этапах: проектирование, разработка и эксплуатация; Развитие пайплайнов поставки моделей в промышленную эксплуатацию... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Мира Мурати в погоне за талантами: сколько получают сотрудники секретного стартапа?

🔷 В Thinking Machines Lab — секретном стартапе бывшей сооучредительницы OpenAI Миры Мурати тех.специалисты получают от 450.000 до 500.000$ в год.

🔷 При этом это только базовая зарплата, без учета всех бонусов, акций и премий. По примерным подсчетам, средняя зарплата в стартапе у Мурати выше, чем у ее бывших коллег.

🔷 OpenAI платит в среднем 292.115$ своим 29 техническим сотрудникам, при этом самая высокооплачиваемая должность приносит 530.000$, а самая низкооплачиваемая — 200.000$.

🔷 Anthropic платит в среднем 387.500$ 14 техническим сотрудникам, при этом самая высокая зарплата составляет 690.000$, самая низкая — 300.000$.

🔷 Также известно, что в начале этого года компания TML устроила массовый набор сотрудников, наняв Боба МакГрю (бывшего главного научного сотрудника OpenAI), Джона Шульмана (одного из руководителей ChatGPT), Баррета Зофа (одного из создателей ChatGPT) и Александра Кириллова, который тесно сотрудничал с Мурати над голосовым режимом ChatGPT.

Как бы Цукерберг не нацелился на таланты Мурати 😰
Please open Telegram to view this post
VIEW IN TELEGRAM
Подборка открытых вакансий 🔵

Data Engineer в НМГ
Удаленно / Офис / Гибрид

Data Analyst в Сбер
От 95.000₽
Офис в Омске

Middle Data Analyst в Автомакон
До 250.000₽
Удаленно

Senior Data Analyst в Атом
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге, Набережных Челнах

Senior Data Engineer в ПСБ
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
Куда бы сходить в июле? 🚀

Собрали небольшую подборку июльских мероприятий:

Java meetup. Ребята из VK AI расскажут как они масштабировали item2item и как обновляют тысячи эмбеддингов, при этом сократив потребление сети. Очень полезный митап для любителей рексис.
Когда? 9 июля 18:30.
Где? Онлайн и офлайн в Москве.


Алхимия ИИ. На вебинаре вам расскажут, что же такое нейронные сети, где их используют в промышленности и самое интересное — объяснят, где ИИ помогает в роботехнике, зачем же работу зрение.
Когда? 10 июля 19:00.

Turbo ML Conf. Программа конференции очень разнообразна, обсудят и как применять LLM для генерации музыки, и как улучшать рекомендации. А спикерами выступят не только специалисты из различных компаний, но и преподаватели ВУЗ-ов.
Когда? 19 июля.
Где? Онлайн и офлайн в Москве.


Cloud.ru Tech Lab: AI&ML. На митапе эксперты из Cloud.ru расскажут, как они автоматизировали пользовательские сценарии с помощью ИИ-агентов, а также приоткроют завесу тайн и ответят на вопрос, почему же MCP на такой хайпе и как собрать своей MCP-сервер без кода. При этом будет еще один секретный доклад.
Когда? 24 июля в 18:00.
Где? Онлайн и офлайн в Москве.
Please open Telegram to view this post
VIEW IN TELEGRAM
AI Engineer
Удаленно (обязательно вне РФ и РБ)

Предстоит: Проектирование и разработка PoC; участие в подготовке презентаций и технической части коммерческих предложений преимущественно для зарубежных клиентов (различные отрасли, включая HealthTech, EdTech, маркетплейсы и многое другое)... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Junior+ Data Analyst в Wildberries
Офис / Гибрид в Москве

Предстоит: Поиск аномалий в данных; Генерация и проверка гипотез; Написание скриптов поиска фродовых действий... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Assaia is looking for employees 💼

Assaia’s solutions help airports and airlines improve on-time performance, efficiency, safety, and sustainability metrics, helping them get their passengers to their destinations on time.

Assaia has the following vacancies:

➡️ Data Scientist
From 4.500€

Remote (you should be based outside Russia and Belarus)


➡️ CV Engineer
3.500 - 4.500€

Remote (you should be based outside Russia and Belarus)


Additionally, they offer:
- Always remote work and flexible schedule.
- 5 weeks of paid vacation, paid sick leave, paid relevant courses and conferences/online education/English courses.
- Regular performance reviews to make sure you enjoy your tasks, challenges, growth and salary.
- Flat hierarchy and close to zero bureaucracy, a diverse international team of smart people.
- Live team events in Europe.
Please open Telegram to view this post
VIEW IN TELEGRAM
Cross Entropy

Это одна из фундаментальных тем глубокого обучения, поэтому часто на технических собеседованиях можно встретить вопрос, связанный с кросс-энтропией.

Чтобы досконально изучить эту тему, предлагаем прочесть эту статью. Нам она понравилась тем, что автор приводит много примеров и пояснений, а еще в разборе есть вопросы на подумать с подробным объяснением каждого ответа.
Data Scientist
Удаленно

Предстоит: Разработка и дообучение LLM; Создание и оптимизация RAG-систем; Разработка, обучение и внедрение моделей машинного обучения в связке с LLM... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/04 07:42:19
Back to Top
HTML Embed Code: