Telegram Group & Telegram Channel
Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест
👍12



group-telegram.com/thisisdata/236
Create:
Last Update:

Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест

BY This is Data




Share with your friend now:
group-telegram.com/thisisdata/236

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Ukrainian President Volodymyr Zelensky said in a video message on Tuesday that Ukrainian forces "destroy the invaders wherever we can." Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number. The Securities and Exchange Board of India (Sebi) had carried out a similar exercise in 2017 in a matter related to circulation of messages through WhatsApp. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. On Telegram’s website, it says that Pavel Durov “supports Telegram financially and ideologically while Nikolai (Duvov)’s input is technological.” Currently, the Telegram team is based in Dubai, having moved around from Berlin, London and Singapore after departing Russia. Meanwhile, the company which owns Telegram is registered in the British Virgin Islands.
from es


Telegram This is Data
FROM American