Telegram Group & Telegram Channel
Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест
👍12



group-telegram.com/thisisdata/236
Create:
Last Update:

Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест

BY This is Data




Share with your friend now:
group-telegram.com/thisisdata/236

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities. He said that since his platform does not have the capacity to check all channels, it may restrict some in Russia and Ukraine "for the duration of the conflict," but then reversed course hours later after many users complained that Telegram was an important source of information. This provided opportunity to their linked entities to offload their shares at higher prices and make significant profits at the cost of unsuspecting retail investors. But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals.
from us


Telegram This is Data
FROM American