Telegram Group & Telegram Channel
Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест
👍12



group-telegram.com/thisisdata/236
Create:
Last Update:

Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест

BY This is Data




Share with your friend now:
group-telegram.com/thisisdata/236

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Again, in contrast to Facebook, Google and Twitter, Telegram's founder Pavel Durov runs his company in relative secrecy from Dubai. In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look. The perpetrators use various names to carry out the investment scams. They may also impersonate or clone licensed capital market intermediaries by using the names, logos, credentials, websites and other details of the legitimate entities to promote the illegal schemes. Messages are not fully encrypted by default. That means the company could, in theory, access the content of the messages, or be forced to hand over the data at the request of a government. He floated the idea of restricting the use of Telegram in Ukraine and Russia, a suggestion that was met with fierce opposition from users. Shortly after, Durov backed off the idea.
from id


Telegram This is Data
FROM American