Telegram Group & Telegram Channel
❤️ Эксперты в Telegram: тематический анализ, лексическая сложность и тональность

«Полилог. Экспертиза» продолжает серию мини-исследований, посвящённых телеграм-каналам публичных экспертов. Ранее мы расположили каналы на политических координатах при помощи ChatGPT 4o и провели количественное исследование, посчитав аудиторию, средние просмотры, репосты и объём контента авторов. На этот раз с помощью методов ML и NLP мы оценили темы, тональность и лексическую сложность публикаций.

Методология

Из 40 каналов публичных экспертов мы спарсили публикации за 3 года (июнь 2022 — июнь 2025) и для повышения качества моделей отфильтровали тексты в 100 и более слов (51 тысяча*). Репосты были исключены — при подсчетах рассматривались только посты, написанные от лица канала. Основные результаты представлены на карточках, подробную информацию по каждому из каналов можно найти в общей таблице (бонус — средняя токсичность постов).

🎯 Форматы и эмодзи. Эксперты предпочитают текстовые сообщения и публикации с фото. Видео-контент занимает менее 10%, а голосовые сообщения и кружки — менее 0,1%. Эмодзи, как правило, используются для оформления контента — лидерами по частоте их использования стали «Полилог. Экспертиза» и Михаил Фаленков.

🎯 Сложность. Средняя сложность коммуникации оценивалась по адаптированному для русского языка индексу туманности Ганнинга. Значение индекса можно интерпретировать как количество лет обучения, которые необходимы для понимания текста. Важный момент: оцениваются лексика и синтаксис, но не поднимаемые темы. Навык донесения сложной информации простым языком лучше всего развит у Сергея Маркова — тексты на его канале могут понять даже шестиклассники.

🎯 Тональность. Для оценки тональности мы воспользовались моделью RuBERT-tiny2, дообученной для классификации коротких русскоязычных текстов: «позитивные», «негативные» и «нейтральные». Средняя «эмоциональность» рассчитывалась как сумма долей «позитивных» и «негативных» текстов. Лидером позитивной коммуникации стала Дарья Кислицына (49% публикаций), негативной — Сергей Марков (49%). Наиболее нейтральный стиль — у Романа Моложона (79%) и Павла Склянчука (77%).

🎯 Темы. Для оценки тематики публикаций мы разбили выборку на три части (по ключевым словам) и обучили LDA-модели с 20 скрытыми темами. Каждая из 60 скрытых тем интерпретировалась вручную, пополняя две категории: «Теория, история, исследования» и «Актуальная повестка». Лидерами в первой категории стали Political Animals (65% публикаций) и Павел Пряников (44%). Наиболее актуальный контент публикует Максим Жаров (98,3% текстов).

🎯 Кластерный анализ. Категория «Актуальная повестка» включает шесть направлений, представленных на тематическом гексагоне. Мы воспользовались методом k-средних и выделили пять групп экспертов. Авторы из Кластера I пишут о выборах и внутренней политике в зарубежных странах. Кластер II фокусируется на партийной повестке в России. Кластер III — на внутренней политике в РФ. Кластер V — на геополитике и украинском конфликте. А эксперты из Кластера IV в равной мере обращаются ко всем темам.

Кластер I: Ян Веселов, Павел Дубравский, Мирильяс Агаев.

Кластер II: Михаил Фаленков, «Процедуры и ритуалы», Павел Склянчук, Татьяна Косачёва, Андрей Цепелев, Роман Моложон.

Кластер III: «Трезвый политолог», Александр Семёнов, Дмитрий Еловский, Сергей Старовойтов, Станислав Корякин, Илья Гращенков, Наталия Елисеева, Мария Сергеева, Никита Сетов, Анна Федорова, Дарья Кислицына, Макар Вихлянцев, Алексей Чадаев, Павел Пряников.

Кластер IV: «Полилог. Экспертиза», Евгений Минченко, Глеб Кузнецов, Анна Богачёва, Ярослав Игнатовский, Михаил Виноградов, Валерий Прохоров, Political Animals, Марат Баширов, Алексей Ярошенко, Михаил Карягин.

Кластер V: Алексей Мартынов, Алексей Чеснаков, Павел Данилин, Игорь Димитриев, Максим Жаров, Сергей Марков.

*Для оценки форматов публикаций, эмодзи и сложности текстов использовалась полная выборка за 1 год (44 тысячи текстов).

Полилог. Экспертиза | Наши слоны
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/polylog_expertise/3271
Create:
Last Update:

❤️ Эксперты в Telegram: тематический анализ, лексическая сложность и тональность

«Полилог. Экспертиза» продолжает серию мини-исследований, посвящённых телеграм-каналам публичных экспертов. Ранее мы расположили каналы на политических координатах при помощи ChatGPT 4o и провели количественное исследование, посчитав аудиторию, средние просмотры, репосты и объём контента авторов. На этот раз с помощью методов ML и NLP мы оценили темы, тональность и лексическую сложность публикаций.

Методология

Из 40 каналов публичных экспертов мы спарсили публикации за 3 года (июнь 2022 — июнь 2025) и для повышения качества моделей отфильтровали тексты в 100 и более слов (51 тысяча*). Репосты были исключены — при подсчетах рассматривались только посты, написанные от лица канала. Основные результаты представлены на карточках, подробную информацию по каждому из каналов можно найти в общей таблице (бонус — средняя токсичность постов).

🎯 Форматы и эмодзи. Эксперты предпочитают текстовые сообщения и публикации с фото. Видео-контент занимает менее 10%, а голосовые сообщения и кружки — менее 0,1%. Эмодзи, как правило, используются для оформления контента — лидерами по частоте их использования стали «Полилог. Экспертиза» и Михаил Фаленков.

🎯 Сложность. Средняя сложность коммуникации оценивалась по адаптированному для русского языка индексу туманности Ганнинга. Значение индекса можно интерпретировать как количество лет обучения, которые необходимы для понимания текста. Важный момент: оцениваются лексика и синтаксис, но не поднимаемые темы. Навык донесения сложной информации простым языком лучше всего развит у Сергея Маркова — тексты на его канале могут понять даже шестиклассники.

🎯 Тональность. Для оценки тональности мы воспользовались моделью RuBERT-tiny2, дообученной для классификации коротких русскоязычных текстов: «позитивные», «негативные» и «нейтральные». Средняя «эмоциональность» рассчитывалась как сумма долей «позитивных» и «негативных» текстов. Лидером позитивной коммуникации стала Дарья Кислицына (49% публикаций), негативной — Сергей Марков (49%). Наиболее нейтральный стиль — у Романа Моложона (79%) и Павла Склянчука (77%).

🎯 Темы. Для оценки тематики публикаций мы разбили выборку на три части (по ключевым словам) и обучили LDA-модели с 20 скрытыми темами. Каждая из 60 скрытых тем интерпретировалась вручную, пополняя две категории: «Теория, история, исследования» и «Актуальная повестка». Лидерами в первой категории стали Political Animals (65% публикаций) и Павел Пряников (44%). Наиболее актуальный контент публикует Максим Жаров (98,3% текстов).

🎯 Кластерный анализ. Категория «Актуальная повестка» включает шесть направлений, представленных на тематическом гексагоне. Мы воспользовались методом k-средних и выделили пять групп экспертов. Авторы из Кластера I пишут о выборах и внутренней политике в зарубежных странах. Кластер II фокусируется на партийной повестке в России. Кластер III — на внутренней политике в РФ. Кластер V — на геополитике и украинском конфликте. А эксперты из Кластера IV в равной мере обращаются ко всем темам.

Кластер I: Ян Веселов, Павел Дубравский, Мирильяс Агаев.

Кластер II: Михаил Фаленков, «Процедуры и ритуалы», Павел Склянчук, Татьяна Косачёва, Андрей Цепелев, Роман Моложон.

Кластер III: «Трезвый политолог», Александр Семёнов, Дмитрий Еловский, Сергей Старовойтов, Станислав Корякин, Илья Гращенков, Наталия Елисеева, Мария Сергеева, Никита Сетов, Анна Федорова, Дарья Кислицына, Макар Вихлянцев, Алексей Чадаев, Павел Пряников.

Кластер IV: «Полилог. Экспертиза», Евгений Минченко, Глеб Кузнецов, Анна Богачёва, Ярослав Игнатовский, Михаил Виноградов, Валерий Прохоров, Political Animals, Марат Баширов, Алексей Ярошенко, Михаил Карягин.

Кластер V: Алексей Мартынов, Алексей Чеснаков, Павел Данилин, Игорь Димитриев, Максим Жаров, Сергей Марков.

*Для оценки форматов публикаций, эмодзи и сложности текстов использовалась полная выборка за 1 год (44 тысячи текстов).

Полилог. Экспертиза | Наши слоны

BY Полилог. Экспертиза









Share with your friend now:
group-telegram.com/polylog_expertise/3271

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Some privacy experts say Telegram is not secure enough But Telegram says people want to keep their chat history when they get a new phone, and they like having a data backup that will sync their chats across multiple devices. And that is why they let people choose whether they want their messages to be encrypted or not. When not turned on, though, chats are stored on Telegram's services, which are scattered throughout the world. But it has "disclosed 0 bytes of user data to third parties, including governments," Telegram states on its website. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts. "There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee.
from us


Telegram Полилог. Экспертиза
FROM American