group-telegram.com/causal_channel/136
Last Update:
Откуда - не скажу, а куда - не знаю сам
Мы очень любим исследования и в честь нашего любимого канала и подписчиков решили сделать мини-рисеч! Но со следующей недели уже вернемся к нашему привычному формату
Мы давно задавались вопросом, какие по размеру посты лучше писать -- более короткие или лонгриды (даже советовались с друзьями)
А сейчас у нас накопились данные, чтобы проверить, стоит ли писать "многабукав":
Тут мы можем столкнуться с так называемыми ложными корреляциями (spurious correlations) -- ложными или случайными взаимосвязями между двумя переменными, которые не обусловлены причинно-следственной связью, а возникает из-за третьего фактора (общей причины), совпадения или ошибки в данных. Есть много смешных примеров ложных корреляций -- подзалипнуть можно на сайте Tyler Vigen
Если мы представим, что длина поста - это тритмент, и нарисуем исследуемую ситуацию как направленный ациклический граф (directed acyclical graph - DAG), то между переменной интереса и ауткамом будут следующие пути (рисунок
Тогда согласно backdoor criterion / adjustment citerion, для идентификации необходимо проконтролировать на время (возраст поста) и/или число подписчиков. На рисунке регрессия с контролем на время (возраст поста). Позже мы еще вернемся к теме идентификации эффектов, а пока рекомендуем посмотреть посты -- 1, 2, 3
Это рабочая версия: предложить свой DAG вы можете в комментариях
Главная мораль, которую мы хотели подсветить -- при контроле на альтернативный канал влияния через время / число подписчиков (они очень коррелированы), связь числа реакций и длины текста становится менее явная. Мы не будем интерпретировать полученную регрессию как эффект воздействия, потому что у такой оценки есть множество уязвимостей. А еще наша переменная интереса не бинарная -- как строить оценки в случае непрерывных переменных воздействия мы расскажем в ближайших постах. Но при этом нам хочется верить, что наблюдаемая связь может быть результатом того, что мы стали лучше писать (очень надеемся) или что вам и правда нравятся более длинные посты
Второй вопрос, который нас волновал - это рубрики. 8 месяцев назад мы придумали 6 рубрик, сейчас их уже 11!
Мы построили красивый bump chart (рисунок
Если вы бы хотели увидеть какие-то новые рубрики в канале или опеределенный контент -- переходите в комментарии и оставайтесь на связи!
#канал_влияет
#канал_разгоняет
@causal_channel