Telegram Group & Telegram Channel
#статистика_для_котиков

Она говорила, что любит нормальных, но выбирала с эксцессом и асимметрией

Привет, коллега!

Пока я готовлю очередной длиннопост про призму (для вновьприбывших первая и вторая части), решила кратенько рассказать о таких параметрах как асимметрия (skewness) и эксцесс (kurtosis), отражающих форму распределения данных.

Итак, коэффициент асимметрии - это мера асимметрии распределения вероятностей случайной величины относительно её среднего значения. Если он равен нулю, то распределение симметрично относительно центра (например, нормальное распределение или распределение Стьюдента).

Однако, очень часто распределение ассиметрично, например, если посмотреть на распределение зарплат, то можно увидеть, что труд большей части людей не слишком высоко ценится, а вот высокие доходы имеет лишь небольшая часть населения. Собственно вот такой длинный хвост справа будет выражаться в положительном коэффициенте асимметрии и чем больше значение - тем больше перекос.

Отрицательный коэффициент асимметрии будет при длинном хвосте слева и большей вероятности получить высокие значения случайной величины. Например, на одном из моих предметах большинство студентов набирает 70-90 баллов из 100 за эссе, потому что они очень умные, умеют искать литературу и правильно оформлять работу. Но бывает попадаются редкие работы, бездумно сгенерированные нейросетками и вот они создают длинный левый хвост у распределения оценок.

🤔 Странные, конечно, примеры получились, на грустное распределение зарплат коэффициент асимметрии положительный, а на умненьких студентов - отрицательный

Теперь про второй параметр, коэффициент эксцесса. Он отражает насколько "острая" вершина у распределения. UPD: есть поправочка из комментариев. Вообще есть приколы с его расчётом и одна из формул была предложена Пирсоном. По ней у нормального распределения эксцесс равен 3. Но чаще используют избыточный эксцесс (excess kurtosis), получаемый вычитанием тройки, причём называют его также просто коэффициентом эксцесса (например, в призме это так).

Распределение близкое к нормальному имеет избыточный эксцесс равный 0 и называется мезокуртическим распределением. Если коэффициент отрицательный, то распределение имеет более распластанную форму и называется платикуртическим. Для биологических данных небольшие выборки из неоднородной генеральной совокупности чаще всего будут иметь именно такое распределение, поскольку изначально разброс большой, а измерений для высокого пика нормального распределения может просто не хватать. Попробуй измерить рост у 5 своих друзей и посчитать коэффициент эксцесса.

Избыточный эксцесс больше 0 характерен для лептокуртического распределения. В этом случае распределение имеет высокий и острый пик, но в отличие от распределения с малым стандартными отклонением, в нём присутствуют значения сильно отклоняющиеся от среднего. Возвращаясь к умным студентам с высокими баллами за эссе: из-за читеров с нейросетями распределение получается не нормальным с малым разбросом, а лептокуртическим. Кстати, картинку распределением оценок прошлого года и рассчитанными коэффициентами ассиметрии и эксцесса скину в комментарии.

Пока читала литературу для этого поста неоднократно наталкивалась на информацию о том, что лептокуртическое распределение доходности рынка означает высокие риски при инвестировании, а вот платикурическое распределение более безопасно. Пока что моя единственная инвестиция - это запасы жирочка на случай голода, но может кому-то эта информация будет полезной.

И в заключении хочу признаться: я написала весь этот текст только чтобы запостить картинку с котиками, которая поднимает мне настроение каждый раз, когда я её встречаю. Надеюсь, теперь и тебе тоже 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/855
Create:
Last Update:

#статистика_для_котиков

Она говорила, что любит нормальных, но выбирала с эксцессом и асимметрией

Привет, коллега!

Пока я готовлю очередной длиннопост про призму (для вновьприбывших первая и вторая части), решила кратенько рассказать о таких параметрах как асимметрия (skewness) и эксцесс (kurtosis), отражающих форму распределения данных.

Итак, коэффициент асимметрии - это мера асимметрии распределения вероятностей случайной величины относительно её среднего значения. Если он равен нулю, то распределение симметрично относительно центра (например, нормальное распределение или распределение Стьюдента).

Однако, очень часто распределение ассиметрично, например, если посмотреть на распределение зарплат, то можно увидеть, что труд большей части людей не слишком высоко ценится, а вот высокие доходы имеет лишь небольшая часть населения. Собственно вот такой длинный хвост справа будет выражаться в положительном коэффициенте асимметрии и чем больше значение - тем больше перекос.

Отрицательный коэффициент асимметрии будет при длинном хвосте слева и большей вероятности получить высокие значения случайной величины. Например, на одном из моих предметах большинство студентов набирает 70-90 баллов из 100 за эссе, потому что они очень умные, умеют искать литературу и правильно оформлять работу. Но бывает попадаются редкие работы, бездумно сгенерированные нейросетками и вот они создают длинный левый хвост у распределения оценок.

🤔 Странные, конечно, примеры получились, на грустное распределение зарплат коэффициент асимметрии положительный, а на умненьких студентов - отрицательный

Теперь про второй параметр, коэффициент эксцесса. Он отражает насколько "острая" вершина у распределения. UPD: есть поправочка из комментариев. Вообще есть приколы с его расчётом и одна из формул была предложена Пирсоном. По ней у нормального распределения эксцесс равен 3. Но чаще используют избыточный эксцесс (excess kurtosis), получаемый вычитанием тройки, причём называют его также просто коэффициентом эксцесса (например, в призме это так).

Распределение близкое к нормальному имеет избыточный эксцесс равный 0 и называется мезокуртическим распределением. Если коэффициент отрицательный, то распределение имеет более распластанную форму и называется платикуртическим. Для биологических данных небольшие выборки из неоднородной генеральной совокупности чаще всего будут иметь именно такое распределение, поскольку изначально разброс большой, а измерений для высокого пика нормального распределения может просто не хватать. Попробуй измерить рост у 5 своих друзей и посчитать коэффициент эксцесса.

Избыточный эксцесс больше 0 характерен для лептокуртического распределения. В этом случае распределение имеет высокий и острый пик, но в отличие от распределения с малым стандартными отклонением, в нём присутствуют значения сильно отклоняющиеся от среднего. Возвращаясь к умным студентам с высокими баллами за эссе: из-за читеров с нейросетями распределение получается не нормальным с малым разбросом, а лептокуртическим. Кстати, картинку распределением оценок прошлого года и рассчитанными коэффициентами ассиметрии и эксцесса скину в комментарии.

Пока читала литературу для этого поста неоднократно наталкивалась на информацию о том, что лептокуртическое распределение доходности рынка означает высокие риски при инвестировании, а вот платикурическое распределение более безопасно. Пока что моя единственная инвестиция - это запасы жирочка на случай голода, но может кому-то эта информация будет полезной.

И в заключении хочу признаться: я написала весь этот текст только чтобы запостить картинку с котиками, которая поднимает мне настроение каждый раз, когда я её встречаю. Надеюсь, теперь и тебе тоже 🙂

BY АДовый рисёрч





Share with your friend now:
group-telegram.com/ad_research/855

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. Soloviev also promoted the channel in a post he shared on his own Telegram, which has 580,000 followers. The post recommended his viewers subscribe to "War on Fakes" in a time of fake news. Telegram was co-founded by Pavel and Nikolai Durov, the brothers who had previously created VKontakte. VK is Russia’s equivalent of Facebook, a social network used for public and private messaging, audio and video sharing as well as online gaming. In January, SimpleWeb reported that VK was Russia’s fourth most-visited website, after Yandex, YouTube and Google’s Russian-language homepage. In 2016, Forbes’ Michael Solomon described Pavel Durov (pictured, below) as the “Mark Zuckerberg of Russia.” The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. The fake Zelenskiy account reached 20,000 followers on Telegram before it was shut down, a remedial action that experts say is all too rare.
from tw


Telegram АДовый рисёрч
FROM American