Telegram Group & Telegram Channel
#статистика_для_котиков

Она говорила, что любит нормальных, но выбирала с эксцессом и асимметрией

Привет, коллега!

Пока я готовлю очередной длиннопост про призму (для вновьприбывших первая и вторая части), решила кратенько рассказать о таких параметрах как асимметрия (skewness) и эксцесс (kurtosis), отражающих форму распределения данных.

Итак, коэффициент асимметрии - это мера асимметрии распределения вероятностей случайной величины относительно её среднего значения. Если он равен нулю, то распределение симметрично относительно центра (например, нормальное распределение или распределение Стьюдента).

Однако, очень часто распределение ассиметрично, например, если посмотреть на распределение зарплат, то можно увидеть, что труд большей части людей не слишком высоко ценится, а вот высокие доходы имеет лишь небольшая часть населения. Собственно вот такой длинный хвост справа будет выражаться в положительном коэффициенте асимметрии и чем больше значение - тем больше перекос.

Отрицательный коэффициент асимметрии будет при длинном хвосте слева и большей вероятности получить высокие значения случайной величины. Например, на одном из моих предметах большинство студентов набирает 70-90 баллов из 100 за эссе, потому что они очень умные, умеют искать литературу и правильно оформлять работу. Но бывает попадаются редкие работы, бездумно сгенерированные нейросетками и вот они создают длинный левый хвост у распределения оценок.

🤔 Странные, конечно, примеры получились, на грустное распределение зарплат коэффициент асимметрии положительный, а на умненьких студентов - отрицательный

Теперь про второй параметр, коэффициент эксцесса. Он отражает насколько "острая" вершина у распределения. UPD: есть поправочка из комментариев. Вообще есть приколы с его расчётом и одна из формул была предложена Пирсоном. По ней у нормального распределения эксцесс равен 3. Но чаще используют избыточный эксцесс (excess kurtosis), получаемый вычитанием тройки, причём называют его также просто коэффициентом эксцесса (например, в призме это так).

Распределение близкое к нормальному имеет избыточный эксцесс равный 0 и называется мезокуртическим распределением. Если коэффициент отрицательный, то распределение имеет более распластанную форму и называется платикуртическим. Для биологических данных небольшие выборки из неоднородной генеральной совокупности чаще всего будут иметь именно такое распределение, поскольку изначально разброс большой, а измерений для высокого пика нормального распределения может просто не хватать. Попробуй измерить рост у 5 своих друзей и посчитать коэффициент эксцесса.

Избыточный эксцесс больше 0 характерен для лептокуртического распределения. В этом случае распределение имеет высокий и острый пик, но в отличие от распределения с малым стандартными отклонением, в нём присутствуют значения сильно отклоняющиеся от среднего. Возвращаясь к умным студентам с высокими баллами за эссе: из-за читеров с нейросетями распределение получается не нормальным с малым разбросом, а лептокуртическим. Кстати, картинку распределением оценок прошлого года и рассчитанными коэффициентами ассиметрии и эксцесса скину в комментарии.

Пока читала литературу для этого поста неоднократно наталкивалась на информацию о том, что лептокуртическое распределение доходности рынка означает высокие риски при инвестировании, а вот платикурическое распределение более безопасно. Пока что моя единственная инвестиция - это запасы жирочка на случай голода, но может кому-то эта информация будет полезной.

И в заключении хочу признаться: я написала весь этот текст только чтобы запостить картинку с котиками, которая поднимает мне настроение каждый раз, когда я её встречаю. Надеюсь, теперь и тебе тоже 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/ad_research/855
Create:
Last Update:

#статистика_для_котиков

Она говорила, что любит нормальных, но выбирала с эксцессом и асимметрией

Привет, коллега!

Пока я готовлю очередной длиннопост про призму (для вновьприбывших первая и вторая части), решила кратенько рассказать о таких параметрах как асимметрия (skewness) и эксцесс (kurtosis), отражающих форму распределения данных.

Итак, коэффициент асимметрии - это мера асимметрии распределения вероятностей случайной величины относительно её среднего значения. Если он равен нулю, то распределение симметрично относительно центра (например, нормальное распределение или распределение Стьюдента).

Однако, очень часто распределение ассиметрично, например, если посмотреть на распределение зарплат, то можно увидеть, что труд большей части людей не слишком высоко ценится, а вот высокие доходы имеет лишь небольшая часть населения. Собственно вот такой длинный хвост справа будет выражаться в положительном коэффициенте асимметрии и чем больше значение - тем больше перекос.

Отрицательный коэффициент асимметрии будет при длинном хвосте слева и большей вероятности получить высокие значения случайной величины. Например, на одном из моих предметах большинство студентов набирает 70-90 баллов из 100 за эссе, потому что они очень умные, умеют искать литературу и правильно оформлять работу. Но бывает попадаются редкие работы, бездумно сгенерированные нейросетками и вот они создают длинный левый хвост у распределения оценок.

🤔 Странные, конечно, примеры получились, на грустное распределение зарплат коэффициент асимметрии положительный, а на умненьких студентов - отрицательный

Теперь про второй параметр, коэффициент эксцесса. Он отражает насколько "острая" вершина у распределения. UPD: есть поправочка из комментариев. Вообще есть приколы с его расчётом и одна из формул была предложена Пирсоном. По ней у нормального распределения эксцесс равен 3. Но чаще используют избыточный эксцесс (excess kurtosis), получаемый вычитанием тройки, причём называют его также просто коэффициентом эксцесса (например, в призме это так).

Распределение близкое к нормальному имеет избыточный эксцесс равный 0 и называется мезокуртическим распределением. Если коэффициент отрицательный, то распределение имеет более распластанную форму и называется платикуртическим. Для биологических данных небольшие выборки из неоднородной генеральной совокупности чаще всего будут иметь именно такое распределение, поскольку изначально разброс большой, а измерений для высокого пика нормального распределения может просто не хватать. Попробуй измерить рост у 5 своих друзей и посчитать коэффициент эксцесса.

Избыточный эксцесс больше 0 характерен для лептокуртического распределения. В этом случае распределение имеет высокий и острый пик, но в отличие от распределения с малым стандартными отклонением, в нём присутствуют значения сильно отклоняющиеся от среднего. Возвращаясь к умным студентам с высокими баллами за эссе: из-за читеров с нейросетями распределение получается не нормальным с малым разбросом, а лептокуртическим. Кстати, картинку распределением оценок прошлого года и рассчитанными коэффициентами ассиметрии и эксцесса скину в комментарии.

Пока читала литературу для этого поста неоднократно наталкивалась на информацию о том, что лептокуртическое распределение доходности рынка означает высокие риски при инвестировании, а вот платикурическое распределение более безопасно. Пока что моя единственная инвестиция - это запасы жирочка на случай голода, но может кому-то эта информация будет полезной.

И в заключении хочу признаться: я написала весь этот текст только чтобы запостить картинку с котиками, которая поднимает мне настроение каждый раз, когда я её встречаю. Надеюсь, теперь и тебе тоже 🙂

BY АДовый рисёрч





Share with your friend now:
group-telegram.com/ad_research/855

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links. I want a secure messaging app, should I use Telegram? Russians and Ukrainians are both prolific users of Telegram. They rely on the app for channels that act as newsfeeds, group chats (both public and private), and one-to-one communication. Since the Russian invasion of Ukraine, Telegram has remained an important lifeline for both Russians and Ukrainians, as a way of staying aware of the latest news and keeping in touch with loved ones. The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice. Telegram does offer end-to-end encrypted communications through Secret Chats, but this is not the default setting. Standard conversations use the MTProto method, enabling server-client encryption but with them stored on the server for ease-of-access. This makes using Telegram across multiple devices simple, but also means that the regular Telegram chats you’re having with folks are not as secure as you may believe.
from us


Telegram АДовый рисёрч
FROM American