Telegram Group & Telegram Channel
Немного о Бокс Кокс (Box Cox) трансформации.

Часто распределение экспериментальных данных, с которыми мы сталкиваемся в работе, отличаются от нормальных. При этом большое количество статистических методов в своей математической основе имеют допущение о нормальности распределения значений. Разумеется, существуют непараметрические критерии, которые не обладают таким ограничением, но их мощность (то есть вероятность найти значимые различия, там где они реально есть) в среднем ниже. Поэтому имеет смысл приводить свои данные к нормальному виду.
Бокс Кокс преобразование относится к семейству монотонных преобразований с помощью степенных функций. Идея метода состоит в подборе оптимальной степени (обозначаемой лямбда λ), при возведении в которую данные будут лучше соответствовать нормальному распределению. Обычно лямбда подбирается в диапазоне [-5;5].
Наиболее встречаемые значения параметра: 0, что соответствует логарифму от исходных данных (log(Y)), 0.5, что соответствует квадратному корню (Y0.5 = √(Y)), 1 как линейное преобразование, 2 как квадрат исходных данных (далее куб и четвертая и тд степень). Отрицательные значения: Y^-0.5 = 1/(√(Y)), Y^-1 = 1/Y, Y^-2 = 1/Y^2.
После трансформации необходимо проверить видоизмененные данные на соответствие нормальному распределению графически и с помощью статистических критериев, например теста Шапиро-Уилка.
Стоит обратить внимание, что применение любых видов трансформации может затруднить дальнейшую интерпретацию результатов. Например, в случае работы с линейными моделями, коэффициенты регрессии имеют определенный физический смысл относительно параметров. Можно привести пример: при изменении количества школ в штате на единицу, происходит такое-то изменение уровня образования/числа убийств, или что-то в подобном духе. Интерпретация исходных данных интуитивно понятна. Сложнее будет объяснять, скажем, как количество школ возведенное в степень -1.6 скажется на зависимой переменной и что это может значить. Поэтому с трансформацией необходимо обращаться осторожно и всегда держать в голове возможный физический смысл степенных коэффициентов.
Подробнее с формулами можно ознакомиться здесь: https://www.statisticshowto.com/box-cox-transformation/



group-telegram.com/stats_for_science/3
Create:
Last Update:

Немного о Бокс Кокс (Box Cox) трансформации.

Часто распределение экспериментальных данных, с которыми мы сталкиваемся в работе, отличаются от нормальных. При этом большое количество статистических методов в своей математической основе имеют допущение о нормальности распределения значений. Разумеется, существуют непараметрические критерии, которые не обладают таким ограничением, но их мощность (то есть вероятность найти значимые различия, там где они реально есть) в среднем ниже. Поэтому имеет смысл приводить свои данные к нормальному виду.
Бокс Кокс преобразование относится к семейству монотонных преобразований с помощью степенных функций. Идея метода состоит в подборе оптимальной степени (обозначаемой лямбда λ), при возведении в которую данные будут лучше соответствовать нормальному распределению. Обычно лямбда подбирается в диапазоне [-5;5].
Наиболее встречаемые значения параметра: 0, что соответствует логарифму от исходных данных (log(Y)), 0.5, что соответствует квадратному корню (Y0.5 = √(Y)), 1 как линейное преобразование, 2 как квадрат исходных данных (далее куб и четвертая и тд степень). Отрицательные значения: Y^-0.5 = 1/(√(Y)), Y^-1 = 1/Y, Y^-2 = 1/Y^2.
После трансформации необходимо проверить видоизмененные данные на соответствие нормальному распределению графически и с помощью статистических критериев, например теста Шапиро-Уилка.
Стоит обратить внимание, что применение любых видов трансформации может затруднить дальнейшую интерпретацию результатов. Например, в случае работы с линейными моделями, коэффициенты регрессии имеют определенный физический смысл относительно параметров. Можно привести пример: при изменении количества школ в штате на единицу, происходит такое-то изменение уровня образования/числа убийств, или что-то в подобном духе. Интерпретация исходных данных интуитивно понятна. Сложнее будет объяснять, скажем, как количество школ возведенное в степень -1.6 скажется на зависимой переменной и что это может значить. Поэтому с трансформацией необходимо обращаться осторожно и всегда держать в голове возможный физический смысл степенных коэффициентов.
Подробнее с формулами можно ознакомиться здесь: https://www.statisticshowto.com/box-cox-transformation/

BY Статистика и R в науке и аналитике




Share with your friend now:
group-telegram.com/stats_for_science/3

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The picture was mixed overseas. Hong Kong’s Hang Seng Index fell 1.6%, under pressure from U.S. regulatory scrutiny on New York-listed Chinese companies. Stocks were more buoyant in Europe, where Frankfurt’s DAX surged 1.4%. At the start of 2018, the company attempted to launch an Initial Coin Offering (ICO) which would enable it to enable payments (and earn the cash that comes from doing so). The initial signals were promising, especially given Telegram’s user base is already fairly crypto-savvy. It raised an initial tranche of cash – worth more than a billion dollars – to help develop the coin before opening sales to the public. Unfortunately, third-party sales of coins bought in those initial fundraising rounds raised the ire of the SEC, which brought the hammer down on the whole operation. In 2020, officials ordered Telegram to pay a fine of $18.5 million and hand back much of the cash that it had raised. Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." Stocks dropped on Friday afternoon, as gains made earlier in the day on hopes for diplomatic progress between Russia and Ukraine turned to losses. Technology stocks were hit particularly hard by higher bond yields.
from hk


Telegram Статистика и R в науке и аналитике
FROM American