group-telegram.com/ebm_base/796
Create:
Last Update:
Last Update:
ЕЩЕ! ЕЩЕ! ЕЩЕ! ДОВОЛЬНО! ПОЩАДИ...
"А вот у меня n пациентов в группах, этого достаточно?"
Те, кто отвечают на вопросы в чатах по статистике, вы уже закатили глаза? Этот вопрос не редкость (чаще только вопросы про нормальность и пинки Матвея, кстати рекомендую подписаться на его канал)
Почему же такой "простой" вопрос вызывает так много трудностей?
Для ответа на него нужно много нюансов и предположений (формулу затем посчитать не сложно, в большинстве случаев). [1]
Разделим их на методологические, клинические и статистические (классификация имени клоуна Никиты, но мне кажется так удобнее объяснить или нет...)
Стоит признать, что большая часть исследований в медицине это тестирование гипотез, т.е. формулируются нулевая и альтернативные гипотезы, тестируется нулевая на основе данных (насколько они согласуются с ней), делается решение отклонить или не отклонить Н0, вывод.
Это ни хорошо, ни плохо. Скорее это подходит для узкого круга задач (но эти философские рассуждения оставим для комментаторов, в чате тут как раз можно прочитать).
Получается, что внутри методологии любого такого исследования должна стоять гипотеза. Формулируется она определенным образом на основе клинической и статистической составляющих (в зависимости от этого могут возникать разные альтернативы), и "простые" гипотезы преимущественно встречаются в РКИ (но не всегда). Мне кажется, одной только теме гипотез и их определению можно посвятить целые книги и уроки. [2, 3]
Клинически нам надо определить группы, вмешательства, срок и какой исход мы смотрим. Мы можем оценивать общую выживаемость, количество летальных исходов, интенсивность боли по ВАШ, АД и т.п. При этом необходимо предполагать/иметь какой-то базовый/референсный результат для контрольной группы, и какой клинический эффект (его размер) мы ожидаем увидеть (можно его предположить из пилотного исследования). [4, 5]
Затем нужно определить какая вероятность ошибок I и II рода для нас будет достаточной. [6] Согласны ли мы со стандартным уровнем ложно-положительного результата в 5%? Мб нам лучше меньше? Потом нужно не забыть, что % доверительного интервала станет больше (если выберем ошибку I рода меньше 5%), и порог для отклонения Н0 для p-value станет меньше. А если планируем эффект измерять в относительных величинах (RR, OR, HR), то верно определить его, перевести клиническую идею в статистический показатель (снижение относительного риска на 40% = RR 0,6). Затем разобраться как его будем получать (через таблицы 2х2 или вид модели). [7]
А в конце вмещается суровая реальность. Это наши ресурсы: сколько вообще возможно набрать пациентов за установленный срок, можем ли расширить срок набора, можно ли расширить количество центров, сколько необходимо финансовых затрат и т.п.
И начинаются коррекции... Мб попробуем найти более выраженный эффект? А мб мы смиримся с ошибкой I рода в 10%? И т.д. [8]
А если кто-то пропадет/исключится/потеряется из исследования? Надо заложить и под это ожидаемую потерю (drop out rate)... Чтобы был небольшой запас.
Почему же такой "простой" вопрос вызывает так много трудностей?
Оказыается, чтобы выбрать формулу и вставить в нее какие-то значения, необходимо знать нюансы и сделать достаточно предположений (иногда мне кажется, что нужно изучить всю статистику прежде, чем считать размер выборки)
При этом если у вас несколько первичных конечных точек, то желательно провести расчет на каждую и выбрать наибольшую...
Есть альтернативы?
- Можно попробовать сделать симуляцию механизма генерации данных и посмотреть на какой примерно уровне будет достигнута необходимая для нас мощность [9]
- Можно не считать, а исходить из того, что получится собрать (одобрят ли вам такой подход, особенно при финансировании?) [10]
- Можно попробовать байесовские подходы [11, 12]
@ebm_base
BY Ebm_base
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/ebm_base/796