Planning clinical research. Question #2: Choosing of endpoints



Cite item

Full Text

Abstract

The paper is devoted to the questions of correct choosing of endpoints that correspond the goal of the study as well as estimating of potential inaccuracy and bias of sample data due to particularities of different kind of endpoints. The author presents endpoints classification and considers various techniques to solve the problems arising from the endpoint nature.

Full Text

Бытует мнение, что четкая формулировка задачи - это половина ее решения. Трудно с этим поспорить. Любая задача состоит из неизвестного, которое надо найти и набора условий, которые мы имеем в качестве исходной позиции. В терминах научного исследования, которое тоже является задачей, просто, как правило, решаемой впервые, перед исследователем должна быть цель (или цели) и исходные данные, которыми он располагает или знает, как их получить. Это, конечно, несколько упрощенный взгляд, но все остальное - это частности, присущие конкретной ситуации, а костяк, становой хребет любого исследования, - это цель и исходные данные. Именно от четкости определения этих двух обязательных компонентов зависит успех и все прочие полезные результаты, а также положительные эмоции удачно проведенного исследования. Достаточно часто можно встретить подход к исследованию, при котором доктор измерил у пациентов как можно больше разных показателей, педантично зарегистрировал массу симптомов, множество фактов о лечении или течении патологии и только после этого пытается понять, что же полезного можно извлечь из этой информации. В такой ситуации даже опытному специалисту порой не просто разобраться, где здесь цели, а где условия, какие данные являются маркерами исследуемого исхода (цели), а что представляет собой лишь вспомогательные описания особенностей исследуемой популяции (условия). План исследования и его протокол должны быть разработаны и зафиксированы до того, как первый пациент будет включен в группу исследования, и первое, что должно быть четко сформулировано, желательно в письменном виде, это цель исследования, потому что именно она определяет те конечные точки (показатели, симптомы, осложнения), которые будут регистрироваться (в идеале) у каждого без исключения больного исследуемой выборки [1]. Термин «конечные точки» пришел из исследований кривых дожития, в которых анализируется не только частота наступления какого-либо события (осложнения, летального исхода, манифестации заболевания), но и временной отрезок, за который это событие наступает у определенной части больных из наблюдаемой выборки. Конечная точка в этом случае означает именно конец исследования данного больного по причине наступления у него исследуемого события. В настоящее время, однако, термин «конечная точка» широко применяется во всех клинических исследованиях, создавая порой трудности выделения целевых переменных. Что такое конечная точка в обсервационном исследовании, в котором просто наблюдается и описывается течение какой-то конкретной патологии? Обычно в этом случае конечными точками называются все подряд переменные, регистрируемые, и порой не по одному разу, в течение всего периода наблюдения. Из этого возникает терминологическая путаница, где конечные точки, где факторы, где исходы, как их отделить друг от друга, и если это одно и то же, то зачем столько разных названий? Попробуем разобраться в этом и начнем с терминологии. В зарубежной литературе для определения целевых переменных используется термин «конечная точка» исследования (endpoint). Например, пороговые цифры артериального давления, начиная с которых у больного констатируется гипертензия, уровень глюкозы крови, который регистрируется через час после инфузии раствора глюкозы, уровень боли по ВАШ, который отмечает больной через 24 часа после операции - это все конечные точки. Но наряду с «конечной точкой» используется и термин «исход» исследования (outcome). Есть ли различие между этими терминами? Большинство специалистов рассматривают эти два термина как синонимы. Есть некоторая дань традиции называть исходами конечные точки исследования, которые являются исходами заболевания или исследуемой процедуры, а не измеряемыми переменными, но все же более точно и надежно будет использовать всегда термин «конечная точка». Это позволит избежать путаницы в изложении материала и понимать, о каких исходах идет речь: исходах исследования или исходах патологии. Итак, вы четко определили цель своего исследования. Означает ли, что вы тем самым определили и конечную точку (или точки)? Совсем нет. Цель исследования и конечные точки - это не одно и то же. Конечные точки, как правило, являются средством или базисом достижения цели исследования. Например, в исследовании сравнения эффективности двух препаратов для профилактики интраоперационной тошноты и рвоты (ИОТР) цель исследования может быть определена как выяснение вопроса, есть ли у этих препаратов преимущество друг перед другом и если да, то какой из них эффективней. Эффективность может определяться как снижение частоты ИОТР при использовании одного препарата по сравнению с частотой при использовании другого. Чтобы рассчитать частоту ИОТР надо зарегистрировать наличие или отсутствие этого осложнения у каждого больного в обеих исследуемых группах. Таким образом, конечной точкой данного исследования будет бинарный признак наличия/отсутствия ИОТР у каждого пациента, включенного в исследование. Сам по себе набор значений конечной точки в выборке еще не является достижением цели исследования, но это те самые данные, на основе которых мы будем делать расчеты и/или интерпретацию, приводящую нас к ответу на главный вопрос исследования. Конечная точка (КТ) - это важнейший компонент исследования, который относится ко всей выборке, так как это переменная, с помощью которой мы описываем исследуемый исход у каждого пациента, и поэтому ее величина должна быть измерена или отмечена у каждого пациента выборки без исключения. Такая регистрация должна проходить строго по одним и тем же правилам, в одинаковых условиях и одних и тех же единицах измерения, все это должно быть четко зафиксировано в протоколе. КТ различаются по типу тех переменных, которые они представляют. Это может быть бинарный признак наличия/отсутствия осложнения (симптома, исхода), как в примере, приведенном выше. Это может быть и изменяемый показатель, как, например, величина систолического артериального давления. Это может быть порядковая или счетная переменная, примером которой может быть балльная оценка интенсивности боли по визуально-аналоговой шкале (ВАШ) или степень глубины комы по шкале Глазго. Однако сложность адекватного выбора КТ заключается еще и в том, что они должны позволять сделать наиболее аргументированный вывод и позволить любому сомневающемуся, повторив ваше исследование, получить то же или сходное заключение, т.е. обеспечить воспроизводимость результатов и выводов вашего исследования. Какие здесь могут быть варианты? Есть множество рекомендаций, они очень похожи, но мы остановимся на классификации конечных точек, принятой в Медицинской школе Гарвардского университета, поскольку она объединяет многие используемые классификации, оставаясь при этом достаточно компактной и четкой. Итак, КТ различаются по степени точности их определения и, соответственно, возможности получить те же самые или близкие результаты в повторном исследовании. По этому признаку различают жесткие (hard) и мягкие (soft) КТ. Например, если исследуется частота летального исхода, то наступление у больного этого события не вызывает никакой неоднозначности. То же самое можно сказать об остановке сердца, возникновении судорог или любой определенной клинической ситуации, которая совершенно очевидна для всех специалистов и не вызывает разночтений в ее наличии или отсутствии у данного больного. Однако не все исследуемые события можно привести к столь четкому и однозначному определению. Например, снижение интенсивности болевого синдрома, улучшение самочувствия или качества жизни пациента во многом зависят от исходного уровня всех этих качественных признаков, а также от личностных качеств самого пациента, тех балльных шкал и критериев, которые применяет исследователь для оценки этих показателей и в конечном итоге от случайных флуктуаций той выборки, которую набрал доктор. Такие конечные точки считаются мягкими, потому что имеют широкие возможности для различной трактовки, интерпретации, образуют большие, а иногда просто непреодолимые трудности для воспроизведения результатов и выводов в других подобных исследованиях. Совет мог бы быть простым - избегать таких нечетко определенных КТ, но проблема состоит в том, что именно такие исследования вызывают наибольший интерес и наиболее востребованы, поэтому такой простой совет не годится. Решение этой проблемы лежит в максимальной объективизации таких мягких КТ с помощью различных шкал и балльных оценок, разработанных в пилотных исследованиях, взятых из литературы или уже использующихся в клинической практике. Следует по возможности максимально точно давать определение тем исходам, которые будут описываться конечными точками исследования: снижение интенсивности боли на сколько баллов, улучшение качества жизни по каким параметрам и насколько пунктов и т. п. Это позволит не только четко изложить результаты, полученные в ходе исследования, но и определить границы их обобщения на исследуемую популяцию, а также дать возможность другим исследователям продолжить и развить вашу идею в условиях своей клиники, четко понимая, в чем состоит отличие их популяции и критериев оценки от тех, что были в вашей работе. КТ в исследовании может быть единственной, как например исследование риска развития гипотонии как осложнения спинномозговой анестезии у беременных при операции кесарева сечения. Если же исследуется состояние или патология, характеризующаяся определенным набором показателей, то конечных точек в исследовании становится несколько, это так называемая множественная КТ. Примером может служить любое когортное исследование преэклампсии, патологии беременности, манифестирующей целым комплексом признаков. КТ в этом случае будет состоять из переменных, отражающих цифры артериального давления, концентрацию белка в моче, наличие отеков и некоторые другие признаки этого осложнения. Очевидно, что проводить исследование с единичной КТ, проще, чем с множественной, поскольку проверка гипотезы проводится только один раз, а не по всем переменным, составляющим множественную конечную точку. Кроме того, множественные КТ увеличивают объем выборки по сравнению с единичной КТ, поскольку необходимо обеспечить мощность достаточную для проверки всех гипотез. Усложняется и расчет необходимого объема выборки. Но в данном случае нет возможности для ухода от трудностей, и если проблема требует рассмотрения такой множественной КТ, приходится честно проделать все необходимые расчеты. В тех случаях, когда предметом исследования является только один исход, например частота интраоперационной гипотонии, обусловленной спинномозговой анестезией, КТ является простой. У каждого больного регистрируется наличие или отсутствие гипотонии во время операции. Однако достаточно часто осложнения рассматриваются в комплексе. Вопрос, например, состоит в том, какова частота вообще каких бы то ни было осложнений после данной процедуры. Такая КТ называется составной. Иногда частота какого-то одного осложнения настолько мала, что для его исследования необходимо набрать очень большую выборку, чтобы обеспечить адекватную мощность статистических критериев и сделать обоснованные выводы. В этих случаях прибегают к объединению нескольких таких редких осложнений и изучают изменение их совместной частоты. Преимущество составной КТ - это увеличение эффективности, поскольку она включает в себя несколько событий, снижая объем выборки, необходимый для заданной мощности статистического критерия. Однако здесь имеет место подводный камень, просто настоящий риф, о который может разбиться все исследование, потеряв не только мощность, но и смысл. Дело в том, что частоты событий, которые объединены в составной КТ могут быть неравными, и чаще всего так и есть на самом деле. Например, если объединить в одну КТ такие осложнения спинномозговой анестезии, как гипотония, тошнота и рвота, то для исследования изменений частоты такого составного исхода под влиянием какого-то препарата или профилактических мер, достаточно будет вполне приемлемого объема выборки. Однако при этом следует обратить внимание на то, что гипотония встречается чаще, чем тошнота, а рвота имеет наименьшую частоту из всех трех осложнений, поэтому если результаты исследования показали эффективность профилактики в отношении такой составной КТ, то утверждение можно делать только в отношении совместной частоты гипотонии, тошноты и рвоты и никаких выводов и даже предположений нельзя сделать об эффективности этой меры по отношению к каждому осложнению в отдельности. Более того, если наша профилактическая мера снижает, например, частоту рвоты, но никак не влияет на частоту гипотонии, мы никогда не узнаем об этом из нашего исследования, потому что более частое событие, доминирующее в составе такой КТ, маскирует влияние на более редкое. Это не значит, что составные КТ всегда несостоятельны. Иногда, действительно, важно исследовать объединенную частоту каких-то последствий и снизить ее в целом, так как эти последствия в равной степени нежелательны, а по отдельности они очень редки, и поэтому исследовать их затруднительно. Просто включая составную КТ в свое исследование надо помнить о ее особенностях и скрытых источниках проблем. Иногда вместо клинического исхода, который непосредственно представляет интерес для исследователя, в качестве КТ используется некий признак, связанный с ним, или маркер, свидетельствующий о развитии или выраженности этого исхода. Ни признак, ни маркер сами по себе не представляют интерес, они становятся КТ только потому, что могут в какой-то степени заменить, стать представителями интересующего исхода. Такая КТ называется суррогатной. [2] Ее противоположность называется прямой КТ, т. е. исходом или показателем, который сам по себе напрямую является предметом исследования. Суррогатные КТ довольно активно используются в онкологических исследованиях и в целом часто встречаются во многих когортных клинических исследованиях, когда время наступления изучаемого события (манифестации заболевания, реабилитации, развития осложнения) занимает достаточно длительный период времени. Суррогатные переменные обычно легче измерить, их изменения наступают быстрее, что существенно сокращает затраты на проведение исследования. Но для того чтобы строить выводы относительно интересующего исхода на основе изменений его признаков и маркеров, надо убедительно доказать, что эти суррогатные КТ действительно связаны с предметом исследования и их сдвиги значимо коррелируют с его изменениями. Правомерность таких заключений целиком и полностью зависит от силы ассоциативной связи суррогатной конечной точки с интересующим клиническим исходом. Итак, если уже на этапе составления протокола все КТ будут оценены с этих четырех позиций, то исследователь получит четкую картину источников возможных проблем, неточностей и смещений своих данных, а также сможет оценить воспроизводимость и степень объективности будущих заключений, сделанных на их основе. Помимо КТ в исследовании, как правило, необходимо регистрировать множество других вспомогательных переменных: например, значения исходного уровня различных величин, характеристики исследуемой популяции. Это необходимо сделать, чтобы образовать группы, однородные по этим характеристикам и тем самым исключить или максимально уменьшить влияние вмешивающихся факторов (confounders). Дополнительные переменные могут включать также характеристики факторов, если они присутствуют в исследовании. Переменных, регистрируемых в исследовании, может быть достаточно много, но, повторюсь, прежде всего должны быть четко определены КТ - измерения, которые будут сделаны после рандомизации или иного распределения участников исследования по группам, и которые проводятся для того, чтобы достичь цели (целей) исследования и максимально достоверно и объективно описать ее. Четко сформулированная цель исследования, а также строгое определение КТ и оценка их по указанным четырем пунктам - это краеугольный камень однозначного (валидного, как иногда говорят, не переводя с английского языка) протокола, т.е. проверяемого, воспроизводимого, подтверждаемого протокола, обеспечивающего успешное достижение цели исследования. Если отойти от сухого языка науки и обратиться к образам, то КТ - это забетонированное русло канала, по которому исследование потечет в строго указанном направлении к цели. Отсутствие таких переменных чревато разливом воды и затоплением площадей, что порождает множество проблем и не гарантирует достижения цели.
×

About the authors

Galina P. Tikhova

FSBI “Karelian Research Center of Russian Academy of Science"

Email: gala@critical.ru
185910, Petrozavodsk

References

  1. Adams-Huet B., Ahn C. Bridging clinical investigators and statisticians: writing the statistical methodology for a research proposal. J Investig Med. 2009; 57(8): 818-824.
  2. Prentice R.L. Surrogate endpoints in clinical trials: definition and operational criteria. Stat Med. 1989; 8(4): 431-440.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2014 Eco-Vector



СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ ФС 77 - 55827 от 30.10.2013 г
СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ЭЛ № ЭЛ № ФС 77 - 80651 от 15.03.2021 г
.



This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies