banner

Блог

Nov 10, 2023

Статистические модели и машинное обучение для борьбы с конкурирующими рисками: разработка и проверка прогностических моделей

Методология медицинских исследований BMC, том 23, номер статьи: 51 (2023 г.) Цитировать эту статью

1353 Доступа

9 Альтметрика

Подробности о метриках

В медицинских исследованиях некоторые хронические заболевания подвержены конкурирующим рискам (CR). Первоначально статистические модели (СМ) были разработаны для оценки совокупной частоты событий при наличии ПР. Поскольку в последнее время растет интерес к применению машинного обучения (МО) для клинического прогнозирования, эти методы также были распространены на моделирование CR, но литература ограничена. Здесь наша цель — изучить потенциальную роль ML по сравнению с SM для CR в рамках несложных данных (малый/средний размер выборки, настройка низкой размерности).

Набор данных с 3826 ретроспективно собранными пациентами с саркомой мягких тканей конечностей (eSTS) и девятью предикторами используется для оценки прогнозирующей эффективности модели с точки зрения дискриминации и калибровки. Два SM (Cox, Fine-Gray) и три метода ML сравниваются для CR в простых клинических условиях. Модели ML включают в себя оригинальную частичную логистическую искусственную нейронную сеть для CR (оригинал PLANNCR), PLANNCR с новыми спецификациями с точки зрения архитектуры (расширенный PLANNCR) и случайный лес выживания для CR (RSFCR). Клинической конечной точкой является время в годах между операцией и прогрессированием заболевания (событие, представляющее интерес) или смертью (конкурирующее событие). Интересующие моменты времени: 2, 5 и 10 лет.

На основе исходных данных eSTS было составлено 100 наборов обучающих данных. Эффективность окончательных моделей оценивается на основе данных проверки (исключенные образцы) с использованием в качестве показателей показателя Брайера и площади под кривой (AUC) с CR. Также оценивается неточность калибровки (погрешность абсолютной точности). Результаты показывают, что модели ML способны достичь сравнимой производительности с моделью SM через 2, 5 и 10 лет как по шкале Брайера, так и по AUC (перекрывающиеся доверительные интервалы 95%). Однако SM зачастую лучше откалиброваны.

В целом методы МО менее практичны, поскольку требуют значительного времени на реализацию (предварительная обработка данных, настройка гиперпараметров, интенсивность вычислений), тогда как методы регрессии могут хорошо работать без дополнительной нагрузки по обучению модели. Таким образом, для несложных данных о выживании в реальной жизни эти методы следует применять только в качестве дополнения к SM в качестве инструментов исследования производительности модели. Срочно необходимо уделять больше внимания калибровке моделей.

Отчеты экспертной оценки

Анализ выживаемости (также называемый анализом времени до события) используется для оценки продолжительности жизни конкретной изучаемой популяции. Часто данные о выживаемости подвергаются цензуре справа; время до события не наблюдается для всех пациентов из-за перерыва в наблюдении до возникновения интересующего события или ограничений по времени (прекращение исследования). Конкурирующие риски (CR) часто возникают при клиническом применении данных о выживаемости [1,2,3,4]. В этом типе данных человек может выйти из строя по одной из нескольких причин. ПР – это событие, появление которого исключает возникновение интересующего события (например, смерть может предотвратить возникновение рецидива заболевания) [5, 6]. В медицинских исследованиях CR вряд ли будут независимыми, поскольку биология предполагает, по крайней мере, некоторую зависимость между событиями. При некоторых хронических заболеваниях, связанных со старением и слабостью, таких как рак, хроническая сердечная недостаточность или деменция, исследуемые популяции восприимчивы к ПР [7].

Наиболее популярным непараметрическим подходом к оценке выживаемости при наличии цензурированных справа данных о времени до события является методология Каплана-Мейера (КМ) [8]. Однако при наличии полного ответа эта методология переоценивает вероятность неудачи, что может привести к чрезмерному лечению пациентов [1, 5, 9]. Для оценки кумулятивной заболеваемости (абсолютного риска) события при наличии CR были разработаны различные статистические модели (SM), такие как модель Кокса для конкретной причины [10] и модель регрессии рисков подраспределения Fine-Gray [10]. 11]. Первый вариант является естественным продолжением стандартной модели Кокса с пропорциональными рисками для условий CR, где модель Кокса применяется для каждой конкретной причины опасности. Последний моделирует влияние ковариат непосредственно на кумулятивную функцию заболеваемости (CIF) с течением времени, сообщая о коэффициенте риска субраспределения [9].

A common approach in the literature is the partial logistic artificial neural network (PLANN) of Biganzoli et al. (1998) [3.0.CO;2-D ." href="/articles/10.1186/s12874-023-01866-z#ref-CR18" id="ref-link-section-d54317150e784"18]. For the purpose of implementation, time is specified in discrete non-overlapping time intervals which are added as an input feature in a longitudinally transformed feed-forward network with logistic activation, and entropy error function. The output layer estimates smoothed discrete hazards for each time interval. PLANN was extended by Lisboa et al. (2003) under a Bayesian regularisation framework which performs automatic relevance determination (PLANN-ARD) [19]. Recently, Kantidakis et al. in 2020 proposed extensions of PLANN in terms of architecture i.e., new hyperparameters, new activation functions, and time interval specification as multiple input features [20]. Next to survival neural networks (SNNs), another well-known ML technique for clinical prediction of survival data is random survival forests (RSF, Ishwaran et al. 2008) [21]. RSF adapt Breiman's random forest method by using a collection of survival trees [22]./p>

In 2006, Biganzoli et al. extended the partial logistic artificial neural network to competing risks (PLANNCR) for the joint modelling of discrete cause-specific hazards [3.0.CO;2-D ." href="/articles/10.1186/s12874-023-01866-z#ref-CR18" id="ref-link-section-d54317150e2646"18, 23]. PLANNCR is a feed-forward network comprised of a group of units called nodes (or neurons) in each layer. It has an input layer that picks up the signals and passes them to a single hidden layer after the application of an activation (also called transformation) function. An activation function modulates the degree of non-linearity transferred from the input features to the hidden layer. Connections between the artificial neurons of different layers are called edges - each having a weight. Weights are adjusted through training increasing or decreasing the strength of each connection [35]. Signals are transmitted towards the output layer, which provides a smoothed estimation of discrete conditional event probabilities (in multiple output nodes; each for an event), with another activation function./p>

This expression can be expanded based on Graaf et al. 1999 [3.0.CO;2-5 ." href="/articles/10.1186/s12874-023-01866-z#ref-CR41" id="ref-link-section-d54317150e5094"41] taking the following form/p>s \}\) the information at time s used to compute the prediction of \(\pi (s, t)\). The first term in (12) measures calibration - how close the predictions are to \(\mathbb{E} [\Delta (s, t) | H(s)]\), the "true" underlying risk of event in \((s, s+t]\) given H(s). In addition, the second term depends on the discrimination ability of H(s). Thus, Brier score is a measure of both calibration and discrimination. Typically, it ranges from 0 to 0.25 (lower values mean smaller prediction error)./p>

Biganzoli E, Boracchi P, Mariani L, Marubini E. Feed forward neural networks for the analysis of censored survival data: a partial logistic regression approach. Stat Med. 1998;17(10):1169–86. 3.0.CO;2-D"https://doi.org/10.1002/(SICI)1097-0258(19980530)17:10<1169::AID-SIM796>3.0.CO;2-D./p>

Graf E, Schmoor C, Sauerbrei W, Schumacher M. Assessment and comparison of prognostic classification schemes for survival data. Stat Med. 1999;18(17-18):2529–2545. http://www.ncbi.nlm.nih.gov/pubmed/10474158. 3.0.CO;2-5"https://doi.org/10.1002/(SICI)1097-0258(19990915/30)18:17/18<2529::AID-SIM274>3.0.CO;2-5./p>

ДЕЛИТЬСЯ