МЕТОД RANDOM FOREST В ЗАДАЧАХ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ БИОЛЮМИНЕСЦЕНТНОГО АНАЛИЗА СЛЮНЫ ПРИ ПЕРСОНАЛИЗИРОВАННОЙ ДИАГНОСТИКЕ

Описание

Тип публикации: статья из журнала

Год издания: 2025

Идентификатор DOI: 10.21668/health.risk/2025.2.14

Ключевые слова: personalized diagnostics, machine learning, data analysis, multifactorial analysis, saliva, bioluminescence, biosensor, signal systems, персонифицированная диагностика, машинное обучение, анализ данных, многофакторный анализ, слюна, биолюминесценция, биосенсор, сигнальные системы

Аннотация: Развитие направления персонифицированной медицины и биотехнологии напрямую связано с получением данных, в значительной степени зависящих от индивидуальных характеристик исследуемых. При этом используемые в традиционной медицине допустимые интервалы исследуемых параметров не всегда позволяют адекватно охарактеризовать состояние пациПоказать полностьюента. Возникает необходимость поиска таких методов обработки результатов, которые позволяют учитывать разные индивидуальные особенности организма испытуемых и образа его жизни. Определены возможности применения анализа биомедицинских данных Random Forest для корректной интерпретации результатов персонифицированных диагностических тестов на примере биолюминесцентного тестирования, позволяющего оценить влияние разных характеристик испытуемых и условий их жизни. Метод позволяет минимизировать риски неверного диагноза и корректировать схему мониторинга исследуемых. В данной работе используются результаты диагностики трудовой нагрузки работников железнодорожного транспорта, полученные биолюминесцентным методом. Оценку состояния организма проводят, изучая влияние слюны испытуемых на интенсивность свечения биферментной системы: НАДН: ФМН-оксидоредуктаза + люцифераза. Такой анализ является интегральным, реагирует на множество факторов, каждый из которых потенциально может повлиять на результат. Оценку эффективности разных методов обработки данных проводили на примере группы диспетчеров Красноярского филиала АО «РЖД». Для анализа были использованы как статистические методы, так и алгоритм машинного обучения Random Forest. В результате было показано, что для оценки значимости некоторых биохимических показателей слюны для прогнозирования состояния организма работников железнодорожного транспорта целесообразно использовать метод Random Forest, который позволяет определить наиболее значимые факторы и построить графики частичного влияния факторов на целевую переменную. Данное исследование позволяет оптимизировать систему диагностики организма человека при использовании интегрального биолюминесцентного анализа. Метод Random Forest может быть составной частью персонифицированного биолюминесцентного биосенсора для оценки влияния стрессовых и трудовых нагрузок на организм человека. Development of personalized medicine and biotechnologies is directly linked to obtaining relevant data, which largely depend on individual characteristics of examined patients. Permissible ranges of analyzed indicators that are commonly used in conventional medicine do not always describe a patient’s health adequately. It seems necessary to search for such data analysis techniques, which allow considering variable individual peculiarities of patients’ bodies and their lifestyles. The aim of this study is to determine whether it is possible to use the Random Forest method for biomedical data analysis in order to achieve correct interpretation of results obtained by personalized diagnostic tests. Bioluminescent testing is used as an example since it estimates effects produced by various characteristics of examined patients and their living conditions. The method allows minimizing risks of incorrect diagnosis and adjusting monitoring schemes for specific patients. This study relies on using the results obtained by diagnosing workloads of railway workers using the bioluminescence method. A patient’s health is assessed by examining effects produced by a patient’s saliva on intensity of the bi-enzyme system luminescence: NAD(P)H:FMN oxidoreductase + luciferase. This analysis is integral and responses to many factors, each of which can influence the analysis result. Effectiveness of various methods for data analysis is assessed on an example group made of traffic controllers employed by the Krasnoyarsk Branch of Russian Railways JSC. Both statistical methods and the Random Forest machine learning algorithm were used for data analysis. As a result, our study has revealed that it is advisable to use the Random Forest method for assessing significance of some biochemical saliva indicators to predict health of railway workers. The method makes it possible to identify the most significant factors and create graphs to show partial influence exerted by various factors on the target variable. This study allows optimizing the system for health diagnostics using integral bioluminescence analysis. The Random Forest method can become a component of a personalized bioluminescent biosensor for assessing effects produced by stress and workloads on the body.

Ссылки на полный текст

Издание

Журнал: Анализ риска здоровью

Выпуск журнала: 2

Номера страниц: 166-174

ISSN журнала: 23081155

Место издания: Пермь

Издатель: Федеральный научный центр медико-профилактических технологий управления рисками здоровью населения

Персоны

  • Жукова Галина Викторовна (Сибирский федеральный университет)
  • Мартыщук Полина Александровна (Сибирский федеральный университет)
  • Афер Егор Романович (Сибирский федеральный университет)
  • Шуваев Андрей Николаевич (Сибирский федеральный университет)
  • Розанова Наталья Александровна (Научный центр неврологии)
  • Сергеев Дмитрий Владимирович (Научный центр неврологии)
  • Кратасюк Валентина Александровна (Институт биофизики СО РАН, обособленное подразделение ФНЦ «Красноярский научный центр Сибирского отделения Российской академии наук»)

Вхождение в базы данных