Методы и средства анализа информативности признаков при обработке медицинских данных : научное издание

Описание

Перевод названия: Methods and tools for analysing informative features when processing medical data

Тип публикации: статья из журнала

Год издания: 2016

Ключевые слова: анализ медицинских данных, методы отбора и конструирования признаков, оценка информативности признаков, программное обеспечение для здравоохранения

Аннотация: Многие современные лечебные учреждения располагают информационными системами для хранения различных медицинских данных о здоровье пациентов, которые используются врачами для распознавания (диагностики) патологических процессов. Однако при анализе медицинских данных, обнаружении закономерностей в этих данных и их извлечении приходитПоказать полностьюся сталкиваться с проблемой размерности. Размерность хранимых данных, определяемая числом различных признаков, описывающих состояние здоровья пациента, весьма велика и порой достигает нескольких десятков и сотен показателей. Поэтому проблема снижения размерности признакового пространства и выделения наиболее информативных признаков весьма актуальна для медицинских информационных систем. В статье сформулирована задача отбора информативных признаков как задача комбинаторной оптимизации, вычислительная сложность которой составляет O (2n), где n – исходное число исследуемых признаков. Приведено обобщение данной задачи с учетом возможности конструирования новых признаков на основе исходных. Представлен краткий обзор базовых методов сокращения признакового пространства, таких как метод главных компонент и метод экстремальной группировки признаков. Подробно рассмотрены и исследованы статистические методы оценки информативности признаков, используемые в медицинской диагностике: метод накопленных частот, метод Шеннона и метод Кульбака. Применение данных методов продемонстрировано на примере диагностики заболевания почек. Описан разработанный комплекс программ InformSigns, в котором реализованы все указанные статистические методы. InformSigns предоставляет врачу удобный интерфейс для оценки информативности признаков, описывающих состояние здоровья пациентов. Данный комплекс может быть встроен в специализированные медицинские информационные системы для диагностики различных патологических процессов. Many modern hospitals have information systems for storing medical data about their patients’ health. These data are for doctors to recognise (diagnose) pathological processes. However, experts face a problem of dimension in medical data analysis, detection of regularities in these data and their extraction. The dimension of stored data is determined by the number of different features that describe the health of the patient is very large and sometimes reaches several tens or hundreds of factors. Therefore, reducing the dimensionality of the feature space and selection of the most informative features is important for medical information systems. The article describes the problem of selection of informative features as a problem of combinatorial optimization. Its computational complexity is O (2n), where n is the initial number of features. The generalization of this problem with regard to the possibility of designing new factors based on the source features. The article gives a brief review of basic methods of sign space reduction, such as a principal component analysis and a method of extreme group of features. It also reviews statistical methods for estimating informative features used in medical diagnostics: the method of cumulative frequency, Shannon’s and Kullback’s methods. The application of these methods is demonstrated for diagnosing kidney disease. The article describes the program InformSigns, which implements all the statistical methods. InformSigns gives doctors a convenient interface for estimating informative features describing patients’ state of health. This complex can be integrated in specialized medical information systems for diagnostics of various pathological processes.

Ссылки на полный текст

Издание

Журнал: Программные продукты и системы

Выпуск журнала: 2

Номера страниц: 172-178

ISSN журнала: 0236235X

Место издания: Тверь

Издатель: Закрытое акционерное общество Научно-исследовательский институт Центрпрограммсистем

Авторы

  • Быкова В.В. (Сибирский Федеральный университет)
  • Катаева А.В. (Краевая клиническая больница)

Вхождение в базы данных