Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Информационные технологии и математическое моделирование (ИТММ-2024); Томск; Томск
Год издания: 2024
Ключевые слова: машинное обучение, рак молочной железы, классификация, профили экспрессии генов
Аннотация: В работе представлен сравнительный анализ четырех моделей классического машинного обучения (k-ближайших соседей, наивный Байес, метод опорных векторов, случайный лес) и адаптивной нейро-нечеткой системы вывода ANFIS для бинарной классификации пациентов по уровню экспрессии генов на ДНК-чипах, используемых в изучении патогенетическиПоказать полностьюх основ рака молочной железы. Уровни экспрессии каждого гена представляют собой стандартизированные показатели интенсивности флуоресценции гибридизованных цепей ДНК. Все модели классификации протестированы на трех непересекающихся подмножествах информативных признаков, отобранных тремя методами: случайный лес, рекурсивное удаление признаков, экспертная оценка. Сравнительный анализ качества моделей показал, что наибольшая точность классификации достигнута при использовании ансамблевого метода случайный лес на основе показателей экспрессии пяти генов, образующих подмножество признаков, отобранных методом рекурсивного удаления признаков. Предлагаемая модель позволит значительно ускорить обработку результатов ДНК-чипа и может быть использована в качестве инструмента для первичной диагностики - выявления наличия или отсутствия онкопатологии у пациента.
Журнал: Информационные технологии и математическое моделирование (ИТММ-2024)
Номера страниц: 536-541
Место издания: Томск