Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Системы управления, информационные технологии и математическое моделирование; Омск; Омск
Год издания: 2024
Ключевые слова: машинное обучение, рак молочной железы, профили экспрессии генов, Anfis, точность, machine learning, breast cancer, gene expression profiles, accuracy
Аннотация: В статье представлен сравнительный анализ четырех моделей классического машинного обучения и адаптивной нейро-нечеткой системы вывода (ANFIS) для бинарной классификации РМЖ по уровню экспрессии генов. ДНК-чипы используются в изучении патогенетических основ рака молочной железы, определяя функциональное назначение каждого гена. ДНК-Показать полностьючип на твердой матрице содержит тысячи олигонуклеотидных зондов, иммобилизированных на твердом носителе. Уровни экспрессии каждого гена представляют собой стандартизированные показатели интенсивности флуоресценции гибридизованных цепей ДНК, полученных путем обратной транскрипции матричной рибонуклеиновой кислоты (мРНК) исследуемой ткани. Машинное обучение позволяет ускорить обработку результатов ДНК-чипа. Все разработанные модели протестированы на трех непересекающихся подмножествах информативных признаков, отобранных из десятков тысяч признаков (генов на ДНК-чипах) методами машинного обучения: случайный лес, рекурсивное удаление признаков, экспертная оценка. Наибольшая точность классификации достигнута при использовании ансамблевого метода случайный лес на основе показателей экспрессии пяти генов, образующих подмножество признаков, отобранных методом рекурсивного удаления признаков. DNA microarray (or DNA chips) are used in the study of the pathogenetic basis of breast cancer, determining the functional purpose of each gene. The DNA chip on a solid matrix contains thousands of oligonucleotide probes immobilized on a solid carrier. The expression levels of each gene are standardized indicators of the fluorescence intensity of hybridized DNA strands obtained by reverse transcription of the matrix ribonucleic acid (mRNA) of the tissue under study. Machine learning allows you to speed up the processing of DNA chip results. The study provides a comparative analysis of models for solving the binary classification problem using classical machine learning methods and an adaptive network based fuzzy inference system (ANFIS). All developed models were tested on three non - intersecting subsets of informative features selected from thousands of features (genes on DNA chips), by machine learning methods: random forest, recursive feature elimination, expert judgement. The highest classification accuracy was achieved using an ensemble random forest method based on the expression levels of five genes formed a subset of features have been selected by recursive feature elimination.
Журнал: ИТ. Наука. креатив
Номера страниц: 403-410
Место издания: Москва