Тип публикации: статья из журнала
Год издания: 2025
Идентификатор DOI: 10.21177/1998-4502-2025-17-4-2153-2161
Ключевые слова: rock classification, machine learning in geology, oxide analysis in rocks, classification accuracy, model evaluation metrics, feature importance, классификация горных пород, машинное обучение в геологии, анализ оксидов в породах, точность классификации, метрики оценки модели, важность признаков
Аннотация: В статье рассматривается задача классификации горных пород на основе их химического состава с применением методов машинного обучения. Актуальность исследования обусловлена необходимостью повышения точности и автоматизации геологических исследований, где традиционные методы классификации, основанные на визуальном и минералогическом Показать полностьюанализе, становятся недостаточно эффективными при работе с большими объемами данных. Целью работы является разработка модели, способной классифицировать различные типы горных пород по содержанию химических элементов. В качестве основного метода использована логистическая регрессия, позволяющая оценивать вероятность принадлежности образцов к определённым классам пород. В исследовании применялся датасет, содержащий информацию о концентрациях ключевых оксидов, при этом данные прошли этапы предварительной обработки и нормализации. Для оценки качества модели использовались метрики accuracy, precision, recall и F1 - score, а также инструменты визуализации, включая матрицу ошибок и анализ важности признаков. Полученные результаты показали, что модель демонстрирует удовлетворительную точность (около 76%) и эффективно классифицирует распространённые типы пород, такие как базальт и андезит. Однако выявлены трудности при распознавании редких и химически схожих пород, что связано с недостаточной представленностью данных и близостью их химических характеристик. Сделан вывод о необходимости дальнейшего совершенствования модели, включая применение более сложных алгоритмов и расширение обучающей выборки, что позволит повысить точность классификации и расширить практическое применение метода в геологии. Introduction. This study focuses on the development of a method for classifying rocks based on their chemical composition using machine learning techniques. The relevance of the research is conditioned by the need to improve the accuracy and automation of geological analysis, especially when handling large volumes of geochemical data. Traditional classification approaches based on visual and mineralogical characteristics have limitations, particularly for chemically similar rock types. Methods. A logistic regression model was applied to classify rocks using data on the concentrations of major oxides. The dataset was preprocessed by removing missing values and normalizing numerical features. Model performance was evaluated using accuracy, precision, recall, and F1 - score metrics. Visualization techniques, including confusion matrices, heat maps, and feature importance analysis, were also employed. Results. The model achieved an overall classification accuracy of approximately 76%. It demonstrated strong performance in identifying common rock types such as basalt and andesite due to their distinct chemical features. However, lower accuracy was observed for rare and chemically similar rocks, including diorite, granodiorite, and rhyolite, which can be explained by their compositional similarity and limited representation in the dataset. Conclusion. The results confirm that logistic regression is an effective tool for basic rock classification tasks. Nevertheless, improving classification accuracy for complex and rare rock types requires expanding the dataset and applying more advanced machine learning methods. The proposed approach can be used in geological research, natural resource analysis, and automated processing of geochemical data.
Журнал: Устойчивое развитие горных территорий
Выпуск журнала: Т. 17, № 4
Номера страниц: 2153-2161
ISSN журнала: 19984502
Место издания: Владикавказ
Издатель: Северо-Кавказский горно-металлургический институт