САМОКОНФИГУРИРУЕМЫЙ ГИБРИДНЫЙ ЭВОЛЮЦИОННЫЙ АЛГОРИТМ ДЛЯ ЗАДАЧ С НЕСБАЛАНСИРОВАННЫМИ ДАННЫМИ И МНОЖЕСТВОМ КЛАССОВ : научное издание

Описание

Перевод названия: SELF-CONFIGURING HYBRID EVOLUTIONARY ALGORITHM FOR MULTI-CLASS UNBALANCED DATASETS

Тип публикации: статья из журнала

Год издания: 2015

Ключевые слова: fuzzy classification system, unbalanced data, evolutionary algorithm, self-configuration, нечеткие системы классификации, несбалансированные данные, эволюционный алгоритм, самоконфигурирование

Аннотация: Рассматривается модификация самоконфигурируемого гибридного эволюционного алгоритма для решения задач классификации. В алгоритме реализована гибридизация Питсбургского и Мичиганского подходов, где Мичиганская часть используется вместе с оператором мутации. Базы правил используют фиксированные нечеткие термы, а число правил в базе мПоказать полностьюожет меняться в ходе работы алгоритма. Также примененный алгоритм использует набор эвристик для определения весов и номеров классов для каждого нечеткого правила с использованием значений достоверности (confidence), которые рассчитываются по обучающей выборке. Особая процедура инициализации позволяет получать более точные нечеткие базы правил на первых поколениях. Модификация изменяет процедуру определения наиболее подходящего номера класса для нечеткого правила. Она использует число объектов различных классов в качестве весовых коэффициентов, чтобы избежать смещения значений достоверности. Модификация в комбинации с другими мерами качества классификации позволяет улучшить результаты классификации. Самоконфигурируемый алгоритм был протестирован на ряде задач классификации с несбалансированными данными и несколькими классами с применением процедуры кросс-валидации и стратифицированным разбиением выборки. Тестовые задачи включали классификацию сегментов изображения, классификацию клиентов банка, распознавание фонем, классификацию содержимого страниц и классификацию снимков со спутника. Для одной из задач были приведены матрицы ошибок, для того чтобы показать увеличение баланса точности по классам. Представленный подход успешно решил задачу классификации снимков со спутника и может быть применен для множества реальных задач, включая задачи из аэрокосмической области. This paper describes a modification of the self-configuring hybrid evolutionary algorithm for solving classification problems. The algorithm implements a hybridization of Pittsburg and Michigan approaches, where Michigan part is used together with mutation operator. The rule bases use fixed fuzzy terms, and the number of rules in the rule base can change during the algorithm run. Also, the applied algorithm uses a set of heuristics to determine the weights and class labels for every fuzzy rule, using the confidence values, which are calculated using the training sample. A special initialization procedure allows getting more accurate fuzzy rule bases on the first generations. The modification changes the procedure of determining the most appropriate class number for the fuzzy rule. It uses the number of instances of different classes, as a weighting coefficient to avoid confidence values bias. Also, we apply two classification quality measures, the classical accuracy value and the average accuracy among classes. The modification, combined with different classification quality measures, allows improvement in the classification results. The self-configuring algorithm is tested on a set of unbalanced classification problems with several classes using cross-validation and a stratified sampling procedure. The test problems included image segment classification, bank client classification, phoneme recognition, classification of page contents, and satellite image classification. For one of the problems, the confusion matrixes are provided to show the increasing balance over the class accuracies. The presented method has efficiently solved the satellite images classification problem and can be applied for many real-life problems, including the problems from aerospace area.

Ссылки на полный текст

Издание

Журнал: Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева

Выпуск журнала: Т. 16, 1

Номера страниц: 131-136

ISSN журнала: 18169724

Место издания: Красноярск

Издатель: Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева

Персоны

  • Становов В.В. (Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева)
  • Семенкина О.Э. (Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева)

Вхождение в базы данных