Перевод названия: Self-configuring hybrid evolutionary algorithm for fuzzy classifier design with active learning for unbalanced datasets
Тип публикации: статья из журнала
Год издания: 2014
Ключевые слова: fuzzy classification system, active learning, evolutionary algorithm, unbalanced data, self-configuration, нечеткие системы классификации, активное обучение, эволюционный алгоритм, самоконфигурация, несбалансированные данные
Аннотация: Описывается метод активного выбора обучающих примеров для самоконфигурирующегося гибридного эволюционного алгоритма формирования нечетких баз правил для задач классификации. Данный метод относится к методам отбора измерений, позволяющим не только снизить объем требуемых вычислительных ресурсов, но также улучшить качество получаемыхПоказать полностьюклассификаторов. Метод меняет вероятности выбора измерений для обучающей подвыборки в зависимости от того, насколько хорошо они классифицируются алгоритмом. Через некоторое число поколений выборка меняется и вероятности пересчитываются. Те измерения, которые не использовались ранее, и те, на которых алгоритм совершал ошибки, имели большую вероятность попасть в обучающую выборку. Вероятности выбора измерений рассчитывались с использованием процедуры, схожей с процедурой пропорциональной селекции в генетическом алгоритме. Описанная идея выбора обучающих примеров реализована для алгоритма построения нечетких классификаторов. Данный алгоритм использует комбинацию питсбургского и мичиганского подходов для построения баз правил с фиксированными термами, причем мичиганский подход используется вместе с оператором мутации. Размер баз правил не фиксирован и может изменяться в ходе работы алгоритма, а соответствующий номер класса и вес для каждого правила рассчитываются эвристически. Помимо этого в алгоритме применяется инициализация с использованием измерений выборки, для генерации более точных правил. В мичиганской части реализованы операторы добавления правил, удаления правил и замещения правил. При этом создание правил могло производиться как генетически, с использованием имеющихся в базе правил, так и эвристически, с использованием некорректно классифицированных объектов. Работоспособность алгоритма показана на ряде сложных задач классификации с множеством классов, в качестве мер качества классификации использовалась общая точность классификации и средняя точность по всем классам. The paper describes an active training example selection for a self-configured hybrid evolutionary algorithm for fuzzy rule bases design for classification problems. This method is related to instance selection methods, which allow not only decreasing of required computational recourses, but also increasing the quality of the obtained classifiers. The method changes the probabilities of instances which are selected into the training subsample depending on how good they are classified by the algorithm. After several generations the sample is changed and probabilities are recalculated. Those instances which were not used before and those which were misclassified by the algorithm had higher probabilities of getting into the training sample. The probabilities of instance selection were calculated using a procedure similar to proportional selection in the genetic algorithm. The idea of training instance selection described here was implemented for the fuzzy classifiers forming. This algorithm uses the combination of Pittsburg and Michigan approach for fuzzy rule base design with fixed terms, and the Michigan approach is used together with the mutation operator. The size of the rule base is not fixed, and may change during the algorithm run, and a corresponding class number and the rule weight were calculated heuristically for every rule. Moreover, the algorithm uses an initialization procedure that uses instances from the sample to generate more accurate rules. In the Michigan part the operators of adding rules, deleting rules and replacing rules has been implemented. The creation of new rules could be performed by genetic approach - using the existing rules, and heuristically - using those instances which were misclassified. The efficiency of the algorithm was shown on a set of complex classification problems with several classes, as an efficiency measure the overall accuracy and the average accuracy among classes was used.
Журнал: Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева
Выпуск журнала: № 5
Номера страниц: 128-135
ISSN журнала: 18169724
Место издания: Красноярск
Издатель: Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева