Topic Categorization Based on Collectives of Term Weighting Methods for Natural Language Call Routing : научное издание

Описание

Перевод названия: Определение темы для маршрутизации вызовов на естественном языке на основе коллективов методов взвешивания термов

Тип публикации: статья из журнала

Год издания: 2016

Идентификатор DOI: 10.17516/1997-1397-2016-9-2-235-245

Ключевые слова: natural language call routing, text classification, Term weighting, маршрутизация вызовов на естественном языке, классификация текста, взвешивание термовю

Аннотация: Natural languagecall routingisanimportant data analysisproblem whichcanbe appliedin di?erentdomains including airspace industry. Thispaperpresents the investigationofcollectivesof term weighting methods for natural language call routing based on text classi?cation. The main idea is that collectives of di?erent term weighting methodПоказать полностьюs can provide classi?cation e?ectiveness improvement with the same classi?cation algorithm. Seven di?erent unsupervised and supervised term weighting methods were tested and compared with each other for classi?cation with k-NN. After that di?erent combinations of term weighting methods were formed as collectives. Two approaches for the handling of the collectives were considered: the meta-classi?er based on the rule induction and the majority vote procedure. The numerical experiments have shown that the best result is provided with the vote of all seven di?erent term weighting methods. This combination provides a signi?cant increasing of classi?cation e?ectiveness in comparison with the most e?ective term weighting methods. Маршрутизация вызовов на естественном языке - актуальная задача анализа данных, которая может найти применение в различных областях, включая аэрокосмическую индустрию. В статье представлено исследование коллективов методов взвешивания термов для машрутизации вызовов на естественном языке на основе классификации текста. Основная идея предлагаемого подхода заключаетсяв том, что коллективы методов взвешивания термов могу обеспечить повышениеэффективности классификации при использовании одногоитого же алгоритма классификации.Семьразличных методов взвешивания термов были протестированыисравнены между собойс использованиемметодаближайших соседейв качестве алгоритма классификации. После этого былисформированыразличные комбинации методов взвешивания термов для дальнейшего использованияв коллективных решающих правилах.Рассмотрено два подхода для формирования коллективных решающих правил: мета-классификатор на основе индукции правил и голосование простым большинством. Численные исследования показали, что наилучший результат достигается при включении всех семирассматриваемых методов взвешивания термоввколлективное решающее правило на основе голосования простым большинством. Такая комбинация обеспечивает статистически значимое улучшениеэффективности классификациив сравнениислучшим по эффективности отедльным методом взвешивания термов.

Ссылки на полный текст

Издание

Журнал: Журнал Сибирского федерального университета. Серия: Математика и физика

Выпуск журнала: Т. 9, 2

Номера страниц: 235-245

ISSN журнала: 19971397

Место издания: Красноярск

Издатель: Федеральное государственное автономное образовательное учреждение высшего образования Сибирский федеральный университет

Персоны

  • Sergienko Roman B. (Institute of Telecommunication Engineering Ulm University)
  • Shan Muhammad (Institute of Telecommunication Engineering Ulm University)
  • Minker Wolfgang (Institute of Telecommunication Engineering Ulm University)
  • Semenkin Eugene S. (Informatics and Telecommunications Institute Siberian State Aerospace University)

Вхождение в базы данных