Тип публикации: патент
Год издания: 2022
Аннотация: Программа предназначена для классификации текста на два класса: содержит или нет информацию о недоступности сервиса. Работа начинается с загрузки обученных моделей классификатора и преобразования текста в вектора. Затем происходит ожидание входных данных. Каждая строка проходит обработку, показывающую наилучший результат при обученПоказать полностьюии классификатора. Каждая строка приводится к нижнему регистру, далее происходит удаление различных чисел, специальных символов и эмодзи, стоп-слов - всего того, что не несет смысловой нагрузки, но будет являться признаком. Далее каждое слово приводится к его нормальной форме, для этого используется библиотека pymorphy2. Предложения после обработки попадают в модель, преобразующую предложения в наборы векторов. Данные вектора подаются в заранее обученную модель машинного обучения, выдающую вероятность принадлежности предложения к интересующему классу. Тип ЭВМ: ПК на базе процессора Intel Core i3 и выше. ОС: Windows ХР и выше, Linux, Unix.