Программа для бинарной классификации комментариев, описывающих доступность сервиса : регистрация программы для ЭВМ

Описание

Тип публикации: патент

Год издания: 2022

Аннотация: Программа предназначена для классификации текста на два класса: содержит или нет информацию о недоступности сервиса. Работа начинается с загрузки обученных моделей классификатора и преобразования текста в вектора. Затем происходит ожидание входных данных. Каждая строка проходит обработку, показывающую наилучший результат при обученПоказать полностьюии классификатора. Каждая строка приводится к нижнему регистру, далее происходит удаление различных чисел, специальных символов и эмодзи, стоп-слов - всего того, что не несет смысловой нагрузки, но будет являться признаком. Далее каждое слово приводится к его нормальной форме, для этого используется библиотека pymorphy2. Предложения после обработки попадают в модель, преобразующую предложения в наборы векторов. Данные вектора подаются в заранее обученную модель машинного обучения, выдающую вероятность принадлежности предложения к интересующему классу. Тип ЭВМ: ПК на базе процессора Intel Core i3 и выше. ОС: Windows ХР и выше, Linux, Unix.

Ссылки на полный текст

Персоны

  • Янбекова Кристина Димовна
  • Рыбков Mихаил Викторович
  • Перехрест Василий Дмитриевич
  • Танич Константин Дмитриевич
  • Хоров Данил Владимирович
  • Дятлов Андрей Анатольевич

Вхождение в базы данных