Тип публикации: патент
Год издания: 2021
Аннотация: Программа позволяет сократить количество признаков опорного словаря признаков за счет процедуры векторизации текста с помощью моделей машинного обучения, генетического алгоритма и метода TF-IDF. Интеллектуальная система анализа текста избавляет пользователя от необходимости ручной обработки данных и существенно экономит время для рПоказать полностьюешения других задач. Программа может использоваться в задачах изучения мнения покупателей или пользователей функционала в случае, когда отзывы представлены в виде текста на естественном языке, а объемы таких отзывов не позволяют обрабатывать их в ручном режиме. На 1 этапе происходит загрузка текстовых сообщений как последовательности строк в формате excel или csv. Затем на основе ГА происходит выбор наиболее информативных слов и векторизация текста методом TFIDF. На основе полученных векторов происходит обучение модели классификации.