Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: XII Всероссийская научно-техническая конференция с международным участием "Робототехника и искусственный интеллект"; Железногорск; Железногорск
Год издания: 2020
Ключевые слова: анализ неструктурированных данных, классификация, точность, полнота, тексты, малая длина
Аннотация: В статье рассмотрен подход к классификации коротких текстов (из 1-3 слов) на небольшом (относительно количества классов) корпусе. Генерация валидных обучающей и текстовых выборок позволила производить корректное обучение классификатора. Анализ показателей точности алгоритма позволил выявить классы, для которых качество классификациПоказать полностьюи приемлемо.
Журнал: Робототехника и искусственный интеллект
Номера страниц: 82-87
Издатель: Литера-Принт