Перевод названия: RESEARCH OF METHODS OF DOCUMENT VECTORIZATION BASED ON WORD VECTORIZATION.
Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ; Красноярск; Красноярск
Год издания: 2021
Ключевые слова: word2vec, neural network, classification, logistic regression, embedding, vectorization, нейронная сеть, классификация, логистическая регрессия, эмбеддинг, векторизация
Аннотация: В работе рассмотрены методы векторизации документов помощью алгебраическихкомбинаций векторов слов. Исследуется эффективность применения методов при решении практических задач классификации текстовых документов. Произведена статистическая проверка результатов. Исследование проведено с целью развития средств обработки естественного Показать полностьюязыка, которые имеют большие перспективы использования в космическойотрасли. The paper considers methods of vectorization of documents using algebraic combinations ofword vectors. The effectiveness of the methods in solving practical problems of classification of text documents is investigated. Statistical verification of the results is performed. The research was conducted to develop natural language processing tools that have high prospects for use in the space industry.
Журнал: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ
Выпуск журнала: 2
Номера страниц: 216-218
Место издания: Красноярск
Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева"