ИССЛЕДОВАНИЕ МЕТОДОВ ВЕКТОРИЗАЦИИ ДОКУМЕНТОВ НА ОСНОВЕ ВЕКТОРИЗАЦИИ СЛОВ : доклад, тезисы доклада

Описание

Перевод названия: RESEARCH OF METHODS OF DOCUMENT VECTORIZATION BASED ON WORD VECTORIZATION.

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ; Красноярск; Красноярск

Год издания: 2021

Ключевые слова: word2vec, neural network, classification, logistic regression, embedding, vectorization, нейронная сеть, классификация, логистическая регрессия, эмбеддинг, векторизация

Аннотация: В работе рассмотрены методы векторизации документов помощью алгебраическихкомбинаций векторов слов. Исследуется эффективность применения методов при решении практических задач классификации текстовых документов. Произведена статистическая проверка результатов. Исследование проведено с целью развития средств обработки естественного Показать полностьюязыка, которые имеют большие перспективы использования в космическойотрасли. The paper considers methods of vectorization of documents using algebraic combinations ofword vectors. The effectiveness of the methods in solving practical problems of classification of text documents is investigated. Statistical verification of the results is performed. The research was conducted to develop natural language processing tools that have high prospects for use in the space industry.

Ссылки на полный текст

Издание

Журнал: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ

Выпуск журнала: 2

Номера страниц: 216-218

Место издания: Красноярск

Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева"

Персоны

  • Шерстнев П. А. (Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева)

Вхождение в базы данных