Перевод названия: CALCULATING A DOCUMENT VECTOR USING THE TF-IDF MEASURE
Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ; Красноярск; Красноярск
Год издания: 2021
Ключевые слова: tf-idf, vectorization, embedding, text classification, inverse document frequency, logistic regression, векторизация, эмбеддинг, классификация текста, обратнаячастота документа, логистическая регрессия
Аннотация: В данной работе исследуются подходы вычисления вектора документа из векторов словс использованием обратной частоты документа. Производится сравнительный анализ эффективности методов на основе результатов прикладных задач классификации. Исследования мотивированы перспективами создания интеллектуальных информационных систем для поддеПоказать полностьюржки деятельности космонавтов. In this paper, we investigate approaches for calculating a document vector from word vectorsusing the inverse frequency of the document. A comparative analysis of the effectiveness of the methods based on the results of applied classification tasks is performed. The research is motivated by the prospects of creating intelligent information systems to support the activities of astronauts.
Журнал: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ
Выпуск журнала: 2
Номера страниц: 213-215
Место издания: Красноярск
Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева"