ВЫЧИСЛЕНИЕ ВЕКТОРА ДОКУМЕНТА С ИСПОЛЬЗОВАНИЕМ МЕРЫ TF-IDF : доклад, тезисы доклада

Описание

Перевод названия: CALCULATING A DOCUMENT VECTOR USING THE TF-IDF MEASURE

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ; Красноярск; Красноярск

Год издания: 2021

Ключевые слова: tf-idf, vectorization, embedding, text classification, inverse document frequency, logistic regression, векторизация, эмбеддинг, классификация текста, обратнаячастота документа, логистическая регрессия

Аннотация: В данной работе исследуются подходы вычисления вектора документа из векторов словс использованием обратной частоты документа. Производится сравнительный анализ эффективности методов на основе результатов прикладных задач классификации. Исследования мотивированы перспективами создания интеллектуальных информационных систем для поддеПоказать полностьюржки деятельности космонавтов. In this paper, we investigate approaches for calculating a document vector from word vectorsusing the inverse frequency of the document. A comparative analysis of the effectiveness of the methods based on the results of applied classification tasks is performed. The research is motivated by the prospects of creating intelligent information systems to support the activities of astronauts.

Ссылки на полный текст

Издание

Журнал: АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВИАЦИИ И КОСМОНАВТИКИ

Выпуск журнала: 2

Номера страниц: 213-215

Место издания: Красноярск

Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева"

Персоны

  • Шерстнев П.А. (Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева)

Вхождение в базы данных