ОЦЕНКА РАССТОЯНИЯ В СЕМАНТИЧЕСКОМ И ГРАММАТИЧЕСКОМ ПРОСТРАНСТВЕ МЕЖДУ ОТДЕЛЬНЫМИ ЯЗЫКОВЫМИ ЕДИНИЦАМИ И ФРАГМЕНТАМИ ТЕКСТОВ

Описание

Перевод названия: ESTIMATION OF THE DISTANCES IN SEMANTIC AND GRAMMATICAL SPACE BETWEEN INDIVIDUAL LANGUAGE UNITS AND TEXT FRAGMENTS

Тип публикации: статья из журнала

Год издания: 2014

Ключевые слова: computational linguistics, semantically meaningful text, semantics, Semantic distance, mathematical semantics, the distance between pairs of words in the language, компьютерная лингвистика, семантически осмысленный текст, семантика, семантическое расстояние, математическая семантика, расстояние между парами слов языка

Аннотация: В работе рассматривается проблема оценки семантического и грамматического расстояния между словами и другими единицами осмысленного языка. Данная проблема является подпроблемой генерации семантически осмысленного и грамматически корректного текста на естественном языке. В качестве инструмента оценки семантических расстояний между еПоказать полностьюдиницами языка используется многомерная грамматическая база данных с координатами понятийного вектора. В этой базе грамматические конструкции определены в ячейках многомерного массива данных – многомерного пространства слов языка. Решение вопроса об измерении метрического расстояния между парами слов позволяет определить степень мощности множества сем, общих для рассматриваемого семантического отношения между словами. Численно заданы расстояния в рамках многомерного пространства отношений между словами в рамках семантической классификации слов и понятий языка. Рассмотрены примеры сложений лексических пар в семантическом пространстве с учетом метрики семантического пространства. Также в работе приводятся подходы по определению семантического расстояния между фрагментами текста на основе расстояния между ключевыми словами естественного языка. This paper considers the problem of estimating the semantic and grammatical distance between words and other units of the meaningful language. This problem is a sub-problem of generating semantically meaningful and grammatically correct text in a natural language. As a tool for estimating the semantic distance between the units of the language, a grammatical multidimensional database with the coordinates of the notional vector is applied. In this database grammatical structures are defined in the cells of a multidimensional database - a multidimensional space of words of the language. Solving the task of estimating the metric distance between pairs of words allows determining the power of semes set, common for the considered semantic relations between words. The distance within the multidimensional space of relations between words within the semantic classification of words and notions of the language is numerically determined. The examples of adding lexical unit pairs in the semantic space are viewed, taking into account the metrics of the semantic space. Besides, in the paper approaches for determining the semantic distance between the fragments of the text is present based on the distance between the keywords of the natural language.

Ссылки на полный текст

Издание

Журнал: Современные проблемы науки и образования

Выпуск журнала: 6

Номера страниц: 88-88

ISSN журнала: 20707428

Место издания: Пенза

Издатель: Общество с ограниченной ответственностью "Издательский Дом "Академия Естествознания"

Персоны

  • Личаргин Д.В. (ФГАОУ ВПО «Сибирский федеральный университет»)
  • Полякова О.С. (ФГАОУ ВПО «Сибирский федеральный университет»)
  • Подлесный А.О. (ФГАОУ ВПО «Сибирский федеральный университет»)
  • Кравченко М.В. (ФГАОУ ВПО «Сибирский федеральный университет»)

Вхождение в базы данных