Статистические методы анализа естественного языка как способ повышения эффективности его генерации на основе семантических шаблонов

Описание

Перевод названия: STATISTICAL METHODS FOR ANALYZING THE NATURAL LANGUAGE AS MEANS OF INCREASING THE EFFICIENCY OF ITS GENERATION BASED ON SEMANTIC TEMPLATES

Тип публикации: статья из журнала

Год издания: 2014

Ключевые слова: порождающие грамматики, дерево состояний, Generative grammars, trees of states, Natural language generation, semantics, computational linguistics, порождение естественного языка, семантика, компьютерная лингвистика

Аннотация: В статье рассматривается проблема определения семантического метрического расстояния между фрагментами текста на естественном языке с использованием шаблонов генерации осмысленных фраз языка в интеграции с применением анализа корпусов текстов на основе модели марковских процессов. Проблема давно рассматривается с точки зрения методПоказать полностьюов компьютерной лингвистики, искусственного интеллекта, традиционной лингвистики, информатики. Рассматривается вопрос о методах построения шаблонов генерации осмысленных фраз и различных видов проекций информации из этих шаблонов на предложения из корпусов текстов на естественном языке. Делается вывод о необходимости гибридизации статистических и парадигматических методов генерации осмысленных подмножеств языка. The problem of determining the semantic metric distance between fragments of natural language text by using templates of meaningful phrases generation integrated with the analysis of using corpuses based on the model of Markov’s processes is considered. This problem has been considered for a long time in terms of computational linguistics, artificial intelligence, traditional linguistics, computer science. The paper represents the discussion about the methods of constructing templates for generating meaningful phrases and various projections of the information from these templates onto the sentences of a natural language texts corpus. The conclusion about the necessity of hybridization of statistical and paradigmatic methods for generating meaningful subsets of the language is made.

Ссылки на полный текст

Издание

Журнал: Информатизация образования и науки

Выпуск журнала: 4

Номера страниц: 92-103

ISSN журнала: 20737572

Место издания: Москва

Издатель: Федеральное государственное автономное учреждение Государственный научно-исследовательский институт информационных технологий и телекоммуникаций

Персоны

Вхождение в базы данных