ЗАПОЛНЕНИЕ ПРОПУСКОВ ВО ВХОДНЫХ И ВЫХОДНЫХ ДАННЫХ С ПОМОЩЬЮ АЛГОРИТМА НЕПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ : научное издание

Описание

Перевод названия: FILLING THE GAPS IN THE INPUT AND OUTPUT DATA USING THE ALGORITHM OF NONPARAMETRIC IDENTIFICATION

Тип публикации: статья из журнала

Год издания: 2018

Идентификатор DOI: 10.31772/2587-6066-2018-19-4-589-597

Ключевые слова: непараметрическая идентификация, оценка кривой регрессии, моделирование, анализ данных, пропуски в данных, Nonparametric identification, regression curve estimation, modeling, data analysis, data gaps

Аннотация: Задача идентификации систем, т. е. определение структуры и параметров систем по наблюдениям, явля- ется одной из основных задач современной теории и техники автоматического управления. Точность решения задачи идентификации напрямую зависит от качества исходных данных (выборки наблюдений). Однако данные могут содержать в себе различПоказать полностьюные недостатки, в частности, пропуски. Пробелы (пропуски) в данных возникают вследствие множества причин, таких как невозможность наблю- дения, отсутствие необходимых инструментов и т. п. Самый простой метод работы с такими данными - исключение из таблицы показателя (столбец) или объекта (строки) с пробелом. При большом количестве про- пусков в данных этот подход приводит к уменьшению точности модели из-за сокращения объема выборки. Важно отметить, что в описанном случае сложность решения задачи идентификации повышается, особенно когда плотность пропусков высока, их расположение нерегулярно, а данных недостаточно (крайне мало). Целью работы является повышение точности решения задачи идентификации дискретно-непрерывных многомерных процессов по выборкам наблюдений с пропусками. Для достижения поставленной цели использо- вались методы математической статистики, анализа данных, математического моделирования. Описан алгоритм непараметрической оценки кривой регрессии в дискретно-непрерывном процессе в задаче заполнения пропусков матрицы наблюдений. Также на основе этого алгоритма строится модель. Были прове- дены два вычислительных эксперимента. Первое исследование проведено в условиях наличия пропусков в вы- ходной переменной матрицы наблюдений. Второй эксперимент проходил при наличии пробелов во входных переменных. Исследования проводились при различных объемах выборки. По итогам работы алгоритма при различных условиях приведены некоторые выводы. Результаты работы могут быть полезны при создании систем управления многомерными дискретно- непрерывными процессами. The task of identifying systems, that is, determining the structure and parameters of systems from observations, is one of the main tasks of a modern theory and technology of automatic control. The accuracy of solving the identifica- tion problem directly depends on the quality of the initial data (sample of observations). However, the data may contain various shortcomings, in particular, gaps. Gaps in the data are due to a variety of reasons, such as inability to observe, lack of necessary tools, and so on. The easiest method of working with such data is to exclude from the table an indicator (column) or an object (line) with a space. With a large number of gaps in the data, this approach leads to a reduction in the accuracy of the model due to a reduction in the sample size. It is important to note that in the described case the complexity of solving the identification problem increases, especially when the density of passes is high, their location is irregular, and the data is insufficient (very little). The aim of the paper is to improve the accuracy of solving the problem of identifying discrete-continuous multidi- mensional processes from samples of observations with gaps. To achieve this goal, methods of mathematical statistics, data analysis, and mathematical modelings were used. In the article the algorithm of a non-parametric estimation of the regression curve in a discrete-continuous process in the task of filling out the admissions of the observation matrix is described. Moreover, a model is built based on this algorithm. Two computational experiments were carried out. The first experiment was conducted in the presence of gaps in the output variable matrix of observations. The second experiment was conducted with gaps in the input variables. The experiments were conducted at different sample sizes. Based on the results of the algorithm under vari- ous conditions, conclusions are given. The results of the work can be useful in creating control systems for multidimensional discrete-continuous processes.

Ссылки на полный текст

Издание

Журнал: Сибирский журнал науки и технологий

Выпуск журнала: Т. 19, 4

Номера страниц: 589-597

ISSN журнала: 25876066

Место издания: Красноярск

Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева

Персоны

  • Осипов П.А. (Сибирский федеральный университет, Институт космических и информационных технологий)
  • Осипова Я.С. (Сибирский федеральный университет, Институт космических и информационных технологий)
  • Хоркуш А.В. (Сибирский федеральный университет, Институт космических и информационных технологий)
  • Вдовых П.Е. (Сибирский федеральный университет, Институт космических и информационных технологий)
  • Верхотурова М.В. (Сибирский федеральный университет, Институт космических и информационных технологий)

Вхождение в базы данных