Разработка теоретических основ оптимального синтеза и анализа многоуровневых непараметрических систем классификации : отчет о НИР

Описание

Перевод названия: An elaboration of a theoretical foundation of an optimal synthesis and analysis of multilevel nonparametric systems of classification.

Тип публикации: отчёт о НИР

Год издания: 1997

Аннотация: С позиций общей теории систем и теории статистических решений впервые обоснована методика синтеза и анализа многоуровневых непараметрических систем классификации в задачах обработки больших массивов данных и моделирования процессов развития по их повторяющимся реализациям. Математическую основу предложенного подхода составляют поняПоказать полностьютие макросостояния как области в пространстве переменных процессов развития и теоремы об условиях его динамического представления с помощью множеств операторов смены макросостояний и соответствующих им однозначных функций выхода. На объектах введенной структуры определяется вероятностный критерий типа аддитивного аналога функции среднего риска и осуществляется оптимальный статистический синтез модели процесса развития. При этом операторы сопряжения между макросостояниями смежных по времени уровней структуры восстанавливаются непараметрическими алгоритмами распознавания образов, а закономерности взаимосвязи между переменными процесса в пределах макросостояния статическими моделями. Используя принципы декомпозиции систем в каскадные структуры, предложенный подход обобщен при построении классификационных моделей комплекса взаимодействующих процессов развития. Исследованы асимптотические свойства разработанных статистических оценок вероятностных показателей эффективности многоуровневых систем классификации. Установлена зависимость их скоростей сходимости от параметров структуры и объема исходной информации. Полученные результаты обобщают ряд утверждений теории марковских цепей.p Для "обхода" проблемы обработки больших массивов статистических данных разработаны и исследованы многоуровневые непараметрические системы распознавания образов, реализующие условно-последовательную процедуру принятия решений в пространствах различных наборов признаков. Каждый последующий этап классификации осуществляется в области неоднозначных решений предыдущего этапа. Создан структурно-параметрический подход оптимизации многоуровневых непараметрических систем классификации. Исследованы свойства высокоэффективных рандомизированных процедур выбора коэффициентов размытости непараметрических статистик, определен оптимальный закон их распределения. Результаты теоретических исследований опубликованы в монографии "Многоуровневые непараметрические системы принятия решений" For the first time synthesis and analysis methods of classification multilevel nonparametric systems for a processing of large data set and for a simulation of development processes by their replicate samples were substantiated in the context of a general systems theory and a statistical decisions theory. A mathematical basis of the proposed approach consists in a definition of a macrostate as an area in a development processes parameters space and in a theorem about conditions of their presentation with the help of sets of macrostates changes operators and single-valued output functions corresponding to them. For objects of this structure a probabilistic criterion as an additive analogue of a average risk function is defined and an optimal statistic synthesis of a development process model by results of an input data decomposition is made. In similar systems conjugation operators between macro-states of structure levels, which are adjacent in time, are reconstructed with the help of nonparametric algorithms of a pattern recognition, regularities of an interconnection on the macrostates between the process variables are reconstructed with the help of statistic models.p With the use of principles of a system decomposition into cascade structures the proposed approach is extended for a construction of classification models of a interacting development processes complex. An asymptotic properties of statistical estimates of a probabilistic effectivity index (probabilities of the macro-states changes or their path tracing) of multilevel classification system. It is deduced that their degree of convergence depends on structure parameters and input data set size. Received results extend the Markov chains theory.p For a "bypass" of a large statistic samples processing problem multilevel nonparametric systems of pattern recognition were developed. These systems use a conditional- sequential procedure of a decision-making in spaces of different feature sets. Every succeeding stage of the classification is realized in the area of previous stage ambiguous decisions. A structural-parametric approach to an optimisation of the classification multilevel nonparametric systems is created. Properties of high-effective randomized procedures for nonparametric statistics fuzzifying coefficients are investigated, their optimal distribution law is defined. The results of the theoretical investigations have been published in a monograph: "Multilevel nonparametric systems of decision-making".

Ссылки на полный текст

Авторы

  • Лапко А.В. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))
  • Востротина А.С. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))
  • Высоцкая Г.С. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))
  • Новоходько Н.А. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))
  • Ченцов С.В. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))
  • Юдин Н.А. (Вычислительный центр СО РАН в Красноярске (ВЦКр СО РАН))

Вхождение в базы данных