КЛАСТЕРИЗАЦИЯ РАЗНОТИПНЫХ ДАННЫХ С ПОМОЩЬЮ МЕТОДА ДВУДОЛЬНЫХ МНОЖЕСТВ : доклад, тезисы доклада

Описание

Перевод названия: CLUSTERING POLYTYPIC DATA USING THE BIPARTITE SETS METHOD

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Системы управления, информационные технологии и математическое моделирование; Омск; Омск

Год издания: 2022

Идентификатор DOI: 10.25206/978-5-8149-3487-1-2022-1-10-15

Ключевые слова: clustering, polytypic data, bipartite set of events, Minkovsky distance, k-means, кластеризация, разнотипные данные, двудольное множество событий, расстояние по Минковскому, k-средние

Аннотация: В данной работе предлагается метод кластеризации разнотипных данных, одни из которых являются числовыми, а другие - множественными. Предложенный метод относится к вероятностному подходу и основывается на методе двудольных множеств событий. Под двудольным множеством событий понимается объединение двух множеств событий, первая доля кПоказать полностьюоторого определяется случайными величинами, а вторая - случайными множествами. Основная идея метода заключается в том, что каждому объекту кластеризации ставится в соответствие двудольное множество событий, и затем проводится разбиение полученных множеств на кластеры. В качестве метрики для нахождения расстояния между объектами используется вероятностная метрика - вероятность симметрической разности по Минковскому. Предложенный метод представляет собой вероятностный аналог метода k-средних In paper is offered the new method of clustering polytypic data, the one part of which is numerical and the second part is multiple. The suggested method applies to the probabilistic approach and bases on the bipartite set of random events method. The bipartite set of events is determined as union of two sets of events, whose first part corresponds to the random variables, and second part - to the sets. The basic idea of this method concludes in reduction an clustering of objects from a multidimensional space to analysis of corresponding bipartite sets of events. It is offered to use the probability of Minkovsky symmetry difference as distance between bipartite sets of events. The suggested method is a probabilistic analog of the k-means method

Ссылки на полный текст

Издание

Журнал: Системы управления, информационные технологии и математическое моделирование

Номера страниц: 10-15

Место издания: Омск

Издатель: Омский государственный технический университет

Персоны

Вхождение в базы данных