ЖАДНАЯ АГЛОМЕРАТИВНАЯ КЛАСТЕРИЗАЦИЯ ПРИ ОБРАБОТКЕ БОЛЬШИХ ДАННЫХ

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: ВСЕРОССИЙСКИЙ ФОРУМ МОЛОДЫХ ИССЛЕДОВАТЕЛЕЙ - 2024; Петрозаводск; Петрозаводск

Год издания: 2024

Ключевые слова: кластеризация, анализ данных, жадные агломеративные алгоритмы, clustering, data analysis, greedy agglomerative algorithms

Аннотация: Кластеризация - ключевая техника в анализе данных для группирования подобных объектов, что облегчает выявление паттернов и способствует эффективной организации данных. Одним из применений кластеризации является создание индексов векторных баз данных, которые разбивают точки данных на подмножества на основе их близости к центроидам.Показать полностьюМетод жадной агломеративной кластеризации прост: он начинается с отдельных объектов и постепенно объединяет их в кластеры. В работе проводится анализ эффективности предлагаемого метода. Clustering is a key technique in data analysis that groups similar objects, facilitating the identification of patterns and promoting efficient data organization. An application of clustering is the creation of vector database indexes, which partitions data points into subsets based on their proximity to centroids. The greedy agglomerative clustering method is simple: starting with individual objects, it gradually merges them into clusters. In this paper, we analyze the proposed method.

Ссылки на полный текст

Издание

Журнал: Всероссийский форум молодых исследователей - 2024

Номера страниц: 113-117

Место издания: Петрозаводск

Персоны

  • Казаковцев Владимир Львович (Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева)
  • Казаковцев Лев Александрович (Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева)

Вхождение в базы данных