Нормализация данных для обучения и анализа моделью MaskRCNN методом k-means для компьютерного зрения умного холодильника : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2021

Идентификатор DOI: 10.34219/2078-8320-2021-12-4-74-80

Ключевые слова: k-means method, data normalization, Mask-RCNN, метод k-средних, нормализация данных, openCV, Python 3.8

Аннотация: В данной работе предлагается использовать метод k-средних для контролируемой настройки учебной выборки для семантической сегментации изображений в искусственном зрении умного холодильника. Для решения этой задачи предлагается новая двухэтапная архитектура компьютерного зрения. В предлагаемой архитектуре используются различные наборПоказать полностьюы настроек оптимизации контрастирования изображений по показателю точной классификации пикселей по их принадлежности к фрагментам исследуемого изображения. Обширная экспериментальная оценка показывает, что предлагаемый метод имеет ключевые преимущества по сравнению с существующими работами. Во-первых, полученные классы пикселей можно напрямую кластеризовать в семантические группы с помощью k-средних, во-вторых, метод может использоваться при дообучении искусственного интеллекта решению задачи семантической сегментации. Разработчики предлагают подход правильного выбора числа k центроидов для получения хорошего качества кластеров, которое трудно определить при высоком значении k. Для преодоления проблемы инициализации метода k-средних предлагается метод инкрементной кластеризации k-средних, который улучшает качество кластеров с точки зрения уменьшения суммы квадратов ошибок. Проведены всесторонние эксперименты по сравнению с традиционным алгоритмом k-средних и его новыми версиями для оценки производительности предлагаемого метода на синтетически сгенерированных наборах данных и некоторых наборах данных реального мира. This paper proposes using the k-means method for the controlled adjustment of the training sample for semantic image segmentation in the artificial vision of a smart refrigerator. To solve this problem, a new two-stage architecture for computer vision is proposed. In the proposed architecture, various sets of settings for optimizing the contrast of images are used to classify pixels according to their belonging to fragments of the studied image. Extensive experimental evaluation shows that the proposed method has critical advantages over existing work. Firstly, the obtained pixel classes can be directly clustered into semantic groups using k-means. Secondly, the method can be used for additional training of artificial intelligence in solving the semantic segmentation problem. The developers propose an approach to the correct choice of the number k of centroids to obtain good quality clusters, which is difficult to determine at a high k value. To overcome the problem of initializing the k-means method, an incremental k-means clustering method is proposed, which improves the quality of clusters to reduce the sum of squared errors. Comprehensive experiments have been carried out compared to the traditional k-means algorithm and its new versions to evaluate the performance of the proposed method on synthetically generated datasets and some real-world datasets.

Ссылки на полный текст

Издание

Журнал: Информатизация и связь

Выпуск журнала: 4

Номера страниц: 74-80

ISSN журнала: 20788320

Место издания: Москва

Издатель: Администрация Ярославской области, Министерство Российской Федерации по связи и информатизации, Государственная техническая комиссия при Президенте Российской Федерации

Персоны

  • Доррер М.Г. (Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева)
  • Алехина А.Е. (Компания «Фабрика решений»)

Вхождение в базы данных