РАСПОЗНАВАНИЕ АКТИВНОСТИ ЧЕЛОВЕКА ПО ВИДЕОДАННЫМ : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2022

Идентификатор DOI: 10.12731/2227-930X-2022-12-4-96-110

Ключевые слова: human physical activity recognition, Deep Neural Networks, actions classification, распознавание физической активности человека, глубокие нейронные сети, классификация действий

Аннотация: Настоящая работа посвящена решению задачи классификации вида физической активности человека по визуальным данным. Авторами предложено использование глубинных нейронных сетей с целью определения типа активности. Системы распознавания человеческой активности по видеоданным или отдельному изображению в настоящее время находят активноеПоказать полностьюприменение в различных областях человеческой деятельности от приложений для обучения занятиям спортом до системы контроля эффективности сотрудников предприятия, поэтому решение задачи распознавания действий человека по визуальным данным является актуальной задачей. Авторами разработан алгоритм определения типа физической активности по визуальным данным на основе моделей DenseNet121 и MobileNetV2, а затем самостоятельно построена модель глубокой нейронной сети, так как предварительно обученные сети не давали необходимой точности обнаружения типа физической активности, выполнен подбор гиперпараметров. Программная реализация модели выполнена в среде IDLE на языке программирования Python. Экспериментальные исследования, выполненные на специализированном наборе данных UCF50, содержащем 50 различных видов действий человека, подтверждают эффективность использования предложенного подхода для решения поставленной задачи. Дополнительно репрезентативность тестового набора данных увеличена с помощью видеопоследовательностей, полученных с YouTube. Цель - разработка алгоритма определения физической активности человека по визуальным данным. Метод или методология проведения работы: в работе использованы методы компьютерного зрения; методы глубокого обучения, а также методы объектно-ориентированного программирования. Результаты: разработан алгоритм отслеживания физической активности человека по визуальным данным с применением технологий глубокого обучения. Область применения результатов: применение полученных результатов целесообразно в системах мониторинга деятельности человека, например, при отслеживании преступной деятельности в работе правоохранительных органов, в медицинской диагностике, для отслеживания активности сотрудников офиса и др. The paper considers the problem solution of classifying the type of physical activity of a person according to visual data. The authors propose using of deep neural networks to determine the type of activity. The recognizing human activity from video data or a single image systems are currently actively used in various areas of human activity. As the example we can take the system for monitoring the effectiveness of enterprise employees. So solving the problem of recognizing human actions from visual data is an actual task. The authors developed an algorithm for determining the physical activity type by visual data based on the DenseNet121 and MobileNetV2 models. Then the deep neural network model was built and hyperparameters were selected, because pre-trained networks did not provide the required accuracy of detecting the type of physical activity. The software implementation of the model is made in the IDLE environment in the Python programming language. Experimental studies performed on a specialized UCF50 dataset containing 50 different types of human actions confirm the effectiveness of using the proposed approach to solve the problem. Additionally, the representativeness of the test data set was increased with the help of video sequences obtained from YouTube. Purpose - development of an algorithm for determining a person’s physical activity based on visual data. Methodology: in the work the methods of computer vision, deep learning methods and object-oriented programming methods were used. Results: an algorithm for tracking a person’s physical activity based on visual data using deep learning technologies has been developed. Practical implications: the obtained results can be used in human activity monitoring systems, for example, in tracking criminal activity, in medical diagnostics, in tracking the activity of office employees, etc.

Ссылки на полный текст

Издание

Журнал: International Journal of Advanced Studies

Выпуск журнала: Т.12, 4

Номера страниц: 96-110

ISSN журнала: 23281391

Место издания: Красноярск

Издатель: ООО "Научно-инновационный центр"

Персоны

Вхождение в базы данных