Тип публикации: статья из журнала
Год издания: 2023
Идентификатор DOI: 10.17513/snt.39865
Ключевые слова: introscope, dangerous objects, detection of dangerous objects, 3D representation of dangerous objects, intelligent decision support system, artificial intelligence, интроскоп, опасные предметы, обнаружение опасных предметов, 3D-представление опасных предметов, интеллектуальная система поддержки принятия решений, искусственный интеллект
Аннотация: Статья содержит обзор существующих методов и технологий детектирования и реконструкции потенциально опасных объектов в видеопотоке рентгеновских изображений c интроскопа. Для решения задачи детектирования объектов на изображениях на сегодняшний день наиболее эффективной технологией является аппарат нейронных сетей. В результате проПоказать полностьюведенного литературного обзора было найдено большое количество исследований, в которых для задачи обнаружения опасных предметов используются различные модели детектирования объектов. В большинстве случаев в статьях для задачи обнаружения объектов применяются «классические» нейросетевые модели: Faster R-CNN, SSD и YOLO. Представленные в статье модели показывают достаточно высокие значения по указанным метрикам. Для класса «Взрывные устройства» был найден только один набор данных, которого нет в открытом доступе. Данный набор включает в себя только три компонента для сбора взрывного устройства, при условии, что на сегодняшний момент существует большое число как взрывчатых веществ, так и различных подручных материалов для их сбора. Что касается проблемы 3D-реконструкции, на данный момент существует множество решений для реконструкции единичных объектов, восстановление множества объектов встречается заметно реже. Существующие подходы различаются форматом представления результатов реконструкции: воксели, полигоны и облака точек. Для задачи реконструкции опасных предметов на кадрах, получаемых с интроскопа, наиболее подходящим является воксельное представление из-за его способности точно передавать внутреннюю структуру объекта, а также из-за относительной простоты при обработке и анализе данных. Облака точек также могут быть полезными для детального анализа отдельных объектов, но для быстрой реконструкции на основе данных с интроскопа может оказаться менее эффективным, чем воксельное представление. Перевод изображений с интроскопа в полигональные модели является более сложной задачей, особенно при нечеткости и перекрытии объектов в багаже и ручной клади. Данное исследование выполнено за счет гранта Красноярского краевого фонда поддержки научной и научно-технической деятельности в рамках конкурса научно-технических и инновационных проектов, направленных на развитие сферы железнодорожного транспорта на территории Красноярского края, № 2023032509756. The article contains a survеy of existing methods and technologies of detection and reconstruction of potentially dangerous objects in the video stream of x-ray images from the introscope. To solve the problem of detecting objects in images, the most effective technology today is the neural network apparatus. As a result of the literature review, a large number of studies were found in which different object detection models are used for the problem of detecting dangerous objects. In most cases, the articles use “classical” neural network models for the task of object detection: Faster R-CNN, SSD, and YOLO. The models presented in the articles show quite high values for the mentioned metrics. For the Explosive Devices class, only one dataset was found that is not in the public domain. This dataset contains only three components to assemble an explosive device, as there are currently a large number of both explosives and various improvised materials to assemble them. Regarding the 3D reconstruction problem, there are currently many solutions for single object reconstruction, but reconstruction of multiple objects is much less common. Existing approaches differ in the representation format of the reconstruction results: voxels, polygons, and point clouds. For the task of reconstructing dangerous objects on the images received by the Introscope, the voxel representation is the most suitable. This research was carried out at the expense of a grant from the Krasnoyarsk Regional Fund for the Support of Scientific and Scientific-Technical Activities within the framework of a competition of scientific, technical and innovative projects aimed at developing the sphere of railway transport in the Krasnoyarsk Territory, No. 2023032509756.
Журнал: Современные наукоемкие технологии
Выпуск журнала: № 12-1
Номера страниц: 87-93
ISSN журнала: 18127320
Место издания: Москва
Издатель: ООО "Издательский дом "Академия естествознания"