ПРОГНОЗИРОВАНИЕ ВЫРУЧКИ ПРЕДПОЛАГАЕМОЙ ТОРГОВОЙ ТОЧКИ СЕТИ МЕДИЦИНСКИХ ТОВАРОВ НА ОСНОВЕ ГЕОИНФОРМАЦИОННЫХ ДАННЫХ : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2020

Идентификатор DOI: 10.17513/snt.38074

Ключевые слова: искусственный интеллект, задача прогнозирования, регрессия, машинное обучение, геоинформационные системы, торговая сеть, artificial intelligence, prediction, regression, machine learning, geographic information systems, retail network

Аннотация: Вследствие стремительного роста популярности применения методов машинного обучения в практической среде инженеры по работе с данными сталкиваются с рядом вопросов, касающихся определенной узкой прикладной области. В данной работе подчеркивается специфика задачи, а именно предсказание предполагаемого дохода точки торговой сети. ТочнПоказать полностьюость предсказания строится на наборе факторов, в большей или меньшей мере влияющих на конечный результат. Таким образом, в данной работе были задействованы признаки, описывающие специфику работы торговой точки (время или площадь торгового помещения), а также акцент делался на геопространственных данных (например, количество конкурентов в радиусе 200 м). С учетом таких признаков у исследователей возникают дополнительные условия и варианты комбинаций уже существующих методов интеллектуального анализа данных. Таким образом, в данной работе были сравнены регрессионные модели, а именно лассо и гребневая. Также применены методы предобработки данных, выполнена операция шкалирования, построена корреляционная матрица признаков. В результате работы были определены признаки, которые в большей степени влияют на доход торговых точек, а также вычислена математическая формула модели прогнозирования. Due to the rapidly growing popularity up of machine learning methods in a variety of spheres, so data engineers are confronted with a number of issues relating to a specific application field. This paper focused on the specific issue, namely, predicting the income of the retail network. The accuracy of the prediction is based on a set of features that more or less affect the prediction result. Thus, in this paper, features were used that describe not only the specifics of the retail outlet, such as working time or area of the retail but the emphasis was on geospatial data, for instance, the number of competitors within a radius of 200 meters. Given these features, researchers have additional information and a variety of existing data mining methods. Thus, in this paper, regression models were compared, namely, the lasso and ridge. Data preprocessing and scaling were also applied on the dataset, in addition, a correlation matrix of features was computed. In conclusion, features were identified that affected the income of retail outlets, as well as the mathematical formula of the prediction model, was calculated.

Ссылки на полный текст

Издание

Журнал: Современные наукоемкие технологии

Выпуск журнала: 6-1

Номера страниц: 74-78

ISSN журнала: 18127320

Место издания: Москва

Издатель: ООО "Издательский дом "Академия естествознания"

Персоны

Вхождение в базы данных