Разработка информационно-справочной системы для базы знаний по природно-техногенной безопасности регионов Сибири : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2025

Идентификатор DOI: 10.17587/prin.16.632-645

Ключевые слова: large language model (LLM), Contextual Question-Answering System, vector database, Retrieval-Augmented Generation (RAG), Text Generation Interface, FastAPI, ReAct, большая языковая модель, вопрос-контекст-ответная система, векторная база данных, генерация с извлечением, rag

Аннотация: Описан современный подход к разработке вопрос-контекст-ответной системы, предназначенной для информационной поддержки территориального управления и повышения природной и техногенной безопасности сибирских регионов. В основе системы лежат большие языковые модели (БЯМ), применяющие метод генерации с дополнением контекста (Retrieval-AПоказать полностьюugmented Generation). База знаний формируется на основе данных федеральных проектов, методов цифрового мониторинга и геоинформационного анализа. Это позволяет прогнозировать экологические и техногенные риски, а также предлагать управленческие решения для органов власти и бизнеса. Для хранения и быстрого доступа к данным используется векторная база PostgreSQL с расширением pgvector. Работа БЯМ обеспечивается платформой Text Generation Interface, серверная часть построена на фреймворк FastAPI, клиентская - на базе библиотеке React. This article presents a modern approach to developing a question-answering system aimed at supporting decision making in territorial governance and enhancing environmental and industrial safety in Siberian regions. The proposed system leverages large language models (LLMs) enhanced with the Retrieval-Augmented Generation (RAG) framework. The knowledge base integrates heterogeneous data sources, including federal projects documentation, digital monitoring outputs, and geospatial datasets, enabling proactive risk assessment and regulatory compliance solutions for governmental and industrial stakeholders. To ensure efficient information retrieval and storage, the system utilizes a PostgreSQL database extended with pgvector for vector similarity searches. The LLM inference pipeline is deployed via the Text Generation Interface (TGI), with a backend built on FastAPI and a React-based frontend interface. Experimental evaluation demonstrates that incorporating re-ranking mechanisms based on token-level query-document matching significantly improves answer relevance and accuracy. The system generates responses in HTML format, allowing structured presentation of information enriched with hyperlinks to relevant figures, tables, and bibliographic references. When available, associated visual elements such as charts, maps, and tabular data are dynamically embedded alongside the generated text. This integration ensures that users can access supporting materials directly within the response interface without switching between different views or documents. Such capabilities enhance the interpretability and traceability of the provided information, particularly for domain experts who rely on contextual details and evidence-based insights. The intuitive graphical user interface further enhances accessibility for non-technical users, offering interactive navigation through complex datasets and analytical summaries. All components of the system have been designed with modularity and scalability in mind, enabling seamless adaptation to other subject domains. As a result, the solution demonstrates strong potential for broader application in public administration, emergency response planning, and risk management contexts beyond the scope of the initial implementation.

Ссылки на полный текст

Издание

Журнал: Программная инженерия

Выпуск журнала: Т. 16, 12

Номера страниц: 632-645

ISSN журнала: 22203397

Место издания: Москва

Издатель: ООО "Издательство "Новые технологии"

Персоны

  • Попов С.Е. (Федеральный исследовательский центр информационных и вычислительных технологий)
  • Потапов В.П. (Федеральный исследовательский центр информационных и вычислительных технологий)
  • Москвичев В.В. (Федеральный исследовательский центр информационных и вычислительных технологий)
  • Чернякова Н.А. (Федеральный исследовательский центр информационных и вычислительных технологий)

Вхождение в базы данных