Тип публикации: статья из журнала
Год издания: 2024
Идентификатор DOI: 10.18127/j5604128-202404-09
Ключевые слова: large language models, Academic genealogy, information processing, semantic classification, большие языковые модели, академическая генеалогия, обработка информации, семантическая классификация
Аннотация: Постановка проблемы. Сегодня, в эпоху перехода к информационному обществу, проблема анализа и обработки научной информации стоит крайне остро. Это обусловлено тем, что использование результатов и обработки прямо и косвенно влияет на стратегию страны в области образовательной деятельности. Прямое влияние проявляется во внедрении резПоказать полностьюультатов научной деятельности в образовательный процесс в форме учебного материала. В то же время косвенное влияние задействует более сложный механизм, который имеет более долговременный результат за счёт реализации эффектов от поколенческих ценностей, которые формируются в возрасте 12-14 лет под воздействием существующего технологического развития, семейных ценностей и социокультурной обстановки, что, в свою очередь, формирует образцы поведения, которые влияют на процесс выбора и изучения новой информации, выработки новых подходов, принятия ключевых решений, что напрямую оказывает воздействие на промышленный потенциал страны. В настоящее время существует достаточно обширное число наукометрических методов для исследования научной информации. Однако все эти методы используют в той или иной форме формальный анализ и бесконтекстный подход к оценке цитирований, которые не позволяют качественно оценить обработку и трансформацию информации в процессе научной деятельности, что является необходимым условием для развития промышленности страны. Цель. Разработать алгоритм классификации научной информации посредством формирования запросов с использованием больших языковых моделей для обеспечения контекстного анализа цитирований в научных работах и классификации научной информации на основании глубокого семантического анализа. Результаты. Сформированы требования к выборке научной информации, обеспечивающие наиболее качественные результаты анализа с точки зрения экспертного мнения. Представлен алгоритм формирования запросов к большим языковым моделям, позволяющий обеспечить контекстный анализ и классификацию библиографических ссылок в научной информации. Предложен подход для кластеризации научной информации с учётом мультидисциплинарного характера исследований и обеспечения преемственности исследований на базе лингвистических базисов. Показано, что качество контекстного анализа библиографических ссылок за счёт разработанного алгоритма возросло на 27% по сравнению с использованием большой языковой модели без данного алгоритма. Практическая значимость. На основе экспериментальных данных можно выполнить предсказания изменений в социальной и образовательной сферах. Today, in the era of transition to the information society, the issue of analysis and processing of scientific information is extremely acute. This is due to the fact that the use of results and processing directly and indirectly affect the country's strategy in the field of educational activities. Direct influence is manifested in the introduction of the results of scientific activity into the educational process in the form of educational material. At the same time, indirect influence involves a more complex mechanism, which was described by the authors earlier and has a more long-term effect due to the implementation of the effects of generational values that are formed at the age of 12-14 years under the influence of existing technological development, family values and the socio-cultural environment, which in turn forms patterns of behavior that affect the process of choosing and studying new information, developing new technical solutions, making key decisions, which directly influence the industrial potential of the country. Currently, there is a fairly large number of scientometric methods for studying scientific information, which, among other things, allow implementing in a limited form the idea of D. Price about the "invisible college", when in the course of analyzing scientific information it is possible to determine the scientific social structure consisting of universities, research institutes, scientific journals, conferences, scientists in individual fields of science. However, all methods use in one form or another formal analysis and a context-free approach to assessing citations, which does not allow for a qualitative assessment of the processing and transformation of information in the process of scientific activity, which is a necessary condition for the development of the country's industry. Creating an algorithm for classifying scientific information by generating prompts for a large language model to ensure contextual analysis of citations in scientific papers and classifying scientific information based on deep semantic analysis. Requirements have been formed for the selection of scientific information that provides the highest quality analysis results from the point of view of expert opinion. The presented algorithm for generating queries to a large language model facilities contextual analysis and classification of bibliographic references in scientific information. The proposed approach for clustering scientific information takes into account the multidisciplinary nature of research and ensures the continuity of research based on multidimensional bases. It is shown that the quality of contextual analysis of bibliographic references due to the developed algorithm has increased by 27% compared to using a large language model without this algorithm. Based on experimental studies, the possibility of predicting changes in the social sphere is shown. The algorithm for generating queries to a large language model is presented, facilities for contextual analysis and classification of bibliographic references in scientific information. The proposed approach for clustering scientific information takes into account the multidisciplinary nature of research and ensures the continuity of research based on linguistic multidimensional bases.
Журнал: Электромагнитные волны и электронные системы
Выпуск журнала: Т.29, №4
Номера страниц: 108-120
ISSN журнала: 15604128
Место издания: Москва
Издатель: ООО "Издательское предприятие редакции журнала "Радиотехника"