Тип публикации: патент
Год издания: 2024
Аннотация: Программа реализует автоматизированное извлечения метаданных из авторефератов диссертаций с учётом структуры Российской Федерации. Программа предназначена для обработки авторефератов в формате PDF-файлов и соответствующих им XML-файлов. Результаты обработки являются БД в формате CSV для каждого календарного года, в которой содержитПоказать полностьюся информация об именах авторов, его научных руководителей и консультантах, ученых степенях и званиях, специальностях, по которым производится защита и темы диссертационного исследования, город и год, где производится защита. Программа имеет ряд специализированных функций для обработки текста, таких как корректировка разбитых строк, извлечение номеров специальностей, определение ученых степеней и приведение имен к стандартному формату. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Windows XP, Linux, MacOS.