Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Региональные проблемы дистанционного зондирования Земли; Красноярск; Красноярск
Год издания: 2024
Ключевые слова: оцифровка текста, разметка данных, распознавание рукописного текста, text digitization, data labeling, handwritten text recognition
Аннотация: Создание набора данных для задачи распознавания текста отчетов губернатора Красноярского края представляет собой важную и сложную задачу, особенно в контексте работы с историческими рукописными документами. Качественная разметка данных имеет решающее значение для успешного обучения алгоритмов распознавания текста [1], что, в свою оПоказать полностьючередь, способствует точной и полной оцифровке рукописей. Для разметки использованы уникальные архивные материалы. Результаты работы могут найти применение как в научных исследованиях, так и в развитии технологий автоматического распознавания исторических текстов. Creating a dataset for the task of recognizing the text of the reports of the governor of Krasnoyarsk Krai is an important and complex task, especially in the context of working with historical handwritten documents. High-quality data labeling is crucial for the successful training of text recognition algorithms [1], which, in turn, contributes to the accurate and complete digitization of manuscripts. Unique archival materials were used for labeling. The results of the work can find application both in scientific research and in the development of automatic recognition technologies for historical texts.
Журнал: Региональные проблемы дистанционного зондирования Земли
Номера страниц: 302-305
Место издания: Красноярск