Распознавание рукописных текстов отчетов губернаторов Енисейской губернии 19 века : доклад, тезисы доклада

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: GraphiCon 2024; Омск; Омск

Год издания: 2024

Идентификатор DOI: 10.25206/978-5-8149-3873-2-2024-519-524

Ключевые слова: распознавание текста, оцифровка документов, дореформенный русский язык, машинное обучение, исторические документы, text recognition, document digitization, pre-reform Russian language, machine learning, historical documents

Аннотация: Текст отчетов губернаторов Енисейской губернии имеют значительные особенности, такие как дореформенный язык отчетов, устаревшие орфографические нормы, старые буквы и символы. Кроме того, фотографии отчетов могут содержать различные артефакты, связанные с особенностью письма и сканирования этих документов. Стандартные методы распознПоказать полностьюавания для распознавания текстов отчетов являются малоэффективными, поэтому авторами разработан специализированный алгоритм для распознавания текста на таких изображениях. Алгоритм включает в себя два этапа: детекция строк на изображении с помощью модели CRAFT и последующее распознавание текста с помощью модели TPS-ResNet-BiLSTM-Attn. Для обучения и тестирования моделей использованы самостоятельно созданные комбинированные наборы данных. Экспериментальные исследования подтверждают эффективность предложенных методов. The text of the reports of the governors of the Yenisei Governorate have significant peculiarities, such as pre-reform language of the reports, outdated spelling norms, old letters and symbols. In addition, photos of the reports may contain various artifacts related to the peculiarities of writing and scanning of these documents. Standard recognition methods for recognizing report texts are inefficient, so the authors have developed a specialized algorithm for recognizing text in such images. The algorithm includes two stages: line detection in the image using the CRAFT model and subsequent text recognition using the TPS-ResNet-BiLSTM-Attn model. Self-created combined datasets were used for training and testing the models. Experimental studies confirm the effectiveness of the proposed methods.

Ссылки на полный текст

Издание

Журнал: GraphiCon 2024

Номера страниц: 519-524

Место издания: Омск

Персоны

Вхождение в базы данных