Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Информационные технологии в гуманитарных исследованиях; Красноярск; Красноярск
Год издания: 2023
Ключевые слова: "Курьер ЮНЕСКО", мультимодальный анализ, кросс-модальный анализ, сегментация изображений
Аннотация: Исторические периодические издания, такие как журналы, газеты, сочетают в своем оформлении текст и изображения для достижения нужного визуального эффекта на читателя. Разделение изображений и текстов в таких документах необходимо для изучения вариативности способов представления контента, а также для подготовки корпусов изображенийПоказать полностьюи текстов к мультимодальному анализу. Чтобы узнать, насколько согласованы эти два корпуса, нам необходимо создать отдельные наборы данных, а далее найти способ соединить их. В данной работе мы сосредоточимся на корпусе, охватывающем два десятилетия XX в.: 60-е и 90-е гг. Корпус включает в себя 10 тыс. изображений и более 3 млн слов из журнала «Курьер ЮНЕСКО» - главного издательского центра ЮНЕСКО. Мы выполняем сегментацию макета и извлекаем изображения с помощью набора алгоритмов. Мы сравниваем нашу модель с несколькими универсальными моделями и показываем, что необходима тонкая настройка для излечения изображений из журнала с экспериментальным дизайном и макетом.
Журнал: Информационные технологии в гуманитарных исследованиях
Номера страниц: 124-133
Место издания: Красноярск