РЕПРЕЗЕНТАТИВНОСТЬ И СБАЛАНСИРОВАННОСТЬ АГРЕГАТОРОВ ЦИФРОВЫХ ДАННЫХ В ОБЛАСТИ КУЛЬТУРНОГО НАСЛЕДИЯ : научное издание

Описание

Тип публикации: статья из журнала

Год издания: 2020

Идентификатор DOI: 10.31804/2542-1816-2020-4-3-169-177

Ключевые слова: representative digital collections, cultural heritage, aggregated digitized content, digitization, репрезентативность, сбалансированность, культурное наследие, корпус данных, агрегаторы данных

Аннотация: Агрегаторы цифровых данных в области культурного культурного наследия предоставляют доступ к первичным материалам из коллекций архивов, библиотек и музеев. Они также дают возможность использовать цифровые инструменты, предназначенные для анализа и классификации данных, предоставляя возможности образовательной и исследовательской раПоказать полностьюботы как общей публике, так и академическому сообществу. Важными характеристиками агрегатора являются объем данных и то, в какой мере разные типы данных представлены для анализа, насколько репрезентативен и сбалансирован корпус представленных данных. Статья предлагает обзор литературы, рассматривающей сложности создания репрезентативного и сбалансированного агрегатора, связанные с особенностями распространения и трансляции произведений культуры и искусства, принципами подбора и организации материалов как физических коллекций, так и цифровых агрегаторов. Обзор рассматривает те особенности агрегаторов, на которые влияют принципы создания физических коллекций и цифровых коллекцй, технологические особенности оцифровки и работы алгоритмов, рекомендующих контент пользователю, принципы публикации оцифрованных данных, которые являются принятыми в стране, где хранятся произведения. Обзор вводит методологические подходы к демонстрации или устранению ограничений, связанных с недостаточной репрезентативностью и сбалансированностью цифровых агрегаторов данных в области культурного наследия The paper reviews extensive literature that demonstrates the limitations and obstacles to building representative and balanced collections of aggregated cultural data. We review several sources of bias that result from a lack of balance in digital collections: bias that is inherited from physical collections and principles of collecting; bias related to the technological processes of digitization, material quality and bias that can be traced to the work of algorithms that recommend a narrowed scope of content to users; bias connected to access and online heritage policies; reduction bias when a lack of balance narrows the focus of the collection and skews the results of the humanities research. Following the previous studies, we propose that the aggregators of digitized cultural content document their epistemological choice and present the principles that govern how digital data are selected, organized and published. In doing so, the aggregators can show the limitations and constraints of the datasets that can be used for education and research in the humanities

Ссылки на полный текст

Издание

Журнал: Сибирский антропологический журнал

Выпуск журнала: Т. 4, 3

Номера страниц: 169-177

ISSN журнала: 25421816

Место издания: Красноярск

Издатель: Красноярская региональная общественная организация "Содружество просветителей Красноярья", Копцева Наталья Петровна

Персоны

Вхождение в базы данных