ОБ ОДНОМ СПОСОБЕ ХЕШИРОВАНИЯ ТЕКСТА С УЧЕТОМ ПОЗИЦИЙ СИМВОЛОВ : доклад, тезисы доклада

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Интеллектуальные технологии в науке и образовании; Новочеркасск; Новочеркасск

Год издания: 2023

Ключевые слова: хеширование текста, simhash_cp, уникальные хеш-значения, text hashing, unique hash values

Аннотация: В данной статье представлен новаторский подход к хешированию текста, который минимизирует различия в позициях символов и учитывает частоту определенных символов. Предложенный алгоритм, основанный на методе "Charikar hash", интегрирует позиции символов в процесс хеширования и находит применение в различных областях, таких как сравниПоказать полностьютельный анализ текстов и оптимизация баз данных, обрабатывая большие объемы данных эффективно. This article introduces a novel text hashing approach that minimizes differences in character positions while considering the frequency of specific characters. The proposed algorithm, based on the "Charikar hash" algorithm, integrates character positions into the hashing process and finds applications in diverse fields such as comparative text analysis and database optimization, handling large volumes of data efficiently.

Ссылки на полный текст

Издание

Журнал: Интеллектуальные технологии в науке и образовании

Номера страниц: 50-54

Место издания: Новочеркасск

Персоны

  • Герасименко Д.В. (Сибирский федеральный университет (СФУ))
  • Чубарова О.В. (Сибирский федеральный университет (СФУ))

Вхождение в базы данных