Тип публикации: патент
Год издания: 2016
Аннотация: Программа предназначена для индексирования последовательностей строк (контигов, суммарная длина может достигать 30 млрд. символов), которые представляют собой геном какого-либо организма. Индексирование контигов выполняется для реализации быстрого, не точного поиска множества подстрок (ридов). Такой поиск используется при решении рПоказать полностьюазличных задач биоинформатики. В программе предложена модификация алгоритма «FM-index». Ускорение индексирования реализовано посредством распараллеливания этапа сортировки алгоритма под архитектуру графических ускорителей. Программа требует объем ОЗУ равный 5Х от размера входного файла. Область применения - анализ геномных данных. Программа позволяет: работать с файлами последовательностей генома (контигами) в формате *. fasta; преобразовывать входной файл в индекс, размер которого может варьироваться в зависимости от частоты выборки индекса, который указывает пользователь (чем больше частота выборки, тем быстрее будет осуществляться поиск в индексе, но его размер будет увеличен и обратно); работать в параллельном режиме; использовать в вычислениях графический ускоритель; формировать статистический отчет и отчет об ошибках.