Перевод названия: SIMULATION OF SCHEDULING SYSTEM OF DISTRIBUTED HIGH-PERFORMANCE COMPUTING SYSTEM
Тип публикации: статья из журнала
Год издания: 2014
Ключевые слова: grid, распределенные системы, torque, Maui, SimGrid, GridSim, Microgrid, distributed system
Аннотация: Эффективное использование вычислительных ресурсов в центрах высокопроизводительных вычислений является актуальной проблемой, важный аспект которой - правильный подход к распределению задач и планированию нагрузки на вычислительные узлы. В статье рассматриваются основные алгоритмы распределения ресурсоемких пользовательских заданий Показать полностьювнутри гетерогенных вычислительных систем, такие как First Come First Served, Shortest/Longest Job First, Backfilling, Round-robin и другие. Оценка эффективности алгоритмов распределения проводилась на разработанной авторами статьи модели вычислительной системы, отражающей структуру существующего распределенного вычислительного комплекса СФУ. Исходные экспериментальные данные для моделирования составили реальные задачи, запущенные в вычислительной системе СФУ за последние несколько лет. В качестве платформы для имитации запуска задач были использованы платформы SimGrid и Alea. Как результат - достигнуты максимально приближенные к реальным условия для проведения экспериментов по оценке эффективности применения различных алгоритмов распределения пользовательских задач. Анализ результатов проведенных экспериментов позволяет предложить решения по модернизации существующей вычислительной инфраструктуры. An effective use of computing resources in high-performance computing centers is a vital problem. The main aspect of this problem is a rational approach to task planning and distribution across computing nodes. This article covers the main algorithms of huge task distribution in large computing systems, such as First Come First Served, Shortest/Longest Job First, Backfilling, Round-robin, etc. To evaluate the effectiveness of these algorithms the authors have developed a model of a computer system showing the structure of the available SFU computing system. As initial experimental data the authors used a variety of tasks which have been run in the SFU computing system over the past few years. The SimGrid and Alea platforms are used to simulate starting task execution. The conditions for the evaluation of the effectiveness of various algorithms of user task distribution closest to real conditions have been found. Using experimental results obtained, the authors have proposed some solutions aimed at modernizing the existing computing infrastructure.
Журнал: Доклады Академии наук высшей школы Российской Федерации
Выпуск журнала: № 2-3
Номера страниц: 34-41
ISSN журнала: 17272769
Место издания: Новосибирск
Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования Новосибирский государственный технический университет