Программа для анализа эффективности подсистемы планирования диспетчера ресурсов PBS Torque
Аннотация: Программа позволяет выполнить нагрузочное тестирование и анализ эффективности системы управления ресурсами (СУР) распределенных вычислительных систем.
Назначение: Программа состоит из двух модулей. Первый используется для создания потока загрузки на функционирующую СУР и запускается для каждого набора политик и алгоритмов планирования PBS Torque. Второй модуль анализирует системные лог файлы и для каждого набора задач рассчитывает показатели, характеризующие эффективность планирования.
Область применения: Высокопроизводительные распределенные вычислительные системы.
Используемые алгоритмы:
На входе программа использует наборы масштабируемых задач, параметры которых соответствуют моделям загрузки промышленных вычислительных систем (Parallel Workload Archive). Набор задач задаётся в XML формате и архивируется с целью экономии места. Файлы с исходными наборами задач могут быть созданы с помощью пакета программ MOJOS. Формат XML:
<JOBSET GUID="1024_bit" CREATIONDATE="date" COUNDJOBS="XXX">
<JOB GUID="1024_bit" ARRIVALTIME="start_time" COUNTREQUESTS="XX">
<REQUEST NODES="XX" TIME="solution_time1" PRIORITY="XX"/>
<REQUEST NODES="YY" TIME="solution_time2" PRIORITY="XX"/>
...
</JOB>
...
</JOBSET>
Показатели эффективности, такие как время решения всех задач набора, среднее время ожидания задач в очереди СУР и % загрузки ресурсов, для всех вариантов настройки СУР и для всех наборов задач на выходе программы сохраняются в таблицу в формате CSV с заголовком:
NODES_COUNT;JOBS_COUNT;RIGID_JOBS_PART;SCHEDULER;POLICY;ALGORITHM;WINDOW;QUEUE_RUN_TIME;AVERAGE_WAIT_TIME;WORKLOAD.
Программа разработана в рамках ГЗ 0306-2016-0018
Вычислительная система под управлением СУР PBS Torque; архитектура процессора i386 и выше; GNU/Linux, версия ядра Linux не ниже 2.4; поддержка скриптовых языков bash, ruby, python; объём программы 17 Kб (исходного текста).