Методы сравнительного анализа суперкомпьютерных приложений на основе интеллектуального анализа данных

Семинары

Лаборатория информационных технологий

Общелабораторный семинар

Дата и время: четверг, 6 февраля 2025 г., в 14:00

Место: конференц-зал, Лаборатория информационных технологий им. М. Г. Мещерякова, онлайн в Webinar

Тема семинара: «Исследование и разработка методов для сравнительного анализа суперкомпьютерных приложений на основе технологий интеллектуального анализа данных»

Докладчик: Денис Шайхисламов (МГУ)

Аннотация:

Современные суперкомпьютеры предоставляют много полезной информации о выполняемых на них приложениях: данные о структуре, производительности выполнения или коммуникационном профиле приложений; названия используемых прикладных программных пакетов, библиотек и компиляторов; подробная информация о запуске заданий, и т. д. Объем собираемой информации становится все больше, и его уже практически невозможно обрабатывать вручную. Поэтому все более актуальной становится проблема разработки методов интеллектуального анализа данных, которые позволят администраторам более полно, точно и быстро оценивать работу суперкомпьютера на основе указанной информации, а также выявлять и устранять проблемы, приводящие к снижению эффективности функционирования суперкомпьютеров. Одним из направлений для подобного анализа является задача поиска схожих приложений. Обладая информацией о схожести различных приложений, можно не только изучать новые задания, используя полученные ранее результаты анализа схожих, уже изученных приложений, но и группировать задания или предсказывать их поведение, что значительно облегчит процесс исследования эффективности приложений как для пользователей, так и для администраторов суперкомпьютеров. В данной работе приведены 2 подхода к решению задачи поиска схожих суперкомпьютерных приложений, а также предложены алгоритмы для исследования потока суперкомпьютерных заданий на основе предложенных подходов, которые позволяют выделять используемые программные пакеты, осуществлять кластеризацию заданий и предсказывать оценки качества использования суперкомпьютерных ресурсов.