Вычисления для масштабных научных проектов обсудили на площадке МИФИ
Новости, 15 декабря 2022
14 декабря в Институте Космофизики НИЯУ МИФИ прошел второй семинар цикла «Физика элементарных частиц и космофизика», посвященного актуальной проблематике современной науки и технологий. Спикером на мероприятии выступил директор Лаборатории информационных технологий ОИЯИ Владимир Кореньков с докладом «Интеграция распределенных и параллельных вычислений для масштабных научных проектов».
Директор ЛИТ ОИЯИ рассказал о концепции глобальной компьютерной инфраструктуры для хранения, обработки и анализа данных экспериментов на Большом адронном коллайдере (LHC) в ЦЕРН и об опыте создания распределенной информационно-вычислительной среды ОИЯИ, которая была организована на платформе DIRAC Interware.
Как сообщил докладчик, в структуре обработки данных эксперимента CMS на LHC центр уровня Tier-1 в ОИЯИ находится на первом месте в мире из всех семи центров Tier-1, которые обеспечивают CMS. Вместе с тем на территории России данные с LHC обрабатывают только пять организаций (ОИЯИ, НИЦ КИ, СПбГУ, ИЯИ РАН в Троицке, Саровский физико-технический институт). «Чтобы готовить специалистов в области компьютинга для наших крупных проектов, требуется некий собственный полигон, который позволит получить необходимый опыт. Только на такой инфраструктуре можно готовить высококлассных специалистов в области компьютинга, способных эффективно решать задачи такого рода», — отметил Владимир Кореньков, пригласив представителей МИФИ и МГУ к участию в подготовке кадров.
Владимир Кореньков рассказал, что бесперебойную работу мощной IT-инфраструктуры ОИЯИ, созданной в последние 5-7 лет, обеспечивает столь же внушительная инженерная инфраструктура. Центр обработки данных Tier-1 в Дубне бесперебойно работал даже в то время, когда во всем городе отключалось электричество на 7 часов во время перевозки магнита детектора MPD на комплексе NICA в 2020 году. Многофункциональный информационный вычислительный комплекс состоит из пяти компонентов. Три из них – центры Tier-1 для CMS и MPD, а также Tier-2, который обслуживает большое количество экспериментов, и активно развиваемое озеро данных – DataLake. «Звезда нашей инфраструктуры – суперкомпьютер «Говорун». В этом году произошло долгожданное событие – наш суперкомпьютер преодолел петафлопсный барьер после последней модернизации, которая также дала ему иерархическую память большого объема», — сообщил Владимир Кореньков. Пятой составляющей МИВК ЛИТ ОИЯИ является облачная инфраструктура, которая также активно развивается и нацелена в основном на решение задач мегасайенс-эксперимента Baikal-GVD и крупных проектов в области нейтринной физики. «Мы помогаем создавать облачную платформу в странах-участницах ОИЯИ. Сейчас мы интегрировали в эту инфраструктуру 13 центров, которые также являются важным компонентом нашей IT-среды», — сказал ученый.
Владимир Кореньков подчеркнул, что реализация крупных проектов на переднем крае науки требует организации распределенной IT-инфраструктуры. «Практически все большие проекты, особенно класса мегасайенс, не могут быть реализованы в рамках одной компьютерной инфраструктуры. Поэтому интеграция параллельных, гибридных и распределенных вычислений – сейчас задача чрезвычайно важная», — прокомментировал он. Спикер добавил, что для того, чтобы обеспечить потребности экспериментов по хранению петабайтного диапазона данных, требуется использовать вычислительные ресурсы, производительность которых измеряется по меньшей мере в петафлопсах. При этом участие сотен и тысяч пользователей в рамках одного проекта требует новых активно развивающихся подходов.