В сентябре текущего года первые стажеры Томского политехнического университета, трое молодых ученых, двое из которых являются представителями Института кибернетики, отправились на долгосрочную стажировку в Европейский центр ядерных исследований (CERN) , что вблизи Женевы (Швейцария). Там они принимают активное участие в эксперименте «АТЛАС» (ATLAS) на Большом адронном коллайдере. И ведущий программист каф. ОСУ, Губин Максим Юрьевич, поделился своими впечатлениями о работе и о том, как ему помог опыт, приобретенный на кафедре.
- Максим, расскажите, как протекает Ваша работа в CERN?
- Моя работа здесь пока заключается в анализе статистики работы вычислительных мощностей CERN и в поиске узких мест. Я уже представил промежуточные результаты своей работы на еженедельной конференции ADC Weekly, в которой учувствует около 200 представителей организаций-участников коллаборации ATLAS со всего мира, и мой доклад оценили хорошо. Кроме того, на основании проделанной работы меня пригласили на конференцию по машинному обучению в январе 2016. Так что я бы сказал, моя работа продвигается очень успешно.
- Есть ли нюансы, которых изначально Вы не ожидали?
- Что касается нюансов, они безусловно есть. Так, в CERN предпочитают свободное программное обеспечение, и у них даже есть (и повсеместно используется) свой дистрибутив Linux - Scientific Linux CERN. Особых проблем это не вызывает, но тем, кто едет в CERN, стоит быть готовыми к работе в Linux.
Также к нюансам, пожалуй, можно отнести то, что CERN состоит из Meyren site в Швейцарии и Prevessin site во Франции, и в течение рабочего дня иногда приходится по несколько раз пересекать границу.
- А какие цели переда нашей командой стоят сейчас?
- Сейчас передо мной стоят две задачи. Первая, как я уже упоминал, заключается в анализе статистики работы вычислительных мощностей CERN, в поиске узких мест. На данный момент я разобрался в устройстве вычислительной сети и начал анализ, некоторые интересные и неожиданные результаты уже есть, но до конкретных предложений по повышению эффективности работы GRID пока далеко. Я ожидаю, что первые значимые результаты будут ближе к середине второй части моей командировки.
Вторая задача заключается в сотрудничестве с Курчатовским институтом в качестве сотрудника лаборатории Big Data ТПУ в разработке Data Knowledge Catalog - проекта, который ориентирован на хранение данных о том, какие результаты работы коллайдера используются физиками, и анализ их методами машинного обучения.
Первая задача в основном сводится к запросам к базам данных и применению статистических подходов для поиска аномалий в работе системы. Вторая задача значительно более сложная, и я ожидаю, что мой опыт работы в лаборатории систем управления знаниями в ТПУ очень пригодится мне, потому что задачи, стоящие перед DKC имеют много общего с тем, чем мы занимались в лаборатории СУЗ.