Астрофизики создали программу для поиска редких и уникальных объектов в больших объёмах астрономических данных и применили её для обнаружения переменных звёзд.

Объёмы астрономических данных постоянно растут. Так 3 декабря 2020 года был опубликован третий набор данных «Gaia EDR3» космического телескопа Gaia, дополняющий трёхмерную карту Млечного Пути, составленную по результатам наблюдений за 34 месяца с июля 2014 года по май 2017 года. Он содержит информацию о точном расположении и передвижении 1,8 миллиарда звёзд. В 2021 году должен (если не помешает пандемия) начаться обзор всего доступного неба Legacy Survey of Space and Time (LSST) в обсерватории имени Веры Рубин, достраиваемой в Чили. LSST, использующий самую большую цифровую ПЗС камеру (3,2 гигапикселя) из когда-либо созданных, будет выдавать около десяти миллионов сообщений о новых событиях в ночь. Поэтому всё сложнее становится находить среди миллионов и миллиардов обнаруженных объектов те, чьи свойства отличаются от свойств большинства.

На карте Галактики показаны три поля обзора Zwicky Transient Facility, в которых команда исследователей SNAD искала аномальные объекты. (Константин Маланчев/МГУ)

На снимке астероид Барселона (чёрный кружок) «наползает» на тусклую звезду, находящуюся на пересечении линий в центре. В момент наложения для алгоритма анализа звезда как бы увеличивает яркость (ГАИШ МГУ).

Открыть в полном размере

Решение проблемы состоит в разработке автоматических анализаторов, специально предназначенных для их распознавания. Возможность быстро находить потенциально редкие и уникальные объекты на небе имеет огромное значение для текущих и грядущих в скором времени крупных обзоров неба. Подобные инструменты уже успешно применяются в различных сферах жизни, например, для выявления случаев мошенничества с кредитными картами среди миллионов ежедневных транзакций. Однако их адаптация для работы с астрономическими данными сопряжена с определёнными сложностями из-за нерегулярности астрономических наблюдений. Тем не менее, разработка специальных автоматических инструментов поиска уникальных с астрофизической точки зрения объектов – единственная возможность максимально эффективно использовать большие объёмы астрономических данных, получение которых сопряжено с огромными интеллектуальными и финансовыми затратами. Для анализа всего потока информации потребуются надёжные алгоритмы, которые не позволят упустить из виду интересные астрофизические объекты и явления.

Астрофизики, участвующие в международном проекте SNAD, объединяющем исследователей из России, США и Франции, в течение последних трёх лет работали над решением этой задачи в астрономии. Они разработали программу для поиска редких и уникальных объектов (аномалий) в больших объёмах астрономических данных и использовали её для нахождения переменных звёзд с уникальными свойствами в каталоге данных Zwicky Transient Facility Паломарской обсерватории (США). Результаты работы опубликованы в журнале Monthly Notices of the Royal Astronomical Society.

Для создания надёжного инструмента поиска аномалий исследователи объединили эффективные алгоритмы машинного обучения и знания экспертов-астрофизиков. Разработанный подход включал следующие этапы: выделение признаков, характеризующих изменение блеска объекта с течением времени, поиск кандидатов в аномалии с использованием нескольких алгоритмов машинного обучения и ручную фильтрацию кандидатов специалистом-человеком. На последнем этапе также проводились дополнительные наблюдения с помощью телескопов Кавказской горной обсерватории ГАИШ МГУ.

Всего компьютером было проанализировано 2,25 миллиона переменных объектов и автоматически выделено 277 кандидатов в аномалии. Из них 23 объекта были обнаружены впервые, 66 оказались известными, уже занесёнными в каталоги источниками, а большая часть — 188 объектов — артефактами (то есть ошибками) первичной обработки изображений. Объекты двух первых групп представляют потенциальный интерес для дальнейших исследований. Артефакты мешают анализу изменения блеска источников, заставляя машинные алгоритмы ошибочно думать, что перед ними реальный объект. Например, резко возросший блеск одной из звёзд произошёл из-за «наезда» на неё астероида Барселона.

В каталоге переменных источников Zwicky Transient Facility исследователи также обнаружили четыре кандидата в сверхновые, шесть ранее не классифицированных затменных двойных звёзд, четыре кандидата в молодые звёзды до стадии главной последовательности. Изучение последних представляется ключевым для понимания формирования звёзд. Также астрономы обнаружили возможную вспышку красного карлика и яркие голубые переменные звёзды, которые в скором времени могут взорваться как сверхновые или гиперновые.

Группа разработала также специальный веб-интерфейс, позволяющий визуализировать и сопоставлять объекты Zwicky Transient Facility с другими астрономическими каталогами. Это было сделано для того, чтобы облегчить работу экспертов-астрофизиков, занятых анализом кандидатов в аномалии и поиском наиболее интригующих объектов для дальнейшего изучения.

Исходный код программы и результаты исследования, включая полный список кандидатов в аномальные объекты, находятся в открытом доступе.

В проекте SNAD Россию представляют астрономы из ГАИШ МГУ, МФТИ и ИКИ РАН.

По материалам МГУ им. М.В. Ломоносова.