Алгоритмы машинного обучения могут найти аномальные иголки в космических стогах сена


Фото из открытых источников
Лицо астрономии меняется. Хотя узкопольная астрономия «наведи и снимай» по-прежнему имеет значение, крупные исследования с широким полем зрения обещают стать движущей силой открытий в ближайшие десятилетия, особенно с появлением машинного обучения.
 
Недавно разработанная программа машинного обучения под названием ASTRONOMALY отсканировала почти четыре миллиона изображений галактик в рамках исследования наследия камеры темной энергии (DECaLS), обнаружив 1635 аномалий, включая 18 ранее неопознанных источников с «весьма необычной морфологией». Это признак грядущих событий: партнерства между людьми и программным обеспечением, которое сможет проводить наблюдения лучше, чем каждый из них мог бы сделать по отдельности.
 
Обзорные телескопы уже давно стали частью инструментария астрономов. Отличие двадцать первого века состоит в том, что теперь они могут производить невероятно огромные объемы данных, гораздо больше, чем человек мог бы надеяться раскопать и изучить самостоятельно. Ожидается, что будущая обсерватория Веры Рубин будет создавать 20 терабайт данных каждую ночь (60 петабайт за 10 лет) и в конечном итоге обеспечит «32 триллиона наблюдений 20 миллиардов галактик».
 
На анализ всех этих данных у людей уйдут десятилетия. ИИ может сделать это гораздо быстрее.
 
Большинство предыдущих программ обнаружения аномалий обучались на тестовых наборах данных, обучая алгоритм поиску конкретных явлений. Ограничением этих программ является то, что они склонны обнаруживать множество аномалий одного типа, а не совершенно новые аномалии.
 
АСТРОНОМАЛИЯ вместо этого работает «без присмотра», что позволяет ей находить новые виды выбросов – то, что волнует астрономов, например, гравитационные линзы, слияния галактик, странные узоры красного смещения и все остальное, что просто странно. Однако АСТРОНОМАЛИЯ работает лучше всего, когда использует форму активного обучения с участием людей для исправления ошибок. Включение этой обратной связи в поиск дает гораздо лучшие результаты.
 
Самое приятное то, что астроному требуется всего несколько часов.
 
В недавнем препринте астрономы протестировали ASTRONOMALY на большем наборе данных, чем когда-либо прежде, продемонстрировав, что он может работать в больших масштабах. Загрузив в программу огромное количество данных DECaLS, они протестировали несколько разных алгоритмов. Результаты показали, что метод без присмотра, усиленный активным обучением людей, обеспечивает наивысший результат уникальных аномалий.
 
По мнению исследователей, наиболее интересные аномалии включали «кольцевые галактики странного цвета и морфологии, источник наполовину красного, наполовину синего цвета, потенциальную сильно линзированную систему с парой источников, действующих в качестве линзы, несколько известных взаимодействующих групп и некоторые источники либо взаимодействуют, либо совпадают».
 
Один загадочный объект испускает радиоизлучение, которое можно объяснить наличием квазара, но у галактики также есть кольцевая особенность, которая представляет собой либо редкую галактику с красными кольцами, либо гравитационную линзу. Другая аномалия выглядит как кольцеобразная галактика со звездообразованием либо с приливным хвостом, либо со сталкивающейся галактикой-компаньоном.
 
Все эти редкие объекты были бы пропущены без алгоритма активного обучения. Результаты обещают новые захватывающие находки в самом ближайшем будущем.
 
Но в эту новую эпоху огромных наборов данных остается еще одна проблема, которую необходимо преодолеть: передача данных.
 
«Одной из основных проблем, с которыми мы столкнулись, была передача данных с хост-сервера на локальный компьютер, что заняло несколько недель», — сказали исследователи. Предлагаемое ими решение? В будущем имеет смысл передать вычислительные мощности главной обсерватории, а не пытаться перенести данные за пределы объекта.