
Исследователи представили новую архитектуру искусственного интеллекта, которая может изменить один из главных принципов обучения современных нейросетей. Вместо того чтобы требовать все больше данных и вычислительных ресурсов, новая система использует знания о физических законах еще до начала обучения. Авторы утверждают, что такой подход позволяет добиться сопоставимой точности при значительно меньшем объеме обучающих данных.
Кто разработал новый подход к ИИ
Исследование подготовили физики из шведского Технологического университета Чалмерса (Chalmers University of Technology) в Гётеборге. Авторами работы стали Виктор Лилья, Альбин Свэрдсбю, Тимо Гальманн и Филипп Тассен - специалисты в области фотоники, электромагнетизма и вычислительной физики.
Разработанная ими архитектура QNM-Net предназначена для моделирования сложных фотонных структур, однако сами исследователи рассматривают проект как демонстрацию более широкого подхода к созданию искусственного интеллекта. Вместо обучения исключительно на больших массивах данных нейросеть использует знания о физических законах, лежащих в основе исследуемой системы.
Главная проблема современного ИИ
Последние годы развитие искусственного интеллекта строилось вокруг одной идеи: чем больше данных получает модель, тем лучше становится результат. Именно этот принцип лежит в основе крупнейших нейросетей, которые обучаются на огромных массивах информации и требуют колоссальных вычислительных мощностей.
Однако такой подход становится все дороже. Для обучения современных моделей необходимы тысячи ускорителей, крупные дата-центры и огромные объемы данных, сбор которых сам по себе превращается в сложную задачу.
Поэтому ученые все чаще ищут альтернативный путь развития ИИ - не только через увеличение масштабов, но и через повышение эффективности самих алгоритмов.
Нейросеть, которая понимает физику
В своей работе исследователи предложили архитектуру QNM-Net для моделирования сложных фотонных структур. На первый взгляд это выглядит как узкоспециализированная задача для инженеров и физиков.
Но ключевая идея гораздо шире.
Обычные нейросети получают на вход данные и пытаются самостоятельно найти закономерности. QNM-Net работает иначе. Авторы встроили в модель знания о физических процессах, которые управляют системой, заставив нейросеть опираться не только на статистику, но и на реальные законы природы.
Фактически модель сначала учится понимать физические механизмы происходящего, а уже затем строит прогноз.
От больших данных к умным моделям
Самый интересный результат исследования связан не с фотоникой, а с философией развития искусственного интеллекта.
Авторы показали, что их подход позволяет достигать той же точности примерно при десятикратно меньшем объеме обучающих данных по сравнению с традиционными нейросетевыми решениями.
Проще говоря, модель начинает учиться не за счет бесконечного увеличения числа примеров, а за счет более глубокого понимания того, как устроена изучаемая система.
Это направление получило название Physics-Informed AI - искусственный интеллект, который использует фундаментальные законы физики как часть своей архитектуры.
Скорость поиска решений тоже выросла
В работе есть показательный пример: после обучения QNM-Net смогла подбирать параметры фотонной структуры под заданные физические характеристики за несколько сотен шагов оптимизации менее чем за одну секунду. То есть нейросеть выступает не просто как быстрый заменитель тяжелого электромагнитного симулятора, а как инструмент для ускоренного проектирования новых устройств.
Почему это может быть важно не только для ученых
Сегодня крупнейшие технологические компании вкладывают десятки миллиардов долларов в развитие вычислительной инфраструктуры для ИИ. Чем сложнее становятся модели, тем больше энергии, оборудования и данных им требуется.
Новая работа показывает альтернативный сценарий. Вместо постоянного наращивания масштабов исследователи предлагают делать модели более осведомленными о мире еще до начала обучения.
Пока технология тестируется на задачах фотоники и электромагнитного моделирования. Однако сам принцип может оказаться востребованным гораздо шире - от инженерных расчетов до будущих поколений искусственного интеллекта.
Следующий этап эволюции ИИ
На протяжении последнего десятилетия индустрия двигалась по пути «больше данных - больше возможностей». Теперь в научном сообществе набирает популярность другая идея: часть знаний модель должна не выучивать самостоятельно, а получать заранее.
Если этот подход подтвердит свою эффективность в других областях, будущие системы искусственного интеллекта смогут стать быстрее, дешевле и менее зависимыми от гигантских датасетов.
Именно поэтому исследование привлекло внимание специалистов далеко за пределами фотоники. Возможно, речь идет не просто о новой нейросети для научных расчетов, а об одном из возможных направлений развития ИИ после эпохи бесконечного масштабирования.
Работа опубликована в журнале Laser & Photonics Reviews и посвящена интеграции физических знаний в архитектуру нейросетей для моделирования электромагнитных процессов.
Все новости:
aramil.life
77243

Загрузка...