IMG-LOGO
image

13 мар. 2024

Просмотров: 75

Как учат ИИ законам физики: данные плюс теория создают учёного

Представьте, что вы учите ребенка собирать сложный пазл. Можно просто дать ему коробку с деталями — пусть сам разбирается. А можно подсказать ключевой принцип, например: «Сначала ищи угловые элементы». Китайские исследователи под руководством Пекинского университета придумали, как делать нечто похожее с системами машинного обучения: учить их не только на данных, но и на правилах — тех самых законах природы, которые описываем мы, люди.
Ведь как иначе заставить модель понять, что такое гравитация или течение жидкости, если она видит только цифры и пиксели? Это как пытаться объяснить вкус шоколада, показывая только его фотографию.

Ученые создали структуру, которая позволяет оценить, насколько полезно то или иное правило для итоговой точности модели. Проще говоря, они научились взвешивать вклад человеческих знаний и сырых данных. Это помогает системам гораздо лучше справляться с настоящими научными задачами — решать головоломные уравнения или подбирать идеальные условия для химического эксперимента.

«Внедрение человеческих знаний в модель может радикально повысить ее эффективность и способность к выводам, — говорит первый автор работы Хао Сюй. — Но главный вопрос: как найти баланс между данными и правилами? Наша структура как раз помогает оценить разные типы знаний, чтобы улучшить прогнозы».

Большинство современных генеративных моделей учатся исключительно на данных, методом проб и ошибок. Но представьте, что вы учите физику, только глядя на случайные видео, без единого учебника. Вы вряд ли поймете суть законов Ньютона. Так и модели, которые видят только данные, часто не способны уловить фундаментальные законы реальности и теряются в ситуациях, выходящих за рамки их тренировочного набора.

Уроки для «цифрового студента»: как добавить здравого смысла

Как учат ИИ законам физики: данные плюс теория создают учёного

Альтернатива — так называемое «информированное машинное обучение». Идея в том, чтобы дать модели не только данные, но и набор базовых правил-подсказок. Проблема была в том, как это сделать эффективно. «Мы пытаемся научить модели законам физики, чтобы их представление о мире было более точным, — объясняет соавтор исследования Юньтянь Чен. — Это сделало бы их куда полезнее в науке и инженерии».

Чтобы раскрыть потенциал такого подхода, команда разработала систему, которая вычисляет, насколько каждое отдельное правило улучшает предсказания модели. Они также изучили, как разные правила взаимодействуют друг с другом — ведь слишком много нескоординированных указаний могут только навредить, запутав «цифрового студента».

Это позволило оптимизировать модели, тонко настраивая влияние разных правил и безжалостно отсеивая те, что противоречат друг другу или просто избыточны. «Мы выяснили, что правила связаны между собой по-разному, — говорит Чен. — И используем эти связи, чтобы ускорить обучение и повысить точность».

У такого подхода огромные перспективы в инженерии, физике и химии. Ученые уже продемонстрировали его в деле: их метод помог оптимизировать модели для решения сложных многомерных уравнений и для прогнозирования результатов экспериментов по тонкослойной хроматографии, подсказывая наилучшие условия для будущих опытов.

Исследователи планируют превратить свою разработку в удобный плагин, доступный другим разработчикам. Но их главная мечта — создать модель, которая сможет сама извлекать необходимые правила и знания прямо из данных, а не просто использовать то, что в нее заложили люди.

«Мы хотим замкнуть цикл, превратив модель в настоящего ученого, — делится планами Юньтянь Чен. — Работаем над тем, чтобы система могла самостоятельно находить знания в данных, формулировать на их основе правила и постоянно самосовершенствоваться». Звучит как начало новой, очень умной эры, не правда ли?