IMG-LOGO
image

26 февр. 2024

Просмотров: 101

На каком языке будут общаться машины, если люди им не помешают?

А что, если машины однажды заговорят между собой на собственном, абсолютно новом языке? Не на нашем, переработанном и оцифрованном, а на том, что родится из чистого зрения, из обмена образами? Именно эту, почти философскую, возможность и изучают в Институте автоматизации Китайской академии наук. Их гипотеза дерзка: главным источником взаимопонимания для ИИ могут стать не слова, а визуальные представления.
Юрий Лотман: «Если человеку удастся создать полно­ценный искусственный разум, то мы менее всего заинтересованы, чтобы этот разум был точной копией человеческого».

Знаете, меня всегда завораживала эта мысль Лотмана. Мы так стараемся сделать ИИ похожим на нас, что забываем спросить: а может, его главная ценность — в инаковости? Новое исследование китайских учёных — это шаг в эту самую сторону. Они проверяют, могут ли две нейросети, просто общаясь друг с другом, спонтанно изобрести свой собственный язык. И ключевое условие: в основе этого языка — только то, что они «видят», без единого человеческого слова-посредника.

Современные большие языковые модели (LLM), конечно, впечатляют, но они по сути — гениальные попугаи, обучающиеся на гигантских архивах нашего текстового наследия. Они учатся гладко заполнять пробелы в предложениях. Но что, если дать им чистый лист? Учёные начали с простейшего сценария — игры для двух ИИ-агентов, что-то вроде «Говори, угадай и нарисуй». Их цель — не объяснить правила, а посмотреть, родится ли в процессе взаимодействия хоть какое-то подобие языка.

На каком языке будут общаться машины, если люди им не помешают?

И знаете что? Язык действительно появился. В своих цифровых мирах агенты достигли взаимопонимания. Они выработали систему сигналов — дискретных, отрывистых, не похожих на плавную речь LLM.

Команда тщательно сравнила два подхода: привычный непрерывный язык LLM и новый, дискретный, рождённый из картинок. Сравнивали по трём параметрам: можно ли его понять (интерпретируемость), может ли он работать с новыми данными (обобщение) и насколько он устойчив к помехам (надёжность).

Оказалось, что дискретный язык не уступает в понимании и обобщении. Но его главный козырь — устойчивость. Когда в данные вносят «возмущения» — что-то вроде шума или ошибок, — язык, рождённый из образов, держится куда увереннее. Он менее хрупкий. Не правда ли, любопытная метафора: то, что рождается из визуального опыта, оказывается прочнее того, что выведено из текстовых шаблонов?

Изучение такого машинного языка — это не просто техническая задача. Это ценнейшее направление для всей науки об ИИ. Только представьте: будущее, где интеллектуальные агенты свободно развиваются в своей среде, общаясь и сотрудничая на языке, который мы, возможно, даже не сразу расшифруем. Будут ли они при этом думать иначе, чем мы? И что нам с этим знанием делать? Вопросы, от которых захватывает дух.