Как работает нейроинтерфейс, который переводит мысли в текст без имплантов
Это не научная фантастика, а реальная технология, которая в будущем может вернуть голос тем, кто его потерял. Люди после инсульта, с параличом или другими тяжёлыми заболеваниями, лишающими речи, получат шанс на общение. Но и это не всё. Такая система откроет двери для новых форм взаимодействия человека с машинами — от управления роботизированными протезами до прямого диалога с компьютером. Представляете, просто подумать — и команда выполнена?
Как это работает? Почти телепатия.
Участники эксперимента читали текст про себя, а на их головах была та самая шапочка, записывающая электроэнцефалограмму (ЭЭГ). Никаких разрезов, трепанаций или имплантов — электроды снимают сигналы прямо через кожу и кости черепа.
Полученные мозговые волны затем разбиваются на блоки, в которых скрываются паттерны нашей мыслительной деятельности. Здесь в игру вступает искусственный интеллект — модель DeWave. Она обучена на огромных массивах данных ЭЭГ и выступает в роли переводчика. Её задача — расшифровать электрические сигналы и превратить их в связные слова и предложения.
«Это исследование — настоящий прорыв, — говорит соавтор работы Чин-Тенг Линь. — Впервые нам удалось переводить сырые волны ЭЭГ напрямую в язык. Мы интегрировали методы дискретного кодирования и большие языковые модели, что открывает совершенно новые горизонты как в нейробиологии, так и в ИИ». До сих пор подобные технологии требовали либо сканирования в МРТ (не слишком практично), либо хирургической имплантации электродов, как в проектах вроде Neuralink.
Кстати, эта разработка — логичное продолжение предыдущих работ университета. Они уже создавали интерфейс «мозг-компьютер», который позволял с помощью ЭЭГ управлять четвероногим роботом. Кажется, будущее уже стучится в дверь.А насколько это точно?
Сигнал, снятый через кожу головы, конечно, более «шумный», чем с имплантированных электродов. Но даже с этим препятствием технология показывает впечатляющие результаты. Правда, пока не идеальные.
«Наша модель лучше справляется с глаголами, чем с существительными, — объясняет соавтор Ицюнь Дуань. — При переводе существительных она часто подбирает синонимы: например, говорит «человек» вместо «автор». Мы полагаем, это происходит потому, что семантически близкие слова создают в мозге очень похожие волновые паттерны».
Текущая точность перевода, измеряемая по метрике BLEU-1, составляет около 40%. Это значит, что система улавливает ключевые слова и общую структуру предложения, но до идеала далеко. Для сравнения, современные переводчики и системы распознавания речи достигают 90%. Учёные надеются приблизиться к этим цифрам. Ведь 40% — это только начало пути. А что будет через несколько лет, когда точность возрастёт? Возможно, мы стоим на пороге новой формы человеческого общения.