Как ребёнок учит слова? ИИ повторил это, глядя на мир его глазами
Итак, наш цифровой подопытный. У него не было ни словаря, ни грамматического справочника — только видеозаписи с камеры на голове одного реального ребёнка. Просто картинка и звук. И этого оказалось достаточно, чтобы начать понимать мир. Исследователи из Нью-Йорка считают, что подобный опыт — ключ к разгадке древней тайны детского языка.
Вся его наука свелась к поиску связей между тем, что он видел, и тем, что слышал. Никаких врождённых правил, никакой «лингвистической прошивки». И что удивительно — этого хватило. Этот простой подход ставит под сомнение целые научные школы, уверявшие нас, что младенцам для освоения речи нужно некое таинственное врождённое знание о языке. А если всё проще?
Мир глазами младенца Сэма

Учёные взяли 61 час записей с мини-камеры, закреплённой на голове малыша по имени Сэм из Австралии. Он носил её примерно час дважды в неделю — представьте, всего около 1% его времени бодрствования, с шести месяцев до двух лет. Крошечный срез детства.
Нейросеть училась на этих кадрах и словах, которые Сэму говорили родители во время игр, чтения или обеда. В её распоряжении оказалось около 200 000 пар «слово-изображение». Метод обучения был элегантен: система училась отличать, какие картинки и слова подходят друг к другу, а какие — явно нет. Принцип контраста — один из фундаментальных в нашем познании.
А потом её протестировали как обычного ребёнка: дали слово и попросили выбрать подходящую картинку из четырёх вариантов. Результат? Угадывание в 62% случаев против ожидаемых случайных 25%. И это — с опытом всего одного малыша! Для сравнения: аналогичная модель, натренированная на 400 миллионах пар, показала схожие результаты. Удивительная эффективность детского опыта, не правда ли?
Некоторые слова модель усвоила настолько хорошо, что узнавала объекты, которых раньше не видела. Зелёные яблоки на видео — и вот она уже опознаёт красное яблоко. Правда, получалось не всегда: в среднем, переносить слово на незнакомый предмет удавалось в 35% случаев. Легче давались предметы, часто мелькавшие в кадре. А вот абстрактные понятия вроде «игрушка» — где одна и та же вещь может быть куклой, машинкой, кубиком — оказались сложной задачей. Что, впрочем, неудивительно.
Язык: дар или навык?

Конечно, можно спорить о надёжности данных всего одного ребёнка, как отмечает когнитивист Хизер Бортфельд. Окружение у всех разное. Но суть-то в другом! Эксперимент наглядно показывает, как много можно узнать, просто связывая звуки речи с тем, что видишь вокруг. Этот результат — серьёзный вызов сторонникам теории врождённого языка, таким как знаменитый лингвист Ноам Хомский. Они всегда говорили: язык слишком сложен, а информация, которую получает ребёнок, слишком бедна и хаотична, чтобы научиться всему простым ассоциированием.
«Это одно из самых убедительных исследований, которые я видела, показывающее, что никаких «особых» механизмов не требуется», — заключает Бортфельд. Звучит как революция, согласны?
Конечно, мир реального ребёнка неизмеримо богаче. Наша модель училась на статичных картинках и тексте, а у младенца есть тактильные ощущения, взаимодействие, эмоции. Например, ИИ так и не смог толком освоить слово «рука» — а ведь малыши узнают его очень рано. «У детей есть собственные руки, они их постоянно видят и чувствуют, — признаются исследователи. — Это явно упущенный компонент в нашей модели. Но мы это понимаем и будем двигаться дальше». Ведь главное — начать видеть мир глазами ребёнка. Даже если это «глаза» — объектив камеры на детском шлеме.