Расшифровка собачьего лая: как технологии учатся понимать животных
Работа ученых, опубликованная на сервере препринтов arXiv, ведется в русле глобальной идеи. Как сказал Джереми Коллер, председатель фонда, учредившего специальную премию: «Я убежден, что сила современных технологий поможет нам установить межвидовой диалог, подобно тому, как Розеттский камень раскрыл египетские иероглифы». Согласитесь, амбициозно и немного волшебно?
Главной сложностью для исследователей стал… информационный голод. Записей человеческой речи — пруд пруди. А вот качественных, размеченных архивов собачьего лая и скулежа — катастрофически мало. Как научить алгоритм, если нечем кормить?
Учёные нашли изящный выход. Они взяли модель, уже натренированную на распознавании человеческой речи и нескольких языков. Её-то и стали «доучивать» на той небольшой коллекции собачьих голосов, которую удалось собрать. Получился своего рода «переводчик» с человеческого на собачий.
И что же говорят наши хвостатые друзья?
Первые результаты вселяют оптимизм. Модель научилась улавливать тончайшие нюансы в лае, которые наше ухо просто пропускает. Она может не только отличить одну собаку от другой, но и с хорошей точностью определить породу и даже пол животного!
Самое важное — алгоритм начал понимать контекст. Он различает, когда лай означает «брось мою кость!», а когда — «давай поиграем!». Согласитесь, для владельцев собак это было бы суперспособностью.
«Это первый случай, когда методы, заточенные под человеческую речь, применили для расшифровки звуков животных», — с гордостью отмечают авторы.
И это только начало. Разработанный подход открывает дорогу для изучения «речи» других животных, записей которых ещё меньше — от китов до слонов. Возможно, совсем скоро мы не только услышим, но и поймём целый зоопарк. Представляете, какие диалоги нас ждут?