Как мозг предсказывает время награды и учится терпению: роль дофамина
Раньше ученые знали одно: всплеск дофамина — это сигнал об успехе, который мотивирует нас стремиться к большему. Но команда из Сан-Франциско решила копнуть глубже. Они сосредоточились на полосатом теле (стриатуме) — области мозга, отвечающей за обучение и принятие решений, основанных на вознаграждении. Исследователи хотели понять, что происходит с дофамином в разных его уголках.
Оказалось, всё не так просто. Временные колебания дофамина в трех разных частях полосатого тела работают как прогностические часы. Они оценивают, когда придет награда: через долю секунды, через минуту или может через несколько часов. Мозг буквально просчитывает будущее удовольствие.
«Выброс дофамина — это способ мозга сказать: “Эй, ситуация оказалась лучше, чем мы думали! Нужно срочно обновить прогнозы”», — объясняет ведущий автор работы Джош Берке. Эта теория «ошибки предсказания вознаграждения» произвела фурор в нейробиологии. Она связывает активность нашего мозга с принципами машинного обучения. Но, как признается Берке, в ней еще много белых пятен.
Светящийся дофамин

«Раньше считалось, что дофаминовые сигналы распространяются по мозгу равномерно, — говорит Берке. — Но теперь мы видим, что в разных зонах они разные. Значит ли это, что нам нужна не одна, а целый набор теорий, чтобы всё это объяснить?»
Чтобы разобраться, команда Берке провела эксперименты на крысах. Они использовали хитроумный молекулярный сенсор — специальный белок, который начинает светиться, когда связывается с дофамином. По сути, они заставили мозг подсвечивать свои собственные процессы.
«Мы поместили этот датчик в три разные области полосатого тела крысы — туда, где больше всего дофамина, — объясняет ученый. — Каждая из этих зон входит в разные крупные нейронные контуры и обрабатывает разную информацию.»
Исследователи наблюдали за свечением, пока крысы выполняли задания: получали награды с разной скоростью и слышали звуковые сигналы, предсказывающие угощение с разной задержкой. Представьте себе крысу-геймера, ждущую свой бонус.

Долгожданный дофамин
И вот что выяснилось. Колебания дофамина в разных субрегионах отражали разные «таймфреймы» ожидания.
«В зоне, которая связана с контролем движений, дофамин колеблется часто, и она сильно реагирует только на сигнал, который предсказывает награду в течение доли секунды, — рассказывает Берке. — Вторая область заточена под ожидание в десятки секунд. А третья — под сотни секунд.»
«Вот пример: когда вы поете, между движением голосовых связок и тем, понравился ли результат, проходит мгновение, — поясняет ученый. — Для эффективного обучения такая обратная связь должна быть мгновенной. Но иногда мы делаем выбор и узнаем о последствиях лишь спустя долгое время. Мозгу нужны механизмы, чтобы преодолеть этот разрыв и понять, был ли выбор правильным.»
Это исследование также проливает свет на наши внутренние конфликты.
«Мы часто принимаем долгосрочные решения — скажем, похудеть. Но, столкнувшись с сиюминутным выбором (взять пирожное или нет), мы нарушаем обещание, — говорит Берке. — Это кажется иррациональным. Но, возможно, это неизбежное следствие работы нескольких параллельных систем принятия решений. Каждая из них заточена под свой горизонт планирования. Чем ближе потенциальная награда, тем больше подсистем включается в гонку за сиюминутным удовольствием. Противостоять этому невероятно трудно.»
Команда Берке планирует использовать свои открытия для новых экспериментов. Они хотят понять, как дофаминовые сигналы взаимодействуют с другими нейронными цепями.
«Сейчас мы изучаем, как это всё работает и почему ломается при таких состояниях, как зависимости, болезнь Паркинсона или синдром Туретта», — подводит итог исследователь. Похоже, ключ к пониманию наших слабостей и болезней лежит в тонкой настройке внутренних дофаминовых часов.