Как мозг предсказывает время награды и учится терпению: роль дофамина

Вы когда-нибудь задумывались, почему так сложно отказаться от лишней печеньки, когда вы на диете? Или почему так приятно получать лайки в соцсетях? Всё дело в дофамине — химическом веществе мозга, которое кричит нам: «Молодец! Повтори!» Ученые из Калифорнийского университета сделали удивительное открытие: оказывается, наш мозг не просто получает дофаминовую «награду», он еще и мастерски предсказывает, когда она придет.

Дофамин — это внутренняя валюта мозга, которой он платит себе за успех. Но что важнее: мгновенная выплата или умение ждать? Новое исследование показывает, что ожидание награды — это целая сложная наука.

Раньше ученые знали одно: всплеск дофамина — это сигнал об успехе, который мотивирует нас стремиться к большему. Но команда из Сан-Франциско решила копнуть глубже. Они сосредоточились на полосатом теле (стриатуме) — области мозга, отвечающей за обучение и принятие решений, основанных на вознаграждении. Исследователи хотели понять, что происходит с дофамином в разных его уголках.

Оказалось, всё не так просто. Временные колебания дофамина в трех разных частях полосатого тела работают как прогностические часы. Они оценивают, когда придет награда: через долю секунды, через минуту или может через несколько часов. Мозг буквально просчитывает будущее удовольствие.

«Выброс дофамина — это способ мозга сказать: “Эй, ситуация оказалась лучше, чем мы думали! Нужно срочно обновить прогнозы”», — объясняет ведущий автор работы Джош Берке. Эта теория «ошибки предсказания вознаграждения» произвела фурор в нейробиологии. Она связывает активность нашего мозга с принципами машинного обучения. Но, как признается Берке, в ней еще много белых пятен.

Светящийся дофамин

Как мозг предсказывает время награды и учится терпению: роль дофамина

«Раньше считалось, что дофаминовые сигналы распространяются по мозгу равномерно, — говорит Берке. — Но теперь мы видим, что в разных зонах они разные. Значит ли это, что нам нужна не одна, а целый набор теорий, чтобы всё это объяснить?»

Чтобы разобраться, команда Берке провела эксперименты на крысах. Они использовали хитроумный молекулярный сенсор — специальный белок, который начинает светиться, когда связывается с дофамином. По сути, они заставили мозг подсвечивать свои собственные процессы.

«Мы поместили этот датчик в три разные области полосатого тела крысы — туда, где больше всего дофамина, — объясняет ученый. — Каждая из этих зон входит в разные крупные нейронные контуры и обрабатывает разную информацию.»

Исследователи наблюдали за свечением, пока крысы выполняли задания: получали награды с разной скоростью и слышали звуковые сигналы, предсказывающие угощение с разной задержкой. Представьте себе крысу-геймера, ждущую свой бонус.

Долгожданный дофамин

И вот что выяснилось. Колебания дофамина в разных субрегионах отражали разные «таймфреймы» ожидания.

«В зоне, которая связана с контролем движений, дофамин колеблется часто, и она сильно реагирует только на сигнал, который предсказывает награду в течение доли секунды, — рассказывает Берке. — Вторая область заточена под ожидание в десятки секунд. А третья — под сотни секунд.»

«Вот пример: когда вы поете, между движением голосовых связок и тем, понравился ли результат, проходит мгновение, — поясняет ученый. — Для эффективного обучения такая обратная связь должна быть мгновенной. Но иногда мы делаем выбор и узнаем о последствиях лишь спустя долгое время. Мозгу нужны механизмы, чтобы преодолеть этот разрыв и понять, был ли выбор правильным.»

Это исследование также проливает свет на наши внутренние конфликты.

«Мы часто принимаем долгосрочные решения — скажем, похудеть. Но, столкнувшись с сиюминутным выбором (взять пирожное или нет), мы нарушаем обещание, — говорит Берке. — Это кажется иррациональным. Но, возможно, это неизбежное следствие работы нескольких параллельных систем принятия решений. Каждая из них заточена под свой горизонт планирования. Чем ближе потенциальная награда, тем больше подсистем включается в гонку за сиюминутным удовольствием. Противостоять этому невероятно трудно.»

Команда Берке планирует использовать свои открытия для новых экспериментов. Они хотят понять, как дофаминовые сигналы взаимодействуют с другими нейронными цепями.

«Сейчас мы изучаем, как это всё работает и почему ломается при таких состояниях, как зависимости, болезнь Паркинсона или синдром Туретта», — подводит итог исследователь. Похоже, ключ к пониманию наших слабостей и болезней лежит в тонкой настройке внутренних дофаминовых часов.