Как алгоритмы учатся читать «язык» рака и болезней Альцгеймера
Что общего у рекомендаций Netflix и… языка раковой клетки? Звучит как шутка, но ученые из Колледжа св. Георгия именно на это обратили внимание. Они взяли технологию, которая угадывает ваши сериалы, и научили ее читать «биологический язык» — язык белков внутри наших клеток. Идея в том, чтобы в будущем находить и исправлять «грамматические ошибки» в этой речи, которые приводят к тяжелым болезням.
Вы же сталкивались с этим: алгоритмы изучают ваши лайки и предсказывают, что вам понравится. Или голосовой помощник учится понимать именно ваш голос. Теперь представьте, что такой же «умный» алгоритм начал вдумчиво читать диалоги, которые ведут между собой молекулы в вашем теле. Именно такую задачу и поставили перед масштабной языковой моделью. Ее обучали понимать язык белковых конденсатов — особых капелек в клетках, которые управляют ключевыми процессами. И если этот язык сбивается, начинаются неполадки, ведущие к раку или нейродегенеративным заболеваниям.
И самое потрясающее? Модель самостоятельно, без подсказок, пришла к тем же выводам, на которые у ученых ушли десятилетия кропотливых исследований. Она буквально переоткрыла грамматику языка белков.
«Белковые конденсаты — это горячая тета в науке, — объясняет профессор Томас Ноулз, ведущий автор исследования. — Они дирижируют самыми важными процессами: как наша ДНК превращается в белки и как клетки эти белки создают. Сбой в их работе — прямая дорога к болезни. Поэтому, если мы хотим исправлять «опечатки» внутри клеток, нам критически нужны инструменты вроде обработки естественного языка». По сути, речь идет о создании универсального переводчика с биологического на человеческий.
Это не первый случай, когда вычислительные методы совершают прорыв в биологии. Вспомните проект AlphaFold от DeepMind, который решил головоломку фолдинга белков — предсказал, как цепочка аминокислот сворачивается в сложную 3D-форму. Теперь же мы учимся не только видеть форму, но и понимать смысл того, что эти белки «говорят». Интересно, какие еще диалоги в нашем теле мы до сих пор не слышали?