Можно ли предсказать жизнь? Как алгоритмы учатся прогнозировать наши судьбы
Исследователи из Технического университета Дании подошли к жизни как к последовательности — рождение, школа, работа, болезни, переезды. Их модель, названная life2vec, преобразует эту историю в числовой код, чтобы искать закономерности.
Цель — не просто гадание. Ученые хотят понять, какие глубинные связи между нашими поступками, здоровьем и социальными условиями могут раскрыть подобные вычисления. От диагностики рисков заболеваний до прогноза доходов — спектр возможных «предсказаний» огромен.
«Это общий каркас для прогнозирования человеческой жизни. Он может предсказать почти что угодно, если у вас есть подходящие данные для обучения», — поясняет один из авторов работы, Суне Леманн.
«Модель способна оценивать риски для здоровья, вероятность иметь детей или столкнуться с ожирением. Она может спрогнозировать, кто имеет высокие шансы заболеть раком, а кто — нет. Или даже предугадать будущие заработки», — добавляет он.
Технически модель работает по принципу, схожему с языковыми алгоритмами вроде ChatGPT. Но вместо слов она «читает» события: дата и место рождения, образование, визиты к врачу, смена работы, получение социальных пособий.
«Жизнь — это просто череда событий, — говорит Леманн. — Люди рождаются, посещают поликлиники, учатся, переезжают, женятся. Каждое такое событие можно перевести в цифровой вектор».
Публикация о работе породила волну спекуляций. В сети тут же появились мошеннические сайты, предлагающие «рассчитать дату смерти» в обмен на личные данные. Датские ученые категорически подчеркивают: их модель закрыта и используется только в исследовательских целях.
Шесть миллионов судеб как учебник
Модель life2vec училась на обезличенных данных шести миллионов датчан, собранных государственной статистикой.
Итоги впечатляют: алгоритм верно предсказал смерть в течение четырех лет в 78% случаев, а переезд в другой город или страну — в 73%. «Мы взяли относительно молодую группу людей от 35 до 65 лет, — объясняет Леманн. — На основе восьми лет их жизни (2008–2016) мы пытались предсказать, умрут ли они в последующие четыре года».
Фокус на возрастной группе с низкой естественной смертностью позволил по-настоящему проверить точность алгоритма. Не самое весёлое исследование, но крайне показательное.
Этика цифрового предсказания
Модель пока далека от практического применения. «Сейчас это чисто исследовательский проект, — настаивает Леманн. — Мы изучаем границы возможного».
Однако он убеждён, что аналогичные разработки уже ведутся за закрытыми дверями. «Крупные компании наверняка создают такие модели, просто они об этом не говорят. Их цель — точнее направлять рекламу или увеличивать продажи».
Леманн настаивает на важности публичной дискуссии: «Нам нужен открытый диалог, чтобы понять, как подобная чувствительная информация — например, вероятная дата смерти — может повлиять на человека».
Датский эксперт по этике данных Пернилле Транберг считает, что страховщики уже используют подобные алгоритмы. «Представьте, что вас занесли в группу высокого риска по хроническому заболеванию. Вас могут заставить платить большие страховые взносы, отказать в кредите или даже в государственном лечении, если сочтут, что шансы слишком низки», — говорит она.
Ученые отдают себе отчёт: персональный «график рисков» — информация взрывоопасная. Но наша жизнь всё больше оцифровывается, превращаясь в учебный материал для алгоритмов. А значит, они будут предсказывать наш путь всё точнее. Готовы ли мы к таким знаниям о себе? Вопрос, пожалуй, риторический.