GigaCheck: как определить, написал ли текст человек или нейросеть

На конференции GigaConf 2024 представили нечто интересное: детектор авторства текстов GigaCheck. Разработка от исследователей Сбера и SberDevices умеет определять, кто написал русскоязычный текст — человек или нейросеть. И самое главное — её можно встроить куда угодно через API.

Забавный парадокс: чтобы бороться с текстами от ИИ, приходится создавать инструменты, которые сами являются вершиной технологий. Цикл замкнулся?

Насколько же можно доверять такому детектору? Судя по заявлениям, точность GigaCheck достигает 94,7%. Для сравнения: у ближайшего известного аналога этот показатель не превышает 85%. Получается, на данный момент это самый точный инструмент в своём роде. Неплохо для задачи, которую многие эксперты считали практически нерешаемой.

Пока система выдаёт общую оценку для всего текста. Если в статье перемешаны человеческие и сгенерированные фрагменты, вердикт выносится по тому, чего больше. Но разработчики обещают, что скоро детектор научится выделять машинные куски по отдельности — как будто будет подсвечивать их маркером. Это уже серьёзно.

GigaCheck: как определить, написал ли текст человек или нейросеть

Кому это нужно? Да практически всем, кто работает с текстом. Научные рецензенты смогут проверять диссертации и статьи. Редакторы — оценивать работу копирайтеров. Администраторы пабликов — отсеивать массовые комментарии, написанные ботами. Только представьте, как изменится интернет, если такие инструменты войдут в повседневную практику.

«Долгое время создание работающего детектора считалось почти невозможным. Для этого нужны колоссальные ресурсы и данные, и даже их может не хватить. Помните, как OpenAI пыталась выпустить детектор для английских текстов, а потом свернула проект из-за низкой точности? Это показывает, какую сложную задачу нам удалось решить», — отмечает Сергей Марков, управляющий директор Управления экспериментальных систем машинного обучения SberDevices.

Попробовать GigaCheck в действии можно уже сейчас — на официальном сайте или через бота в Telegram. Для бизнеса, который хочет внедрить технологию, работает система заявок. Интересно, а как скоро подобные проверки станут такой же рутиной, как проверка орфографии?