GigaCheck: как определить, написал ли текст человек или нейросеть
Насколько же можно доверять такому детектору? Судя по заявлениям, точность GigaCheck достигает 94,7%. Для сравнения: у ближайшего известного аналога этот показатель не превышает 85%. Получается, на данный момент это самый точный инструмент в своём роде. Неплохо для задачи, которую многие эксперты считали практически нерешаемой.
Пока система выдаёт общую оценку для всего текста. Если в статье перемешаны человеческие и сгенерированные фрагменты, вердикт выносится по тому, чего больше. Но разработчики обещают, что скоро детектор научится выделять машинные куски по отдельности — как будто будет подсвечивать их маркером. Это уже серьёзно.
Кому это нужно? Да практически всем, кто работает с текстом. Научные рецензенты смогут проверять диссертации и статьи. Редакторы — оценивать работу копирайтеров. Администраторы пабликов — отсеивать массовые комментарии, написанные ботами. Только представьте, как изменится интернет, если такие инструменты войдут в повседневную практику.
«Долгое время создание работающего детектора считалось почти невозможным. Для этого нужны колоссальные ресурсы и данные, и даже их может не хватить. Помните, как OpenAI пыталась выпустить детектор для английских текстов, а потом свернула проект из-за низкой точности? Это показывает, какую сложную задачу нам удалось решить», — отмечает Сергей Марков, управляющий директор Управления экспериментальных систем машинного обучения SberDevices.
Попробовать GigaCheck в действии можно уже сейчас — на официальном сайте или через бота в Telegram. Для бизнеса, который хочет внедрить технологию, работает система заявок. Интересно, а как скоро подобные проверки станут такой же рутиной, как проверка орфографии?