Студентка создала программу для замены сленга в аудио: как это работает
Автор этой идеи — Дарья Иванченко с кафедры вычислительной математики. Она показала сервис, который буквально «моет» аудио, заменяя разговорные словечки на их литературных двойников. А принцип, между прочим, элегантен и понятен.
- Сначала вы создаете свой «словарь нарушителей»: записываете те сленговые фразы, которые программа должна будет отлавливать. Она преобразует эти звуки в набор чисел — своеобразный цифровой отпечаток слова.
- Потом через тот же процесс пропускается аудиодорожка, которую нужно проверить. Все та же магия превращения звука в цифры.
- А дальше в дело вступает хитрый алгоритм. Он сравнивает численные «отпечатки» из словаря с «отпечатками» проверяемой записи. Где находит совпадение — там и вставляет цензурную, литературную замену. Умно же?
Знаете, что самое интересное? У этого проекта пока нет прямых конкурентов в России. Представьте, сколько времени тратят звукорежиссеры, вручную вычищая эфиры от лишних слов. Эта работа кропотливая, почти ювелирная. А тут — автоматический помощник.
«Сложнее всего оказалось добиться приемлемой точности. Приходилось долго подбирать нужные коэффициенты», – призналась Дарья. И ведь это главный вызов в любой подобной разработке: научить машину понимать человеческую речь со всеми ее интонациями и акцентами.
Но на этом история не заканчивается. В будущем программу можно научить работать с живым потоком речи. Вообразите: ведущий прямого эфира или блогер говорит без подготовки, а программа на лету «причесывает» его речь, убирая сленг и крепкие выражение. Ценный инструмент для медиа, не находите? Получается цифровой суфлер для чистой речи.