IMG-LOGO
image

02 июл. 2024

Просмотров: 119

Студентка создала программу для замены сленга в аудио: как это работает

Знакомьтесь: студенты Московского авиационного института снова удивляют. Они не только про самолеты думают, но и создают полезные IT-штуки для повседневности. Их новое детище — программа, которая учится слышать наш сленг и… вежливо его поправлять. Звучит как сюжет для легкой научной фантастики, правда?
Что же эта умная программа может, и как ее вообще использовать? Давайте разбираться без сложных терминов.

Автор этой идеи — Дарья Иванченко с кафедры вычислительной математики. Она показала сервис, который буквально «моет» аудио, заменяя разговорные словечки на их литературных двойников. А принцип, между прочим, элегантен и понятен.

  1. Сначала вы создаете свой «словарь нарушителей»: записываете те сленговые фразы, которые программа должна будет отлавливать. Она преобразует эти звуки в набор чисел — своеобразный цифровой отпечаток слова.
  2. Потом через тот же процесс пропускается аудиодорожка, которую нужно проверить. Все та же магия превращения звука в цифры.
  3. А дальше в дело вступает хитрый алгоритм. Он сравнивает численные «отпечатки» из словаря с «отпечатками» проверяемой записи. Где находит совпадение — там и вставляет цензурную, литературную замену. Умно же?

Знаете, что самое интересное? У этого проекта пока нет прямых конкурентов в России. Представьте, сколько времени тратят звукорежиссеры, вручную вычищая эфиры от лишних слов. Эта работа кропотливая, почти ювелирная. А тут — автоматический помощник.

«Сложнее всего оказалось добиться приемлемой точности. Приходилось долго подбирать нужные коэффициенты», – призналась Дарья. И ведь это главный вызов в любой подобной разработке: научить машину понимать человеческую речь со всеми ее интонациями и акцентами.

Студентка создала программу для замены сленга в аудио: как это работает

Но на этом история не заканчивается. В будущем программу можно научить работать с живым потоком речи. Вообразите: ведущий прямого эфира или блогер говорит без подготовки, а программа на лету «причесывает» его речь, убирая сленг и крепкие выражение. Ценный инструмент для медиа, не находите? Получается цифровой суфлер для чистой речи.