Нажмите ENTER, чтобы посмотреть результаты поиска, или нажмите ESC для отмены.

Нейросети заменяют композиторов, пародистов и звукорежиссеров

Нейросети уже несколько лет успешно используются популярными музыкальными сервисами. Алгоритмы изучают музыкальные пристрастия пользователей и советуют им новую музыку. Но это лишь малая толика возможностей искусственного интеллекта в работе со звуковыми файлами. Уже сегодня мы можем проверить некоторые из них, находящиеся в широком доступе 

Создаем цифровую копию своего голоса

Самым ярким примером нейросервиса для работы с аудио в прошлом году представил канадский стартап Lyrebird. Предложенный набор алгоритмов позволяет сымитировать голос любого человека. Уникальность сервиса в том, что достаточно звукового файла длинной 1 минуту. Конкурентам Lyrebird требуется намного больше времени. Сегодня сервис позволяет создать цифровую копию вашего голоса. Протестировать его легко — после регистрации вам необходимо начитать на микрофон вашего ноутбука 30 фраз, которые появятся на экране. После этого сервис сгенерирует ваш голос и попробует прочесть фразы, которые вы наберете в соответствующем окне.

Lyrebird

В Lyrebird утверждают, что могут не только воссоздать голос, но и окрасить его эмоционально: на сердитый, веселый, грустный. Они уверяют, что это будет полезно для озвучивания текста голосами известных людей, для совершенствования работы голосовых ассистентов и прочих безобидных применений. Для демонстрации возможностей компания выложила беседу искусственных Обамы, Трампа и Клинтон. В текущей версии можно достаточно легко отличить воссозданный голос от оригинального, но сервис растет и вскоре может добиться идеального повторения.

Кстати, о конкурентах — близкая по уровню исполнения работа проделана создателями Photoshop — IT-гигантом Adobe. Они создали «фотошоп для аудио» — программное обеспечение Project VoCo. Ему понадобится около 20 минут, чтобы распознать чей-то голос, а затем речь можно будет редактировать. Можно вырезать слова и даже вставлять фразы, которые не были сказаны обладателем голоса. Но это пока не онлайн-сервис, поэтому нам не подходит.

Генерируем музыку, которая нам нравится

Российский стартап Mubert — онлайн-композитор электронной музыки. Сервис генерирует свободный от копирайта поток ликвид-фанка, дип-хауса, эмбиента и чилстепа, генерируемый алгоритмом в режиме реального времени. Если вы обладатель гаджета на iOS, можете опробовать сервис уже сейчас.

Mubert на iTunes

Похожий сервис предлагают создатели Amper Music. Правда, нейросети здесь упомянуты исключительно в маркетинговых целях. Потому что трек сочиняется в результате простого подбора его характеристик.

Amper Music

Использовать нейросети для генерации музыки не гнушаются даже крупные компании. Они не используют общедоступные сервисы и ориетируются на собственные разработки. Но успех некоторых из них позволяет судить о будущем таких сервисов. Например, компания Sony Music с помощью сервиса Flow Machines получила песню Daddy’s Car, написанную в стиле The Beatles и неплохо аранжированную.

Ищем фрагмент на аудиозаписи по тексту

Если вы работаете с большими аудиофайлами, в которых периодически необходимо находить важные фрагменты, то не пройдете мимо сервиса DeepGram. Пользователь сервиса может ежемесячно загружать до 40 часов аудио и видео. Файлы можно загружать с локального диска или по ссылке с популярных видеохостингов. Пользователь может как просмотреть текстовую транскрипцию файла целиком, так и найти непосредственно место, где звучит искомая фраза — искомые места будут отмечены красными точками на временной шкале. DeepGram использует методы глубокого обучения и ориентируется при поиске не на написание проиндексированного текста, а на фонетическую транскрипцию. Такой подход позволяет онлайн-платформе искать и находить не только точно совпадающие слова и фразы, но и те, которые звучат похоже при разном написании. При этом, у фонетического поиска есть и негативный эффект — из-за него в результатах может содержаться большое количество ошибок.

DeepGram

Режем, клеим и пишем голос онлайн

Традиционно мы не обходим стороной простые сервисы, которые построены без использования нейросетей, но позволяют решить простые задачи, которые неоднократно возникают перед любым из нас.

Если нужно отрезать часть аудиодорожки, то с этим справятся такие онлайн-сервисы:

audiorez.ru

mp3cut.ru

madringtones.org

tools.diktorov.net

Если нужно соединить два аудиофайла вместе, это можно сделать здесь:

audio-joiner.com/ru

mp3cut.foxcom.su/audio-splitter-joiner

Бывает необходимость быстро сделать аудиозаметку. С этим справятся тут:

vocaroo.com

online-voice-recorder.com/ru

online-microphone.ru

voicespice.com

Если вы давно и успешно используете какие-либо онлайн-сервисы для работы с аудио, не забудьте поделиться адресами с нами и читателями на наших страницах в соцсетях. А также не забудьте познакомиться с подборками сервисов для работы с текстами, иллюстрациями и видео.

Рекомендуем