Top.Mail.Ru
Блог Сабатовского

Нейросети для создания музыки и улучшения звука

Нейросети Креатив Развитие
Красивое видео — это, конечно, важно. Но без качественного звука оно рискует остаться незамеченным. Шум, скачки громкости, заикания — все это может отвлечь зрителя от твоего шедевра и даже вызвать негативную реакцию. Что делать, чтобы получить максимально качественный звук в своем видео? Использовать нейросети. Разбираемся, какие нейронки для чего лучше подходят:
https://sabatovsky.com/aivideo

Проверить микрофон — Mic Check

Лучший способ решить проблему — не допустить ее появления. На сайте Adobe Podcast AI есть бесплатный инструмент Mic Check, который проверит твой микрофон. Как это работает: подключаешь микрофон, открываешь Mic Check и нажимаешь "протестировать микрофон". Затем наговариваешь любой текст, пока программа тебя не остановит. Нейронка проанализирует звук и даст всю нужную информацию: есть ли шум, скачки звука, странные охи-вздохи на заднем фоне. Кроме того, нейросеть сама даст инструкции, как это все исправить через настройки микрофона. После этого можно снова протестировать запись, чтобы убедиться, что звук стал лучше.
https://podcast.adobe.com/miccheck#

Исправить проблемы со звуком — Enhance Speech

Если о Mic Check ты узнал слишком поздно, а косячный звук уже записан, на этом же сайте есть нейронка, которая это исправит. Enhance Speech сделает звук более глубоким, уберет фоновый шум и подкорректирует речь, чтобы та стала более разборчивой. И что важно, не превратит голос в робота. Все звучит естественно. У бесплатной версии есть ограничения: можно обработать не больше часа аудио в сутки, и файл не должен весить больше 500 мб. Есть один нюанс: если звук сильно плохой, русский голос после обработки может немного шепелявить.
https://podcast.adobe.com/enhance

Создать фоновую музыку — Riffusion

В мире личных границ и авторских прав найти бесплатную музыку, которую можно использовать, — сложная задача. И здесь на помощь снова приходят нейросети для генерации музыки. Riffusion — неплохой вариант для этой цели. Работает по тому же принципу, что и все генеративные нейронки: вводишь запрос и получаешь результат. Главное правило генерации: нужно все детально объяснять, давать примеры и использовать простые слова и ассоциации. Тогда ты получишь нужный результат. Можно даже дословно прописать текст песни, если нужна не только музыка, но и слова. Также в Riffusion есть библиотека звуков, их тоже можно использовать бесплатно, если что-то понравится.
https://app.riffusion.com/

Сделать озвучку — ElevenLabs

Нейронка ElevenLabs поможет вам озвучить видео. Короткие тексты до 333 символов можно озвучивать без регистрации. До10 тысяч символов (примерно 10 минут говорения) в месяц — бесплатно, но с регистрацией. Дальше уже за деньги — от 5 долларов в месяц. Поддерживает 29 языков, включая русский. Есть множество разных голосов на любой вкус: женские, мужские, детские, мультяшные. Все звучат более-менее реалистично. Могут быть ошибки в ударениях, но их легко избежать, расставив в сложных или неоднозначных словах большие буквы на месте ударных гласных.
https://elevenlabs.io/
Разумеется, это не полный список нейросетей, которые могут помочь тебе в работе со звуком и музыкой. Но это та база, которую будет полезно освоить, прежде чем погружаться в более сложные инструменты. Напомним, что ключ к успеху — в практике. Поэтому вперед изучать новые инструменты!