Тёмный

0171 Лучшая озвучка текста голосом / Подробный тест нейросетей 

Timesaver
Подписаться 50 тыс.
Просмотров 12 тыс.
50% 1

Привет, друзья! В этом мы с вами выберем лучшую нейросеть для озвучки текста голосом!
🔥Мои сборки нейросетей и уроки: boosty.to/timesavervfx
🔥Бесплатный курс по Davinci Resolve Fusion: timesavervfx.com/
00:00 Начало
00:27 Балаболка
02:17 Dupdub
03:50 Elevenlabs
05:53 Texttospeech
06:44 Freetts
06:58 TerraTTS
08:31 XTTS
11:24 Bark
12:48 Silero
16:26 RVC
17:53 Yandex SpeachKit
Ссылки на лучшие нейросети для озвучки:
www.cross-plus-a.com/ru/balab...
rhvoice.ru/ru-voices/
huggingface.co/spaces/TeraTTS...
huggingface.co/spaces/coqui/xtts
huggingface.co/spaces/suno/bark
t.me/silero_audio_bot
colab.research.google.com/git...
github.com/RVC-Project/Retrie...
cloud.yandex.ru/ru/services/s...
✔Telegram канал: t.me/timesavervfx
✔Группа VK: timesaver_vfx
✔Yandex Zen: zen.yandex.ru/id/6221c692f9ad...
✔Чат в Telegram: t.me/timesaverchat
✔Чат в Discord: / discord
#neuralnetworks #tts

Опубликовано:

 

1 июн 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 114   
@mike-stpr
@mike-stpr 2 месяца назад
Пока что лучше всех Яндекс. Давно им пользуюсь. Недавно, правда, цены подняли, но всё равно оправданно. По поводу ограничений -- у него вполне вменяемый API, легко можно сделать скрипт бьющий текст на куски и пихающий в движок параллельно. Выгода еще в том, что у яндекса очень гибкая настройка голосов и разделение на мужские и женские достаточно условны -- можно понизить женский до мужского и наоборот, т.о. озвучив всех персонажей книги разными узнаваемыми тембрами. Самые классные голоса в Яндексе это filipp и alena. Остальные тоже ничего, но эти лучшие. Текст для проверки классный конечно, но я новые нейросети проверяю другим: примерно таким "На горе стоял замок, на воротах висел замок. На горе врагам все лето вокруг летали драконы. До следующего замка было всего полчаса лету." (или т.п.) Пока ни одна нейронка не осилила, но скоро осилит, уверен! :-) Спасибо за шикарный ролик, канал и Ваш труд! Он бесценен! СПАСИБО!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 🙂
@stab4544
@stab4544 2 месяца назад
абсолютно согласен. Мои "любимые " на данный момент Кирилл, Антон и Ермил, Качество у последнего на слух вроде бы и похуже, но для худ-книг лучший вариант.хотя приходится звуковой спектр под свои уши поднастраивать
@andreyp6226
@andreyp6226 2 месяца назад
В Элевенлабс надо букву писать Большую, на которую ударение - в сЕренькую.
@vasuha
@vasuha 2 месяца назад
Еще был мэйджик Гуди в начале 2000х, прикалывались матные разные слова ему подсовывали.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
да, помню) тогда это было что-то удивительное
@ivangushchin7326
@ivangushchin7326 2 месяца назад
Прекрасный формат видео. Приятно видеть Ваши эмоции. ❤
@firstlast493
@firstlast493 2 месяца назад
Из этих самая лучшая озвучка для аудиокниги у XTTS
@user-hn3qg1bh6i
@user-hn3qg1bh6i 2 месяца назад
Как всегда, спасибо за труд. Ждём новых выпусков.
@funnyests
@funnyests 2 месяца назад
*4:43** Можно повлиять на ударение ! Просто ставишь букву заглавной, на которую нужно ударение, например: замОк )*
@TimesaverVFX
@TimesaverVFX 2 месяца назад
конечно можно, вопрос сколько это займет у вас времени для большого текста, тогда уж проще самому прочитать)
@user-kn8nl4lv5y
@user-kn8nl4lv5y 2 месяца назад
Нельзя. То иллюзия. В этой нейронке просто каждая генерация случайная, даже с теми самыми настройками. Мне приходилось в сложных словах просто несколько раз перезапускать процесс, пока получал правильное ударение, а затем склеивал в одно аудио.
@studiogsm
@studiogsm 2 месяца назад
Читайте всегда документацию на сайте: Произношение: В настоящее время эта функция поддерживается только АНГЛИЙСКИМИ моделями «Eleven English V1» и «Eleven Turbo V2 English ». для русского языка еще не сделали, ударения она ставит от балды, и тратятся ваши кредиты, разбивайте текст на 3-4 предложения не больше, иначе она допустит ошибку в большом тексте и все насмарку.
@alexkhudobin3767
@alexkhudobin3767 2 месяца назад
Последнее время твои видео сложны для реализации проектов не подкованных в этой области или начинающих а также немолодой публики. Но этот ролик прям для всех. Побольше бы таких работ. Спасибо. Лайк!
@Tolyan991
@Tolyan991 2 месяца назад
Так у тебя в тексте слова написаны через Е когда надо писать через Ё, вот они и читают через Е. Я просто понять не могу, как может не быть на клавиатуре кнопки Ё, когда она всегда под кнопкой ESCape находилась, и до сих пор находится.
@letsplaygamesps1771
@letsplaygamesps1771 Месяц назад
Большое спасибо. Сам очень часто пользуюсь такими нейросетями и очень выручают
@ndmitrienkov5083
@ndmitrienkov5083 2 месяца назад
Крутой выпуск, спасибо!
@NikitaVladimirovich
@NikitaVladimirovich 2 месяца назад
Лучший ( прорекламил яндекс ) ! спасибо , оч нравиться все что ты делаешь , щас разбогатею залечу на бусте )))) !!!!!!!
@TimesaverVFX
@TimesaverVFX 2 месяца назад
Друзья еще полезные видео по теме: Как убрать эхо: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-fxfMEdXZGRI.html Как изменить голос: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-M6Nmb7JY_gQ.html Мои сборки нейросетей и уроки: boosty.to/timesavervfx
@havemoney
@havemoney 2 месяца назад
Скажите а модуль Голос в Голос у вас работает? Автор обещал вроде поправить но тишина.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
голос в голос отлично работает в RVC
@vladhanov1530
@vladhanov1530 2 месяца назад
play dot ht . Английская версия - лучшая на планете. Русский вар-т (голос Алёша) уже не в ультрареалистичной части интерфейса, но на мой вкус идеально. Т.е. это тот уровень синтеза, когда речь идеальна и лишь ищешь тембры. Проверял на вашем самле.
@tvcrowd6009
@tvcrowd6009 2 месяца назад
Ого, спасибо, как раз то что я искал
@user-wj2ws1po6q
@user-wj2ws1po6q 2 месяца назад
Добавил бы озвучку из гугль-переводчика, или микрософт-баузером ) голос в голос - нейросеть so-vits-svc-fork (локально) модель Saya, Санчес, вот попробуйте, ручаюсь, вы испытаете настоящий интеллектуальный оргазм )))
@Yogsvet
@Yogsvet 2 месяца назад
Интересная идея. А как эту озвучку из гугл-переводчика в звуковой файл вытащить?
@user-wn3uy9tw1x
@user-wn3uy9tw1x Месяц назад
Спасибо огромное!❤
@mrudakov57
@mrudakov57 Месяц назад
Нейросетей по озвучке много, спасибо за обзор! Каждый может выбрать для себя подходящую.., посмотрев это видео. Главное, я определился..!!😊 😊
@user-qp7uv7wu7e
@user-qp7uv7wu7e 2 месяца назад
Во многих нейросетях для озвучки, слог на котором нужно делать ударение можно определять специальным символом, например +. Так что если неправильное ударение - это единственная проблема, то это можно поправить.
@guestalex
@guestalex 2 месяца назад
Санчес, ещё есть нейронки, где ты сам можешь прочитать текст, а потом изменить тембр на более брутальный или ещё там какой хочешь... Я делал как-то в одном платном решении, там по 30 секунд можно было делать... Я разбил по таймингу все аудио и перегнал там, а потом склеил - отлично получилось...
@TimesaverVFX
@TimesaverVFX 2 месяца назад
так это как раз RVC: можно поменять тембр, нет ограничений по длительности, бесплатно, много готовых моделей и можно свою сделать: github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI Там в релизах портативная сборка, а голоса например тут: www.weights.gg/ru
@alexanderdan5187
@alexanderdan5187 2 месяца назад
Спасибо за обзор!!!
@vaysheslavvolkov1581
@vaysheslavvolkov1581 2 месяца назад
Приколько) Спасибо
@Green1991ize
@Green1991ize 2 месяца назад
Супер полезное видео ⚡️
@Mar_chella
@Mar_chella 2 месяца назад
Круто 👍, благодарю
@Alex-sx8nr
@Alex-sx8nr 2 месяца назад
я юзаю Eleven просто короткими кусками текст закидывааю и немного настройками играюсь если с ударением проблемы, всё таки по набору голосов и тембров они лучшие, ну на мой взгляд
@TimesaverVFX
@TimesaverVFX 2 месяца назад
если есть время и желание править ударения и буквы, или текст маленький, то наверно, тембры там хорошие, но в режиме закинул текст и получил результат Яндекс топ, а тембр можно любой получить через RVC
@ThelIHTCIl
@ThelIHTCIl 2 месяца назад
@@TimesaverVFX про RVC интересно узнать - если закинуть нерусский образец речи на русский текст, что произойдёт? акцент?
@stas_web
@stas_web 2 месяца назад
Ударения можно почти в любой нейронке с помощью апрстрофов либо звездочек расставлять
@user-lj1zj8oz1t
@user-lj1zj8oz1t 2 месяца назад
Спасибо за видео, очень интересно и вовремя (для меня), как раз сижу перевожу с русского на английский пачку видосов. Огромное уважение и почет Вам!
@aleksandr.v100
@aleksandr.v100 2 месяца назад
чем ты занимаешься? зачем ты пачки переводишь текстов?
@igornaumov6900
@igornaumov6900 2 месяца назад
Привет, а ты какими сервисами пользуешься для перевода видео с русского на английский? У меня сейчас тоже есть такая задача, ищу решение. Буду рад, если сможешь помочь!
@user-lj1zj8oz1t
@user-lj1zj8oz1t 2 месяца назад
@@igornaumov6900 я сначала делаю модель вдладельца русского голоса в RVC, потом начитываю текст в TTS своим на английском, а потом делаю замену моего голоса моделью RVC. Не идеально конечно, но если пройтись потом напильником - вполне годно. Главный критерий - голос на русскоязычном видео переносится в анлоязычную дорожку.
@user-lj1zj8oz1t
@user-lj1zj8oz1t 2 месяца назад
@@aleksandr.v100 перевожу видосы с русского на английский для англоязычной аудитории
@igornaumov6900
@igornaumov6900 2 месяца назад
@@user-lj1zj8oz1t хм, интересный подход) благодарю!) я напрямую использовал HeyGen для перевода видео,с сохранением голоса и артикуляции, но у них ценник конский просто... Вот ищу альтернативу)
@PrimFL
@PrimFL 2 месяца назад
Если у вас хром, то советую расширение Text to speech..,в фришной версии прекрасно работает (пять голосов на русском), паузы можно убрать в любом аудиоредакторе, записать в программах Ace Stream или GiliSoft Audio Recorder Pro 11.1.0 (репаки найдёте). Есть в редких случаях неправильное ударение, но можно заменить слово синонимом..,озвучка естесственная по сравнению с представленными здесь, в ролике....
@imhotep403
@imhotep403 2 месяца назад
Спасибо 🤝
@Manarakixix
@Manarakixix 2 месяца назад
Класс, спасибо ))
@FilmRestorations
@FilmRestorations 2 месяца назад
Очень хорошо держитесь в кадре, без позёрства, мимическая артикуляция соответствует смысловой нагрузки... Есть ли нейросети, которые создают музыкальное сопровождение к немым фильмам? хочу Аэлиту 1924 в 4К предложить Netflix c муз. сопровождением и озвучкой интротитров, и стать вашим главным спонсором)
@tvcrowd6009
@tvcrowd6009 2 месяца назад
А нет в планах такого же ролика по сравнению нейронок для музыкального оформления? Или там все плохо?
@AchieveVibes
@AchieveVibes 2 месяца назад
Этим видосом ты заставил меня захотеть подписаться на бусти. Я, конечно сам могу все найти, настроить, но за такой подгон надо бы отблагодарить.
@AchieveVibes
@AchieveVibes 2 месяца назад
Пользовался давно еще балаболкой, лет 10 назад. Там есть специальные конфиги, где можно добиться нужного произношения.
@dishabay
@dishabay 2 месяца назад
С тобой еще интересней получается! Продолжай ...
@omgtravius8156
@omgtravius8156 2 месяца назад
Хм, как бы ударения легко правятся знаком + перед нужной буквой, а чтобы говорили "ё" надо писать "ё". По итогу лучше всех звучит Elevenlabs, а неправильное удаление легко правится.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
а еще проще зачитать текст своим голосом, только тест не про это)
@Aleksey2846
@Aleksey2846 2 месяца назад
хорошая реклама яндекса)
@antonmanukyan3307
@antonmanukyan3307 2 месяца назад
Хочу поставить два лайка, но при попытке поставить второй, первый снимается. Шутка. Контент - огнище!
@LyNat1km1
@LyNat1km1 2 месяца назад
Чтоб ударенье поставить нужно букву заглавной сделать
@afferist
@afferist 2 месяца назад
спасибо
@user-pn7lz3me7c
@user-pn7lz3me7c 2 месяца назад
Здравствуйте. Не понял как скачать, где найти Silero TTS.
@user-fb4nh3oi9i
@user-fb4nh3oi9i 2 месяца назад
От души благодарю за видео. Подскажите пожалуйста, а RVC можно на МАК установить? Или он только на Винду?
@TimesaverVFX
@TimesaverVFX 2 месяца назад
под мак можно попробовать через пинокио установить: pinokio.computer/ Или онлайн через гугл колаб
@user-fb4nh3oi9i
@user-fb4nh3oi9i 2 месяца назад
@@TimesaverVFX Да, через Пинокио действительно получилось. Супер. Обычно на Маке почти ничего с нейросетями не получалось у меня. А может еще подскажите, где можно скачать модели голоса (желательно русскоязычного уклона, но в целом хотя бы какие-то)?
@microflm
@microflm 2 месяца назад
А по RVC был обзор? Плагинами к Davinci Resolve что-то из этих чудных штук уже подключается, чтобы в одном рабочем пространстве оставаться?
@Nikolos7
@Nikolos7 2 месяца назад
ясненько, так и запишем - Санчес не... рекламирует платный сервис яндекса)... по мне задолбаешься нарезать текст на 500 символов и вырезать уже из аудио это "генерация голоса выполнена яндекс-клауд спич кит"... Спасибо на наводки на альтернативные бесплатные сервисы.
@andrg9093
@andrg9093 2 месяца назад
Ну наконец кто-то добрался до яши) уже несколько лет как он лучший, по крайней мере в русскоязычном сегменте, а все озвучивают в каком-то гне) и да, за сервис можно даже заплатить за удобство и объем, ибо стоит он копейки.
@Krasnopyourov
@Krasnopyourov 2 месяца назад
Спасибо.
@sofawarrior6944
@sofawarrior6944 2 месяца назад
у тинькова была в открытом доступе очень крутая говорилка. Сейчас халява закрыта, но женский нежный голос ооочень круто звучал. А яндекс, на мой взгляд, тут лучший, самый реалстичный
@vedeoyura
@vedeoyura 2 месяца назад
круто
@loadmore
@loadmore 2 месяца назад
Надо было еще на староруском проверить 😅
@Serebriakov9
@Serebriakov9 2 месяца назад
Почти в любом голосовом TTS движке ударение легко задается плюсиком перед ударной гласной в слове. Автор видео видимо первый раз столкнулся с технологией TTS - и сразу пилить контент не разобравшись.
@drms1101
@drms1101 2 месяца назад
В Балаболке можно нейронами озвучивать
@teslahuman
@teslahuman 12 дней назад
годнота
@Pavel_video_edit
@Pavel_video_edit 2 месяца назад
Здравствуйте, будет ли скидка на пакет переходов для Davinci?
@TimesaverVFX
@TimesaverVFX 2 месяца назад
да, сейчас действует скидка 30%
@studioprometheus5530
@studioprometheus5530 28 дней назад
А как с авторським правом, можна использовать на йотуб?
@TimesaverVFX
@TimesaverVFX 10 дней назад
Да
@kingleon980
@kingleon980 2 месяца назад
Кроме того, в Яндексе SK можно расставлять ударения через специальные знаки, если автоматом получилось некорректно.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
во всех нейронках есть такая возможность, но задача теста определить какая нейросеть лучше понимает текст без дополнительных манипуляций
@andreyvolkov1322
@andreyvolkov1322 2 месяца назад
Давно использую Silero Speech как лучший, но только третьей версией голосов. Четвертая слишком циферит и утомляет слух. Ещё есть проблема на больших объемах - попробуйте озвучить польностью Мастера и Маргариту. У меня, например, примерно на 50% остановка процесса. Рендер на проце. Нарезаю текст, примерно, по 30000 знаков в Балаболке, но опять неудобство - в программу с использованием движка Silero можно добавить только 1 текстовый файл. Вот была бы пакетная обработка.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
а на GPU Silero не пробовали?
@andreyvolkov1322
@andreyvolkov1322 2 месяца назад
@@TimesaverVFX AMD у меня встройка и с её поддержкой не нашёл портабельную сборку. Пользуюсь сейчас одной китайской онлайн нейросеткой. На втором месте после яндексовских голосов в личном рейтинге, но светить не буду, а то лавочка может схлопнуться.
@fallout8492
@fallout8492 21 день назад
Некоторым нужно Ё писать.
@ruslanflex
@ruslanflex 2 месяца назад
Нес в руке. Это Gameboy от NES
@yklandares
@yklandares 2 месяца назад
Таймсэйвер лучший человечище
@cairo8905
@cairo8905 2 месяца назад
how to use the rvc project it looks complicated
@wakeup2.369
@wakeup2.369 2 месяца назад
Бро вот еще штука читалка демагог с встроенным движком силеро портабл версия с силеро сама ударения расставляет
@michail_777
@michail_777 2 месяца назад
К сожалению на данный момент вот только такое что ты показал. И такое на всех языках. Для многих кажется то,что на английском хорошо разговаривает,но там так же есть помарки,просто люди как не носители языка не слышат этого. Полагаю что в течении пару лет всё станет гораздо лучше.
@Zherebtsow
@Zherebtsow 2 месяца назад
так а к "нес" какие притензии?) ты напиши нËс и будет нёс) нес так пишут в мессенджерах друг другу) а слово пишется через Ë же)) Да и потом в большинстве таких нейронок, можно руками выставлять ударение через символы * например. Проблем с ударением не вижу вобще.
@RussianManikure
@RussianManikure 2 месяца назад
Вчера попался канал нейронка называется, там на крайнем ролике про чат gpt и бота, озвучка лютейшая, ради интереса посмотрите, может потом расскажете как она это делает, ей вопрос задал, пока молчит, спасибо за обзор.
@havemoney
@havemoney 2 месяца назад
Тут где то был мой комент, скаджите а вкладка Голос в Голос работает?
@TimesaverVFX
@TimesaverVFX 2 месяца назад
в RVC работает
@havemoney
@havemoney 2 месяца назад
@@TimesaverVFX Но он в RVC не переводит, XTTS должен делать перевод и сохранять голос оригинала.
@TimesaverVFX
@TimesaverVFX 2 месяца назад
@@havemoney в XTTS я так понял эта функция корректно не работает, и не понятно когда ее исправят
@havemoney
@havemoney 2 месяца назад
@@TimesaverVFX я писал разрабу, он занимается, думал это только у меня
@wakeup2.369
@wakeup2.369 2 месяца назад
Кибервойс попробуйте - писал уже пропало сообщение
@sopranoiua8776
@sopranoiua8776 2 месяца назад
не могу оплатить подписку бусти с Украины что делать?
@TimesaverVFX
@TimesaverVFX 2 месяца назад
есть еще патреон: patreon.com/timesaver_vfx
@sopranoiua8776
@sopranoiua8776 2 месяца назад
а там есть эта нейронка?@@TimesaverVFX
@sopranoiua8776
@sopranoiua8776 2 месяца назад
а на патреоне есть эта нейронка?@@TimesaverVFX
@VSELENNAYA-KINO
@VSELENNAYA-KINO Месяц назад
На данный момент лучше всех озвучивает програма Genny, я ей сам озвучиваю свои видео. Зайди проверь. Она в плоть до эмоций все очень хорошо передает. От человеческого голоса не отличить. Даже люди не все так могут говорить.
@akula-z
@akula-z 7 дней назад
Эта программа платная или бесплатная?
@Qwerty-yg5be
@Qwerty-yg5be 2 месяца назад
А в чём прикол что куча блогеров начали пиарить "Мастера и Маргариту"? Даже если на секунду притворимся что это не реклама :)
@pmwa
@pmwa 2 месяца назад
Можно спасть спокойно, нейросети как были всратыми, так и остались... не думаю что когда0нибудь что-то изменится)
@naotmash
@naotmash 7 дней назад
ё надо писать, а не е, тогда и ударения будут лучше. Зачем игнорировать живую букву русского языка?
@cairo8905
@cairo8905 2 месяца назад
English sup please..
@AlyoshkaKotov
@AlyoshkaKotov 2 месяца назад
одна шляпа
@loadmore
@loadmore 2 месяца назад
Шляпа пирожком 😂
@2Cats
@2Cats 2 месяца назад
Сначала текст через ёфикатор пропустить, а уже потом в нейросеть. Вообще редакторам, игнорирующим ё дизлайк.
@fadeichnsk
@fadeichnsk 2 месяца назад
Для профессиональной работы, всё это не годится, лучше денег актёру заплатить
@TimesaverVFX
@TimesaverVFX 2 месяца назад
Определённо
@user-vy4io5si6j
@user-vy4io5si6j 2 месяца назад
млять, семь раз повторил про странноватый звук балаболки. Ну зачем? У меня мозг отказался вас слушать уже на третьем повторе. Зачем повторять одно и тоже десять раз, как алкаш? Тема нужная, всем хочется разобраться с возможностями нейронок, но, млять, давайте уже учиться нести информацию нормальным языком..
@user-uw1zj2lq9q
@user-uw1zj2lq9q 2 месяца назад
Автор сам иногда прикалывается с того, что повторяет одно и то же слово."Референсный кадр", помню .. Он не учитель, а просто специалист, который разбирается в этих вещах и хочет донести много полезностей до слушателей. И у него это получается.
@user-dy3sj9ks9c
@user-dy3sj9ks9c 7 дней назад
А гдеж лучшая озвучка то ?
Далее
надувательство чистой воды
00:28
REALLY LOVES CHIPS
00:19
Просмотров 1,5 млн
I need your help..
00:28
Просмотров 4,7 млн
can you repeat it? #tatyanadiablo ##shorts
00:11
Просмотров 949 тыс.
I tried 279+ AI, showing the BEST
21:32
Просмотров 32 тыс.
надувательство чистой воды
00:28