Тёмный

【RVC】実際に声を作ってみよう!音声データの学習編【AIボイチェン】 

もものせ
Подписаться 7 тыс.
Просмотров 77 тыс.
50% 1

新しい解説はこちら
• 【RVC】初心者の方向けにRVCの導入からモ...
次回→実際に歌わせてみよう
• 【RVC】実際に歌わせてみたを作ってみよう!...
RVC用の音声データを作成する手順を解説しています。
動画にそって練習してみてね!
後半はAudacityで音声ファイルを作る方法を簡単に解説してまーす。
実在する人物から生成した音声を販売するなどは絶対にしないでください。
また、ご本人様の不利益となるような行為はおやめください。
※もものせもRVCに関しては素人です…
わかる範囲で質問はお受けしますがまだまだ勉強中なのでこたえられる範囲でってことで!!
RVC Bata ダウンロードページ
huggingface.co...
あみたろの声工房様 音声ファイル ダウンロードページ
amitaro.net/vo...
7-zip ダウンロードページ
7-zip.opensour...
Audacity ダウンロードページ
www.audacityte...
Pythonのインストールが必須です。ない場合はエラーで起動できません。
下記より事前にダウンロード、インストールしてください。
www.python.org/
もものせTwitter
/ yumeno_momonose
イラストレータ
ねいろ様
モデリング
おかだ様

Опубликовано:

 

15 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 361   
@Vtuber-luna67
@Vtuber-luna67 Год назад
とても分かりやすいです❤ 情報ありがとうございます ボイチェンの声 見分け付かなかったです♪ とっても綺麗でしたよ。 もちろん地声も聴きやすかったです★
@yumeno_momonose
@yumeno_momonose Год назад
参考になれば幸いです☆ もうすこしクオリティ上げれるように研究してみますー!
@makoto_dijital
@makoto_dijital 10 месяцев назад
丁寧な動画をありがとうございます。自分でもできそうなので早速試そうと思います。
@masaya35789
@masaya35789 Год назад
地声のボイチェンも可愛いですね
@yumeno_momonose
@yumeno_momonose Год назад
ありがとう☆
@ムニエル-u4d
@ムニエル-u4d 8 месяцев назад
解説ありがとうございます 素材についてですが、どのくらいの長さのファイルをいくつ程度用意すればいいでしょうか
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
ご視聴ありがとうございます! BGMやSEのないものを40~50分程度あればそれなりの品質になるかと思います 最近ですと1ファイル5分ほどに区切って学習させてますね!
@flattery898
@flattery898 8 месяцев назад
既出でしたらすみませんが私が遭遇した事例です ・ワンクリックトレーニングで10エポックくらいでエラー吐いて中断する →空ストレージを15GBから50GBくらいにしたら改善
@BeKoBee
@BeKoBee Год назад
とてもたすかる〜
@大塚凌-v3l
@大塚凌-v3l Год назад
ありがとうございます!
@yumeno_momonose
@yumeno_momonose Год назад
よきRVCライフをー!!
@user-agepantsu
@user-agepantsu Год назад
わかりやすい解説ありがとうございます。動画の手順で作成を行ったのですがindexfileなどは作成されるのにもかかわらずmodelのpthファイルのみが作成されません。解決策ご存知でしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
こんにちは!ちょっと遭遇したことがない状況ですが、コマンドプロンプト(黒くて文字がいっぱいでる画面)はどのように進行していましたか?Epoc1 Epoc2…のように順番に学習は進んでいましたでしょうか?
@るる-y8d
@るる-y8d Год назад
コメント失礼します。自分で音声データを作る方法についてですが、文章やワードごとで区切るよりもあみたろうさんの素材みたく単語単語でファイルを区切ったほうがよいでしょうか?また、最低でもこれくらいの音声ファイル数は用意しとけみたいなのがあればご教授いただきたいです。よろしくお願いします。
@yumeno_momonose
@yumeno_momonose Год назад
文章(長くても15秒程度)で区切りのいいところで切る、それを50個くらい用意する感じがお勧めな気がします!
@るる-y8d
@るる-y8d Год назад
@@yumeno_momonose ありがとうございます!頑張ります!!
@Aitchess5993
@Aitchess5993 Год назад
bro when I heard your real voice I just freaked out fr
@K_White
@K_White Год назад
とても分かりやすい解説ありがとうございます!! 簡単なデータを渡すことで音声を作ることができました! 1点質問なのですが、データ処理のステップで処理が進まなくなる原因はご存知でしょうか? 25個ほどデータを用意しデータ処理にかけたのですが、8個目まで処理が成功した後処理が進みません。 logs/[作業ディレクトリ]/preprocess.logを確認したところ、開始はされていましたがその後の処理のログが残っていませんでした。(もしかしたら処理中なのかもしれませんが...) 投稿主様にお聞きする内容ではないかもしれませんが、なにか対処法などご存知でしたらご教授願いたいです。
@yumeno_momonose
@yumeno_momonose Год назад
ご視聴ありがとうございます! データ処理(特徴抽出へ進む前の段階)で音声素材がすべて読み込まれない感じでしょうか?
@K_White
@K_White Год назад
@@yumeno_momonose 返信ありがとございますm(_ _)m はい、その挙動です。 別の音源データで複数ファイルの処理を試したところ上手くいったため、音源に原因があるのですかね… 使用しているデータはAudacityで同じ作業を経て出来たものの為、Audacityの設定ミスは考えづらいかと…
@yumeno_momonose
@yumeno_momonose Год назад
@@K_White ほかの音源で処理ができたということはAudacityでの書き出しに失敗している可能性もあるかと思います。通常の挙動ですと、読み込み処理に失敗した場合はコマンドプロンプトの画面になにかしらエラー表記が出るはずなのですが…
@K_White
@K_White Год назад
@@yumeno_momonose なるほど、ありがとうございます。 また件の音源で確かめてみます。
@ゴミ垢-f5g
@ゴミ垢-f5g Год назад
とてもためになる解説ありがとうございます。質問なのですが、Audacityで長尺の音声データを扱う際、20秒などの一定間隔で切り取りや貼り付けができる機能などはありますでしょうか?それとも全て手作業で切り取りをしていく必要があるのでしょうか?お手隙の際に答えて頂ければ幸いです。
@yumeno_momonose
@yumeno_momonose Год назад
基本は必要な部分を切り抜く→空いているタイムラインへ貼り付けるの繰り返しで手作業で行ってます…!ちょっとめんどくさいですね…
@ゴミ垢-f5g
@ゴミ垢-f5g Год назад
@@yumeno_momonose 回答ありがとうございます。やっぱりそうなんですね...... 切り抜き作業頑張ります!
@yumeno_momonose
@yumeno_momonose Год назад
大変かもですが頑張ってください!
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW 2 месяца назад
質問です。音声学習で音声を用意してAudacityに入れたのですが、音声は1時間程度の長さで20秒幅の切り抜きにどうしても時間がかかります。自動で切り抜いてくれる方法とかってありますか?楽したいのであったら教えて欲しいです!お願いします🙇
@yumeno_momonose
@yumeno_momonose 2 месяца назад
5分くらいに区切っても大丈夫です。 20秒区切りは初期のころのやり方です
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW 2 месяца назад
@@yumeno_momonose 確かにそうなんですけど、僕が言いたいのはですね自動で切り抜いてくれる方法が知りたいんですけどありますかね?
@yumeno_momonose
@yumeno_momonose 2 месяца назад
ご質問の意図をくみ取れず申し訳ございません。 自動で切り抜く方法については当方も勉強不足でわかりかねます💦
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW 2 месяца назад
@@yumeno_momonose 自分の説明がわるかったです、謝らないでください!わざわざ丁寧に返信ありがとうございます!自動で切り抜く方法はないっぽいので手作業でがんばります!ありがとうございます!
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW
@WAWWJWGWGWAWWWAWDWDWMWMWWWGWJW 2 месяца назад
@@yumeno_momonose Converged (lack of improvement in inertia) at step 1468/46312 これが出てずっと止まるんですが大丈夫なんでしょうか?
@owari463
@owari463 11 месяцев назад
投稿者様 とても詳しく参考になる解説をありがとうございます! 質問失礼いたします! より高精度のAI学習を行うため、1000Epochで実行させております。 そうすると、総容量が約225GBとなり、SSDを圧迫してしまいます。 高品質は必須のため大容量なのは仕方ないのですが、この状態はキャッシュ等何かを削除すれば削減できるものなのでしょうか? それとも「1プロジェクト225GB」の認識でいたほうが良いのでしょうか? 何人か分を作ってみたいなと思っていた次第です。 お知恵の程、お借りできれば幸いです。
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
ご視聴いただきありがとうございます! おそらく1000エポックは学習のやりすぎにかもしれません… 500を超えてくると機械感が強くなってくる印象です(個人的な見解ですが…) 一応データ量を控える方法としてステップ3の『ハードディスク容量を節約するため、最新のckptファイルのみを保存しますか?』の項目をはいにすることによって容量を控えることができますね!
@owari463
@owari463 11 месяцев назад
なるほど!早急なご返信ありがとうございます!!500でどのくらいになるのか試してみます! 例えば、四人グループの歌唱データをカバーしてみようと考えた場合、RVCそのものや関連フォルダも4つ分必要なのでしょうか?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
RVCはそれ一つで大丈夫です!声の学習時にAの人、Bの人といった感じでフォルダが必要ですね!
@owari463
@owari463 11 месяцев назад
@@yumeno_momonose わかりました! 詳しく教えて下さりありがとうございます!!
@吉岡黄色
@吉岡黄色 Год назад
こんにちは 動画拝見させていただきました Audacityから音声ファイルへ書き出す際の質問なのですが、Audacity上で音声データが例えば3時間ほどあった場合、それを1つの音声ファイルとして書き出すのと、数百個に分けて書き出すのとではやはり品質に差は出るのでしょうか 元の音声が何時間もあると、どうしてもファイルを分けて書き出す作業が面倒なので…
@yumeno_momonose
@yumeno_momonose Год назад
こんにちは!すべてつなげるより、15秒程度に分割し複数ファイルとして学習することをお勧めいたします。その方が良い結果が得られます!
@yuzuka777
@yuzuka777 5 месяцев назад
すごく参考になりました 質問よろしいでしょうか 「GPUごとのバッチサイズ」は4でやっておられますがクオリティに関係するのでしょうか? また用意する音声ファイルは、細かいファイルで用意してらっしゃいますが、空白のない音声を長くというよりは、短いものを複数用意したほうがいいでしょうか? ちなみに歌で使用します
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
この動画は情報が古いのでよろしければ2月に解説している動画をご覧いただければ…! ちなみにバッチサイズでクオリティは変化しないのでご安心を! 短いものを複数よりはつながっていた方が品質は安定するかと思います
@yuzuka777
@yuzuka777 5 месяцев назад
@@yumeno_momonose 返答ありがとうございます!!参考になります!頑張って作っってみます!!
@tttkbm
@tttkbm 4 месяца назад
ワンクリックトレーニングのときにブラウザの方では全工程が完了!となっているのですがコマンド?の画面ではSuccessと表記されておらず、tracebackと表示されています。どうしたらよいでしょうか
@yumeno_momonose
@yumeno_momonose 4 месяца назад
フォルダのパス(フォルダ名)にスペースや日本語が含まれていませんか?
@tttkbm
@tttkbm 4 месяца назад
@@yumeno_momonose すみません。解決しました!ありがとうございます
@tttkbm
@tttkbm 4 месяца назад
続けて質問させてください。testファイルが見つからないのですがどこの項目にあるのでしょうか。rvc1006nvidiaでやっていることが原因なのでしょうか..
@yumeno_momonose
@yumeno_momonose 4 месяца назад
testファイルというのは学習前につけた名前ですか?
@tttkbm
@tttkbm 4 месяца назад
トレーニングのときのモデル名にtest1いれたものです
@2_tinheri
@2_tinheri 5 месяцев назад
Googleコラボを使った方法が上手くいかなかったのでありがたいです
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
お役に立ててよかったです!
@user-iz9qv3qo4u
@user-iz9qv3qo4u 4 месяца назад
すげぇのら
@TKRecordView
@TKRecordView Год назад
動画拝見させて頂きました、ご質問よろしいでしょうか! audacityでの音声データ作成についてですが、もものせさんの方法でしたら、声の途切れのタイミングなどは意識せずに、とにかく時間を均等にデータを区切っているという解釈で間違い無いですかね? 自分の直感的には、ある程度話の途切れを意識してデータ分けたほうが精度が高くならないのかなーと疑問に思ったので… やはり一つ一つのデータの長さが違うと書き出しに手間がかかる感じでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
声が途切れたタイミングで切るのがよろしいかと思います! なおかつ秒数は長くても20秒程度にしています 正直一つ一つ処理することになるので手間はかかりますが精度は間違いなく高まります!
@TKRecordView
@TKRecordView Год назад
⁠@@yumeno_momonoseやはり精度は上がるのですね、ご回答ありがとうございます!
@背筋マン
@背筋マン 11 месяцев назад
データ処理のところで処理が終わったあとにErrorの文字が出てきて、connection errored out.が画面右上に出てきます。 そのまま続行してると特徴抽出やワンクリックトレーニングのところにもErrorがでてきます。 どうすればなおるか分かるでしょうか?
@背筋マン
@背筋マン 11 месяцев назад
データ処理終了時までのcmdのログを見たらエラーがRVC起動時のError caught was: No module named 'triton'だけでした。cmdのログではend preprocessで終わってるんですけどその後にエラーが起きてます
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
起動時のエラーが気になります。当方の環境では出ていないエラーでしたので… RVCのフォルダごと環境を再構築してみると改善するかもしれません。
@背筋マン
@背筋マン 11 месяцев назад
エラーが出ても続行したら問題なく学習する事ができました100エポックに10時間ほどかかりましたが
@akuru9029
@akuru9029 Год назад
audacityについて質問です。 説明にあった左下の「プロジェクトのサンプリング周波数」という項目が存在しないのですが何か追加で設定しなければならないのでしょうか? インストール後にしたことはファイルをドラッグした際にffmpegが必要とウィンドウが出たのでffmpegを設定しただけです。
@yumeno_momonose
@yumeno_momonose Год назад
Audacityのバージョンが新しくなったようでした。 動画内のバージョンはv2.4.2ですのでよかったら確認してみてください。
@akuru9029
@akuru9029 Год назад
@@yumeno_momonose ありがとうございます、解決しました。
@user-jl2me2nu9z
@user-jl2me2nu9z Год назад
動画を参考して新しく声を作成することができました。ありがとうございます。ですが学習で容量を多く取ってしまいました。pthを作れたら学習ファイルを消しても平気なのでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
ご視聴ありがとうございました! 必要なければ消してしまって大丈夫ですよ!
@user-jl2me2nu9z
@user-jl2me2nu9z Год назад
返信ありがとうございます。消しても特に影響はありませんでした!
@user-fb7wm2vd3e
@user-fb7wm2vd3e 11 месяцев назад
コメント失礼します。 ボイチェン用の素材を作成したい場合、総エポック数を増やしたり音声素材の数を増やした方がクオリティって上がりますかね…?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
回数、量より素材の質を重視した方がよいかと思います。 ホワイトノイズや、声以外の音などが入っていると極端にモデルの品質が下がります。
@frt4095
@frt4095 Год назад
概要欄にあったあみたろ様のところのファイルを読み込ませようとしたのですが最後のweightファイルに完成したファイルがありません。対処法などはありますか?
@yumeno_momonose
@yumeno_momonose Год назад
どこかのタイミングでエラーになっていて生成が完了していないと思われます。 コマンドプロンプトの画面でどこかにそれらしいエラーが出ていないでしょうか?
@frt4095
@frt4095 Год назад
最後の方にout of memory error:CUDA out of memoryみたいなことが書かれてるぐらいしか分かんなかったです😭
@yumeno_momonose
@yumeno_momonose Год назад
@@frt4095 VRAM不足のエラーですね、使っているGPUは何になりますか?
@frt4095
@frt4095 Год назад
@@yumeno_momonose NVIDIA GeForceGTX1650TIですね
@yumeno_momonose
@yumeno_momonose Год назад
VRAM4GBだと学習は難しいですね、最低ラインはVRAM8GBになります…!
@user-qt2bp7li6l
@user-qt2bp7li6l 5 месяцев назад
質問よろしいでしょうか?自分の声を変換する時はエポック数が150〜200で、何か曲を歌わせる時は500-1000と言った認識で良いですか?また、rtx3070の8gbを使っている場合パッチサイズは6でも大丈夫でしょうか?
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
大体そのような認識でよろしいかと…!歌わせる場合でも400もあれば十分かと思います バッチサイズは5-6程度、素材が多く共有GPUメモリが使われてしまう場合は極端に学習速度が落ちますので様子を見てもう少し下げてみる感じでしょうか
@user-qt2bp7li6l
@user-qt2bp7li6l 5 месяцев назад
@@yumeno_momonose ありがとうございます。370くらいで試そうと思います
@teikoku69
@teikoku69 Год назад
audacityでマスターデータをのサンプリングレートを48000にすると声が高くなってしまいますがそれでよろしいのでしょうか?また、4,5秒ほどのセリフを1つ1つ、3秒ほど間隔を開けて1つのデータにしてあるんですが、無音区間をつめて統合して10秒ずつ切り出して良いのでしょうか?それとも10秒には満たないですが1セリフずつ切り出したほうがよいでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
windowsのサンプリングレートが44.1khzで動いているのであればそのまま44100からいじらなくて大丈夫です。 音声データの処理方法ですが、この辺は人それぞれやり方があるようで自分は10秒に満たなくても1セリフずつ切り出して作りました!
@teikoku69
@teikoku69 Год назад
@@yumeno_momonose お陰様で初めての学習データを作成できました。悲しいかな自分の声質とは上手くマッチせず変な声になってます・・・地声が低いと高く元気な学習データは向きませんね。
@Reft12345
@Reft12345 10 месяцев назад
最後の出力がすぐに終わってしまい、完成したファイルも無い状態で困ってます(全工程が完了!は出てます) 原因として考えられるのは、①PCが内蔵GPUのみだから(GPU情報にはGPUの性能が書かれておらず、「トレーニングに対応したGPUが動作しないのは残念です。」という文章が出てました) ②Audasityが動画時からアプデが入っており、UIが変わっていたのでそこでミスった可能性(動画通りにやって、文字も完全一致なのを慎重に確認しながらやりましたので間違いないはずです)
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
内蔵GPUでは動作必要要件に満たしていないので処理自体が走っていないと思います。 別途でグラボは載っていないPCでしょうか?
@fog-bv4kf
@fog-bv4kf Год назад
歌声を学習させてAI coverを作る場合も同じ容量でいいですか?
@yumeno_momonose
@yumeno_momonose Год назад
学習したpthファイルをRVCのモデル推論タブに読み込ませる感じになります。歌わせる場合はボーカルのみの曲が必要になります。
@user-ej2ii4dv3k
@user-ej2ii4dv3k Месяц назад
質問ですこの動画の投稿から約一年たっておりますがもっと精度が上がったものや、簡単に作れるようになったものができたりしたのでしょうか?
@yumeno_momonose
@yumeno_momonose Месяц назад
今のところそんなに変化はないですね💦
@ghast_real
@ghast_real 6 месяцев назад
歌声データじゃなく音楽データそのものを学習に使ったら 音楽チェンジャーになるのかなw
@user-vq7cx8rt3z
@user-vq7cx8rt3z 8 месяцев назад
試しに作ろうと思うのですがvtuberさんのライブ配信の音源でも作れますか
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
できますよー!ただし素材はBGMのないものを選定する必要があります…!
@ああ-y1i1x
@ああ-y1i1x 11 месяцев назад
コメント失礼いたします。どのくらいの量の音声データを集めたらいいか迷ってます。最低でも何分ほどの元の声のデータがあれば良い学習ができますか?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
合計20分くらいは欲しい感じですね…!
@ああ-y1i1x
@ああ-y1i1x 11 месяцев назад
@@yumeno_momonoseありがとうございます!助かりました!
@Ruperu.
@Ruperu. Год назад
分かりやすい説明ありがとうございます🙇‍♀️🙇‍♀️ワンクリックトレーニングを試したくて出力したんですけど音源推論が出て来ません😭どうすれば出てくるようになりますか、色々調べて見たんです原因が分からなくて
@yumeno_momonose
@yumeno_momonose Год назад
web UI(オレンジのボタンががあるブラウザの画面)上で音源推論が表示されていないということでしょうか??
@Ruperu.
@Ruperu. Год назад
@@yumeno_momonose そうです😭説明分かりにくくてすみません🙇‍♀️
@yumeno_momonose
@yumeno_momonose Год назад
モデル推論タブのページの一番上に出てくると思うのですが、ちょっとその画面を見てみないとなんとも… 問題なければtwitterへスクショを送付してもらえればアドバイスできるかもです
@奈不
@奈不 7 месяцев назад
ワンクリックトレーニングまではおそらくできていると思うのですが、学習の黒い画面「Succes」ではなく「No such file or directory」と表示されます、、 原因わかりますでしょうか、、教えていただきたいです。
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
指定された場所にファイルが見つかりませんというエラーなのですが、フォルダやファイル名に日本語が入っている、不要なスペースが入ってしまってたりはしませんか?
@chikage_official0819
@chikage_official0819 10 месяцев назад
コメント失礼します! gradioを使ってワンクリックトレーニングをしている際に"RuntimeError"という風に表示されてしまいうまくいきません💦 どうすれば解決できますでしょうか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
可能であればtwitterへスクショをお願いします… バックグラウンドで動いているcmd(黒い画面)があればアドバイスできるかもしれません
@user-ds7ts7zn7n
@user-ds7ts7zn7n Год назад
こんにちは! RVCbetaをダウンロードしました、前回の動画のように行きたいのですが、展開したファイルは RVC-beta-v2-0618というものになります。そこからバッチのSTART.httpというファイルがありません。もちろん7ZIPで開いております。回答お願いします
@yumeno_momonose
@yumeno_momonose Год назад
こんにちは!同じバージョンをダウンロードしてみました。START.httpではなくgo-webというwindowsバッチファイルはありませんか? それをダブルクリックで起動できます!
@takuande
@takuande 11 месяцев назад
すみません 割り込み質問させてもらいます go-webをcmdで開いたあと、内部コマンドまたは外部コマンド、 操作可能なプログラムまたはバッチ ファイルとして認識されていません。 という表示がでて先に進めません pythonもダウンロードしてあるのですが、なぜか分かりますか? @@yumeno_momonose
@ムニエル-u4d
@ムニエル-u4d 7 месяцев назад
40~50分程度の素材で200エポックで学習しています。 かなり時間がかかりそうなのですが どのくらいかかるかわかりますか?
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
使っているGPUによって全然ちがうので一概には言えないのですが、黒い画面(cmd)の履歴に1エポックで何分かかったかの記載があるのでそれである程度の時間の目安がわかるかと思います
@Tetoa.
@Tetoa. 11 месяцев назад
動画を参考にして作っているのですが、学習するデータは動画で言っていた10〜20秒のファイルを数十個分は作りました。このファイルの数が多くなっても(200個とか)、結果はあんまり変わらないですか?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
多すぎてもあまりいい結果にはならない気がします… 個数というよりは一つ一つの素材の品質を重視するといいと思いますよ!
@Tetoa.
@Tetoa. 11 месяцев назад
@@yumeno_momonose ありがとうございます!やってみます!
@はるのさくら-p7u
@はるのさくら-p7u 7 месяцев назад
すいません!お聞きしたいことがあるのですが、、、これってアニメキャラでも音声データを作ってその声で話すことも可能でしょうか?
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
もちろん可能ですよ! 素材集めが大変かもですが…
@はるのさくら-p7u
@はるのさくら-p7u 7 месяцев назад
@@yumeno_momonose お返事ありがとうございます!アニメの場合どうやってBGMとかと分離させて音だけ抽出することができるでしょうか、、、?
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
UVR5というソフトが役に立つかと思います…! RVC(この動画で使用しているもの)の2番目のタブでもある程度処理ができるので試してみるといいかもです…!
@カラム-l7n
@カラム-l7n 11 месяцев назад
語尾がロボっぽくなったりするのですがエポック数やバッチサイズ、素材で意識すべきことはありますか? また一度学習したデータのエポック数を増やす形で、学習を加えるようなファイルの編集は可能ですか?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
基本は素材が原因のことが多いですね、とにかくホワイトノイズやBGM、SEが全く入っていないものを使用するのが最善です。最近は200エポックも回せば十分といわれるようになってきました。バッチサイズは使用しているGPUが耐えられる値まで上げていますね。RVCの追加学習などで検索いただくとやり方は出てくると思いますがなるべく一から学習したほうが結果はいいと思います。
@カラム-l7n
@カラム-l7n 11 месяцев назад
バッチサイズを上げると効率が上がる感じですかね?@@yumeno_momonose
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
@@カラム-l7n そうですね、効率は上がると思います!
@カラム-l7n
@カラム-l7n 11 месяцев назад
なるほど、丁寧にありがとうございます!@@yumeno_momonose
@ituka_04
@ituka_04 9 месяцев назад
コメント失礼します。 7-Zipのインストールを開始して、インストールゲージ?がマックスまで溜まっても永遠にインストールが完了しないのですがどうすればいいでしょうか。 もう一つ質問なのですが、Windows10の場合、RVC-beta.7zを展開するためにはどういう手順で行えばよいのでしょうか。
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
7zipは64ビット版をインストールしていますか?7zipのインストールがうまくいかないのは謎ですが一度windowsを再起動してからお試しいただくことをおすすめします…!windows11では7zipで展開の項目が隠れているだけでwin10では右クリックで表示されたメニューの中にRVC-bata.7zを展開という項目があったはずです
@ituka_04
@ituka_04 9 месяцев назад
何度か再起動していたらインストールされてました!Windows10での開き方もわかりました!助かりました!
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
解決したようでよかったです!
@yuitototo
@yuitototo 9 месяцев назад
コメント失礼します。 ディレクトリにファイルがありませんとでて進みません。 解決方法を教えていただきたいです。
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
おそらくですがデータ処理の項目でエラーが出ている感じですよね? フォルダ名やファイル名に日本語が入っていたりRVCフォルダ自体をCドライブ直下以外に配置したりはしていないですか?
@にゅ-i4x
@にゅ-i4x 10 месяцев назад
こんにちは 学習をさせるとRVC Bata内のlogsフォルダの容量がすごいことになるのですが、 学習を終えた後はこのファイルは削除してもいいやつなのでしょうか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
消しちゃって大丈夫です!
@にゅ-i4x
@にゅ-i4x 10 месяцев назад
わかりました!ありがとうございます!@@yumeno_momonose
@gamingflowPC
@gamingflowPC 6 месяцев назад
度々失礼いたします。 ブースなどで購入したすでにpthとindexで完成しているものの質を更によくするためにそのpthから学習する方法などはありますでしょうか。
@yumeno_momonose
@yumeno_momonose 6 месяцев назад
マージという方法がありますが、販売元様がNGとしている場合もありますので確認してからがよろしいかと思います
@gamingflowPC
@gamingflowPC 6 месяцев назад
@@yumeno_momonose調べた感じさっぱりでした...動画化してもらえると大変助かります🙏
@yumeno_momonose
@yumeno_momonose 6 месяцев назад
了解しました!近々動画で紹介しますね!
@user-nn1sy8sm6d
@user-nn1sy8sm6d Год назад
配信の切り抜きでやりたいんですけど言葉ごとに切り取りしないとダメですか??それとも配信全部入れて大丈夫ですか?
@yumeno_momonose
@yumeno_momonose Год назад
ちゃんと区切らないとあまりいい結果にはならないと思いますよ!
@user-nn1sy8sm6d
@user-nn1sy8sm6d Год назад
@@yumeno_momonose ありがとうございます!
@user-nn1sy8sm6d
@user-nn1sy8sm6d Год назад
@@yumeno_momonose 言葉の長さは、単語や笑い声ごとに区切るか、笑い声とかが混ざった少し長い文で区切るか効率も考えてどっちの方がいいと思いますか?何度もすみません
@yumeno_momonose
@yumeno_momonose Год назад
@@user-nn1sy8sm6d 笑い声は入れないほうがいいですね、多少短い分には構わないので笑い声がない一小節みたいなのが理想ですかね
@John.SM1TH
@John.SM1TH 6 месяцев назад
身も蓋もない意見ですが、地声でいいじゃんと思いました😅
@siki8380
@siki8380 11 месяцев назад
ワンクリックトレーニングを押した後が、successではなく、sequenceと出てきてしまってファイルが出来上がらないのですがどうしたら良いでしょうか?
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
データ処理、特徴抽出のどこかでエラーがでている気がします。 cmdの画面でエラー表記を探して検索してみることをお勧めします…!
@sora_hakuai8993
@sora_hakuai8993 Год назад
コメント失礼します。 推しの声でRVCのデータ作るのってどーやるんですか?
@yumeno_momonose
@yumeno_momonose Год назад
声の素材を集めてこの動画の通りに進める感じです! 素材はBGMやSEの入っていないものを集めるので大変ですが…
@user-nn1sy8sm6d
@user-nn1sy8sm6d Год назад
@@yumeno_momonose声だけであればどんな音声でも大丈夫なんですか?情弱ですみません、
@yukkuri2793
@yukkuri2793 11 месяцев назад
最後のワンクリックトレーニングでエラーもない状態で最後まで行ったのですが、pthファイルが出力されてないんですがどうしたらいいでしょうか?また、途中出力される、G_〇〇〇〇.pthファイルは何に使うのでしょうか?そこから最後のpthファイルを作れないんでしょうか?質問多くてすみません
@yukkuri2793
@yukkuri2793 11 месяцев назад
G_〇〇〇〇やD_〇〇〇〇ファイルを使う項目があるのでそこからできるかの推測です。なんに使う項目かわからないんですよね…
@yumeno_momonose
@yumeno_momonose 11 месяцев назад
DやGがついているものは途中ファイルだったかと記憶しています。 本来であればすべて処理が完了すると学習時に指定した名前のpthファイルが完成するのですが何らかのエラーで最後まで処理が完了していない可能性が高いです… G_〇〇〇〇.pthだけはckpt処理タブの一番下で処理すると使えるものに変換できるらしいです。当方では検証していませんがやってみる価値はありそうです
@yukkuri2793
@yukkuri2793 11 месяцев назад
@@yumeno_momonose ありがとうございます!あとエラーについてはダウンロードしなおしたら直りました 途中ファイルは今度試してみたいと思います
@ラピス-h4i
@ラピス-h4i Год назад
ちなみに元の音声データが少なすぎたり、多すぎたりするとエラーになったりするんですか?
@yumeno_momonose
@yumeno_momonose Год назад
数はあまり関係ないと思いますよ!
@sasimi960
@sasimi960 Месяц назад
学習を一時停止させたり再開させたりすることは可能なのでしょうか?
@yumeno_momonose
@yumeno_momonose Месяц назад
可能ですよ!ブラウザやcmdを閉じて停止させた場合、同じ学習名、設定値でスタートさせると途中から学習が再開されます。(たまに失敗します。)
@user-zubaban
@user-zubaban 5 месяцев назад
質問すみません。weightsフォルダにPTHファイルが生成されないのですが、何がダメなのでしょうか。
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
indexの生成に失敗している可能性が高いです。 可能であればRVC1006Nvidiaで学習してみてください。
@user-zubaban
@user-zubaban 5 месяцев назад
@@yumeno_momonose わかりました。やってみます
@user-xn6we6pe2k
@user-xn6we6pe2k Год назад
全工程が完了と出ているのにも関わらずpthファイルがありません。 どうしたら良いでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
学習開始からやたらと早く処理が終わってしまっていませんか? Epoch: 1 Epoch: 2 と順番に進んでいくのですが、失敗している場合はいきなり最終Epochの処理だけで終わってしまいます。 おそらく音源のエンコード設定をミスしているかChromium系以外のブラウザを使っていることが原因だったりするかもです
@user-vv6yk1vo5i
@user-vv6yk1vo5i Год назад
もものせさんが使った音声ファイルはどこにありますか? 参考にさせていただきたく
@yumeno_momonose
@yumeno_momonose Год назад
概要欄の2つ目がそのダウンロード先になってます! 冒頭でしゃべっている声の事でしたら自作の音声になっています…!
@user-vv6yk1vo5i
@user-vv6yk1vo5i Год назад
@@yumeno_momonose 自作音声データ(多分花澤さん声?)何個くらい覚えさせましたか? また、学習ファイルを作成するにあたり仕組み的にwavデータを読み込ませるほどワードサンプルが増えるのでいい感じになっていくのかな?
@yumeno_momonose
@yumeno_momonose Год назад
@@user-vv6yk1vo5i 今回は花澤さんですねー!15秒程のデータを50個弱、200エポックで学習しております。試した感じサンプル数が多すぎたり学習回数が多く過学習状態になってしまうと破綻する感じでした…!
@matan2009
@matan2009 8 месяцев назад
声を作らなくても買えば配信とかでもつかえるんですか?
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
もちろんです!作るのが難しければ無料のものもたくさんありますし、まずはそういったもので試してみるのもいいと思います!
@琴椿と梵
@琴椿と梵 Год назад
最後のワンクリックトレーニングにて「指定されたパスが見つかりません」と表示されるのですが、解決方法などはありますか?
@yumeno_momonose
@yumeno_momonose Год назад
その前の特徴抽出などの処理で失敗してるような気がします。 cmd(黒い画面)で確認しつつエラーっぽいのが出ていないか確認していただきたいです。
@琴椿と梵
@琴椿と梵 Год назад
@@yumeno_momonose その前の処理では一切エラー表示出てないんですよね、、、
@yumeno_momonose
@yumeno_momonose Год назад
パスが見つかりません=特徴抽出したファイルが見つからない。だと思うんですが画面を見ないとなんとも言えないのでよかったらtwitterへcmdのスクショいただけますか?解決できるかはわかりませんが…
@frt4095
@frt4095 Год назад
ワンクリックトレーニングの後全行程完了は出ているんですが、バッチファイルの方にsuccessが出てこなかったりweightの中にファイルがなかったりしたんですが対処法などはありますか?
@yumeno_momonose
@yumeno_momonose Год назад
できるときとできないときがある感じですかね? そのような現象には当たったことがないのでわからないですが、できてないとき、コマンドプロンプトで何かしらのエラーが出ていると思うのですが…
@frt4095
@frt4095 Год назад
@@yumeno_momonose まずデータ処理の段階でパスの無効とか出るんですけどファイルの時間が長いこととか関係あるんですかね...?
@yumeno_momonose
@yumeno_momonose Год назад
@@frt4095 パスが無効ということはそもそも素材のファイルが読み込めていないと思います。私が以前トラブったときは ・RVC Web UIのインストール先がCドライブ直下になっていなかった。 ・素材wavファイルの書き出し時にAudacityで『複数ファイルの書き出し』を行わずwav形式で書き出しを選択してしまっていた。 これで『パスが無効』エラーを回避した記憶があります。
@frt4095
@frt4095 Год назад
@@yumeno_momonose 試してみます!
@amaneacc6052
@amaneacc6052 Год назад
これはすごいですね。 どうでもいいですが、weightsはウェイツじゃないんでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
ありがとうございます☆ 英語が苦手なもので…笑
@user-lu3qn5ty7g
@user-lu3qn5ty7g 9 месяцев назад
ファイルのサンプリングデータが元々96000hzあってそれを下げるとすごい声になるんですけどどうすればいいですか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
元のファイルが96000hzというのは経験がないので憶測ですが、audacityでそのままのサンプリングレートで書き出し→RVCでそのまま取り込んで学習時に48khzを指定して学習させてみるのはどうでしょうか…?
@ラピス-h4i
@ラピス-h4i Год назад
weightsにpthファイルがどうしても表示されません。どうすれば解決されるのでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
モデルの学習が完了しているはずなのにweightsフォルダにモデルが無いということですよね? どこかのタイミングで処理に失敗していると思います。エラー状態でも完了表記がでてしまうので… cmdでエラーっぽい表記は見当たりませんか?
@Koyomani
@Koyomani Год назад
ノートPCなんですが、RTX4050です。これでディスコードなどでRVCを使うことはできるでしょうか?同時にゲーム、配信をすることはありません
@yumeno_momonose
@yumeno_momonose Год назад
モバイル版GPUですが使うことは全然可能だと思います!
@Koyomani
@Koyomani Год назад
@@yumeno_momonoseありがとうございます!!自分で作った音声を学習させて使うことも可能でしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
できることはできますがVRAMが6GBと少なめなのでエラーが出る場合はバッチサイズを小さくして学習する感じになると思います。(時間かかります)
@Koyomani
@Koyomani Год назад
ありがとうございます!
@kechappu951
@kechappu951 Год назад
配信などから音声データを引っ張ってきたい場合はどのようにすればよいですか?
@yumeno_momonose
@yumeno_momonose Год назад
配信のアーカイブなどをMP3へ変換するサイトやソフトでダウンロード、Audacityに取り込んで編集しています
@kechappu951
@kechappu951 Год назад
@@yumeno_momonose ありがとうございます!!
@糞-c9q
@糞-c9q Год назад
マイク何使っていますか? これは実際に通話で使える機能ですか?
@yumeno_momonose
@yumeno_momonose Год назад
AG03にAT2020を使っています!リアルタイムにとなると遅延が2秒ほどありますのでそこをどう考えるですかねー…
@糞-c9q
@糞-c9q Год назад
@@yumeno_momonose 20のusbタイプとインターフェイスあるのでは音の違いって結構あるんですかね
@yumeno_momonose
@yumeno_momonose Год назад
@@糞-c9q 多少なりともあると思いますよー!ものによってはASIOが使えるので遅延が少し抑えられたり…!
@user-qv7bq2rk7j
@user-qv7bq2rk7j Год назад
サンプリングレートを48000にすると、声が高くなるんですけど、仕様ですか?
@yumeno_momonose
@yumeno_momonose Год назад
もとのwindowsのサンプリングレートが48khzの場合は48000を、44.1khzの場合は44100を。説明不足で申し訳ないsです…
@user-nj8ji2qu3o
@user-nj8ji2qu3o 10 месяцев назад
ワンクリックトレーニング何回も押して繰り返し学習をさせたら品質は良くなりますか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
よくはならないです… どんどんロボットぽくなっていくと思います
@user-nj8ji2qu3o
@user-nj8ji2qu3o 10 месяцев назад
@@yumeno_momonose2つ目の質問すみません。ワンクリックトレーニングでエポックが5ごとに保存されていると思うんですけど、どうしたら保存されたところからワンクリックトレーニングをまた再開出来ますか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
学習時につけた名前と同じ名前、かつすべてを同じ設定値で開始すると再開できるはず…!
@user-nj8ji2qu3o
@user-nj8ji2qu3o 10 месяцев назад
@@yumeno_momonose ありがとうございます!絶対に配信みます!!
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
@@user-nj8ji2qu3o ありがとです!久しぶりに金曜日の夜に配信します…!
@u2uki
@u2uki Год назад
RVC Bataのダウンロードなのですがダウンロードしたものが7zファイルではなくwindows media playerになっているのですがどうすればいいのでしょうか
@yumeno_momonose
@yumeno_momonose Год назад
ブラウザを変えてダウンロードしてもだめですか??
@u2uki
@u2uki Год назад
ダメでした
@yumeno_momonose
@yumeno_momonose Год назад
聞いたことがない症状ですが、ファイルから右クリック→プログラムから開く→7zipのように進んで解凍できませんか?
@u2uki
@u2uki Год назад
試してみたのですが、解凍したファイルがエクスプローラーのダウンロード欄に出てきませんでした。 試しに7z→開くをしてみたらファイルを見つけたので、フォルダ内のバッチファイルを実行しようとしたところ 操作可能またはバッチファイルとして認識されません と出てきました
@contact-s4q
@contact-s4q 10 месяцев назад
この動画を投稿されてから4ヶ月ほど経ちましたが、RVCの性能は進化しましたか? 質のいい音源を用意するのは変わりないと思いますが、 エポック関連やファイルの数など、前と認識の違いはありますか? GPUごとのバッチサイズはノータッチでいいでしょうか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
性能自体は特段変わったような気はしないですが、以前は細かく素材を分割して学習させていましたが最近は5分程度の長い素材を30分くらい用意して300エポックくらいで回すと品質がいい気がしています。もちろんノイズなどが無い素材を使用する前提ですが… バッチサイズは使用しているGPUによりますがVRAMの容量を超えない程度のサイズが適切で学習時に搭載量を超えると極端に学習が遅くなります。VRAM8GBならバッチサイズは大きくても5くらいじゃないかな?と思いますね
@user-nv1vt4lz8n
@user-nv1vt4lz8n 10 месяцев назад
MSI GEFORCE GTX 1070 GAMING X 8Gこれでいけますか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
学習自体は可能なレベルだと思います!
@user-of7fe1mg5t
@user-of7fe1mg5t 8 месяцев назад
質問失礼します。 データ処理したところ出力情報には[WinError 267] ディレクトリ名が無効です。: っと出てきます。 ファイル名、フォルダ名をローマ字表記に変更したりもしました。しかしまた ディレクトリ名が無効です。 と出てきます。どうすればいいですか?
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
こちらにディレクトリをそのままコメントいただけますか??
@user-of7fe1mg5t
@user-of7fe1mg5t 8 месяцев назад
返信ありがとうございます。 フォルダ名はonsei1です。 ファイル名は12345みたいに数字で並べています。
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
@@user-of7fe1mg5t 問題なさそうですね… たまにあるのですがフォルダの配置がデスクトップにあり、ディレクトリにonedriveが含まれているとエラーになることがあるようです。素材が入っているフォルダをCドライブ直下に変更し実行しても症状はかわりませんか?
@user-of7fe1mg5t
@user-of7fe1mg5t 8 месяцев назад
​@@yumeno_momonose 返信ありがとうございます。 今色々試していたらフォルダからパスのコピーをしたらerrorが出ずにワンクリックトレーニングまで進めました。
@user-of7fe1mg5t
@user-of7fe1mg5t 8 месяцев назад
​​@@yumeno_momonose 返信ありがとうございます。 今色々試していたらファイルからではなくフォルダからパスのコピーをしたらerrorが出ずにワンクリックトレーニングまで進めました。
@ch-lo4ov
@ch-lo4ov 9 месяцев назад
weightsファイルに工程が完了しても入っていない場合は何が問題などありますでしょうか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
学習に失敗している可能性はありませんか? 学習中、cmd(黒い画面)でepoc1,epoc2のように進捗は表示されてましたでしょうか?
@ch-lo4ov
@ch-lo4ov 9 месяцев назад
@@yumeno_momonose 多分ないですね!
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
表示されてないということは学習自体進まず完了表示になっている可能性が高いですね… cmd上でなにかエラーっぽいのは出ていないですか?
@ch-lo4ov
@ch-lo4ov 9 месяцев назад
@@yumeno_momonose errorというのが少しZeroDivisionErrorが最後に出てきました
@ws.3349
@ws.3349 10 месяцев назад
作ったほうがより人間のようになるんですか?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
最近はフリーで配布しているようなものでも実用域だと思います。 こだわればキリがないのは事実ですね…
@Kazu-0
@Kazu-0 10 месяцев назад
BGM削除して11分ほどの素材ができてトレーニングした後 ボイロで試しに変換してみたら全然声が変わっていなかった どこでやり方が間違っているのかが分からない…… 追記 フォルダに1個11分のみを置いて学習させてるけど もしかして細く分けなきないけないとかあるのかな?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
もしかしたら11分1ファイルは長すぎるかも… エポック数はどれくらいで回してどのくらいの時間で処理が終わりましたか?
@Kazu-0
@Kazu-0 10 месяцев назад
@@yumeno_momonose エポック数200で約2時間30分 エポック30でやったりharvestやpmで試したりしてたけど変わらない 変換させる声が低過ぎるのかと思いピッチを上げてみたりもしたけど声はほぼ変わらず 今は2分素材を足して 全てCドライブ内でデータ処理・特徴抽出(エラーなし)・エポック200で学習中です
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
@@Kazu-0 そのくらい時間がかかっていると学習は完了しているようですね…たまに即学習処理が終わって未完了のpthファイルが出来上がるんですがそれではなさそうですね なんだろう…?素材は女性の声ですよね?
@Kazu-0
@Kazu-0 10 месяцев назад
@@yumeno_momonose 女性声優ですね ただ少し原因として気になるのが モデルにしている素材が機械風の声に加工されているキャラなんです 他のアニメキャラ(加工なし)で同じような方法で学習させ、もし問題なく声が変われたなら原因は素材にしているキャラの声そのものなのかなと…… まだ現在学習中なので、これが上手く行かなかったら次に試してみるつもりです
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
@@Kazu-0 加工済みの音声だともしかするとまともに学習されないかもしれないですね…試行錯誤が必要かもしれませんがもし行き詰りましたらtwitterへご連絡ください。素材の品質などを確認してみます
@rice_cake-i6o
@rice_cake-i6o Год назад
RU-vidの動画の声から音声ファイルを作るにはどうすればいいのでしょうか
@yumeno_momonose
@yumeno_momonose Год назад
動画をmp3としてダウンロードできるサイトやソフトなどでダウンロードし、それをAudaCityで編集する感じになりますね!
@rice_cake-i6o
@rice_cake-i6o Год назад
元の動画に別の人の声などが入っていたら画面録画して切り抜いてからmp3にした方が良いですか?それともAudacityの編集で削除できるのでしょうか
@yumeno_momonose
@yumeno_momonose Год назад
ほかの人の声は学習には向いていないですね AudaCity上で切り貼りできますのでそれで編集しています
@user-gp9rm4sd6z
@user-gp9rm4sd6z 5 месяцев назад
音声データに笑い声はあってもいいですか?
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
あってもオッケーです! むしろ最近はあったほうがいい気がしてます
@user-gp9rm4sd6z
@user-gp9rm4sd6z 5 месяцев назад
@@yumeno_momonoseありがとうございます!
@torakundayoo
@torakundayoo Месяц назад
声がどうしてもAI感になってしまうのですが、どうしたらいいでしょうか。
@yumeno_momonose
@yumeno_momonose Месяц назад
素材の影響が大きいと思われます。 学習に使用したデータは元からBGMやSEなどがないきれいなものを使用していますか?
@torakundayoo
@torakundayoo Месяц назад
@@yumeno_momonose 今度から綺麗なものを選びます。声を学習させるみたいな動画ってあげてますか?
@yumeno_momonose
@yumeno_momonose Месяц назад
2月にあげている声の作り方をまとめた動画が参考になると思います…!
@torakundayoo
@torakundayoo 29 дней назад
@@yumeno_momonose 了解ですみてみます
@user-bx1rv1jq2t
@user-bx1rv1jq2t 9 месяцев назад
7ZIpでの解凍後ファイルが表示されないのですがどうしたらよいですか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
どのように解凍を行ったか、どこに解凍したか覚えていらっしゃいますか??
@user-bx1rv1jq2t
@user-bx1rv1jq2t 9 месяцев назад
@@yumeno_momonose ここに展開でダウンロードファイルにしました
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
もしうまく解凍されなければデスクトップを解凍先に指定して試してみてください…!その方がわかりやすいかもです
@user-bx1rv1jq2t
@user-bx1rv1jq2t 9 месяцев назад
@@yumeno_momonose デスクトップにしてからやりました!失敗しましたww
@snappy676
@snappy676 Год назад
データ処理ができませんどうすればいいですか?
@yumeno_momonose
@yumeno_momonose Год назад
RVC自体のインストール先がCドライブになっていない、素材データが入っているフォルダに日本語が入っているなどしていませんか?
@user-zh6qv4ni1w
@user-zh6qv4ni1w Год назад
容量でかくてビビった
@yumeno_momonose
@yumeno_momonose Год назад
ソフト自体の容量結構大きいんですよね…!
@sasa-ky9tw
@sasa-ky9tw Год назад
RVCを解凍する時に7zipが出てきません。😂どうすればいいですか
@yumeno_momonose
@yumeno_momonose Год назад
7zipのインストール自体はお済でしょうか?windowsの標準では解凍ができませんので…
@sasa-ky9tw
@sasa-ky9tw Год назад
@@yumeno_momonose できました!ありがとうございます😊
@CattleyaSR10
@CattleyaSR10 5 месяцев назад
rvcデータ自体が解凍しても一瞬しか出てこない
@yumeno_momonose
@yumeno_momonose 5 месяцев назад
解凍は7zipで行ってますか?
@user-rs6ru3cq9s
@user-rs6ru3cq9s 9 месяцев назад
ワンクリックトレーニングとモデルのトレーニングって何が違いますか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/jp/training_tips_ja.md こちらのページの一番下が参考になるかと思います…!
@user-rs6ru3cq9s
@user-rs6ru3cq9s 9 месяцев назад
@@yumeno_momonose ありがとうございます。学習中に表示されるloss_melってなんですか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
こちらの環境では表示されていませんが学習が進んでいれば特段気にすることはなさそうです…! エラーとして表示される場合はGPUが2枚以上(CPUの内蔵グラフィック含む)の場合に表示されるみたいです
@user-rs6ru3cq9s
@user-rs6ru3cq9s 9 месяцев назад
@@yumeno_momonose ディスクの容量が足りなくてエラー出ちゃって止まっちゃったんですけど再開する方法とかってありますか?
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
学習時につけた名前、設定値はすべて同じくすることで再開可能です! もし上記方法で再開できない場合は一からになると思います…
@piyo0704
@piyo0704 Год назад
音声学習をさせる際VRAMが足りないとエラー表記がでてしまったのですがどうすればよいのでしょうか...?(´・ω・`)
@yumeno_momonose
@yumeno_momonose Год назад
バッチサイズを限界まで下げても足りない場合は諦めるしかないです… グラボは何を使っていますか?
@piyo0704
@piyo0704 Год назад
@@yumeno_momonose rtx3050を使ってます
@piyo0704
@piyo0704 Год назад
VRAMが4GBだとやはり無理なのでしょうか...?
@yumeno_momonose
@yumeno_momonose Год назад
最低でも8GB無いと厳しいですね…
@piyo0704
@piyo0704 Год назад
そうですか...ありがとうございましたm(_ _)m
@صصه
@صصه 8 месяцев назад
16:28 書き出しボタンがありません 仕様が変わったらしいです助けてください…
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
ファイル→オーディオをエクスポート→複数ファイル(U)にチェックを入れてエクスポートで書き出しできますよ!
@صصه
@صصه 8 месяцев назад
@@yumeno_momonose全てうまくいきました。ありがとうございます
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
よかったです!
@555sugurukuuga
@555sugurukuuga 8 месяцев назад
はじめまして! 動画の方法を試しているところで、質問です お手すきの際にお返事がいただけたらうれしいで💦 ワンクリック学習後、PTHファイルが weights に作成されません PCのGPUは NVIDIA GeForce RTX 3050 Laptop GPU である事が確認できました 動画の初めに例をいくつか提示頂いておりましたが、対象外なのでしょうか(´;ω;`) また その場合は PCを変えるしか方法はないのでしょうか、、、
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
RTX3050のノート版はVRAMが4GBだったはずなので容量が足りずに学習が完了していないと思われます。 最低8GBは必要ですのでPCの買い替え、外付けGPUでの対応、googleコラボラトリーのオンラインサーバーでの学習(お金がかかります)といった方法も可能ではありますね!
@biker6813
@biker6813 8 месяцев назад
@@yumeno_momonose ログには正常に完了と出ているがweightsには何も生成されない同じ症状が自分の環境でも発生してます。 Logフォルダーのほうは正常に保存されているようです。 CPU Xeon W 2175 GPU RTX A2000 12GB RVC beta0717
@user-hq7fe2xy5s
@user-hq7fe2xy5s Год назад
他の動画で最近勉強してからきたんですが、 他の人の動画だとデータ処理や特徴抽出飛ばしていきなりワンクリックトレーニングで学習してたんですが、やっぱりやると品質上がるんでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
こんにちは!特徴抽出などの処理をした方が品質は上がると思います。声の特徴分析→分析したデータを学習しますので元の声に近づけるには行うことをお勧めいたします!
@user-hq7fe2xy5s
@user-hq7fe2xy5s Год назад
@@yumeno_momonose ありがとうございます。ckpt処理₍2つ声を合成して新しい声作るやつ₎とか歌わせてみたのやり方とかの動画もだしてほしいです。あとは時間ある時でいいので素材に使う音声のノイズあるないなどいろんな音声での聞き比べ動画も欲しい₍あんまいないので)チャンネ登録しときます
@yumeno_momonose
@yumeno_momonose Год назад
チャンネル登録感謝いたします!次以降の動画で歌ってみたの解説など随時投稿させていただきます!
@user-rs6ru3cq9s
@user-rs6ru3cq9s 7 месяцев назад
onnx出力ってなんですか?
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
onnxもモデルの一つで、nvidia以外のGPUを使用している場合はpthファイルを扱えないためonnxに変換して使用するためのものですね
@user-rs6ru3cq9s
@user-rs6ru3cq9s 7 месяцев назад
@@yumeno_momonose めちゃ助かります。ありがとうございます
@user-rs6ru3cq9s
@user-rs6ru3cq9s 7 месяцев назад
@@yumeno_momonose 私はnvidia使ってるんですがonnxの方が質が良かったりするのですか?
@yumeno_momonose
@yumeno_momonose 7 месяцев назад
遅くなってすみません…! 基本はnvidiaのpthで大丈夫です!pthが使えない環境でonnxを使うという認識でよろしいかと思いますよー
@notnint7170
@notnint7170 9 месяцев назад
RVC-beta 7zを7zipで展開してもそのファイルがダウンロードにないんですがどうしたらいいでしょうか
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
展開時にどこに解凍したかによって場所が違います… 右クリックからここに展開を押した場合は同じ場所に解凍されるはずです…
@notnint7170
@notnint7170 9 месяцев назад
しっかり「ここに展開」を押しました 一度展開してしまったので、もう一度展開しようとするとファイルを上書きすることしかできません かといって元のファイルがダウンロードにないので消すことができず...ほかの場所も見てみましたが見つかりませんでした@@yumeno_momonose
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
うーん… 元ファイルを削除して再度解凍するのが確実なんですが、元ファイルがどこにあるかわからないということですよね…?
@notnint7170
@notnint7170 9 месяцев назад
そうですね@@yumeno_momonose
@yumeno_momonose
@yumeno_momonose 9 месяцев назад
状況を実際に見てみないとわたしもnotnint7170さまがどこに解凍したのかわからないのが現状です… どうしても解決できなければtwitterへご連絡ください。解決できるか保証はできませんがわかる範囲でアドバイスさせていただきます…!
@kuromi37564
@kuromi37564 Год назад
こんにちは( *ˊᵕˋ)ノ 勉強させる音声は声だけ (音楽が後ろで流れてる) の方がいいですか??
@yumeno_momonose
@yumeno_momonose Год назад
こんにちは!学習させる音声はできるだけ声だけにしてください。BGMやSEなど余計な音は学習後、ノイズになってしまいます…
@kuromi37564
@kuromi37564 Год назад
返事ありがとうございます♪̊̈♪̆̈ 短い音声を何個も入れても 効率は悪いですかね…??
@yumeno_momonose
@yumeno_momonose Год назад
@@kuromi37564 目安は15秒程度の音声を30個以上、できれば50個くらい学習した方がいい結果が得られると思いますよ!
@kuromi37564
@kuromi37564 Год назад
ありがとうございます( *ˊᵕˋ)ノ またやってみて分からなかったら 教えてくださいm(_ _)m
@kuromi37564
@kuromi37564 Год назад
携帯で8分位の音声をwavに 出来たんですが 携帯からPCに簡単に送れる 方法ありますか…?
@PETOSIKUN
@PETOSIKUN Год назад
indexファイルはどこにありますか?
@yumeno_momonose
@yumeno_momonose Год назад
ご自身でpthを作成した場合はRVC-bataのフォルダ→logs→学習時につけた名前のフォルダの中にaddedから始まるファイルがあります。それがindexファイルになりますね!
@PETOSIKUN
@PETOSIKUN Год назад
@@yumeno_momonose 返信ありがとうございます。torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 4.00 GiB total capacity; 3.38 GiB already allocated; 0 bytes free; 3.41 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF (CUDA のメモリが不足しています。 20.00 MiB を割り当てようとしました (GPU 0、合計容量 4.00 GiB、すでに割り当てられている 3.38 GiB、空き 0 バイト、PyTorch によって合計で 3.41 GiB が予約されています) 予約メモリ >> 割り当てメモリの場合は、断片化を避けるために max_split_size_mb を設定してみてください。メモリ管理と PYTORCH_CUDA_ALLOC_CONF のドキュメントを参照してください。) と出ているのですがどうすればいいですかね。無知ですみません。
@yumeno_momonose
@yumeno_momonose Год назад
CUDAのメモリというのはGPUのvramのことだと思います。 学習処理を行うにあたってvram不足で実行ができない状態です。 グラボは何を使っていますか?
@PETOSIKUN
@PETOSIKUN Год назад
@@yumeno_momonoseGTX1650です。やっぱ古いですよねぇ💦
@yumeno_momonose
@yumeno_momonose Год назад
@@PETOSIKUN 1650はvramが4GBなので学習には足りないですね… 目安は8GB以上、余裕を見て12GB程度のvramがあるnvidia製のグラボが必要ですね!
@もっちゃ-l9v
@もっちゃ-l9v Год назад
見分け付かないとか言ってる人いるけど 自分にはボイチェンにしか聞こえないわ 完全に女性声になるのはまだまだだな・・・
@あまよん
@あまよん 8 месяцев назад
質問失礼します ワンクリックトレーニングをすると Error: 'f' failed: could not open C:\RVC-beta\RVC-beta0717/logs/名前/trained_IVF99_Flat_nprobe_1_名前_v2.index for writing: No such file or directory と出てきてしまうのですがどうしたらできますか💦
@あまよん
@あまよん 8 месяцев назад
なんか名前を日本語から英語にしたらいけました!ろくに調べずにコメントしてすいませんでした🙇‍♂️
@yumeno_momonose
@yumeno_momonose 8 месяцев назад
ファイルディレクトリに日本語が含まれているのが原因な気がします ファイル名、フォルダ名をローマ字表記に変更してから再度お試しいただけますか?
@あまよん
@あまよん 8 месяцев назад
@@yumeno_momonose 正しくそれでした‼️本当にありがとうございます😭😭
@mirudayoo
@mirudayoo 10 месяцев назад
ワンクリックトレーニングを押すとtorch.nn.parallel.distributed:Reducer buckets have been rebuilt in this iteration. とエラーをはいてできないんですがなぜですかね?
@yumeno_momonose
@yumeno_momonose 10 месяцев назад
GPUが2枚以上搭載されている場合に発生することが多いエラーのようです。 GPUドライバは最新ですか?
@user-yi3fz1qh5m
@user-yi3fz1qh5m Год назад
解説ありがとうございます。動画の手順通り進めてワンクリックトレーニングをするとコマンドのところに INFO:torch.nn.parallel.distributed:Reducer buckets have been rebuilt in this iteration. と表示され、何度やってもダメでした。解決策ご存知でしょうか
@yumeno_momonose
@yumeno_momonose Год назад
少し調べてきました。 どうやらGPUを2枚以上指定していると起きるエラーのようです。一度RVCのクライアントを再起動してGPU0のみ指定して進めるそうですが、そもそもGPUが複数載ってたりしていますか??
@user-yi3fz1qh5m
@user-yi3fz1qh5m Год назад
返信ありがとうございます。GPUはGeForceGTX1660 SUPERです。複数は載せてませんね…@@yumeno_momonose
@yumeno_momonose
@yumeno_momonose Год назад
可能な限り調べてみますので少しお待ちください…!
@user-yi3fz1qh5m
@user-yi3fz1qh5m Год назад
@@yumeno_momonose ありがとうございます!
@plixlt
@plixlt 7 месяцев назад
ARIGATO GOZAIMAS😫😫😫
@BOLTZMANN-wv1vl
@BOLTZMANN-wv1vl Год назад
ワンクリックトレーニングを押すとコマンドプロンプトでerrorと表示されてしまいます。 どうしたらいいんでしょうか...?
@yumeno_momonose
@yumeno_momonose Год назад
Errorの前、または後ろになぜエラーなのかの記載があるはずなのでそちらの詳細を教えていただけるとアドバイスできるかもしれないです!
@BOLTZMANN-wv1vl
@BOLTZMANN-wv1vl Год назад
@@yumeno_momonose RuntimeError: Error in __cdecl faiss::FileIOWriter::FileIOWriter(const char *) at D:\a\faiss-wheels\faiss-wheels\faiss\faiss\impl\io.cpp:98: Error: 'f' failed: could not open D:\RVC-beta0717/logs/モデル名/trained_IVF42_Flat_nprobe_1_モデル名_v2.index for writing: No such file or directory と出てます 初心者なので何もわからんのです...
@johnsonmason36701
@johnsonmason36701 Год назад
@@BOLTZMANN-wv1vl 解決しましたか?
@user-gp6jn8yr1e
@user-gp6jn8yr1e Год назад
最後のワンクリックトレーニングでINFO:torch.nn.parallel.distributed:Reducer buckets have been rebuilt in this iteration.tっと出てきて止まります。どうすればいいでしょうか?
@yumeno_momonose
@yumeno_momonose Год назад
少し調べてきました。 どうやらマルチGPU環境下で起きるエラーのようです。 1枚しか使用していない場合はドライバを最新のものにして回避できたとの報告もありましたのでやってみる価値はありそうです。
@user-gp6jn8yr1e
@user-gp6jn8yr1e Год назад
@@yumeno_momonose ありがとうございます。試してみます
Далее
Сколько стоят роды мечты?
00:59
Просмотров 835 тыс.
I turned into a cute girl in realtime. Here's how
26:24