Тёмный

HƯỚNG DẪN TẠO MODEL A.I GIẢ GIỌNG MC NGUYỄN NGỌC NGẠN 

EZTech - Lập trình tương lai của bạn
Подписаться 1,7 тыс.
Просмотров 30 тыс.
50% 1

Trong video này mình sẽ hướng dẫn các bạn các tạo ra model AI clone giọng của MC Nguyễn Ngọc Ngạn giống như trong video • Giả giọng MC Nguyễn Ng...
Các phần chính trong video này như sau
- 00:00 Giới thiệu chủ đề video
- 01:58 Chuẩn bị dữ liệu
- 02:48 Xử lý dữ liệu
- 02:55 Loại bỏ phần thừa bằng Audacity
- 04:28 Cắt nhỏ file sử dụng FFMPEG
- 06:08 Xử lý âm thanh Ultimate Vocal Remover
- 09:40 Upload dữ liệu lên Google Drive
- 10:23 Huấn luyện mô hình
- 17:45 Inference mô hình
- 21:30 Xử lý hậu kì
Hi vọng rằng thông qua hướng dẫn này các bạn có thể biết cách huấn luyện một model AI để giả giọng của một người khác bất kì. Mình xin nhấn mạnh rằng video này chỉ nhằm mục đích chia sẻ về vấn đề kĩ thuật, mình không chịu trách nhiệm nếu cách bạn sử dụng các mô hình AI này vào mục đích xấu.
MỘT SỐ TÀI NGUYÊN
Code training: colab.research.google.com/git...
Dữ liệu và pretrained model: drive.google.com/drive/folder...
----
Facebook Page: / eztechvietnam
Group trao đổi về AI: / eztechvietnam
Viblo: viblo.asia/u/pham.van.toan
CẢM ƠN CÁC BẠN RẤT NHIỀU !!!!! Love you !!!!

Опубликовано:

 

15 июл 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 273   
@eztechvietnam
@eztechvietnam 10 месяцев назад
Mình đã update thêm model G_1001.pth và D_1001.pth ở trong thư mục logs/44K. Các bạn có thể thử model này để thấy chất lượng tốt hơn với phiên bản chạy trong video. Cảm ơn các bạn rất nhiều
@NayChieu-ty2uq
@NayChieu-ty2uq 10 месяцев назад
bạn có thể giúp mình được không ạ, mình đang rất cần cái này
@eztechvietnam
@eztechvietnam 10 месяцев назад
@@NayChieu-ty2uq Bạn cần giúp gì nhỉ
@chuyentamlinh9
@chuyentamlinh9 9 месяцев назад
Hi bạn cho hình hỏi 1 chút là làm sao để tạo ra modal training 1001 này vậy. Mình làm theo trong video bạn hướng dẫn thì nó chỉ dừng lại ở G_467 thôi và báo train done
@eztechvietnam
@eztechvietnam 9 месяцев назад
@@chuyentamlinh9 Bạn thay đổi chỗ epoch trong file config là đc
@chuyentamlinh9
@chuyentamlinh9 9 месяцев назад
@@eztechvietnam hi cảm ơn bạn đã trả lời, mình muốn hỏi thêm 1 vấn đề này nữa là trong quá trình mình clone ra thì xử lý rất lâu, file gốc 10p thì phải chờ thời gian nó convert cũng phải 20-30p thì mới chạy xong. Có config hay cách nào để rút ngắn thời gian ko bạn?
@umami07
@umami07 5 месяцев назад
Cảm ơn bạn.đúng thứ mình đang cần
@nguyenthachlan
@nguyenthachlan 9 месяцев назад
Cảm ơn bạn nhiều
@voquangvinh0302
@voquangvinh0302 8 месяцев назад
Có mấy bài hát idol e k hát nên e muốn tạo giọng ai trên nền nhạc của ca sĩ khác. A hướng dẫn có nhiều chỗ tắt quá nên e đi theo kịp. Cũng cảm ơn anh đã chia sẻ
@Self-helpwithAlice
@Self-helpwithAlice 10 месяцев назад
Cám ơn bạn nhiều.
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn đã ủng hộ kênh ạ
@phamnam4316
@phamnam4316 3 месяца назад
Hay quá anh❤
@thinkgold9999
@thinkgold9999 10 месяцев назад
Hay quá ❤
@eztechvietnam
@eztechvietnam 9 месяцев назад
Cảm ơn bạn nhiều
@atNguyen-kz5nz
@atNguyen-kz5nz 11 месяцев назад
thank
@HuongPham-sj8xq
@HuongPham-sj8xq Месяц назад
đẳng cấp thật
@anghuy9813
@anghuy9813 11 месяцев назад
cảm ơn anh nhiều ạ
@eztechvietnam
@eztechvietnam 11 месяцев назад
Cảm ơn bạn rất nhiều đã theo dõi kênh.
@thithuhanguyen69
@thithuhanguyen69 10 месяцев назад
Hay quá ,cám ơn bạn chia sẻ ,không biết có dễ làm không
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn đã ủng hộ kênh, nếu có khó khăn gì bạn có thể đặt câu hỏi ở đây, mình sẽ giải đáp ạ
@saiyanman6497
@saiyanman6497 12 дней назад
PRETTY GOOD MAN
@MinArt3D
@MinArt3D 10 месяцев назад
Sorry bác vì hôm qua mình comment trong lúc bị quạu vì ko làm được,Tks bác nhiều vì đã ra video chất lượng cho mọi người!,ra thêm nhiều vid mới bác nhé!
@eztechvietnam
@eztechvietnam 10 месяцев назад
Dạ không sao bác. Có thể góc nhìn của mình từ người đang làm kĩ thuật nên mình cũng bỏ qua mấy chỗ cơ bản không nói đến. Nếu có khó khăn gì bác cứ nhắn lên đây mình sẽ hỗ trợ ạ
@hiepdohoang3824
@hiepdohoang3824 11 месяцев назад
hay quá quá anh ạ :D
@eztechvietnam
@eztechvietnam 11 месяцев назад
Cảm ơn em nhiều
@donam7922
@donam7922 5 месяцев назад
thanks bạn rất nhiều m làm dc rồi
@MEOAL
@MEOAL 2 месяца назад
Chỉ mình làm với
@tronghuyinh5907
@tronghuyinh5907 11 месяцев назад
👏👏👏
@seiichisatoshi9192
@seiichisatoshi9192 11 дней назад
cảm ơn bác haha
@phaniel1111
@phaniel1111 10 месяцев назад
Tuyệt vời quá ạ, cảm ơn anh
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn nhiều nhé
@topvideohai8534
@topvideohai8534 5 месяцев назад
bạn làm video hướng dẫn cách nạp lại những thứ đã train rồi để sử dụng lại nhé.
@am5thun515
@am5thun515 11 месяцев назад
🎉hay quá anh ạ
@eztechvietnam
@eztechvietnam 11 месяцев назад
Cảm ơn em nhiều
@am5thun515
@am5thun515 11 месяцев назад
Anh có model text to speed được không ạ😊
@eztechvietnam
@eztechvietnam 11 месяцев назад
Text to speech trước đây mình đã có bài rồi bạn có thể tham khảo cách làm. Giờ có nhiều model khác tốt hơn nhưng quan trọng nhất vẫn là data viblo.asia/p/ong-toan-vi-loc-ung-dung-deep-learning-tu-dong-sinh-ra-series-audio-truyen-ma-sieu-to-khong-lo-bJzKmwqkl9N
@trinhnguyenthithuy9392
@trinhnguyenthithuy9392 6 месяцев назад
Giọng bạn hay thế :)
@phoovan5194
@phoovan5194 10 месяцев назад
hay quá, cảm ơn bạn.
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn đã ủng hộ kênh ạ
@vienquangai8008
@vienquangai8008 7 месяцев назад
Mình thấy bên chat GPT có tạo custom GPT để train giọng chú Ngạn, bạn thử chưa nhỉ, nếu kết hợp con chat GPT thì mình có cách nào ra kết quả xịn hơn k ad ơi?
@nguoikesu2174
@nguoikesu2174 10 месяцев назад
Không được chán
@eztechvietnam
@eztechvietnam 10 месяцев назад
Hihi, cảm ơn bác đã động viên. Em không có chán đâu ạ. Em lập kênh với mục đích chia sẻ kiến thức cho cộng đồng AI là chính nên cũng không có chuyện chán hay không chán ạ.
@quoctuan6
@quoctuan6 9 месяцев назад
bạn có thể làm hướng dẫn cho bản local được ko ?Cảm ơn bạn nhé.
@thaophung1710
@thaophung1710 3 месяца назад
bạn giỏi và tài năng, video rất hay và bổ ích bạn ạ, nhưng đối với mình, 1 người hiểu công nghệ 1/10 ( và hầu hết những bạn nào ko rành về code, lệnh....) thì coi như bó tay huhuuu
@cdntube1763
@cdntube1763 4 месяца назад
Bạn có thể hướng dẫn cài vits svc fork được không
11 месяцев назад
Bác hướng dẫn có hơi rối. Cái này nhiều bước nên kể ra bác nên ghi chú từng bước trên màn hình thì hơn. Những người không rành AI làm theo dễ bị rối hoặc lỗi này lỗi kia. Dù sao cũng cám ơn bác đã chia sẻ
@eztechvietnam
@eztechvietnam 11 месяцев назад
Cảm ơn bác đã góp ý. Mình sẽ để ý hơn trong các vid sau
@user-ek3dm8fo6l
@user-ek3dm8fo6l 5 месяцев назад
Mình xem chả hiểu gì cả, khó quá
@NguoiKeThua
@NguoiKeThua 9 месяцев назад
hướng dẫn kỹ giúp mình chuyển đổi qua đuôi .out.wav với.cảm ơn
@chinhnguyenhuu9230
@chinhnguyenhuu9230 3 месяца назад
anh ơi, anh dạy chi tiết lại chủ đề này mà chạy trực tiếp trên máy tính đi anh
@nghiagm5188
@nghiagm5188 5 дней назад
em thấy GPU trên colab có giới hạn anh có thể hướng dẫn trên máy làm trên GPU cá nhân không
@Campingfarm
@Campingfarm Месяц назад
#dacnongvlog #campingfarm
@hieudinh3509
@hieudinh3509 9 месяцев назад
bác chủ ơi, tới lúc dùng model thì nó báo "rate must be specified when data is a numpy array or list of audio samples " là sao bác nhỉ
@user-qk6mo7lz2h
@user-qk6mo7lz2h 2 месяца назад
Có chuyển văn bản thành giọng nói theo , theo mô hình giọng nói mình đã đào tạo được không Toàn ơi
@andylee8283
@andylee8283 11 месяцев назад
Em nghĩ là bắt đầu có video về kỹ thuật sau hơn được rồi á anh.
@eztechvietnam
@eztechvietnam 11 месяцев назад
Nhất trí luôn em ơi. Anh có plan rồi
@mtuan1911
@mtuan1911 28 дней назад
Bh mn có thể dùng RVC V2 DISCONNECTED để train cx dc (Ai muốn thử dùng cái này thì có thể trl bình luận này nhé,cái này là RVC chứ kh phải SVC nên có thể khác nma model vẫn là model AI thôi)
@clearmeaning
@clearmeaning 18 дней назад
Bác chỉ em với
@FasttechKidsWatch
@FasttechKidsWatch 4 месяца назад
Mình đã làm và thành công nhưng mình muốn chất lượng âm thanh cao hơn nữa (giống hơn nữa) thì cần chỉnh ở bước nào bạn nhỉ (không sợ colab treo vì mình mua colab pro rồi :v). Cám ơn bạn nhiều lắm !
@PetStationUK
@PetStationUK 9 месяцев назад
Quá hay anh ơi.nếu có thể tặng em 1 video hướng dẫn chuyển đổi văn bản thành giọng nói và ngược lại dc không ạ.em cảm ơn❤
@eztechvietnam
@eztechvietnam 9 месяцев назад
Quà này to quá em ạ. Để mình thu xếp thời gian nha.
@PetStationUK
@PetStationUK 9 месяцев назад
Em nghĩ chủ đề em nêu trên sẽ nhận đc rất rất nhiều sự quan tâm đó anh
@user-ci2cd5oe4v
@user-ci2cd5oe4v 7 месяцев назад
Cảm ơn bạn đã chia sẽ nghiên cứu kỳ công của mình , bạn xem cách nầy trên RU-vid có đơn giản hơn không :" Cách làm AI Cover BẤT KỲ giọng ca sĩ nào | Cách làm chi tiết (phan đông giang) "
@user-cf4hw7zw5j
@user-cf4hw7zw5j 7 месяцев назад
Phan đông giang mất phí, cái này ko biết mất phí ko bạn
@ThanhNguyen
@ThanhNguyen 6 месяцев назад
Bước Automatic preprocessing mình bị lỗi "/bin/bash: line 1: svc: command not found" và không thấy hiện thư mục dataset. Bạn hỗ trợ mình với ạ
@user-cx6sv7nj3b
@user-cx6sv7nj3b 4 месяца назад
Model này có thể đọc từ chữ viết thành file âm thanh không bạn ?
@tvxx08
@tvxx08 Месяц назад
Mình góp ý thêm là mn có thể split file audio bằng WavePad nhé, gọn nhẹ và dễ làm hơn ffmpeg. Cơ mà chủ thớt cho mình hỏi có thể train voice khác bằng file model của bạn không, và train 2 voice cùng 1 mail GG Colab đc ko nhỉ
@NamNguyen-sq7jx
@NamNguyen-sq7jx 10 месяцев назад
Cảm ơn anh về video. Hướng này tiếp cận cho việc generative ra video dạng music thì solution là gì anh nhỉ? Nhờ anh chia sẻ thêm
@eztechvietnam
@eztechvietnam 10 месяцев назад
Ý bạn là chuyển thành giọng hát phải không. Giọng hát thì về lý thuyết có thể chuyển được nhưng muốn chất lượng tốt thì bạn phải có vocal sạch, thường cái này sẽ cần phải liên hệ với các bạn ca sĩ để cung cấp vocal cho.
@baongaymoi261
@baongaymoi261 Месяц назад
mic bạn dùng tên là gì ạ , xin cảm ơn
@nguyenanphong
@nguyenanphong 11 месяцев назад
anh ơi anh cho em hỏi sau khi training xong thì Google Colab có lưu lại project đã training để dùng cho lần làm việc sau không ạ? hay phải download file đã training về lần sau dùng thì load lại ạ? Em không phải dân kĩ thuật nên ko biết, mong anh giải đáp giúp em ạ
@eztechvietnam
@eztechvietnam 11 месяцев назад
Trong code đó đã lưu lại file model vào Google drive rồi nên lần sau em chỉ cần load lại từ đoạn inference là được em ạ
@nguyenanphong
@nguyenanphong 11 месяцев назад
Em cảm ơn anh ạ!
@yeapin2k269
@yeapin2k269 5 месяцев назад
Mình mở cmd của window lên hông dùng được ls -la bạn làm như nào để chạy ffmpeg thế
@donam7922
@donam7922 5 месяцев назад
nếu có sẵn dữ liệu train thì chỉ cần chạy phần pretrained model hả bạn Mình chạy phần pretrained model thì báo lỗi này /bin/bash: line 1: svc: command not found
@nguyenanphong
@nguyenanphong 11 месяцев назад
em cảm ơn anh vì bài hướng dẫn. Với phương pháp clone voice như này có cách nào áp dụng cho text to speech không anh nhỉ? (kiểu dùng voice clone để làm voice cho kênh youtube ý anh)
@eztechvietnam
@eztechvietnam 11 месяцев назад
Voice clone đầu vào là audio nên em có thể dùng một model khác để sinh audio từ text đầu vào sau đó dùng audio đó cho vào voice clone nhé
@nguyenanphong
@nguyenanphong 11 месяцев назад
@@eztechvietnam em hiểu ý anh nói như này ko biết có đúng ko ạ, tức là em sẽ vào app text to speech (vbee, fpt ai...) để tạo audio gốc, sau đó làm tiếp các bước như phần inference là được voice clone anh nhỉ?
@nguyenanphong
@nguyenanphong 11 месяцев назад
@@eztechvietnam anh cho em hỏi thêm là làm voice clone như này có giới hạn thời gian file đầu ra ko anh nhỉ?
@eztechvietnam
@eztechvietnam 11 месяцев назад
@@nguyenanphong Model mình tự train thì ko giới hạn gì em nhé. Dùng thoải mái luôn
@eztechvietnam
@eztechvietnam 11 месяцев назад
@@nguyenanphongĐúng rồi em
@psunrang
@psunrang 11 месяцев назад
Luyện về sound thì bạn nên bỏ sound nhạc nền đi để tiện nghe rõ
@eztechvietnam
@eztechvietnam 11 месяцев назад
Cảm ơn bạn đã góp ý, mình sẽ chú ý hơn trong các video tiếp theo
@hungph
@hungph 10 месяцев назад
Cám ơn bạn video chi tiết quá 👍. Mong bạn làm thêm video hướng dẫn về Text to Speech cho tiếng Việt 🙏
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn. Mình sẽ thu xếp thời gian
@tuanda82
@tuanda82 10 месяцев назад
Cảm ơn bạn nhiều vì đã chia sẻ. Bạn cho mình hỏi thêm với? 1. Code đó đang chạy trên google colab nó có bị mất không nhỉ? Mình có cần đưa nó về tài khoản colab của mình không nhỉ? làm sao mình đưa về? 2. À mình thấy có nhiều mã nguồn mở về trí tuệ nhân tạo (kiểu như Stable diffusion, MusicLM,.....vân vân). Có nhiều người low tech như mình muốn tìm hiểu và cài đặt và dùng thử nhưng không biết. Bạn làm hướng dẫn chung về cài đặt và sử dụng những phần mềm đó giải thích bằng ngôn ngữ của người low tech đi (cố gắng KHÔNG dùng thuật ngữ chuyên môn) sẽ có nhiều người quan tâm đó, nhất là mình :D Cảm ơn bạn nhiều
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn. Mình xin trả lời câu hỏi của bạn 1. Bạn nên clone về colab của mình để dễ chỉnh sửa hơn. Code đó đã lưu lại bằng Google Drive rồi nên không bị mất model nhưng muốn lưu lại code thì bạn make copy về colab của mình cho chắc 2. Mình sẽ cố gắng thu xếp thời gian. Rất mong nhận được những ý kiến của các bạn về các ứng dụng muốn mình hướng dẫn nhé
9 месяцев назад
Ví dụ mình chạy lần 1 300 epoch thì lần sau có chạy dc tiếp từ đó ko hay load lại hết từ đầu hả ad?
@eztechvietnam
@eztechvietnam 9 месяцев назад
Chạy tiếp được bác nhé
@GoogleColabGoogleColab
@GoogleColabGoogleColab 4 месяца назад
cho mình hỏi để đạt được giọng nói giống nhất thì thời gian âm thanh là bao nhiêu
@HoaiMyAudio
@HoaiMyAudio 7 месяцев назад
Ad ơi mk chạy đến đoạn train bị lỗi này thì sửa thế nạo vậy The tensorboard extension is already loaded. To reload it, use: %reload_ext tensorboard [15:05:48] INFO [15:05:48] NumExpr defaulting to 2 threads.
@bongdama
@bongdama 4 месяца назад
mình là người low tech, bạn có thể làm clip short hướng dẫn cách cài ffmpeg cho win 10 , sử dụng được và cắt clip như bạn làm không :), mình đã thử xem các clip yt khác nhưng gõ theo lệnh nó toàn báo lỗi thôi bạn. Cảm ơn bạn nhiều về clip chia sẻ bên trên :)
@hieuleinh180
@hieuleinh180 10 месяцев назад
Anh hướng dẫn thêm 1 model anti-spoofing lại nữa thì hay anh ạ
@eztechvietnam
@eztechvietnam 10 месяцев назад
Anti spoofing thường bị phụ thuộc bởi thiết bị đầu vào khá nhiều mới đảm bảo chĩnh xác được em ạ
@newbieg5930
@newbieg5930 4 месяца назад
Mình làm ik như bạn nhưng tới bước export configs file nó không ra dc thư mục config...mong bạn giúp với ạ !
8 месяцев назад
mình chạy bị lỗi không ak có cách nào khắc phục không bạn
@nhungoc626
@nhungoc626 26 дней назад
em làm được tới phân goolge colab. còn khúc đó không hiêu lắm . nhờ anh giúp đỡ em xin cam ơn
@dongytuetinh
@dongytuetinh 5 месяцев назад
Bạn ơi, chạy đến phần training thì colab báo: " Warning: Could not find TensorRT" là bị lỗi gì vậy bạn
@thanhson89
@thanhson89 2 месяца назад
Video anh đăng giả giọng bác Ngạn là video nào vậy?
@namphung2528
@namphung2528 9 месяцев назад
anh cho em hỏi chút ạ, làm cái này mình chuyển đổi đoạn audio dài 1 tiếng có được không ạ, nếu được thì thời gian tạo ra file mới mất khoảng bao nhiêu lâu ạ..em cảm ơn ạ
@eztechvietnam
@eztechvietnam 8 месяцев назад
Về lý thuyết là được nhưng em nên cắt nhỏ thành từng đoạn ngắn hơn rồi xử lý xong ghép lại
@phutct0502
@phutct0502 3 месяца назад
Cái colab này sau này có bị mất k anh nhỉ?
@thanhtochu
@thanhtochu 5 месяцев назад
mic bác dùng là gì vậy, giá cao không bác
@IF25497
@IF25497 9 месяцев назад
Hi a. Cho e hỏi chút, của em chạy đến khúc use train model hiển thị "ValueError: rate must be specified when data is a numpy array or list of audio samples." ; "/bin/bash: line 1: svc: command not found" thì làm sao giờ ạ?
@mytv2010
@mytv2010 9 месяцев назад
mình cũng bị như này, b có cách nào fix chưa ạ
@dongvietquan
@dongvietquan 9 месяцев назад
Bạn ơi, cái này có thể cài đặt để sau khi học xong, mình chỉ cần nhập text vào để ra voice luôn được không? Cảm ơn bạn.
@eztechvietnam
@eztechvietnam 9 месяцев назад
Đây là voice cloning nên đầu vào cần là audio còn công nghệ bạn nói là text to speech
@user-wu3qh9ce7s
@user-wu3qh9ce7s 8 месяцев назад
anh oi cho em hoi tai sao Epoch cua em len toi 9999 vay anh?
@lu0nghainamluong301
@lu0nghainamluong301 10 месяцев назад
chào bạn, cảm ơn bạn đã chia sẻ kiến thức rất hay mình đã làm theo và thành công. Bạn có thể làm video hướng dẫn tải model về máy để chạy trực tiếp trên PC được không ạ, cảm ơn bạn rất nhiều
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cảm ơn bạn nhiều. Tải về PC thì máy bạn cần có GPU nhé.
@lu0nghainamluong301
@lu0nghainamluong301 10 месяцев назад
@@eztechvietnam vâng ạ, bạn có thể làm video hướng dẫn cho mọi người cùng biết được không ạ, tại mình cũng không phải dân kỹ thuật nên không hiểu lắm ạ. Cảm ơn bạn nhiều
@eztechvietnam
@eztechvietnam 10 месяцев назад
​@@lu0nghainamluong301 Cảm ơn bạn, mình sẽ thu xếp thời gian để làm video nha
@lu0nghainamluong301
@lu0nghainamluong301 10 месяцев назад
@@eztechvietnam Vâng mình sẽ đón xem video của bạn ạ
@nampham-dl8xn
@nampham-dl8xn 8 месяцев назад
em làm tới mục Automatic preprocessing thì hiện lên mục dataset và 44k đã có file WAV . Nhưng khi chạy SVC pre-config thì không hiện thư mục "configs - 44k- config.json " như video ạ. Mong anh hướng dẫn giúp em đoạn này
@anghuy9813
@anghuy9813 10 месяцев назад
thời lượng cần thiết cho target voice để cho ra chất lượng tốt là khoảng bao nhiêu lâu vậy ạ?
@eztechvietnam
@eztechvietnam 10 месяцев назад
Nếu finetuning thì khoảng 10 phút thì mình thấy chất lượng cũng ổn rồi. Chỉ có mỗi cái là chất lượng voice phải tốt, âm sạch, không nhiễu và có độ đồng đều (tốt nhất nên lấy từ cùng 1 câu truyện như trong bài mình hướng dẫn để đảm bảo)
@AGAZET
@AGAZET Месяц назад
Tạo model giọng mình sao bạn
@HaiVo-bo6hs
@HaiVo-bo6hs 3 месяца назад
khi đến bước Install dependencies: thì bị lỗi google-colab cụ thể là: google-colab 1.0.0 requires ipython==7.34.0, but you have ipython 8.22.2 which is incompatible mong đạo hữu chỉ giáo giúp. tại hạ xin chân thành cảm ơn.
9 месяцев назад
b ko hướng dẫn cụ thể cách dùng cái ffmpeg à
@eztechvietnam
@eztechvietnam 9 месяцев назад
Xin lỗi bạn vì trong phạm vi video ngắn nên mình chưa hướng dẫn chi tiết được phần đó. Phần FFMPEG bạn có thể tải FFMPEG về máy. Có rất nhiều hướng dẫn trên mạng để bạn có thể cài đặt như phoenixnap.com/kb/ffmpeg-windows chẳng hạn. Sau đó thì bạn vào thư mục chứa file data rồi xử lý chạy lệnh giống như trên video thôi ạ
@Truyennhama
@Truyennhama 5 дней назад
Cái này m làm thành công rồi, nhưng mà nhiều từ nó phát âm như kiểu bị ngọng, bị tây hoá lơ lớ thì phải làm sao bạn? Hay phải train kĩ hơn? Mong dk bạn giải đáp!
@user-oo8vh8ie3t
@user-oo8vh8ie3t 10 месяцев назад
Tích hợp cái model train này vào phần mềm như balaboka như thế nào add ơi ???
@eztechvietnam
@eztechvietnam 10 месяцев назад
Chắc bác lấy audio rồi chạy qua model này thôi ak
@Trangnguyen-vs5pk
@Trangnguyen-vs5pk 2 месяца назад
bạn có thể giúp mình được k, mình cần cái này ạ
@mykhanh-xs1rq
@mykhanh-xs1rq 2 месяца назад
chào bạn, mình dùng GPU AMD, có cách nào sử dụng được AMD thay vị NVdia ko bạn
@ngoctcef
@ngoctcef 7 месяцев назад
Chạy svc pre-config =0% thì phải làm sao hả bạn ơi
@vinhlocvo
@vinhlocvo 7 месяцев назад
bỏ qua lỗi này đi bạn, mình thấy nó vẫn chạy tiếp được ah'.
@quendi9381
@quendi9381 6 месяцев назад
Cái đoạn cắt thành nhiều file 10s rồi đem đi tách vocal liền là đúng bậy, toàn cho ra kết quả giọng có âm thanh rất tệ. Làm đúng là phải xử lý file âm thanh gốc đủ kiểu cả trước lẫn sau khi vocal, sau đó bước cuối cùng cắt ra thành nhiều file 10s thì mới cho ra giọng AI chất lượng
@nhungoc626
@nhungoc626 26 дней назад
ANH GIÚP EM VƠI EM XIN CÁM ƠN
9 месяцев назад
trong lúc train có dc tắt máy ko b?
@eztechvietnam
@eztechvietnam 9 месяцев назад
Bác nên mở trình duyệt tab đó trong lúc train để tránh ngắt kết nối
@hieudinh3509
@hieudinh3509 9 месяцев назад
chạy càng lâu thì giọng càng giống à bác chủ
@hungisbetter7948
@hungisbetter7948 10 месяцев назад
Train AI này có ảnh hưởng đến cpu máy không ạ ?
@eztechvietnam
@eztechvietnam 10 месяцев назад
Dùng chủ yếu là GPU thôi bạn
@DaoVietBach1986
@DaoVietBach1986 4 месяца назад
Ngay khúc đầu mình chạy Installation thì nó cứ quay mòng mòng "Connecting to Python 3 Google Compute Engine backend (GPU)", rồi báo Disconnected là sao nhỉ
@honglientran9631
@honglientran9631 4 месяца назад
Các bác cho em hỏi: Em tải FFmpeg về nhưng không thấy file cài đặt ạ
@user-cr2oi4zu8s
@user-cr2oi4zu8s 6 месяцев назад
mỗi một lần chạy là phải train lại à bác ơi, có cách lưu lại để lần sau vào cứ thể thay đổi giọng luôn được không ạ?
@Cafe_Kechuyen
@Cafe_Kechuyen 4 дня назад
@@user-cr2oi4zu8s k cần train lại, mục đích train là để lấy cái model g1000 và D1000. 2 cái file đó ông Toàn để link cho mọi người tải về, ném vào google drive là xong
@dart6863
@dart6863 9 месяцев назад
Như em muốn làm giọng đọc của em, xong em đưa văn bản lên nó tự đọc theo giọng e set trước k anh
@eztechvietnam
@eztechvietnam 9 месяцев назад
Vậy em phải làm model text to speech em ạ. Cái này là voice cloning thôi, tức là em phải có audio sẵn của giọng khác xong nó chuyển sang giọng em thì đc
@user-ek3dm8fo6l
@user-ek3dm8fo6l 5 месяцев назад
Anh ơi có cần phải dữ liệu trên 1GB thì mới train được ai không ạ :(((
@lecongtuananh1993
@lecongtuananh1993 3 месяца назад
train model này online hả bro, nó có tốn chi phí gì không nhỉ
@msalee39
@msalee39 9 месяцев назад
mình train giọng hoạt hình của nhật cho nó nói tiếng việt được không bro, mong được hướng dẫn cảm ơn
@eztechvietnam
@eztechvietnam 9 месяцев назад
Được bạn nhé. Bạn sinh giọng anime ra thay cho giọng bác ngạn là đc
@msalee39
@msalee39 9 месяцев назад
​@@eztechvietnambro hướng dẫn training để nó chuyển tts đi bro.
@lamkhatinh8344
@lamkhatinh8344 10 месяцев назад
Hi ông, file ngan_original.wav ở đâu ra vậy ông nhỉ, t thấy file đó gần giống với giọng bác Ngạn luôn nhỉ? Có phải file đó mình tạo ra bằng cách ghi âm không
@eztechvietnam
@eztechvietnam 10 месяцев назад
Cile ở trong google drive luôn bạn ạ. File đó mình tự thu bạn ạ
@hieudinh3509
@hieudinh3509 9 месяцев назад
mình thấy giọng ông Ngạn luôn mà bác, có vẻ admin đưa nhầm file
@vietnamong4028
@vietnamong4028 4 месяца назад
sao mình chạy Install dependencies không được bạn nhỉ
@DangHo-jq2eh
@DangHo-jq2eh 2 месяца назад
Lỗi /bin/bash: line 1: svc: command not found khi chạy preprocessing là sao bạn ơi. mình bị kẹt ở đây. mình cảm ơn
@TidyMenswear
@TidyMenswear 8 месяцев назад
Anh ơi cho em hỏi là em muốn sử dụng luôn model bác Ngạn của anh train thì mình dùng như nào anh nhỉ em cảm ơn anh đã chia sẻ
@nampham-dl8xn
@nampham-dl8xn 8 месяцев назад
em làm tới mục Automatic preprocessing thì hiện lên mục dataset và 44k đã có file WAV . Nhưng khi chạy SVC pre-config thì không hiện thư mục "configs - 44k- config.json " như video ạ. Mong anh hướng dẫn giúp em đoạn này. .CÓ AI BIẾT KHÔNG CHỈ GIÚP VỚI Ạ
@user-rx3zm4zm4h
@user-rx3zm4zm4h 8 месяцев назад
click chuột phải trong vùng folder chọn refresh
@steadvuifast3597
@steadvuifast3597 4 месяца назад
Bạn điên vl chia sẻ cái hay như vậy,phải download về gấp😍
@Isaac-fb1rf
@Isaac-fb1rf 10 месяцев назад
cảm ơn bạn đã hướng dẫn, bạn cho mình hỏi mình đang đến đoạn "Use trained model" thì bị báo lỗi là "ValueError: rate must be specified when data is a numpy array or list of audio samples." bạn cho mình hỏi đây là lỗi gì với ạ. Cảm ơn bạn nhiều
@eztechvietnam
@eztechvietnam 10 месяцев назад
Lỗi đó có thể do file chưa kịp ghi vào drive. Bạn bỏ dòng display đi và chạy lại là được nhé
@hieudinh581
@hieudinh581 9 месяцев назад
bỏ dòng display là bỏ hết cả 1 đoạn ạ bác, thế thì nó đâu còn cái dòng xuất file out bác nhỉ @@eztechvietnam
@GameUproar
@GameUproar 5 месяцев назад
@@hieudinh581 roi lam sao bac, minh cung bi
@hieudinh581
@hieudinh581 5 месяцев назад
bác úp file lên để lâu tí cho nó nhận là ok@@GameUproar
@xuantung191
@xuantung191 10 месяцев назад
cái này train xong thì file index ở đâu vậy bác? em muốn train xong rồi mang về Pc để tạo voice mà k biết tải index ở đâu
@eztechvietnam
@eztechvietnam 10 месяцев назад
Chào bạn, bạn có thể download model về máy và chạy dưới máy local được bạn nhé, nhưng phần đó mình chưa hướng dẫn trong video này vì muốn dùng dưới máy được thì máy bạn cũng cần có GPU mạnh mạnh một chút
@lu0nghainamluong301
@lu0nghainamluong301 10 месяцев назад
@@eztechvietnam bạn có thể hướng dẫn phần tải model về máy để chạy được không ạ, cảm ơn bạn rất nhiều
@jonsonkasi092
@jonsonkasi092 23 дня назад
cho mình hỏi là input có thể từ text to speech ko bạn
@Cafe_Kechuyen
@Cafe_Kechuyen 4 дня назад
@@jonsonkasi092 không
@HiepHuynh-ul9sd
@HiepHuynh-ul9sd 10 месяцев назад
làm sao sử dụng model G_1001.pth và D_1001.pth vậy bạn ơi?
@HuyHoang-ly3ee
@HuyHoang-ly3ee 10 месяцев назад
mở config.json ở logs thay thế đường dẫn ở cuối file là được bạn
@v-trend8923
@v-trend8923 8 месяцев назад
đóng gói model này lại để dùng cho lần sau mà không cần train lại được ko bạn?
@Cafe_Kechuyen
@Cafe_Kechuyen 4 дня назад
@@v-trend8923 cần gì train lại,
Далее