네 음원에서 태연 보컬만 추출한 데이터가 있으면 되고 RVC의 경우는 15분~20분 정도면 되고(나눠져있어도 상관없습니다. 예) 1분짜리 파일 15개) diff나 DDSP는 더 많이 필요합니다 1시간 정도 학습해서 모델 만들고 만들고 싶은 노래 보컬만 추출해서 추론하면 됩니다 저도 웹, 유튜브에서 얻은 정보로 하는거라 찾아보시는게 좋습니다
네 맞습니다 원곡(남성 보컬)을 여성 키로 높여서 만드는 방법도 있는데 이 곡의 경우에서는 깔끔하게 만들어지지 않아 커버곡으로 작업했습니다 단순히 키 때문만 아니고 원곡자의 발성, 창법이 AI에서 어울리는지와 원음에서 기계, 전자음, 코러스 등이 많거나 하는 등(요아소비의 아이돌 같은) 음성 분리가 어려울 경우 커버를 사용합니다
@@jaenak2198 감사합니다 여태 목소리 싱크로율에 대한 지적만 있었는데 음향 관련된 댓글은 처음 받아봅니다 아직도 배우고 적용해나가는 중이라 아직도 갈피를 잡았다고 얘기할 수 없지만 확실한건 경험이라고 이것저것 만져보면서 결과물을 올리다보니 조금씩 알아가고 또 뒤돌아보면(이전에 업로드된 것을 보면) 퀄리티에 실망하기도 하고 그러네요 이렇게 발전해나가겠죠. 응원 감사합니다
ai 기술이 점점 두려워진다. 지금도 뉴스에 올라온거 보니까 ai로 만든 대통령 얼굴에 ai가 만든 음성을 짜집기해서 페이크뉴스 만든 영상들 있던데 거기서도 트럼프 집권 시기에 트럼프가 전쟁 시작한다고 하는데 표정이며 목소리 모든게 똑같다보니 진짜 나쁜짓 한다면 ㄷㄷ 이외에도 예전부터 합성 같은걸로 연예인들 고소 하는게 많던데 연예인 모습에 목소리까지 입히는 범죄들도 딥웹에서 많이 이루어지고 있을듯