Voice Conversion 간단 설명
Voice Conversion (VC)VC는 linguistic content information은 유지한 채로 utterance의 speaker를 target speaker로 변환하는 기술입니다. VC를 하기 위해 과거에는 paired data가 필요했습니다. 최근 몇 년 동안 non-parallel data를 이용하는 다양한 model들이 등장했습니다. DGAN-VC는 adversarial training 방식으로 content information과 speaker information을 분리하도록 학습합니다. StarGAN-VC는 many-to-many voice conversion을 진행하기 위해 conditional input을 사용합니다. 하지만, 두 model다 training 중에 봤던 ..
연구실 공부
2024. 5. 13.