GMM supervector, Eigenvoice vector, JFA, I-vector
먼저 speaker recognition(화자 인식)은 음성이 주어졌을 때, 해당 음성의 발화한 사람이 누구인지를 찾는 것입니다. 사람마다 고유한 음성 특징이 있습니다. 그래서 해당 음성 특징을 이용해 발화한 사람을 찾을 수 있습니다. 화자 인식은 크게 2가지로 분류됩니다. speaker identification과 speaker verification입니다. speaker identification의 경우, 음성이 input으로 들어왔을 때, 해당 음성의 발화자를 찾는 것입니다. multi class classification인 느낌입니다. speaker verification의 경우, 음성이 input으로 들어왔을 때, 해당 음성이 등록된 발화자의 음성인지 분류하는 것입니다. binary classi..
연구실 공부
2024. 1. 31.