[논문] Deep Neural Network Embeddings for Text-Independent Speaker Verification
https://www.isca-archive.org/interspeech_2017/snyder17_interspeech.pdf 해당 논문을 보고 작성했습니다. Abstract 저자들은 text-independent speaker verification에서 사용할 수 있는 feed forward deep neural network에서 추출된 embedding을 i-vector의 대체자로 제안합니다. long-term speaker characteristic은 network에 존재하는 시간 pooling layer에 의해 capture된다고 합니다. 해당 pooling layer는 input speech을 aggregate합니다. 이를 통해 network가 가변길이의 speech 부분에서도 speaker를 ..
연구실 공부
2024. 2. 1.