[논문] End-to-End Neural Speaker Diarization with Self-Attention
https://ieeexplore.ieee.org/abstract/document/9003959 Request Rejected ieeexplore.ieee.org 해당 논문을 보고 작성했습니다. Abstract Speaker diarization은 speaker embedding을 clustering하는 방식으로 주로 발전되어 왔습니다. 그러나, clustering 기반 방식들은 2가지 문제가 존재합니다. (1) diarization error를 직접적으로 minimize하는 방식으로 최적화할 수 없습니다. (2) speaker overlap을 정확하게 다룰 수 없습니다. 이러한 문제를 해결하기 위해, bidirectional long short-term memory (BLSTM) network를 사용하..
연구실 공부
2024. 3. 18.