Deep Learning-based Source-Selective Audio Manipulation Framework

2021.03.01


“Ok google! 남자 목소리 줄여줘!” 같은 기능이 스마트폰에서 지원되면 얼마나 편할까요? 딥러닝 기반의 다중음원 오디오에 대한 음원선별적 편집 모델 연구에서는 여러 음원이 섞여 있는 signal에서 특정 음원만 선별적으로 편집하는 기법을 연구합니다.

실적

  • Choi, Woosung, Kim, Minseok., Martinez Ramirez, Marco A., Chung, Jaehwa., and Jung, Soonyoung. “AMSS-Net: Audio Manipulation on User-Specified Sources with Textual Queries.” arXiv preprint arXiv:2104.13553 (2021). (github, demo) (preprint)