Vanilla Temporal Pooling是由中国哈尔滨工业大学语音实验室的Jiqing Han和Shiwen Deng开发的一种音频信号无监督时序特征学习方法。该方法利用非线性支持向量回归(SVR)直接连接BoAW直方图序列与时间索引,有效地捕获任意持续时间的音频信号时间动态模型。此外,为了提升特征表示的信号重构能力,我们还嵌入了稀疏编码方法于传统的BoAW框架中。如果您对我们的研究感兴趣,请引用:@article{zhang:2018:temporal pooling, title={Unsupervised Temporal Feature Learning Based on Sparse Coding Embedded BoAW}, author={Liwen Zhang, Jiqing Han and Shiwen Deng}, conference={Interspeech}, year={2018}.