(资料图片)
企查查APP显示,近日,阿里巴巴达摩院(杭州)科技有限公司“声纹特征提取方法、说话人识别方法、模型训练方法及装置”专利公开。企查查专利摘要显示,主要技术方案包括:获取包含语音的音频段;提取音频段的频谱特征输入声纹提取模型。其中声纹提取模型的第一卷积处理层包括一个以上串连的第一卷积处理模块,第一卷积处理模块包括多个串连的基础模块;基础模块对输入该基础模块的特征进行降维处理,得到第一特征;对第一特征进行至少一种粒度的池化处理,并对池化处理的结果进行卷积处理,得到第二特征;以及对第一特征进行卷积处理得到第三特征;对第二特征和第三特征进行融合处理,得到该基础模块输出的特征;池化层对第一卷积处理层输出的特征进行池化处理,得到声纹特征。本申请能够提升声纹特征提取的准确性。
标签: