北京晨翰科技有限公司

说话人识别


      说话人识别可以分为文本相关和文本无关等。文本相关是指限定了测试语音的文本内容必须与训练语音一致;而文本无关则不限定测试语音的文本内容。

      说话人识别技术的关键是语音信号中个性特征的分离和提取,以及对各种声学特征参数的线性或非线性的模式匹配方法上。另一方面,对于短语音说话人识别,由于语音时间很短,提取的特征有限,限制了说话人识别的性能。

     
      针对这些问题,我们改进了MFCC(美尔倒谱系数)特征的提取过程,降低了复杂度,同时减少了信号失真,增强了语音信号中的个性化特征。并且,采用我们自主创新的自适应核可能性模糊C均值聚类算法(AKPFCM),和分类器实现可靠的说话人识别,在很短的语音情况下(1~2秒),仍能具有很高的识别性能。通过我们的改进算法,克服了在短语音情况下说话人识别性能下降的情况,很大程度上提高了系统的识别率。

      通过这种基于文本相关的短语音说话人识别方法,可以用于声纹密码系统,嵌入式设备的声纹解锁,以及系统登录,支付等应用。


应用场景      

     

      通过这种基于文本相关的短语音说话人识别方法,可以用于声纹密码系统,嵌入式设备的声纹解锁,以及系统登录,支付等应用。


Beijing Chenhan Technology Co., Ltd.
QQ:1827102886 联系电话:18612238658
联系邮箱:1827102886@qq.com
联系地址:
北京市海淀区丰慧中路7号新材料创业大厦10层1223号