中译语通申请基于语音融合特征的跨语种说话人识别方法及系统专利 提高跨语种说话人识别的准确率

金融界2025年6月7日消息,国家知识产权局信息显示,中译语通科技股份有限公司申请一项名为“一种基于语音融合特征的跨语种说话人识别方法及系统”的专利,公开号CN120108401A,申请日期为2025年03月。

专利摘要显示,本发明提供了一种基于语音融合特征的跨语种说话人识别方法及系统,涉及语音处理技术领域,该方法通过对原始语音信号进行带通滤波,提取浊音段并整合为新语音段;提取新语音段中的基音周期和MFCC特征,串联形成融合特征向量;输入多个测试者的多语种语音段,提取融合特征,使用K均值聚类和EM算法训练得到每个说话人的GMM模型;输入测试语音段,提取融合特征,计算与GMM模型的似然概率得分,与预设阈值比较,确认或拒绝测试者身份。本发明能够从语音信号中提取更加稳定的特征,从而提高跨语种说话人识别的准确率,有效应对说话人语种失配的情况,提升识别性能,尤其是在双语或多语种的应用场景下,具有较强的适应性。

天眼查资料显示,中译语通科技股份有限公司,成立于2009年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本44535.8474万人民币。通过天眼查大数据分析,中译语通科技股份有限公司共对外投资了6家企业,参与招投标项目474次,财产线索方面有商标信息399条,专利信息255条,此外企业还拥有行政许可6个。

打开APP阅读更多精彩内容