云知声携手国家电网及安全好医生 打造职业一流水准声纹体系

声纹辨认(Voiceprint Recognition,VPR)也称说话人辨认,是一种通过声响判别说话人身份的技能,分为说话人辨识和说话人承认。前者用以判别某段语音是若干人中的哪一个所说的,即“ N 选一”;后者用以承认某段语音是否是指定的或人所说,是“1对1匹配”问题。不同的使命和使用会使用不同的声纹辨认技能,如缩小刑侦规模时或许需求辨认技能,而银行买卖时则需用到承认技能。

云知声在声纹技能范畴深耕多年,是国内为数不多具有全栈语音技能才能的人工智能公司。早在2004年,尚上任于摩托罗拉公司的云知声创始人黄伟博士便带领团队研制出世界上第一款手机声纹认证体系,搭载该体系的相关产品总计销量超2 亿台。

尽管声纹辨认优势显着,但要想精确分辩声响特征却并非易事。首要,声纹辨认体系功能会受用户发声状况影响,如用户的身体状况、心情等都会影响辨认精确度。其次,环境的喧闹度,以及收集、传输音频的硬件装备,都会在不同程度上对辨认体系行成搅扰。为处理上述问题,云知声声纹技能团队进行了一系列技能攻坚与立异。

首要,依托云知声强壮的语音信号前端处理技能,如VAD、语音降噪等,精确地捕捉到人声并进行背景噪声消除。

其次,云知声将DNN引进到传统声纹辨认ivector技能结构中,并交融最新端到端声纹辨认技能,根据云知声超算渠道和海量声纹练习数据,使得模型得以学习到数万说话人,每人多种发声的特性,且在云端针对每个用户选用说话人自适应技能,到达越用越好的作用。在信道处理上,选用PLDA信道补偿技能,可将信道影响降到最小。

近年来,随同深度学习的鼓起,云知声在国内率先将深度学习技能使用到语音辨认中,且后续引进到声纹辨认范畴,处理了一系列声纹技能有用难点,并使用到实践产品上。

在1月7日政法委“新时代市域社会办理智能使用沟通展”上,云知声在公检法范畴的声纹身份验证和反诈骗计划得到了各级政法委领导的高度赞扬,表明这才是真实的“智治”,让AI成为政府和社会组织施行精准办理、智能办理的重要利器,帮忙公安部门削减案发、更快破案,为安全城市保驾护航。

近来,我国抢先的一站式医疗健康生态渠道安全好医生宣告,由云知声供给声纹技能支撑的安全好医生客户端“声纹登陆体系”在通过屡次模型优化和晋级迭代后,登陆成功率挨近99%,达职业一流水准。

与此一起,为保证用户登陆的“安全性”,云知声为安全好医生客户端声纹登录体系供给数字串注册和登录的“文本弱相关”技能,工程难度更高,安全性更强。在同一账号下,云知声声纹辨认产品可支撑6 人注册。在客户端云知声供给封装好的SDK,支撑声纹注册、登录、解绑等接口,供上层调用API完成产品逻辑。

此外,云知声与国家电网协作的会议体系声纹辨认项目更是完成了10人以内声纹库辨认率高达90%以上。此体系选用云知声最先进的声纹辨认、语音辨认技能,精确辨认会议中的讲话人身份和讲话内容,构成完好会议记录,便利归档、追溯,完成会议全过程的数字化,推进会议办理的智能化开展。

一起,云知声还供给老练的声纹效劳私有化布置计划,根据在金融、客服、快递等不同职业丰厚的私有云布置经历,可有用保证客户数据安全。未来,云知声将更老练、更先进的声纹技能与产品使用到金融、医疗、教育、公检法等范畴。

来历:东北新闻网