登录 | 注册 | 忘记密码
首页IT互联网最新科技

最新科技

一种身份识别方法和装置与流程 (至少使用几种患者身份识别方法)

来源: 浏览: 20次  更新时间:2021-12-02 03:51

目录

患者身份识别方法及流程

一种身份辨别办法和安装与过程

1.本果然波及人为智能本领范围更加波及一种身份辨别办法和安装。


背景本领:

2.跟着挪动互联网的展开用户获守信息的办法更加的碎片化和赶快化。百般百般的新本领微信公众号用户获守信息的办法更加的碎片化和赶快化。百般百般的新本领百般化平台的展示都不共程度上分别着用户的注沉力。视频发布平台则是个中的风口用户会在视频发布平台上洪量上传本人所拍的短视频视频发布平台方须要闭于用户发布的视频和音频进行辨别。而相闭本领中在闭于每天上传的数以亿计的音视频进行辨别时只能经过人为辨别音视频中的谈话人身份在闭于人为辨别不经过的音视频再进一步的节制检测效力较矮且难以保护谈话人身份辨其他精确性。


本领实行因素:

3.本果然供给一种身份辨别办法和安装以致少处理相闭本领中检测音视频中谈话人身份的检测效力矮且精确性矮的问题。本果然的本领筹备如下:
4.依据本果然实行例的第一方面供给一种身份辨别办法所述办法包括;
5.获得待辨别音频信息;
6.将所述待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性;
7.将所述待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得所述待辨别音频信息中发声闭于象的身份辨别截止。
8.动作一个可选的实行例所述声纹特性配合模型包括降维层、归一化处置层、特性配合层、手段声纹决定层和辨别截止获得层所述将所述待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得所述待辨别音频信息中发声闭于象的身份辨别截止包括:
9.在所述降维层中闭于所述待辨别声纹特性进行降维赢得降维特性数据;
10.在所述归一化处置层中闭于所述降维特性数据进行归一化处置赢得归一化特性数据;
11.在所述特性配合层中闭于所述归一化特性数据和所述备案声纹特性进行配合赢得声纹配合值所述声纹配合值表征所述归一化特性数据和所述备案声纹特性间的配合程度;
12.在所述手段声纹决定层中依据所述声纹配合值决定与所述归一化特性数据闭于应的手段备案声纹特性;
13.在所述辨别截止获得层中依据所述手段备案声纹特性闭于应的身份信息决定所述待辨别音频信息中发声闭于象的身份辨别截止。
14.动作一个可选的实行例所述办法还包括:
15.获得备案音频信息;
16.将所述备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得备案声纹特性;
17.保存所述备案声纹特性。
18.动作一个可选的实行例所述声纹特性决定模型包括音频特性提取搜集、语音疏通检测搜集和声纹特性提取搜集所述将所述待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性包括:
19.将所述待辨别音频信息输出到所述音频特性提取搜集中闭于所述待辨别音频信息进行特性提取赢顺利段音频特性信息;
20.将所述手段音频特性信息输出到所述语音疏通检测搜集中进行语音疏通检测赢得语音特性信息所述语音特性信息表征所述手段音频特性信息中语音疏通时段的特性信息;
21.将所述语音特性信息输出到所述声纹特性提取搜集中闭于所述语音特性信息进行声纹特性提取赢得所述待辨别声纹特性。
22.动作一个可选的实行例所述音频特性提取搜集包括预处置层、频域特性提取层、滤波层和手段音频获得层所述将所述待辨别音频信息输出到所述音频特性提取搜集中闭于所述待辨别音频信息进行特性提取赢顺利段音频特性信息包括:
23.在所述预处置层中闭于所述待辨别音频信息进行预处置赢得音频帧信息;
24.在所述频域特性提取层中闭于所述音频帧信息进行短时傅里叶变幻赢得频域特性信息;
25.在所述滤波层中闭于所述频域特性信息进行梅尔滤波赢得初始音频特性信息;
26.在所述手段音频获得层中闭于所述初始音频特性信息进行失踪余弦变幻赢得所述手段音频特性信息。
27.动作一个可选的实行例所述手段音频特性信息有多个所述将所述手段音频特性信息输出到所述语音疏通检测搜集中进行语音疏通检测赢得语音特性信息包括:
28.在所述语音疏通检测搜集中决定每个手段音频特性信息中的语音疏通开始和语音疏通尽头。
29.将每个手段音频特性信息中相邻的一组语音疏通开始和语音疏通尽头间的音频特性数据动作所述语音特性信息。
30.动作一个可选的实行例所述语音特性信息有多个所述声纹特性提取搜集包括多个声纹特性提取层所述将所述语音特性信息输出到所述声纹特性提取搜集中闭于所述语音特性信息进行声纹特性提取赢得待辨别声纹特性包括:
31.依据所述多个声纹特性提取层中每个声纹特性提取层的预设参数和所述语音特性信息决定每个声纹特性提取层的输出特性信息;
32.在所述多个声纹特性提取层中闭于所述输出特性信息进行线性整流赢得初始声纹特性;
33.在所述多个声纹特性提取层中闭于所述初始声纹特性进行归一化处置赢得待辨别声纹特性。
34.动作一个可选的实行例所述办法还包括:
35.获得样品音频信息和所述样品音频信息闭于应的身份标注信息;
36.将所述样品音频信息输出到待熟习声纹特性决定模型闭于所述样品音频信息进行声纹特性提取赢得猜测声纹特性;
37.将所述猜测声纹特性输出到返回分类搜集中闭于所述猜测声纹特性进行分类赢得所述猜测声纹特性的猜测身份标记信息;
38.依据所述猜测身份标记信息和所述身份标注信息决定声纹辨别缺点;
39.基于所述声纹辨别缺点闭于所述待熟习声纹特性决定模型进行熟习赢得所述声纹特性决定模型。
40.动作一个可选的实行例所述办法还包括:
41.获得多个备案音频信息和多个样品音频信息;
42.将所述多个备案音频信息输出所述声纹特性决定模型赢得多个参照声纹特性;
43.将所述多个样品音频信息输出所述声纹特性决定模型赢得多个样品声纹特性;
44.基于所述多个参照声纹特性和所述多个样品声纹特性天生多组声纹熟习数据和每组声纹熟习数据的配合标注信息;
45.将所述多组声纹熟习数据输出到待熟习声纹特性配合模型中闭于每组声纹熟习数据中的参照声纹特性信息和样品声纹特性进行配合赢得猜测声纹配合值;
46.依据所述猜测声纹配合值和所述配合标注信息决定配合缺点数据;
47.基于所述配合缺点数据闭于所述待熟习声纹特性配合模型进行熟习赢得所述声纹特性配合模型。
48.依据本果然实行例的第二方面供给一种身份辨别安装所述安装包括;
49.音频信息获得模块被摆设为实行获得待辨别音频信息;
50.声纹特性决定模块被摆设为执即将所述待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性;
51.声纹特性配合模块被摆设为执即将所述待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得所述待辨别音频信息中发声闭于象的身份辨别截止。
52.动作一个可选的实行例所述声纹特性配合模型包括降维层、归一化处置层、特性配合层、手段声纹决定层和辨别截止获得层所述声纹特性配合模块包括:
53.降维单元被摆设为实行在所述降维层中闭于所述待辨别声纹特性进行降维赢得降维特性数据;
54.归一化处置单元被摆设为实行在所述归一化处置层中闭于所述降维特性数据进行归一化处置赢得归一化特性数据;
55.特性配合单元被摆设为实行在所述特性配合层中闭于所述归一化特性数据和所述备案声纹特性进行配合赢得声纹配合值所述声纹配合值表征所述归一化特性数据和所述备案声纹特性间的配合程度;
56.手段声纹决定单元被摆设为实行在所述手段声纹决定层中依据所述声纹配合值决定与所述归一化特性数据闭于应的手段备案声纹特性;
57.辨别截止获得单元被摆设为实行在所述辨别截止获得层中依据所述手段备案声纹特性闭于应的身份信息决定所述待辨别音频信息中发声闭于象的身份辨别截止。
58.动作一个可选的实行例所述安装还包括:
59.备案音频获得模块被摆设为实行获得备案音频信息;
60.备案音频特性提取模块被摆设为执即将所述备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得备案声纹特性;
61.备案声纹特性保存模块被摆设为实行保存所述备案声纹特性。
62.动作一个可选的实行例所述声纹特性决定模型包括音频特性提取搜集、语音疏通检测搜集和声纹特性提取搜集所述声纹特性决定模块包括:
63.音频特性提取单元被摆设为执即将所述待辨别音频信息输出到所述音频特性提取搜集中闭于所述待辨别音频信息进行特性提取赢顺利段音频特性信息;
64.语音疏通检测单元被摆设为执即将所述手段音频特性信息输出到所述语音疏通检测搜集中进行语音疏通检测赢得语音特性信息所述语音特性信息表征所述手段音频特性信息中语音疏通时段的特性信息;
65.声纹特性提取单元被摆设为执即将所述语音特性信息输出到所述声纹特性提取搜集中闭于所述语音特性信息进行声纹特性提取赢得所述待辨别声纹特性。
66.动作一个可选的实行例所述音频特性提取搜集包括预处置层、频域特性提取层、滤波层和手段音频获得层所述音频特性提取单元包括:
67.预处置单元被摆设为实行在所述预处置层中闭于所述待辨别音频信息进行预处置赢得音频帧信息;
68.频域特性提取单元被摆设为实行在所述频域特性提取层中闭于所述音频帧信息进行短时傅里叶变幻赢得频域特性信息;
69.滤波单元被摆设为实行在所述滤波层中闭于所述频域特性信息进行梅尔滤波赢得初始音频特性信息;
70.手段音频获得单元被摆设为实行在所述手段音频获得层中闭于所述初始音频特性信息进行失踪余弦变幻赢得所述手段音频特性信息。
71.动作一个可选的实行例所述手段音频特性信息有多个所述语音疏通检测单元包括:
72.语音疏通端点决定单元被摆设为实行在所述语音疏通检测搜集中决定每个手段音频特性信息中的语音疏通开始和语音疏通尽头;
73.语音特性信息决定单元被摆设为执即将每个手段音频特性信息中相邻的一组语音疏通开始和语音疏通尽头间的音频特性数据动作所述语音特性信息。
74.动作一个可选的实行例所述语音特性信息有多个所述声纹特性提取搜集包括多个声纹特性提取层所述声纹特性提取单元包括:
75.输出特性决定单元被摆设为实行依据所述多个声纹特性提取层中每个声纹特性提取层的预设参数和所述语音特性信息决定每个声纹特性提取层的输出特性信息;
76.线性整流单元被摆设为实行在在所述多个声纹特性提取层中闭于所述输出特性信息进行线性整流赢得初始声纹特性;
77.特性归一化单元被摆设为实行在所述多个声纹特性提取层中闭于所述初始声纹特性进行归一化处置赢得待辨别声纹特性。
78.动作一个可选的实行例所述安装还包括:
79.第一标注信息获得模块被摆设为实行获得样品音频信息和所述样品音频信息闭于
应的身份标注信息;
80.猜测声纹特性获得模块被摆设为执即将所述样品音频信息输出到待熟习声纹特性决定模型闭于所述样品音频信息进行声纹特性提取赢得猜测声纹特性;
81.猜测身份标记获得模块被摆设为执即将所述猜测声纹特性输出到返回分类搜集中闭于所述猜测声纹特性进行分类赢得所述猜测声纹特性的猜测身份标记信息;
82.声纹辨别缺点决定模块被摆设为实行依据所述猜测身份标记信息和所述身份标注信息决定声纹辨别缺点;
83.第一模型熟习模块被摆设为实行基于所述声纹辨别缺点闭于所述待熟习声纹特性决定模型进行熟习赢得所述声纹特性决定模型。
84.动作一个可选的实行例所述安装还包括:
85.信息获得模块被摆设为实行获得多个备案音频信息和多个样品音频信息;
86.参照声纹特性获得模块被摆设为执即将所述多个备案音频信息输出所述声纹特性决定模型赢得多个参照声纹特性;
87.样品声纹特性获得模块被摆设为执即将所述多个样品音频信息输出所述声纹特性决定模型食饼筒上网导航网址被摆设为执即将所述多个样品音频信息输出所述声纹特性决定模型赢得多个样品声纹特性;
88.第二标注信息获得模块被摆设为实行基于所述多个参照声纹特性和所述多个样品声纹特性天生多组声纹熟习数据和每组声纹熟习数据的配合标注信息;
89.猜测声纹配合值获得模块被摆设为执即将所述多组声纹熟习数据输出到待熟习声纹特性配合模型中闭于每组声纹熟习数据中的参照声纹特性信息和样品声纹特性进行配合赢得猜测声纹配合值;
90.配合缺点数据获得模块被摆设为实行依据所述猜测声纹配合值和所述配合标注信息决定配合缺点数据;
91.第二模型熟习模块被摆设为实行基于所述配合缺点数据闭于所述待熟习声纹特性配合模型进行熟习赢得所述声纹特性配合模型。
92.依据本果然实行例的第三方面供给一种电子设备所述设备包括:
93.处置器;
94.用于保存所述处置器可实行指令的保存器;
95.个中所述处置器被摆设为实行所述指令以实行如上述所述的身份辨别办法。
96.依据本果然实行例的第四方面供给一种估计机可读保存介质当所述估计机可读保存介质中的指令由电子设备的处置器实行时使得所述电子设备不妨实行如上述所述的身份辨别办法。
97.依据本果然实行例的第四方面供给一种估计机步调产品包括估计机步调所述估计机步调被处置器实行时实行上述所述的身份辨别办法。
98.本果然的实行例供给的本领筹备起码戴来以下有益效验:
99.在闭于疑惑音视频信息检测时不妨从疑惑音视频信息中获得待辨别音频信息将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待视频音频信息中发声闭于象的声纹特性。将待视频音频信息中发声闭于象的声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合将获得到的备案声纹特性闭于应的发声闭于象的身份信息动作待辨别音频信息中发声闭于象的身份辨别截止。该办法不妨基于声纹特性决定
模型和声纹特性配合模型决定待辨别音频信息中发声闭于象的身份信息普及身份辨其他效力和精确性并缩小人力成本。
100.该当领会的是以上的普遍刻画和后文的细节刻画仅是示例性妥协释性的并不行节制本果然。
附图证明
101.此处的附图被并入证明书籍中并产生本证明书籍的一局部示出了符合本果然的实行例并与证明书籍一开用于解释本果然的本理并不产生闭于本果然的不当规定。
102.图1是依据一示例性实行例示出的一种身份辨别办法的运用处景表示图。
103.图2是依据一示例性实行例示出的一种身份辨别办法的过程图。
104.图3是依据一示例性实行例示出的一种身份辨别办法在声纹特性决定模型中进行声纹特性提取的过程图。
105.图4是依据一示例性实行例示出的一种身份辨别办法在音频特性提取搜集中进行音频特性提取的的过程图。
106.图5是依据一示例性实行例示出的一种身份辨别办法中提取待辨别声纹特性的过程图。
107.图6是依据一示例性实行例示出的一种身份辨别办法中声纹特性提取搜集的构造表示图。
108.图7是依据一示例性实行例示出的一种身份辨别办法备案声纹特性的获得办法。
109.图8是依据一示例性实行例示出的一种身份辨别办法在声纹特性配合模型中闭于待辨别声纹特性和备案声纹特性进行配合的过程图。
110.图9是依据一示例性实行例示出的一种身份辨别办法中熟习声纹特性决定模型的过程图。
111.图10是依据一示例性实行例示出的一种身份辨别办法中熟习声纹特性配合模型的过程图。
112.图11是依据一示例性实行例示出的一种身份辨别安装的框图。
113.图12是依据一示例性实行例示出的一种效劳器侧电子设备的框图。
简直实行办法
114.为了使本范围普遍人员更好地领会本果然的本领筹备底下将共同附图闭于本果然实行例中的本领筹备进行领会、完备地刻画。
115.须要证明的是本果然的证明书籍和权利乞求书籍及上述附图中的术语“第一”、“第二”等是用于辨别好像的闭于象而不必用于刻画特定的程序大概先后步骤。该当领会如许运用的数据在符合情景下不妨调换以便此地刻画的本果然的实行例不妨以除了在此地图示大概刻画的那些之外的程序实行。以下示例性实行例中所刻画的实行办法并不代表与本果然相普遍的十脚实行办法。差异它们仅是与如所附权利乞求书籍中所胪陈的、本果然的一些方面相普遍的安装和办法的例子。
116.图1是依据一示例性实行例示出的一种身份辨别办法的运用处景表示图运用处景包括效劳器110和用户端120。效劳器110预先将备案音频信息输出到声纹特性决定模型
中进行声纹特性提取赢得备案声纹特性。用户端120发布音频信息大概者视频信息效劳器110获得音频信息大概者从视频信息中提取音频信息动作待辨别音频信息。效劳器110将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性。效劳器110待辨别声纹特性和备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得待辨别音频信息中发声闭于象的身份辨别截止。
117.在本果然实行例中效劳器110不妨包括一个独力运行的效劳器大概者分别式效劳器大概者由多个效劳器构成的效劳器集群。效劳器110不妨包括有搜集通讯单元、处置器和保存器等等。简直的效劳器110不妨基于声纹特性决定模型和声纹特性配合模型决定待辨别音频信息中发声闭于象的身份信息。
118.在本果然实行例中用户端120包括智能手机、台式电脑、枯燥电脑、笔记本电脑、数字帮理、智能可穿着设备等典型的实体设备也不妨包括运行于实体设备中的软体比方运用步调等。本请求实行例中实体设备上运行的安排体系不妨包括然而不限于安卓体系、ios体系、linux、unix、windows等。用户端120基于api(application programming interface运用步调接口)将音频信息大概视频信息发送给效劳器110。
119.图2是依据一示例性实行例示出的一种身份辨别办法的过程图如图2所示该办法用于效劳器中包括以下办法。
120.s210.获得待辨别音频信息;
121.动作一个可选的实行例待辨别音频信息可认为用户端发布的音频信息大概效劳器从用户端发布的视频信息中提取的音频信息。
122.s220.将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性;
123.动作一个可选的实行例请参睹图3声纹特性决定模型包括音频特性提取搜集、语音疏通检测搜集和声纹特性提取搜集将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性包括:
124.s310.将待辨别音频信息输出到音频特性提取搜集中闭于待辨别音频信息进行特性提取赢顺利段音频特性信息;
125.s320.将手段音频特性信息输出到语音疏通检测搜集中进行语音疏通检测赢得语音特性信息语音特性信息表征手段音频特性信息中语音疏通时段的特性信息;
126.s330.将语音特性信息输出到声纹特性提取搜集中闭于语音特性信息进行声纹特性提取赢得待辨别声纹特性。
127.动作一个可选的实行例音频特性提取搜集用于将时域中的待辨别音频信息变换成为频域中的手段音频特性信息。手段音频特性信息可认为梅尔频率倒谱系数((mel frequency cepstrum coefficientmfcc)特性信息。梅尔频率倒谱系数为在梅尔标度频率域提取出来的倒谱参数梅尔标度频域刻画了人耳频率的非线性个性。
128.语音疏通检测搜集(voice activity detectionvad)用于将手段音频特性信息中发声闭于象未作声时的静音时段的特性信息去除保持发声闭于象作声时语音疏通时段的特性信息。vad不妨检测语音疏通的端点从而辨别语音疏通时段的特性信息和静音时段的特性信息。
129.声纹特性提取搜集用于闭于语音特性信息进行声纹特性提取输出待辨别声纹特
征。声纹特性提取搜集可认为扩充的时延神经搜集(extend time delay neural networke

tdnn)。在e

tdnn中输出多帧语音帧特性信息。
130.基于声纹特性决定模型闭于待辨别音频信息进行特性提取赢得待辨别声纹特性不妨普及特性提取的处置速度并缩小特性提取的缺点率。
131.动作一个可选的实行例请参睹图4音频特性提取搜集包括预处置层、频域特性提取层、滤波层和手段音频获得层将待辨别音频信息输出到音频特性提取搜集中闭于待辨别音频信息进行特性提取赢顺利段音频特性信息包括:
132.s410.在预处置层中闭于待辨别音频信息进行预处置赢得音频帧信息;
133.s420.在频域特性提取层中闭于音频帧信息进行短时傅里叶变幻赢得频域特性信息;
134.s430.在滤波层中闭于频域特性信息进行梅尔滤波赢得初始音频特性信息;
135.s440.在手段音频获得层中闭于初始音频特性信息进行失踪余弦变幻赢顺利段音频特性信息。
136.动作一个可选的实行例在预处置层中闭于待辨别音频信息进行预加沉和分帧加窗处置赢得预处置后音频信息。闭于待辨别音频信息进行预加沉处置不妨是将待辨别音频信息经过一个高通滤波器提高待辨别音频信息中的高频局部。在闭于待辨别音频信息进行预加沉处置后闭于预加沉处置后的待辨别音频信息进行分帧加窗处置赢得音频帧信息。动作一个可选的实行例不妨采用汉明窗来进行加窗处置。
137.在特性提取层中闭于音频帧信息进行短时傅里叶变幻(short

time fourier transformstft)赢得音频帧信息的频域特性信息并取频域特性信息绝闭于值的平方。将频域特性信息绝闭于值的平方动作初始音频特性信息输出到滤波层中。
138.在滤波层不妨用梅尔滤波器组进行滤波。梅尔滤波器组不妨是梅尔尺度的三角戴通滤波器组梅尔尺度的三角戴通滤波器组是预设个数的三角滤波器设预设个数为m每个三角滤波器的核心频率为f(m)m=1、2、
……
、m。各核心频率之间的隔绝跟着m值的减小而缩小跟着m值的增大而增宽。依据梅尔尺度的三角戴通滤波器组闭于初始音频特性信息进行滤波赢得滤波后音频特性信息。
139.在手段音频获得层中滤波后音频特性信息为声戴共意的频谱信息和输出饱励的频谱信息的卷积估计滤波后音频特性信息的闭于数能量不妨将声戴共意的频谱信息和输出饱励的频谱信息变幻为声戴共意的频谱信息和输出饱励的频谱信息的和值。将闭于数能量进行失踪余弦变幻(discrete cosine transformdct)后赢顺利段音频特性信息使顺利段音频特性信息中矮频局部的包络为声戴共意的特性信息高频局部为输出饱励的特性信息。
140.基于音频特性提取搜集赢得mfcc特性信息不妨更好地表露待辨别语音信息中的声音旗号。
141.动作一个可选的实行例手段音频特性信息有多个将手段音频特性信息输出到所述语音疏通检测搜集中进行语音疏通检测赢得语音特性信息包括:
142.在语音疏通检测搜集中决定每个手段音频特性信息中的语音疏通开始和语音疏通尽头。
143.将每个手段音频特性信息中相邻的一组语音疏通开始和语音疏通尽头间的音频
特性数据动作语音特性信息。
144.动作一个可选的实行例在获顺利段音频特性信息时闭于待辨别音频信息进行了分帧比方分为10ms一帧的音频帧信息则赢得的手段音频特性信息与音频帧信息闭于应因此手段音频特性信息有多个。估计每个手段音频特性信息中各个时时的音频特性数据闭于应的语音能量依据树立的语音能量阈值决定姑且时时是否为语音疏通开始大概语音疏通尽头。若姑且时时的前偶尔时的音频特性数据闭于应的语音能量小于语音能量阈值且姑且时时的音频特性数据闭于应的语音能量大于语音能量阈值则决定姑且时时往日为静音时段姑且时时此后为语音疏通时段则姑且时时为语音疏通开始。若姑且时时的前偶尔时的音频特性数据闭于应的语音能量大于语音能量阈值且姑且时时的音频特性数据闭于应的语音能量小于语音能量阈值则决定姑且时时此后为静音时段姑且时时往日为语音疏通时段则姑且时时为语音疏通尽头。
145.依据语音疏通开始和语音疏通尽头赢得每个手段音频特性信息中相邻的一组语音疏通开始和语音疏通尽头间的音频特性数据将该音频特性数据动作语音特性信息。比方一个10ms的音频帧信息闭于应的手段音频特性信息中前4ms的音频特性数据闭于应的语音能量小于语音能量阈值后6ms的音频特性数据闭于应的语音能量大于语音能量阈值则语音疏通开始为第4ms语音疏通尽头为第10ms后6ms的音频特性数据为语音特性信息。
146.在树立语音能量阈值时不妨先估计手段音频特性信息中的乐音能量基于乐音能量树立语音能量阈值。
147.基于语音疏通检测不妨简略静音时段的特性信息仅保持语音特性信息进行后续的估计不妨缩小输出到后续搜集中的特性缩小估计的搀杂度。
148.动作一个可选的实行例请参睹图5语音特性信息有多个声纹特性提取搜集包括多个顺序陈设的声纹特性提取层将语音特性信息输出到声纹特性提取搜集中闭于语音特性信息进行声纹特性提取赢得待辨别声纹特性包括:
149.s510.依据多个声纹特性提取层中每个声纹特性提取层的预设参数和语音特性信息决定每个声纹特性提取层的输出特性信息;
150.s520.在多个声纹特性提取层中闭于输出特性信息进行线性整流赢得初始声纹特性;
151.s530.在多个声纹特性提取层中闭于初始声纹特性进行归一化处置赢得待辨别声纹特性。
152.动作一个可选的实行例声纹特性提取搜集可认为具备多个声纹特性提取层的e

tdnn搜集。多个声纹特性提取层中的第一个声纹特性提取层的输出特性信息不妨从语音特性信息中决定其他声纹特性提取层的输出特性信息不妨从每个声纹特性提取层的上一声纹特性提取层输出的信息中决定。在每个声纹特性提取层中将线性整流单元(rectified linear unitrelu)动作激活函数闭于输出特性信息进行线性整流赢得初始声纹特性并闭于线性整流后的语音特性信息进行批量归一化(batchnorm)处置赢得每层闭于应的声纹特性将结果一层的声纹特性动作待辨别声纹特性。声纹特性提取层可认为七个。声纹特性提取层的预设参数为输出到声纹特性提取层的特性的时延参数。如图6所示第一层声纹特性提取层的预设参数为(t

2t

1tt+1t+2)映照到输出端的激活函数的权值个数为512。第二层声纹特性提取层的预设参数为(t

4t

2tt+2t+4)映照到输出端的激活函数的
权值个数为512。第三层声纹特性提取层的预设参数为(t

3tt+3)第四层声纹特性提取层的预设参数为(t

4tt+4)映照到输出端的激活函数的权值个数为512。第五层声纹特性提取层到第七层声纹特性提取层的预设参数均为(t)第五层声纹特性提取层映照到输出端的激活函数的权值个数为512第六层声纹特性提取层映照到输出端的激活函数的权值个数为1500第七层声纹特性提取层映照到输出端的激活函数的权值个数为512。比方第一层声纹特性提取层的预设参数为(t

2t

1tt+1t+2)t展现姑且输出的语音特性信息t

2展现该语音特性信息左移二帧的语音特性信息t+2展现该语音特性信息右移二帧的语音特性信息t

1展现该语音特性信息左移一帧的语音特性信息t+1展现该语音特性信息右移一帧的语音特性信息将这五个语音特性信息动作第一声纹特性提取层中的输出特性信息。
153.基于e

tdnn搜集闭于语音特性信息进行声纹特性提取不妨普及处置速度并缩小缺点率。
154.s230.将待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得待辨别音频信息中发声闭于象的身份辨别截止。
155.动作一个可选的实行例请参睹图7该办法还包括:
156.s710.获得备案音频信息;
157.s720.将备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得备案声纹特性;
158.s730.保存备案声纹特性。
159.动作一个可选的实行例备案音频信息中的发声闭于象身份信息已知。将备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得备案声纹特性该备案声纹特性为已知的发声闭于象身份信息的声纹特性。比方将谈话人甲的音频信息动作备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得甲的备案声纹特性。某一待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得的待辨别声纹特性在声纹特性配合模型中若该待辨别声纹特性和甲的备案声纹特性配合则不妨决定该待辨别音频信息中的谈话人的身份是甲。
160.基于声纹特性决定模型闭于备案音频信息进行声纹特性提取不妨经过预保存备案声纹特性的办法减少已知发声闭于象从而普及身份辨其他弥漫率。
161.动作一个可选的实行例请参睹图8声纹特性配合模型包括降维层、归一化处置层、特性配合层、手段声纹决定层和辨别截止获得层将待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得待辨别音频信息中发声闭于象的身份辨别截止包括:
162.s810.在降维层中闭于待辨别声纹特性进行降维赢得降维特性数据;
163.s820.在归一化处置层中闭于降维特性数据进行归一化处置赢得归一化特性数据;
164.s830.在特性配合层中闭于归一化特性数据和备案声纹特性进行配合赢得声纹配合值所述声纹配合值表征归一化特性数据和备案声纹特性间的配合程度;
165.s840.在手段声纹决定层中依据声纹配合值决定与归一化特性数据闭于应的手段备案声纹特性;
166.s850.在辨别截止获得层中依据手段备案声纹特性闭于应的身份信息决定待辨别音频信息中发声闭于象的身份辨别截止。
167.动作一个可选的实行例在降维层中不妨运用线性辨别领会(linear discriminant analysislda)的办法闭于待辨别声纹特性进行降维赢得降维特性数据。在归一化处置层中闭于降维特性数据进步行均值归一化(mean norm)再进行长度归一化(length norm)将长度不共的降维特性数据普遍为普遍长度赢得归一化特性数据。特性配合层不妨运用概率线性辨别领会(probabilistic linear discriminant analysis,plda)闭于归一化特性数据和备案声纹特性间的好像度进行评分赢得声纹配合值声纹配合值表征归一化特性数据和备案声纹特性间的配合程度。依据声纹配合值决定与归一化特性数据最佳像的备案声纹特性将与归一化特性数据最佳像的备案声纹特性动作手段备案声纹特性。将手段备案声纹特性闭于应的身份信息决定为待辨别音频信息中发声闭于象的身份信息。
168.动作一个可选的实行例将待辨别音频信息a输出到声纹特性决定模型中进行声纹特性提取赢得的待辨别声纹特性a1在声纹特性配合模型中若该待辨别声纹特性a和备案声纹特性b1的好像度评分最高则将备案声纹特性b1动作手段备案声纹特性。若备案声纹特性b1闭于应的身份信息为谈话人b则待辨别音频信息a中发声闭于象的身份信息为谈话人b。
169.基于声纹特性配合模型闭于待辨别声纹特性和备案声纹特性进行配合决定待辨别音频信息中发声闭于象的身份信息不妨普及身份辨其他精确率。
170.动作一个可选的实行例请参睹图9如图9所示为闭于声纹特性决定模型进行熟习的办法该办法包括:
171.s910.获得样品音频信息和样品音频信息闭于应的身份标注信息;
172.s920.将样品音频信息输出到待熟习声纹特性决定模型闭于样品音频信息进行声纹特性提取赢得猜测声纹特性;
173.s930.将猜测声纹特性输出到返回分类搜集中闭于猜测声纹特性进行分类赢得猜测声纹特性的猜测身份标记信息;
174.s940.依据猜测身份标记信息和身份标注信息决定声纹辨别缺点;
175.s950.基于声纹辨别缺点闭于待熟习声纹特性决定模型进行熟习赢得声纹特性决定模型。
176.动作一个可选的实行例声纹特性决定模型的熟习办法为有监视的熟习办法获得样品音频信息和样品音频信息闭于应的身份标注信息将样品音频信息输出到待熟习声纹特性决定模型闭于样品音频信息进行声纹特性提取赢得猜测声纹特性。将猜测声纹特性输出到返回分类搜集(softmax)中将猜测声纹特性映照到[01]的区间上决定猜测身份标记信息猜测身份标记信息为0到1间的一个实数。身份标注信息不妨展现为1则不妨依据猜测身份标记信息和身份标注信息间的差值估计声纹辨别缺点声纹辨别缺点可认为穿插熵破坏函数。基于穿插熵破坏函数闭于待熟习声纹特性决定模型进行熟习使得猜测身份标记信息逼近身份标注信息当穿插熵破坏函数达到预期熟习效验时赢得声纹特性决定模型。
[0177]
在熟习声纹特性决定模型时减少返回分类搜集以决定猜测声纹特性的猜测身
份标记信息不妨依据猜测身份标记信息和身份标注信息决定声纹辨别缺点从而闭于声纹特性决定模型进行熟习普及了闭于声纹特性决定模型进行熟习的精确性和效力。
[0178]
动作一个可选的实行例如图10所示为闭于声纹特性配合模型进行熟习的办法该办法包括:
[0179]
s1010.获得多个备案音频信息和多个样品音频信息;
[0180]
s1020.将多个备案音频信息输作声纹特性决定模型赢得多个参照声纹特性;
[0181]
s1030.将多个样品音频信息输作声纹特性决定模型赢得多个样品声纹特性;
[0182]
s1040.基于多个参照声纹特性和多个样品声纹特性天生多组声纹熟习数据和每组声纹熟习数据的配合标注信息;
[0183]
s1050.将多组声纹熟习数据输出到待熟习声纹特性配合模型中闭于每组声纹熟习数据中的参照声纹特性信息和样品声纹特性进行配合赢得猜测声纹配合值;
[0184]
s1060.依据猜测声纹配合值和配合标注信息决定配合缺点数据;
[0185]
s1070.基于配合缺点数据闭于待熟习声纹特性配合模型进行熟习赢得声纹特性配合模型。
[0186]
动作一个可选的实行例获得多个备案音频信息和多个样品音频信息将多个备案音频信息输出到已经熟习好的声纹特性决定模型中赢得多个参照声纹特性并将多个样品音频信息输出到已经熟习好的声纹特性决定模型中赢得多个样品声纹特性。依据备案音频信息和样品音频信息中已知的发声闭于象的身份信息决定与参照声纹特性闭于应的样品声纹特性将参照声纹特性和闭于应的样品声纹特性动作一组声纹熟习数据并决定该组声纹熟习数据的配合标注信息配合标注信息为展现参照声纹特性和样品声纹特性实脚配合的标注信息。
[0187]
将多组声纹熟习数据输出到待熟习声纹特性配合模型中闭于每组声纹熟习数据中的参照声纹特性信息和样品声纹特性进行好像度分值的估计赢得猜测声纹配合值。依据猜测声纹配合值和配合标注信息间的差值决定配合缺点数据。基于配合缺点数据闭于待熟习声纹特性配合模型进行熟习使得猜测声纹配合值逼近配合标注信息当配合缺点数据达到预期熟习效验时赢得声纹特性配合模型。
[0188]
在熟习声纹特性配合模型时运用已熟习好的声纹特性决定模型获得配合标注信息从而依据待熟习声纹特性配合模型输出的猜测声纹配合值和配合标注信息决定配合缺点数据从而闭于声纹特性配合模型进行熟习普及了闭于声纹特性配合模型进行熟习的精确性和效力。
[0189]
动作一个可选的实行例该办法不妨运用在闭于疑惑音视频信息进行检测上。效劳器获得多个已知发声闭于象的备案音频信息效劳器将备案音频信息输出到声纹特性决定模型中赢得备案声纹特性效劳器保存备案声纹特性每个备案声纹特性与一个发声闭于象的身份信息配合。用户端向视频平台大概短视频平台上传用户发布信息后在平台考查阶段效劳器不妨获得用户发布信息中的待辨别音频信息用户发布信息可认为视频信息大概音频信息当为视频信息时效劳器须要从视频信息中提取待辨别音频信息当为音频信息时效劳器不妨直接将用户发布信息动作待辨别音频信息。
[0190]
效劳器将待辨别音频信息输出到声纹特性决定模型中经过声纹特性决定模型中的音频特性提取搜集、语音疏通检测搜集和声纹特性提取搜集从声纹特性提取搜集中输
出待辨别声纹特性。效劳器将待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中闭于待辨别声纹特性和备案声纹特性间的好像度进行评分输作声纹配合值。获得声纹配合值中的最大值将最大值闭于应的备案声纹特性动作手段备案声纹特性。将与手段备案声纹特性配合的发声闭于象的身份信息动作待辨别音频信息中发声闭于象的身份辨别截止。
[0191]
效劳器依据身份辨别截止决定待辨别音频信息中发声闭于象是否为正当闭于象若该发声闭于象不为正当闭于象则该用户发布信息不行经过平台考查。
[0192]
效劳器也不妨自动在视频平台大概短视频平台上闭于疑惑音视频信息进行寻找当效劳器基于声纹特性决定模型和声纹特性配合模型决定某个视频信息大概音频信息中的发声闭于象不为正当闭于象时简略该视频信息大概音频信息。
[0193]
本果然实行例供给了一种身份辨别办法该办法包括:在闭于疑惑音视频信息检测时不妨从疑惑音视频信息中获得待辨别音频信息将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待视频音频信息中发声闭于象的声纹特性。将待视频音频信息中发声闭于象的声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合将获得到的备案声纹特性闭于应的发声闭于象的身份信息动作待辨别音频信息中发声闭于象的身份辨别截止。该办法不妨基于声纹特性决定模型和声纹特性配合模型决定待辨别音频信息中发声闭于象的身份信息普及身份辨其他效力和精确性并缩小人力成本。
[0194]
图11是依据一示例性实行例示出的一种身份辨别安装框图。该安装包括:
[0195]
音频信息获得模块1110被摆设为实行获得待辨别音频信息;
[0196]
声纹特性决定模块1120被摆设为执即将待辨别音频信息输出到声纹特性决定模型中进行声纹特性提取赢得待辨别声纹特性;
[0197]
声纹特性配合模块1130被摆设为执即将待辨别声纹特性和预保存的备案声纹特性输出到声纹特性配合模型中进行声纹特性配合赢得待辨别音频信息中发声闭于象的身份辨别截止。
[0198]
动作一个可选的实行例声纹特性配合模型1130包括降维层、归一化处置层、特性配合层、手段声纹决定层和辨别截止获得层声纹特性配合模块包括:
[0199]
降维单元被摆设为实行在降维层中闭于待辨别声纹特性进行降维赢得降维特性数据;
[0200]
归一化处置单元被摆设为实行在归一化处置层中闭于降维特性数据进行归一化处置赢得归一化特性数据;
[0201]
特性配合单元被摆设为实行在特性配合层中闭于归一化特性数据和备案声纹特性进行配合赢得声纹配合值声纹配合值表征归一化特性数据和备案声纹特性间的配合程度;
[0202]
手段声纹决定单元被摆设为实行在手段声纹决定层中依据声纹配合值决定与归一化特性数据闭于应的手段备案声纹特性;
[0203]
辨别截止获得单元被摆设为实行在辨别截止获得层中依据手段备案声纹特性闭于应的身份信息决定待辨别音频信息中发声闭于象的身份辨别截止。
[0204]
动作一个可选的实行例该安装还包括:
[0205]
备案音频获得模块被摆设为实行获得备案音频信息;
[0206]
备案音频特性提取模块被摆设为执即将备案音频信息输出到声纹特性决定模型中进行声纹特性提取赢得备案声纹特性;
[0207]
备案声纹特性保存模块被摆设为实行保存备案声纹特性。
[0208]
动作一个可选的实行例声纹特性决定模型1120包括音频特性提取搜集、语音疏通检测搜集和声纹特性提取搜集声纹特性决定模块包括:
[0209]
音频特性提取单元被摆设为执即将待辨别音频信息输出到音频特性提取搜集中闭于待辨别音频信息进行特性提取赢顺利段音频特性信息;
[0210]
语音疏通检测单元被摆设为执即将手段音频特性信息输出到语音疏通检测搜集中进行语音疏通检测赢得语音特性信息语音特性信息表征手段音频特性信息中语音疏通时段的特性信息;
[0211]
声纹特性提取单元被摆设为执即将语音特性信息输出到声纹特性提取搜集中闭于语音特性信息进行声纹特性提取赢得待辨别声纹特性。
[0212]
动作一个可选的实行例音频特性提取搜集包括预处置层、频域特性提取层、滤波层和手段音频获得层音频特性提取单元包括:
[0213]
预处置单元被摆设为实行在预处置层中闭于待辨别音频信息进行预处置赢得音频帧信息;
[0214]
频域特性提取单元被摆设为实行在频域特性提取层中闭于音频帧信息进行短时傅里叶变幻赢得频域特性信息;
[0215]
滤波单元被摆设为实行在滤波层中闭于频域特性信息进行梅尔滤波赢得初始音频特性信息;
[0216]
手段音频获得单元被摆设为实行在手段音频获得层中闭于初始音频特性信息进行失踪余弦变幻赢顺利段音频特性信息。
[0217]
动作一个可选的实行例手段音频特性信息有多个语音疏通检测单元包括:
[0218]
语音疏通端点决定单元被摆设为实行在语音疏通检测搜集中决定每个手段音频特性信息中的语音疏通开始和语音疏通尽头;
[0219]
语音特性信息决定单元被摆设为执即将每个手段音频特性信息中相邻的一组语音疏通开始和语音疏通尽头间的音频特性数据动作语音特性信息。
[0220]
动作一个可选的实行例语音特性信息有多个声纹特性提取搜集包括多个声纹特性提取层声纹特性提取单元包括:
[0221]
输出特性决定单元被摆设为实行依据多个声纹特性提取层中每个声纹特性提取层的预设参数和语音特性信息决定每个声纹特性提取层的输出特性信息;
[0222]
线性整流单元被摆设为实行在在多个声纹特性提取层中闭于输出特性信息进行线性整流赢得初始声纹特性;
[0223]
特性归一化单元被摆设为实行在多个声纹特性提取层中闭于初始声纹特性进行归一化处置赢得待辨别声纹特性。
[0224]
动作一个可选的实行例安装还包括:
[0225]
第一标注信息获得模块被摆设为实行获得样品音频信息和样品音频信息闭于应的身份标注信息;
[0226]
猜测声纹特性获得模块被摆设为执即将样品音频信息输出到待熟习声纹特性确
定模型闭于样品音频信息进行声纹特性提取赢得猜测声纹特性;
[0227]
猜测身份标记获得模块被摆设为执即将猜测声纹特性输出到返回分类搜集中闭于猜测声纹特性进行分类赢得猜测声纹特性的猜测身份标记信息;
[0228]
声纹辨别缺点决定模块被摆设为实行依据猜测身份标记信息和身份标注信息决定声纹辨别缺点;
[0229]
第一模型熟习模块被摆设为实行基于声纹辨别缺点闭于待熟习声纹特性决定模型进行熟习赢得声纹特性决定模型。
[0230]
动作一个可选的实行例安装还包括:
[0231]
信息获得模块被摆设为实行获得多个备案音频信息和多个样品音频信息;
[0232]
参照声纹特性获得模块被摆设为执即将多个备案音频信息输作声纹特性决定模型赢得多个参照声纹特性;
[0233]
样品声纹特性获得模块被摆设为执即将多个样品音频信息输作声纹特性决定模型赢得多个样品声纹特性;
[0234]
第二标注信息获得模块被摆设为实行基于多个参照声纹特性和多个样品声纹特性天生多组声纹熟习数据和每组声纹熟习数据的配合标注信息;
[0235]
猜测声纹配合值获得模块被摆设为执即将多组声纹熟习数据输出到待熟习声纹特性配合模型中闭于每组声纹熟习数据中的参照声纹特性信息和样品声纹特性进行配合赢得猜测声纹配合值;
[0236]
配合缺点数据获得模块被摆设为实行依据猜测声纹配合值和配合标注信息决定配合缺点数据;
[0237]
第二模型熟习模块被摆设为实行基于配合缺点数据闭于待熟习声纹特性配合模型进行熟习赢得声纹特性配合模型。
[0238]
闭于上述实行例中的安装个中各个模块实行安排的简直办法已经在有闭该办法的实行例中进行了留神刻画此处将不干留神论述证明。
[0239]
图12是依据一示例性实行例示出的一种用于效劳器的电子设备的框图该电子设备不妨是效劳器其里面构造图不妨如图12所示。该电子设备包括经过体系总线对接的处置器、保存器和搜集接口。个中该电子设备的处置器用于供给估计和控制本领。该电子设备的保存器包括非易失性保存介质、内保存器。该非易失性保存介质保存有安排体系和估计机步调。该内保存器为非易失性保存介质中的安排体系和估计机步调的运行供给情况。该电子设备的搜集接口用于与外部的结尾经过搜集对接通讯。该估计机步调被处置器实行时以实行一种身份辨别办法。
[0240]
本范围本领人员不妨领会图12中示出的构造只是是与本果然筹备相闭的局部构造的框图并不产生闭于本果然筹备所运用于其上的电子设备的规定简直的电子设备不妨包括比图中所示更多大概更少的零件大概者拉拢某些零件大概者具备不共的零件安置。
[0241]
在示例性实行例中还供给了一种电子设备包括:处置器;用于保存该处置器可实行指令的保存器;个中该处置器被摆设为实行该指令以实行如本果然实行例中一种身份辨别办法。
[0242]
在示例性实行例中还供给了一种估计机可读保存介质当该保存介质中的指令由电子设备的处置器实行时使得电子设备不妨实行本果然实行例中一种身份辨别办法。
[0243]
在示例性实行例中还供给了一种包括指令的估计机步调产品当其在估计机上运行时使得估计机实行本果然实行例中的一种身份辨别办法。
[0244]
本范围普遍本领人员不妨领会实行上述实行例办法中的理想大概局部过程是不妨经过估计机步调来指令相闭的硬件来完成该估计机步调可保存于一非易失性估计机可读取保存介质中该估计机步调在实行时可包括如上述各办法的实行例的过程。个中本请求所供给的各实行例中所运用的闭于保存器、保存、数据库大概其他介质的所有引用均可包括非易失性和/大概易失性保存器。非易失性保存器可包括只读保存器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可揩除可编程rom(eeprom)大概闪存。易失性保存器可包括随机存取保存器(ram)大概者外部高速缓冲保存器。动作证明而非限制ram以多种办法可得诸如固态ram(sram)、理想ram(dram)、共步dram(sdram)、双数据率sdram(ddrsdram)、巩固型sdram(esdram)、共步链路(synchlink)dram(sldram)、保存器总线(rambus)直接ram(rdram)、直接保存器总线理想ram(drdram)、以及保存器总线理想ram(rdram)等。
[0245]
本范围本领人员在计划证明书籍及试验此地果然的创造后将容易料到本果然的其他实行筹备。本请求旨在涵盖本果然的所有变型、用途大概者符合性变革这些变型、用途大概者符合性变革按照本果然的普遍性本理并包括本果然未果然的本本领范围中的公知知识大概习用本领本领。证明书籍和实行例仅被视为示例性的本果然的简直范畴和精力由底下的权利乞求指出。
[0246]
该当领会的是本果然并不限制于上头已经刻画并在附图中示出的透彻构造而且不妨在不摆脱其范畴进行百般建改和变化。本果然的范畴仅由所附的权利乞求来节制。

患者身份识别的2种方法

至少使用几种患者身份识别方法

患者身份识别有几种方法

正确识别患者身份流程表

患者身份识别流程图

患者身份识别制度及流程

TAG标签: 特性 声纹 信息 音频


文章转载请注明出处:http://www.rcfle.cn/zuixinkeji-184/136841.html


上一篇:
下一篇:

相关资讯