CN1222925C - 降噪方法和系统 - Google Patents
降噪方法和系统 Download PDFInfo
- Publication number
- CN1222925C CN1222925C CNB031221491A CN03122149A CN1222925C CN 1222925 C CN1222925 C CN 1222925C CN B031221491 A CNB031221491 A CN B031221491A CN 03122149 A CN03122149 A CN 03122149A CN 1222925 C CN1222925 C CN 1222925C
- Authority
- CN
- China
- Prior art keywords
- noise
- weighting coefficient
- virtual
- error
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 title claims description 25
- 238000002945 steepest descent method Methods 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims 1
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Abstract
公开了一种降噪系统,包括:语音分离器,用于接收环境噪声以便产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和加权系数产生器,用于使用误差和虚拟噪声来更新加权系数使得降低误差。在这里,加权系数产生器利用最陡下降法实时更新加权系数以使将误差均方值最小化。
Description
技术领域
本发明涉及一种降噪方法和系统。更明确地,本发明涉及一种使用自适应算法的降噪方法。
背景技术
噪声在各个领域中引起严重的问题,并且特别地,在要求精确语音输入的情况下把噪声降至一定程度变得非常关键,目前已提出许多方法来降低语音识别领域中的污染噪声。传统降噪方法提供人工降噪,例如通过使用一个隔音墙来降低噪声。可是,上述人工降噪方法不适合于降低许多其他种类的噪声。
例如,如果混合的语音和噪声被输入到一个语音识别设备,则该设备不能识别精确的语音并且无法获得期望的结果。因此,语音识别设备在使用传统人工降噪方法降低噪声方面存在问题。
发明内容
本发明的一个优点是使用自适应系数积极地降低噪声。
在本发明的一个方面中,一种降噪系统包括:语音分离器,用于接收环境噪声以便产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和加权系数产生器,用于使用误差和虚拟噪声来更新加权系数使得降低误差。
加权系数产生器使用最陡下降法以更新加权系数,因此,误差的均方值可以是最小值。
在本发明的另一方面中,一种降噪方法包括:(a)外部地接收噪声以产生虚拟噪声;(b)通过使用加权系数滤除虚拟噪声从而产生滤波过的语音;(c)计算从外部输入的语音中去掉虚拟噪声而产生的虚拟语音和滤波过的语音之间的差值从而产生误差;和(d)使用该误差和虚拟噪声来更新加权系数。
(b)包括:使用
产生滤波过的语音,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
(d)包括:使用wl(n)+μx(n-l)e(n)更新加权系数,在此,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声而e(n)是误差。
附图说明
所结合的并且构成说明书一部分的附图,说明了本发明的一个实施例,并且和说明书一起用于解释本发明的原理:
图1示出了根据本发明优选实施例的一种降噪系统的框图;
图2示出了根据本发明优选实施例的一种降噪方法的流程图;和图3示出了根据本发明优选实施例的用于更新自适应系数的方法流程图。
具体实施方式
在下面的详细说明中,只示出并描述了简单地通过发明人实现本发明所预期的最佳方式的优选实施例。正如将被实现的,本发明能够在各个明显的方面进行修改,所有的修改都不偏离本发明。因此,附图和说明书实际上作为说明性的而非限定性的。
参考附图,根据本发明优选实施例将描述一种降噪方法和系统。
图1示出了根据本发明优选实施例的一种降噪系统的框图。
正如所示出的,降噪系统包括语音分离器10、数字滤波器20、减法器30和加权系数产生器40。
语音分离器10包括AD(模拟转换数字)转换器以把外部输入的模拟声源转换成为数字信号,并且它从该外部输入的声源中分离虚拟噪声[x(k)],并且将它存储在缓存器中。
详细地,当语音分离器10没有接收附加的语音信号来产生虚拟噪声[x(k)]时,则环境噪声通过一个外部输入端被输入到语音分离器10,并且语音分离器10对该输入噪声上进行傅里叶变换,按照最小单位频带分离之,并且把结果存储在缓存器中。
语音分离器10接收包括期望语音和噪声在内的声源时,降低来自声源中的储存在缓存器中的虚拟噪声[x(k)]以产生虚拟语音[d(k)]。
数字滤波器20接收储存在语音分离器10的缓存器中的虚拟噪声[x(k)],按照由加权系数产生器40产生的加权系数[w(k)]来滤除该虚拟噪声[x(k)],然后产生滤波过的语音[y(k)],其中噪声被降低。
减法器30从语音分离器10中接收从其中降低了虚拟噪声[x(k)]的虚拟语音[d(k)],从虚拟语音[d(k)]中减掉由数字滤波器20产生的滤波过的语音[y(k)],然后得到一个误差[e(k)]。
加权系数产生器40接收虚拟噪声[x(k)]和误差[e(k)],产生加权系数[w(k)],并且向数字滤波器20提供该加权系数。
参见图2,将描述降噪方法。
图2示出了根据本发明优选实施例的一种降噪方法的流程图。
在步骤S201,语音分离器10接收没有附加语音输入的外部噪声,产生虚拟噪声[x(k)],并且将它存储在缓存器中。降噪系统接收无附加的外部语音输入以便产生虚拟噪声[x(k)]。也就是说,建立降噪系统不是接收语音,而是仅仅接收通过语音输入终端的环境噪声。
没有外部语音输入的噪声输入被付里叶变换以便分开频率和幅值。正如所描述的,经Fourier变换的噪声被分离为每个最小的单位频带,储存在缓存器中,并且经反Fourier变换以变成虚拟噪声[x(k)]。
在步骤S202,虚拟噪声[x(k)]输入到数字滤波器20,并且在步骤S203按照由加权系数产生器40产生的加权系数[w(k)]滤波。正如所描述的,通过加权系数滤波的虚拟噪声产生来成为期望的语音。
在此情况下,当每一频带分离的虚拟噪声被表示为[x(n),x(n-1),…,x(n-L+1)],并且相应的加权系数为[w0(n),w1(n),…,wL-1(n)],滤波过的语音[y(n)]被表示为式1:
式1
当利用式2中的向量组来表示每一频带分离的虚拟噪声和加权系数时,滤波过的语音[y(n)]可以如式3所示。
式2
X(n)=[x(n)x(n-1)…x(n-L+1)]T
W(n)=[w0(n)w1(n)…wL-1(n)]T
式3
y(n)=WT(n)X(n)=XT(n)W(n)
接下来,在步骤S204,通过从外部输入的声源中减掉虚拟噪声所获得的虚拟语音[d(n)]输入到减法器30,然后通过从虚拟语音[d(n)]中减去由数字滤波器产生的滤波过的语音[y(n)]所获得的一个数值被定义为一个误差[e(n)],然后输出。该误差在式4中被表达。
式4
e(n)=d(n)-y(n)=d(n)-WT(n)X(n)
在步骤S205,加权系数产生器40接收误差[e(n)]和虚拟噪声[x(n)]以便更新加权系数。在步骤S206,更新了的加权系数[W(n+1)]被数字滤波器20用来滤除虚拟噪声,并且相应地产生滤波过的语音[y((n+1)],并且通过重复上述的处理从而产生降噪语音。
现在详细描述用于产生加权系数的方法。
如上所述,加权系数产生器40需要误差和虚拟噪声用于更新加权系数。误差是在通过从输入语音中减掉虚拟噪声所产生的虚拟语音与通过数字滤波器使用加权系数滤除虚拟噪声所产生的语音(即,在本发明优选实施例中结果期望的语音)之间的一个差值。加权系数产生器40更新加权系数以最小化式5中表达的误差均方值。
式5
ξ(n)=E[e2(n)]
当以向量形式使用误差来表示式5时,获得式6。
式6
ξ(n)=E[(d(n)-XT(n)W(n))2]
=E[d2(n)]-2E[d(n)XT(n)]W(n)+WT(n)E[X(n)XT(n)]W(n)
=E[d2(n)]-2PTW(n)+WT(n)RW(n)
在此情况下,当使用最陡下降法作为一个最优化算法并且计算加权系数[W(n)]以便最小化ξ(n)时,它如式7所示。
式7
W(n+1)=W(n)+μX(n)e(n)在此μ表示一个步长。
当不使用向量形式表示式7时,它被表示成式8。
式8
w1(n+1)=w1(n)+μx(n-l)e(n)在此,l=0,1,2,…,L-1。
以下参照图3描述一种使用式8来更新加权系数的方法。
和图3示出了根据本发明优选实施例的用于更新自适应系数的方法流程图。
首先,在步骤S301,为了找到一个加权系数需要确定一个初始值。初始值包括加权系数的步长μ和初始值[w1(0)]。在步骤S302,加权系数的初始值被代入式1中以计算滤波过的语音[y(0)]。在步骤S303,计算虚拟语音[d(0)]和滤波过的语音[y(0)]之间的误差以便计算出一个误差[e(0)]。
接下来,使用在早先步骤S301中确定的误差[e(0)]、加权系数的初始值以及在步骤S304中的步长来更新加权系数[w1(1)]。使用更新的加权系数[w1(1)],重复早先的步骤S302到S304从而得到一个加权系数。
也就是说,在步骤S302通过把加权系数[w1(n)]代入式1中来计算出滤波过的语音[y(n)];在步骤S303计算出在滤波过的语音[y(n)]和虚拟语音[d(n)]之间的误差[e(n)];并且在步骤S304使用误差[e(n)]和步长来更新加权系数以便获得一个新的加权系数[w1(n+1)]。
通过如上所述地更新加权系数,则每次语音被输入时误差被降低从而降低噪声。
根据本发明,由于加权系数被实时更新,所以噪声可以相应于环境的变化实时降低。
本发明已描述目前被认为是最实用且优选的实施例,所应理解的是,本发明不局限于所公开的实施例,相反地,各种修改和等同置换均包含在本发明的精神和权利要求范围内。
Claims (12)
1、一种降噪系统,包括:
语音分离器,用于接收环境噪声以产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;
数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;
减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和
加权系数产生器,用于使用误差和虚拟噪声来更新加权系数以降低误差。
2、如权利要求1所述的系统,其中加权系数产生器更新加权系数以使误差的均方值成为最小值。
3、如权利要求2所述的系统,其中加权系数产生器使用最陡下降法以更新该加权系数从而误差的均方值成为最小值。
4、如权利要求1所述的系统,其中,加权系数产生器使用wl(n)+μx(n-l)e(n)来更新加权系数,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声,而e(n)是误差。
5、如权利要求1所述的系统,其中,数字滤波器使用
来产生滤波过的语音,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
6、如权利要求1所述的系统,其中,语音分离器还包括一个缓存器,用于为每个频带分离虚拟噪声并且存储之。
7、一种降噪方法,包括:
(a)外部地接收噪声以便产生虚拟噪声;
(b)通过使用一个加权系数滤除虚拟噪声以产生滤波过的语音;
(c)计算从外部输入的语音中去掉虚拟噪声而产生的虚拟语音和滤波过的语音之间的差值从而产生误差;和
(d)使用该误差和虚拟噪声来更新加权系数。
8、如权利要求7所述的方法,其中,(a)还包括为每个频带分离虚拟噪声。
9、如权利要求7所述的方法,其中,(b)包括:使用
来产生滤波过的语音,其中,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
10、如权利要求7所述的方法,其中(d)包括:更新加权系数以使误差的均方值成为最小值。
11、如权利要求10所述的方法,其中,(d)使用最陡下降法来更新加权系数。
12、如权利要求7所述的方法,其中,(d)包括使用wl(n)+μx(n-l)e(n)来更新加权系数,其中,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声,而e(n)是误差。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0020846A KR100492819B1 (ko) | 2002-04-17 | 2002-04-17 | 소음 제거 방법 및 그 시스템 |
KR1020020020846 | 2002-04-17 | ||
KR10-2002-0020846 | 2002-04-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1482596A CN1482596A (zh) | 2004-03-17 |
CN1222925C true CN1222925C (zh) | 2005-10-12 |
Family
ID=29208707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031221491A Expired - Lifetime CN1222925C (zh) | 2002-04-17 | 2003-04-17 | 降噪方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20030200084A1 (zh) |
JP (1) | JP2003316399A (zh) |
KR (1) | KR100492819B1 (zh) |
CN (1) | CN1222925C (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073699B2 (en) | 2005-08-16 | 2011-12-06 | Nuance Communications, Inc. | Numeric weighting of error recovery prompts for transfer to a human agent from an automated speech response system |
CN101047455A (zh) * | 2006-03-29 | 2007-10-03 | 华为技术有限公司 | 一种降低环境耦合噪声的方法和装置 |
JP5564743B2 (ja) * | 2006-11-13 | 2014-08-06 | ソニー株式会社 | ノイズキャンセル用のフィルタ回路、ノイズ低減信号生成方法、およびノイズキャンセリングシステム |
JP4932652B2 (ja) * | 2007-09-14 | 2012-05-16 | Necマグナスコミュニケーションズ株式会社 | 通信装置、マルチキャリア伝送システム、通信方法及び通信プログラム |
KR102351061B1 (ko) * | 2014-07-23 | 2022-01-13 | 현대모비스 주식회사 | 음성인식방법 및 음성인식장치 |
CN105603317A (zh) * | 2015-12-22 | 2016-05-25 | 唐艺峰 | 一种高氮不锈钢及其制备方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5960391A (en) * | 1995-12-13 | 1999-09-28 | Denso Corporation | Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
US6826528B1 (en) * | 1998-09-09 | 2004-11-30 | Sony Corporation | Weighted frequency-channel background noise suppressor |
DE69932626T2 (de) * | 1998-11-13 | 2007-10-25 | Bitwave Pte Ltd. | Signalverarbeitungsvorrichtung und verfahren |
KR100304666B1 (ko) * | 1999-08-28 | 2001-11-01 | 윤종용 | 음성 향상 방법 |
EP1208724B1 (en) * | 1999-12-24 | 2006-04-05 | Koninklijke Philips Electronics N.V. | Audio signal processing device |
US6937978B2 (en) * | 2001-10-30 | 2005-08-30 | Chungwa Telecom Co., Ltd. | Suppression system of background noise of speech signals and the method thereof |
US7117148B2 (en) * | 2002-04-05 | 2006-10-03 | Microsoft Corporation | Method of noise reduction using correction vectors based on dynamic aspects of speech and noise normalization |
-
2002
- 2002-04-17 KR KR10-2002-0020846A patent/KR100492819B1/ko active IP Right Grant
-
2003
- 2003-04-16 US US10/417,022 patent/US20030200084A1/en not_active Abandoned
- 2003-04-17 JP JP2003113068A patent/JP2003316399A/ja active Pending
- 2003-04-17 CN CNB031221491A patent/CN1222925C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US20030200084A1 (en) | 2003-10-23 |
JP2003316399A (ja) | 2003-11-07 |
KR20030082216A (ko) | 2003-10-22 |
CN1482596A (zh) | 2004-03-17 |
KR100492819B1 (ko) | 2005-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1132153C (zh) | 改善增强语声的滤波器,用该滤波器的装置、系统和方法 | |
CN102122511B (zh) | 一种信号处理方法、处理装置以及语音解码器 | |
US5794179A (en) | Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal | |
CN101051461A (zh) | 特征向量补偿装置和特征向量补偿方法 | |
CN1222925C (zh) | 降噪方法和系统 | |
CN101030383A (zh) | 声源分离装置、方法和程序 | |
CN101030377A (zh) | 提高声码器基音周期参数量化精度的方法 | |
CN1820542A (zh) | 具有声反馈抑制的助听器 | |
CN110248300B (zh) | 一种基于自主学习的啸叫抑制方法及扩声系统 | |
CN1173690A (zh) | 识别浊音/清音的方法和装置及其语音编码方法 | |
CN1146864C (zh) | 语音合成的方法和装置 | |
CN1225934C (zh) | 控制移动终端的多功能器件的装置和方法 | |
CN1214362C (zh) | 用于确定信号间相关系数和信号音高的设备和方法 | |
CN1233195C (zh) | 带宽扩展设备 | |
CN1146861C (zh) | 语音处理装置中的音调提取方法 | |
CN1397062A (zh) | 声音控制电视接收设备以及声音控制方法 | |
CN1920951A (zh) | 变速方法和系统 | |
CN1701630A (zh) | 啸声抑制装置和啸声抑制方法 | |
CN1822092A (zh) | 一种消除语音输入中背景噪声的方法及其装置 | |
CN1473323A (zh) | 改进噪声环境和频率失谐条件下话音识别性能的系统和方法 | |
CN1498007A (zh) | 在移动终端中压缩声音的方法 | |
CN1295678C (zh) | 子带自适应谷点降噪系统和方法 | |
WO2019167706A1 (ja) | 符号化装置、符号化方法、プログラム、および記録媒体 | |
CN1246825C (zh) | 预估语音信号的语调估测值的方法和装置 | |
CN1774866A (zh) | ∑-△调制器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20051012 |
|
CX01 | Expiry of patent term |