CN1222925C - 降噪方法和系统 - Google Patents

降噪方法和系统 Download PDF

Info

Publication number
CN1222925C
CN1222925C CNB031221491A CN03122149A CN1222925C CN 1222925 C CN1222925 C CN 1222925C CN B031221491 A CNB031221491 A CN B031221491A CN 03122149 A CN03122149 A CN 03122149A CN 1222925 C CN1222925 C CN 1222925C
Authority
CN
China
Prior art keywords
noise
weighting coefficient
virtual
error
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB031221491A
Other languages
English (en)
Other versions
CN1482596A (zh
Inventor
金润焕
姜千模
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INFOTECH MAGIC CO Ltd
Original Assignee
INFOTECH MAGIC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INFOTECH MAGIC CO Ltd filed Critical INFOTECH MAGIC CO Ltd
Publication of CN1482596A publication Critical patent/CN1482596A/zh
Application granted granted Critical
Publication of CN1222925C publication Critical patent/CN1222925C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Abstract

公开了一种降噪系统,包括:语音分离器,用于接收环境噪声以便产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和加权系数产生器,用于使用误差和虚拟噪声来更新加权系数使得降低误差。在这里,加权系数产生器利用最陡下降法实时更新加权系数以使将误差均方值最小化。

Description

降噪方法和系统
技术领域
本发明涉及一种降噪方法和系统。更明确地,本发明涉及一种使用自适应算法的降噪方法。
背景技术
噪声在各个领域中引起严重的问题,并且特别地,在要求精确语音输入的情况下把噪声降至一定程度变得非常关键,目前已提出许多方法来降低语音识别领域中的污染噪声。传统降噪方法提供人工降噪,例如通过使用一个隔音墙来降低噪声。可是,上述人工降噪方法不适合于降低许多其他种类的噪声。
例如,如果混合的语音和噪声被输入到一个语音识别设备,则该设备不能识别精确的语音并且无法获得期望的结果。因此,语音识别设备在使用传统人工降噪方法降低噪声方面存在问题。
发明内容
本发明的一个优点是使用自适应系数积极地降低噪声。
在本发明的一个方面中,一种降噪系统包括:语音分离器,用于接收环境噪声以便产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和加权系数产生器,用于使用误差和虚拟噪声来更新加权系数使得降低误差。
加权系数产生器使用最陡下降法以更新加权系数,因此,误差的均方值可以是最小值。
在本发明的另一方面中,一种降噪方法包括:(a)外部地接收噪声以产生虚拟噪声;(b)通过使用加权系数滤除虚拟噪声从而产生滤波过的语音;(c)计算从外部输入的语音中去掉虚拟噪声而产生的虚拟语音和滤波过的语音之间的差值从而产生误差;和(d)使用该误差和虚拟噪声来更新加权系数。
(b)包括:使用 Σ l = 0 L - 1 w 1 ( n ) x ( n - l ) 产生滤波过的语音,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
(d)包括:使用wl(n)+μx(n-l)e(n)更新加权系数,在此,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声而e(n)是误差。
附图说明
所结合的并且构成说明书一部分的附图,说明了本发明的一个实施例,并且和说明书一起用于解释本发明的原理:
图1示出了根据本发明优选实施例的一种降噪系统的框图;
图2示出了根据本发明优选实施例的一种降噪方法的流程图;和图3示出了根据本发明优选实施例的用于更新自适应系数的方法流程图。
具体实施方式
在下面的详细说明中,只示出并描述了简单地通过发明人实现本发明所预期的最佳方式的优选实施例。正如将被实现的,本发明能够在各个明显的方面进行修改,所有的修改都不偏离本发明。因此,附图和说明书实际上作为说明性的而非限定性的。
参考附图,根据本发明优选实施例将描述一种降噪方法和系统。
图1示出了根据本发明优选实施例的一种降噪系统的框图。
正如所示出的,降噪系统包括语音分离器10、数字滤波器20、减法器30和加权系数产生器40。
语音分离器10包括AD(模拟转换数字)转换器以把外部输入的模拟声源转换成为数字信号,并且它从该外部输入的声源中分离虚拟噪声[x(k)],并且将它存储在缓存器中。
详细地,当语音分离器10没有接收附加的语音信号来产生虚拟噪声[x(k)]时,则环境噪声通过一个外部输入端被输入到语音分离器10,并且语音分离器10对该输入噪声上进行傅里叶变换,按照最小单位频带分离之,并且把结果存储在缓存器中。
语音分离器10接收包括期望语音和噪声在内的声源时,降低来自声源中的储存在缓存器中的虚拟噪声[x(k)]以产生虚拟语音[d(k)]。
数字滤波器20接收储存在语音分离器10的缓存器中的虚拟噪声[x(k)],按照由加权系数产生器40产生的加权系数[w(k)]来滤除该虚拟噪声[x(k)],然后产生滤波过的语音[y(k)],其中噪声被降低。
减法器30从语音分离器10中接收从其中降低了虚拟噪声[x(k)]的虚拟语音[d(k)],从虚拟语音[d(k)]中减掉由数字滤波器20产生的滤波过的语音[y(k)],然后得到一个误差[e(k)]。
加权系数产生器40接收虚拟噪声[x(k)]和误差[e(k)],产生加权系数[w(k)],并且向数字滤波器20提供该加权系数。
参见图2,将描述降噪方法。
图2示出了根据本发明优选实施例的一种降噪方法的流程图。
在步骤S201,语音分离器10接收没有附加语音输入的外部噪声,产生虚拟噪声[x(k)],并且将它存储在缓存器中。降噪系统接收无附加的外部语音输入以便产生虚拟噪声[x(k)]。也就是说,建立降噪系统不是接收语音,而是仅仅接收通过语音输入终端的环境噪声。
没有外部语音输入的噪声输入被付里叶变换以便分开频率和幅值。正如所描述的,经Fourier变换的噪声被分离为每个最小的单位频带,储存在缓存器中,并且经反Fourier变换以变成虚拟噪声[x(k)]。
在步骤S202,虚拟噪声[x(k)]输入到数字滤波器20,并且在步骤S203按照由加权系数产生器40产生的加权系数[w(k)]滤波。正如所描述的,通过加权系数滤波的虚拟噪声产生来成为期望的语音。
在此情况下,当每一频带分离的虚拟噪声被表示为[x(n),x(n-1),…,x(n-L+1)],并且相应的加权系数为[w0(n),w1(n),…,wL-1(n)],滤波过的语音[y(n)]被表示为式1:
式1
y ( n ) Σ I = 0 L - 1 w l ( n ) x ( n - 1 )
当利用式2中的向量组来表示每一频带分离的虚拟噪声和加权系数时,滤波过的语音[y(n)]可以如式3所示。
式2
X(n)=[x(n)x(n-1)…x(n-L+1)]T
W(n)=[w0(n)w1(n)…wL-1(n)]T
式3
y(n)=WT(n)X(n)=XT(n)W(n)
接下来,在步骤S204,通过从外部输入的声源中减掉虚拟噪声所获得的虚拟语音[d(n)]输入到减法器30,然后通过从虚拟语音[d(n)]中减去由数字滤波器产生的滤波过的语音[y(n)]所获得的一个数值被定义为一个误差[e(n)],然后输出。该误差在式4中被表达。
式4
e(n)=d(n)-y(n)=d(n)-WT(n)X(n)
在步骤S205,加权系数产生器40接收误差[e(n)]和虚拟噪声[x(n)]以便更新加权系数。在步骤S206,更新了的加权系数[W(n+1)]被数字滤波器20用来滤除虚拟噪声,并且相应地产生滤波过的语音[y((n+1)],并且通过重复上述的处理从而产生降噪语音。
现在详细描述用于产生加权系数的方法。
如上所述,加权系数产生器40需要误差和虚拟噪声用于更新加权系数。误差是在通过从输入语音中减掉虚拟噪声所产生的虚拟语音与通过数字滤波器使用加权系数滤除虚拟噪声所产生的语音(即,在本发明优选实施例中结果期望的语音)之间的一个差值。加权系数产生器40更新加权系数以最小化式5中表达的误差均方值。
式5
ξ(n)=E[e2(n)]
当以向量形式使用误差来表示式5时,获得式6。
式6
ξ(n)=E[(d(n)-XT(n)W(n))2]
=E[d2(n)]-2E[d(n)XT(n)]W(n)+WT(n)E[X(n)XT(n)]W(n)
=E[d2(n)]-2PTW(n)+WT(n)RW(n)
在此情况下,当使用最陡下降法作为一个最优化算法并且计算加权系数[W(n)]以便最小化ξ(n)时,它如式7所示。
式7
W(n+1)=W(n)+μX(n)e(n)在此μ表示一个步长。
当不使用向量形式表示式7时,它被表示成式8。
式8
w1(n+1)=w1(n)+μx(n-l)e(n)在此,l=0,1,2,…,L-1。
以下参照图3描述一种使用式8来更新加权系数的方法。
和图3示出了根据本发明优选实施例的用于更新自适应系数的方法流程图。
首先,在步骤S301,为了找到一个加权系数需要确定一个初始值。初始值包括加权系数的步长μ和初始值[w1(0)]。在步骤S302,加权系数的初始值被代入式1中以计算滤波过的语音[y(0)]。在步骤S303,计算虚拟语音[d(0)]和滤波过的语音[y(0)]之间的误差以便计算出一个误差[e(0)]。
接下来,使用在早先步骤S301中确定的误差[e(0)]、加权系数的初始值以及在步骤S304中的步长来更新加权系数[w1(1)]。使用更新的加权系数[w1(1)],重复早先的步骤S302到S304从而得到一个加权系数。
也就是说,在步骤S302通过把加权系数[w1(n)]代入式1中来计算出滤波过的语音[y(n)];在步骤S303计算出在滤波过的语音[y(n)]和虚拟语音[d(n)]之间的误差[e(n)];并且在步骤S304使用误差[e(n)]和步长来更新加权系数以便获得一个新的加权系数[w1(n+1)]。
通过如上所述地更新加权系数,则每次语音被输入时误差被降低从而降低噪声。
根据本发明,由于加权系数被实时更新,所以噪声可以相应于环境的变化实时降低。
本发明已描述目前被认为是最实用且优选的实施例,所应理解的是,本发明不局限于所公开的实施例,相反地,各种修改和等同置换均包含在本发明的精神和权利要求范围内。

Claims (12)

1、一种降噪系统,包括:
语音分离器,用于接收环境噪声以产生虚拟噪声,并且从外部输入的声源中减掉该虚拟噪声从而产生虚拟语音;
数字滤波器,用于使用加权系数来滤除该虚拟噪声并且产生滤波过的语音;
减法器,用于从该虚拟语音中减掉由数字滤波器产生的滤波过的语音以便计算误差;和
加权系数产生器,用于使用误差和虚拟噪声来更新加权系数以降低误差。
2、如权利要求1所述的系统,其中加权系数产生器更新加权系数以使误差的均方值成为最小值。
3、如权利要求2所述的系统,其中加权系数产生器使用最陡下降法以更新该加权系数从而误差的均方值成为最小值。
4、如权利要求1所述的系统,其中,加权系数产生器使用wl(n)+μx(n-l)e(n)来更新加权系数,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声,而e(n)是误差。
5、如权利要求1所述的系统,其中,数字滤波器使用 Σ l = 0 L - 1 w l ( n ) x ( n - l ) 来产生滤波过的语音,在此,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
6、如权利要求1所述的系统,其中,语音分离器还包括一个缓存器,用于为每个频带分离虚拟噪声并且存储之。
7、一种降噪方法,包括:
(a)外部地接收噪声以便产生虚拟噪声;
(b)通过使用一个加权系数滤除虚拟噪声以产生滤波过的语音;
(c)计算从外部输入的语音中去掉虚拟噪声而产生的虚拟语音和滤波过的语音之间的差值从而产生误差;和
(d)使用该误差和虚拟噪声来更新加权系数。
8、如权利要求7所述的方法,其中,(a)还包括为每个频带分离虚拟噪声。
9、如权利要求7所述的方法,其中,(b)包括:使用 Σ l = 0 L - 1 w l ( n ) x ( n - l ) 来产生滤波过的语音,其中,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,而x(n-l)是虚拟噪声。
10、如权利要求7所述的方法,其中(d)包括:更新加权系数以使误差的均方值成为最小值。
11、如权利要求10所述的方法,其中,(d)使用最陡下降法来更新加权系数。
12、如权利要求7所述的方法,其中,(d)包括使用wl(n)+μx(n-l)e(n)来更新加权系数,其中,n为次数,l=0,1,2,…,L-1,其中L为数字滤波器的阶数,wl(n)是加权系数,μ是用于表示步长的一个恒量,x(n-l)是虚拟噪声,而e(n)是误差。
CNB031221491A 2002-04-17 2003-04-17 降噪方法和系统 Expired - Lifetime CN1222925C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2002-0020846A KR100492819B1 (ko) 2002-04-17 2002-04-17 소음 제거 방법 및 그 시스템
KR1020020020846 2002-04-17
KR10-2002-0020846 2002-04-17

Publications (2)

Publication Number Publication Date
CN1482596A CN1482596A (zh) 2004-03-17
CN1222925C true CN1222925C (zh) 2005-10-12

Family

ID=29208707

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031221491A Expired - Lifetime CN1222925C (zh) 2002-04-17 2003-04-17 降噪方法和系统

Country Status (4)

Country Link
US (1) US20030200084A1 (zh)
JP (1) JP2003316399A (zh)
KR (1) KR100492819B1 (zh)
CN (1) CN1222925C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073699B2 (en) 2005-08-16 2011-12-06 Nuance Communications, Inc. Numeric weighting of error recovery prompts for transfer to a human agent from an automated speech response system
CN101047455A (zh) * 2006-03-29 2007-10-03 华为技术有限公司 一种降低环境耦合噪声的方法和装置
JP5564743B2 (ja) * 2006-11-13 2014-08-06 ソニー株式会社 ノイズキャンセル用のフィルタ回路、ノイズ低減信号生成方法、およびノイズキャンセリングシステム
JP4932652B2 (ja) * 2007-09-14 2012-05-16 Necマグナスコミュニケーションズ株式会社 通信装置、マルチキャリア伝送システム、通信方法及び通信プログラム
KR102351061B1 (ko) * 2014-07-23 2022-01-13 현대모비스 주식회사 음성인식방법 및 음성인식장치
CN105603317A (zh) * 2015-12-22 2016-05-25 唐艺峰 一种高氮不锈钢及其制备方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960391A (en) * 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6826528B1 (en) * 1998-09-09 2004-11-30 Sony Corporation Weighted frequency-channel background noise suppressor
DE69932626T2 (de) * 1998-11-13 2007-10-25 Bitwave Pte Ltd. Signalverarbeitungsvorrichtung und verfahren
KR100304666B1 (ko) * 1999-08-28 2001-11-01 윤종용 음성 향상 방법
EP1208724B1 (en) * 1999-12-24 2006-04-05 Koninklijke Philips Electronics N.V. Audio signal processing device
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US7117148B2 (en) * 2002-04-05 2006-10-03 Microsoft Corporation Method of noise reduction using correction vectors based on dynamic aspects of speech and noise normalization

Also Published As

Publication number Publication date
US20030200084A1 (en) 2003-10-23
JP2003316399A (ja) 2003-11-07
KR20030082216A (ko) 2003-10-22
CN1482596A (zh) 2004-03-17
KR100492819B1 (ko) 2005-05-31

Similar Documents

Publication Publication Date Title
CN1132153C (zh) 改善增强语声的滤波器,用该滤波器的装置、系统和方法
CN102122511B (zh) 一种信号处理方法、处理装置以及语音解码器
US5794179A (en) Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal
CN101051461A (zh) 特征向量补偿装置和特征向量补偿方法
CN1222925C (zh) 降噪方法和系统
CN101030383A (zh) 声源分离装置、方法和程序
CN101030377A (zh) 提高声码器基音周期参数量化精度的方法
CN1820542A (zh) 具有声反馈抑制的助听器
CN110248300B (zh) 一种基于自主学习的啸叫抑制方法及扩声系统
CN1173690A (zh) 识别浊音/清音的方法和装置及其语音编码方法
CN1146864C (zh) 语音合成的方法和装置
CN1225934C (zh) 控制移动终端的多功能器件的装置和方法
CN1214362C (zh) 用于确定信号间相关系数和信号音高的设备和方法
CN1233195C (zh) 带宽扩展设备
CN1146861C (zh) 语音处理装置中的音调提取方法
CN1397062A (zh) 声音控制电视接收设备以及声音控制方法
CN1920951A (zh) 变速方法和系统
CN1701630A (zh) 啸声抑制装置和啸声抑制方法
CN1822092A (zh) 一种消除语音输入中背景噪声的方法及其装置
CN1473323A (zh) 改进噪声环境和频率失谐条件下话音识别性能的系统和方法
CN1498007A (zh) 在移动终端中压缩声音的方法
CN1295678C (zh) 子带自适应谷点降噪系统和方法
WO2019167706A1 (ja) 符号化装置、符号化方法、プログラム、および記録媒体
CN1246825C (zh) 预估语音信号的语调估测值的方法和装置
CN1774866A (zh) ∑-△调制器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20051012

CX01 Expiry of patent term