CN100394476C - 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法 - Google Patents

使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法 Download PDF

Info

Publication number
CN100394476C
CN100394476C CNB200480011250XA CN200480011250A CN100394476C CN 100394476 C CN100394476 C CN 100394476C CN B200480011250X A CNB200480011250X A CN B200480011250XA CN 200480011250 A CN200480011250 A CN 200480011250A CN 100394476 C CN100394476 C CN 100394476C
Authority
CN
China
Prior art keywords
signal
spectrum component
signals
spectrum
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB200480011250XA
Other languages
English (en)
Other versions
CN1781141A (zh
Inventor
罗伯特·L.·安德森
迈克尔·M.·杜鲁门
飞利浦·A.·威廉姆斯
斯蒂芬·D.·弗农
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN1781141A publication Critical patent/CN1781141A/zh
Application granted granted Critical
Publication of CN100394476C publication Critical patent/CN100394476C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

一种音频编码器丢弃输入信号的频谱分量并且使用声道耦合来降低已编码信号的信息容量需求。声道耦合以复合形式表示多个声道信号的选定频谱分量。音频解码器合成频谱分量来代替丢弃的频谱分量并且从耦合声道信号中产生用于各个声道信号的频谱分量。该编码器在已编码信号中提供定标因子,这些定标因子可以提高解码器产生输出信号的效率,其中这些输出信号基本上保持了原始输入信号的频谱能量。

Description

使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法
技术领域
本发明涉及用于传输、记录和回放音频信号的音频编码和解码装置和方法。更具体地,本发明涉及减少传送或记录给定音频信号所需要的信息,同时在回放输出信号中维持给定感觉质量水平。
背景技术
许多通信系统面临着信息传输和记录容量的需求通常超过可用容量的问题。因此,其中在广播和记录领域中很受关注的是,降低传送或记录供人感知的音频信号所需要的信息量而不降低它的感觉质量。
用于降低信息容量要求的传统方法涉及只传送或记录输入信号中的选定部分。丢弃其余部分。称为感知编码的技术典型地转换原始音频信号为频谱分量或者频率子带信号,以便冗余或者不相关的那些信号部分可以被更容易地识别和丢弃。一个信号部分如果可以从该信号的其他部分再生,那么它就被认为是冗余的。如果一个信号部分感觉上无关紧要或者听不见,那么它就被认为是不相关的。感知解码器可以从一个已编码信号中再生丢失的冗余部分,但是它不能产生还不是冗余的任何丢失的不相关信息。然而,不相关信息的丢失是可接受的,因为它的缺少对已解码信号没有任何可察觉的影响。
如果信号编码技术仅仅丢弃冗余或者感觉上不相关的那些信号部分,那么它在感觉上是透明的。如果感觉上透明的技术不能达到充分降低信息容量的要求,那么就需要感觉上不透明的技术来丢弃非冗余并且感觉上相关的附加信号部分。不可避免的结果就是,所传送或记录信号的感觉保真度就会降低。优选地,感觉上不透明的技术只丢弃被认为感觉上最不重要的那些信号部分。
一种称为“耦合”的编码技术可以用来降低信息容量要求,它通常被认为是感觉上不透明的技术。根据该技术,组合两个或更多个输入音频信号中的频谱分量以形成耦合声道信号,该耦合声道信号具有这些频谱分量的复合表示。还产生补充信息,表示每一个输入音频信号中为了形成该复合表示所组合的频谱分量的谱包络。传送或记录包括耦合声道信号和补充信息的已编码信号,以供接收机随后解码。该接收机通过产生耦合声道信号的副本并且使用补充信息对复制信号中的频谱分量定标使得原始输入信号的谱包络基本上被恢复,来产生去耦信号,这些去耦信号是原始输入信号的不精确复制。一种用于双声道立体声系统的典型耦合技术组合左右声道信号的高频分量来形成一个单独的复合高频分量信号,并且产生表示原始左右声道信号中的高频分量的谱包络的补充信息。在高级电视系统委员会(ATSC)标准文件A/52的“Digital Audio Compression(AC-3)”中描述了耦合技术的一个例子,通过引用其全部包含于此。
应该选择补充信息和耦合声道信号的信息容量要求,以便优化两个竞争需要之间的折衷。如果用于补充信息的信息容量要求设置得太高,那么耦合声道将被迫以低精确度传送它的频谱分量。耦合声道频谱分量中的较低精确度可能导致听得见程度的编码噪声或量化噪声被注入到去耦信号中。相反,如果耦合声道信号的信息容量要求设置得太高,那么补充信息将被迫传送具有低水平频谱细节的谱包络。谱包络中的较低细节水平可能导致每个去耦信号的谱级(spectral level)和形状的听得到的差异。
通常,如果补充信息传送频率子带的谱级,那么就可以得到良好的折衷,其中这些子带具有与人听觉系统的临界频带相当的带宽。应该注意到,去耦信号可能能够保持原始输入信号的原始频谱分量的谱级,但是他们通常不能保持原始频谱分量的相位。如果耦合限于高频频谱分量,那么可能不会感觉到相位信息的丢失,因为人的听觉系统对尤其是在高频的相位变化相对不敏感。
通过传统耦合技术产生的补充信息典型地是频谱幅度的度量。因此,一个典型系统中的解码器基于从频谱幅度推导的能量度量来计算定标因子。这些计算通常要求计算从补充信息得到的值的平方和的平方根,这需要相当大的计算资源。
一种有时称为“高频再生”(HFR)的编码技术是感觉上不透明的技术,它可以用来降低信息容量要求。根据该技术,传送或存储只包含输入音频信号的低频分量的基带信号。还提供表示原始高频分量的频谱包络的补充信息。传送或记录一个包括该基带信号和该补充信息的已编码信号,供接收机随后解码。该接收机基于该补充信息再生具有谱级的所省略高频分量并且组合该基带信号和该再生高频分量来产生输出信号。在1979年4月的Proc.of the International Conf.onAcoust.,Speech and Signal Proc.中的Makhoul和Berouti的“High-Frequency Regeneration in Speech Coding Systems”,可以找到已知HFR方法的描述。在2002年3月28日提交的题目为“BroadbandFrequency Translation for High Frequency Regeneration”的美国专利申请第10/113,858号中公开了适于编码高质量音乐的改进HFR技术,通过参考其全部包含于此并且在下面称为HFR申请。
应该选择补充信息和基带信号的信息容量要求,以便优化两个竞争需要之间的折衷。如果用于补充信息的信息容量要求设置得太高,那么已编码信号将被迫以低精确度传送基带信号中的频谱分量。基带信号频谱分量中的较低精确度可能导致听得见程度的编码噪声或量化噪声被注入到基带信号以及从它合成的其他信号中。相反,如果基带信号的信息容量要求设置得太高,那么补充信息将被迫传送具有低水平频谱细节的谱包络。谱包络中的较低细节水平可能导致每个合成信号的谱级和形状的听得到的差异。
通常,如果补充信息传送频率子带的谱级,那么就可以得到良好的折衷,其中这些子带具有与人听觉系统的临界频带相当的带宽。
正如对上面所讨论的耦合技术,通过传统HFR技术产生的补充信息典型地是频谱幅度的度量。因此,一个典型系统中的解码器基于从频谱幅度推导的能量度量来计算定标因子。这些计算通常要求计算从补充信息得到的值的平方和的平方根,这需要相当大的计算资源。
传统的系统使用了耦合技术或者HFR技术,但没有同时使用两者。在许多应用中,耦合技术可能引起比HFR技术小的信号劣化,但是HFR技术可以实现信息容量要求的更大降低。可以在多声道和单声道应用中有利地使用HFR技术,但是,在单声道应用中耦合技术不能提供任何优点。
发明内容
本发明的目的是提供像在音频编码系统中实现耦合和HFR那样的信号处理技术的改进。
根据本发明的一个方面,一种用于编码一个或多个输入音频信号的方法包括以下步骤:从输入音频信号中得到一个或多个基带信号以及一个或多个剩余信号,其中基带信号的频谱分量在第一组频率子带中,剩余信号的频谱分量在基带信号所不表示的第二组频率子带中;得到一个或多个合成信号的频谱分量的能量度量,其中这些合成信号将在解码期间在该第二组子带内产生;得到剩余信号的频谱分量的能量度量;通过得到剩余信号和合成信号的频谱分量的能量度量的平方根和比值来计算定标因子;并且将表示定标因子的定标信息和表示基带信号中的频谱分量的信号信息汇编到已编码信号中。
根据本发明的另一个方面,一种用于解码表示一个或多个输入音频信号的已编码信号的方法包括以下步骤:从已编码信号中得到定标信息和信号信息,其中定标信息表示通过得到频谱分量的能量度量的平方根和比值所计算的定标因子,信号信息表示一个或多个子带信号的频谱分量,并且其中基带信号中的频谱分量表示第一组频率子带中的输入音频信号的频谱分量;为该基带信号产生相关合成信号,这些合成信号具有基带信号所不表示的第二组频率子带中的频谱分量,其中根据一个或多个定标因子通过乘法和除法对合成信号中的频谱分量定标;并且产生一个或多个输出音频信号,这些信号表示输入音频信号并且是从基带信号和相关合成信号中的频谱分量中产生的。
根据本发明的又一个方面,一种用于编码多个输入音频信号的方法包括以下步骤:从输入音频信号中得到多个基带信号、多个剩余信号和一个耦合声道信号,其中基带信号的频谱分量表示在第一组频率子带中的输入音频信号频谱分量而剩余信号的频谱分量表示在基带信号所不表示的第二组频率子带中的输入音频信号频谱分量,并且其中耦合声道信号的频谱分量表示在第三组频率子带中的两个或更多个输入音频信号的频谱分量的复合;得到剩余信号和该耦合声道信号所表示的两个或更多个输入音频信号的频谱分量的能量度量;并且将从能量度量中推导出来的定标信息和表示基带信号和耦合声道信号中的频谱分量的信号信息汇编到已编码信号。
根据本发明的另一个方面,一种用于解码表示多个输入音频信号的已编码信号的方法包括以下步骤:从已编码信号中得到控制信息和信号信息,其中控制信息是从频谱分量的能量度量中推导出来的并且信号信息表示多个基带信号和一个耦合声道信号的频谱分量,基带信号中的频谱分量表示在第一组频率子带中的输入音频信号频谱分量,耦合声道信号的频谱分量表示在两个或更多个输入音频信号的第三组频率子带中的频谱分量的复合;为基带信号产生相关合成信号,这些相关合成信号具有基带信号所不表示的第二组频率子带中的频谱分量,其中根据该控制信息对相关合成信号中的频谱分量定标;从耦合声道信号中为耦合声道信号所表示的两个或更多个输入音频信号产生去耦信号,其中去耦信号具有根据控制信息所定标的第三频率子带中的频谱分量;并且从基带信号和相关合成信号中的频谱分量产生表示输入音频信号的多个输出信频信号,其中表示两个或更多个音频信号的输出音频信号也是从各个去耦信号中的频谱分量中产生的。
本发明的其它方面包括:具有执行各种编码和解码方法的处理电路的装置;携带装置可执行指令的程序的媒体,其中该程序会引起装置执行各种编码和解码方法;以及携带表示各种编码方法所产生的输入音频信号的已编码信息的媒体。
通过参考下面的讨论和附图,可以更好地理解本发明的各种特点及其优选实施例,其中几个图中相同的参考编号指的是相同的元件。下面讨论和附图的内容仅仅作为例子阐述,不应该理解为表示对本发明范围的限制。
附图说明
图1是对音频信号编码的装置的示意框图,其中该编码信号用于随后通过一个装置使用高频再生进行解码。
图2是使用高频再生解码已编码音频信号的装置的示意框图。
图3是将音频信号分为频率子带信号的装置的示意框图,这些子带信号具有响应于该音频信号的一个或多个特征所适配的范围。
图4是从具有所适配范围的频率子带信号合成音频信号的装置的示意框图。
图5和6是使用耦合来编码音频信号的装置的示意框图,该编码信号用于随后通过一个装置使用高频再生和去耦合进行解码。
图7是使用高频再生和去耦合来解码已编码信号的装置的示意框图。
图8是一个编码音频信号的装置的示意框图,该装置使用第二分析滤波器组以便提供用于能量计算的附加频谱分量。
图9是可以实现本发明的各个方面的设备的示意框图。
具体实施方式
A.概述
本发明涉及降低已编码信号的信息容量要求的音频编码系统和方法,其通过丢弃原始输入音频信号的“剩余”部分并且只编码原始输入音频信号的基带部分、并且随后通过产生合成信号代替丢失的剩余部分来解码已编码信号来实现。已编码信号包括解码处理用来控制信号合成的定标信息,以便合成信号在某种程度上保持原始输入音频信号的剩余部分的谱级。
这种编码技术在此称为高频再生(HFR),因为可以预料到,在许多实现中,剩余信号将包含较高频率的频谱分量。但是原则上,该技术并不限于只合成高频频谱分量。基带信号可以包括更高频率频谱分量的一些或全部,或者可以包括分散在整个输入信号总带宽的频率子带中的频谱分量。
1.编码器
图1示出接收输入音频信号并且产生表示该输入音频信号的已编码信号的音频编码器。分析滤波器组10从路径9接收该输入音频信号,并且作为响应,提供表示该音频信号的频谱分量的频率子带信息。沿着路径12产生表示基带信号的频谱分量的信息并且沿着路径11产生表示剩余信号的频谱分量的信息。基带信号的频谱分量表示第一组频率子带中的一个或多个子带中的输入音频信号的频谱内容,这些子带由已编码信号中传送的信号信息来表示。在一种优选实现中,第一组频率子带是较低频子带。剩余信号的频谱分量表示在第二组频率子带中的一个或多个子带中的输入音频信号的频谱内容,这些子带没有在基带被表示并且没有被已编码信号传送。在一种实现中,第一和第二组频率子带的联合组成了输入音频信号的整个带宽。
能量计算器31计算剩余信号的一个或多个子带中频谱能量的一个或多个度量。在一种优选实现中,从路径11接收的频谱分量被安排在具有与人听觉系统的临界频带相当的带宽的频率子带中,并且能量计算器31提供这些频率子带中每一个的能量度量。
合成模型21表示信号合成处理,该处理将会在对沿着路径51产生的已编码信号进行解码的解码处理中发生。合成模型21可以自己执行合成处理或者它可以执行某种其他处理,该其他处理可以估计合成信号的频谱能量而不实际执行合成处理。能量计算器32接收合成模型21的输出并且计算要合成的信号中的频谱能量的一个或多个度量。在一个优选实现中,合成信号的频谱分量被安排在具有与人听觉系统的临界频带相当的带宽的频率子带中,并且能量计算器32提供这些频率子带中每一个的能量度量。
在图1中的描述和图5、6和8中的描述表示了分析滤波器组和合成模型之间的连接,其建议合成模型至少部分地响应于基带信号;但是,这种连接是可选的。下面讨论合成模型的一些实现。这些实现中的一些独立于基带信号而操作。
定标因子计算器40从两个能量计算器中的每一个接收一个或多个能量度量,并且计算定标因子,这在下面更详细地解释。沿着路径41传递表示所计算的定标因子的定标信息。
格式化器50从路径41接收定标信息并且从路径12接收表示基带信号的频谱分量的信息。这些信息被汇编到已编码信号中,后者沿着路径51传递供传输或记录用。已编码信号可以通过基带或包括超声波到紫外频率的整个频谱上的调制通信路径传送,或者它可以使用基本上任何记录技术记录在媒体上,这些记录技术包括磁带、卡或盘、光卡或盘以及在像纸张这样的媒体上的可检测标记。
在优选实现中,使用可以通过丢弃冗余或不相关的部分降低信息容量要求的感知编码处理来编码基带信号的频谱分量。这些编码处理对于本发明来说不是必要的。
2.解码器
图2描述了接收表示音频信号的已编码信号并且产生该音频信号的解码表示的音频解码器。去格式化器60从路径59接收已编码信号并且从已编码信号中得到定标信息和信号信息。定标信息表示定标因子而信号信息表示基带信号的频谱分量,其中该基带信号具有在第一组频率子带中的一个或多个子带中的频谱分量。信号合成部件23执行合成处理以便产生具有在第二组频率子带中的一个或多个子带中的频谱分量的信号,这些频率分量表示已编码信号没有传送的剩余信号的频谱分量。
图2和7中的描述示出了去格式化器和信号合成部件23之间的连接,其建议信号合成至少部分地响应于基带信号;但是,该连接是可选的。下面讨论信号合成的一些实现。这些实现中的一些独立于基带信号而操作。
信号定标部件70从由路径61接收的定标信息中得到定标因子。定标因子用来对信号合成部件23产生的合成信号的频谱分量定标。合成滤波器组80从路径71接收已定标合成信号,从路径62接收基带信号的频谱分量,并且作为响应沿着路径89产生输出音频信号,该输出音频信号是原始输入音频信号的解码表示。尽管输出信号与原始输入音频信号不同样,但是可以预料到,该输出信号与输入音频信号在感觉上不可区别,或者对于给定应用至少是以在感觉上令人满意并且可接受的方式可区别的。
在优选实现中,信号信息表示编码形式的基带信号的频谱分量,必须使用与编码器中使用的编码处理相反的解码处理来解码。如上所提到的,这些处理对于本发明来说不是必要的。
3.滤波器组
分析和合成滤波器组可以以期望的基本上任何方式来实现,包括数字滤波器技术、块变换和小波变换的广泛范围。在一个具有如图1和2中分别所示的解码器和编码器的音频编码系统中,分析滤波器组10通过改进离散余弦变换(MDCT)来实现,并且合成滤波器组80可以通过改进离散余弦反变换来实现,这些在1987年5月的Proc.ofthe International Conf.on Acoust.,Speech and Signal Proc.第2161-64页Princen等人的“Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation”中描述了。原则上没有特定的滤波器实现是很重要的。
通过块变换实现的分析滤波器组将一块或一个时段的输入信号分为一组表示该时段的信号的频谱内容的变换系数。一个或多个相邻变换系数的一个组表示一个特定频率子带中的频谱内容,该子带具有与该组中的系数数量相当的带宽。
通过某种数字滤波器例如多相滤波器而不是块变换实现的分析滤波器组将输入信号分为一组子带信号。每个子带信号是一个特定频率子带内的输入信号频谱内容的基于时间的表示。优选地,子带信号被抽取,以便每个子带信号的带宽与单位时段的子带信号中的抽样数量相当。
下面的讨论具体地参考使用类似于上面提到的时域混叠消除(TDAC)变换的块变换的实现。在该讨论中,术语“频谱分量”指的是变换系数并且术语“频率子带”和“子带信号”涉及一个或多个相邻变换系数的组。但是,本发明的原理可以应用于其它类型的实现,因此术语“频率子带”和“子带信号”还涉及表示一个信号的整个带宽一部分的频谱内容的信号,并且术语“频谱分量”通常理解为指的是子带信号的抽样或单元。
B.定标因子
在使用例如像TDAC变换这样的变换的编码系统中,变换系数X(k)表示原始输入音频信号x(t)的频谱分量。变换系数分为不同组,表示基带信号和剩余信号。在使用诸如下述方式之一的合成处理的解码处理期间,产生合成信号的变换系数Y(k)。
1.计算
在一个优选实现中,编码处理提供定标信息,其传送根据剩余信号的频谱能量度量与合成信号的频谱能量度量的比值的平方根而计算的定标因子。对剩余信号和合成信号的频谱能量的度量可以根据下式计算:
E(k)=X2(k)                     (1a)
ES(k)=Y2(k)                    (1b)
其中,X(k)=剩余信号中的变换系数k;
E(k)=频谱分量X(k)的能量度量;
Y(k)=合成信号中的变换系数k;以及
ES(k)=频谱分量Y(k)的能量度量。
对于大多数应用来说,用于补充信息的信息容量要求太高,其中补充信息基于对每个频谱分量的能量度量;因此,根据下式由频谱分量的组或频率子带的能量度量计算定标因子:
E ( m ) = Σ k = m 1 m 2 X 2 ( k ) - - - ( 2 a )
ES ( m ) = Σ k = m 1 m 2 Y 2 ( k ) - - - ( 2 b )
其中,E(m)=对剩余信号的频率子带m的能量度量;以及
ES(m)=对合成信号的频率子带m的能量度量。求和界限m1和m2规定了在子带m中的最低和最高频谱分量。在优选实现中,这些频率子带具有与人听觉系统的临界频带相当的带宽。
求和界限还可以使用一个集合表示法来表示,例如k∈{M},其中{M}表示包含在能量计算中的所有频谱分量的集合。基于下面解释的原因,该表示法在说明书其余部分中使用。使用该表示法,公式2a和2b可以分别如公式2c和2d所示写为:
E ( m ) = Σ k ∈ { M } X 2 ( k ) - - - ( 2 c )
ES ( m ) = Σ k ∈ { M } Y 2 ( k ) - - - ( 2 b )
其中,{M}=子带m中的所有频谱分量的集合。
根据下式之一可以计算用于子带m的定标因子SF(m):
SF ( m ) = E ( m ) ES ( m ) - - - ( 3 a )
SF ( m ) = E ( m ) ES ( m ) - - - ( 3 b )
但是,基于第一公式的计算通常更有效。
2.定标因子的表示
优选地,编码处理在已编码信号中提供定标信息,其以需要比这些定标因子本身低的信息容量的形式来传送所计算的定标因子。可以使用各种方法来降低定标信息的信息容量要求。
一种方法是将每个定标因子本身表示为具有相关定标值的定标数。可实现该方法的一种方式是将每个定标因子表示为一个浮点数,其中尾数是定标数并且相关指数表示定标值。可以选择尾数或定标数的精确度,以便传送具有足够精确度的定标因子。可以选择指数或定标值的允许范围,以便为定标因子提供足够的动态范围。产生定标信息的处理还可以允许两个或更多浮点尾数或定标数来共享一个共同指数或定标值。
另一种方法通过相对于某个基值或归一化值归一化定标因子来降低信息容量要求。可以在定标信息的编码和解码处理之前规定该基值,或者可以自适应地确定它。例如,可以相对于一个时段的音频信号的最大定标因子来归一化用于音频信号的所有频率子带的定标因子,或者可以相对于从规定的一组值中选择的一个值来对它们归一化。基值的某种指示可以与定标信息包含在一起,以便解码处理可以撤销归一化的作用。
如果定标因子可由在从零到一范围内的值来表示,在许多实现中可以便于编码和解码定标信息所需的处理。如果相对于等于或大于所有可能定标因子的某个基值来归一化定标因子,那么可以确保该范围。作为替换,可以相对于比可合理预期的任何定标因子大的某个基值来归一化定标因子,并且如果某个意外或罕见事件导致一个定标因子超出该值就将其设置等于一。如果基值被限制为2的幂,那么归一化这些定标因子并且撤销该归一化的处理可以通过二进制整数运算函数或二进制移位操作有效地实现。
这些方法中的多个可以一起使用。例如,定标信息可以包括归一化定标因子的浮点表示。
C.信号合成
合成信号可以以各种方式产生。
1.频率变换
一种技术通过线性地转换一个基带信号的频谱分量X(k)来产生合成信号的频谱分量Y(k)。该转换可以表示为
Y(j)=X(k)                            (4)
这里,差值(j-k)是用于频谱分量k的频率变换的量。
当子带m中的频谱分量被转换为频率子带p时,编码处理可以根据下式由频率子带m中的频谱分量的能量度量计算用于频率子带p的定标因子:
SF ( p ) = E ( p ) ES ( p ) = Σ j ∈ { p } X 2 ( j ) Σ j ∈ { p } Y 2 ( j ) = Σ j ∈ { p } X 2 ( j ) Σ k ∈ { M } X 2 ( k ) - - - ( 5 )
这里,{P}=频率子带p中的所有频谱分量的集合;以及
{M}=被转换的频率子带m中的频谱分量的集合。
集合{M}不需要包含频率子带m中的所有频谱分量并且频率子带m中的一些频谱分量可以在该集合中被多次表示。这是因为该频率变换处理可能不转换频率子带m中的一些频谱分量并且可以多次转换频率子带m中的其他频谱分量,每次以不同的量转换。当频率子带p与频率子带m的频谱分量的数量不相同时,将出现这些情况之一或两者。
下面的例子说明了子带m中的一些频谱分量被省略而其他分量被多次表示的情况。频率子带m的频率范围从200Hz到3.5kHz并且频率子带p的频率范围从10kHz到14kHz。通过将从500Hz到3.5kHz的频谱分量转换到从10kHz到13kHz的范围,其中对每个频谱分量的转换量是9.5kHz,并且通过将从500Hz到1.5kHz的频谱分量转换到从13kHz到14kHz的范围,其中对每个频谱分量的转换量是12.5kHz,在频率子带p中合成一个信号。在该例中集合{M}不包括从200Hz到500Hz的任何频谱分量,但是包括从1.5kHz到3.5kHz的频谱分量并且包括从500Hz到1.5kHz的每个频谱分量两次。
上面所提到的HFR申请描述了可以包含到编码系统中以便改进合成信号的感觉质量的其他考虑。一个考虑是根据需要修改转换的频谱分量以便确保在已转换信号中维持一致相位的特征。在本发明的优选实现中,限制频率变换的量,以便已转换分量维持一致相位而不需任何进一步的修改。例如对于使用TDAC变换的实现,这可以通过确保转换量是一个偶数来实现。
另一个考虑是音频信号的类似噪声或类似音调的特征。在许多情况下,音频信号的高频部分比低频部分更像噪声。如果低频基带信号更像音调并且高频剩余信号更像噪声,那么频率变换将产生比原始剩余信号更像音调的高频合成信号。信号高频部分的特征的改变可能导致可听得到的劣化,但是通过下面所述的合成技术可以降低或避免劣化的可听度,这种合成技术使用频率变换和噪声产生来保持高频部分的类似噪声的特征。
在一个信号的低频和高频部分都类似音调的其他情况下,频率变换仍然可能导致听得出的劣化,因为所转换的频谱分量不保持原始剩余信号的谐波结构。通过限制要通过频率变换合成的剩余信号的最低频率可以降低或避免这种听得到的劣化影响。HFR申请建议用于转换的最低频率应该不低于大约5kHz。
2.噪声产生
可以用来产生合成信号的第二种技术是例如通过产生一个伪随机数序列以表示时域信号的抽样来合成类似噪声的信号。这种特定的技术有一个缺点,就是必须使用分析滤波器组来得到所产生的信号的频谱分量以用于随后的信号合成。作为替换,可以通过使用伪随机数产生器直接产生这些频谱分量来产生类似噪声的信号。任何一种方法都可以通过下式示意性地表示:
Y(j)=N(j)                       (6)
这里,N(j)=类似噪声的信号的频谱分量j。
但是根据任何一种方法,编码处理都可以合成该类似噪声的信号。产生该信号所需要的附加计算资源增加了编码处理的复杂性和实现成本。
3.转换和噪声
用于信号合成的第三种方法是组合基带信号的频率变换和合成的类似噪声信号的频谱分量。在一个优选实现中,根据在已编码信号中传送的噪声混合控制信息,如在HFR申请中所描述的那样适配所转换信号和类似噪声信号的相对部分。该方法可以表示为:
Y(j)=a·X(k)+b·N(j)                (7)
这里,a=用于所转换频谱分量的混合参数;以及
b=用于类似噪声的频谱分量的混合参数。
在一种实现中,通过取频谱平坦度量(SFM)的平方根来计算混合参数b,频谱平坦度量等于频谱分量值的几何平均与算术平均的比值的对数,其被定标并且限制在从零到一的范围内变化。对于这种特定实现,b=1指示类似噪声的信号。优选地,混合参数a如下式所示从b推导出来:
a = c - b 2 - - - ( 8 )
这里,c是常数。
在一个优选实现中,公式8中的常数c等于一并且产生类似噪声的信号,以便它的频谱分量N(j)具有均值零和统计上等效于与它们组合的转换频谱分量的能量度量的能量度量。如公式7所示,合成处理可以混合类似噪声信号的频谱分量和所转换频谱分量。在该合成信号中的频率子带p的能量可以根据下式计算:
ES ( p ) = Σ j ∈ { P } Y 2 ( j ) = Σ k ∈ { M , } , j ∈ { P } [ a · X ( k ) + b · N ( j ) ] 2 - - - ( 9 )
在一个替换实现中,混合参数表示频率的规定函数或者它们明确地传送频率的函数a(j)和b(j),该函数指示原始输入音频信号的类似噪声特征如何随频率变化。在另一个替换中,为各个频率子带提供混合参数,这基于可为每个子带计算的噪声度量。
通过编码和解码处理执行对合成信号的能量度量的计算。包括类似噪声的信号的频谱分量的计算是不希望的,因为仅仅为了执行这些能量计算的目的,该编码处理必须使用附加的计算资源来合成类似噪声的信号。编码处理为任何其他目的并不需要合成信号本身。
上面所述的优选实现允许编码处理得到公式7中所示的合成信号的频谱分量的能量度量,而不需合成类似噪声的信号,因为所合成信号中的频谱分量的频率子带的能量在统计上独立于类似噪声的信号的频谱能量。编码处理可以仅仅基于所转换的频谱分量来计算能量度量。以这种方式计算的能量度量平均来说是实际能量的精确度量。因此,该编码处理可以根据公式5仅仅从基带信号的频率子带m的能量度量为频率子带p计算一个定标因子。
在一个替换实现中,通过已编码信号而不是定标因子来传送频谱能量度量。在该替换实现中,产生类似噪声的信号,以便它的频谱分量具有等于零的均值以及等于一的方差,并且定标所转换频谱分量,以便他们的方差为一。如公式7所示通过组合分量所得到的合成信号的频谱能量平均来说等于常数c。解码处理可以对该合成信号定标,以便具有与原始剩余信号相同的能量度量。如果常数c不等于一,那么定标处理还应该考虑该常数。
D.耦合
通过在编码系统中使用耦合,对于解码信号中的给定感觉信号质量水平,可以达到已编码信号的信息要求的降低,其中该编码系统产生表示两个或更多个声道的音频信号的已编码信号。
1.编码器
图5和6描述了音频编码器,其从路径9a和9b接收两个声道的输入音频信号,并且沿路径51产生表示这两个声道的输入音频信号的一个已编码信号。分析滤波器组10a和10b、能量计算器31a、32a、31b和32b、合成模型21a和21b、定标因子计算器40a和40b以及格式化器50的细节和特点基本上与针对图1中所示的单声道编码器的部件所描述的那些相同。
a)共同特点
图5和6中的编码器类似。在讨论不同点之前描述对这两种实现来说共同的特点。
参照图5和6,分析滤波器组10a和10b分别沿路径13a和13b产生频谱分量,他们表示在第三组频率子带中的一个或多个子带中的各自输入音频信号的频谱分量。在优选实现中,第三组频率子带是一个或多个中间频率子带,在第一组频率子带中的低频子带之上并且在第二组频率子带中的高频子带之下。能量计算器35a和35b各计算在一个或多个频率子带中的频谱能量的一个或多个度量。优选地,这些频率子带具有与人听觉系统的临界频带相当的带宽,并且能量计算器35a和35b为这些频率子带中每一个提供一个能量度量。
耦合器26沿着路径27产生一个耦合声道信号,该信号的频谱分量表示从路径13a和13b接收的频谱分量的复合。该复合表示可以以各种方式形成。例如,可以根据从路径13a和13b接收的相应频谱分量值的和或平均计算复合表示中的每个频谱分量。能量计算器37计算在该耦合声道信号的一个或多个频率子带中频谱能量的一个或多个度量。在一个优选实现中,这些频率子带具有与人听觉系统的临界频带相当的带宽,并且能量计算器37为这些频率子带中每一个提供能量度量。
定标因子计算器44从能量计算器35a、35b和37中每一个接收一个或多个能量度量并且如上所述计算定标因子。沿路径45a和45b分别传递表示用于耦合声道信号中所表示的每个输入音频信号的定标因子的定标信息。可以如上所述编码该定标信息。在一个优选实现中,如下式中任一个所表示的那样,为每个频率子带中的每个输入声道信号计算一个定标因子。
SF i ( m ) = E i ( m ) EC ( m ) - - - ( 10 a )
SF i ( m ) = E i ( m ) EC ( m ) - - - ( 10 b )
这里,SFi(m)=用于信号声道i的频率子带m的定标因子;
Ei(m)=用于输入信号声道i的频率子带m的能量度量;以及
EC(m)=用于耦合声道的频率子带m的能量度量。
格式化器50从路径41a、41b、45a和45b接收定标信息,从路径12a和12b接收表示基带信号的频谱分量的信息,以及从路径27接收表示该耦合声道信号的频谱分量的信息。如上所述将这些信息汇编到一个用于传输或记录的已编码信号中。
图5和6中所示的编码器和图7中所示的解码器是双声道装置;但是,本发明的各方面可以应用到用于更多声道的编码系统。说明书和附图提到双声道实现仅仅是为了解释和图示的方便。
b)不同特点
可以将耦合声道信号中的频谱分量在解码处理中用于HFR。在这种实现中,编码器应该为解码处理在已编码信号中提供控制信息,以便在从耦合声道信号产生合成信号中使用。该控制信息可以以许多方式来产生。
在图5中描述了一种方式。根据该实现,合成模型21a响应于从路径12a接收的基带频谱分量,并且响应于从路径13a接收的频谱分量,后者将通过耦合器26耦合。合成模式21a、相关的能量计算器31a和32a以及定标因子计算器40a以类似于上面讨论的计算的方式执行计算。表示这些定标因子的定标信息沿路径41a传递给格式化器50。该格式化器还从路径41b接收定标信息,该定标信息表示以类似方式为来自路径12b和13b的频谱分量所计算的定标因子。
在图5所示编码器的一个替换实现中,如上所讨论的,合成模型21a独立于来自路径12a和13a中任一个或两者的频谱分量而操作,并且合成模型21b独立于来自路径12b和13b中任一个或两者的频谱分量而操作。
在另一个实现中,没有为耦合声道信号和/或基带信号计算用于HFR的定标因子。作为替代,频谱能量度量的表示传递给格式化器50并且包含在已编码信号中,而不是相应的定标因子的表示。这种实现增加了解码处理的计算复杂性,因为解码处理必须计算这些定标因子中至少一些;但是,它降低了编码处理的计算复杂性。
图6中描述了另一种产生控制信息的方式。根据该实现,定标部件91a和91b从路径27接收耦合声道信号并从定标因子计算器44接收定标因子,并且执行等效于在下面讨论的解码处理中执行的处理的处理以从耦合声道信号产生去耦信号。这些去耦信号传递给合成模型21a和21b,并且以类似于在上面结合图5所讨论的方式计算这些定标因子。
在图6所示编码器的一个替换实现中,如果频谱能量度量和定标因子的计算不需要基带信号和/或耦合声道信号的频谱分量的话,合成模型21a和21b可以独立于基带信号和/或耦合声道信号的频谱分量进行操作。此外,如果HFR不使用耦合声道信号中的频谱分量,那么合成模型可以独立于耦合声道信号进行操作。
2.解码器
图7描述了一个音频解码器,其从路径59接收表示两个声道的输入音频信号的一个已编码信号并且沿路径89a和89b产生这些信号的解码表示。去格式化器60、信号合成部件23a和23b、信号定标部件70a和70b以及合成滤波器组80a和80b的细节和特点基本上与上面对图2中所示的单声道解码器的部件描述的那些是相同的。
去格式化器60从该已编码信号得到一个耦合声道信号和一组耦合定标因子。该耦合声道信号沿着路径64传递,其频谱分量表示在两个输入音频信号中的频谱分量的复合。用于这两个输入音频信号中每一个的耦合定标因子分别沿路径63a和63b传递。
信号定标部件92a沿路径93a产生一个去耦信号的频谱分量,这些频谱分量近似于在原始输入音频信号之一中的相应频谱分量的频谱能量水平。通过将该耦合声道信号中的每个频谱分量与一个合适的耦合定标因子相乘,可以产生这些去耦频谱分量。在将该耦合声道信号的频谱分量安排到频谱子带中并且为每个子带提供一个定标因子的实现中,可以根据下式产生一个去耦信号的频谱分量。
XDi(k)=SFi(m)·XC(k)               (11)
这里,XC(k)=该耦合声道信号的子带m中的频谱分量k;
SFi(m)=用于信号声道i的频率子带m的定标因子;以及
XDi(k)=用于信号声道i的去耦频谱分量k。
每个去耦信号都传递到一个相应的合成滤波器组中。在上述的优选实现中,每个去耦信号的频谱分量都在第三组频率子带中的一个或多个频率子带中,该第三组频率子带在第一和第二组频率子带的频率子带的中间。
如果信号合成需要去耦频谱分量的话,去耦频谱分量还传递到一个相应的信号合成部件23a或23b中。
E.自适应带化(banding)
如上所讨论的将频谱分量安排到两或三组频率子带中的编码系统可以适配包含在每组中的子带的频率范围。例如,有利的是,在具有被认为是类似噪声的高频频谱分量的输入音频信号各时段,降低用于剩余信号的第二组频率子带的频率范围的较低端。还可以适配频率范围,以便去除一组频率子带中的所有子带。例如,可以通过从第二组频率子带中去除所有子带,对幅度具有大的突然变化的输入音频信号禁止HFR处理。
图3和4描述了一种方式,在该方式下为了任何原因,包括对输入音频信号的一个或多个特征的响应,都可以适配基带、剩余和/或耦合声道信号的频率范围。为了实现该特点,图1、5、6和8中所示的分析滤波器组中每一个都可以由图3中所示的装置代替,并且图2和7中所示的分析滤波器组中每一个都可以由图4中所示的装置来代替。这些图表示了频率子带如何适应三组频率子带;但是,可以使用同样的实现原理来适应不同数量的频率子带组。
参照图3,分析滤波器组14从路径9接收一个输入音频信号并且作为响应产生一组频率子带信号,传递给自适应带化部件15。信号分析部件17分析直接从输入音频信号推导出来的和/或从子带信号推导出来的信息,并且响应于该分析产生频带控制信息。该频带控制信息传递给自适应带化部件15,并且它沿路径18将该频带控制信息传递给格式化器50。格式化器50将该频带控制信息的表示包括在已编码信号中。
该自适应带化部件15通过将频率子带信号频谱分量分配给各组频率子带来响应该频带控制信息。沿路径12传递分配给第一组子带的频谱分量。沿路径11传递分配给第二组子带的频谱分量。沿路径13传递分配给第三组子带的频谱分量。如果存在没有包含在任何一组中的一个频率范围或间隔,那么通过不分配该范围或间隔中的频谱分量给任何一组,就可以达到此目的。
信号分析部件17还可以产生频带控制信息以响应于与该输入音频信号无关的条件适配频率范围。例如,可响应于表示信号质量的期望水平或者传送或记录已编码信号的可用容量的一个信号来适配这些范围。
频带控制信息可以以许多形式产生。在一种实现中,频带控制信息规定了频谱分量要被分配到的每个组的最低和/或最高频率。在另一种实现中,频带控制信息规定了多个预定义频率范围安排之一。
参照图4,自适应带化部件81从路径71、93和62接收各组频谱分量,并且它从路径68接收频带控制信息。通过去格式化器60从已编码信号得到频带控制信息。自适应带化部件81通过将接收到的各组频谱分量中的频谱分量分配到一组频率子带信号中来响应频带控制信息,该组频率子带信号被传递给合成滤波器组82。合成滤波器组82响应于频率子带信号沿路径89产生一个输出音频信号。
F.第二分析滤波器组
在用诸如上面提到的TDAC变换这样的变换来实现分析滤波器组10的音频编码器中根据公式1a计算的频谱能量度量往往低于输入音频信号的真实频谱能量,因为分析滤波器组仅仅提供了实数值变换系数。使用像离散傅立叶变换(DFT)这样的变换的实现能够提供更精确的能量计算,因为每个变换系数都由一个复数值表示,该复数值更精确地传送每个频谱分量的真实幅度。
通过使用第二分析滤波器组,可以克服基于从如TDAC变换这样的变换得到的仅有实数值的变换系数的能量计算的固有不精确性,该第二分析滤波器组具有正交于分析滤波器组10的基底函数的基底函数。图8示出了一个音频编码器,其类似于图1中所示的编码器,但是包括第二分析滤波器组19。如果该编码器使用TDAC变换的MDCT来实现分析滤波器组10,那么可以使用一个相应的改进离散正弦变换(MDST)来实现第二分析滤波器组19。
能量计算器39根据下式计算频谱能量的更精确度量E’(k):
E ′ ( k ) = X 1 2 ( k ) + X 2 2 ( k ) - - - ( 12 )
这里,X1(k)=来自第一分析滤波器组的变换系数k;以及
X2(k)=来自第二分析滤波器组的变换系数k。
在为频率子带计算能量度量的实现中,能量计算器39根据下式为频率子带m计算度量:
E ′ ( m ) = Σ k ∈ { M } X 1 2 ( k ) + X 2 2 ( k ) - - - ( 13 )
定标因子计算器49以类似于公式3a或3b的方式根据这些更精确能量度量计算定标因子SF’(m)。在公式14中表示了类似于公式3a的计算:
SF ′ ( m ) = E ′ ( m ) ES ( m ) = Σ k ∈ { M } X 1 2 ( k ) + X 2 2 ( k ) Σ k ∈ { M } Y 2 ( k ) - - - ( 14 )
当使用根据这些更精确的能量度量计算的定标因子SF’(m)时,应该注意一些。根据更精确定标因子SF’(m)定标的合成信号频谱分量几乎肯定会畸变一个信号的基带部分与再生的合成部分的相对频谱平衡,因为更精确的能量度量总是大于或等于仅仅从实数值变换系数计算的能量度量。可以补偿该差别的一种方式是将更精确的能量度量减半,因为平均来说更精确度量是较低精确度量的两倍大。这种减小将在一个信号的基带和合成部分中提供一个在统计上一致的能量水平,同时保持了更精确频谱能量度量的好处。
可能有用的是指出即使可以从第二滤波器组19得到附加系数,公式14中的比例的分母也应该仅仅根据来自分析滤波器组10的实数值变换系数计算。定标因子的计算应该以这种方式来完成,因为在解码处理期间执行的定标将基于合成频谱分量,这些合成频谱分量仅类似于从分析滤波器组10得到的变换系数。解码处理将不使用相应于或可以从由第二分析滤波器组19得到的频谱分量推导出来的任何系数。
G.实现
本发明的各方面可以以多种方式实现,包括在通用计算机系统中或者在某种其他设备中的软件,该其它设备包括更多诸如数字信号处理器(DSP)电路这样的专用部件,这些专用部件耦合到类似于在通用计算机系统中可以找到的那些部件的部件上。图9是可以用来在音频编码器或音频解码器中实现本发明的各方面的装置90的框图。DSP94提供计算资源。RAM 95是用于信号处理的DSP 94所使用的系统随机存取存储器(RAM)。ROM 96表示某种形式的永久存储器,例如只读存储器(ROM),用于存储操作装置90以及执行本发明的各方面所需要的程序。I/O控制器97表示用来通过通信信道98、99接收和传送信号的接口电路。模数转换器和数模转换器可以根据需要包括在I/O控制器97中,用来接收和/或传送模拟音频信号。在所示的实施例中,所有主要系统部件都连接到总线100上,该总线可以表示多于一个的物理总线;但是,实现本发明并不需要总线结构。
在通用计算机系统中实现的实施例中,为了接口到诸如键盘或鼠标和显示器这样的装置上,以及为了控制具有存储媒体的存储器装置,可以包括附加部件,其中存储媒体例如是磁带或盘、或光媒体。存储媒体可用来记录用于操作系统、实用和应用的指令程序,并且可以包括实现本发明的各方面的程序的实施例。
实践本发明的各方面所需要的功能可以通过以多种方式实现的部件来执行,这些部件包括分立逻辑部件、集成电路、一个或多个ASIC和/或受程序控制的处理器。实现这些部件的方式对于本发明来说并不重要。
通过多种机器可读媒体或者基本上使用任何记录技术传送信息的存储媒体可以传送本发明的软件实现,机器可读媒体例如是基带或包括从超声波到紫外频率的整个频谱中的调制通信路径,所述记录技术包括磁带、卡或盘、光卡或盘以及在像纸张这样的媒体上的可检测标记。

Claims (43)

1.一种用于编码一个或多个输入音频信号的方法,包括:
接收该一个或多个输入音频信号并且从中得到一个或多个基带信号和一个或多个剩余信号,其中一个基带信号的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量,并且在一个相关剩余信号中的频谱分量表示在该基带信号所没有表示的第二组频率子带中的该相应输入音频信号的频谱分量;
得到将在解码期间产生的一个或多个合成信号的至少一些频谱分量的能量度量,其中该一个或多个合成信号具有在该第二组频率子带内的频谱分量;
得到每个剩余信号的至少一些频谱分量的能量度量;
通过得到在所述剩余信号中的频谱分量的能量度量与在该一个或多个合成信号中的频谱分量的能量度量的比值的平方根、在该一个或多个合成信号中的频谱分量的能量度量与在所述剩余信号中的频谱分量的能量度量的比值的平方根、在所述剩余信号中的频谱分量的能量度量的平方根与在该一个或多个合成信号中的频谱分量的能量度量的平方根的比值、或者在该一个或多个合成信号中的频谱分量的能量度量的平方根与在所述剩余信号中的频谱分量的能量度量的平方根的比值,计算定标因子;以及
将信号信息和定标信息汇编到已编码信号中,其中该信号信息表示在该一个或多个基带信号中的频谱分量并且该定标信息表示定标因子。
2.根据权利要求1的方法,其中该一个或多个合成信号将至少部分地通过该一个或多个基带信号中的至少一些频谱分量的频率变换来产生。
3.根据权利要求2的方法,合成信号的频谱分量将通过保持相位相关性的频率变换来产生。
4.根据权利要求1的方法,其中,将至少部分地通过组合该一个或多个基带信号中的至少一些频谱分量的频率变换和一个或多个类似噪声的信号的产生来产生该一个或多个合成信号,所述类似噪声的信号具有根据该一个或多个基带信号中的谱级适配的谱级,并且其中,在不考虑所述类似噪声的信号中的谱级的情况下得到在该一个或多个合成信号中的频谱分量的能量度量。
5.根据权利要求1的方法,其中该一个或多个合成信号将至少部分地通过产生一个或多个类似噪声的信号来产生。
6.根据权利要求1的方法,其中所述剩余信号的频谱分量的能量度量从表示这些频谱分量的幅度的值得到。
7.根据权利要求6的方法,还包括:
将第一分析滤波器组应用于该一个或多个输入音频信号以得到该一个或多个基带信号和该一个或多个剩余信号;以及
将第二分析滤波器组应用于该一个或多个输入音频信号以得到附加频谱分量;
其中,从所述剩余信号的频谱分量和所述附加频谱分量中的一个或多个计算所述剩余信号中的频谱分量的能量度量。
8.根据权利要求1的方法,其中该定标信息表示相对于一个或多个归一化值被归一化的定标因子,并且其中该定标信息包括该一个或多个归一化值的表示。
9.根据权利要求8的方法,其中从一组值中选择该一个或多个归一化值。
10.根据权利要求8的方法,其中该一个或多个归一化值包括定标因子的最大容许值。
11.根据权利要求1的方法,为各个剩余信号的一个或多个频率子带计算一个定标因子。
12.根据权利要求11的方法,其中适配所述各组频率子带中一组或多组的频率范围,并且其中该方法在该已编码信号中汇编所适配频率范围的指示。
13.根据权利要求12的方法,其中通过从一组范围中选择来适配所述频率范围。
14.根据权利要求1的用于多个输入音频信号的方法,包括:
从该多个输入音频信号得到一个耦合声道信号,该耦合声道信号的频谱分量表示第三组频率子带中的所述输入音频信号中两个或更多个的频谱分量的复合;
得到该耦合声道信号的至少一些频谱分量的能量度量;
得到在该第三组频率子带中的耦合声道信号所表示的所述两个或更多个输入音频信号的至少一些频谱分量的能量度量;以及
通过得到在该两个或更多个输入音频信号中的频谱分量的能量度量与在该耦合声道信号中的频谱能量的能量度量的比值的平方根、在该耦合声道信号中的频谱能量的能量度量与在该两个或更多个输入音频信号中的频谱分量的能量度量的比值的平方根、在该两个或更多个输入音频信号中的频谱分量的能量度量的平方根与在该耦合声道信号中的频谱能量的能量度量的平方根的比值、或者在该耦合声道信号中的频谱能量的能量度量的平方根与在该两个或更多个输入音频信号中的频谱分量的能量度量的平方根的比值,计算耦合定标因子;
其中该定标信息还表示这些耦合定标因子并且该信号信息还表示该耦合声道信号中的频谱分量。
15.根据权利要求14的方法,其中该一个或多个合成信号将至少部分地通过在该第三组频率子带中的输入音频信号的至少一些频谱分量的频率变换来产生。
16.根据权利要求14的方法,包括:
检测该多个输入音频信号的一个或多个特性;
响应于所检测的特性,适配该第一组频率子带、该第二组频率子带或该第三组频率子带的频率范围;以及
在该已编码信号中汇编所适配频率范围的指示。
17.根据权利要求1的方法,包括:
检测该一个或多个输入音频信号的一个或多个特性;
响应于所检测的特性,适配该第一组频率子带或该第二组频率子带的频率范围;以及
在该已编码信号中汇编所适配频率范围的指示。
18.一种用于解码表示一个或多个输入音频信号的已编码信号的方法,包括:
从该已编码信号中得到定标信息和信号信息,其中该定标信息表示从频谱分量的能量度量的比值的平方根或者频谱分量的能量度量的平方根的比值所计算的定标因子,并且该信号信息表示一个或多个基带信号的频谱分量,其中在每个基带信号中的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量;
为每个相应的基带信号产生一个相关的合成信号,该合成信号具有该相应基带信号所没有表示的第二组频率子带中的频谱分量,其中根据一个或多个所述定标因子通过乘法或除法对该相关合成信号中的频谱分量定标;以及
产生一个或多个输出音频信号,其中每个输出音频信号表示一个相应的输入音频信号并且从相应基带信号及其相关合成信号中的频谱分量产生。
19.根据权利要求18的方法,其中该相关合成信号至少部分地通过在相应基带信号中的至少一些频谱分量的频率变换来产生。
20.根据权利要求19的方法,其中频率变换保持相位相关性。
21.根据权利要求18的方法,其中该相关合成信号至少部分地通过产生一个类似噪声的信号来产生,该类似噪声的信号具有根据一个或多个所述定标因子适配的谱级。
22.根据权利要求18的方法,从该已编码信号中得到一个或多个归一化值并且撤销所述定标因子相对于该一个或多个归一化值的归一化。
23.根据权利要求22的方法,其中通过定标信息在该已编码信号中传送该一个或多个归一化值,该定标信息表示在一组值中的选定值。
24.根据权利要求22的方法,其中该一个或多个归一化值包括定标因子的最大容许值。
25.根据权利要求18的方法,其中该相关合成信号的频率子带与一个相应的定标因子相关。
26.根据权利要求25的方法,响应于在该已编码信号中传送的子带信息适配该相关合成信号的产生,其中该子带信息规定所述频率子带的频率范围。
27.根据权利要求26的方法,其中该子带信息表示在一组范围中的选定频率范围。
28.根据权利要求18的用于解码表示多个输入音频信号的信号的方法,包括:
从该已编码信号得到一个耦合声道信号,该耦合声道信号的频谱分量表示第三组频率子带中的该多个输入音频信号中两个或更多个的复合,其中该定标信息还表示耦合定标因子,这些耦合定标因子是从以下计算的:在该第三组频率子带中的该两个或更多个输入音频信号的频谱分量的能量度量与在该耦合声道信号中的频谱能量的能量度量的比值的平方根、在该耦合声道信号中的频谱能量的能量度量与在该第三组频率子带中的该两个或更多个输入音频信号的频谱分量的能量度量的比值的平方根、在该第三组频率子带中的该两个或更多个输入音频信号的频谱分量的能量度量的平方根与在该耦合声道信号中的频谱能量的能量度量的平方根的比值、或者在该耦合声道信号中的频谱能量的能量度量的平方根与在该第三组频率子带中的该两个或更多个输入音频信号的频谱分量的能量度量的平方根的比值;以及
从该耦合声道信号为该耦合声道信号所表示的该两个或更多个输入音频信号中每一个产生一个相应的去耦信号,其中这些去耦信号具有在该第三组频率子带中的频谱分量,这些频率分量根据一个或多个所述耦合定标因子通过乘法或除法来定标;
其中,还从各个去耦信号中的频谱分量产生表示该两个或更多个输入音频信号的输出音频信号。
29.根据权利要求28的方法,其中该相关合成信号至少部分地通过在该第三组频率子带中的至少一些频谱分量的频率变换来产生。
30.根据权利要求28的方法,包括:
从该已编码信号中得到该第一、第二或第三组频率子带的频率范围的指示;以及
响应于该指示适配合成信号和去耦信号的产生。
31.根据权利要求18的方法,包括:
从该已编码信号中得到该第一或第二组频率子带的频率范围的指示;以及
响应于该指示适配合成信号和去耦信号的产生。
32.一种用于编码多个输入音频信号的方法,包括:
接收该多个输入音频信号并且从中得到多个基带信号、多个剩余信号以及一个耦合声道信号,其中一个基带信号的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量并且一个相关剩余信号的频谱分量表示在该基带信号所没有表示的第二组频率子带中的该相应输入音频信号的频谱分量,并且其中该耦合声道信号的频谱分量表示在第三组频率子带中的两个或更多个所述输入音频信号的频谱分量的复合;
得到每个剩余信号和该耦合声道信号所表示的该两个或更多个输入音频信号的至少一些频谱分量的能量度量;以及
将控制信息和信号汇编到已编码信号中,其中该控制信息从所述能量度量中推导出来并且其中该信号信息表示在该多个基带信号和该耦合声道信号中的频谱分量。
33.根据权利要求32的方法,包括:
得到将在解码期间产生的一个或多个合成信号的至少一些频谱分量的能量度量,其中该一个或多个合成信号具有在该第二组频率子带内的频谱分量;以及
通过计算这些能量度量的比值的平方根或这些能量度量的平方根的比值推导至少一些所述控制信息。
34.根据权利要求33的方法,其中该一个或多个合成信号的至少一些频谱分量将从该第三组频率子带中的频谱分量合成。
35.根据权利要求32的方法,其中适配所述各组频率子带的频率范围,并且其中该方法将所适配的频率范围的指示汇编到该已编码信号中。
36.一种用于解码表示多个输入音频信号的已编码信号的方法,包括:
从该已编码信号得到控制信息和信号信息,其中该控制信息是从频谱分量的能量度量推导出来的并且该信号信息表示多个基带信号和一个耦合声道信号的频谱分量,其中在每个基带信号中的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量并且该耦合声道信号的频谱分量表示该多个输入音频信号中两个或更多个的第三组频率子带中的频谱分量的复合;
为每个相应的基带信号产生一个相关合成信号,该合成信号具有该相应基带信号所没有表示的第二组频率子带中的频谱分量,其中根据该控制信息对该相关合成信号中的频谱分量定标;
从该耦合声道信号为该耦合声道信号所表示的所述两个或更多个输入音频信号中每一个产生一个相应去耦信号,其中去耦信号具有该第三组频率子带中的根据该控制信息所定标的频谱分量;以及
产生多个输出音频信号,其中每个输出音频信号表示一个相应的输入音频信号并且是从一个相应基带信号及其相关合成信号中的频谱分量产生的,并且其中表示该两个或更多个音频信号的输出音频信号也是从相应的去耦信号中的频谱分量产生的。
37.根据权利要求36的方法,其中该控制信息传送从能量度量的比值的平方根或者能量度量的平方根的比值所计算的定标因子的表示,并且其中在这些比值中的一些能量度量表示所述合成信号的至少一些频谱分量的能量。
38.根据权利要求37的方法,其中从该第三组频率子带中的频谱分量合成该一个或多个合成信号的至少一些频谱分量。
39.根据权利要求36的方法,其中响应于该控制信息适配所述各组频率子带中的一组或多组的频率范围。
40.一种用于编码一个或多个输入音频信号的编码器,其中该编码器具有执行信号处理方法的处理电路,该信号处理方法包括:
接收该一个或多个输入音频信号并且从中得到一个或多个基带信号和一个或多个剩余信号,其中一个基带信号的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量,并且在一个相关剩余信号中的频谱分量表示在该基带信号所没有表示的第二组频率子带中的该相应输入音频信号的频谱分量;
得到将在解码期间产生的一个或多个合成信号的至少一些频谱分量的能量度量,其中该一个或多个合成信号具有在该第二组频率子带内的频谱分量;
得到每个剩余信号的至少一些频谱分量的能量度量;
通过得到在所述剩余信号中的频谱分量的能量度量与在该一个或多个合成信号中的频谱分量的能量度量的比值的平方根、在该一个或多个合成信号中的频谱分量的能量度量与在所述剩余信号中的频谱分量的能量度量的比值的平方根、在所述剩余信号中的频谱分量的能量度量的平方根与在该一个或多个合成信号中的频谱分量的能量度量的平方根的比值、或者在该一个或多个合成信号中的频谱分量的能量度量的平方根与在所述剩余信号中的频谱分量的能量度量的平方根的比值,计算定标因子;以及
将信号信息和定标信息汇编到已编码信号中,其中该信号信息表示在该一个或多个基带信号中的频谱分量并且该定标信息表示定标因子。
41.一种用于解码表示一个或多个输入音频信号的编码信号的解码器,其中该解码器具有执行信号处理方法的处理电路,该信号处理方法包括:
从该已编码信号中得到定标信息和信号信息,其中该定标信息表示从频谱分量的能量度量的比值的平方根或者频谱分量的能量度量的平方根的比值所计算的定标因子,并且该信号信息表示一个或多个基带信号的频谱分量,其中在每个基带信号中的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量;
为每个相应的基带信号产生一个相关的合成信号,该合成信号具有该相应基带信号所没有表示的第二组频率子带中的频谱分量,其中根据一个或多个所述定标因子通过乘法或除法对该相关合成信号中的频谱分量定标;以及
产生一个或多个输出音频信号,其中每个输出音频信号表示一个相应的输入音频信号并且从相应基带信号及其相关合成信号中的频谱分量产生。
42.一种用于编码多个输入音频信号的编码器,其中该编码器具有执行信号处理方法的处理电路,该信号处理方法包括:
接收该多个输入音频信号并且从中得到多个基带信号、多个剩余信号以及一个耦合声道信号,其中一个基带信号的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量并且一个相关剩余信号的频谱分量表示在该基带信号所没有表示的第二组频率子带中的该相应输入音频信号的频谱分量,并且其中该耦合声道信号的频谱分量表示在第三组频率子带中的两个或更多个所述输入音频信号的频谱分量的复合;
得到每个剩余信号和该耦合声道信号所表示的该两个或更多个输入音频信号的至少一些频谱分量的能量度量;以及
将控制信息和信号汇编到已编码信号中,其中该控制信息从所述能量度量中推导出来并且其中该信号信息表示在该多个基带信号和该耦合声道信号中的频谱分量。
43.一种用于解码表示多个输入音频信号的已编码信号的解码器,其中该解码器具有执行信号处理方法的处理电路,该信号处理方法包括:
从该已编码信号得到控制信息和信号信息,其中该控制信息是从频谱分量的能量度量推导出来的并且该信号信息表示多个基带信号和一个耦合声道信号的频谱分量,其中在每个基带信号中的频谱分量表示在第一组频率子带中的一个相应输入音频信号的频谱分量并且该耦合声道信号的频谱分量表示该多个输入音频信号中两个或更多个的第三组频率子带中的频谱分量的复合;
为每个相应的基带信号产生一个相关合成信号,该合成信号具有该相应基带信号所没有表示的第二组频率子带中的频谱分量,其中根据该控制信息对该相关合成信号中的频谱分量定标;
从该耦合声道信号为该耦合声道信号所表示的所述两个或更多个输入音频信号中每一个产生一个相应去耦信号,其中去耦信号具有该第三组频率子带中的根据该控制信息所定标的频谱分量;以及
产生多个输出音频信号,其中每个输出音频信号表示一个相应的输入音频信号并且是从一个相应基带信号及其相关合成信号中的频谱分量产生的,并且其中表示该两个或更多个音频信号的输出音频信号也是从相应的去耦信号中的频谱分量产生的。
CNB200480011250XA 2003-05-08 2004-04-30 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法 Active CN100394476C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/434,449 2003-05-08
US10/434,449 US7318035B2 (en) 2003-05-08 2003-05-08 Audio coding systems and methods using spectral component coupling and spectral component regeneration

Publications (2)

Publication Number Publication Date
CN1781141A CN1781141A (zh) 2006-05-31
CN100394476C true CN100394476C (zh) 2008-06-11

Family

ID=33416693

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200480011250XA Active CN100394476C (zh) 2003-05-08 2004-04-30 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法

Country Status (19)

Country Link
US (1) US7318035B2 (zh)
EP (5) EP1620845B1 (zh)
JP (1) JP4782685B2 (zh)
KR (1) KR101085477B1 (zh)
CN (1) CN100394476C (zh)
AU (1) AU2004239655B2 (zh)
BR (1) BRPI0410130B1 (zh)
CA (1) CA2521601C (zh)
DK (1) DK1620845T3 (zh)
ES (2) ES2664397T3 (zh)
HU (1) HUE045759T2 (zh)
IL (1) IL171287A (zh)
MX (1) MXPA05011979A (zh)
MY (1) MY138877A (zh)
PL (1) PL1620845T3 (zh)
PT (1) PT2535895T (zh)
SI (1) SI2535895T1 (zh)
TW (1) TWI324762B (zh)
WO (1) WO2004102532A1 (zh)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100537517B1 (ko) * 2004-01-13 2005-12-19 삼성전자주식회사 오디오 데이타 변환 방법 및 장치
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
CN1954363B (zh) * 2004-05-19 2011-10-12 松下电器产业株式会社 编码装置和编码方法
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7676360B2 (en) * 2005-12-01 2010-03-09 Sasken Communication Technologies Ltd. Method for scale-factor estimation in an audio encoder
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8706507B2 (en) * 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US8675771B2 (en) * 2006-09-29 2014-03-18 Nec Corporation Log likelihood ratio arithmetic circuit, transmission apparatus, log likelihood ratio arithmetic method, and program
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
KR20230003596A (ko) 2010-01-19 2023-01-06 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR102304093B1 (ko) 2010-07-19 2021-09-23 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
ES2623291T3 (es) 2011-02-14 2017-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación de una porción de una señal de audio utilizando una detección de transitorios y un resultado de calidad
AR085361A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
ES2458436T3 (es) 2011-02-14 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Representación de señal de información utilizando transformada superpuesta
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
CN105304090B (zh) 2011-02-14 2019-04-09 弗劳恩霍夫应用研究促进协会 使用对齐的前瞻部分将音频信号编码及解码的装置与方法
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2681429T3 (es) * 2011-02-14 2018-09-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido en códecs de audio
BR112014020562B1 (pt) * 2012-02-23 2022-06-14 Dolby International Ab Método, sistema e meio não-transitório legível por computador para determinar um primeiro valor de tonalidade agrupada
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
ES2905846T3 (es) 2013-01-29 2022-04-12 Fraunhofer Ges Forschung Aparato y procedimiento para generar una señal de frecuencia reforzada mediante la suavización temporal de las subbandas
EP3742440A1 (en) * 2013-04-05 2020-11-25 Dolby International AB Audio encoder and decoder for interleaved waveform coding
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830054A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
US10521657B2 (en) 2016-06-17 2019-12-31 Li-Cor, Inc. Adaptive asymmetrical signal detection and synthesis methods and systems
AU2018304166B2 (en) * 2017-07-17 2020-08-27 Li-Cor, Inc. Spectral response synthesis on trace data
RU2744485C1 (ru) * 2017-10-27 2021-03-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Ослабление шума в декодере
CN114708874A (zh) * 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
WO2020092955A1 (en) * 2018-11-02 2020-05-07 Li-Cor, Inc. Adaptive asymmetrical signal detection and synthesis methods and systems
US10958485B1 (en) * 2019-12-11 2021-03-23 Viavi Solutions Inc. Methods and systems for performing analysis and correlation of DOCSIS 3.1 pre-equalization coefficients

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
WO2002041302A1 (en) * 2000-11-15 2002-05-23 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
ES2087522T3 (es) * 1991-01-08 1996-07-16 Dolby Lab Licensing Corp Descodificacion/codificacion para campos sonoros multidimensionales.
JP3076086B2 (ja) * 1991-06-28 2000-08-14 シャープ株式会社 音声合成装置用ポストフィルタ
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3398457B2 (ja) * 1994-03-10 2003-04-21 沖電気工業株式会社 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置
KR960704300A (ko) * 1994-05-25 1996-08-31 이데이 노부유키 부호화 방법, 복호화 방법, 부호화/복호화 방법, 부호화 장치, 복호화 장치 및 부호화/복호화 장치(Encoding method, decoding method, encoding/decoding method, encoding apparatus, decoding apparatus, and encoding/decoding apparatus)
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5937000A (en) * 1995-09-06 1999-08-10 Solana Technology Development Corporation Method and apparatus for embedding auxiliary data in a primary data signal
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6341164B1 (en) * 1998-07-22 2002-01-22 Entrust Technologies Limited Method and apparatus for correcting improper encryption and/or for reducing memory storage
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
US10113858B2 (en) 2015-08-19 2018-10-30 Medlumics S.L. Distributed delay-line for low-coherence interferometry
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
WO2002041302A1 (en) * 2000-11-15 2002-05-23 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods

Also Published As

Publication number Publication date
JP4782685B2 (ja) 2011-09-28
DK1620845T3 (en) 2018-05-07
US7318035B2 (en) 2008-01-08
BRPI0410130A (pt) 2006-05-16
US20040225505A1 (en) 2004-11-11
KR101085477B1 (ko) 2011-11-21
TW200504683A (en) 2005-02-01
EP1620845B1 (en) 2018-02-28
ES2832606T3 (es) 2021-06-10
SI2535895T1 (sl) 2019-12-31
IL171287A (en) 2009-09-22
PT2535895T (pt) 2019-10-24
EP3757994A1 (en) 2020-12-30
EP3093844A1 (en) 2016-11-16
BRPI0410130B1 (pt) 2018-06-05
AU2004239655B2 (en) 2009-06-25
CN1781141A (zh) 2006-05-31
EP3093844B1 (en) 2020-10-21
MXPA05011979A (es) 2006-02-02
CA2521601C (en) 2013-08-20
AU2004239655A1 (en) 2004-11-25
WO2004102532A1 (en) 2004-11-25
PL1620845T3 (pl) 2018-06-29
TWI324762B (en) 2010-05-11
HUE045759T2 (hu) 2020-01-28
EP2535895B1 (en) 2019-09-11
MY138877A (en) 2009-08-28
CA2521601A1 (en) 2004-11-25
EP3757994B1 (en) 2022-04-27
EP1620845A1 (en) 2006-02-01
EP4057282B1 (en) 2023-08-09
KR20060014386A (ko) 2006-02-15
JP2007501441A (ja) 2007-01-25
EP2535895A1 (en) 2012-12-19
ES2664397T3 (es) 2018-04-19
EP4057282A1 (en) 2022-09-14

Similar Documents

Publication Publication Date Title
CN100394476C (zh) 使用频谱分量耦合和频谱分量再生的改进音频编码系统和方法
CN101093670B (zh) 用于产生重建信号的方法
US8843378B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
US9305558B2 (en) Multi-channel audio encoding/decoding with parametric compression/decompression and weight factors
CN103858356B (zh) 基于预测的fm立体声无线电噪声减小
TWI307248B (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CN101356571B (zh) 多声道音频信号的时间与空间成形
KR101184992B1 (ko) 변경된 이산 코사인 변환 계수로부터 유도되는 추정된스펙트럼의 크기와 위상을 이용하는 개선된 코딩 기술
CN103069721B (zh) 降低调频无线电广播噪声中的伪不相关性
CN101548555B (zh) 用于隐藏多通道布置的一条或多条通道中的信息失落的方法
KR100745688B1 (ko) 다채널 오디오 신호 부호화/복호화 방법 및 장치
Suresh et al. Direct MDCT domain psychoacoustic modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangzhou Panyu Juda Car Audio Equipment Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2010990000986

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20101216

EE01 Entry into force of recordation of patent licensing contract

Assignee: Zhejiang BeresonTechnology Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000044

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20110117

EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangzhou Panyu Juda Car Audio Equipment Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000899

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20110915

EE01 Entry into force of recordation of patent licensing contract

Assignee: Desai Video-Audio Science & Technology Co., Ltd., Huizhou City

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000968

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20111012

EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangdong OPPO Mobile Communications Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000215

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20120411

EE01 Entry into force of recordation of patent licensing contract

Assignee: Qingdao Haier Electric Appliance Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000481

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Open date: 20060531

Record date: 20120706

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20060531

Assignee: Lenovo Mobile Communication Technology Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000858

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Record date: 20121129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20060531

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000005

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Record date: 20130106

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20060531

Assignee: Beijing millet Communication Technology Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000048

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Record date: 20130206

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20060531

Assignee: Shenzhen Maxmade Technology Co.,Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2013990000353

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Record date: 20130627

Application publication date: 20060531

Assignee: Beijing Chaoge Digital Technology Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2013990000354

Denomination of invention: Improved audio coding systems and methods using spectral component coupling and spectral component regeneration

Granted publication date: 20080611

License type: Common License

Record date: 20130627

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model