CN101248483A - 多声道音频信号的生成 - Google Patents

多声道音频信号的生成 Download PDF

Info

Publication number
CN101248483A
CN101248483A CNA2006800264569A CN200680026456A CN101248483A CN 101248483 A CN101248483 A CN 101248483A CN A2006800264569 A CNA2006800264569 A CN A2006800264569A CN 200680026456 A CN200680026456 A CN 200680026456A CN 101248483 A CN101248483 A CN 101248483A
Authority
CN
China
Prior art keywords
group
signal
audio
channel
demoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800264569A
Other languages
English (en)
Other versions
CN101248483B (zh
Inventor
D·J·布拉巴特
L·F·维尔莫斯
H·普恩哈根
C·法勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International Ltd.
Koninklijke Philips NV
Dolby Sweden AB
Agere Systems LLC
Original Assignee
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=37398669&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101248483(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV, Coding Technologies Sweden AB, Agere Systems LLC filed Critical Koninklijke Philips Electronics NV
Publication of CN101248483A publication Critical patent/CN101248483A/zh
Application granted granted Critical
Publication of CN101248483B publication Critical patent/CN101248483B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

一种解码器(115)从接收到的第一信号中生成诸如环绕声信号的多声道音频信号。多声道信号包括第二组音频声道并且第一信号包括第一组音频声道。解码器(115)包括接收机(401),其接收第一信号。接收机(401)耦合至估计处理器(405),其响应于第一组音频声道的特性生成用于第二组音频声道的估计的参数数据。估计的参数数据将第二组音频声道的特性与第一组音频声道的特性相关联起来。解码器(115)此外包括空间音频解码器(403),其响应于估计的参数数据解码第一信号以生成包括第二组声道的多声道信号。本发明允许对不是由空间音频编码器编码的信号使用空间音频解码。

Description

多声道音频信号的生成
本发明涉及通过空间音频解码的多声道音频信号的生成,特别地但排它地,涉及从矩阵编码的环绕声立体声信号中的多声道音频信号的生成。
各种源信号的数字编码在最近的十年期间已经变得日益重要,因为数字信号表示和通信日益代替了模拟表示和通信。例如,诸如全球移动通信系统的移动电话系统基于数字语音编码。同样诸如视频和音乐的媒体内容的分发日益基于数字内容编码。
此外,在最近十年中已经有向多声道音频的趋势,尤其是向超出传统立体声信号而扩展的空间音频的趋势。例如,传统的立体声记录只包括两个声道,而现代先进的音频系统典型地使用五个或六个声道,如在流行的5.1环绕声系统中。这提供了更复杂的听觉体验,其中用户可能被声音源所环绕。
对于这种多声道信号的通信已经发展了多种技术和标准。例如,表现5.1环绕系统的六个离散声道可以根据诸如先进音频编码(AAC)或杜比数字标准之类的标准而被发射。
然而,为了提供向后的兼容性,所公知的是将较高数量的声道下混合(down-mix)为较低数量,并且尤其常见的是使用它来将5.1环绕声信号下混合为立体声信号,这允许立体声信号被传统(立体声)解码器再现和5.1信号被环绕声解码器再现。
这种不需要额外多声道信息的用于向后兼容多声道传输的现有方法典型地能够被特性描绘为矩阵式环绕方法。矩阵环绕声编码的例子包括诸如杜比预逻辑II(Dolby Prologic II)和逻辑-7(Logic-7)之类的方法。这些方法的共同原理是它们将输入信号的多声道矩阵乘以合适的非二次矩阵,由此生成具有较低声道数量的输出信号。特别地,矩阵编码器典型地在将环绕声道与前声道和中央声道混合之前对环绕声道应用相移。下混合信号(Lt,Rt)的生成例如可以通过下式给出:
Lt Rt = 1 0 q a . j b . j 0 1 q - b . j - a . j Lf Rf C Ls Rs - - - ( 1 )
因此,左边的下混合信号(Lt)由左前信号(Lf)、乘以系数q的中央信号(c)、相位旋转90度(,j’)并以系数a缩放的左环绕信号(Ls)、以及最后也相位旋转90度并以系数b缩放的右环绕信号(Rs)组成。右边的下混合信号(Rt)也类似地生成。下混合系数通常对于q和a是0.707,对于b是0.408。
对于右下混合信号(Rt)的相反符号的基本原因是在下混合对(Lt,Rt)中环绕声道以相反相位被混合。这个性质帮助解码器从下混合信号对中辨别前和后声道。通过应用分解矩阵(de-matrixing)操作,解码器能够(部分地)从立体声下混合中重构多声道信号。重建的多声道信号有多么精确地类似于原始多声道信号将取决于多声道音频内容的特有性质。
虽然矩阵式环绕声系统提供了向后的兼容性,但是与诸如AAC或杜比数字系统的离散环绕系统/编码器相比,它只能提供低音频质量。
被称为空间音频编码(SAC)的编码/解码技术已经被开发以提供改善的下混合音频信号的质量。在SAC中,解码器将声道下混合至较低数量并另外生成参数数据,其描述多声道信号相对于下混合信号的特性。附加的参数数据然后与下混合信号一起被包括在比特流中,下混合信号典型地是单声道或立体声音频信号。因此,传统解码器能够忽略附加的参数数据并重新生成单声道或立体声信号(或可能是矩阵解码的低质量环绕声信号)。此外,SAC解码器能够提取出参数数据并使用其以生成较高质量的多声道信号。
然而,这个方法带有的问题是许多系统不是为SAC编码信号而装配。例如,许多系统只利用不生成SAC参数数据的矩阵环绕声编码。此外,许多信号和解码器标准不提供允许包括附加参数数据的灵活性,因此需要在配置SAC之前完全转换为新的标准。这可能需要系统中所有现有的编码器和解码器都被替换为SAC使能的编码器和解码器。具体地,有许多基于双声道立体声的传统系统(诸如无线电广播、数字无线电广播等),其中增加SAC所必需的附加信息的努力是不能实行般巨大,即将该系统扩展以使用SAC的代价太高了。此外,已经有大量矩阵编码的音频材料可利用并且这将需要在SAC解码的益处实现之前由SAC编码器重新编码。
因此,用于处理和/或通信多声道音频信号的改进的系统将是有优势的,并且特别是允许增加的灵活性、增加的音频质量、增加的SAC原理的应用性和/或改善的性能的功能将是有优势的。
据此,本发明试图优选地逐一或任意组合地缓和、减轻或消除一个或多个上面提到的缺点。
根据本发明的第一方面,提供了一种解码器用于生成多声道音频信号,解码器包括:用于接收包括第一组音频声道的第一信号的装置;用于响应于第一组音频声道的特性而为第二组音频声道生成估计的参数数据的估计装置;估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的多声道音频信号的空间音频解码器。
本发明可以允许改进的性能。特定地,本发明可以允许空间音频解码原理被用于不包含空间音频编码(SAC)参数的信号。解码器的可应用性可以被大大增加并且它可以例如与矩阵编码器和已编码信号一起使用。通过空间音频解码可以实现改进的音频质量。
第二组声道通常包括比第一组声道更多的声道。第二组音频声道可以包括第一组音频声道中的一个或多个。第二组音频声道中的一个或多个可以不使用估计的参数数据而生成。估计的参数数据可以特定地是相应于空间音频参数的数据并特别地相应于如通过传统SAC编码器典型的生成的空间音频参数。
估计的参数数据可以直接地将第一组声道的特有特性与第二组声道和特有特性关联起来和/或可以例如包括数据值,其使得第二组声道的不同声道的特性关联,由此指示第一信号能够被怎样解码以提供第二组音频声道。该特性可以是一个单个参数在不同时间间隔上的一系列测量值。可替换地,该特性可以属于多于一个的单个参数。
根据本发明可选的特征,第一信号不包括与第二组声道关联的参数音频数据。
本发明允许空间音频解码原理被应用于不包括至少一些输出声道的参数音频数据的信号。因此,本发明可以允许对于非SAC编码信号质量的改进。本发明可以允许改进的向后兼容性并且可以特别地对于从矩阵编码的环绕声信号中解码的环绕声信号允许改进的音频质量。
根据本发明可选的特征,估计装置包括用于确定第一组音频声道的第一参数数据的装置和用于将第一参数数据映射至第二组音频声道的估计的参数数据的装置。
这可以允许有效的实现和参数数据的估计,其可以提供特别高的解码音频质量。该映射可以例如通过使用查找表或通过数学函数的计算。因此,在估计的参数值和第一参数数据的特定参数值之间存在直接关系。
根据本发明可选的特征,第一参数数据包括第一组音频信号的至少两个音频声道的至少一个声道间电平(inter-channel level)差值。
这可以允许允许有效的实现和参数数据的估计,其可以提供特别高的解码音频质量。特别地,研究已经表明声道间电平差值特别地适于从矩阵编码的环绕声信号估计关联的SAC参数数据。本发明的发明人已经认识到例如立体声矩阵编码环绕声信号的声道间电平差和环绕声信号的SAC数据之间有高度的相关性。
根据本发明可选的特征,第一参数数据包括第一组音频信号的至少两个音频声道的至少一个声道间相关性系数值。
这可以允许有效的实现和估计参数数据,其可以提供特别高的解码音频质量。特别地,研究已经示表明声道间相关性系数值特别适于从矩阵编码环绕声信号估计关联的SAC参数数据。本发明的发明人已经认识到在用于例如立体声矩阵编码环绕声信号的声道间相关性系数和用于环绕声信号的SAC数据之间具有高相关性。
根据本发明可选的特征,多声道音频信号是环绕声信号并且估计的参数数据包括从组中选择的至少一个参数,该组由下面组成:在第二组声道的左前和左环绕声道之间的声道间电平差;在第二组声道的右前和右环绕声道之间的声道间电平差;在第二组声道的左前和左环绕声道之间的声道间相关性系数;在第二组声道的右前和右环绕声道之间的声道间相关性系数;第二组音频声道的中央声道的预测系数;在第二组声道的中央声道和另一个声道(或声道的组合)之间的声道间电平差。
这可以允许特别高的性能。特定地,这些参数特别适于通过空间音频解码器生成高质量解码信号并且典型地在诸如矩阵编码环绕声系统的输入信号的参数之间具有高相关性。
从该组中选择的至少一个参数可以通过从第一组音频信号的至少两个音频声道的声道间电平差值和/或声道间相关性系数值直接映射至至少一个参数而生成。
根据本发明的可选特征,设备进一步包括用于生成时间频率片(tile)的装置;其中估计装置被配置以对于时间频率片生成估计的参数数据。
这方便了操作和/或改进了质量。特别地,其可以允许便利地和/或改进地在从第一信号提取出的参数和估计的参数数据之间的映射。
根据本发明的可选特征,估计装置包括用于直接地将对于时间频率片的第一组音频声道的一组至少一个信号特性映射为第二组音频声道的参数数据值的装置。
这可以允许有效地实现和估计参数数据,其可以提供特别高的解码音频质量。映射例如可以通过使用查找表或通过数学函数的计算。由此,直接关系被应用在该组信号特性与相应的估计的参数数据的值之间。信号特性可以是第一组音频声道的两个声道的声道间电平差和/或声道间相关性系数,这些可以直接映射为例如第二组音频声道的预测系数和/或声道间相关性系数和/或声道间电平差。
根据本发明可选的特征,空间音频解码器被配置以使用响应于估计的参数数据而确定的参数执行至少一个矩阵操作。
这可以允许高的性能。特别地它可以允许带有高解码质量的会适当的实现。
根据本发明可选的特征,该解码器进一步包括用于对第二信号提取参数数据的装置,并且空间音频解码器可操作以响应于所提取的参数数据来解码第二信号。
解码器可以被配置以使用相同的空间音频编码器处理SAC编码信号和非SAC编码信号二者。对于SAC编码信号,所提取的数据可以被使用而对于非SAC编码信号,估计的参数数据可以被使用。本发明可以提供增加的应用性和/或向后兼容性。设备可以被配置以响应于所提取的参数数据而解码第一信号,由此允许在第一和第二信号之间的相关性被利用。
根据本发明可选的特征,解码器进一步包括用于响应于第一信号的特性选择解码模式的装置。
解码器可以例如被配置以操作在第一模式中,其中SAC参数数据被估计,和操作在第二模式中,其中SAC参数数据从接收的信号被提取出,并且解码器可以被配置以响应于第一信号是否包括SAC数据而在第一和第二模式之间选择。因此,能够实现具有处理各种不同类型信号的能力的高度灵活的解码器。
根据本发明可选的特征,第一组音频声道由两个音频声道组成。
本发明可以允许改进的多声道信号下混合为立体声信号的解码。
根据本发明可选的特征,第一信号是矩阵编码环绕声信号。
本发明可以允许特别地改进的多声道信号下混合为矩阵编码环绕声信号的解码。特别地,试验已经表明对于基于信号的立体声声道的矩阵编码环绕声信号能够估计出非常精确的SAC数据。
根据本发明可选的特征,解码器进一步包括矩阵环绕逆矩阵,和用于响应于估计的参数数据确定矩阵环绕逆矩阵的至少一个系数的装置。
这可以允许对于矩阵编码的环绕信号改进的解码音频质量。
根据本发明另一个方面,提供了一种生成多声道音频信号的方法,该方法包括:接收包括第一组音频声道的第一信号;响应于第一组音频声道的特性为第二组音频声道生成估计的参数数据;估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;空间音频解码器响应于估计的参数数据而解码第一信号以生成包括第二组声道的多声道音频信号。
根据本发明另一个方面,提供了一种用于执行方法的计算机程序产品。
根据本发明另一个方面,提供了一种用于生成多声道音频信号的接收机,该接收机包括:用于接收包括第一组音频声道的第一信号的装置;用于响应于第一组音频声道的特性而为第二组音频声道生成估计的参数数据的估计装置;估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的多声道音频信号的空间音频解码器。
根据本发明另一个方面,提供了一种传输系统,包括:用于通过编码多声道信号而生成包括第一组音频声道的第一信号的编码器;用于发射第一信号的发射器;用于接收第一信号的装置;用于响应于第一组音频声道的特性而为第二组音频声道生成估计的参数数据的估计装置;估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的解码的多声道音频信号的空间音频解码器。
根据本发明另一个方面,提供了一种发射和接收音频数据的方法,该方法包括:通过编码多声道信号而生成包括第一组音频声道的第一信号;发射第一信号;接收第一信号;响应于第一组音频声道的特性而为第二组音频声道生成估计的参数数据;估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;空间音频解码器响应于估计的参数数据而解码第一信号以生成包括第二组声道的解码的多声道音频信号。
根据本发明另一个方面,提供了一种包括如上面描述的解码器的音频播放设备。
本发明的这些和其它方面、特征和优点将从下面描述的一个或多个实施方式中变得明显,并参照下面描述的一个或多个实施方式而得到阐明。
本发明的实施方式将通过仅仅例子的方式参照附图被描述,其中
图1图示说明了根据本发明的一些实施方式用于音频信号通信的传输系统;
图2图示说明了典型的SAC编码器的框图;
图3图示说明了典型的SAC解码器的例子;
图4图示说明了根据本发明的一些实施方式的解码器;
图5图示说明了根据本发明的一些实施方式的解码器的元件;
图6图示说明了根据本发明的一些实施方式生成多声道音频信号的方法。
下面的描述集中在可应用于矩阵式环绕声信号下混合为立体声信号的解码的本发明实施方式上。然而,将认识到的是本发明不限于这个应用而且还可以被应用于许多其它信号。
图1图示说明了根据本发明的一些实施方式用于音频信号通信的传输系统100。传输系统100包括发射器101,其通过网络105与接收机103相耦合,网络105具体地可以是互联网。
在特定的例子中,发射器101是信号记录设备,接收机是信号播放设备103,但是将认识到的是在其它实施方式中发射器和接收机可以在其它应用中录制并用于其它目的。例如,发射器101和/或接收机103可以是代码转换功能性的一部分并且可以例如提供与其它信号源或目的端的接口连接。
在其中支持信号记录功能的特定的例子中,,发射器101包括数字化器(digitizer)107,其接收模拟信号,该模拟信号通过采样和模拟至数字转换被转换为数字PCM信号。模拟信号特定地是5.1环绕声多声道信号。
发射器101耦合至图1的编码器109,其根据编码算法编码PCM信号。特定地,编码器是矩阵编码器,其使用公式1的矩阵操作生成下混合的立体声信号。因此,已编码信号是矩阵编码环绕声信号。
编码器100耦合至网络发射器111,其接收已编码信号并接口连接至互联网105。网络发射器可以将已编码信号通过互联网105发射至接收机103。
接收机103包括网络接收机113,其接口连接至互联网105并且被配置以接收来自发射器101的已编码信号。
网络接收机111耦合至解码器115。解码器115接收已编码信号并根据解码算法解码它。
在其中支持信号播放功能的特定的例子中,接收机103进一步包括信号播放器117,其接收来自解码器115的已解码音频信号并将这呈现给用户。特定地,根据输出已解码音频信号的需要,信号播放器113可以包括数字至模拟转换器、放大器和扬声器。
在描述的实施方式中,解码器115所使用的解码算法包括SAC解码元件。为了清楚,典型的SAC编码器的操作将首先被描述。
图2图示说明了典型的SAC编码器200的框图。编码器200通过正交镜像滤波器(Quadrature Mirror Filter,QMF)组201将进入的信号分为分离的时间频率片。这些时间/频率片通常被称为“参数带”。
对于每个参数带,SAC编码元件203确定多个空间参数,其描述空间图像的性质,例如声道间电平差和交叉相关性系数。除了参数的提取,SAC编码元件203还从多声道输入信号生成下混合的单声道或立体声。通过QMF合成组205,这些信号被转换到时间域。结果产生的下混合被馈入比特流处理器207,其生成包括下混合声道和由SAC编码元件203生成的参数数据的比特流。优选地,下混合在传输前也被编码(使用传统的单声道或立体声‘核心(core)’编码器),而核心编码器的比特流和空间参数优选地被组合(多路复用)到单个输出比特流中。
根据操作的模式,这个参数数据的数据速率能够覆盖宽的比特速率的宽范围,从用于较好质量多声道音频的较少的几kBit/s至用于接近透明的质量的几十kBit/s。
此外,在立体声下混合的情况中,用户具有对传统的立体声下混合或者与矩阵式环绕系统兼容的下混合的选择。在后一种情况中,编码器200能够使用公式1的矩阵方式生成矩阵式环绕兼容的下混合。可替换地,它可以使用以规则(regular)立体声下混合方式工作的下混合后置处理单元(down-mix postprocessing unit)来生成矩阵式环绕兼容的下混合。在这个构造中,编码器能够包括矩阵式环绕后置处理器,其更改规则立体声下混合以使得它通过使用由参数估计阶段提取的空间参数兼容矩阵式环绕声。该方式的优点在于矩阵式环绕处理可以被具有可用空间参数的解码器完全反转。
SAC解码器原则上执行编码器的反过程。图3图示说明了典型的SAC解码器的例子。SAC解码器300包括分离器301,其接收比特流并将它分为下混合信号和参数数据。随后,已解码的下混合被QMF分析组303处理,结果产生与在SAC编码器200中应用的那些相同的参数带。空间合成平台305使用由分离器301提取出的参数数据重新构造多声道信号。最终,通过QMF合成组307,QMF-域信号被转换到时间域,结果产生最终的多声道输出信号。
因此在编码器和解码器都包括SAC功能性的系统中,可以对于相对低的数据速率实现已解码多声道信号的高质量。然而,许多已经部置的系统和许多音频材料不利用SAC功能性,该益处典型地限于新系统和重新编码的音频材料。
在图1的例子中,解码器115包括SAC解码功能性,其可以被用于非SAC编码器和非SAC编码的材料。解码器115因此可以引入一些SAC的优点,而不需要重新编码或SAC兼容的编码器,并可以特定地对于多声道信号提供大大改善的质量-数据速率比。
图4更详细地图示说明了图1的解码器115。解码器115包括接收机401,其接收包括一组音频声道的信号。特定地,接收机接收包括两个声道的比特流,其是已经由编码器109矩阵编码环绕声信号而生成的。接收机401接收比特流并生成下混合立体声信号的两个声道y1,y2。应当注意在特定的例子中,编码器109是传统的用于环绕信号的矩阵编码器,生成只包括两个下混合声道的比特流。因此,在例子中,比特流不包括空间音频参数数据。在其它的实施方式中,编码器109例如可以是SAC编码器,生成不带有SAC参数数据的矩阵环绕兼容的立体声信号。
解码器115进一步包括耦合至接收机401的SAC解码元件403。SAC解码元件403使用如在前描述的SAC技术解码立体声下混合声道y1,y2。特定地,SAC解码元件403的操作相应于对图3的SAC解码器300所描述的那些。SAC解码元件403因此相应于由编码器109矩阵编码的环绕信号而生成输出环绕声信号。
如在前描述的,立体声下混合声道可能已经被如在等式1(Eq.1)中所述的矩阵编码器而编码。可替换地,下混合声道可能已经被包括后置处理单元的SAC编码器203生成以生成矩阵环绕兼容的下混合。在两种情况中,SAC解码元件403可以包括预处理单元,其倒转编码器为了矩阵环绕的兼容性而应用的操作。
解码器115进一步包括估计处理器405,其耦合至接收机401和SAC解码元件403。估计处理器405被配置以生成估计的参数数据,其能够被使用以生成输出环绕信号。特定地,估计处理器405估计参数数据,如果SAC编码已经被执行,SAC编码器将已经为了下混合声道而生成它。因此,估计的参数数据将输出环绕声道的特性与接收的下混合声道的特性相关联,因为它提供有关它们如何能够被解码以生成输出环绕声道的信息。
在图4的例子中,估计处理器405生成估计的参数数据,使得它相应于SAC解码元件403能够直接使用来确定输出环绕声道的SAC数据。
因此,解码器115将SAC的原理用于解码矩阵编码的环绕音频材料。估计处理器405使用接收的立体声输入信号的信号提示(signal cue)以确定由SAC解码元件403使用的数据。特定地,估计处理器405估计接收的立体声信号的声道间指示并将这映射为可以由SAC解码元件403直接使用的SAC提示。这可以特定地允许SAC解码元件403作为传统的SAC解码器,由比使向后兼容性更方便,减少了设计和开发要求并且允许相同的功能被用于解码SAC编码的信号和非SAC编码的信号。因此,在例子中,在解码器侧使用通过分析接收到的两个声道下混合而获得的参数以生成所需要的SAC参数。
估计处理器405包括分析处理器407,其确定对于立体声下混合信号的一个或多个参数。特定地,分析处理器407生成立体声下混合声道y1,y2的声道间电平差(ILD)值和声道间相关性系数(ICC)值。
分析处理器407耦合至映射处理器409,其将ILD和ICC值映射为与输出声道相关的SAC值。
映射处理器409特定地利用之前未知的令人惊讶的事实,即,在矩阵编码的环绕信号的ILD和ICC值与原始环绕声声道的空间音频参数之间典型地存在着紧密的相关性。
映射处理器409能够简单地使用查找表以确定用于与立体声下混合声道y1,y2相关的输出环绕声道的SAC参数值。确定的ILD和ICC值或它们例如在量化后的表示能够被用作查找表的地址。同等地,映射处理器409能够计算预定的函数,该函数具有ICC和ILD值作为输入参数并提供需要的SAC参数作为输出参数。
以这种方式,映射处理器409能够生成(例如)下面的输出环绕声声道的SAC参数:
在左前和左环绕声道之间的声道间电平差。
在右前和右环绕声道之间的声道间电平差。
在左前和左环绕声道之间的声道间相关性系数。
在右前和右环绕声道之间的声道间相关性系数。
对于诸如中央声道的一个声道的一个或多个预测系数。
在输出环绕声声道的中央声道和另一个声道(或声道的组合)之间的声道间电平差。
作为特定的例子,分析处理器407能够生成立体声下混合声道y1,y2的ICC值和ILD值。这两个值然后被用于生成查找表的唯一地址。在特定的地址,典型地为了这些ICC和ILD而出现的SAC参数值已经被存储。映射处理器409因此简单地检索存储的数据值,由此获得合适的估计的参数数据。这个数据然后被馈送至SAC解码元件403,在那里它以与SAC编码器生成的传统的SAC数据一样的方式被使用。
应当认识到对于给定的ILD和ICC值相应的SAC参数值能够以任何合适的方式被确定。例如,可以执行仿真,其中大量信号被使用矩阵编码和SAC编码二者而编码。ICC和ILD值然后可以为了矩阵编码的信号而得出,并与SAC编码器生成的参数数据相比较。数据可以被统计地处理以确定SAC参数,其最可能对于给定的ILD和ICC值而存在,并且然后能够被存储在查找表的合适的位置中。应当认识到该分析只需要一次并且确定的查找表能够被许多解码器使用并为了任何接收到的信号而使用。
实际上,试验和仿真已经证明了在矩阵编码下混合的环绕声信号的ILD和ICC值与SAC编码的环绕声信号的SAC参数之间存在着紧密的相关性。因此,SAC参数可以被以相对高的精确度估计,并且能够实现大大改善的解码的音频质量。
在图4的例子中,估计处理器405基于时间频率片而操作。
特定地,立体声下混合声道y1,y2首先被复杂调制的QMF滤波器组处理以生成个别的时间频率片。应当认识到该处理可以在估计处理器405和SAC解码元件403之间共享并且例如可以在SAC解码元件403中实现。包含对于时间间隔的频带的时间频率片的生成对于本领域技术人员来说是已知的并且将不详细描述(一个例子可以例如在Breebaart,J.,van de Par,S.,Kohlrausch,A.,和Schuijers,E.(2005).“Parametric coding of stereo audio(立体声音频的参数编码)”.Eurasip J.Applied Signal Pro.,9:1305-1322中找到)。
时间频率片通过聚集特定频带和时间片段而被公式化。典型地,根据心理声学原理,这些时间频率片相对地在低频率较窄而在高频率较宽。相应的时间分辨度典型地在11和50ms之间。
对于每个生成的时间频率片,分析处理器407从立体声下混合声道y1,y2中生成两个参数ILD和ICC。特定地,如果Y1[k,b]代表对于信号y1(复数值的)滤波器组输出,对于滤波器输出q和时间采样k,Y2[k,b]代表对于y2相应的QMF域表示,对于参数带b的ILD参数通过下式给出:
ILD [ b ] = 10 log 10 Σ k Σ q Y 1 [ k , q ] Y 1 * [ k , q ] Σ k Σ q Y 2 [ k , q ] Y 2 * [ k , q ]
其中k的求和范围在相应的当前时间/频率片的QMF域时间采样上执行,在q上的求和在相应于参数带b的那些滤波器组输出端上拙行,(*)指示复数共轭。
类似地,使用
Figure S2006800264569D00112
指示实数部分,对于参数带b的ICC值通过下式给出:
对于每对ICC和ILD值,映射处理器409然后可以执行表查找和确定:
在左前和左环绕声道的相应的时间频率片之间的ILD;
在右前和右环绕声道的相应的时间频率片之间的ILD;
在左前和左环绕声道的相应的时间频率片之间的ICC;
在右前和右环绕声道的相应的时间频率片之间的ICC;
预测系数以从下混合中生成中央声道,和/或
在中央声道和任何其它声道(对)之间的ILD。
解码器因此被馈送估计的参数数据,其相应于已经由SAC编码器产生的SAC参数数据。
图5更详细地图示说明了SAC解码元件403的元件。
SAC解码元件403包括预混合的矩阵单元501,其控制信号进入第二混合矩阵单元503以及一组去相关器(D1至Dm)505的输入。第二混合矩阵基于去相关器输出和预混合矩阵501的直接输出生成输出信号。SAC的操作对于本领域技术人员来说是公知的,并且为了清楚和简短起见将不在这里进一步描述。进一步的细节例如可以在Herre等人的“The reference model architecture forMPEG spatial audio coding(MPEG空间音频编码的参考模型体系)”,Proc.118thAES会议,Barcelona,Spain,2005中找到。
从估计处理器405接收的估计的参数数据被用于控制预混合矩阵单元501和第二混合矩阵单元503,如同它是传统的SAC参数数据。特定地,预混合矩阵单元501可以使用预混合矩阵M1以从输入信号y1,y2中生成三个中间信号l,r和c,如:
l r c = M 1 y 1 y 2 ,
其中
M 1 = c 1 + 2 c 2 - 1 c 1 - 1 c 2 + 1 1 - c 1 1 - c 2 ,
其中c1和c2表示由映射处理器409生成的空间参数(预测系数)中的两个。两个去相关器D1和D2505被分别馈送入信号l和r。最后,对于左前、右前、中央、左环绕和右环绕声道的输出信号lf,rf,c,ls和rs通过在第二混合矩阵单元503中的后置混合矩阵M2而生成:
l f r f c l s r s = M 2 l r c D 1 D 2 ,
其中,
M 2 = h 11 , L 0 0 h 12 , L 0 0 h 11 , R 0 0 h 12 , R 0 0 1 0 0 h 21 , L 0 0 h 22 , L 0 0 h 21 , R 0 0 h 22 , R ,
hxy,z取决于由映射处理器409生成的ILD和ICC参数:
h11,X=p1,Xcos(vXX)
h12,X=p1,Xsin(vXX)
h21,X=p2,Xcos(vXX)
h22,X=p2,Xsin(vXX)
其中,
p 1 , x = 2 . 10 ILD X / 10 1 + 10 ILD X / 10
p 2 , x = 2 1 + 10 ILD X / 10
μ X = 1 2 arccos ( ICC X )
v X = μ X ( p 2 , X - p 1 , X ) 2
这里,ILDX和ICCX表示由映射处理器409生成的对于声道对X(左前/左环绕,或者右前/右环绕)的ILD和ICC参数。
在SAC编码器通过编码器后置处理器工作在矩阵环绕兼容的模式的情况中,相应的解码器侧预处理器可以被包括在预混合矩阵单元501中。在这个特定的情况中,可替换的预混合矩阵可以被使用,其由原始预混合矩阵M1和矩阵环绕兼容的逆矩阵Q的组合而组成:
M 1 ′ = M 1 Q = c 1 + 2 c 2 - 1 c 1 - 1 c 2 + 1 1 - c 1 1 - c 2 Q ,
其中矩阵环绕逆矩阵Q由下式给出:
Q = q 11 q 12 q 21 q 22 ,
其中qxy,z是由映射处理器409生成的参数的函数:
Q = 1 1 - w l - w r + w l w r + ( w l - w r ) j - ( g 1 g 2 - 1 ) w l w r 1 - w r - w r j - w r j g 2 w l jg 1 1 - w l + w l j ,
其中g1=g2=0.577,且wl和wr是通过映射处理器409给定的参数的函数:
Figure S2006800264569D00141
可替换地,M1或M1′的条目也可以由映射处理器409直接生成,忽略上面给出的公式。
应当认识到虽然上面的描述集中在一个实施方式中,其中接收到的信号不包括SAC参数数据,但是在其它实施方式中一些参数数据可以被包括在接收到的信号中。例如,接收到的信号可以包括与一些输出声道相关但不与其它输出声道相关的参数数据,并且估计的参数可以被用于这些其它声道。作为另一个实例,估计的参数数据可以被用于代替例如由于传输误差已经被损坏的参数数据。因此,估计的参数数据可以被用于增强和补充从编码器接收到的其它参数数据。
此外,将认识到所描述例子的优点中的一个是SAC解码元件403能够使用标准的SAC解码技术。因此,SAC解码元件403可以同等地被用于解码从SAC编码器接收到的传统的SAC信号。
特定地,图1的传输系统100可以包括多个非SAC编码器和多个SAC编码器。解码器115可以根据正在接收的信号更改它的操作。因此,如果接收到非SAC信号,操作可以如上面所描述。然而,如果接收到SAC信号,参数数据可以简单地被提取并与下混合声道一起馈送入SAC解码元件403。因此,能够实现更高灵活性的解码器。
图6图示说明了根据本发明的一些实施方式生成多声道音频信号的方法。该方法可应用于图4的解码器115并将参照其被描述。
该方法起始在步骤601,其中接收机401接收包括第一组音频声道的第一言号。
步骤601随后是步骤603,其中估计处理器405响应于第一组音频声道的特性生成用于第二组音频声道的估计的参数数据。估计的参数数据将第二组音频声道的特性与第一组音频声道的特性相关联。
步骤603随后是步骤605,其中SAC解码元件403响应于估计的参数数据解码第一言号,以生成包括第二组声道的多声道信号。
应当认识到上面的描述为了清楚而参照不同功能单元和处理器描述了本发明的实施方式。然而,明显可知的是在不同功能单元和处理器之间的任何合适的功能分布可以被使用而不减损本发明。例如,图示说明为以分离的处理器或控制器执行的功能性可以被同一个处理器或控制器执行。因此,对特定功能单元的提及仅被看作对用于提供所描述功能性的合适装置的提及而不是指示严格的逻辑或物理结构或机构。
本发明能够以任何合适的形式被实现,包括硬件、软件、固件或它们的任意组合。本发明可选地至少部分地以在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件的形式而实现。本发明实施方式的元件和组件可以是以任何合适的形式物理地、功能地和逻辑地实现。实际上功能性可以单个单元、多个单元或作为其它功能单元的一部分来实现。这样,本发明可以单个单元的形式或者以在不同单元和处理器之间物理地和功能地分布的形式被实施。
虽然本发明已经连同一些实施方式被描述,但是它不意图限制为此处提出的特定形式。相反,本发明的范围仅由所附权利要求限制。另外,虽然特征可能看起来连同特定实施方式被描述,本领域技术人员能够认识到所描述实施方式的各种特征可以根据本发明而组合。在权利要求中,词语“包括”不排除其它元件或步骤的存在。
此外,虽然被独立地列举出,但是多个装置、元件或方法步骤可以被例如单个单元或处理器实现。另外,虽然个别的特征可以被包括在不同的权利要求中,但是它们可能被有优势地组合,并且包括在不同权利要求中不意味着特征的组合是不可行的和/或没有优势的。特征包括在一个类别的权利要求中也不意味着限制为这个类别而是指示在适当时候该特征同样可应用于其它权利要求类别。此外,在权利要求中特征的次序不意味着特征必须按照此工作的任何特定次序,并且特别地在方法权利要求中个别步骤的次序不意味着步骤必须以这个次序被执行。相反,步骤可以任何合适的次序被执行。另外,单数提及并不排除多个。因此对于“一”、“一个”、“第一”、“第二”等的提及不排除多个。在权利要求中的参考标记仅仅被提供为清楚举例,无论如何也不能解释为对权利要求的范围的限制。

Claims (20)

1.一种用于生成多声道音频信号的解码器,该解码器包括:
用于接收(401)包括第一组音频声道的第一信号的装置;
估计装置(405),用于响应于第一组音频声道的特性生成用于第二组音频声道的估计的参数数据;该估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;和
空间音频解码器(403),用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的多声道音频信号。
2.权利要求1的解码器,其中第一信号不包括与第二组声道相关的参数音频数据。
3.权利要求1的解码器,其中估计装置(405)包括用于确定用于第一组音频声道的第一参数数据的装置(407)和用于将第一参数数据映射到用于第二组音频声道的估计的参数数据的装置(409)。
4.权利要求3的解码器,其中第一参数数据包括第一组音频信号的至少两个音频声道的至少一个声道间电平差值。
5.权利要求3的解码器,其中第一参数数据包括第一组音频信号的至少两个音频声道的至少一个声道间相关性系数值。
6.权利要求1的解码器,其中多声道音频信号是环绕声信号并且估计的参数数据包括从组里选择的至少一个参数,组由下面构成:
在第二组声道的左前和左环绕声道之间的声道间电平差;
在第二组声道的右前和右环绕声道之间的声道间电平差;
在第二组声道的左前和左环绕声道之间的声道间相关性系数;
在第二组声道的右前和右环绕声道之间的声道间相关性系数;
第二组音频声道的中央声道的预测系数;和
在第二组声道的中央声道和另一个声道之间的声道间电平差。
7.权利要求1的解码器,进一步包括用于生成时间频率片的装置;并且其中估计装置(405)被配置以生成对于时间频率片的估计的参数数据。
8.权利要求7的解码器,其中估计装置包括用于将第一组音频声道对于时间频率片的一组至少一个信号特性直接映射到用于第二组音频声道的相应的参数教据的值的装置。
9.权利要求1的解码器,其中空间音频解码器被配置以使用响应于估计的参数数据而确定的参数而执行至少一个矩阵操作。
10.权利要求1的解码器,进一步包括用于为第二信号提取参数数据的装置,并且其中空间音频解码器(403)可操作以响应于提取的参数数据解码第二信号。
11.权利要求1的解码器,进一步包括用于响应于第一信号的特性选择解码模式的装置。
12.权利要求1的解码器,其中第一组音频声道由两个音频声道组成。
13.权利要求12的解码器,其中第一信号是矩阵编码环绕声信号。
14.权利要求13的解码器,进一步包括矩阵环绕逆矩阵和用于响应于估计的参数数据确定该矩阵环绕逆矩阵的至少一个系数的装置。
15.一种生成多声道音频信号的方法,该方法包括:
接收(601)包括第一组音频声道的第一信号;
响应于第一组音频声道的特性,为第二组音频声道生成(603)估计的参数数据;该估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;和
空间音频解码器响应于估计的参数数据解码(605)第一信号,以生成包括第二组声道的多声道音频信号。
16.一种用于执行权利要求15的方法的计算机程序产品。
17.一种用于生成多声道音频信号的接收机(103),该接收机包括:
用于接收(113,401)包括第一组音频声道的第一信号的装置;
估计装置(405),用于响应于第一组音频声道的特性生成用于第二组音频声道的估计的参数数据;该估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;和
空间音频解码器(403),用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的多声道音频信号。
18.一种传输系统,包括:
编码器,用于通过编码多声道信号生成包括第一组音频声道的第一信号;
发射器,用于发射第一信号;
用于接收(401)第一信号的装置;
估计装置(405),用于响应于第一组音频声道的特性生成用于第二组音频声道的估计的参数数据;该估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;和
空间音频解码器(403),用于响应于估计的参数数据而解码第一信号以生成包括第二组声道的解码的多声道音频信号。
19.一种发射和接收音频信号的方法,该方法包括:
通过编码多声道信号生成包括第一组音频声道的第一信号;
发射第一信号;
接收(401)第一信号;
响应于第一组音频声道的特性,为第二组音频声道生成估计的参数数据;该估计的参数数据将第二组音频声道的特性与第一组音频声道的特性关联起来;和
空间音频解码器(403)响应于估计的参数数据解码第一信号,以生成包括第二组声道的解码的多声道音频信号。
20.一种音频播放设备(103),包括根据权利要求1的解码器(115)。
CN2006800264569A 2005-07-19 2006-07-12 多声道音频信号的生成 Active CN101248483B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05106612 2005-07-19
EP05106612.4 2005-07-19
PCT/IB2006/052368 WO2007010451A1 (en) 2005-07-19 2006-07-12 Generation of multi-channel audio signals

Publications (2)

Publication Number Publication Date
CN101248483A true CN101248483A (zh) 2008-08-20
CN101248483B CN101248483B (zh) 2011-11-23

Family

ID=37398669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800264569A Active CN101248483B (zh) 2005-07-19 2006-07-12 多声道音频信号的生成

Country Status (10)

Country Link
US (1) US8160888B2 (zh)
EP (1) EP1905006B1 (zh)
JP (1) JP5171622B2 (zh)
KR (1) KR101356586B1 (zh)
CN (1) CN101248483B (zh)
BR (1) BRPI0613734B1 (zh)
ES (1) ES2433316T3 (zh)
PL (1) PL1905006T3 (zh)
RU (1) RU2417458C2 (zh)
WO (1) WO2007010451A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
CN102598122A (zh) * 2009-11-12 2012-07-18 皇家飞利浦电子股份有限公司 参量编码和解码
CN103262160A (zh) * 2010-10-13 2013-08-21 三星电子株式会社 用于对多通道音频信号进行缩混的方法和设备
CN103518384A (zh) * 2011-05-11 2014-01-15 创新科技有限公司 用于再生环绕音的扬声器
CN107430861A (zh) * 2015-03-03 2017-12-01 杜比实验室特许公司 通过调制解相关进行的空间音频信号增强
CN110189759A (zh) * 2013-09-12 2019-08-30 杜比国际公司 用于联合多声道编码的方法和设备
CN110648674A (zh) * 2013-09-12 2020-01-03 杜比国际公司 多声道音频内容的编码
CN113438595A (zh) * 2021-06-24 2021-09-24 深圳市叡扬声学设计研发有限公司 Kas音频处理系统

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
WO2007110823A1 (en) * 2006-03-29 2007-10-04 Koninklijke Philips Electronics N.V. Audio decoding
MX2010012580A (es) 2008-05-23 2010-12-20 Koninkl Philips Electronics Nv Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.
KR101230691B1 (ko) * 2008-07-10 2013-02-07 한국전자통신연구원 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
CN102209988B (zh) * 2008-09-11 2014-01-08 弗劳恩霍夫应用研究促进协会 基于麦克风信号来提供空间提示集合的设备、方法以及用于提供双声道音频信号和空间提示集合的设备
US20110123055A1 (en) * 2009-11-24 2011-05-26 Sharp Laboratories Of America, Inc. Multi-channel on-display spatial audio system
BR112014012097B1 (pt) * 2011-11-23 2021-07-06 Koninklijke Philips N.V. sistema para a mixagem de sinais de áudio a partir de um ou mais dispositivos portáteis de usuário docados no dito sistema, host de docagem, e método para a mixagem de sinais de áudio a partir de um ou mais dispositivos portáteis de usuário docados em pelo menos dois hosts de docagem para a apresentação em um sistema de som de áudio
US20140129236A1 (en) * 2012-11-07 2014-05-08 Kenneth John Lannes System and method for linear frequency translation, frequency compression and user selectable response time
US9466301B2 (en) * 2012-11-07 2016-10-11 Kenneth John Lannes System and method for linear frequency translation, frequency compression and user selectable response time
JP6543627B2 (ja) * 2013-07-30 2019-07-10 ディーティーエス・インコーポレイテッドDTS,Inc. 一定出力ペアワイズパニングによるマトリクスデコーダ
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
JP6235725B2 (ja) * 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN113055789B (zh) * 2021-02-09 2023-03-24 安克创新科技股份有限公司 单声道音箱、在单声道音箱中增加环绕效果的方法及系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
JP4478220B2 (ja) * 1997-05-29 2010-06-09 ソニー株式会社 音場補正回路
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6823018B1 (en) 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
ATE426235T1 (de) * 2002-04-22 2009-04-15 Koninkl Philips Electronics Nv Dekodiervorrichtung mit dekorreliereinheit
ES2291939T3 (es) 2003-09-29 2008-03-01 Koninklijke Philips Electronics N.V. Codificacion de señales de audio.
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
CN102598122A (zh) * 2009-11-12 2012-07-18 皇家飞利浦电子股份有限公司 参量编码和解码
CN103262160A (zh) * 2010-10-13 2013-08-21 三星电子株式会社 用于对多通道音频信号进行缩混的方法和设备
US8874449B2 (en) 2010-10-13 2014-10-28 Samsung Electronics Co., Ltd. Method and apparatus for downmixing multi-channel audio signals
CN103262160B (zh) * 2010-10-13 2015-06-17 三星电子株式会社 用于对多通道音频信号进行缩混的方法和设备
US9980049B2 (en) 2011-05-11 2018-05-22 Creative Technology Ltd Speaker for reproducing surround sound
CN103518384A (zh) * 2011-05-11 2014-01-15 创新科技有限公司 用于再生环绕音的扬声器
CN110189759A (zh) * 2013-09-12 2019-08-30 杜比国际公司 用于联合多声道编码的方法和设备
CN110648674A (zh) * 2013-09-12 2020-01-03 杜比国际公司 多声道音频内容的编码
CN110189759B (zh) * 2013-09-12 2023-05-23 杜比国际公司 用于音频编码和解码的方法、设备、系统、以及存储介质
US11749288B2 (en) 2013-09-12 2023-09-05 Dolby International Ab Methods and devices for joint multichannel coding
CN110648674B (zh) * 2013-09-12 2023-09-22 杜比国际公司 多声道音频内容的编码
CN107430861A (zh) * 2015-03-03 2017-12-01 杜比实验室特许公司 通过调制解相关进行的空间音频信号增强
CN107430861B (zh) * 2015-03-03 2020-10-16 杜比实验室特许公司 用于对音频信号进行处理的方法、装置和设备
CN112002337A (zh) * 2015-03-03 2020-11-27 杜比实验室特许公司 用于对音频信号进行处理的方法、装置和设备
US11081119B2 (en) 2015-03-03 2021-08-03 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
US11562750B2 (en) 2015-03-03 2023-01-24 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
CN113438595A (zh) * 2021-06-24 2021-09-24 深圳市叡扬声学设计研发有限公司 Kas音频处理系统

Also Published As

Publication number Publication date
US20080201153A1 (en) 2008-08-21
RU2008106223A (ru) 2009-08-27
PL1905006T3 (pl) 2014-02-28
JP2009501957A (ja) 2009-01-22
JP5171622B2 (ja) 2013-03-27
RU2417458C2 (ru) 2011-04-27
KR20080033993A (ko) 2008-04-17
EP1905006A1 (en) 2008-04-02
EP1905006B1 (en) 2013-09-04
US8160888B2 (en) 2012-04-17
WO2007010451A1 (en) 2007-01-25
CN101248483B (zh) 2011-11-23
KR101356586B1 (ko) 2014-02-11
BRPI0613734B1 (pt) 2019-10-22
ES2433316T3 (es) 2013-12-10

Similar Documents

Publication Publication Date Title
CN101248483B (zh) 多声道音频信号的生成
CN101553865B (zh) 用于处理音频信号的方法和装置
CN101044551B (zh) 用于双声道提示编码方案和类似方案的单通道整形
CN101044794B (zh) 用于双声道提示码编码方案和类似方案的散射声音整形的方法和设备
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
CN101542596B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN102883257B (zh) 用于编码多对象音频信号的设备和方法
CN101930740B (zh) 使用解相关信号的多信道音频信号解码
CN101821799B (zh) 使用上混合的音频编码
CN101044550B (zh) 产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
KR100737302B1 (ko) 호환성 다중-채널 코딩/디코딩
CN101484935B (zh) 用于编码和解码基于对象的音频信号的方法和装置
TWI396187B (zh) 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
CN102667919A (zh) 音频信号解码器和编码器、提供上混和下混信号表示型态的方法、计算机程序及使用共用对象间相关参数值的位流
CN101529504A (zh) 多通道参数转换的装置和方法
CN101390443A (zh) 音频编码和解码
Dubey et al. A Novel Very Low Bit Rate Multi-Channel Audio Coding Scheme Using Accurate Temporal Envelope Coding and Signal Synthesis Tools
Annadana et al. New Enhancements to Immersive Sound Field Rendition (ISR) System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Holland Ian Deho Finn

Co-patentee after: Dolby International Ltd.

Patentee after: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Co-patentee after: AGERE SYSTEMS Inc.

Address before: Holland Ian Deho Finn

Co-patentee before: Dolby Sweden AB

Patentee before: Koninklijke Philips Electronics N.V.

Co-patentee before: AGERE SYSTEMS Inc.

Address after: Holland Ian Deho Finn

Co-patentee after: Dolby Sweden AB

Patentee after: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Co-patentee after: AGERE SYSTEMS Inc.

Address before: Holland Ian Deho Finn

Co-patentee before: CODING TECH AB

Patentee before: Koninklijke Philips Electronics N.V.

Co-patentee before: AGERE SYSTEMS Inc.