CN1969487B - 水印嵌入 - Google Patents

水印嵌入 Download PDF

Info

Publication number
CN1969487B
CN1969487B CN2005800196764A CN200580019676A CN1969487B CN 1969487 B CN1969487 B CN 1969487B CN 2005800196764 A CN2005800196764 A CN 2005800196764A CN 200580019676 A CN200580019676 A CN 200580019676A CN 1969487 B CN1969487 B CN 1969487B
Authority
CN
China
Prior art keywords
spectrum
information signal
watermark
modulation
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800196764A
Other languages
English (en)
Other versions
CN1969487A (zh
Inventor
于尔根·赫勒
拉尔夫·库勒萨
萨沙·迪施
卡斯滕·林茨迈尔
克里斯蒂安·纽鲍尔
弗兰克·西本哈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN1969487A publication Critical patent/CN1969487A/zh
Application granted granted Critical
Publication of CN1969487B publication Critical patent/CN1969487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/28Arrangements for simultaneous broadcast of plural pieces of information
    • H04H20/30Arrangements for simultaneous broadcast of plural pieces of information by a single channel
    • H04H20/31Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Abstract

根据用于将水印引入信息信号的发明方案,首先将信息信号(12)从时间表达(22)转换为频谱/调制频谱表达(30)。然后依据要引入的水印(14),处理频谱/调制频谱表达(30)的信息信号,来获得修改后的频谱/调制频谱表达;接下来基于所述修改后的频谱/调制频谱表达,来形成具有水印(16)的信息信号。其优点在于,由于在所述频谱/调制频谱表达或范围内嵌入和/或推导出水印(14),所以用于基于扩频调制的水印方法中的传统的有关攻击不会容易地成功。

Description

水印嵌入
技术领域
本发明涉及一种将水印引入诸如音频信号之类的信息信号的方案。
背景技术
随着因特网的日益扩展,音乐盗版也显著增加。在因特网上的许多网站提供了音乐或一般音频信号用于下载。仅在非常少的情况下遵守版权。具体地,几乎不会向作者请求可以使用他或她的作品的许可。甚至更少地,向作者支付以合法拷贝的价格收取的费用。因此,在不遵守版权的情况下,还经常发生以不受控制的方式来拷贝作品的现象。
当通过因特网,从提供音乐的供应商处合法地购买到音乐时,通常,供应商将会生成要添加至音乐的报头或数据块,在这些报头或数据块中,引入了诸如顾客号之类的版权信息,其中,顾客号明确地指向当前的购买者。此外,已知将诸如禁止拷贝当前段、仅允许拷贝一次当前段、完全免费拷贝当前段之类的表示许多种不同版权的拷贝许可信息引入该报头中。顾客具有解码器或者管理软件,以在报头中进行读取,并遵守所允许的动作,例如,仅允许单次拷贝和拒绝另外的拷贝等。
然而,用于遵守版权的这种概念将仅对合法活动的顾客起作用。非法顾客通常具有相当大的潜在创造力,用来“破解”具有报头的音乐。这里,为保护版权所描述的过程的缺点显而易见。可以简单地删除这样的报头。可选地,为了将条目“禁止拷贝”转换为条目“拷贝完全免费”,非法顾客也许还可以修改报头中的各个条目。此外,非法顾客可以从报头中删除自己的顾客号,然后在因特网上他/她自己的主页或另一主页上提供该首音乐。由于已经删除了他/她的顾客号,所以从此刻起,不再能够确定该非法顾客。
从WO 97/33391中可知一种将听不到的数据信号引入音频信号中的编码方法。因此,把要将听不到的数据信号(这里称为水印)引入其中的音频信号转换至频域,通过心理声学模型来确定音频信号的掩蔽阈值。由伪噪声信号对要引入音频信号的数据信号进行调制,以提供扩频数据信号。然后,由心理声学掩蔽阈值来对扩频数据信号进行加权,使得扩频数据信号的能量将总是低于掩蔽阈值。最后,将加权的数据信号叠加在音频信号上,这就是怎样在听不到的情况下生成将数据信号引入其中的音频信号的过程。一方面,数据信号可以用于将作者信息添加至音频信号,以及可选地,由于每个声音载体(例如,压缩盘的形式)在制造时具有单独的标签,所以数据信号可以用于特征化音频信号,以易于识别潜在的盗版拷贝。
在C.Neubauer,J.Herre:“Digital Watermarking and its Influence onAudio Quality”,105th AES Convention,San Francisco 1998,Preprint4823以及在DE 196 40 814中,也对将水印嵌入未压缩的音频信号进行了描述,其中,该音频信号仍然处于时域中或处于时域表达中。
然而,音频信号通常已经呈现为压缩的音频数据流,例如,这些压缩的音频数据流已经经过了根据MPEG音频方法之一的处理。如果上述水印嵌入方法之一用于在将音乐传递至顾客之前,向音乐提供水印,则必须在引入水印之前完全压缩这些音乐以再次获得时域音频值序列。然而,由于嵌入水印之前的附加解码,这意味着除了高计算复杂度之外,还存在当对具有水印的这些音频信号再次编码时出现串联编码效应(tandem coding effect)的危险。
这就是开发将水印嵌入已压缩音频信号或压缩音频比特流的方案的原因,其中,由于不需要对将要具有水印的音频比特流进行完全地编码,即,具体地,可以省略将分析和合成滤波器组应用于音频信号,所以该方案具有需要低计算复杂度的优点。可以应用于压缩的音频信号上的这些方法的其它优点是:高音频质量,这是由于可以精确地对量化噪声和水印噪声进行相互调谐;高鲁棒性,这是由于随后的音频编码器并不会“削弱”水印;以及允许适当选择扩频参数,使得可以实现与PCM(脉冲编码调制)水印方法、或者在未压缩音频信号上操作的嵌入方案的兼容。可以在C.Neubauer,J.Herre:“AudioWatermarking of MPEG-2 AAC Bit Streams”,108th AES Convention,Paris 2000,Preprint 5101中,以及附加地,在DE 10129239C1中,找到将水印嵌入已压缩音频信号的方案的概述。
将水印引入音频信号的另一改进方式是指,在压缩尚未压缩的音频信号时执行嵌入的那些方案。其中,由于这种嵌入方案通过同时进行水印嵌入和编码,仅必须执行一次特定操作(例如,计算掩蔽模型、以及将音频信号转换至频谱范围),所以该方案具有低计算复杂度的优点。另外的优点包括,较高的音频质量,这是由于可以精确地对量化噪声和水印噪声进行相互调谐;高鲁棒性,这是由于随后的音频编码器并不会“削弱”水印;以及可以适当选择扩频参数,以实现与PCM水印方法的兼容。例如,可以在Siebenhaar,Frank;Neubauer,Christian;Herre,Jürgen:“Combined Compression/Watermarking for AudioSignals”,110th AES Convention,Amsterdam,preprint 5344;C.Neubauer,R.Kulessa和J.Herre:“A Compatible Family of Bitstream WatermarkingSystems for MPEG-Audio”,110th AES Convention,Amsterdam,2000年5月,Preprint 5346中,以及在DE 199 47 877中,找到压缩水印嵌入/编码的概述。
总之,已知在不同变化中的用于编码和未编码音频信号的水印。使用水印,能够以鲁棒的和听不到的方式在音频信号内转移附加数据。今天,如以上已示出的,存在嵌入域不同(例如,时域、频域等)和嵌入类型不同(例如,量化、擦去单独值等)的不同的水印嵌入方法。可以在M.van der Veen,F.Brukers等:“Robust,Multi-Functional andHigh-Quality Audio Watermarking Technology”,110th AES Convention,Amsterdam,2002年5月,Preprint 5345;Jaap Haitsma,Michiel van derVeen,Ton Kalker和Fons Bruekers:“Audio Watermarking for Monitoringand Copy Protection”,ACM Workshop 2000,Los Angeles中,以及在上述的DE 196 40 814中,找到对现有方法的概括描述。
尽管之前简要解释的将水印嵌入音频信号的多种方案已经非常先进,但是现有水印方法中的缺点在于,几乎唯一地关注于这样的目的:以高引入速率和高鲁棒性,听不到地将水印嵌入原始音频信号,即,具有在信号变换之后水印仍然可用的特性。因此,对于大多数应用领域,该关注点是坚定的。认为向音频信号提供水印的最普遍的方法,即,扩频调制(如在以上提及的WO 97/33391中示例性描述的),是非常鲁棒和安全的。
由于该方法的普及、以及基于扩频调制的水印方法的原理通常已知的事实,逐渐了解到这些方法的危险:通过这些方法,可以破坏从具有水印的音频信号中反向得到的水印。为此,开发新颖的可以用作扩频调制可选方案的高质量方法非常重要。
发明内容
因此,本发明的目的是提供一种完全新颖、因而更加安全的方案,用于将水印引入信息信号中。
通过根据权利要求1或22的设备、以及根据权利要求23或24的方法,来实现该目的。
根据将水印引入信息信号的发明方案,首先,将信息信号从时间表达转变为频谱/调制频谱表达。然后,依据要引入的水印,在频谱/调制频谱表达中处理信息信号,以获得修改的频谱/调制频谱表达,接下来,基于修改的频谱/调制频谱表达来形成具有水印的信息信号。
根据从具有水印的信息信号中提取水印的发明方案,将具有水印的信息信号相应地从时间表达转变为频谱/调制频谱表达,因此,基于频谱/调制频谱表达来导出水印。
由于根据本发明,在频谱/调制频谱表达和范围内嵌入水印、以及在频谱/调制频谱表达和范围内导出水印的事实,本发明的优点在于,如在基于扩频调制的水印方法中使用的传统的相关性攻击将不会轻易成功。这里,本发明具有以下积极作用:对于潜在的攻击者来说,对频谱/调制频谱范围内的信号的分析仍然是新的领域。
此外,本发明的在频谱/调制频谱范围、或者二维调制频谱/调制层(level)内嵌入水印提供了比迄今为止的情况明显更多的嵌入参数的变体,例如,在该层中嵌入所处的“位置”。因此,还可以与时间变化一起发生相应位置的选择。
在音频信号作为信息信号的情况下,附加地,还可以通过在频谱/调制频谱范围内嵌入水印,在没有传统心理声学参数(例如,听力阈值)的复杂计算的情况下,来听不到地嵌入水印,因而以少量复杂度来确保听不到水印。例如,可以利用调制频谱范围内的掩蔽效应来执行这里对调制值的修改。
附图说明
接下来,将参照附图对本发明的优选实施例进行详细描述,其中:
图1是根据本发明实施例的用于将水印嵌入音频信号的设备的结构框图;
图2是示出了音频信号至图1的设备所基于的频率/调制频域的转移的示意图;
图3是用于从具有水印的音频信号中提取由图1设备嵌入的水印的设备的结构框图;
图4是根据本发明另一实施例的用于将水印嵌入音频信号的设备的电路框图;
图5是用于从具有水印的音频信号中提取由图4设备嵌入的水印的设备的结构框图。
具体实施方式
接下来,将参照图1-3来描述将水印嵌入音频信号的方案,其中,首先,将以时域或时间表达呈现的输入音频信号或音频输入信号逐块地转变为时间/频率表达、以及从此处转变为频率/调制频率表达。然后,通过依据水印来修改频率/调制频域表达的调制值,将水印引入该表达中的音频信号。以这样的方式进行修改,然后再次将音频信号转变到时间/频率域,以及从此处转变到时域。
由根据图1的设备来执行根据图1-3的方案的水印嵌入,接下来将该设备称为水印嵌入器,并且由参考号10表示。嵌入器10包括输入12,用于接收要引入的水印将要引入到的音频输入信号。嵌入器10在输入14处接收诸如顾客号之类的水印。除了输入12和14之外,嵌入器10包括输出16,用于输出具有水印的输出信号。
在内部,嵌入器10包括加窗装置18和第一滤波器组20,加窗装置18和第一滤波器组20在输入12之后串联连接,用于通过逐块处理,将输入12处的音频信号从时域22转变为时间/频率域24。在滤波器组20的输出之后是幅度/相位检测装置26,用于将音频信号的时间/频率域表达分为幅度和相位。第二滤波器组28与检测装置26连接,以获得时间/频率域表达的幅度部分,并且将该幅度部分转变为频率/调制频域30,以这种方式来生成音频信号12的频率/调制频率表达。因此,块18、20、26、28代表嵌入器10的分析部分,用于实现音频信号至频率/调制频率表达的转变。
水印嵌入装置32与第二滤波器组28连接,来从中接收音频信号12的频率/调制频率表达。水印嵌入装置32的另一输入与嵌入器10的输入14连接。水印嵌入装置32输出修改的频率/调制频率表达。
水印嵌入装置32的输出与滤波器组34的输入连接,滤波器组34与第二滤波器组28相逆,负责重新转变为时间/频率域24。相位处理装置36与检测装置26连接,来获得音频信号的时间/频率域表达24的相位部分,以及如将在以下描述的,以受控形式将该相位部分传递至重新组合装置38,重新组合装置38附加地与逆滤波组34的输出连接,来获得音频信号的时间/频率表达的修改的幅度部分。重新组合装置38将由相位处理36修改的相位部分和由水印修改的音频信号时间/频率域表达的幅度部分进行结合,并将结果(即,具有水印的音频信号的时间/频率表达)输出至与第一滤波器组20相逆的滤波器组40。加窗装置42连接在逆滤波器组40的输出与输出16之间。由于组件34、38、40、42部分负责从修改的频率/调制频率表达中生成以时间表达的具有水印的音频信号,所以可以认为这部分是嵌入器10的合成部分。
以上已经对嵌入器10的设置进行了描述,以下将描述嵌入器10的功能模式。
嵌入开始于由装置18和20将输入12处的音频信号从时间表达转变为时间/频域表达,其中,假设输入12处的音频输入信号以由预定采样频率进行采样的形式呈现,即,以采样或音频值序列呈现。如果音频信号尚不是这样的采样形式,则在这里可以使用相应的A/D转换器作为采样装置。
加窗装置18接收音频信号,并且从音频信号中提取音频值块的序列。为此,加窗装置18将输入12处音频信号的预定数量的连续音频值结合,以形成时间块,并且通过窗函数或加权函数(例如,正弦窗、KBD窗等),与音频信号12中代表时间窗的这些时间块相乘或对其进行加窗。该过程称为加窗,以及示例性地执行该过程,使得各个时间块指向彼此重叠(例如,重叠一半)的音频信号的时间段,因此每个音频值被分配到两个时间块。
在图2中,更详细地示例性地示出了对于50%重叠的情况,装置18的加窗过程。图2由箭头50示出了以到达输入12处的时间序列的音频值序列。音频值代表时域22中的音频信号12。图2中的索引n表示沿箭头方向增加的音频值的索引。52表示加窗装置18施加于时间块的窗函数。在图2中,分别由索引2m和2m+1表示前两个时间块的前两个加窗函数。可以看出,时间块2m和接下来的时间块2m+1重叠一半或50%,因而每个都具有共用的一半音频值。由装置18生成、并传递至滤波器组20的块与由窗函数52对属于时间块的音频值进行加权或者两者的乘法相对应。
如由图2中的箭头54所示,滤波器组20接收时间块、或者加窗的音频值块,并且由时间/频率变换52逐块地将其转变为频谱表达。因此,依据设计,滤波器组执行将频谱范围分为预定的频带或者频率成分的预定分离。示例性地,频谱表达包括频谱值,这些频谱值具有从频率0至音频信号所基于的最大音频频率(示例性地,44.1kHz)的彼此紧邻的频率。图2代表分为十个子频带的频谱分离的示例情况。
在图2中,由多个箭头58示出了逐块的转变。每个箭头与转变到频域的一个时间块相对应。示例性地,如图2中由一列方框所表示的,时间块2m转变为频谱值62的块60。每个频谱值指示不同的频率成分、或者不同的频带,其中,在图2中,由轴64来表示频率k所沿的方向。如已经提及的,假设仅有十个频谱成分,然而,该数值仅是示例性的,在现实中,将可能更大。
由于滤波器组在每个时间块生成频谱值62中的一块60,所以在时间上产生频谱值62的多个序列,即每个频谱成分k或子频带k中一个。在图2中,如由箭头66所示,这些时间序列沿线的方向。因此,箭头66代表时间/频率表达的时间轴,而箭头64表示该表达的频率轴。“采样频率”或者各个子频带内频谱值的重复距离与音频信号中时间块的频率或重复距离相对应。因此,时间块重复频率与由音频信号采样频率除以每时间块的音频值个数所得的二倍相对应。因此,只要箭头66代表时间块的时间序列,箭头66就与时间维度相对应。
可以看出,经过这些时间块的持续时间,代表音频信号的时间/频率域表达24的频谱值62的矩阵68形成特定数量(这里示例性地是数值8)的连续时间块。
例如,由滤波器组20对时间块逐块执行的时间/频率变换56是DFT、DCT、MDCT等。依据该变换,块60内的各个频谱值被分到特定的子频带。对于每个子频带,每个块60可以包括多于一个频谱值62。总之,经过时间块序列的结果是代表各个子频带的时间形式的频谱值序列,在图2中,是沿每子频带或频谱成分的线84的方向。
滤波器组20逐块地将频谱值62的块60传递至幅度/相位检测装置26。后者处理复合频谱值,并仅将频谱值的幅度传递至滤波器组28。然而,将频谱值62的相位传输至相位处理装置36。
类似于滤波器组20,即,再次优选地使用加窗和重叠的块,通过逐块地将这些序列块逐块转换为频谱表达或调制频率表达,滤波器组28处理每子频带的频谱值62的幅度序列70,其中优选地,所有子频带的基本块是彼此同等地时间导向(time-oriented)的。换言之,滤波器组28将会同时或共同地处理每个频谱值幅度的N个频谱块60。频谱值幅度的N个频谱块60形成频谱值幅度矩阵68。例如,如果有M个子频带,则滤波器组28将会处理在每个N*M频谱值幅度矩阵中的频谱值幅度。图3假设了M=N的示例情况,而在图2中示例性地假设了N=10及M=8。在图2中,由箭头72指示将这样的频谱值幅度矩阵68的幅度部分传递至滤波器组28。
在接收到连续的频谱块或矩阵68的幅度部分N之后,滤波器28将会(分别对于每个频带)把各个子频带的频谱值幅度块(即,矩阵68中的行)从时间域66变换为频率表达,其中,如已经提及的,可以对频谱值幅度进行加窗以避免混叠效应。换言之,滤波器组28将会把这些频谱值幅度块中的每个从代表各个子频带时间形式的序列70转变为频谱表达,因而每频带生成一个调制值的块,这在图2中由74表示。每个块74包含多个调制值(未在图2中示出)。块74中的这些调制值的每一个与不同的调制频率相关联,这些调制频率在图2中沿轴76,因而轴76代表频率/调制频率表达的调制频率轴。通过依据沿轴78的子频带频率来排列块74,调制值的矩阵80在与矩阵68相关联的时间部分中,形成代表输入12处的音频信号的频率/调制频域的表达。
如已经提及的,为了避免假象(artifact),滤波器组28或装置26可以包括内部加窗装置(未示出),在通过滤波器组28的各个时间/调制频率变换80变换为调制频率域30以获得块74之前,通过窗函数82对每个子频带频谱值的变换块(即,矩阵68的行)进行加窗。
再次,明确指出,以上面描述的方式来处理矩阵80的序列,其中,矩阵80的序列在时间上50%重叠之前,进行了示例性地提及的50%重叠加窗。换言之,滤波器组28形成连续N个时间块的矩阵80,使得每个矩阵80指示重叠一半的N个时间块,如示例性地由图2中表示对下一矩阵加窗的窗函数84示出的。
由滤波器组28输出的频率/调制频率域表达30的调制值到达水印嵌入装置32。然后,水印嵌入装置32修改调制矩阵80、或者音频信号12的调制矩阵80的调制值中的单个或多个。例如,通过调制子频带频谱或频率/调制频域表达的各个调制频率/频率部分的乘法加权,即,通过由在轴76和78上取值的频率/调制频率间隔的特定区域内的调制值的加权,可以进行由装置32执行的修改。此外,该修改可以包括将各个部分或调制值设置为特定值。
乘法加权或特定值将会依据以预定方式在输入14处获得的水印。因此,将会以信号自适应的方式,即,附加地依据音频信号12本身,来进行将各个调制值或调制值的部分设置为特定值。
一方面,可以通过将声音频率轴78细分为频率组,来获得2维调制子频带频谱的各个部分,另一方面,还可以通过将调制频率轴76细分为调制频率组,来执行另一分割。在图1中,示例性地表示了将频率轴分为5组、以及将调制频率轴分为4组、结果导致了20个部分的分割。黑色部分示例性地表示装置32修改了调制矩阵80的那些位置,其中,如之前提及的,用于修改的这些位置可以在时间上发生变化。优选地,选择这些位置,使得通过掩蔽效应,频率/调制频率表达中的音频信号的改变是听不到或几乎听不到的。
在装置32修改了调制矩阵80之后,将会把调制矩阵80的修改后的调制值发送至逆滤波器组34,通过与滤波器组28相逆的变换(即如,IDF、IFFT、IDCT等),逆滤波器组34以逐块74的方式(即,所分的每个子频带),沿调制频率轴76,将调制矩阵80重新转变为时间/频率域表达24,以按照这样的方式获得修改后的幅度部分频谱值。换言之,逆滤波器组34通过与变换86相逆的变换,将属于特定子频带的修改后的调制值74的每个块转变为每个子频带一个幅度部分频谱值序列,根据上述实施例,结果是N×M幅度部分频谱值的矩阵。
因此,来自逆滤波器组34的幅度部分频谱值将总是与二维块、或者与来自频谱值序列流的矩阵相关(当然是以由水印修改的形式)。根据示例性实施例,这些块重叠50%。然后,在此示例性的50%重叠的情况下,在装置34中示例性提供的装置(未示出)通过添加频谱值的连续矩阵的重叠的、重新组合的频谱值,来补偿加窗,其中,该频谱值是通过对连续的调制矩阵进行重新变换而获得的。这里,再次从修改后的频谱值的各个矩阵中,形成修改后的频谱值的流或序列,即,每个子频带一个。这些序列仅与频谱值的未修改序列70的幅度部分(如已由装置20输出的)相对应。
重新组合装置38将结合以形成子频带流的逆滤波器组34的幅度部分频谱值与频谱值62的相位部分进行组合,所述相位部分是在第一滤波器组20的变换56之后,由检测装置26直接分解、但是具有由相位处理36所修改的形式的。相位处理装置36以与装置32的水印嵌入独立、但是也许依据该嵌入的方式,来修改相位部分,使得在检测器或解码器系统中的水印的可检测性(这将在之后参照图3进行解释)可以更好地检测,和/或在具有要在输出16处输出的水印的输出信号中,更好地声音掩蔽了水印信号,因而提高了水印的听不到性。可以由重新组合装置38逐矩阵地执行每个矩阵68的重新组合,或者,连续地在每个子频带的修改后的幅度部分频谱值序列上执行重新组合。在图1中,由虚线表示的箭头88示出了,输入12处的音频信号时间/频率表达的相位部分的处理、与处理装置32的对频率/调制频率表达的处理的可选依赖性。例如,通过将频谱值的相位添加至相应的修改后的频谱值的相位部分(如由滤波器组34输出的),来执行重新组合。
因此,以这种方式,装置38生成类似于在滤波器组20之后直接从没有改变的音频信号中获得的每个子频带的频谱值序列,即序列70(但是具有经水印改变的形式),使得由装置38重新组合和输出的、并且关于幅度部分进行了修改的频谱值代表具有水印的音频信号的时间/频率表达。
因此,逆滤波器组40再次获得了修改后的频谱值序列,即每个子频带一个序列。换言之,逆滤波器组40每周期获得修改后频谱值的一个块,即,对于一个时间部分,具有水印的音频信号的一个频率表达。相应地,滤波器组40在每个这样的频谱值的块(即,沿频率轴70排列的频谱值)处执行与滤波器组20的变换56相逆的变换,作为结果,获得修改后的加窗时间块、或者加窗的修改后的音频值的时间块。后续的加窗装置42通过添加重叠区域内彼此对应的音频值,来补偿由加窗装置18所引入的加窗,补偿的结果是,在输出16处的时域表达22的具有水印的输出信号。
上面对根据图1-2的实施例的水印嵌入进行了描述,接下来将参照图3对设备进行描述,该设备适于成功地分析具有水印并由嵌入器10生成的输出信号,以便从中再次重构和检测来自该设备的水印,其中,该水印优选地以对于人类听力听不到的方式,包含于具有水印、以及具有有用音频信息的输出信号中。
通常标为100的图3的水印解码器包括音频信号输入112,用于接收具有水印的音频信号;以及输出114,用于输出从具有水印的音频信号中提取出来的水印。在输入112之后,存在串联连接、并且按照如依次列出的顺序的以下装置:加窗装置118、滤波器组120、幅度/相位检测装置126和第二滤波器组128,这些装置的功能和操作模式与嵌入器10中的块18、20、26和28相对应。这意味着,由加窗装置118和滤波器组120将输入112处的具有水印的音频信号从时域122转换至时间频率域124,由检测装置126和第二滤波器组128将输入112处的音频信号从时间频率域124转换为频率/调制频率域130。然后,具有水印的音频信号经过装置118、120、126和128的如参照图2所描述的对于原始音频信号的相同处理。然而,作为结果的调制矩阵并不完全与在嵌入器10中由水印嵌入装置32输出的那些矩阵相对应,这是由于调制部分中的一些相对于所修改的调制矩阵发生了改变,其中,这些所修改的调制矩阵由装置32输出、通过重新组合装置38的相位重新组合、因而在具有水印的输出信号中以稍微改变了的形式表示。逆向加窗或者OLA也改变了调制部分,以在解码器100中进行重新的调制频谱分析。
滤波器组128用于获得具有水印的输入信号或者调制矩阵的频率/调制域表达,提供与滤波器组128连接的水印解码装置132,以从该表达中提取最初由嵌入器10引入的水印,并在输出114处输出该水印。在与那些已经由嵌入器10用于嵌入的调制矩阵的预定位置相对应的预定位置处,执行该提取。例如,由相应的标准来确保位置的匹配选择。
还可以由具有水印的输入信号引起馈入水印解码装置132中的、与在嵌入器10中的装置32中生成的调制矩阵相比所引起的调制矩阵的变化,其中,该具有水印的输入信号在它的生成或输出16处的输出与检测器100的检测或输入112处的接收之间以某种方式(例如,通过音频值的更粗糙量化)恶化。
接下来将要参照图4和5,对水印嵌入音频信号的方案的另一实施例进行描述,该方案与参照图1至3所描述的方案相比,仅在音频信号从时域至频率/调制频率域的转换类型和方式上有所不同,接下来,将对示例的应用领域或方式进行描述,其中,可以非常有用地使用之前描述的嵌入方案。因此,以下示例示例性地涉及在广播监控和在DRM系统中(例如,传统的WM(水印)系统)的应用领域。然而,以下描述的应用不仅仅可以应用于要在以下描述的图4和5的实施例中。
一方面,以上描述的将水印嵌入音频信号的实施例可以用于证实音频信号的原创作者。示例性地,到达输入12处的原始音频信号是音乐。当制作音乐时,可以由嵌入器10将水印形式的作者信息引入音频信号,其结果是在输出16处的具有水印的音频信号。如果第三人自称是相应音乐或音乐标题的作者,则能够使用可以通过检测器100、从具有水印的音频信号中再次提取出来(但在正常的播放中听不到)的水印,来证实实际的原创作者。
以上示出的水印嵌入的另一可能使用是,使用水印用于登陆TV和广播站的广播节目。通常将广播节目分为不同的部分,如单独的音乐标题、广播剧、广告等。音频信号的作者、或者至少是被允许的、或者想要利用特定音乐标题或广告来赚钱的人,可以通过嵌入器10来给他或她的音频信号提供水印,并使具有水印的音频信号对广播公司运营商可用。以这种方式,音乐标题或广告可以具有各自明确的水印。为了登陆广播节目,示例性地,可以使用检查广播信号的水印、并登陆发现的水印的计算机。使用所发现的水印的列表,可以容易地生成相应广播站的广播列表,这使得结算和收费较为容易。
另一应用领域是使用水印来确定非法拷贝。以这种方式,对于在因特网上散布音乐来说,使用水印尤其有意义的。如果顾客购买了音乐标题,则在将音乐数据传输至顾客时,使用水印将明确的顾客号嵌入数据中。其结果是,听不到地在音乐标题中嵌入了水印。如果在之后的时间点处,在因特网的站点(例如,交换站点)上发现了未经同意的音乐标题,则可以通过根据图3的解码器,来检查该音乐的水印,以及可以使用该水印来识别原始的顾客。后者的使用还可以为当前的DRM(数字版权管理)解决方案扮演重要角色。这里,具有水印的音频信号中的水印可以用作一种“第二防线”,当回避(bypass)了对具有水印的音频信号的密码保护时,允许跟踪原始顾客。
例如,在出版物Chr.Neubauer,J.Here的“Advanced Watermarkingand its Applications”,109th Audio Engineering Society Convention,LosAngeles,Sept.2000,Preprint 5176中,描述了水印的另一应用。
接下来,将参照嵌入方案的实施例,来描述嵌入器和水印解码器,其中,与图1-3实施例相比,该嵌入器和水印解码器使用了音频信号从时域至频率/调制频率域的不同的转换。在接下来的描述中,图中与图1和3中的那些元件相同的或者具有相同意义的元件,具有与图1和3中所提供的相同的参考数字,其中,为了避免重复,附加地,对于图1-3的描述作出参考,用于对这些元件的功能或意义的模式作出更加具体地讨论。
如图1中的嵌入器一样,通常标为210的图4的嵌入器包括:音频信号输入12、水印输入14和用于输出具有水印的音频信号的输出16。在输入12之后跟随着加窗装置18,以及第一滤波器组20,以逐块地将音频信号转换为频谱值62的块60(图2),其中,按照这种方式在滤波器组20的输出处形成的频谱值的块的序列代表音频信号的时间/频率域表达24。然而,与图1的嵌入器10相反,并未将复合频谱值62分为幅度和相位,而是对该复合频谱值进行完全处理,以将音频信号转换到频率/调制频率域。因此,逐块地将子频带的连续频谱值的序列70转换为考虑幅度和相位的频谱表达。然而,之前,每个子频带的频谱值序列70经过解调。由混合器212通过由载波频率确定装置214从频谱值(具体地,音频信号的时间/频率域表达的这些频谱值的相位部分)中确定的调制载波成分的复共轭,对每个序列70(即,通过将连续时间块转换为特定子频带的频谱范围而产生的频谱值序列)进行相乘或混合。装置212和214用于提供对以下事实的补偿:不必要地将时间块的重复距离调谐至音频信号的载波频率成分(即,平均起来代表音频信号载波频率的可听见频率)的持续时间。在误差调谐(error tuning)的情况下,由不同的相位偏移将连续的时间块移位至音频信号的载波频率。这具有以下结果:依据在相位部分各个时间块到载波频率的相位偏移,由滤波器组20输出的频谱值的每个块60包括线性相位增加(可追溯到(trace back to)时间块各个相位偏移,即,其斜率和轴部分依据相位偏移)。由于连续时间块之间的相位偏移最初将总是增加,所以追溯到频谱值62的每个块60的相位偏移的相位增加的斜率也将增加,直至相位偏移再次变为零。
以上解释仅指频谱值的各个块60。然而,从以上解释中,很明显,对于从同一子频带的连续时间块中得出的频谱值,同样可以检测到线性相位增加,即,沿图2中的矩阵68中的行的相位增加。该相位增加还可以追溯到、并且依据连续时间块的相位偏移。总之,由于连续时间块的时间偏移,使得矩阵68中的频谱值62经历了累积的相位改变,如由轴66和64所跨距的空间中的平面所示。
因此,载波频率确定装置214通过适合的方法(如,最小误差平方算法),在矩阵68的频谱值62的经过了相位展开(phaseunwrapping)、相位形成(phase development)或相位部分调整(phaseportion lineup)的展开相位中拟合(fit)平面,并从中推导出追溯到时间块相位偏移的相位增加,其中,该相位增加发生在矩阵68中各个子频带的频谱值的序列70中。总之,每个子频带的结果是与所找到的调制载波成分相对应的推导出的相位增加。装置214将相位增加继续传输至混合器212,以便使频谱值的各个序列70通过混合器212与其复共轭相乘、或者与e-j(w*m+ )相乘(w表示特定载波,m是频谱值的索引,以及
Figure 10003_1
是所考虑的N个时间块的时间部分处的特定载波的相位偏移)。当然,载波频率确定装置214还可以执行矩阵68中的频谱值62的各个序列70的相位形式的直线一维拟合,以获得追溯到时间块相位偏移的相位增加。因此,在由混合器212解调之后,矩阵68的频谱值的相位部分“变平(level out)”,而且仅由于音频信号自身的形状而在零相位周围平均地变化。
混合器212将以这样的方式修改的频谱值62继续传输至滤波器组28,滤波器组28用于逐矩阵(图2中的矩阵68)地将修改后的频谱值62转换到频率/调制频率域。类似于图1-3的实施例,其结果是调制值矩阵,然而其中,这次考虑了时间/频率域表达24的相位和幅度。类似于图1的示例,可以提供50%重叠的加窗等。
将以这种方式生成的连续的调制矩阵继续传输至水印嵌入装置216,该水印嵌入装置216在另一输入处接收水印14。示例性地,水印嵌入装置216以与图1嵌入器10的嵌入装置32类似的方式进行操作。然而,如果必要,使用考虑了不同于在嵌入装置32中的情况的掩蔽效应的规则,来选择频率/调制频率域表达30中的嵌入位置。类似于在装置32中的,应当这样选择嵌入位置,使得所修改的调制值对于之后将在嵌入器210的输出处输出的具有水印的音频信号不产生可听到的影响。
将改变的调制值、或者改变的或修改后的调制矩阵继续传输至逆滤波器组34,这就是怎样从修改后的调制矩阵中形成修改后的频谱值的矩阵的过程。使用这些修改后的频谱值,仍然可以使由混合器212的解调引起的相位修正反向(reverse)。这就是为什么,要通过混合器218,将由逆滤波器组34每个子频带输出的修改后的频谱值块与解调载波成分混合或相乘,即,通过执行这些块与ej(w*m+
Figure 10003_2
)的相乘(其中,w依次表示各个子频带的特定载波,m是修改后的频谱值的索引,以及是所考虑的各个子频带的N个时间块的时间部分处的特定载波的相位偏移)的原因,其中,该解调载波成分是在为了解调而转换为频率/调制频率域之前,由混合器212针对该子频带使用的解调载波成分的复共轭。在后续的块合并之前,针对特定子频带块的内容的、或者在通过调制212、214进行块划分之后应用的各个子频带的各个调制器进行再次反相(inverse)。
以这种方式获得的频谱值仍然以块的形式存在,即,每个子频带有修改后的频谱值块中的一块,以及如果必要,这些频谱值经过OLA、或者用于反向加窗的合并(如,以参照图1的34所描述的方式)。然后,以这种方式获得的未加窗频谱值可用作每个子频带所修改的频谱值的流,并且表示具有水印的音频信号的时间/频率域表达。在混合器218的输出之后跟随着的是逆滤波器组40和加窗装置42,用于执行将具有水印的音频信号的时间/频率域表达转换为时域22,其结果是在输出16处的代表具有水印的音频信号的音频值序列。
与图1的过程相比,根据图4的过程的优点在于,由于相位和幅度共同用于频率/调制频率域的转换,所以在重新合并相位和修改后的幅度部分时,不会引起调制部分的重新引入。
在图5中示出了一种水印解码器,该水印解码器适于处理如由嵌入器210输出的具有水印的音频信号,以从中提取水印。解码器(通常由310指示)包括输入312,用于接收具有水印的音频信号;以及输出314,用于输出所提取的水印。在解码器310的输入312之后跟随着的是串联连接、并且按照以下提及的顺序的以下装置:加窗装置318、滤波器组320、混合器412和滤波器组328,其中,混合器412的另一输入与载波频率确定装置414的输出连接,载波频率确定装置414的输入与滤波器组320的输出连接。组件318、320、412、328和414用于相同的目的,以及以与嵌入器210的组件18、20、212、28和214相同的方式操作。以这样的方式,将具有水印的输入信号在解码器310中从时域322中经时间频率域324转换为频率/调制频率域330,其中,水印解码装置332接收并处理具有水印的音频信号的频率/调制频率域表达,以提取水印并在解码器310的输入314处输出水印。如之前所提及的,由于在图4的嵌入器系统中没有相位部分和修改后的幅度部分之间的重新组合,所以,馈入解码器310中的解码装置332的调制矩阵与馈入嵌入装置216的调制矩阵的不同小于馈入图1-3的实施例中的解码装置132的调制矩阵与馈入嵌入装置216的调制矩阵的不同。
因此,上述实施例涉及过去不知道的主题范围“子频带调制频谱分析”和“数字水印”的联系,以形成整个系统,用于在一侧使用嵌入器系统来引入水印,并且在另一侧具有检测器系统。嵌入器系统用于引入水印。嵌入器系统由以下组成:子频带调制频谱分析、执行对通过分析实现的信号表达的修改的嵌入器阶段、以及修改后的表达的信号合成。相反地,检测器系统用于识别呈现于具有水印的音频信号中的水印。检测器系统由以下组成:子频带调制频谱分析、以及使用通过分析获得的信号表达来识别和估计水印的检测阶段。
关于对频率/调制频率域中那些位置的选择、或者用于嵌入水印或提取水印的频率/调制频率域中的那些调制值的选择,应该指出,应当就心理声学因素来作出该选择,以确保在播放具有水印的音频信号时,水印是听不到的。可以利用调制频谱范围内的掩蔽效应来作出适合的选择。例如,这里可以参考T.Houtgast的“Frequency Selectivity inAmplitude Modulation Detection”,J.Acoust.Soc.Am.,vol.85,No.4,1989年4月,关于在频率/调制频率域中选择可听不到地修改的调制值,在此并入作为参考。
通常,为了更好地理解调制频谱分析,参考涉及使用调制变换的音频编码的以下出版物,其中,通过变换,将信号分为频带,接下来,执行关于幅度和相位的划分,然后,通过多个变换块,将每个子频带的幅度再次变换为第二变换形式,而不再进一步处理相位。其结果是,将各个子频带的时间包络分为“调制系数”。这些接续的文献包括:M.Vinton和L.Atlas的文章“A Scalable and Progressive Audio Codec”,Proceedings of the 2001 IEEE ICASSP,2001年5月7-11日,盐湖城,US 2002/0176353A1 by Atlas,以及其它的,J.Thompson和L.Atlas的名为“Scalable And Perceptually Ranked Signal Coding and Decoding”的文章,“A Non-uniform Modulation Transform for Audio Coding withIncreased Time Resolution”,Proceedings of the 2003 IEEE ICASSP,香港,2003年4月6-10日,以及L.Atlas的文章“Joint Acoustic AndModulation Frequency”,Journal on Applied Signal Processing 7EURASIP,pp.668-675,2003。
以上实施例仅表示了示例性的方式,能够提供具有听不到的附加信息的音频信号(具有抗处理的鲁棒性),因而将水印引入所谓的子频带调制频谱范围,并在该子频带调制频谱范围内执行检测。然而,可以对这些实施例作出不同的变化。以上提及的加窗装置可以仅用于块的形成,即,可以省略窗函数的乘法或加权。此外,可以使用不同于之前提及的三角函数的幅度的窗函数。此外,可以省略、或者不同地执行50%的块重叠。因此,在合成侧的块重叠可以包括不同于匹配连续时间块中的音频值的纯加法的操作。此外,还可以相应地改变第二变换阶段中的加窗操作。
附加地指出了,不必需将音频信号从时间域引入频率/调制频率域表达,以及在修改之后,再次从频率/调制频率域表达反向引入时间域表达。此外,还可能对之前提及的两个实施例中的以下方面进行修改:将由重新组合装置38或混合器218输出的值结合以形成比特流形式的具有水印的音频信号,以呈现于时间/频率域中。
此外,还可以不同地设计用于第二实施例中的解调,如,通过不同于固定复合载波的完全乘法的措施,来改变矩阵68内频谱值块的相位形式。
如已参照图3和5描述的与关于可能的解码器的以上实施例,应该指出,由于在水印解码装置与输入之间设置的块与相关嵌入器中的相应块的匹配,与这些装置相关的对嵌入器进行描述的所有变化的可能性以相同的方式应用于图3和5的水印解码器。
还应该指出,以上实施例只与关于音频信号的水印嵌入相关,但是该水印嵌入方案还可以应用于不同的信息信号(如,控制信号、测量信号、视频信号等)以检查例如这些信号的真实性。在所有这些情况下,当前建议的方案可以执行信息的嵌入,使得这不会妨碍具有水印形式的信息信号的正常使用(例如,对视频的测量结果或光影像的分析等),这也就是为什么在这些情况下,将要嵌入的附加数据称为水印的原因。
具体地指出了,依据环境,还可以以软件来实现本发明方案。实施方式可以在数字存储介质上,具体地,在具有控制信号的盘或CD上,其中,可以与可编程计算机系统协作以电子地读出该控制信号,使得将会执行相应的方法。通常,本发明还在计算机程序产品中,该计算机程序产品具有存储于机器可读载体上的程序代码,用于在计算机上运行计算机程序产品时来执行本发明的方法。换言之,因此,本发明可以实现为具有程序代码的计算机程序,用于在计算机上运行计算机程序产品时来执行该方法。

Claims (22)

1.一种将水印引入信息信号的设备,包括:
用于将所述信息信号从时间表达(22)转换为频谱/调制频谱表达(30)的装置(18、20、26、28;18、20、212、214、28);
用于依据要引入的所述水印,来修改以频谱/调制频谱表达的信息信号,以获得修改后的频谱/调制频谱表达的装置(32;216);以及
用于基于修改后的频谱/调制频谱表达,来形成具有水印的信息信号的装置(34、38、40、42;34、218、40、42),
其中,用于转换为所述频谱/调制频谱表达的装置包括:
用于通过逐块地变换所述信息信号,来将所述信息信号转换为时间/频谱表达的装置(18、20);以及
用于将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的装置(26、28;212、214、28),
其中,用于将所述信息信号转换为时间/频谱表达的装置(18、20)被形成为将时间/频谱表达划分为多个频谱成分,以获得每个频谱成分的频谱值序列;以及用于将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的装置(26、28;212、214、28)包括用于对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列,以获得频谱/调制频谱表达的一部分的装置(26、28;212、214、28)。
2.如权利要求1所述的设备,其中,用于对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列的所述装置(212,214,28)被形成为:首先将所述频谱值序列逐块地乘以(212)复合载波,使得所述频谱值序列的相位形式的平均斜率的幅度减小,来获得解调的频谱值块;然后在频谱上逐块地划分解调的频谱值块,来获得频谱/调制频谱表达的一部分。
3.如权利要求2所述的设备,其中,用于对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列的所述装置(212,214,28)包括:用于依据所述信息信号的时间/频谱表达,逐块地改变所述频谱值序列所乘的所述复合载波的装置(214)。 
4.如权利要求3所述的设备,其中,改变装置(214)被形成为:逐块地展开所述频谱值序列中的所述频谱值的相位,用于逐块地改变复合载波以获得相位形式;确定所述相位形式的平均斜率;以及基于所述平均斜率来确定所述复合载波。
5.如权利要求4所述的设备,其中,改变装置(214)还被形成为:从所述相位形式中确定所述相位形式的轴部分;以及基于所述轴部分,来附加地确定所述复合载波。
6.如权利要求2至5之一所述的设备,其中,用于形成具有水印的所述信息信号的所述装置(34、218、40、42)包括:
用于将所述信息信号从修改后的频谱/调制频谱表达重新转换为修改后的时间/频谱表达,来获得所述特定频谱成分的修改后的解调的频谱值块的装置(34);以及
用于将所述修改后的解调的频谱值块逐块地与载波相乘,以获得修改后的频谱值块的装置(218),其中,所述载波是所述复合载波的复共轭;以及
用于结合所述修改后的解调的频谱值块,来形成修改后的频谱值序列,以获得具有水印的信息信号的时间/频谱表达的一部分的装置。
7.如权利要求6所述的设备,其中,形成装置还包括:
用于将所述具有水印的信息信号从时间/频谱表达重新转换为时间表达的装置。
8.如权利要求1所述的设备,其中,用于对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列的所述装置(26、28)被形成为:首先对所述频谱值序列进行幅度计算(26),来获得频谱值幅度序列;以及然后,将所述频谱值的幅度序列逐块地转变为调制频谱表达(28),来获得频谱/调制频谱表达的一部分。
9.如权利要求8所述的设备,其中,用于形成具有水印的所述信息信号的所述装置(34、218、40、42)包括:
用于将所述信息信号从修改后的频谱/调制频谱表达重新转换为修改后的时间/频谱表达,来获得所述特定频谱成分的修改后的频谱值序列的装置(34);以及 
用于将所述修改后的频谱值序列与基于所述频谱值序列的相位的相位重新组合,以获得具有水印的所述信息信号的时间/频谱表达的一部分的装置(38)。
10.如权利要求1所述的设备,
其中,用于将所述信息信号转换为时间/频谱表达的装置(18、20)包括:
用于从所述信息信号中形成信息值块的序列的块形成装置(18);以及
用于在频谱上对信息值块的序列中的每个进行划分,以获得频谱值块的序列的装置(20),每个频谱值块包括预定的多个频谱成分中的每个的频谱值,使得所述频谱值块的序列形成每个频谱成分的频谱值序列,以及
其中,用于将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的装置包括:
用于在频谱上对序列的预定序列进行划分,以获得调制值块的装置(26、28;212、214、28),
其中,修改装置(32、216)被形成为依据要引入的水印来修改所述调制值块,以获得修改的调制值块;以及用于形成具有水印的信息信号的装置(34、38、40、42;34、218、40、42)被形成为基于所述修改的调制值块,形成具有水印的信息信号。
11.如权利要求10所述的设备,其中,用于形成具有水印的信息信号的装置(34、38、40、42;34、218、40、42)被形成为:对来自所述频谱划分(34、38;34、218)的修改后的调制值块进行重新转换,以获得修改后的频谱值序列;以及对基于所述修改后的频谱值序列的修改后的频谱块序列进行重新转换(40),来获得修改后的信息值块序列;以及结合(42)修改后的信息值块,以获得具有水印的信息信号。
12.如权利要求10或11所述的设备,其中,所述块形成装置(18)被形成为从所述信息信号中提取所述信息值块,使得所述信息值块与彼此重叠一半的信息信号的连续时间部分相关联;以及用于形成具有水印的信息信号的装置(42)被形成为在结合时使修改后的时间块彼此重叠 一半,以及对校准的相邻信息块的信息值进行重新组合。
13.如权利要求10或11所述的设备,其中,在频谱上对信息值块的序列中的每个进行划分的所述装置(20)被形成使得在频谱上划分时,提供每个频谱成分的复合频谱值序列;以及用于在频谱上对频谱值序列的预定序列进行划分的装置(26、28)被形成为仅在频谱上对所述复合频谱值的幅度进行划分(28),来获得调制值块。
14.如权利要求13所述的设备,其中,用于形成具有水印的信息信号的装置被形成为:对来自所述频谱划分的修改后的调制值块进行重新转换(34),来获得修改后的频谱值序列;依据所述修改装置的修改,来调整(36)所述复合频谱值序列的相位,以获得调整后的相位值序列;将所述调整后的相位值序列与所述修改后的频谱值序列进行重新组合(38),以获得重新组合的修改后的频谱值序列;以及对修改后的频谱值序列进行重新转换(40),以获得所述修改后的信息值块,其中,所述修改后的频谱值序列基于所述重新组合的修改后的频谱值序列。
15.如权利要求10所述的设备,其中,
用于在频谱上对信息值块的序列中的每个进行划分的所述装置(20)被形成为使得在频谱上划分时,提供每个频谱成分的复合频谱值序列;以及
用于将所述频谱值序列的预定频谱值序列转换为频谱/调制频谱表达的所述装置(212、214、28)被形成为:首先处理(212)所述频谱值序列,使得所述至少一个频谱值序列的频谱值的相位增加或减少随所述序列连续增加或减少的幅度,以获得相位处理后的频谱值序列;以及然后在频谱上对所述相位处理后的频谱值序列进行划分(28),以获得所述至少一个调制值块;以及
用于形成具有水印的信息信号的装置(34、38;40、42)被形成为:对来自频谱划分的所述修改后的调制值块进行重新转换,以获得修改后的频谱值序列;对所述修改后的频谱值序列进行处理(218),所述处理(218)与用于在频谱上对所述频谱值序列中的所述预定频谱值序列进行划分的所述装置(212)相反,使得所述至少一个频谱值序列的所述频谱值的相位增加或减少随所述序列连续增加或减少的幅度,以获得处理后 的频谱值序列;对基于所述修改后的频谱值序列的修改后的频谱块序列进行重新转换(40),以获得修改后的信息值块的序列;以及结合(42)所述修改后的信息值块,以获得具有水印的信息信号。
16.如权利要求1至5之一所述的设备,其中,修改装置(32;216)被调整为在时间上改变的频谱/调制频谱表达的位置处执行修改。
17.如权利要求1至5之一所述的设备,其中,修改装置(32;216)被调整为依据所述信息信号来执行修改。
18.如权利要求1至5之一所述的设备,其中,修改装置(32;216)被调整为执行修改,使得由于心理声学掩蔽效应,所述修改并不导致具有水印的所述信息信号的可听到的改变。
19.如权利要求1至5之一所述的设备,其中,所述水印指示作者信息、表征所述信息信号的标识号、或者顾客号。
20.一种用于从具有水印的信息信号中提取水印的设备,包括:
用于将具有水印的所述信息信号从时间表达转换为频谱/调制频谱表达的装置(118、120、126、128;318、320、414、412、328);
用于基于所述频谱/调制频谱表达,来推导出所述水印的装置(132;332),
其中,用于转换为所述频谱/调制频谱表达的装置包括:
用于通过逐块地变换所述信息信号,来将所述信息信号转换为时间/频谱表达的装置(118、120);以及
用于将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的装置(126、128;412、414、328),
其中,用于将所述信息信号转换为时间/频谱表达的装置(118、120)被形成为将时间/频谱表达划分为多个频谱成分,以获得每个频谱成分的频谱值序列;以及用于将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的装置(126、128;412、414、328)包括用于对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列,以获得频谱/调制频谱表达的一部分的装置(126、28;412、414、328)。
21.一种将水印引入信息信号的方法,包括:
将所述信息信号从时间表达(22)转换(18、20、26、28;18、20、 212、214、28)为频谱/调制频谱表达(30);
依据要引入的水印,来修改(32;216)以所述频谱/调制频谱表达的所述信息信号,以获得修改后的频谱/调制频谱表达;以及
基于所述修改后的频谱/调制频谱表达,来形成(34、38、40、42;34、218、40、42)用于具有水印的信息信号,
其中,转换为所述频谱/调制频谱表达的步骤包括:
通过逐块地变换所述信息信号,来将所述信息信号转换为时间/频谱表达;以及
将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达,
其中,将所述信息信号转换为时间/频谱表达的步骤包括:将时间/频谱表达划分为多个频谱成分,以获得每个频谱成分的频谱值序列;以及将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的步骤包括:对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列,以获得频谱/调制频谱表达的一部分。
22.一种用于从具有水印的信息信号中提取水印的方法,包括:
将具有水印的所述信息信号从时间表达转换(118、120、126、128;318、320、414、412、328)为频谱/调制频谱表达;
基于所述频谱/调制频谱表达,来推导(132;332)出所述水印,
其中,转换为所述频谱/调制频谱表达的步骤包括:
通过逐块地变换所述信息信号,来将所述信息信号转换为时间/频谱表达;以及
将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达,
其中,将所述信息信号转换为时间/频谱表达的步骤包括:将时间/频谱表达划分为多个频谱成分,以获得每个频谱成分的频谱值序列;以及将所述信息信号从时间/频谱表达转换为频谱/调制频谱表达的步骤包括:对于预定的频谱成分,在频谱上逐块地划分所述频谱值序列,以获得频谱/调制频谱表达的一部分。 
CN2005800196764A 2004-04-30 2005-03-11 水印嵌入 Active CN1969487B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004021404.2 2004-04-30
DE102004021404A DE102004021404B4 (de) 2004-04-30 2004-04-30 Wasserzeicheneinbettung
PCT/EP2005/002636 WO2005109702A1 (de) 2004-04-30 2005-03-11 Wasserzeicheneinbettung

Publications (2)

Publication Number Publication Date
CN1969487A CN1969487A (zh) 2007-05-23
CN1969487B true CN1969487B (zh) 2011-08-17

Family

ID=34961950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800196764A Active CN1969487B (zh) 2004-04-30 2005-03-11 水印嵌入

Country Status (17)

Country Link
US (1) US7676336B2 (zh)
EP (1) EP1741215B1 (zh)
JP (1) JP5048478B2 (zh)
KR (3) KR20080081098A (zh)
CN (1) CN1969487B (zh)
AU (1) AU2005241609B2 (zh)
BR (1) BRPI0509819B1 (zh)
CA (1) CA2564981C (zh)
DE (1) DE102004021404B4 (zh)
ES (1) ES2449043T3 (zh)
HK (1) HK1103320A1 (zh)
IL (1) IL178929A (zh)
MX (1) MXPA06012550A (zh)
NO (1) NO338923B1 (zh)
PL (1) PL1741215T3 (zh)
RU (1) RU2376708C2 (zh)
WO (1) WO2005109702A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
DE102004023436B4 (de) * 2004-05-10 2006-06-14 M2Any Gmbh Vorrichtung und Verfahren zum Analysieren eines Informationssignals
EP1891626A1 (en) * 2005-06-03 2008-02-27 Koninklijke Philips Electronics N.V. Homomorphic encryption for secure watermarking
EP1764780A1 (en) * 2005-09-16 2007-03-21 Deutsche Thomson-Brandt Gmbh Blind watermarking of audio signals by using phase modifications
US20090271318A1 (en) * 2006-08-29 2009-10-29 Benjamin Filmalter Grobler Digital data licensing system
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US8099285B2 (en) * 2007-12-13 2012-01-17 Dts, Inc. Temporally accurate watermarking system and method of operation
US20090265366A1 (en) * 2008-04-22 2009-10-22 Qualcomm Incorporated Opportunistic opinion score collection on a mobile device
CN101271690B (zh) * 2008-05-09 2010-12-22 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法
JP5338170B2 (ja) * 2008-07-18 2013-11-13 ヤマハ株式会社 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム
JP5582508B2 (ja) * 2008-08-14 2014-09-03 エスケーテレコム株式会社 データ送信装置、データ受信装置、データ送信方法、及びデータ受信方法
JP2011145541A (ja) * 2010-01-15 2011-07-28 Yamaha Corp 再生装置、楽音信号出力装置、再生システム及びプログラム
EP2362382A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark signal provider and method for providing a watermark signal
EP2362387A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding
EP2362386A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a two-dimensional bit spreading
JP5459069B2 (ja) * 2010-05-24 2014-04-02 ヤマハ株式会社 音声信号に埋め込まれた電子透かし情報を除去する装置、および音声信号に電子透かし情報を埋め込む装置
EP2431970A1 (en) 2010-09-21 2012-03-21 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermarked signal based on discrete valued data and method for providing discrete valued data in dependence on a watermarked signal
EP2565667A1 (en) 2011-08-31 2013-03-06 Friedrich-Alexander-Universität Erlangen-Nürnberg Direction of arrival estimation using watermarked audio signals and microphone arrays
TWI457852B (zh) * 2011-11-22 2014-10-21 Univ Nat Taiwan Normal 文件複印後呈現內容意義改變之浮水印製作方法
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9380383B2 (en) * 2013-09-06 2016-06-28 Gracenote, Inc. Modifying playback of content using pre-processed profile information
US9990928B2 (en) * 2014-05-01 2018-06-05 Digital Voice Systems, Inc. Audio watermarking via phase modification
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
US10262118B2 (en) * 2015-01-06 2019-04-16 Robert Antonius Adrianus Van Overbruggen Systems and methods for authenticating digital content
WO2016115483A2 (en) * 2015-01-15 2016-07-21 Hardwick John C Audio watermarking via phase modification
JP6163680B1 (ja) * 2016-10-27 2017-07-19 エヴィクサー株式会社 コンテンツ再生プログラム及びコンテンツ再生装置
CN107375810A (zh) * 2017-08-03 2017-11-24 广河县盛和中医医院 一种专治男科阳痿早泄的组合物
CN109166570B (zh) * 2018-07-24 2019-11-26 百度在线网络技术(北京)有限公司 一种语音切分的方法、装置、设备和计算机存储介质
US11244692B2 (en) 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
CN111341329B (zh) * 2020-02-04 2022-01-21 北京达佳互联信息技术有限公司 水印信息添加方法、提取方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1189042A (zh) * 1996-11-05 1998-07-29 日本电气株式会社 数字水印
CN1272284A (zh) * 1998-03-18 2000-11-01 皇家菲利浦电子有限公司 用于拷贝保护的数字材料的拷贝保护方案
CN1327585A (zh) * 1999-07-02 2001-12-19 皇家菲利浦电子有限公司 根据灵活格式附加水印密钥

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0519782A (ja) * 1991-05-02 1993-01-29 Ricoh Co Ltd 音声特徴抽出装置
US5173923A (en) * 1991-11-22 1992-12-22 Bell Communications Research, Inc. Spread-time code division multiple access technique with arbitrary spectral shaping
US5321497A (en) * 1992-03-09 1994-06-14 Wyko Corporation Interferometric integration technique and apparatus to confine 2π discontinuity
US5671168A (en) * 1995-07-06 1997-09-23 Technion Research & Development Foundation Ltd. Digital frequency-domain implementation of arrays
EP0766468B1 (en) * 1995-09-28 2006-05-03 Nec Corporation Method and system for inserting a spread spectrum watermark into multimedia data
DE19640825C2 (de) * 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierer zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Decodierer zum decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
EP0875107B1 (de) * 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US5724270A (en) * 1996-08-26 1998-03-03 He Holdings, Inc. Wave-number-frequency adaptive beamforming
WO1999018723A1 (en) * 1997-10-08 1999-04-15 Macrovision Corporation Method and apparatus for a copy-once watermark for video recording
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6064764A (en) 1998-03-30 2000-05-16 Seiko Epson Corporation Fragile watermarks for detecting tampering in images
KR100362801B1 (ko) 1998-05-20 2002-11-29 매크로비젼 코포레이션 특정 스케일 및 임의 쉬프트에 대해 워터마크를 검출하는방법 및 장치
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6725371B1 (en) * 1999-06-30 2004-04-20 Intel Corporation Secure packet processor
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6725372B1 (en) * 1999-12-02 2004-04-20 Verizon Laboratories Inc. Digital watermarking
JP3507743B2 (ja) * 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
WO2001054053A1 (en) 2000-01-24 2001-07-26 Ecole Polytechnique Federale De Lausanne Transform domain allocation for multimedia watermarking
JP3659321B2 (ja) * 2000-06-29 2005-06-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子透かし方法およびそのシステム
US7298841B2 (en) * 2000-07-27 2007-11-20 Activated Content Corporation Stegotext encoder and decoder
WO2002015587A2 (en) * 2000-08-16 2002-02-21 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US20020168082A1 (en) * 2001-03-07 2002-11-14 Ravi Razdan Real-time, distributed, transactional, hybrid watermarking method to provide trace-ability and copyright protection of digital content in peer-to-peer networks
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7006452B2 (en) * 2001-05-22 2006-02-28 Intel Corporation Matching DSL data link layer protocol detection
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
JP2003044067A (ja) * 2001-08-03 2003-02-14 Univ Tohoku 位相の周期偏移によるディジタルデータの埋めこみ・検出装置
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
FR2834363B1 (fr) * 2001-12-27 2004-02-27 France Telecom Procede de caracterisation d'un signal sonore
US7243060B2 (en) * 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
JP2005525600A (ja) 2002-05-10 2005-08-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 透かしの埋め込み及び取り出し
US7254500B2 (en) * 2003-03-31 2007-08-07 The Salk Institute For Biological Studies Monitoring and representing complex signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1189042A (zh) * 1996-11-05 1998-07-29 日本电气株式会社 数字水印
CN1272284A (zh) * 1998-03-18 2000-11-01 皇家菲利浦电子有限公司 用于拷贝保护的数字材料的拷贝保护方案
CN1327585A (zh) * 1999-07-02 2001-12-19 皇家菲利浦电子有限公司 根据灵活格式附加水印密钥

Also Published As

Publication number Publication date
US20080027729A1 (en) 2008-01-31
BRPI0509819A (pt) 2007-09-18
CA2564981C (en) 2011-12-06
ES2449043T3 (es) 2014-03-18
HK1103320A1 (en) 2007-12-14
KR20070015182A (ko) 2007-02-01
RU2376708C2 (ru) 2009-12-20
CN1969487A (zh) 2007-05-23
CA2564981A1 (en) 2005-11-17
BRPI0509819B1 (pt) 2023-10-03
IL178929A (en) 2011-03-31
AU2005241609A1 (en) 2005-11-17
NO338923B1 (no) 2016-10-31
JP5048478B2 (ja) 2012-10-17
MXPA06012550A (es) 2006-12-15
IL178929A0 (en) 2007-03-08
US7676336B2 (en) 2010-03-09
DE102004021404B4 (de) 2007-05-10
JP2007535699A (ja) 2007-12-06
NO20065424L (no) 2007-01-31
AU2005241609B2 (en) 2008-01-10
EP1741215B1 (de) 2013-12-25
KR100902910B1 (ko) 2009-06-15
KR20080081098A (ko) 2008-09-05
DE102004021404A1 (de) 2005-11-24
EP1741215A1 (de) 2007-01-10
KR20080094851A (ko) 2008-10-24
RU2006142304A (ru) 2008-06-10
PL1741215T3 (pl) 2014-05-30
WO2005109702A1 (de) 2005-11-17

Similar Documents

Publication Publication Date Title
CN1969487B (zh) 水印嵌入
CA2705549C (en) Methods and apparatus to perform audio watermarking and watermark detection and extraction
Özer et al. An SVD-based audio watermarking technique
Hu et al. A DWT-based rational dither modulation scheme for effective blind audio watermarking
Al-Haj An imperceptible and robust audio watermarking algorithm
Nematollahi et al. Blind digital speech watermarking based on Eigen-value quantization in DWT
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
Hu et al. High-performance self-synchronous blind audio watermarking in a unified FFT framework
Singh et al. Audio watermarking based on quantization index modulation using combined perceptual masking
KR20060027351A (ko) 적은 주파수 성분들을 갖는 미디어 신호 내의 부가적데이터의 검출 가능성을 증가시키는 방법
Ko et al. Robust watermarking based on time-spread echo method with subband decomposition
Saito et al. A digital watermarking for audio data using band division based on QMF bank
Nishimura Reversible and robust audio watermarking based on spread spectrum and amplitude expansion
Bellaaj et al. Audio watermarking technique in frequency domain: comparative study MDCT Vs DCT
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
Blackledge et al. Audio data verification and authentication using frequency modulation based watermarking
Cvejic et al. Audio watermarking: Requirements, algorithms, and benchmarking
Farooq et al. Blind tamper detection in audio using chirp based robust watermarking
Wang et al. A robust watermarking system based on the properties of low frequency in perceptual audio coding
Mosleh et al. Presenting a Novel Audio Watermarking Based on Discrete Wavelet Transform
Neubauer et al. Robustness evaluation of transactional audio watermarking systems
Koz et al. Adaptive selection of embedding locations for spread spectrum watermarking of compressed audio
HUSAIN Sottor of^ I) iIos (opf) p
Iwakiri et al. Infomation Media Processing for Security. The Watermarking of Digital Sound by Band Division and Spectral Spreading.
Saxena et al. Transformed Domain Audio Watermarking Using DWT and DCT

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant