WO2005109702A1

WO2005109702A1 - Wasserzeicheneinbettung

Info

Publication number: WO2005109702A1
Application number: PCT/EP2005/002636
Authority: WO
Inventors: Juergen Herre; Ralph Kulessa; Sascha Disch; Karsten Linzmeier; Christian Neubauer; Frank Siebenhaar
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date: 2004-04-30
Filing date: 2005-03-11
Publication date: 2005-11-17
Also published as: KR20080094851A; DE102004021404A1; US7676336B2; JP2007535699A; AU2005241609A1; NO20065424L; CN1969487B; PL1741215T3; EP1741215A1; RU2006142304A; IL178929A; CN1969487A; EP1741215B1; RU2376708C2; KR20080081098A; DE102004021404B4; ES2449043T3; KR20070015182A; US20080027729A1; AU2005241609B2

Abstract

Nach einem erfindungsgemäßen Schema zum Einbringen eines Wasserzeichens in ein Informationssignal, wird zunächst das Informationssignal (12) von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30) überführt. Das Informationssignal wird dann in der Spektral/Modulationsspektraldarstellung (30) abhängig von dem einzubringenden Wasserzeichen (14) manipuliert, um eine modifizierte Spektral/Modulationsspektraldarstellung zu erhalten, und anschließend wird ein wasserzeichenbehaftetes Informationssignal (16) basierend auf der modifizierten Spektral/Modulationsspektraldarstellung gebildet. Ein Vorteil besteht darin, dass dadurch, dass das Wasserzeichen (14) in der Spektral/Modulationsspektraldarstellung bzw. -Domäne eingebettet bzw. hergeleitet wird, traditionelle Korrelationsangriffe, wie sie bei den spreizbandmodulationsbasierten Wasserzeichenverfahren eingesetzt werden, nicht ohne weiteres zum Ziel führen.

Description

Wasserzeic eneinbettung

Beschreibung

Die vorliegende Erfindung bezieht sich auf ein Schema zur Einbringung eines Wasserzeichens in ein Informationssignal, wie z.B. ein Audiosignal.

Mit zunehmender Verbreitung des Internets hat auch die Musikpiraterie drastisch zugenommen. An vielen Stellen im Internet werden Musikstücke bzw. allgemeine Audiosignale angeboten, um dort heruntergeladen werden zu können. In den allerwenigsten Fällen werden hierbei Urheberrechte beach- tet . Insbesondere wird sehr selten die Erlaubnis des Urhebers eingeholt, sein Werk zur Verfügung zu stellen. Noch seltener werden Gebühren an den Urheber bezahlt, die der Preis für ein rechtmäßiges Kopieren sind. Darüber hinaus findet ein unkontrolliertes Kopieren von Werken statt, was in den allermeisten Fällen ebenfalls ohne Berücksichtigung von Urheberrechten geschieht.

Wenn Musikstücke über das Internet von einem Provider bzw. Anbieter für Musikstücke rechtmäßig erworben werden, er- zeugt der Provider üblicherweise einen Header bzw. einen dem Musikstück beigefügten Datenblock, in dem Copyright- Informationen sowie beispielsweise eine Kundennummer eingebracht sind, wobei die Kundennummer eindeutig auf den aktuell vorliegenden Käufer hinweist. Es ist ferner bekannt, Kopiererlaubnisinformationen in diesen Header einzufügen, welche die verschiedensten Arten von Kopierrechten signalisieren, wie z.B. dass das Kopieren des aktuellen Stücks vollständig untersagt ist, dass das Kopieren des aktuellen Stücks nur ein einziges Mal erlaubt ist, dass das Kopieren des aktuellen Stücks völlig frei ist, usw. Der Kunde verfügt über einen Decodierer oder eine Verwaltungssoftware, der bzw. die den Header einliest und unter Beachtung der erlaubten Handlungen beispielsweise nur eine einzige Kopie zulässt und weitere Kopien verweigert, oder dergleichen.

Dieses Konzept zur Beachtung der Urheberrechte funktioniert jedoch nur für Kunden, die sich legal verhalten. Illegale Kunden haben üblicherweise ein wesentliches Potential an Kreativität, die mit einem Header versehenen Musikstücke zu „knacken". Hier zeigt sich bereits der Nachteil der beschriebenen Vorgehensweise zum Schutz von Urheberrechten. Ein solcher Header kann einfach entfernt werden. Alternativ könnte ein illegaler Benutzer auch einzelne Einträge in dem Header modifizieren, um beispielsweise den Eintrag „Kopieren untersagt" in einen Eintrag „Kopieren völlig frei" umzuwandeln. Denkbar ist auch der Fall, dass ein illegaler Kunde seine eigene Kundennummer aus dem Header entfernt und dann das Musikstück auf seiner oder einer anderen Homepage im Internet anbietet. Ab diesem Moment ist es nicht mehr möglich, den illegalen Kunden zu ermitteln, da er seine Kundennummer entfernt hat.

Aus der WO 97/33391 ist ein Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal bekannt. Dabei wird das Audiosignal, in das das nicht hörbare Datensignal, hier Wasserzeichen genannt, eingebracht werden soll, in den Frequenzbereich umgewandelt, um mittels eines psychoakustischen Modells die Maskierungsschwelle des Audiosignals zu bestimmen. Das Datensignal, das in das Audiosignal eingebracht werden soll, wird mit einem Pseudo- rauschsignal moduliert, um ein frequenzmäßig gespreiztes Datensignal zu schaffen. Das frequenzmäßig gespreizte Datensignal wird dann mit der psychoakustischen Maskierungsschwelle gewichtet, derart, dass die Energie des frequenzmäßig gespreizten Datensignals immer unterhalb der Maskierungsschwelle liegt. Schließlich wird das gewichtete Daten- signal dem Audiosignal überlagert, wodurch ein Audiosignal erzeugt wird, in das das Datensignal unhörbar eingebracht ist. Das Datensignal kann zum einen dazu verwendet werden, dem Audiosignal Urheber Informationen hinzuzufügen und al- ternativ kann das Datensignal zur Kennzeichnung ^' von Audiosignalen verwendet werden, um eventuelle Raubkopien ohne weiteres zu identifizieren, da jeder Tonträger beispielsweise in Form einer CompactDisk ab Werk mit einer individu- eilen Kennung versehen wird.

Die Einbettung eines Wasserzeichens in ein unkomprimiertes Audiosignal, bei dem also das Audiosignal noch im Zeitbereich bzw. in der Zeitbereichsdarstellung vorliegt, sind auch noch in C. Neubauer, J. Herre: „Digital Watermarking and its Influence on Audio Quality", 105th AES Convention, San Francisco 1998, Preprint 4823 und in der DE 196 40 814 beschrieben. Audiosignale liegen jedoch häufig auch bereits als komprimierte Audiodatenströme vor, die beispielsweise einer Verarbeitung nach einem der MPEG-Audioverfahren unterzogen worden sind. Würde man nun eines der vorhergehenden Wasserzeicheneinbettungsverfahren verwenden wollen, um Musikstü- cke vor der Auslieferung an einen Kunden mit einem Wasserzeichen zu versehen, so müssten dieselben vor der Wasserzeicheneinbringung vollständig dekomprimiert werden, um wieder eine Folge von Zeitbereichs-Audiowerten zu erhalten. Dies bedeutete jedoch neben einem hohen Rechenaufwand auf- grund der zusätzlichen Decodierung vor der Wasserzeicheneinbettung auch, dass bei erneuter Codierung die Gefahr des Auftretens von Tandem-Codiereffekten besteht, wenn diese wasserzeichenbehafteten Audiosignale erneut codiert werden. Es sind deshalb auch Schemata zur Einbettung eines Wasserzeichens in bereits komprimierte Audiosignale bzw. komprimierte Audiobitströme entwickelt worden, die unter anderem den Vorteil besitzen, dass sie eine niedrigere Rechenkomplexität erfordern, da keine volle Decodierung des mit ei- nem Wasserzeichen zu versehenden Audiobitstroms erfolgen uss, d.h. also insbesondere die Anwendung von Analyse- und - Synthese-Filterbanken auf das Audiosignal entfallen. Weitere Vorteile dieser bereits auf komprimierte Audiosignale anwendbaren Verfahren sind die hohe Audioqualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch genau aufeinander abgestimmt werden können, ihre hohe Robustheit, da das Wasserzeichen nicht durch einen nachfolgenden Audio- codierer „geschwächt" wird, und die Ermöglichung einer geeigneten Wahl der Spreizbandparameter, so dass eine Kompatibilität zu PCM-Wasserzeichen-Verfahren (PCM = Pulse Code Modulation = Pulscodemodulation) bzw. den an unkomprimierten Audiosignalen arbeitenden Einbettungsschemata erzielt werden kann. Ein Überblick über Schemata zur Einbettung von Wasserzeichen in bereits komprimierte Audiosignale findet sich in C. Neubauer, J. Herre: „Audio Watermarking of MPEG- 2 AAC Bit Streams", 108th AES Convention, Paris 2000, Preprint 5101 und ferner in der DE 10129239 Cl.

Eine weitere verbesserte Weise der Einbringung eines Wasserzeichens in Audiosignale betreffen diejenigen Schemata, die die Einbettung während der Komprimierung eines noch unkomprimierten Audiosignals vornehmen. Einbettungsschemata dieser Art weisen unter anderem den Vorteil einer niedrigeren Rechenkomplexität auf, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z.B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in den Spektralbereich, nur einmal durchgeführt werden müssen. Weitere Vorteile umfassen eine höhere Audioqualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch genau aufeinander abgestimmt werden können, eine hohe Robustheit, da das Wasserzeichen nicht durch einen nachfolgenden Audiocodierer „geschwächt" wird, und die Möglichkeit einer geeigneten Wahl der Spreizbandparameter, um eine Kompatibilität zu dem PCM-Wasserzeichenverfahren zu erzielen. Ein Überblick über die komprimierte Wasserzeicheneinbettung/Codierung findet sich beispielsweise in Siebenhaar, Frank; Neubauer, Christian; Herre, Jürgen: „Combined Compression/Watermarking for Audio Signals", In llOth AES Convention, Amsterdam, preprint 5344; C. Neubauer, R. Ku- lessa and J. Herre: „A Compatible Family of Bitstream Wa- termarking Systems for MPEG-Audio", llOth AES Convention, Amsterdam, May 2000, Preprint 5346, und der DE 199 47 877.

Zusammenfassend ausgedrückt sind Wasserzeichen für codierte und uncodierte Audiosignale in verschiedenen Varianten bekannt. Mit Hilfe von Wasserzeichen können Zusatzdaten robust und unhörbar innerhalb eines Audiosignals übertragen werden. Es existieren heutzutage wie oben gezeigt verschiedene Wasserzeicheneinbettungsverfahren, die sich in der Do- mäne der Einbettung, wie z.B. dem Zeitbereich, dem Frequenzbereich usw., und der Art der Einbettung, wie z.B. der Quantisierung, der Auslöschung einzelner Werte, usw., unterscheiden. Zusammenfassende Beschreibungen existierender Verfahren finden sich in M. van der Veen, F. Brukers et al.: „Robust, Multi-Functional and High-Quality Audio Watermarking Technology", llOth AES Convention, Amsterdam May 2002, Preprint 5345; Jaap Haitsma, Michiel van der Veen, Ton Kalker and Föns Bruekers: „Audio Watermarking for Monitoring and Copy Protection", ACM Workshop 2000, Los Ange- les, und der bereits zitierten DE 196 40 814.

Obwohl die im Vorhergehenden kurz skizzierten Arten von Schemata zur Einbettung eines Wasserzeichens in Audiosignalen bereits recht ausgefeilt sind, besteht ein Nachteil darin, dass sich existierende Wasserzeichenverfahren fast ausschließlich auf die Aufgabe konzentriert haben, ein Wasserzeichen unhörbar mit einer hohen Einbringungsrate und einer hohen Robustheit, d.h. mit der Eigenschaft, dass das Wasserzeichen auch nach Signalveränderungen verwertbar ist, in das ursprüngliche Audiosignal einzubetten. Dabei wurde für die meisten Anwendungsgebiete das Hauptaugenmerk auf die Robustheit gelegt. Das am weitesten verbreitete Verfahren zur Beaufschlagung von Audiosignalen mit einem Wasserzeichen, nämlich die Spreizbandmodulation, wie sie bei- spielsweise in der im Vorhergehenden genannten WO 97/33391 beschrieben ist, gilt als sehr robust und sicher. Aufgrund der Popularität und der Tatsache, dass die Prinzipien der spreizbandmodulationsbasierten Wasserzeichenverfahren allgemein bekannt sind, besteht die Gefahr, dass Verfahren bekannt werden, mit denen umgekehrt eine Zerstörung des Wasserzeichens aus den mit diesem Verfahren wasserzeichenbehafteten Audiosignalen erzielt werden kann. Aus diesem Grund ist es sehr wichtig, neue hochwertige Verfahren zu entwickeln, die als Alternative zur Spreizbandmodulation dienen können.

Die Aufgabe der vorliegenden 'Erfindung besteht folglich darin, ein völlig neuartiges und damit auch sichereres Schema zur Einbringung eines Wasserzeichens in ein Informationssignal zu schaffen.

Diese Aufgabe wird durch Vorrichtungen gemäß Anspruch 1 o- der 22 und Verfahren gemäß Anspruch 23 oder 24 gelöst.

Nach einem erfindungsgemäßen Schema zum Einbringen eines Wasserzeichens in ein Informationssignal wird zunächst das Informationssignal von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung überführt. Das Informationssignal wird dann in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen manipuliert, um eine modifizierte Spektral/Modulationsspektraldarstellung zu erhalten, und anschließend wird ein wasserzeichenbehaftetes Informationssignal basierend auf der modifizierten Spektral/Modulationsspektraldarstellung gebildet .

Nach einem erfindungsgemäßen Schema zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, wird dementsprechend das wasserzeichenbehaftete Informationssignal von einer Zeitdarstellung in eine Spekt- ral/Modulationsspektraldarstellung überführt, woraufhin das Wasserzeichen basierend auf der Spektral/Modulationsspektraldarstellung hergeleitet wird. Ein Vorteil der vorliegenden Erfindung besteht darin, dass dadurch, dass gemäß der vorliegenden Erfindung das Wasserzeichen in der Spektral/Modulationsspektraldarstellung bzw. -Domäne eingebettet bzw. hergeleitet wird, traditionelle Korrelationsangriffe, wie sie bei den spreizbandmodulationsbasierten Wasserzeichenverfahren eingesetzt werden, nicht ohne weiteres zum Ziel führen. Hier macht sich insbesondere positiv bemerkbar, dass die Analyse eines Signals in der Spektral/Modulationsspektral-Domäne für potentielle Angreifer noch Neuland ist.

Weiterhin birgt die erfindungsgemäße Einbettung des Wasserzeichens in der Spektral/Modulationsspektral-Do äne bzw. in der 2-dimensionalen Modulationsspektral/Spektral-Ebene we- sentlich mehr Variationen der Einbettungsparameter, wie z.B. an welchen „Stellen" in dieser Ebene die Einbettung lokalisiert ist, als dies bisher der Fall war. Die Auswahl der entsprechenden Stellen kann dabei gegebenenfalls auch zeitvariant erfolgen.

Durch Einbettung des Wasserzeichens in der Spekt- ral/Modulationsspektral-Domäne ist es in dem Fall eines Audiosignals als dem Informationssignal unter Umständen ferner möglich, ohne die aufwendige Berechnung herkömmlicher psychoakustischer Parameter, wie z.B. der Mithörschwelle, eine unhörbare Einbettung eines Wasserzeichens vorzunehmen, um somit mit geringerem Aufwand trotzdem die Unhörbarkeit des Wasserzeichens sicherzustellen. Die Modifikation der Modulationswerte kann hierbei beispielsweise unter Ausnut- zung von Verdeckungseffekten im Modulationsspektralbereich durchgeführt werden.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung sind nachfolgend bezugnehmend auf die beiliegenden Zeich- nungen näher erläutert. Es zeigen: Fig. 1 ein Blockdiagramm einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;

Fig. 2 eine schematische Zeichnung zur Veranschaulichung der Vorrichtung nach Fig. 1 zugrunde liegenden Überführung eines Audiosignals in eine Frequenz/Modulationsfrequenz-Domäne;

Fig. 3 ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach Fig. 1 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal;

Fig. 4 ein Blockschaltbild einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung; und

Fig. 5 ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach Fig. 4 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal.

Bezugnehmend auf die Figuren 1-3 wird im Folgenden ein Schema zur Einbettung eines Wasserzeichens in ein Audiosignal beschrieben, bei dem zunächst ein eingehendes Audiosignal bzw. ein Audioeingangssignal, das in einem Zeitbereich bzw. einer Zeitdarstellung vorliegt, blockweise in eine Zeit/Frequenzdarstellung und von dort aus in eine Frequenz/Modulationsfrequenzdarstellung überführt wird. In dieser Darstellung wird dann das Wasserzeichen in das Audiosignal eingebracht, indem abhängig vom Wasserzeichen Modulationswerte der Frequenz/Modulationsfrequenzbereichs- darstellung modifiziert werden. Derart modifiziert wird das Audiosignal dann wieder zurück in den Zeit/Frequenzbereich und von dort aus wieder in den Zeitbereich rücküberführt. Die Wasserzeicheneinbettung nach dem Schema von Fig. 1-3 wird durch die Vorrichtung nach Fig. 1 durchgeführt, die im Folgenden auch als Wasserzeichen-Einbetter bezeichnet wird und mit dem Bezugszeichen 10 angezeigt ist. Der Einbetter 10 umfasst einen Eingang 12 zum Empfangen des Audioeingangssignals, in welches das einzubringende Wasserzeichen eingebracht werden soll. Das Wasserzeichen, wie z.B. eine Kundennummer, erhält der Einbetter 10 an einem Eingang 14. Neben den Eingängen 12 und 14 umfasst der Einbetter 10 ei- nen Ausgang 16 zum Ausgeben des mit dem Wasserzeichen versehenen bzw. des wasserzeichenbehafteten Ausgangssignals.

Intern umfasst der Einbetter 10 eine Fensterungseinrichtung 18 und eine erste Filterbank 20, die in Reihe hinter den Eingang 12 geschaltet sind und dafür zuständig sind, das Audiosignal am Eingang 12 durch blockweise Verarbeitung von dem Zeitbereich 22 in den Zeit/Frequenzbereich 24 zu überführen. An den Ausgang der Filterbank 20 schließt eine Be- trag/Phase-Detektionseinrichtung 26 an, um eine Aufteilung der Zeit/Frequenzbereichsdarstellung des Audiosignals in Betrag und Phase vorzunehmen. Eine zweite Filterbank 28 ist mit der Detektionseinrichtung 26 verbunden, um den Betragsanteil der Zeit/Frequenzbereichsdarstellung zu erhalten, und überführt den Betragsanteil in die Frequenz/Modu- lationsfrequenzbereichsdomäne 30, um auf diese Weise eine Frequenz/Modulationsfrequenzdarstellung des Audiosignals 12 zu erzeugen. Die Blöcke 18, 20, 26, 28 stellen somit einen Analyseteil des Einbetters 10 dar, der die Überführung des Audiosignals in die Frequenz/Modulationsfrequenzdarstellung erzielt.

Eine Wasserzeicheneinbettungseinrichtung 32 ist mit der zweiten Filterbank 28 verbunden, um von derselben die Frequenz/Modulationsfrequenzdarstellung des Audiosignals 12 zu erhalten. Ein weiterer Eingang der Wasserzeicheneinbettungseinrichtung 32 ist mit dem Eingang 14 des Einbetters 10 verbunden. Die Wasserzeicheneinbettungseinrichtung 32 erzeugt eine modifizierte Frequenz/Modulationsfrequenzdarstellung.

Ein Ausgang der Wasserzeicheneinbettungseinrichtung 32 ist mit einem Eingang einer zu der zweiten Filterbank 28 inver- sen Filterbank 34 verbunden, die für die Rücküberführung in den Zeit/Frequenzbereich 24 zuständig ist. Eine Phasenverarbeitungseinrichtung 36 ist mit der Detektionseinrichtung 26 verbunden, um den Phasenanteil der Zeit/Fre- quenzbereichsdarstelLung 24 des Audiosignals zu erhalten und in manipulierter Form, wie es im Folgenden noch beschrieben wird, an eine Rekombinationseinrichtung 38 weiterzuleiten, die darüber hinaus mit einem Ausgang der in- versen Filterbank 34 verbunden ist, um den modifizierten Betragsanteil der Zeit/Frequenzdarstellung des Audiosignals zu erhalten. Die Rekombinationseinrichtung 38 vereint den durch die Phasenverarbeitung 36 modifizierten Phasenanteil mit dem um das Wasserzeichen modifizierten Betragsanteil der Zeit/Frequenzbereichsdarstellung des Audiosignals und gibt das Ergebnis, nämlich die Zeit/Frequenzdarstellung des wasserzeichenbehafteten Audiosignals, an eine zu der ersten Filterbank 20 inverse Filterbank 40 aus. Zwischen den Ausgang der inversen Filterbank 40 und den Ausgang 16 ist eine Fensterungseinrichtung 42 geschaltet. Der Teil aus den Kom- ponenten 34, 38, 40, 42 kann als Syntheseteil des Einbetters 10 betrachtet werden, da er dafür verantwortlich ist, aus der modifizierten Frequenz/Modulationsfrequenzdarstellung das wasserzeichenbehaftete Audiosignal in der Zeitdarstellung zu erzeugen.

Nachdem im Vorhergehenden der Aufbau des Einbetters 10 beschrieben worden ist, wird im Folgenden dessen Funktionsweise beschrieben.

Die Einbettung beginnt mit der Überführung des Audiosignals am Eingang 12 von der Zeitdarstellung in die Zeit/Frequenzdarstellung durch die Einrichtungen 18.und 20, wobei davon ausgegangen wird, dass das Audioeingangssignal am Eingang 12 in einer mit einer vorbestimmten Abtastfrequenz abgetasteten Weise vorliegt, nämlich als eine Folge von Abtast- bzw. Audiowerten. Liegt das Audiosignal noch nicht in einer solchen abgetasteten Form vor, so kann hier- zu ein entsprechender A/D-Wandler als eine Abtasteinrichtung verwendet werden.

Die Fensterungseinrichtung 18 empfängt das Audiosignal und extrahiert aus demselben eine Folge von Blöcken von Audio- werten. Hierzu fasst die Fensterungseinrichtung 18 jeweils eine vorbestimmte Anzahl von aufeinander folgenden Audiowerten des Audiosignals am Eingang 12 zu Zeitblöcken zusammen und multipliziert bzw. fenstert diese Zeitblöcke, die ja einen Zeitausschnitt aus dem Audiosignal 12 darstellen, mit einer Fenster- bzw. Gewichtungsfunktion, wie z.B. einem Sinusfenster, einem KBD-Fenster oder dergleichen. Dieser Vorgang wird als Fensterung bezeichnet und dabei beispielsweise derart durchgeführt, dass die einzelnen Zeitblöcke Zeitabschnitte des Audiosignals betreffen, die sich gegen- seitig überlappen, wie z.B. um die Hälfte, sodass jeder Audiowert zwei Zeitblöcken zugeteilt ist.

Der Vorgang der Fensterung durch die Einrichtung 18 ist in Fig. 2 exemplarisch für den Fall des 50%-Überlapps näher veranschaulicht. Fig. 2 veranschaulicht mit einem Pfeil 50 die Folge von Audiowerten in ihrer zeitlichen Abfolge ihres Eintreffens am Eingang 12. Sie stellen das Audiosignal 12 im Zeitbereich 22 dar. Der Index n in Fig. 2 soll einen in Pfeilrichtung zunehmenden Index der Audiowerte bezeichnen. Mit 52 sind die Fensterfunktionen angedeutet, die die Fensterungseinrichtung 18 auf die Zeitblöcke anwendet. Die ersten beiden Fensterfunktionen für die ersten beiden Zeitblöcke sind in Fig. 2 mit dem Index 2m bzw. 2m+l überschrieben. Wie es zu erkennen ist, überlappen der Zeitblock 2m und der darauf folgende Zeitblock 2m+l um die Hälfte bzw. 50% und weisen somit jeweils die Hälfte ihrer Audiowerte gemeinsam auf. Die von der Einrichtung 18 erzeugten und an die Filterbank 20 weitergeleiteten Blöcke entsprechen einer Gewichtung der zu einem Zeitblock gehörenden Audiowerte mit der Fensterfunktion 52 bzw. einer Multiplikation zwischen denselben.

Die Filterbank 20 erhält die Zeitblöcke bzw. Blöcke von ge- fensterten Audiowerten, wie es in Fig. 2 mit Pfeilen 54 angedeutet ist, und überführt dieselben durch eine Zeit/Frequenz-Transformation 56 blockweise in eine Spektraldarstellung. Dabei nimmt die Filterbank je nach Ausfüh- rung eine vorbestimmte Zerlegung des Spektralbereiches in vorbestimmte Frequenzbänder bzw. Spektralkomponenten vor. Die spektrale Darstellung umfasst beispielsweise frequenzmäßig nebeneinander liegende Spektralwerte von der Frequenz Null bis zur maximalen Audiofrequenz, die dem Audiosignal zugrunde liegt und beispielsweise 44,1 kHz beträgt. In Fig. 2 ist exemplarisch der Fall einer Spektralzerlegung in zehn Teilbänder dargestellt.

Die blockweise Überführung ist in Fig. 2 durch eine Mehr- zahl von Pfeilen 58 angedeutet. Jeder Pfeil entspricht der Überführung eines Zeitblockes in den Frequenzbereich. Beispielsweise wird der Zeitblock 2m in einen Block 60 von Spektralwerten 62 überführt, wie er in Fig. 2 durch eine Spalte von Kästchen angedeutet ist. Die Spektralwerte betreffen jeweils eine unterschiedliche Frequenzkomponente oder ein unterschiedliches Frequenzband, wobei in Fig. 2 durch die Achse 64 die Richtung angedeutet sein soll, entlang der die Frequenz k verläuft. Wie bereits erwähnt wird vorliegend davon ausgegangen, dass lediglich zehn Spektral- komponenten vorliegen, wobei jedoch die Anzahl lediglich veranschaulichender Natur ist und in Wirklichkeit vermutlich höher liegen wird.

Da die Filterbank 20 pro Zeitblock einen Block 60 von Spektralwerten 62 erzeugt, ergeben sich mit der Zeit mehrere Folgen von Spektralwerten 62, nämlich eine pro Spektralkomponente k .bzw. Teilband k. In Fig. 2 verlaufen diese zeitlichen Folgen in Zeilenrichtung, wie sie durch den Pfeil 66 dargestellt ist. Der Pfeil 66 stellt somit die Zeitachse der Zeit/Frequenzdarstellung dar, während der Pfeil 64 die Frequenzachse dieser Darstellung repräsentiert. Die „Abtastfrequenz" bzw. der Wiederholabstand der Spektralwerte innerhalb der einzelnen Teilbänder entspricht der Frequenz bzw. dem Wiederholabstand der Zeitblöcke aus dem Audiosignal. Die Zeitblockwiederholfrequenz entspricht wiederum zwei mal der Abtastfrequenz des Audiosignals dividiert durch die Anzahl an Audiowerten pro Zeitblock. Der Pfeil 66 entspricht somit einer Zeitdimension insofern als er die zeitliche Abfolge der Zeitblöcke verkörpert.

Wie es zu erkennen ist, entsteht somit über eine gewisse Anzahl, hier exemplarisch einer Anzahl von 8, von aufeinan- der folgenden Zeitblöcken hinweg eine Matrix 68 von Spektralwerten 62, die eine Zeit/Frequenzbereichsdarstellung 24 des Audiosignals über die Zeitdauer dieser Zeitblöcke hinweg darstellt.

Die blockweise an den Zeitblöcken durch die Filterbank 20 durchgeführte Zeit/Frequenz-Transformation 56 ist beispielsweise eine DFT, DCT, MDCT oder dergleichen. Je nach Transformation sind die einzelnen Spektralwerte innerhalb eines Blockes 60 in bestimmte Teilbänder eingeteilt. Für jedes Teilband kann jeder Block 60 mehr als einen Spektralwert 62 aufweisen. Insgesamt entsteht somit über die Folge von Zeitblöcken hinweg pro Teilband bzw. Spektralkomponente eine Folge von Spektralwerten, die den zeitlichen Verlauf des jeweiligen Teilbandes wiedergeben und in Fig. 2 in Zei- lenrichtung 84 verlaufen.

Die Filterbank 20 gibt blockweise die Blöcke 60 von Spektralwerten 62 an die Betrags/Phasen-Detektionseinrichtung 26 weiter. Letztere verarbeitet die komplexen Spektralwerte und gibt lediglich die Beträge derselben an die Filterbank 28 weiter. Die Phasen der Spektralwerte 62 gibt sie hingegen an die Phasenverarbeitungseinrichtung 36 weiter. Die Filterbank 28 verarbeitet die pro Teilband vorliegenden Folgen 70 von Beträgen von Spektralwerten 62 ähnlich der Filterbank 20, nämlich durch blockweises Transformieren dieser Folgen Block für Block in die Spektraldarstellung bzw. die Modulationsfrequenzdarstellung, und zwar unter Verwendung von vorzugsweise wiederum gefensterten und sich gegenseitig überlappenden Blöcken, wobei die zugrundeliegenden Blöcke aller Teilbänder vorzugsweise zeitlich zueinander gleich ausgerichtet sind. Anders ausgedrückt verar- beitet die Filterbank 28 jeweils N Spektralblöcke 60 von Spektralwertbeträgen gleichzeitig bzw. gemeinsam. Die N Spektralblöcke 60 von Spektralwertbeträgen bilden eine Matrix 68 von Spektralwertbeträgen. Existieren beispielsweise M Teilbänder, verarbeitet die Filterbank 28 die Spektral- wertbeträge in Matrizen zu je N*M Spektralwertbeträgen. In Fig. 3 ist exemplarisch der Fall angenommen, dass M=N gilt, während in Fig. 2 exemplarisch angenommen wurde, dass N=10 und M=8 gilt. Die Weiterleitung des Betragsanteils einer solchen Matrix 68 von Spektralwertbeträgen 62 an die Fil- terbank 28 ist in Fig. 2 durch die Pfeile 72 angedeutet.

Nach Erhalt des Betragsanteils N aufeinanderfolgender Spektralblöcke bzw. der Matrix 68 transformiert also die Filterbank 28 - getrennt für jedes Teilband - die Blöcke von Spektralwertbeträgen der jeweiligen Teilbänder, also der Zeilen in der Matrix 68, von der Zeitdomäne 66 in eine Frequenzdarstellung, wobei wie bereits erwähnt die Spektralwertbeträge zur Vermeidung von Aliasingeffekten ge- fenstert sein können. Anders ausgedrückt überführt die Fil- terbank 28 jeden dieser Spektralwertbetragsblöcke aus den den zeitlichen Verlauf eines jeweiligen Teilbandes darstellenden Folgen 70 in eine Spektraldarstellung und erzeugt somit pro Teilband einen Block von Modulationswerten, die in Fig. 2 mit 74 angezeigt sind. Jeder Block 74 enthält mehrere Modulationswerte, die in Fig. 2 nicht mehr veranschaulicht sind. Jeder dieser Modulationswerte innerhalb eines Blockes 74 ist einer unterschiedlichen Modulationsfrequenz zugeordnet, die in Fig. 2 entlang der Achse 76 verlaufen soll, die somit die Modulationsfrequenzachse der Frequenz/Modulationsfrequenzdarstellung repräsentiert . Durch Anordnung der Blöcke 74 je nach Teilbandfrequenz entlang einer Achse 78 entsteht hierdurch eine Matrix 80 von Modulationswerten, die eine Frequenz/Modulationsfrequenzbereichsdarstellung des Audiosignals am Eingang 12 in dem der Matrix 68 zugeordneten Zeitabschnitt darstellt.

Wie bereits erwähnt kann zur Vermeidung von Artefakten die Filterbank 28 oder die Einrichtung 26 eine interne Fenstereinrichtung (nicht gezeigt) aufweisen, die die Transformationsblöcke, also die Zeilen der Matrix 68, von Spektralwerten pro Teilband vor ihrer jeweiligen Zeit/Modulations- frequenz-Transformation 80 durch die Filterbank 28 in den Modulationsfrequenzbereich 30, um die Blöcke 74 zu erhalten, einer Fensterung mit einer Fensterfunktion 82 unterzieht .

Es wird noch einmal explizit darauf hingewiesen, dass auf die im Vorhergehenden beschriebene Weise eine Folge von Matrizen 80 verarbeitet werden, die sich in dem im Vorhergehenden erwähnten exemplarisch 50%-Überlapp-Fensterung - um 50% in der Zeit überlappen. Anders ausgedrückt bildet die Filterbank 28 die Matrix 80 für aufeinander folgende N Zeitblöcke derart, dass die Matrizen 80 jeweils N Zeitblöcke betreffen, die sich um die Hälfte überschneiden, wie es in Fig. 2 exemplarisch durch eine gestrichelte Fensterfunktion 84 angedeutet werden soll, die die Fensterung für die nächste Matrix darstellen.

Die Modulationswerte der Frequenz/Modulationsfrequenzbereichsdarstellung 30, wie sie von der Filterbank 28 ausgegeben werden, erreichen die Wasserzeicheneinbettungsein- richtung 32. Die Wasserzeicheneinbettungseinrichtung 32 modifiziert nun die Modulationsmatrix 80 bzw. einzelne oder mehrere der Modulationswerte der Modulationsmatrizen 80 des Audiosignals 12. Die von der Einrichtung 32 vorgenommene Modifikation kann beispielsweise durch eine multiplikative Gewichtung einzelner Modulationsfrequenz/Frequenz-Segmente des Modulationsteilbandspektrums bzw. der Frequenz/Modulationsfrequenzbereichsdarstellung erfolgen, d.h. durch eine Gewichtung der Modulationswerte innerhalb eines bestimmten Bereichs des durch die Achsen 76 und 78 aufgespannten Frequenz/Modulationsfrequenz-Raumes. Ebenso könnte die Modifikation das Setzen einzelner Segmente bzw. Modulationswerte auf bestimmte Werte aufweisen.

Die multiplikative Gewichtung bzw. die bestimmten Werte würden in vorgegebener Weise von dem Wasserzeichen abhängen, das am Eingang 14 erhalten wird. Dabei könnte das Setzen einzelner Modulationswerte bzw. Segmente von Modulati- onswerten auf bestimmte Werte signaladaptiv erfolgen, d.h. zusätzlich abhängig von dem Audiosignal 12 an sich.

Die einzelnen Segmente des 2-dimensionalen Modulationsteilbandspektrums können einerseits durch Unterteilung der a- kustischen Frequenzachse 78 in Frequenzgruppen gewonnen werden, andererseits kann eine weitere Segmentierung durch Unterteilung der Modulationsfrequenzachse 76 in Modulationsfrequenzgruppen durchgeführt werden. In Fig. 1 ist exemplarisch eine Segmentierung der Frequenzachse in 5 und der Modulationsfrequenzachse in 4 Gruppen angedeutet, wodurch sich 20 Segmente ergeben. Die dunklen Segmente zeigen exemplarisch die Stellen an, an denen die Einrichtung 32 die Modulationsmatrix 80 modifiziert, wobei, wie im Vorhergehenden erwähnt, die zur Modifikation herangezogen Stellen zeitlich variieren können. Die Stellen werden vorzusgweise derart ausgewählt, dass durch Verdeckungseffekte die Änderungen an dem Audiosignal in der Frequenz/Modulationsfrequenzdarstellung nicht oder kaum hörbar sind.

Nachdem die Einrichtung 32 die Modulationsmatrix 80 modifiziert hat, sendet dieselbe die modifizierten Modulationswerte der Modulationsmatrix 80 an die inverse Filterbank 34 weiter. Diese überführt mittels einer Transformation, die zu derjenigen der Filterbank 28 invers ist, also z.B. einer IDFT, IFFT, IDCT, IMDCT oder dergleichen, die Modulationsmatrix 80 Block-74-weise, d.h. getrennt nach Teilband, entlang der Modulationsfrequenzachse 76 in die Zeit/Frequenzbereichsdarstellung 24 zurück, um dadurch modifizierte Betragsanteil-Spektralwerte zu erhalten. Anders ausgedrückt transformiert die inverse Filterbank 34 jeden einem bestimmten Teilband zugehörigen Block von modifizierten Modulationswerten 74 mit einer zu der Transformation 86 inversen Transformation in eine Folge von Betragsanteil- Spektralwerten pro Teilband, wodurch sich nach dem vorhergehenden Ausführungsbeispiel eine Matrix von N x M Betragsanteil-Spektralwerten ergibt.

Die Betragsanteil-Spektralwerte von der inversen Filterbank 34 beziehen sich also immer auf zweidimensionale Blöcke bzw. Matrizen aus dem Strom von Folgen von Spektralwerten, in natürlich um das Wasserzeichen modifizierter Form. Nach dem exemplarischen Ausführungsbeispiel überlappen sich die- se Blöcke um 50%. Eine beispielsweise in der Einrichtung 34 vorgesehene Einrichtung (nicht gezeigt) kompensiert nun in diesem exemplarischen 50%-Überlappungsfall die Fensterung, indem sie die sich überlappenden rekombinierten Spektralwerte aufeinanderfolgender, durch Rücktransformation auf- einanderfolgender Modulationsmatrizen erhaltener Matrizen von Spektralwerten addiert. Hierdurch entstehen aus den einzelnen Matrizen von modifizierten Spektralwerten wieder Ströme bzw. Folgen von modifizierten Spektralwerten, nämlich eine pro Teilband. Diese Folgen korrespondieren ledig- lieh mit dem Betragsanteil der unmodifizierten Folgen 70 von Spektralwerten, wie sie von der Einrichtung 20 ausgegeben wurden.

Die Rekombinationseinrichtung 38 verknüpft die zu Teilband- strömen zusammengeführten Betragsanteil-Spektralwerte von der inversen Filterbank 34 mit den Phasenanteilen der Spektralwerte 62, wie sie von der Detektionseinrichtung 26 unmittelbar nach der Transformation 56 durch die erste Fil- terbank 20 abgesondert worden sind, jedoch in einer durch die Phasenverarbeitung 36 modifizierten Form. Und zwar modifiziert die Phasenverarbeitungseinrichtung 36 die Phasenanteile in einer von der Wasserzeicheneinbettung durch die Einrichtung 32 getrennten aber unter Umständen von dieser Einbettung abhängigen Weise derart, dass die Detektierbar- keit des Wasserzeichens im später bezugnehmend auf Fig. 3 erläuterten Detektor bzw. Decodersystem besser detektierbar ist oder/und die akustische Verdeckung des Wasserzeichen- signals im später am Ausgang 16 auszugebenden wasserzeichenbehafteten Ausgangssignal und damit die Unhörbarkeit des Wasserzeichens verbessert ist. Die Rekombination kann die Rekombinationseinrichtung 38 matrixweise pro Matrix 68 oder kontinuierlich über die Folgen von modifizierten Be- tragsanteil-Spektralwerten pro Teilband vornehmen. Die optionale Abhängigkeit der Manipulation des Phasenanteils der Zeit/Frequenzdarstellung des Audiosignals am Eingang 12 von der Manipulation der Frequenz/Modulationsfrequenzdarstellung durch die Manipulationseinrichtung 32 ist in Fig. 1 durch einen gestrichelten Pfeil 88 veranschaulicht. Die Rekombination wird beispielsweise durch Addieren der Phase eines Spektralwertes auf den Phasenanteil des entsprechenden modifizierten Spektralwerts durchgeführt, wie er von der Filterbank 34 ausgegeben wird.

Auf diese Weise erzeugt die Einrichtung 38 also Folgen von Spektralwerten pro Teilband wie diejenige, die nach der Filterbank 20 direkt aus dem unveränderten Audiosignal erhalten worden ist, nämlich die Folgen 70, jedoch in um das Wasserzeichen veränderter Form, so dass die von der Einrichtung 38 ausgegebenen rekombinierten und bezüglich des Betragsanteils modifizierten Spektralwerte eine Zeit/Frequenzdarstellung des wasserzeichenbehafteten Audiosignals repräsentieren.

Die inverse Filterbank 40 erhält somit wieder Folgen von modifizierten Spektralwerten, nämlich eine pro Teilband. Anders ausgedrückt, erhält die inverse Filterbank 40 pro Zyklus eine Block von modifizierten Spektralwerten, also eine Frequenzdarstellung des wasserzeichenbehafteten Audiosignals bezüglich eines Zeitabschnittes desselben. Dementsprechend führt die Filterbank 40 eine zu der Transformati- on 56 der Filterbank 20 inverse Transformation an jedem solchen Block von Spektralwerten, d.h. entlang der Frequenzachse 70 angeordneten Spektralwerten, durch, um als Ergebnis modifizierte gefensterte Zeitblöcke bzw. Zeitblöcke von gefensterten modifizierten Audiowerten zu erhalten. Die anschließende Fensterungseinrichtung 42 kompensiert die Fensterung, wie sie durch die Fensterungseinrichtung 18 eingeführt worden ist, indem sie innerhalb der überlappenden Bereiche einander entsprechende Audiowerte addiert, wodurch sich am Ausgang 16 das wasserzeichenbehaftete Aus- gangssignal in der Zeitbereichsdarstellung 22 ergibt.

Nachdem im Vorhergehenden die Einbettung eines Wasserzeichens gemäß dem Ausführungsbeispiel von Fig. 1-2 beschrieben worden ist, wird im Folgenden bezugnehmend auf Fig. 3 eine Vorrichtung beschrieben, die dazu geeignet ist, ein durch den Einbetter 10 erzeugtes wasserzeichenbehaftetes Ausgangssignal erfolgreich zu analysieren, um wieder das Wasserzeichen aus demselben zu rekonstruieren bzw. detek- tieren, das ja in dem wasserzeichenbehafteten Ausgangssig- nal zusammen mit den Nutzaudioinformationen für das menschliche Gehör vorzugsweise unhörbar enthalten ist.

Der Wasserzeichendecoder von Fig. 3, der allgemein mit 100 angezeigt ist, umfasst einen Audiosignaleingang 112 zum Empfangen des wasserzeichenbehafteten Audiosignals und einen Ausgang 114 zum Ausgeben des aus dem wasserzeichenbehafteten Audiosignal extrahierten Wasserzeichens. An den Eingang 112 schließen sich in Reihe geschaltet und in der Reihenfolge, wie sie im Folgenden aufgelistet sind, eine Fenstereinrichtung 118, eine Filterbank 120, eine Be- trags/Phasen-Detektionseinrichtung 126 und eine zweite Filterbank 128 an, die in ihrer Funktion und Arbeitsweise den Blöcken 18, 20, 26 und 28 aus dem Einbetter 10 entsprechen. Dies bedeutet, dass das wasserzeichenbehaftete Audiosignal am Eingang 112 durch die Fenstereinrichtung 118 und die Filterbank 120 von dem Zeitbereich 122 in den Zeitfrequenzbereich 124 überführt wird, von wo aus durch die Detekti- onseinrichtung 126 und die zweite Filterbank 128 eine Überführung des Audiosignals am Eingang 112 in den Frequenz/Modulationsfrequenzbereich 130 stattfindet. Das wasserzeichenbehaftete Audiosignal wird durch die Einrichtungen 118, 120, 126 und 128 folglich denselben Verarbeitungen unterzogen, wie sie bezüglich des ursprünglichen Audiosignals bezugnehmend auf Fig. 2 beschrieben worden sind. Die sich ergebenden Modulationsmatrizen entsprechen jedoch nicht vollständig denjenigen, wie sie in dem Einbetter 10 von der Wassereinbettungseinrichtung 32 ausgegeben wurden, da durch die Phasenrekombinationen der Rekombinationseinrichtung 38 einige der Modulationsanteile bezüglich der modifizierten Modulationsmatrizen, wie sie von der Einrichtung 32 ausgegeben werden, verändert werden und sich somit in etwas veränderter Form im wasserzeichenbehafteten Aus- gangssignal widerspiegeln. Auch die Fensterungsrückgängigmachung bzw. OLA verändert die Modulationsanteile bis zur erneuten Modulationsspektralanalyse im Dekodierer 100.

Eine Wasserzeichen-Decodierungseinrichtung 132, die mit der Filterbank 128 verbunden ist, um die Frequenz/Modulationsbereichsdarstellung des wasserzeichenbe- ^' hafteten Eingangssignals bzw. die Modulationsmatrizen zu erhalten, ist vorgesehen, um das ursprünglich durch den Einbetter 10 eingebrachte Wasserzeichen aus dieser Darstel- lung zu extrahieren und am Ausgang 114 auszugeben. Die Extraktion wird an vorbestimmten Stellen der Modulationsmatrizen vorgenommen, die mit denjenigen korrespondieren, die von dem Einbetter 10 zur Einbettung verwendet worden sind. Die Übereinstimmung der Auswahl der Stellen wird beispiels- weise durch entsprechende Standardisierung sichergestellt.

Gegenüber den Modulationsmatrizen, wie sie im Einbetter 10 in der Einrichtung 32 erzeugt wurden, bewirkte Veränderun- gen der Modulationsmatrizen, wie sie der Wasserzeichen- Decodierungseinrichtung 132 zugehen, können auch daher rühren, dass das wasserzeichenbehaftete Eingangssignal zwischen seiner Erzeugung bzw. Ausgabe am Ausgang 16 und der Detektion durch den Detektierer 100 bzw. dem Empfang am Eingang 112 auf irgendeine Weise verschlechtert worden ist, wie z.B. durch eine gröbere Quantisierung der Audiowerte oder dergleichen.

Bevor im Folgenden bezugnehmend auf die Figuren 4 und 5 ein weiteres Ausführungsbeispiel für ein Schema einer Einbettung eines Wasserzeichens in ein Audiosignal beschrieben wird, das sich im Hinblick auf das bezugnehmend auf Fig. 1- 3 beschriebene Schema lediglich im Hinblick auf die Art und Weise der Überführung des Audiosignals vom Zeitbereich in den Frequenz/Modulationsfrequenzbereich unterscheidet, werden im Folgenden exemplarische Anwendungsbereiche bzw. Möglichkeiten beschrieben, auf welche das im Vorhergehenden beschriebene Einbettungsschema sinnvoll eingesetzt werden kann. Die folgenden Beispiele beziehen sich dabei exemplarisch auf Einsatzgebiete in der Rundfunküberwachung (broad- cast monitoring) und bei DRM-Systemen, wie herkömmliche WM- Systemen (WM = watermark = Wasserzeichen) . Die im Folgenden beschriebenen Anwendungsmöglichkeiten treffen aber natür- lieh auch auf das im Folgenden noch zu beschreibende Ausführungsbeispiel von Fig. 4 und 5 zu.

Einerseits kann das im Vorhergehenden beschriebene Ausführungsbeispiel zur Einbettung eines Wasserzeichens in ein Audiosignal zum Nachweis der Urheberschaft eines Audiosignals verwendet werden. Bei dem ursprünglichen Audiosignal, das am Eingang 12 eintrifft, handelt es sich beispielsweise um ein Musikstück. Während der Produktion von Musikstücken können durch den Einbetter 10 Urheberinformationen in Form eines Wasserzeichens in das Audiosignal eingebracht werden, wodurch das wasserzeichenbehaftete Audiosignal am Ausgang 16 entsteht. Wenn nun ein Dritter behauptet, Urheber des entsprechenden Musikstückes bzw. Musiktitels zu sein, kann der Nachweis der tatsächlichen Urheberschaft mit Hilfe des Wasserzeichens geführt werden, das aus dem wasserzeichenbehafteten Audiosignal mittels des Detektors 100 wieder extrahiert werden kann und ansonsten bei normalem Abspielen unhörbar ist.

Ein weiterer möglicher Einsatz oben dargestellter Wasserzeicheneinbettung besteht darin, Wasserzeichen für die Protokollierung des Sendeprogramms von TV- und Radiosendern zu verwenden. Rundfunkprogramme untergliedern sich zumeist in unterschiedliche Abschnitte, wie z.B. einzelne Musiktitel, Hörspiele, Werbespots oder dergleichen. Der Urheber eines Audiosignals oder zumindest derjenige, der an einem bestimmten Musiktitel oder Werbespot verdienen darf und möch- te, kann nun sein Audiosignal mit dem Einbetter 10 mit einem Wasserzeichen versehen, und das wasserzeichenbehaftete Audiosignal dem Rundfunkbetreiber zukommen lassen. Musiktitel oder auch Werbespots können auf diese Weise mit einem jeweils eindeutigen Wasserzeichen beaufschlagt werden. Zur Protokollierung des Sendeprogramms kann nun z.B. ein Computer herangezogen werden, der das Rundfunksignal auf ein Wasserzeichen hin untersucht und gefundene Wasserzeichen protokolliert. Anhand der Liste des entdeckten Wasserzeichens lässt sich ohne weiteres eine Sendeliste für den ent- sprechenden Rundfunksender generieren, was die Abrechnung bzw. Gebührenbezahlung erleichtert.

Ein weiteres Einsatzgebiet besteht darin, Wasserzeichen zur Ermittelung illegaler Kopien zu verwenden. In dieser Hin- sieht lohnt sich der Einsatz von Wasserzeichen insbesondere für den Musikvertrieb über das Internet. Erwirbt ein Käufer einen Musiktitel, wird während der Übermittlung der Musikdaten an den Käufer eine eindeutige Kundennummer mit Hilfe eines Wasserzeichens in die Daten eingebettet. Das Ergebnis sind Musiktitel, in denen das Wasserzeichen unhörbar eingebettet ist. Wird zu einem späteren Zeitpunkt ein Musiktitel an einer nicht genehmigten Stelle im Internet, wie z.B. einer Tauschbörse, gefunden, kann dieses Stück auf das Was- serzeichen hin mittels eines Decodierers nach Fig. 3 untersucht und anhand des Wasserzeichens der ursprüngliche Käufer identifiziert werden. Der letztgenannte Einsatz könnte auch für die aktuellen DRM-(DRM = Digital Rights Management = Digitale-Rechte-Verwaltung) Lösungen eine wichtige Rolle spielen. Das Wasserzeichen in den wasserzeichenbehafteten Audiosignalen könnte hier als eine Art „zweite Verteidigungslinie" dienen, die auch dann noch Rückschlüsse auf den ursprünglichen Käufer zulässt, wenn der kryptographische Schutz eines wasserzeichenbehafteten Audiosignals bereits umgangen worden ist.

Weitere Anwendungen für Wasserzeichen sind beispielsweise in der Druckschrift Chr. Neubauer, J. Herre, „Advanced Wa- termarking and its Applications", 109^th Audio Engineering Society Convention, Los Angeles, Sept. 2000, Preprint 5176, beschrieben.

Im folgenden werden ein Einbetter und ein Wasserzeichen- Decoder bezüglich eines Ausführungsbeispiels für ein Einbettungsschema beschrieben, bei dem eine verglichen zu dem Ausführungsbeispiel in Fig. 1-3 unterschiedliche Überführung des Audiosignals vom Zeitbereich in den Frequenz/Modulationsfrequenzbereich verwendet wird. In der nachfolgenden Beschreibung werden Elemente in den Figuren, die zu denjenigen von Fig. 1 und 3 identisch oder gleichbedeutend sind, mit gleichen Bezugszeichen versehen, wie sie in Fig. 1 und 3 versehen worden sind, wobei für eine detailliertere Erörterung der Funktionsweise oder Bedeutung dieser Elemente zur Vermeidung von Wiederholungen ergänzend auf die Beschreibung der Figuren 1-3 verwiesen wird.

Der Einbetter von Fig. 4, der allgemein mit 210 angezeigt ist, umfasst ebenso wie der Einbetter von Fig. 1 einen Au- diosignaleingang 12, einen Wasserzeicheneingang 14 und einen Ausgang 16 zur Ausgabe des wasserzeichenbehafteten Audiosignals. An den Eingang 12 schließen sich die Fensterungseinrichtung 18 und die erste Filterbank 20 an, um das Audiosignal blockweise in Blöcke 60 von Spektralwerten 62 (Fig. 2) zu überführen, wobei die Folge von Blöcken von Spektralwerten, die hierdurch am Ausgang der Filterbank 20 entsteht, die Zeit/Frequenzbereichsdarstellung 24 des Au- diosignals darstellt. Im Unterschied zu dem Einbetter 10 von Fig. 1 werden jedoch die komplexen Spektralwerte 62 nicht in Betrag und Phase unterteilt, sondern die komplexen Spektralwerte werden vollständig weiterverarbeitet, um das Audiosignal in den Frequenz/Modulationsfrequenzbereich zu überführen. Die Folgen 70 von aufeinander folgenden Spektralwerten eines Teilbandes werden deshalb unter Berücksichtigung von Betrag und Phase blockweise in eine spektrale Darstellung überführt. Zuvor wird jedoch jede Teilband- spektralwertfolge 70 noch einer Demodulation unterzogen. Jede Folge 70, also die Abfolge von Spektralwerten, die sich bei aufeinander folgenden Zeitblöcken durch Überführung in den Spektralbereich für ein bestimmtes Teilband ergeben, wird nämlich durch einen Mischer 212 mit dem komplex Konjugierten einer Modulationsträgerkomponente multipli- ziert bzw. gemischt, welche durch eine Trägerfrequenzbestimmungseinrichtung 214 aus den Spektralwerten und insbesondere dem Phasenanteil dieser Spektralwerte der Zeit/Frequenzbereichsdarstellung des Audiosignals ermittelt wird. Die Einrichtungen 212 und 214 dienen dazu, eine Kom- pensation dazu zu liefern, dass der Wiederholabstand der Zeitblöcke nicht unbedingt zu der Periodendauer der Trägerfrequenzkomponente des Audiosignals abgestimmt ist, d.h. derjenigen hörbaren Frequenz, die im Mittel die Trägerfrequenz des Audiosignals darstellt. In dem Fall der Fehlab- Stimmung sind aufeinander folgende Zeitblöcke um einen unterschiedlichen Phasenversatz zu der Trägerfrequenz des Audiosignals verschoben. Dies führt dazu, dass jeder Block 60 von Spektralwerten, wie er von der Filterbank 20 ausgegeben wird, je nach Phasenversatz des jeweiligen Zeitblockes zu der Trägerfrequenz im Phasenanteil einen linearen Phasenanstieg aufweist, der auf den zeitblockindividuellen Phasenversatz zurückzuführen ist, d.h. deren Steigung und Achsenabschnitt von dem Phasenversatz abhängt. Da der Phasenver- satz zwischen aufeinander folgenden Zeitblöcken zunächst immer zunimmt, wird auch die Steigung des auf den Phasenversatz zurückzuführenden Phasenanstieg für jeden Block 60 von Spektralwerten 62 größer, so lange, bis der Phasenver- satz wieder Null wird usw.

Die vorhergehende Betrachtung bezog sich lediglich auf einzelne Blöcke 60 von Spektralwerten. Aus der vorhergehenden Erörterung wird jedoch auch deutlich, dass ein linearer Phasenanstieg auch bei Spektralwerten feststellbar ist, die sich bei aufeinander folgenden Zeitblöcken für ein und dasselbe Teilband ergeben, also ein Phasenanstieg entlang der Zeilen in Fig. 2 in der Matrix 68. Auch dieser Phasenanstieg ist auf den Phasenversatz der aufeinander folgenden Zeitblöcke rückzuführen und von demselben abhängig. Insgesamt erfahren die Spektralwerte 62 in der Matrix 68 aufgrund des Zeitversatzes der aufeinander folgenden Zeitblöcke eine kumulative Phasenänderung, die sich als Ebene indem durch die Achsen 66 und 64 aufgespannten Raum dar- stellt.

Die Trägerfrequenzbestimmungseinrichtung 214 fittet bzw. passt deshalb durch geeignete Verfahren, beispielsweise mit einem kleinste-Fehlerquadrate-Algorithmus, eine Ebene in die geunwrappten bzw. einem Phasenunwrapping bzw. einer Phasenentwicklung bzw. Phasenabschnittsaneinanderreichung unterzogenen Phasen der Spektralwerte 62 der Matrix 68 ein, und schließt aufgrund dessen auf den auf den Phasenversatz der Zeitblöcke rückzuführenden Phasenanstieg zurück, der bei den Folgen 70 von Spektralwerten für die einzelnen Teilbänder innerhalb der Matrix 68 auftritt. Insgesamt ergeben sich somit pro Teilband ein hergeleiteter Phasenanstieg, der der gesuchten Modulationsträgerkomponente entspricht. Diese gibt die Einrichtung 214 an den Mischer 212 weiter, damit die jeweilige Folge 70 von Spektralwerten durch den Mischer 212 mit der komplex Konjugierten derselben gemischt wird, bzw. mit e-^{D ( *m+φ)} multipliziert wird, wobei m den bestimmten Träger angibt, m der Index für die Spektralwerte ist und φ einen Phasenversatz des bestimmten Trägers zum betrachteten Zeitausschnitt der N Zeitblöcke ist. Natürlich kann die Trägerfrequenzbestimmungseinrichtung 214 auch eindimensionale Einpassungen einer Geraden in die Phasenverläufe der einzelnen Folgen 70 von Spektralwerten 62 innerhalb der Matrizen 68 durchführen, um die einzelnen auf den Phasenversatz der Zeitblöcke rückzuführenden Phasenanstieg zu erhalten. Nach der Demodulation durch den Mischer 212 ist deshalb der Phasenanteil der Spektralwerte der Matrix 68 „eingeebnet", und variiert lediglich noch im Mittel um die Phase Null aufgrund der Gestalt des Audiosignals selbst herum.

Die so modifizierten Spektralwerte 62 gibt der Mischer 212 an die Filterbank 28 weiter, die dieselben matrixweise (Matrix 68 in Fig. 2) in den Frequenz/Modulationsfrequenzbereich überführt. Ähnlich wie bei dem Ausführungsbeispiel von Fig. 1-3 wird folglich eine Matrix von Modulationswerten erhalten, in der diesmal jedoch sowohl Phase als auch Betrag der Zeit/Frequenbereichsdarstellung 24 berücksichtigt worden sind. Wie bei dem Beispiel von Fig. 1 kann eine Fensterung mit 50%-Überlappung oder dergleichen vorgesehen sein.

Die so erzeugten aufeinander folgenden Modulationsmatrizen werden einer Wasserzeichen-Einbettungseinrichtung 216 weitergeleitet, die an einem weiteren Eingang das Wasserzeichen 14 erhält. Die Wasserzeicheneinbettungseinrichtung 216 funktioniert beispielsweise auf ähnliche Weise wie die Ein- bettungseinrichtung 32 des Einbetters 10 von Fig. 1. Die Einbettungsstellen innerhalb der Frequenz/Modulationsfrequenzbereichsdarstellung 30 werden jedoch gegebenenfalls unter Verwendung von andere Verdeckungseffekte berücksichtigenden Regeln ausgewählt, als dies bei der Einbettungs- einrichtung 32 der Fall ist. Die Stellen der Einbettung sollten wie auch bei der Einrichtung 32 derart ausgewählt sein, dass die dort modifizierten Modulationswerte sich nicht hörbar auf das wasserzeichenbehaftete Audiosignal auswirken, wie es später am Ausgang des Einbettefs 210 ausgegeben wird.

Die veränderten Modulationswerte bzw. die veränderten bzw. modifizierten Modulationsmatrizen werden an die inverse Filterbank 34 weitergeleitet, wodurch sich aus den modifizierten Modulationsmatrizen Matrizen von modifizierten Spektralwerten ergeben. Bei diesen modifizierten Spektralwerten ist noch die Phasenkorrektur rückgängig zu machen, die durch die Demodulation mittels des Mischers 212 herbeigeführt worden ist. Deshalb werden die von der inversen Filterbank 34 pro Teilband ausgegebenen Blöcke von modifizierten Spektralwerten mittels eines Mischers 218 mit einer Demodulationsträgerkomponente gemischt bzw. multipliziert, die zu derjenigen komplex konjugiert ist, die vor der Überführung in den Frequenz/Modulationsfrequenzbereich zur Demodulation durch den Mischer 212 für dieses Teilband verwendet worden ist, indem also eine Multiplikation dieser Blöcke mit e^{j (w*m+φ)} durchgeführt wird, wobei wiederum w den bestimmten Träger für das jeweilige Teilband angibt, m der Index für die modifizierten Spektralwerte ist und φ einen Phasenversatz des bestimmten Trägers zum betrachteten Zeitausschnitt der N Zeitblöcke für das jeweilige Teilband ist. Hierdurch wird der jeweilige Modulator für das jeweilige Teilband, der sich ja auf den Inhalt eines bestimmten Sub- bandblockes bezieht bzw. nach der Blockeinteilung durch die Modulation 212, 214 angewendet worden ist, vor der anschließenden Blockzusammenführung wieder invertiert.

Die so erhaltenen Spektralwerte liegen noch in Form von Blöcken, nämlich zu je einem Block von modifizierten Spektralwertblöcken pro Teilband vor und werden gegebenenfalls noch einer OLA bzw. Zusammenfügung zur Rückgängigmachung der Fensterung unterzogen, wie z.B. auf die bezugnehmend auf 34 von Fig. 1 beschriebene Weise. Die so erhaltenen un- gefensterten Spektralwerte stehen dann als Ströme von modifizierten Spektralwerten pro Teilband zur Verfügung und stellen die Zeit/Frequenzbereichsdarstellung des wasserzei- chenbehafteten Audiosignals dar. An den Ausgang des Mischers 218 schließen sich die inverse Filterbank 40 und die Fensterungseinrichtung 42 an, die die Überführung der Zeit/Frequenzbereichsdarstellung des wasserzeichenbehafte- ten Audiosignals in den Zeitbereich 22 übernehmen, wodurch sich am Ausgang 16 eine Folge von Audiowerten ergeben, die das wasserzeichenbehaftete Audiosignal darstellen.

Ein Vorteil der Vorgehensweise nach Fig. 4 bezüglich der Vorgehensweise nach Fig. 1 besteht darin, dass dadurch, dass Phase und Betrag zusammen zur Überführung in den Frequenz/Modulationsfrequenzbereich verwendet werden, keine Wiedereinführung von Modulationsanteilen bei der Rekombination von Phase und modifiziertem Betrags-Anteil hervorgeru- fen wird.

Ein Wasserzeichen-Decodierer, der geeignet ist, um das wasserzeichenbehaftete Audiosignal, wie es von dem Einbetter 210 ausgegeben wird, zu verarbeiten, um daraus das Wasser- zeichen zu extrahieren, ist in Fig. 5 gezeigt. Der Decodie- rer, der allgemein mit 310 angezeigt ist, umfasst einen Eingang 312 zum Empfangen des wasserzeichenbehafteten Audiosignals und einen Ausgang 314 zum Ausgeben des extrahierten Wasserzeichens. An den Eingang 312 des Decodierers 310 schließen sich in Reihe geschaltet und in der Reihenfolge, wie sie im Folgenden genannt sind, eine Fensterungseinrichtung 318, eine Filterbank 320, ein Mischer 412 und eine Filterbank 328 an, wobei ein weiterer Eingang des Mischers 412 mit einem Ausgang einer Trägerfrequenzbestim- mungseinrichtung 414 verbunden ist, die einen mit dem Ausgang der Filterbank 320 verbundenen Eingang aufweist. Die Komponenten 318, 320, 412, 328 und 414 erfüllen den selben Zweck und arbeiten auf die gleiche Weise wie die Komponenten 18, 20, 212, 28 und 214 des Einbetters 210. Auf diese Weise wird das wasserzeichenbehaftete Eingangssignal im De- codierer 310 vom Zeitbereich 322 über den Zeitfrequenzbereich 324 in den Frequenz/Modulationsfrequenzbereich 330 überführt, wo eine Wasserzeichen-Decodierungseinrichtung 332 die Frequenz/Modulationsfrequenzbereichsdarstellung des wasserzeichenbehafteten Audiosignals empfängt und verarbeitet, um das Wasserzeichen zu extrahieren und am Eingang 314 des Decodierers 310 auszugeben. Wie im Vorhergehenden er- wähnt, unterscheiden sich die der Decodierungseinrichtung 332 im Decodierer 310 zugeführten Modulationsmatrizen um weniger als die der Dekodierungseinrichtung 132 zugeführten von denen der Einbettungseinrichtung 216 zugeführten in dem Ausführungsbeispiel von Fig. 1-3, da die Rekombination zwi- sehen Phasenanteil und modifiziertem Betragsanteil im Einbettersystem von Fig. 4 wegfällt.

Die vorhergehenden Ausführungsbeispiele betrafen folglich eine bisher nicht da gewesene Verbindung der Themenbereiche „Teilbandmodulationsspektralanalyse" und „digitales Wasserzeichen" zu einem Gesamtsystem zur Einbringung von Wasserzeichen mit einem Einbettersystem auf der einen und einem Detektorsystem auf der anderen Seite. Das Einbettersystem dient zum Einbringen des Wasserzeichens. Es besteht aus ei- ner Teilbandmodulationsspektralanalyse, einer_. Einbetterstufe, die eine Modifikation der durch die Analyse gewonnenen Signalrepräsentation vornimmt, und einer Synthese des Signals der modifizierten Repräsentation. Das Detektorsystem dient umgekehrt zur Erkennung eines vorhandenen Wasserzei- chens in einem wasserzeichenbehafteten Audiosignal. Es besteht aus einer Teilbandmodulationsspektralanalyse und einer Detektionsstufe, die unter Verwendung der durch die A- nalyse gewonnenen Signalrepräsentation das Wasserzeichen erkennt und auswertet .

Im Hinblick auf die Auswahl derjenigen Stellen im Frequenz/Modulationsfrequenzbereich bzw. derjeniger Modulationswerte im Frequenz/Modulationsfrequenzbereich, die zur Wasserzeicheneinbettung bzw. Wasserzeichenextraktion heran- gezogen werden, wird darauf hingewiesen, dass diese Auswahl nach psychoakustischen Gesichtspunkten getroffen werden sollte, um zu gewährleisten, dass das Wasserzeichen bei Abspielen des wasserzeichenbehafteten Audiosginais unhörbar ist. Zur geeigneten Auswahl können Verdeckungs^'effekte im Modulationsspektralbereich ausgenutzt werden. Hierzu sei beispielsweise auf T. Houtgast: „Frequency Selectivity in Amplitude Modulation Detection", J. Acoust. Soc. Am. vol. 85, No. 4, April 1989 verwiesen, welche hiermit bezüglich der Auswahl unhörbar modifizierbarer Modulationswerte im Frequenz/Modulationsfrequenzbereich unter Bezugnahme aufgenommen wird.

Für ein näheres Verständnis der Modulationsspektralanalyse im allgemeinen sei noch auf folgende Veröffentlichungen verwiesen, die sich auf die Audiocodierung unter Verwendung einer Modulationstransformation beziehen, und bei denen das Signal durch eine Transformation in Frequenzbänder zerlegt wird, anschließend eine Zerlegung nach Betrag und Phase vorgenommen wird, und dann, während die Phase nicht weiterverarbeitet wird, die Beträge je Teilband über eine Anzahl von Transformationsblöcken in einer zweiten Transformation erneut transformiert werden. Ergebnis ist eine Frequenzzer- legung der zeitlichen Hüllkurve des betreffenden Teilbandes in „Modulationskoeffizienten". Diese weiterführenden Druckschriften umfassen den Artikel M. Vinton and L. Atlas, „A Scalable and Progressive Audio Codec," in Proceedings of the 2001 IEEE ICASSP, May 7-11, 2001, Salt Lake City, die US 2002/0176353A1 von Atlas et al mit dem Titel "Scalable And Perceptually Ranked Signal Coding And Decoding", den Artikel J. Thompson and L. Atlas, "A Non-uniform Modulation Transform for Audio Coding with Increased Time Resolution, " in Proceedings of the 2003 IEEE ICASSP, April 6-10, Hong Kong, 2003, und den Artikel L. Atlas, "Joint Acoustic And Modulation Frequency", Journal on Applied Signal Processing 7 EURASIP, S. 668-675, 2003.

Die vorhergehenden Ausführungsbeispiele stellen lediglich exemplarische Möglichkeiten dar, um Audioaufnahmen mit unhörbaren und gegen Manipulation robusten Zusatzinformationen versehen zu können, und dabei die Wasserzeicheneinbringung im sogenannten Teilbandmodulationsspektralbereich vor- zunehmen sowie die Detektierung im Teilbandmόdulations- spektralbereich vorzunehmen. Jedoch können verschiedene Variationen an diesen Ausführungsbeispielen vorgenommen werden. Die im Vorhergehenden erwähnten Fensterungseinrichtun- gen könnten lediglich der Blockbildung dienen, d.h. die Multiplikation bzw. Gewichtung mit den Fensterfunktionen könnte auch entfallen. Ferner könnte man auch andere Fensterfunktionen als die im Vorhergehenden erwähnten Beträge von trigonometrischen Funktionen verwenden. Auch die 50%- Blocküberlappung könnte entfallen oder anders ausgeführt sein. Dementsprechend könnte auch die Blocküberlappung auf Seiten der Sythese andere Operationen als eine reine Addition zusammengehörender Audiowerte in aufeinander folgenden Zeitblöcken umfassen. Auch die Fensterungen bei der zweiten Transformationsstufe könnten auf entsprechende Weise variiert werden.

Es wird ferner darauf hingewiesen, dass die Audiosignaleinbringung nicht unbedingt vom Zeitbereich in die Fre- quenz/Modulationsfrequenzbereichsdarstellung und von dort wieder - nach der Modifikation - in die Zeitbereichsdarstellung zurückführen muss. Es wäre ferner möglich, dass die beiden vorhergehenden Ausführungsbeispiele dahin gehend modifiziert werden, dass die Werte, wie sie von der Rekom- binationseinrichtung 38 bzw. dem Mischer 218 ausgegeben werden, zu einem wasserzeichenbehafteten Audiosignal in einem Bitstrom vereinigt werden, um in einem Zeit/Frequenzbereich vorzuliegen.

Ferner könnte die im zweiten Ausführungsbeispiel verwendete Demodulation auch anders ausgeführt sein, z.B. durch Veränderung der Phasenverläufe der Spektralwertblöcke innerhalb der Matrizen 68 durch andere Maßnahmen als durch reine Multiplikation mit einem festen komplexen Träger.

In Bezug auf die vorhergehenden Ausführungsbeispiele für mögliche Decodierer, die bezugnehmend auf Figuren 3 und 5 erläutert worden sind, wird darauf hingewiesen, dass auf- grund der Übereinstimmung der zwischen der Wasserzeichen- Decodierungseinrichtung und dem Eingang angeordneten Blöcke mit den entsprechenden aus dem zugehörigen Einbetter alle Variationsmöglichkeiten, die im Hinblick auf den Einbetter in Bezug auf diese Einrichtungen beschrieben wurden, auf dieselbe Weise auf die Wasserzeichen-Decodierer von Fig. 3 und 5 zutreffen.

Es wird noch darauf hingewiesen, dass sich vorhergehenden Ausführungsbeispiele zwar ausschließlich auf die Wasserzeicheneinbettung in Hinblick auf Audiosignale bezog, dass das vorliegende Wasserzeicheneinbettungsschema aber auch auf andere Informationssignale anwendbar ist, wie z.B. auf Steuersignale, Messsignale, Videosignale oder dergleichen, um dieselben beispielsweise auf ihre Authentizität zu überprüfen. In all diesen Fällen ist es durch das vorliegend vorgeschlagene Schema möglich, die Einbettung von Informationen derart vorzunehmen, dass sie die üblichen Nutzung des Informationssignals in der wasserzeichenbehafteten Form nicht beeinträchtigt, wie z.B. die Analyse des Messergebnisse oder den optischen Eindruck des Videos oder dergleichen, weshalb auch in diesen Fällen die einzubettenden Zusatzdaten als Wasserzeichen bezeichnet werden.

Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Schema auch in Software implementiert sein kann. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfol- gen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens rea- lisiert werden, wenn das Computerprogramm auf einem Computer abläuft.

Claims

Patentansprüche

Vorrichtung zum Einbringen eines Wasserzeichens in ein Informationssignal, mit einer Einrichtung (18, 20, 26, 28; 18, 20, 212, 214, 28) zum Überführen des Informationssignals von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30); einer Einrichtung (32; 216) zum Modifizieren des Informationssignals in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen, um eine modifizierte Spektral/Modulations- spektraldarstellung zu erhalten; und einer Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden eines wasserzeichenbehafteten Informationssignals basierend auf der modifizierten Spektral/Mo- dulationsspektraldarstellung.

2. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung zum Überführen in die Spektral/Modulationsspektraldarstellung folgende Merkmale aufweist: eine Einrichtung (18, 20) zum Überführen des Informationssignals in eine Zeit/Spektraldarstellung durch blockweises Transformieren des Informationssignals; und eine Einrichtung (26, 28; 212, 214, 28) zum Überführen des Informationssignals von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldar- Stellung.

3. Vorrichtung gemäß Anspruch 2, bei der die Einrichtung (18, 20) zum Überführen des Informationssignals in ei- ne Zeit/Spektraldarstellung ausgebildet ist, um die Zeit/Spektraldarstellung in eine Mehrzahl von Spektralkomponenten zu zerlegen, um pro Spektralkomponente eine Folge von Spektralwerten zu erhalten, und die Einrichtung (26, 28; 212, 214, 28) zum Überführen des Informationssignals von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung eine Einrichtung (26, 28; 212, 214, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten aufeist, um einen Teil der Spektral/Modulationsspektraldarstellung zu erhalten.

4. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (212, 214, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten ausgebildet ist, um die Folge von Spektralwerten blockweise zunächst mit einem komplexen Träger zu multiplizieren (212), derart, dass sich ein Betrag einer mittleren Steigung eines Phasenverlaufs der Folge von Spektralwerten verringert, um demodulierte Blöcke von Spektralwerten zu erhalten, und die demodulierten Blöcke von Spektralwerten dann blockweise spektral zu zerlegen (28), um den Teil der modifi- zierten Spektral/Modulationsspektraldarstellung zu erhalten.

5. Vorrichtung gemäß Anspruch 4, bei der die Einrichtung (212, 214, 28) zum, für eine vorbestimmte Spektralkom- ponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten eine Einrichtung (214) zum, abhängig von der Zeit/Spektraldarstellung des Informationssignals, blockweise Variieren des komplexen Trägers aufweist, mit dem die Folge von Spektralwerten multipli- ziert wird.

6. Vorrichtung gemäß Anspruch 5, bei der die Einrichtung (214) zum Variieren ausgebildet ist, um zum blockwei- sen Variieren des komplexen Trägers blockweise Phasen der Spektralwerte in der Folge von Spektralwerten zu unwrappen, um einen Phasenverlauf zu erhalten, eine mittlere Steigung des Phasenverlaufs zu bestimmen und basierend auf der mittleren Steigung den komplexen Träger zu bestimmen.

7. Vorrichtung gemäß Anspruch 6, bei der die Einrichtung (214) zum Variieren ferner ausgebildet ist, um aus dem Phasenverlauf einen Achsenabschnitt des Phasenverlaufs zu bestimmen und den komplexen Träger ferner basierend auf dem Achsenabschnitt zu bestimmen.

8. Vorrichtung gemäß einem der Ansprüche 4 bis 7, bei der die Einrichtung (34, 218, 40, 42) zum Bilden des wasserzeichenbehafteten Informationssignals folgende Einrichtungen aufweist: eine Einrichtung (34) zum Rücküberführen des Informa- tionssignals von der modifizierten Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung, um modifizierte demodulierte Blöcke von Spektralwerten für die vorbestimmte Spektralkomponente zu erhalten; und eine Einrichtung (218) zum blockweisen Multiplizieren der modifizierten demodulierten Blöcke von Spektralwerten mit einem zu dem komplexen Träger komplex konjugierten Träger, um modifizierte Blöcke von Spektral- werten zu erhalten; und eine Einrichtung zum Zusammenfügen der modifizierten demodulierte Blöcke von Spektralwerten zu einer modifizierten Folge von Spektralwerten, um einen Teil ei- ner Zeit/Spektraldarstellung des wasserzeichenbehafteten Informationssignals zu erhalten.

9. Vorrichtung gemäß Anspruch 8, bei der die Einrichtung zum Bilden ferner folgendes Merkmal aufweist: eine Einrichtung zum Rücküberführen des wasserzeichen- behafteten Informationssignals von der Zeit-/Spektral- darstellung in die Zeitdarstellung.

10. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (26, 28) zum, für eine vorbestimmte Spektralkomponen- te, blockweisen spektralen Zerlegen der Folge von Spektralwerten ausgebildet ist, um die Folge von Spektralwerten zunächst einer Betragsbildung (26) zu unterziehen, um eine Folge von Beträgen von Spektralwerten zu erhalten, und die Folge von Beträgen von Spektralwerten dann blockweise in die Modulationsspektraldarstellung zu transformieren (28), um den Teil der Spektral/Modulationsspektraldarstellung zu erhalten.

11. Vorrichtung gemäß Anspruch 10, bei der die Einrichtung (34, 218, 40, 42) zum Bilden des wasserzeichenbehafteten Informationssignals folgende Einrichtungen aufweist: eine Einrichtung (34) zum Rücküberführen des Informationssignals von der modifizierten Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung, um eine modifizierte Folge von Spektralwerten für die vorbestimmte Spektralkompo- nente zu erhalten; und eine Einrichtung (38) zum Rekombinieren der modifizierten Folge von Spektralwerten mit auf Phasen der Folge von Spektralwerten basierenden Phasen, um einen Teil einer Zeit/Spektraldarstellung des wasserzeichenbehafteten Informationssignals zu erhalten.

12. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung (18, 20) zum Überführen des Informationssignals von der Zeitdarstellung in die Spektral/Modulationsspektraldarstellung folgende Merkmale aufweist: eine Blockbildungseinrichtung (18) zur Bildung einer Folge von Blöcken von Informationswerten aus dem Informationssignal; und eine Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten, um eine Folge von Spektralwertblöcken zu erhalten, wobei jeder Spektralwertblock einen Spektralwert für jede einer vorbestimmten Mehrzahl von Spektralkomponenten auf- weist, so dass die Folge von Spektralwertblöcken pro Spektralkomponente eine Folge von Spektralwerten bildet; und eine Einrichtung (26, 28; 212, 214, 28) zum spektralen Zerlegen einer vorbestimmten Folge der Folgen, um einen Block von Modulationswerten zu erhalten, wobei die Einrichtung (32, 216) zum Modifizieren ausgebildet ist, um den Block von Modulationswerten ab- hängig von dem einzubringenden Wasserzeichen zu modifizieren, um einen modifizierten Block von Modulationswerten zu erhalten, und die Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden ausgebildet ist, um das wasserzeichenbehaftete Informationssignal ba- sierend auf dem modifizierten Block von Modulationswerten zu bilden.

13. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden ausgebil- det ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (34, 38; 34, 218), um eine modifizierte Folge von Spektralwerten zu erhalten, und eine Folge von modifi- zierten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (40), um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (42), um das wasserzeichenbehaftete Informationssignal zu erhalten.

14. Vorrichtung gemäß einem der Ansprüche 12 bis 13, bei der die Blockbildungseinrichtung (18) ausgebildet ist, um die Blöcke von Informationswerten derart aus dem Informationssignal zu extrahieren, dass die Blöcke von Informationswerten sich gegenseitig um die Hälfte ü- berlappenden aufeinanderfolgenden Zeitabschnitten des Informationssignals zugeordnet sind, und die Einrichtung (42) zum Bilden ausgebildet ist, um beim Zusammenfügen die modifizierten Zeitblöcke gegenseitig um die Hälfte zu überlappen und zueinander ausgerichtete Informationswerte benachbarter Informationsblöcke zu kombinieren.

15. Vorrichtung gemäß einem der Ansprüche 12 bis 14, bei der die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten derart ausgebildet ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen Spektralwerten liefert, und die Einrichtung (26, 28) zum spektralen Zerlegen der vorbestimmten Folge der Folgen von Spektralwerten ausgebildet ist, um lediglich die Beträge der komplexen Spektralwerte spektral zu zerlegen (28), um den Block von Modulationswerten zu erhalten.

16. Vorrichtung gemäß Anspruch 15, bei der die Einrichtung zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (34) , um eine modifizierte Folge von Spektralwerten zu erhalten, Phasen der Folge von komplexen Spektralwerten abhängig von der Modifikation durch die Einrichtung zum Modifizieren anzupassen (36) , um eine Folge von angepassten Phasenwerten zu erhalten, die Folge von angepassten Phasenwerten mit der modifizierten Folge von Spektralwerten zu rekombinieren (38), um eine rekombinierte modifizierte Folge von Spektralwerten zu erhalten, und eine Folge von modifizierten Spektralwertblöcken rückzuüberführen (40), die auf der rekombinierten modifizierten Folge von Spektralwerten basiert, um die modifizierten Blöcke von Informationswerten zu erhalten.

17. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blö- cken von Informationswerten derart ausgebildet ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen Spektralwerten liefert, und die Einrichtung (212, 214, 28) zum Überführen der vorbestimmten der Folgen von Spektralwerten in die Spektral/Modulationsspektraldarstellung ausgebildet ist, um zunächst die Folge von Spektralwerten derart zu manipulieren (212) , dass eine Phase der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert wird, um eine phasenmanipulierte Folge von Spektralwerten zu erhalten, und dann die phasenmanipulierte Folge von Spektralwerten spektral zu zerlegen (28), um den zumindest einen Block von Modulationswerten zu er- halten, und die Einrichtung zum Bilden (34, 218, 40, 42) ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen, um eine modifizierte Folge von Spektralwerten zu erhalten, die modifizierte Folge von Spekt- ralwerten umgekehrt zu der Einrichtung (212) zum spektralen Zerlegen der vorbestimmten der Folgen von Spektralwerten derart zu manipulieren (218), dass eine Phase der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert o- der verkleinert wird, um eine manipulierte Folge von Spektralwerten zu erhalten, eine Folge von modifizier- ten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (40) , um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (42) , um das was- serzeichenbehaftete Informationssignal zu erhalten.

18. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren an- gepasst ist, um die Modifikation an Stellen der Spekt- ral/Modulationsspektraldarstellung vorzunehmen, die zeitlich variieren.

19. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren an- gepasst ist, um die Modifikation abhängig von dem Informationssignal vorzunehmen.

20. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren angepasst ist, um die Modifikation derart vorzunehmen, dass aufgrund von psychoakustischen Verdeckungseffekten die Modifikation nicht zu einer hörbaren Veränderung des wasserzeichenbehafteten Informationssignals führt .

21. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der das Wasserzeichen eine Urheberinformation, eine das Informationssignal kennzeichnende Kennnummer oder eine Kundennummer anzeigt.

22. Vorrichtung zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, mit einer Einrichtung (118, 120, 126, 128; 318, 320, 414, 412, 328) zum Überführen des wasserzeichenbehafteten Informationssignals von einer Zeitdarstellung in eine Spektral/ModulationsspektraldarStellung; einer Einrichtung (132; 332) zum Herleiten des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarstellung.

23. Verfahren zum Einbringen eines Wasserzeichens in ein Informationssignal, mit

Überführen (18, 20, 26, 28; 18, 20, 212, 214, 28) des Informationssignals von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30) ;

Modifizieren (32; 216) des Informationssignals in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen, um eine modifizier- te Spektral/Modulationsspektraldarstellung zu erhalten; und

Bilden (34, 38, 40, 42; 34, 218, 40, 42) eines wasserzeichenbehafteten Informationssignals basierend auf der modifizierten Spektral/Modulationsspektraldarstellung.

24. Verfahren zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, mit

Überführen (118, 120, 126, 128; 318, 320, 414, 412, 328) des wasserzeichenbehafteten Informationssignals von einer Zeitdarstellung in eine Spektral/Modulationsspe traldarstellung;

Herleiten (132; 332) des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarsteilung.

5. Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 23 oder 24, wenn das Computer-Programm auf einem Computer abläuft.