WO2002103695A2

WO2002103695A2 - Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Info

Publication number: WO2002103695A2
Application number: PCT/EP2002/005173
Authority: WO
Inventors: Jürgen HERRE; Ralph Kulessa; Christian Neubauer; Frank Siebenhaar
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date: 2001-06-18
Filing date: 2002-05-10
Publication date: 2002-12-27
Also published as: DE50203511D1; US20040184369A1; WO2002103695A3; ATE298921T1; EP1382038A2; DE10129239C1; US7346514B2; EP1382038B1

Abstract

Zum Einbetten eines Wasserzeichens in ein Audiosignal wer-den zunächst eine spektrale Darstellung des Audiosignals und eine spektrale Darstellung des Wasserzeichensignals er-mittelt (14, 16). Hierauf wird die spektrale Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Audiosignals verarbeitet (22). Das verarbeitete Wasserzeichensignal wird mit dem Audiosignal kombiniert (18). Die Verarbeitung der spektralen Darstellung des Wasserzeichensignals wird iterativ durchgeführt, indem zunächst ein vorbestimmter Wasserzeichen-Startwert (26) gewählt wird, die durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführte Störung ermittelt wird (28), und dann der Wasserzeichen-Startwert so in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störungsschwelle (32) ist.

Description

Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal

Beschreibung

Die vorliegende Erfindung bezieht sich auf das Gebiet der Audiocodierung und insbesondere auf Verfahren und Vorrichtungen zum Einbetten eines Wasserzeichens in ein Audiosig- nal.

Moderne Audiocodierverfahren verarbeiten zeitdiskrete Audio-Abtastwerte, um einen Bitstrom zu liefern, der gegenüber dem ursprünglichen Audiosignal komprimiert ist. Der Strom von zeitdiskreten Audio-Abtastwerten wird zunächst gefenstert, um aus dem Strom von Audio-Abtastwerten aufeinanderfolgende Blöcke von gefensterten Audio-Abtastwerten zu erzeugen. Die weitere Verarbeitung findet blockweise statt. Ein durch Fensterung erzeugter Block von Audio-Abtastwerten wird typischerweise mittels einer Analyse-Filterbank in eine spektrale Darstellung umgesetzt. Die spektrale Darstellung umfaßt frequenzmäßig nebeneinanderliegende Spektralwerte von der Frequenz 0 bis zur maximalen Audio-Frequenz, welche beispielsweise bei 16 kHz liegen kann. Die Audio- Spektralwerte werden in Skalenfaktorbändern gruppiert und quantisiert. Die Quantisierung findet derart statt, daß das durch die Quantisierung eingeführte Quantisierungsrauschen derart dimensioniert ist, daß es von dem Audiosignal maskiert wird. Hierzu wird ein psychoakustisches Modell einge- setzt, das auf der Basis des Audiosignals für jedes Skalen- faktorband einen Energiewert liefert, der angibt, bis zu welchem Energiepegel Quantisierungsrauschen maskiert wird, d. h. im wieder decodierten Audiosignal nicht hörbar sein wird. Liegt das durch den Quantisierer eingeführte Quanti- sierungsrauschen dagegen oberhalb der psychoakustischen Maskierungsschwelle, so wird das wieder decodierte Audiosignal hörbare Störungen enthalten. Die Quantisierungsstufen des Quantisierers werden abhängig von der Maskierungs- schwelle berechnet. Wenn die Quantisierungsstufen berechnet sind, werden die Audio-Spektralwerte anhand dieser Quantisierungsstufen quantisiert, um quantisierte Audio- Spektralwerte zu erhalten. Aus Dateneffizienzgründen werden die quantisierten Audiospektralwerte einer Entropie- Codierung, wie z. B. eine Huffman-Codierung, unterzogen, um einen Bitstrom mit Codeworten zu liefern, die die Audiospektralwerte darstellen. Mittels eines Bitstrom- Multiplexers werden dem Strom von Codeworten Seiteninforma- tionen hinzugefügt, welche unter anderem die Skalenfaktoren umfassen, auf deren Basis ein Audio-Decodierer die Quantisierungsstufen ermitteln kann, die im Codierer verwendet worden sind.

Zur Audio-Decodierung wird der Bitstrom samt Seiteninformationen mittels eines Bitstrom-Demultiplexers in einerseits Codewörter und andererseits Seiteninformationen aufgesplit- tet. Zunächst wird die Entropie-Codierung rückgängig gemacht. Anschließend werden die Entropie-decodierten Werte, d. h. die quantisierten Audio-Spektralwerte, einer inversen Quantisierung unterzogen, um invers quantisierte Spektral^¬ werte zu erhalten. Diese werden dann mittels einer Synthese-Filterbank vom Frequenzbereich in den Zeitbereich umgesetzt. Am Ausgang der Synthese-Filterbank liegt das wieder decodierte Audiosignal vor.

Es sei darauf hingewiesen, daß es sich hierbei um ein verlustbehaftetes Codierverfahren handelt, da im Codierer eine Quantisierung vorgenommen worden ist. Das wieder decodierte Audiosignal entspricht nicht exakt dem ursprünglichen Audiosignal. Wenn die Codierung und Decodierung erfolgreich war, wird jedoch der subjektive Höreindruck des decodierten Audiosignals dem subjektiven Höreindruck des ursprünglichen Audiosignals entsprechen, da das durch den Quantisierer im Codierer eingeführte Quantisierungsrauschen wegmaskiert wird, d. h. es wird unterhalb der psychoakustischen Maskierungsschwelle "versteckt". Aus Dateneffizienzgründen wird es bevorzugt, möglichst große Quantisierungsschritte zu verwenden. Andererseits führen zu große Quantisierungsschritte zu einem zu großen Quantisierungsrauschen, das sich im wieder decodierten Signal als hörbare Störung äußern kann. Moderne Audiocodierverfahren versuchen einen optimalen Kompromiß zwischen diesen beiden Forderungen zu erreichen.

Die psychoakustische Maskierungsschwelle eines Audiosignal- abschnitts hängt von dem tatsächlichen Eingangs-Audiosignal ab. Ändert sich das Audiosignal über der Zeit, so ändern sich auch die Maskierungseigenschaften über der Zeit. Aus Dateneffizienzgründen wird es bevorzugt, immer so viel Quantisierungsrauschen in das Audiosignal einzuführen, wie möglich ist, d. h. das Quantisierungsrauschen sollte möglichst gut der psychoakustischen Maskierungsschwelle entsprechen. Audiosignalabschnitte mit guten Maskierungseigenschaften können daher mit einem relativ geringen Bitaufwand codiert werden, während andererseits Audiosignalabschnitte mit relativ schlechten Maskierungseigenschaften, wie z. B. tonale Audiosignalabschnitte, sehr fein quantisiert werden müssen, was wiederum bedeutet, daß zur Codierung dieser Audiosignalabschnitte eine große Anzahl von Bits aufgewendet werden muß. Ein Codierer, der versucht, immer genau die Menge an Störung einzuführen, die durch die Maskierungsschwelle gegeben wird, wird daher ein Audiosignal mit konstanter Qualität erzeugen. Aufgrund des zeitlich variierenden Wesens des Eingangssignals führt dies jedoch am Ausgang des Codierers zu einer variablen Bitrate. Obgleich ein Co- dieren mit konstanter Qualität - und damit mit variabler Bitrate - aus Dateneffizienz-Gründen einerseits und Audio- qualitäts-Gründen andererseits attraktiv ist, ist dieses Konzept dahingehend nachteilig, daß es nur für Anwendungen geeignet, die eine variable Übertragungsrate unterstützen, wie z. B. die Speicherung von komprimierten Audiosignalen oder die Übertragung von komprimierten Audiosignalen über Paket-basierte Netze, wie z. B. das Internet. Viele Anwendungen fordern jedoch einen Audiocodierer mit einer konstanten Übertragungsrate. Aufgrund der zeitlich variierenden spektralen und zeitlichen Eigenschaften eines Audiosignals führt dies unweigerlich zu einer variablen Qualität. Insbesondere kann je nach Bitrate der Fall entstehen, in dem Abschnitte des Audiosignals, die relativ geringe Maskierungseigenschaften haben, nicht ausreichend fein quantisiert werden können, d. h. unter-codiert werden und im decodierten Signal unter Umständen hörbare Störungen enthalten, während andererseits leicht zu codierende Segmente, d. h. Audiosignalabschnitt mit guten Maskierungseigenschaften, genauer als nötig codiert werden müssen, d. h. über-codiert werden.

Um die Nachteile des Über-Codierens und Unter-Codierens zu überwinden, wird üblicherweise eine Bitsparkassenfunktion eingesetzt. Die Bitsparkasse wird gefüllt, wenn leicht zu codierende Audioabschnitte codiert werden, derart, daß Bits, die nicht benötigt werden, um diese leicht zu codie- renden Abschnitte zu codieren, nicht einfach durch eine feiner als nötige Quantisierung "verschwendet" werden, sondern daß dennoch eine gröbere Quantisierung verwendet wird und die überzähligen Bits in die Bitsparkasse "gesteckt" werden.

Kommen dagegen Audioabschnitte vor, die schwer zu codieren sind, d. h. bei denen eine geringere Quantisiererschritt- weite eingesetzt werden muß als eigentlich durch die geforderte konstante mittlere Datenrate möglich ist, so wird zu diesem Zweck die Bitsparkasse "geleert", um trotz der ge^¬ forderten Datenrate eine feinere Quantisierung als eigent^¬ lich möglich einzusetzen, so daß im decodierten Audiosignal auch in diesen Abschnitten keine hörbare Störung enthalten ist. Die Bitsparkassenfunktion fungiert somit als Puffer,

nach "außen" einen Audiocodierer mit konstanter Bitrate zu machen. Heutzutage entwickelt sich die Musikverteilung beispielsweise über das Internet zu einer zunehmend wichtigeren Technologie. Der meiste Musikinhalt ist komprimiert, um Speicherplatz zu sparen und die Übertragung über Übertra- gungskanäle mit begrenzter Bandbreite zu beschleunigen. Das Überwachen der Verwendung der in Übertragungsnetzen verteilten Musikstücke oder das Verfolgen von illegalen Kopien derselben wird jedoch zu einem immer größeren Problem. Während einerseits eine breite Verteilung von Audiostücken wünschenswert ist, müssen dennoch Urheberrechte respektiert werden. In diesem Zusammenhang stellt die "Wasserzeichentechnik" (Watermarking) einen nützlichen Mechanismus dar, um solche illegalen Kopien zu verfolgen, oder um Urheberrechts-Informationen oder allgemein das geistige Eigentum an den Stücken im Audiosignal unterzubringen.

Das Einbringen von Wasserzeichen in nicht-komprimierte Multimediadaten, wie z. B. Bildern, Video, Audio usw. ist bekannt. Um Wasserzeichen in komprimiertes Material einzu- bringen, wird jedoch ein schnelles, Qualitäts-bewahrendes Wasserzeichenverfahren benötigt.

Die Fachveröffentlichung "Audio Watermarking of MPEG-2-AAC Bit Streams", Christian Neubauer, Jürgen Herre, 108. AES Convention, Paris 2000, Preprint 5101 lehrt zunächst, eine spektrale Darstellung eines Audiosignals zu erzeugen. Zu dieser wird dann ein gespreiztes und spektral transformiertes Wasserzeichensignal addiert. Aus dem Summensignal wird durch Quantisierung und Huffman-Codierung ein neuer Bit- ström erzeugt. Dieses sogenannte Bitstrom- Wasserzeichenverfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da keine volle Decodierung des mit einem Wasserzeichen zu versehenden Bitstroms erfolgen muß. Weiterhin hat dieses Verfahren den Vorteil der hohen Audio- qualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch aufeinander abgestimmt werden können, wenn die durch das Wasserzeichen in das Audiosignal eingeführte E- nergie unterhalb der psychoakustischen Maskierungsschwelle liegt. Das Verfahren zeichnet sich ferner durch eine hohe Robustheit aus, da das Wasserzeichen nicht aus dem wieder decodierten Audiosignal beispielsweise durch einen illegalen Verbreiter des Audiosignals entfernt werden kann, ohne die Audioqualität zu beeinträchtigen.

Nachteilig an dem beschriebenen Verfahren ist jedoch die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.

Ein weiteres Wasserzeichenverfahren ist die Einbettung des Wasserzeichens während der Komprimierung des Audiosignals. Dieses Konzept ist in der Fachveröffentlichung "Combined Compression/Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer und Jürgen Herre, 110. AES Convention, 12. bis 15 Mai 2001, Amsterdam, Preprint 5344, beschrieben. Zunächst wird ein unkomprimiertes Audiosignal einem psychoakustischen Modell zugeführt, um die Maskie- rungsschwelle zu bestimmen. Hierauf wird das Audiosignal in den Frequenzbereich transformiert. Das gespreizte, spektral repräsentierte Wasserzeichensignal wird anhand der Maskierungsschwelle im Frequenzbereich gewichtet und zum Spektrum des Eingangsaudiosignals addiert. Anhand der Maskierungs- schwelle werden die Parameter für die Quantisierung ermittelt, woraufhin das Wasserzeichen-beaufschlagte Signal quantisiert und codiert wird. Auch dieses Verfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z. B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in eine spektrale Darstellung, nur einmal durchgeführt werden müssen. Das Verfahren liefert ferner üblicherweise eine gute Audioqualität, da Quantisierungsgeräusch und Wasserzeichengeräusch aufeinander abgestimmt werden können.

Nachteilig an diesem Verfahren ist jedoch ebenfalls die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist wieder darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.

Wenn die spektrale Darstellung des Audiosignals betrachtet wird, so ist eine Vielzahl von Audiospektralwerten zu sehen. Das gespreizte Wasserzeichensignal ist ebenfalls durch eine Vielzahl von Spektrallinien gekennzeichnet. Damit das Wasserzeichen jedoch nicht zu hörbaren Störungen im wieder decodierten Audiosignal führt, ist die Höhe der Wasserzei- chen-Spektrallinien wesentlich geringer als die Höhe der Audiosignal-Spektrallinien. Nach einer Addition des Wasserzeichen-Spektrums zum Audio-Spektrum ist das kombinierte Spektrum nur leicht gegenüber dem ursprünglichen Spektrum verändert. Die dann folgende Quantisierung des kombinierten Spektrums wird das Wasserzeichen immer dann ersatzlos entfernen, wenn die Quantisierungs-Schrittweite größer ist als die Höhe der Wasserzeichen-Spektrallinien, die mit dieser Quantisiererschrittweite quantisiert werden. Werden zu viele Wasserzeichen-Spektrallinien durch das darauffolgende Quantisieren "wegquantisiert", so kann der Wasserzeichendetektor kein eindeutiges Wasserzeichen mehr extrahieren.

Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Einbetten eines Wasserzeichens in ein Audiosignal zu schaffen, das einerseits eine gute Audioqualität liefert, und das andererseits auch eine gute Wasserzeichen-Detektierbarkeit sicherstellt . Diese Aufgabe wird durch ein Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 1 oder durch eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 16 gelöst.

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine bessere Wasserzeichendetektierbarkeit erreicht wird, wenn bei der Wasserzeicheneinbettung die Tatsache berücksichtigt wird, daß das Audiosignal samt Wasserzeichen einer Quantisierung unterzogen wird. Ein Wasserzeichen wird nur dann detektierbar sein, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, durch das Wasserzeichen in eine andere Quantisierungsstufe fällt als wenn kein Wasserzeichen eingebettet wird. Nur in diesem Fall wird ein Wasserzeichendetektor, der lediglich quantisierte Informationen erhält, ein Wasserzeichen detektieren können. In anderen Worten ausgedrückt bedeutet dies, daß dann, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, in dieselbe Quantisierungsstufe fällt wie die ent- sprechende Spektrallinie, die nur das Audiosignal darstellt, die Wasserzeicheneinbettung vergeblich war, da im quantisierten Signal kein Energieanteil, der von dem Wasserzeichen herrührt, zu sehen sein wird. Das Wasserzeichen ist wegquantisiert worden.

Erfindungsgemäß wird daher die spektrale Darstellung des Wasserzeichensignals derart verarbeitet, daß sichergestellt wird, daß das durch den Schritt des Verarbeitens verarbeitete Wasserzeichensignal so gestaltet ist, daß es auch nach einer Quantisierung noch vorhanden sein wird. Um dies zu erreichen wird ein vorbestimmter Wasserzeichen-Startwert gewählt, welcher von der spektralen Darstellung des Wasserzeichensignals abhängt. Natürlich darf das Wasserzeichen zu keiner oder nur zu einer sehr geringen Störung des Audio- Signals führen. Aus diesem Grund wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals eingeführte Störung ermittelt, bei der jedoch die Verhältnisse nach einer Quantisierung der spektralen Darstellung des Audiosignals zugrunde gelegt werden. Damit ist es einerseits möglich, zu sehen, ob nach der Quantisierung etwas vom Wasserzeichen verbleibt. Andererseits kann sichergestellt werden, daß die Störung des Wasserzeichens nach der Quantisierung so ist, wie sie sein soll. Falls die durch den Wasserzeichen-Startwert eingeführte Störung größer als eine vorbestimmte Storungsschwelle ist, wird der Wasserzeichen-Startwert so lange verändert, bis die durch einen veränderten Wasserzeichen- Startwert in die spektrale Darstellung nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbe^¬ stimmten Störschwelle ist. Der dadurch erhaltene veränderte Wasserzeichen-Startwert wird dann mit dem Audiosignal kombiniert, um das Wasserzeichen-behaftete Audiosignal zu er- halten, in das das Wasserzeichen eingebettet ist.

Ein Vorteil der vorliegenden Erfindung liegt darin, daß nun nicht mehr Verhältnisse berücksichtigt werden, die letztendlich nicht den Ausgangsverhältnissen entsprechen, näm- lieh die Audiosignal/Wasserzeichen-Verhältnisse vor der Quantisierung, sondern daß das Wasserzeichen z. B. iterativ so lange verändert wird, bis eine gewünschte Wasserzeichen- "Störenergie" gefunden ist. Erfindungsgemäß werden nunmehr die Verhältnisse nach dem Quantisierer berücksichtigt, d. h. die Verhältnisse, die für den Audiosignal-Decodierer und für den Wasserzeichen-Extraktor maßgeblich sind.

Obgleich im Stand der Technik üblicherweise die Wasserzeichenenergie derart eingestellt worden ist, daß die Wasser- Zeichenenergie kleiner oder gleich der psychoakustischen Maskierungsschwelle ist, blieb dennoch die Unwägbarkeit zurück, was mit dem Wasserzeichensignal während der Quantisierung geschieht. Wie es ausgeführt worden ist, konnte zum einen der Fall auftreten, daß das Wasserzeichen wegquanti- siert wird, was dazu führt, daß im decodierten Signal kein Wasserzeichen oder nur ein sehr schwaches Wasserzeichen extrahiert werden konnte. Andererseits konnte auch der Fall auftreten, daß durch das Wasserzeichen, obwohl es so ge- wichtet worden ist, daß es unterhalb der Maskierungsschwelle liegt, dennoch Störungen eingeführt worden sind, die im decodierten Signal hörbar waren.

Erfindungsgemäß wird nunmehr aufgrund der Verarbeitung des Wasserzeichens auf der Basis der Verhältnisse nach der Quantisierung eine genaue Kontrolle erreicht. Diese Kontrolle hat den Vorteil, daß nicht nur einerseits sichergestellt werden kann, daß das Wasserzeichen zu keiner oder nur minimal hörbaren Störung führt, sondern daß gleichzeitig auch eine ausreichende Wasserzeichen-Detektierbarkeit sichergestellt wird. Andererseits liefert das erfindungsgemäße Verfahren den Vorteil, daß für Fälle, bei denen es besonders auf eine gute Detektierbarkeit ankommt, auch bewußt zugunsten einer höheren Wasserzeichen-Detektierbarkeit gewisse - tolerierbare - Störungen in das Audiosignal eingeführt werden, während in anderen Fällen, bei denen die Wasserzeichen-Detektierbarkeit nicht unter allen Umständen zu jedem Zeitpunkt sichergestellt werden muß, Kompromisse hin- sichtlich der Wasserzeichen-Detektierbarkeit eingegangen werden können, um höchste Audioqualitäts-Ansprüche zu erfüllen.

Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird das Wasserzeichensignal vor der Quantisierung dem Audiosignal hinzugefügt, um ein kombiniertes Signal zu erhalten. Das kombinierte Signal wird dann quanti- siert und wieder invers quantisiert und mit dem ursprünglichen Audiosignal verglichen. Aus dem Vergleich wird be- stimmt, ob die durch das Wasserzeichen eingeführte Störung tolerabel ist. Wird festgestellt, daß die Störung nicht to- lerabel ist, so wird das Spektrum des Wasserzeichensignals iterativ unter Verwendung bestimmter Strategien gewichtet, um dann wieder eine Quantisierung und inverse Quantisierung durchzuführen, bis festgestellt wird, daß die Störung nun tolerabel ist. Das durch diese Verarbeitung erhaltene Wasserzeichen-Spektrum wird dann dem ursprünglichen Audiospektrum hinzuaddiert. Das addierte bzw. kombinierte Signal wird dann quantisiert, Entropie-codiert und mit Seiteninformationen versehen, um einen Audiobitstrom zu erhalten, in dem das Wasserzeichen vorhanden ist.

Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung wird das ursprüngliche Audiosignal quantisiert. Dem Audiosignal wird ein quantisiertes Wasserzeichen hinzuaddiert, um das kombinierte Signal zu erhalten. Das kombinierte Signal wird dann nicht mehr, wie beim ersten Ausfüh- rungsbeispiel, noch einmal quantisiert, sondern unmittelbar Entropie-codiert. Das dem quantisierten Audiosignal hinzugefügte "quantisierte" Wasserzeichensignal wird hierbei derart eingestellt, daß einerseits die Forderung nach tole- rabler Störung erfüllt ist und andererseits eine erwünschte Wasserzeichen-Detektierbarkeit erreicht wird.

Unabhängig davon, ob das kombinierte Signal noch quantisiert wird, oder ob das kombinierte Signal bereits in quan- tisierter Form vorliegt, wird gemäß der vorliegenden Erfin- düng eine genaue Steuerung der durch das Wasserzeichen eingeführten Störung in das auf dem Signal erreicht.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:

Fig. 1 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal;

Fig. 2 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbringen eines Wasserzeichens in ein Audiosignal gemäß einem ersten Ausführungsbeispiel;

Fig. 3 eine erfindungsgemäße Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel; und Fig. 4a bis 4d eine schematische Erläuterung des Liniense- lektions-Algorithmus beim zweiten Ausführungsbeispiel der vorliegenden Erfindung.

Die in Fig. 1 gezeigte erfindungsgemäße Vorrichtung umfaßt einen Audioeingang 10 und einen Wasserzeicheneingang 12. Sowohl das Audiosignal an dem Audioeingang 10 als auch das Wasserzeichensignal an dem Wasserzeicheneingang 12 werden mittels einer Einrichtung 14 bzw. 16 in eine spektrale Darstellung überführt. Die spektrale Darstellung des Audiosignals umfaßt Audiospektralwerte, während die spektrale Darstellung des Wasserzeichensignals Wasserzeichenspektralwerte aufweist. In einer Einrichtung 18 zum Kombinieren werden die Audiospektralwerte mit veränderten Wasserzeichen- Spektralwerten kombiniert, um an einem Ausgang 20 das kombinierte Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist. Erfindungsgemäß ist hierzu eine Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Was- serzeichensignals abhängig von einer über einen Eingang 24 gelieferten psychoakustischen Maskierungsschwelle vorgesehen. Die spektrale Darstellung des Wasserzeichensignals wird abhängig von der über den Eingang 24 erhaltenen psychoakustischen Maskierungsschwelle verarbeitet, um ein ver- arbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingeführte Störung unter einer vorbestimmten Störungs- schwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt.

Hierzu umfaßt die Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Wasserzeichensignals eine Einrichtung 26 zum Wählen eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt. In einer Einrichtung 28 wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführte Störung ermit- telt. Hierzu werden von einer Einrichtung 30 zum Liefern von Quantisierungsinformationen Quantisierungsinformationen zugeführt. Die Einrichtung 30 liefert Quantisierungsinformationen, die von dem ursprünglichen Audiosignal, also dem Audiosignal ohne Wasserzeichen, abhängen.

In einer Einrichtung 32 wird untersucht, ob die ermittelte Störung größer als die vorbestimmte Störschwelle ist. Ist dies nicht der Fall, d. h. ist die Störung akzeptabel, so wird der Wasserzeichen-Startwert unmittelbar der Einrichtung 18 zum Kombinieren zugeführt. Ist dies dagegen der Fall, d. h. ist die eingeführte Störung zu groß, bzw. anders als gewünscht, so wird eine Einrichtung 34 zum Verändern des Wasserzeichen-Startwerts aktiviert, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Zu diesem Zweck muß die in der Einrichtung 22 zum Verarbeiten skizzierte Schleife möglicherweise mehrmals iterativ durchlaufen werden, um irgendwann am Ausgang der Einrichtung 32 einen veränderten Wasserzeichen-Startwert zu erhalten, der als verarbeitetes Wasserzeichensignal verwendet wird und der Einrichtung 18 zum Kombinieren zugeführt wird, um das Audiosignal am Ausgang 20 zu erhalten, in das das Wasserzeichen eingebettet ist.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung, das in Fig. 2 gezeigt ist, wird das Kombinieren mittels einer Addition 18 vor dem Quantisieren durchge- führt. Die Einrichtung 28 zum Ermitteln der durch den Block Wasserzeichen-Gewichtung 26 festgelegten Startwert in das Audiosignal eingeführten Störung wird dadurch ermittelt, daß zunächst in einer Quantisierer/Inversquantisierer- Einrichtung 28a das kombinierte Signal quantisiert und in- vers quantisiert wird. In einer Einrichtung 28b wird dann beispielsweise durch Differenzbilden und Quadrieren der Differenzwerte die durch das Wasserzeichen eingeführte Störung berechnet und dann in der Einrichtung 32 mit der psy- choakustischen Maskierungsschwelle 24 verglichen. Ist die Störung zu groß, wird die Einrichtung 34, die in Fig. 2 mit "Gewichtungskontrolle" bezeichnet ist, angesteuert, um dem Block 26 veränderte Gewichtungsfaktoren zuzuführen, um dann das verändert gewichtete Wasserzeichen-Spektrum in der Einrichtung 18 mit dem ursprünglichen Audiosignal in spektraler Darstellung zu kombinieren und die Iterationsschleife von neuem zu durchlaufen.

Bei dem in Fig. 2 dargestellten Ausführungsbeispiel wird es bevorzugt, als Wasserzeichen-Startwert das mit einem für alle Spektrallinien gleich gewichteten Wasserzeichen- Spektrum zu nehmen. Der Gewichtungsfaktor für jede Spektrallinie ist daher für alle Spektrallinien gleich einer Konstanten, die so gewählt ist, daß die Wasserzeichenenergie über der Maskierungsschwelle liegt. Dann wird die Wasserzeichenenergie schrittweise reduziert, um dann die Energie des Wasserzeichens unter die Maskierungsschwelle zu „i- terieren" .

Wenn also zunächst von der Einrichtung 32 festgestellt wird, daß die Störung zu groß wird, ist die Einrichtung 34 zur Kontrolle der Gewichtungsfaktoren ausgebildet, um alle Gewichtungsfaktoren zu verkleinern, z. B. zu halbieren. Wenn dann die Störung immer noch zu groß ist, könnten in einem nächsten Iterationsschritt alle aktuellen Gewichtungsfaktoren erneut halbiert werden usw. Dies kann fortgeführt werden, bis die Einrichtung 32 feststellt, daß die Störung nun in Ordnung ist.

Nachdem die Kombination von Audiosignal und verarbeitetem Wasserzeichensignal im Spektralbereich, also nicht im Quantisierungsbereich, sondern vor der Quantisierung stattfindet, muß noch eine Quantisierung durchgeführt werden. Hier- zu empfiehlt es sich, den Quantisierer-Abschnitt der Einrichtung 28a zu verwenden, um die Ausgangswerte des Quanti- siererabschnitts als Audiosignal samt eingebettetem Wasserzeichen auszugeben. Mittels einer Analyse-Synthese-Iteration, wie sie in Fig. 2 gezeigt ist, wird somit die durch das Wasserzeichen nach der Quantisierung entstandene Störung bestimmt. Somit läßt sich einerseits sicherstellen, daß auch nach der Quantisierung Wasserzeichenenergie im Signal verbleibt. Andererseits kann die tatsächlich eingebrachte Störung ermittelt werden, was zur Erzielung einer hohen Audioqualität von Vorteil ist. Das spektral dargestellte Wasserzeichensignal wird so- mit, wie es anhand von Fig. 2 ausgeführt worden ist, mittels einer Gewichtungsfilterbank, die in dem Block 26 enthalten sein kann, spektral mit den von dem Block 34 zur Verfügung gestellten aktuellen Gewichtungsfaktoren gewich- tet . Das entstehende Signal wird zu dem ursprünglichen Au- diosignal addiert. Wie es ausgeführt worden ist, wird das kombinierte Signal am Ausgang der Einrichtung 18 quantisiert und invers quantisiert und ergibt das am Ausgang der Einrichtung 28a vorliegende Signal, das in die Einrichtung 28b genauso wie das ursprüngliche Audiosignal eingespeist wird. Die Einrichtung 28b vergleicht nunmehr das Originalsignal mit dem quantisierten und wieder invers quantisierten Signal und bestimmt daraus das Quantisierungs- Fehlersignal, das der Einrichtung 32 zugeführt wird. Anhand der Einrichtung 32 wird wiederum die Gewichtungskontrolle im Block 34 angesteuert, um neue bessere Gewichtungsfaktoren zu bestimmen. Hierzu steht die von dem Maskierungsmodellen ermittelte Maskierungsschwelle zur Verfügung, die angibt, wieviel Störung in das Signal an einer bestimmten Stelle im Signalspektrum "erlaubt" ist. Wenn der Block Ge- wichtungskontrolle 34 optimale Gewichtungsfaktoren hinsichtlich auf die gewünschte Audiosignalstörung und gewünschte Wasserzeichendetektierbarkeit, d. h. Wasserzeichenenergie, ermittelt hat, bricht das Verfahren ab. Die zuletzt von dem Block 28a ermittelten quantisierten Spekt- ralwerte des Kombinationssignals werden dann als Resultat zum Bitstrommultiplexer weitergegeben, um dort mit den Seiteninformationen zusammen zu einem Audio-Bitstrom geformt zu werden. Im nachfolgenden wird auf Fig. 3 eingegangen, um eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel der vorlie- genden Erfindung darzustellen. Im Gegensatz zu dem in Fig. 2 gezeigten ersten Ausführungsbeispiel, bei dem ein nicht- quantisiertes Audiosignal mit einem nicht-quantisierten Wasserzeichensignal kombiniert wird, findet diese Kombination 18 in Fig. 3 im "Quantisierungsbereich" statt, d. h. es wird ein quantisiertes Audiosignal mit einem quantisierten Wasserzeichen kombiniert. Dies kann dadurch erreicht werden, daß entweder mittels eines Quantisierers 42 durch Quantisieren des ursprünglichen Audiosignals die Quantisie- rerstufen berechnet werden, oder daß die Quantisierungsstu- fen aus einem codierten Audiosignal extrahiert werden. Ansprechend auf die durch die Einrichtung 42 bereitgestellten Quantisierungsstufen wird eine Einrichtung 40a zum Berechnen des quantisierten Audiosignals minus einer vorbestimmten Anzahl von n Quantisierungsstufen und eine Einrichtung 40b zum Berechnen des quantisierten Audiosignals plus eine vorbestimmte Anzahl von n Quantisierungsstufen betrieben.

Im Gegensatz zu dem in Fig. 2 gezeigten Ausführungsbeispiel, bei dem für jedes kombinierte Audiosignal eine Quan- tisierungsberechnung und eine inverse Quantisierungsberechnung durch die Einrichtung 28a durchzuführen war, und zwar innerhalb der Iterationsschleife, findet dies bei dem in Fig. 3 gezeigten zweiten Ausführungsbeispiel a-priori statt, d. h. durch eine Vorberechnung außerhalb einer Ite- rationsschleife. Hierzu wird zunächst als vorbestimmter Wasserzeichen-Startwert mittels einer Einrichtung 36 ein sogenanntes "maximales" Wasserzeichen berechnet. Zur Berechnung des vorbestimmten maximalen Wasserzeichens werden zunächst nur die Vorzeichen des Wasserzeichen-Spektrums verwendet. Hat das Wasserzeichen-Spektrum ein positives Vorzeichen, so wird der entsprechende Spektralwert des ursprünglichen quantisierten Audiosignals um n Quantisierungsstufen vergrößert, wobei n eine Ganzzahl größer oder gleich 1 ist. Ist das Vorzeichen eines Wasserzeichen- Spektralwerts dagegen negativ, so wird der entsprechende quantisierte Spektralwert, d. h. der Spektralwert des Audiosignals bei derselben Frequenz wie der Spektralwert des Wasserzeichensignals, dessen Vorzeichen gerade betrachtet wird, um n Quantisierungsstufen verkleinert. Hieraus ergibt sich ein maximales Wasserzeichen, wobei der Ausdruck "maximal" dahingehend zu verstehen ist, daß das maximale Wasserzeichensignal auf jede Spektrallinie des ursprünglichen Au- diosignals nach der Quantisierung eine Auswirkung hat. Dieser Fall ist zwar hinsichtlich einer sehr guten Wasserzei- chendetektierbarkeit wünschenswert, dürfte jedoch erfahrungsgemäß zu viel Störung in das Audiosignal einführen. Um die Störung auf ein vertretbares Maß zurückzunehmen, wobei ein vertretbares Maß beispielsweise die psychoakustische Maskierungsschwelle sein kann, wird eine Einrichtung 38, die einen Linienselektionsalgorithmus implementiert, vorgesehen. Die Einrichtung 38 ermittelt die durch das von der Einrichtung 36 zur Verfügung gestellte maximale Wasserzei- chen eingeführte Störung in das Audiosignal. Falls die Störung größer als die vorbestimmte Storungsschwelle ist, wird durch die Einrichtung 38 das "maximale" Wasserzeichen durch Selektion von einzelnen Linien so lange verändert, bis die durch das Wasserzeichen eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Ist diese Bedingung erfüllt, wird das - bereits in quantisierter Form - vorliegende Wasserzeichen ebenso wie das quantisierte ursprüngliche Audiosignal dem Addierer 18 zugeführt, um aus- gangsseitig das quantisierte Wasserzeichen-behaftete Audio- signal zu erhalten.

Im nachfolgenden wird anhand der Fig. 4a bis 4d auf die Funktion und Arbeitsweise der Einrichtung 36 und 38 eingegangen. Fig. 4a zeigt beispielshalber ein quantisiertes Au- diosignal, das aufgrund der Übersichtlichkeit der Darstellung lediglich drei Spektralwerte 50a-50c darstellt. Typischerweise hat ein Audiospektrum je nach gewählter Fensterlänge und Transformation z. B. 1024 Spektralwerte. Die An- zahl der von Null verschiedenen quantisierten Spektralwerte ist abhängig davon, wie viele Audiospektralwerte auf 0 quantisiert worden sind. Selbstverständlich haben die quantisierten Audiospektralwerte im realen Fall unterschiedli- ehe Höhen. Fig. 4b zeigt nun ein mit plus bzw. minus n Quantisierungsstufen (abhängig vom Vorzeichen der Wasserzeichen-Spektralwerte) beaufschlagtes Audiospektrum. Die dem Audiospektralwert 50a von Fig. 4a entsprechende Spektralkomponente des Wasserzeichens hat für das in Fig. 4b ge- zeigte Beispiel ein negatives Vorzeichen. Die Spektralkomponente des Wasserzeichens, die dem Audiospektralwert 50b von Fig. 4a entspricht, hat bei dem in Fig. 4b gezeigten Beispiel ein positives Vorzeichen, während die dritte Spektralkomponente des Wasserzeichens wiederum ein negati- ves Vorzeichen hatte. Der Betrag der Wasserzeichen- Spektralkomponenten spielt zunächst keine Rolle, da davon ausgegangen wird, daß eine Wasserzeichendetektion bereits dann möglich ist, wenn die quantisierten Audiospektralwerte 50a-50c durch das Wasserzeichen verändert werden. Das maxi- male Wasserzeichen, das durch die Einrichtung 36 von Fig. 3 bestimmt wird, ist für den in Fig. 4b gezeigten Fall in Fig. 4c dargestellt. Es hat ein Spektrum, das sich dadurch auszeichnet, daß jeder quantisierte ursprüngliche Audiospektralwert um eine Quantisierungsstufe verändert wird, und zwar entweder vergrößert, wenn das Wasserzeichen ein positives Vorzeichen hat, oder verkleinert, wenn das Wasserzeichen ein negatives Vorzeichen hatte.

Bei dem in Fig. 4b gezeigten Beispiel könnte der Betrag ei- ner Wasserzeichen-Spektrallinie dahingehend berücksichtigt werden, daß nicht nur um eine Quantisierungsstufe inkremen- tiert bzw. dekrementiert wird, sondern daß um mehrere Quantisierungsstufen inkrementiert bzw. dekrementiert wird, wenn der Betrag der Wasserzeichen-Spektrallinie entspre- chend groß ist.

Anhand von Fig. 4d wird nunmehr die Funktion der Einrichtung 38 von Fig. 3 beschrieben. Stellt die Einrichtung 38 fest, daß für die linke quantisierte Audiospektralkomponente die Situation so ist, daß die durch das Wasserzeichen eingeführte Störung zu groß ist, wenn die linke quantisierte Audiospektralkomponente 50a um eine Quantisierungsstufe verringert wird, wie es durch die Spektralkomponente 50a' dargestellt ist, so wird diese Spektralkomponente von der Einrichtung 38 nicht selektiert, was sich in den veränderten Wasserzeichen-Spektralwerten nach der Linienselektion so bemerkbar macht, daß das veränderte Wasserzeichen an dieser Stelle eine Spektrallinie von 0 hat. Bei der mittleren und der rechten Spektralkomponente des quantisierten Audiosignals wurde dagegen festgestellt, daß die durch die Spektrallinien 50b' und 50c' eingeführten Störungen in Ordnung waren, so daß an diesen Stellen so viel Wasserzeichen- energie zu den quantisierten Audiospektralwerten hinzugefügt werden kann, daß diese um eine Quantisierungsstufe erhöht (50b') bzw. um eine Quantisierungsstufe verringert (50c') werden können.

Aus dieser Betrachtung wird deutlich, daß durch Vorberechnung der Quantisierungsstufen durch die Einrichtungen 40a und 40b der Schritt der Quantisierung und inversen Quantisierung, d. h. die Einrichtung 28a von Fig. 2, entfallen kann, da die Größe der Störung durch Veränderung des Quan- tisierungs-Index a-priori vorberechnet werden kann. Ferner ist aus Fig. 3 zu sehen, daß auch die Einrichtung 26, d. h. die Gewichtung der Wasserzeichen-Spektrallinien, entfallen ist .

Die quantisierten Audio-Spektralwerte werden nunmehr anhand des Wasserzeichensignals, d. h. anhand des Vorzeichens des Wasserzeichensignals um z. B. plus oder minus eine Quantisierungsstufe verändert. Dieses Prozedere bringt Vorteile dahingehend, daß Rechenzeit eingespart werden kann, da die Quantisierung und inverse Quantisierung (Einrichtung 28a von Fig. 2) und die Gewichtung des Wasserzeichens (Einrichtung 26 von Fig. 2) ersatzlos entfallen können. Anhand der bereits vorberechneten Audiospektren, d. h. des Originalspektrums und des Originalspektrums minus n Quantisierungsstufen oder des Originalspektrums plus n Quantisierungsstufen wird linienweise das maximale Wasserzeichen (Fig. 4c) bestimmt. Dies ergibt sich als Differenz zwischen dem Originalspektrum (Fig. 4a) und dem um eine Anzahl von n Quantisierungsstufen veränderten Audiospektrum (Fig. 4b), wobei die Differenz das gleiche Vorzeichen wie das unge- wichtete Wasserzeichen hat.

Der Linienselektions-Algorithmus, der in der Einrichtung 38 ausgeführt wird, berücksichtigt den Betrag der ungewichte- ten Wasserzeichenspektrallinien, die Maskierungsschwelle 24 und gegebenenfalls eine Bitsparkassenfunktion 44 des Audio- codierers.

Um sowohl eine gute Audioqualität als auch eine gute Was- serzeichendetektierbarkeit sicherzustellen, wird es bevorzugt, die Linien des maximalen Wasserzeichens so zu selek- tieren, daß das Wasserzeichen-Spreizbandsignal breitbandig eingebettet wird, d. h. daß möglichst viele Linien des quantisierten Audiosignals verändert werden. Weiterhin soll die Maskierungsschwelle oder, falls eine von der Maskierungsschwelle abweichende Schwelle verwendet wird, diese vorbestimmte Storungsschwelle nicht verletzt werden. Schließlich soll die Struktur des Wasserzeichens innerhalb eines Frequenzbandes möglichst wenig verändert werden.

Alle anderen Linien des maximalen Wasserzeichens werden nicht berücksichtigt. Dies bedeutet, daß nach der Addition des Wasserzeichens die quantisierten Audiospektralwerte der selektierten Linien um plus bzw. minus n Quantisierungsstufen verändert werden, während die quantisierten Audiospektralwerte der nicht selektierten Wasserzeichen-Linien unver- ändert übernommen werden. Das quantisierte Wasserzeichen-behaftete Audiosignal am Ausgang 20 der in Fig. 3 gezeigten Vorrichtung muß nunmehr noch Entropie-codiert werden.

Abhängig von dem verwendeten Audiocodierverfahren, in das das erfindungsgemäße Konzept integriert ist, existiert eine Bitsparkassenfunktion, die späteren Signalblöcken zusätzliche Bits zur Verfügung stellen kann, wie es ausgeführt worden ist. Die Linienselektionsstrategie ist vorzugsweise an den Füllstand der Bitsparkasse angepaßt, um so beispielsweise bei gefüllter Bitsparkasse zu erlauben, daß auch quantisierte Audiospektralwerte des ursprünglichen Audiosignals, die den Wert 0 haben, mit einem Wasserzeichen beaufschlagt werden, was normalerweise aufgrund des Bitbe- darfs nicht zulässig wäre. Damit kann die Wasserzeichende- tektion spürbar verbessert werden.

Bei der Anwendung der kombinierten Einbettung/Codierung stehen neben den bereits quantisierten Audiospektralwerten zusätzlich die Originalwerte nach der Transformation in den Frequenzbereich zur Verfügung. Die Quantisierung der originalen Audiospektralwerte kann ebenfalls als eine Art Wasserzeicheneinbettung angesehen werden, da sowohl bei der Quantisierung als auch bei der Addition eines Wasserzei- chensignals eine gewisse Störung des Audiospektrums resultiert. Die durch die Quantisierung eingebrachte Störung ist dabei aufgrund ihrer zufälligen Natur nicht als Wasserzeichen anzusehen. Wenn jedoch die eingebrachte Störung aufgrund der Quantisierung vorzeichenrichtig mit dem Wasser- zeichen ist, unterstützt das Quantisierungsrauschen die De- tektierbarkeit des Wasserzeichens. Hieraus ergeben sich folgende Fälle.

Durch die Quantisierung einer Audiospektrallinie wird das Wasserzeichen vorzeichenrichtig eingebracht. Hier ist die Einrichtung 38 von Fig. 3 vorzugsweise so angeordnet, daß sie aufgrund der Tatsache, daß bereits durch die Quantisierung phasenrichtig zum Wasserzeichen-Spektralwert für eine bestimmte Frequenz eine Störung eingebracht worden ist, angeordnet, um auf das Einbringen einer weiteren Wasserzeichen-Störung zu verzichten. Alternativ könnte noch eine Quantisierungsstufe hinzugefügt werden, um die Detektier- barkeit noch weiter zu verbessern.

Wenn dagegen durch die Quantisierung einer Audiospektrallinie eine Störung eingebracht wird, die das entgegengesetzte Vorzeichen hat wie das Wasserzeichensignal, was dazu führt, daß das Wasserzeichen durch die gegenläufige Quantisierung gewissermaßen verschlechtert wird, ist aufgrund der Linienselektionsstrategien, die weiter oben ausgeführt worden sind, abzuwägen, ob für diese Linie die Robustheit des Wasserzeichens gewährleistet werden muß und somit der quanti- sierte Audiospektralwert verändert werden muß, um das Quantisierungsrauschen gewissermaßen wieder "rückgängig" zu machen, oder ob in Hinblick auf eine bessere Audioqualität das eingebettete Wasserzeichen an dieser Stelle, d. h. das Quantisierungsrauschen an dieser Stelle, ein "falsches" Vorzeichen besitzen soll.

Wie es bereits ausgeführt worden ist, findet bei modernen Codierverfahren die Berechnung der psychoakustischen Maskierungsschwelle nicht linienweise statt, sondern skalen- faktorbandweise. Dies bedeutet, daß nicht Energien einzelner Spektrallinien betrachtet werden, sondern die Gesamtenergien z. B. 20 Spektrallinien in einem Skalenfaktorband. Es kann jedoch in einem Skalenfaktorband, in dem viele Wasserzeichen-Spektrallinien tolerierbar sind, ohne weiteres auf ein paar Linien im Sinne einer guten Audioqualität verzichtet werden, ohne daß die Wasserzeichen-Detektierbarkeit signifikant leidet. Diese Funktionalität kann auch bei dem in Fig. 2 gezeigten Ausführungsbeispiel dadurch erreicht werden, daß die Gewichtungskontrolle 34 von Fig. 2 derart ausgestaltet ist, daß nicht über der Frequenz gleiche Gewichtungsfaktoren eingesetzt werden, sondern daß unterschiedliche Gewichtungsfaktoren für verschiedene Spektralwerte eingesetzt werden, und daß insbesondere auf Gewich- tungsfaktoren von 0 für einzelne Spektrallinien vorkommen. Als vorbestimmter Wasserzeichen-Startwert kann es bei dem in Fig. 2 gezeigten Ausführungsbeispiel auch von Vorteil sein, vor dem Beginn der Iteration die Wasserzeichen- Gewichtung so zu gestalten, daß sie von der psychoakustischen Maskierungsschwelle abgeleitet ist.

Zusammenfassend stellt sich das erfindungsgemäße Konzept derart dar, daß zunächst ein spektral dargestelltes Wasser- zeichensignal erzeugt wird. Dies wird mittels Gewichtungsfaktoren gewichtet. Das gewichtete Signal wird zum Original-Audiosignal, das in spektraler Darstellung vorliegt, hinzuaddiert. Alternativ wird auf der Basis des Wasserzeichen-Signals eine Veränderung der Linien des Original- Audiosignals, das in spektraler Darstellung vorliegt, durchgeführt. Hierauf wird die nach der Quantisierung eingebrachte Störung bestimmt, wobei die Störung durch Quanti- sieren, invers Quantisieren und Differenzbildung zum Original ermittelt wird, oder wobei die Störung vorberechnet ist.

Anschließend werden neue Gewichtungsfaktoren bestimmt, wobei die Maskierungsschwelle verwendet wird, wobei eine Linienselektionsstrategie angewendet wird, oder wobei eine Linienselektionsstrategie insbesondere derart angewendet wird, daß Vorzeichen und Betrag der Spektrallinien des un- gewichteten Wasserzeichens verwendet werden, und daß die Summe von Wasserzeichenlinie und Originalspektrallinie so bestimmt wird, daß diese neue Spektrallinie in ein anderes Quantisierungsintervall fällt als die ursprüngliche Spektrallinie.

Das erfindungsgemäße Konzept ist dahingehend vorteilhaft, daß es sowohl für Bitstrom-Wasserzeichen-Verfahren als auch Verfahren einsetzbar ist, die Audiocodierung und Wasserzeicheneinbettung in einem Schritt vornehmen. Ein weiterer Vorteil des erfindungsgemäßen Konzepts besteht darin, daß eine volle Kontrolle über die eingebrachte Störung erzielbar ist. Dadurch ist es möglich, das Verfahren gezielt zugunsten optimaler Wasserzeichendetektion oder op- timaler Audioqualität einzustellen.

Ein weiterer Vorteil des erfindungsgemäßen Konzepts ist eine volle Kontrolle über die frequenzmäßige Verteilung des Wasserzeichen-Spreizbandsignals in das Audiosignal.

Claims

Patentansprüche

1. Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Schritten:

Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Audio-Spektralwerten aufweist;

Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;

Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Audiosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß ei- ne durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Storungsschwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt; und

Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichenbehaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,

wobei der Schritt des Verarbeitens (22) folgende Teilschritte aufweist:

Wählen (26) eines vorbestimmten Wasserzeichen- Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;

Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Au- diosignal nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführten Störung; und

falls die durch den Wasserzeichen-Spektralwert einge- führte Störung größer als die vorbestimmte Storungsschwelle ist (32), Verändern (34) des Wasserzeichen- Startwerts, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung des Audiosignals einge- führte Störung kleiner oder gleich der vorbestimmten Storungsschwelle ist, und Verwenden des veränderten Wasserzeichen-Startwerts als das verarbeitete Wasserzeichensignal .

Verfahren nach Anspruch 1,

bei dem im Teilschritt des Wählens 26 Wasserzeichen- Spektralwerte mit Start-Gewichtungsfaktoren gewichtet sind;

bei dem im Schritt des Ermitteins (28) die mit den Start-Gewichtungsfaktoren gewichteten Wasserzeichen- Spektralwerte zu den Audiospektralwerten addiert werden, um Additions-Spektralwerte zu erhalten,

bei dem die Additions-Spektralwerte quantisiert und anschließend invers quantisiert werden (28a), um invers quantisierte Additions-Spektralwerte zu erhalten;

bei dem die invers quantisierten Additions- Spektralwerte mit den Audiospektralwerten verglichen werden (28b) , um zu ermitteln, ob die in den Additi- ons-Spektralwerten enthaltene Störung unter der vorbestimmten Storungsschwelle ist (32); und

bei dem im Teilschritt des Veränderns (34) die Start- Gewichtungsfaktoren verändert werden.

3. Verfahren nach Anspruch 2, bei dem die Start- Gewichtungsfaktoren für alle Wasserzeichenspektralwerte gleich sind und einen Betrag haben, der so gewählt ist, daß die Energie des Wasserzeichens oberhalb der psychoakustischen Maskierungsschwelle liegt.

4. Verfahren nach Anspruch 2, bei dem die Start- Gewichtungsfaktoren durch Gewichten der Wasserzeichenspektralwerte mit der psychoakustischen Maskierungs- schwelle erhalten werden, so daß die Energie der mit der psychoakustischen Maskierungsschwelle gewichteten Wasserzeichenspektralwerte an die psychoakustische Maskierungsschwelle angenähert ist und insbesondere kleiner oder gleich der psychoakustischen Maskierungs- schwelle ist.

5. Verfahren nach Anspruch 3 oder 4, bei dem die Start- Gewichtungsfaktoren im Teilschritt des Veränderns (34) pro einem Iterationsschritt verkleinert werden.

6. Verfahren nach einem der Ansprüche 2 bis 5, bei dem der Schritt des Kombinierens (18) das Kombinieren der Spektralwerte des Audiosignals und der Spektralwerte des verarbeiteten Wasserzeichensignals und anschlie- ßend den Schritt des Quantisierens des Wasserzeichenbehafteten Audiosignals unter Verwendung von Quantisierungsstufen aufweist, die durch Quantisieren der Audiospektralwerte ohne Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle er- mittelt wurden, um ein quantisiertes Wasserzeichenbehaftetes Audiosignal zu erhalten.

7. Verfahren nach Anspruch 1,

bei dem der Teilschritt des Wählens (26) eines Wasserzeichen-Startwerts folgende Unterschritte aufweist: Ermitteln (42) von Quantisierungsstufen für die Audiospektralwerte ohne das Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle (24);

Quantisieren (42) der Audiospektralwerte unter Verwendung der ermittelten Quantisierungsstufen, um quantisierte Audiospektralwerte zu erhalten;

Extrahieren von Vorzeichen der Wasserzeichen- Spektralwerte;

Berechnen (36) von quantisierten Spektralwerten des Wasserzeichen-Startwerts, so daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals positiv ist, und daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich dem Negativen einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals negativ ist; und

bei dem der Schritt (34) des Veränderns den Schritt des Einsteilens der Anzahl von Quantisierungsstufen und/oder den Schritt des Selektierens (38) von Spektrallinien des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert aufweist .

8. Verfahren nach Anspruch 7, bei dem für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, keine Spektralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.

9. Verfahren nach Anspruch 7, bei dem eine Bitsparkassenfunktion (44) vorhanden ist, und bei dem abhängig von einer Füllung der Bitsparkasse für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, Spekt- ralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.

10. Verfahren nach einem der Ansprüche 1 bis 9, bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß eine möglichst große Anzahl von veränderten Wasserzeichen-Spektralwerten ungleich 0 ist.

11. Verfahren nach einem der Ansprüche 1 bis 10,

bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß der Verlauf des veränderten Wasserzeichen-Startwerts über der Frequenz dem spektralen Verlauf des Wasserzeichen-Signals so weit als möglich entspricht.

12. Verfahren nach einem der Ansprüche 7 bis 11,

bei dem quantisierte Audiospektralwerte zu selektier- ten Wasserzeichen-Spektralwerten hinzuaddiert werden, um ein quantisiertes Wasserzeichen-behaftetes Audiosignal zu erhalten.

13. Verfahren nach einem der vorhergehenden Ansprüche,

bei dem der Teilschritt des Veränderns (34) abgebrochen wird, wenn die Storungsschwelle erreicht oder unterschritten ist, und wenn zugleich die Anzahl der veränderten Wasserzeichen-Spektralwerte über einer vorbestimmten Schwelle ist.

14. Verfahren nach Anspruch 13, bei dem die vorbestimmte Energieschwelle dadurch definiert ist, daß eine vorbestimmte Anzahl von Audiospektralwerten eines Signals, das die Audiospektralwerte und die veränderten Wasserzeichen-Spektralwerte umfaßt, um zumindest eine Quantisierungsstufe gegenüber den quantisierten Spektralwerten des Audiosignals allein verändert sind.

15. Verfahren nach einem der vorhergehenden Ansprüche,

bei dem die psychoakustische Maskierungsschwelle (24) einen Wert pro einem Skalenfaktorband aufweist, und bei dem der Schritt des Verarbeitens (22) skalenfak- torbandweise durchgeführt wird.

16. Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Merkmalen:

einer Einrichtung zum Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Au- dio-Spektralwerten aufweist;

einer Einrichtung zum Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;

einer Einrichtung zum Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Au- diosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Storungsschwelle ist, die von der psychoakustischen Maskierungsschwelle ab- hängt; und

einer Einrichtung zum Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichen-behaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,

wobei die Einrichtung zum Verarbeiten (22) folgende Merkmale aufweist: eine Einrichtung zum Wählen (26) eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;

eine Einrichtung zum Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignal nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführ- ten Störung;

eine Einrichtung (32) zum Feststellen, ob die durch den Wasserzeichen-Startwert eingeführte Störung größer als die vorbestimmte Storungsschwelle ist; und

eine Einrichtung (34) zum Verändern der Wasserzeichen- Spektralwerte, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist, und zum Verwenden der veränderten Wasserzeichen- Spektralwerte als das verarbeitete Wasserzeichensignal.