EP1382038A2 - Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal - Google Patents

Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Info

Publication number
EP1382038A2
EP1382038A2 EP02740586A EP02740586A EP1382038A2 EP 1382038 A2 EP1382038 A2 EP 1382038A2 EP 02740586 A EP02740586 A EP 02740586A EP 02740586 A EP02740586 A EP 02740586A EP 1382038 A2 EP1382038 A2 EP 1382038A2
Authority
EP
European Patent Office
Prior art keywords
watermark
spectral
signal
audio signal
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP02740586A
Other languages
English (en)
French (fr)
Other versions
EP1382038B1 (de
Inventor
Jürgen HERRE
Ralph Kulessa
Christian Neubauer
Frank Siebenhaar
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of EP1382038A2 publication Critical patent/EP1382038A2/de
Application granted granted Critical
Publication of EP1382038B1 publication Critical patent/EP1382038B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Definitions

  • the present invention relates to the field of audio coding and in particular to methods and devices for embedding a watermark in an audio signal.
  • Modern audio coding methods process discrete-time audio samples to provide a bit stream that is compressed relative to the original audio signal.
  • the stream of discrete-time audio samples is first windowed to generate successive blocks of windowed audio samples from the stream of audio samples. Further processing takes place in blocks.
  • a block of audio samples generated by windowing is typically converted into a spectral representation by means of an analysis filter bank.
  • the spectral representation comprises spectral values lying next to one another from frequency 0 to the maximum audio frequency, which can be, for example, 16 kHz.
  • the audio spectral values are grouped and quantized in scale factor bands. The quantization takes place in such a way that the quantization noise introduced by the quantization is dimensioned such that it is masked by the audio signal.
  • a psychoacoustic model which, on the basis of the audio signal, supplies an energy value for each scale factor band, which indicates the energy level up to which quantization noise is masked, ie it will not be audible in the decoded audio signal. If, on the other hand, the quantization noise introduced by the quantizer lies above the psychoacoustic masking threshold, the re-decoded audio signal will contain audible interference.
  • the quantizer levels of the quantizer are dependent on the masking threshold calculated. When the quantization levels are calculated, the audio spectral values are quantized using these quantization levels to obtain quantized audio spectral values. For data efficiency reasons, the quantized audio spectral values of an entropy coding, such as B.
  • Huffman coding to provide a bit stream with code words that represent the audio spectral values.
  • page information is added to the stream of code words, which includes, among other things, the scale factors on the basis of which an audio decoder can determine the quantization levels that have been used in the encoder.
  • the bit stream including side information is split up into code words on the one hand and side information on the other using a bit stream demultiplexer.
  • the entropy coding is first undone. Then the entropy decoded, values quantized audio spectral values, an inverse quantization that is subjected to inversely quantized spectral values ⁇ to get. These are then converted from the frequency domain to the time domain using a synthesis filter bank. The decoded audio signal is present at the output of the synthesis filter bank.
  • the psychoacoustic masking threshold of an audio signal section depends on the actual input audio signal. If the audio signal changes over time, the masking properties also change over time. For reasons of data efficiency, it is preferred to always introduce as much quantization noise into the audio signal as possible, ie the quantization noise should correspond as closely as possible to the psychoacoustic masking threshold. Audio signal sections with good masking properties can therefore be encoded with a relatively low bit cost, while on the other hand audio signal sections with relatively poor masking properties, such as. B. tonal audio signal sections, must be quantized very finely, which in turn means that a large number of bits must be used to encode these audio signal sections.
  • bit savings bank function is usually used.
  • the bit savings bank is filled when easy-to-encode audio sections are encoded such that bits that are not needed to encode these easy-to-encode sections are not simply "wasted” by more subtle than necessary quantization, but nevertheless a coarser quantization is used and the surplus bits are "inserted" into the bit savings bank.
  • bit savings bank function thus acts as a buffer
  • This method also has the advantage of high audio quality, since the quantization noise and the watermark noise can be matched to one another if the energy introduced into the audio signal by the watermark is below the psychoacoustic masking threshold lies.
  • the method is also characterized by a high level of robustness, since the watermark cannot be removed from the re-decoded audio signal, for example by an illegal distributor of the audio signal, without impairing the audio quality.
  • a disadvantage of the described method is the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
  • Another watermarking method is to embed the watermark during the compression of the audio signal. This concept is described in the specialist publication "Combined Compression / Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer and Jürgen Herre, 110th AES Convention, May 12-15, 2001, Amsterdam, Preprint 5344.
  • First, an uncompressed audio signal is fed to a psychoacoustic model in order to determine the masking threshold.
  • the audio signal is then transformed into the frequency domain.
  • the spread, spectrally represented watermark signal is weighted based on the masking threshold in the frequency domain and added to the spectrum of the input audio signal.
  • the parameters for the quantization are determined on the basis of the masking threshold, whereupon the watermarked signal is quantized and encoded.
  • This method is also characterized by a low level of computational complexity, since certain operations, such as e.g. B. the calculation of the masking model and the conversion of the audio signal into a spectral representation only have to be carried out once.
  • the method usually also provides one good audio quality, since quantization noise and watermark noise can be coordinated.
  • a disadvantage of this method is also the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is again due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
  • the spread watermark signal is also characterized by a large number of spectral lines. However, so that the watermark does not lead to audible interference in the decoded audio signal, the height of the watermark spectral lines is significantly less than the height of the audio signal spectral lines.
  • the combined spectrum is only slightly changed compared to the original spectrum. The subsequent quantization of the combined spectrum will always remove the watermark without replacement if the quantization step size is greater than the height of the watermark spectral lines that are quantized with this quantizer step size. If too many watermark spectral lines are "quantized away" by the subsequent quantization, the watermark detector can no longer extract a clear watermark.
  • the object of the present invention is to provide an improved concept for embedding a watermark in an audio signal which on the one hand provides good audio quality and on the other hand also ensures good watermark detectability.
  • This object is achieved by a method for embedding a watermark in an audio signal according to claim 1 or by a device for embedding a watermark in an audio signal according to claim 16.
  • the present invention is based on the finding that better watermark detectability is achieved if the fact that the audio signal including the watermark is subjected to quantization is taken into account in the watermark embedding.
  • a watermark will only be detectable if a spectral line, which represents the watermark and audio signal, falls through the watermark into a different quantization level than if no watermark is embedded. Only in this case will a watermark detector, which only receives quantized information, be able to detect a watermark.
  • the spectral representation of the watermark signal is therefore processed in such a way that it is ensured that the watermark signal processed by the processing step is designed in such a way that it will still be present after quantization.
  • a predetermined watermark starting value is selected, which depends on the spectral representation of the watermark signal.
  • the watermark must not lead to any or only a very slight interference in the audio signal.
  • a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal is determined, but in which the conditions after a quantization of the spectral representation of the audio signal can be used. On the one hand, this makes it possible to see whether some of the watermark remains after quantization.
  • the watermark initial value error is greater than a predetermined Storungsschwelle
  • the watermark initial value is changed until the system introduced by a modified watermark initial value in the spectral representation after quantization error less than or equal to the Restaurant ⁇ voted fault threshold is.
  • the resulting changed watermark starting value is then combined with the audio signal in order to obtain the watermarked audio signal in which the watermark is embedded.
  • An advantage of the present invention is that ratios that ultimately do not correspond to the initial ratios are no longer taken into account, namely the audio signal / watermark ratios before the quantization, but that the watermark z. B. iteratively changed until a desired watermark "interference energy" is found.
  • the conditions after the quantizer are now taken into account, i. H. the ratios that are relevant for the audio signal decoder and for the watermark extractor.
  • the watermark energy has usually been set in the prior art in such a way that the watermark energy is less than or equal to the psychoacoustic masking threshold, the unpredictability of what happens to the watermark signal during quantization still remains.
  • the case could occur that the watermark is quantized away, which means that no watermark or only a very weak watermark could be extracted in the decoded signal.
  • the case could also arise that, although the watermark What has been important is that it is below the masking threshold, yet noise has been introduced that was audible in the decoded signal.
  • the method according to the invention has the advantage that for cases in which good detectability is particularly important, certain - tolerable - disturbances are deliberately introduced into the audio signal in favor of a higher watermark detectability, while in other cases in which the watermarks -Detectability does not have to be ensured at all times under all circumstances, compromises with regard to watermark detectability can be made in order to meet the highest audio quality requirements.
  • the watermark signal is added to the audio signal prior to quantization to obtain a combined signal.
  • the combined signal is then quantized and again inversely quantized and compared with the original audio signal. The comparison determines whether the interference introduced by the watermark is tolerable. If it is determined that the disturbance is not tolerable, the spectrum of the watermark signal is weighted iteratively using certain strategies in order then to carry out quantization and inverse quantization again until it is determined that the disturbance is now tolerable.
  • the watermark spectrum obtained by this processing is then added to the original audio spectrum.
  • the added or combined signal is then quantized, entropy-encoded and provided with side information to obtain an audio bit stream in which the watermark is present.
  • the original audio signal is quantized.
  • a quantized watermark is added to the audio signal to obtain the combined signal.
  • the combined signal is then no longer quantized again, as in the first exemplary embodiment, but is directly entropy-coded.
  • the "quantized" watermark signal added to the quantized audio signal is set in such a way that on the one hand the requirement for tolerable interference is met and on the other hand a desired watermark detectability is achieved.
  • FIG. 1 shows a block diagram of an inventive device for embedding a watermark in an audio signal
  • FIG. 2 shows a block diagram of a device according to the invention for introducing a watermark into an audio signal according to a first exemplary embodiment
  • FIG. 3 shows an inventive device for embedding a watermark in an audio signal according to a second exemplary embodiment; and 4a to 4d a schematic explanation of the line selection algorithm in the second exemplary embodiment of the present invention.
  • the device according to the invention shown in FIG. 1 comprises an audio input 10 and a watermark input 12. Both the audio signal at the audio input 10 and the watermark signal at the watermark input 12 are converted into a spectral representation by means of a device 14 or 16.
  • the spectral representation of the audio signal comprises audio spectral values, while the spectral representation of the watermark signal has watermark spectral values.
  • a device 18 for combining the audio spectral values are combined with changed watermark spectral values in order to obtain the combined audio signal in an output 20, in which the watermark is embedded.
  • a device 22 for processing the spectral representation of the watermark signal is provided depending on a psychoacoustic masking threshold supplied via an input 24.
  • the spectral representation of the watermark signal is processed depending on the psychoacoustic masking threshold obtained via the input 24 in order to obtain a processed watermark signal so that a disturbance introduced into the audio signal by the processed watermark signal is below a predetermined disturbance threshold which is different from that psychoacoustic masking threshold depends.
  • the device 22 for processing the spectral representation of the watermark signal comprises a device 26 for selecting a predetermined watermark starting value, which depends on the spectral representation of the watermark signal.
  • a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal after quantization of the spectral representation of the audio signal is detected.
  • quantization information is supplied by a device 30 for supplying quantization information.
  • the device 30 provides quantization information which depends on the original audio signal, that is to say the audio signal without a watermark.
  • a device 32 examines whether the ascertained disturbance is greater than the predetermined disturbance threshold. If not, i. H. if the disturbance is acceptable, the watermark start value is fed directly to the device 18 for combining. If this is the case, however. H. if the introduced interference is too great or different than desired, a device 34 for changing the watermark start value is activated until the interference introduced by a changed watermark start value in the spectral representation of the audio signal after quantization is less than or equal to the predetermined one Interference threshold is.
  • the loop sketched in the processing device 22 may have to be iterated several times in order to at some point obtain a changed watermark starting value at the output of the device 32, which is used as a processed watermark signal and fed to the combining device 18 in order to to receive the audio signal at the output 20 in which the watermark is embedded.
  • the combination is carried out by means of an addition 18 before the quantization.
  • the device 28 for determining the initial value introduced into the audio signal by the block watermark weighting 26 is determined by first quantizing and inversely quantizing the combined signal in a quantizer / inverse quantizer device 28a.
  • the disturbance introduced by the watermark is then calculated in a device 28b, for example by forming the difference and squaring the difference values, and then in the device 32 with the psy- choacoustic masking threshold 24 compared. If the disturbance is too great, the device 34, which is labeled "weight control" in FIG. 2, is actuated in order to supply changed weighting factors to the block 26, in order then to change the weighted spectrum of watermarks in the device 18 with the original audio signal in to combine spectral representation and to go through the iteration loop again.
  • the watermark spectrum with a watermark spectrum weighted equally for all spectral lines as the initial watermark value.
  • the weighting factor for each spectral line is therefore equal to a constant for all spectral lines, which is chosen such that the watermark energy lies above the masking threshold. Then the watermark energy is gradually reduced in order to then "iterate" the energy of the watermark below the masking threshold.
  • the device 34 is designed to control the weighting factors in order to reduce all weighting factors, e.g. B. cut in half. If the disturbance is then still too large, all current weighting factors could be halved again in a next iteration step, etc. This can continue until the device 32 determines that the disturbance is now OK.
  • the spectrally represented watermark signal is thus spectrally weighted with the current weighting factors provided by block 34 by means of a weighting filter bank, which can be contained in block 26, as has been explained with reference to FIG. 2.
  • the resulting signal is added to the original audio signal.
  • the combined signal at the output of device 18 is quantized and inversely quantized and results in the signal present at the output of device 28a which is fed into device 28b in the same way as the original audio signal.
  • the device 28b now compares the original signal with the quantized and again inversely quantized signal and uses this to determine the quantization error signal which is supplied to the device 32.
  • the weighting control in block 34 is activated in order to determine new, better weighting factors.
  • the masking threshold determined by the masking model is available, which indicates how much interference in the signal is "allowed" at a certain point in the signal spectrum. If the weight control block 34 has determined optimal weighting factors with regard to the desired audio signal interference and the desired watermark detectability, ie watermark energy, the method terminates.
  • the quantized spectral values of the combination signal last determined by block 28a are then passed on to the bitstream multiplexer as a result, in order to be formed there together with the side information into an audio bitstream. 3 is discussed below in order to illustrate a device for embedding a watermark in an audio signal according to a second exemplary embodiment of the present invention. In contrast to the first exemplary embodiment shown in FIG.
  • this combination 18 in FIG. 3 takes place in the "quantization range", ie it becomes a quantized audio signal with a combined quantized watermark.
  • This can be achieved either by using a quantizer 42 to calculate the quantizer stages by quantizing the original audio signal, or by extracting the quantizer stages from a coded audio signal.
  • means 40a for calculating the quantized audio signal minus a predetermined number of n quantization levels and means 40b for calculating the quantized audio signal plus a predetermined number of n quantization levels are operated.
  • a so-called “maximum” watermark is first calculated as a predetermined watermark starting value by means of a device 36. To calculate the predetermined maximum watermark, only the signs of the watermark spectrum are used. If the watermark spectrum has a positive sign, the corresponding spectral value of the original quantized audio signal is increased by n quantization levels, n being an integer greater than or is 1.
  • the sign of a watermark spectral value is negative
  • the corresponding quantized spectral value ie the spectral value of the audio signal at the same frequency as the spectral value of the watermark signal whose sign is currently being viewed
  • n quantization levels are reduced by n quantization levels.
  • a device 38 that implements a line selection algorithm is provided.
  • the device 38 determines the interference introduced into the audio signal by the maximum watermark provided by the device 36. If the disturbance is greater than the predetermined disturbance threshold, the device 38 changes the "maximum" watermark by selecting individual lines until the disturbance introduced by the watermark is less than or equal to the predetermined disturbance threshold. If this condition is fulfilled, the watermark, which is already in quantized form, and the quantized original audio signal are fed to the adder 18 in order to obtain the quantized watermarked audio signal on the output side.
  • 4a shows, by way of example, a quantized audio signal which, because of the clarity of the illustration, only shows three spectral values 50a-50c.
  • an audio spectrum has e.g. B. 1024 spectral values.
  • the number of non-zero quantized spectral values depends on how many audio spectral values have been quantized to zero. Of course, the quantized audio spectral values have different heights in the real case.
  • 4b shows an audio spectrum with plus or minus n quantization levels (depending on the sign of the watermark spectral values).
  • the spectral component of the watermark corresponding to the audio spectral value 50a of FIG. 4a has a negative sign for the example shown in FIG. 4b.
  • the spectral component of the watermark, which corresponds to the audio spectral value 50b of FIG. 4a, has a positive sign in the example shown in FIG. 4b, while the third spectral component of the watermark again had a negative sign.
  • the amount of the watermark spectral components is initially irrelevant, since it is assumed that watermark detection is already possible if the quantized audio spectral values 50a-50c are changed by the watermark.
  • the maximum watermark which is determined by the device 36 from FIG. 3, is shown in FIG. 4c for the case shown in FIG. 4b. It has a spectrum that is characterized in that each quantized original audio spectral value is changed by a quantization level, either enlarged if the watermark has a positive sign, or decreased if the watermark had a negative sign.
  • the amount of a watermark spectral line could be taken into account in such a way that not only is incremented or decremented by one quantization level, but that is incremented or decremented by several quantization levels if the amount of Watermark spectral line is correspondingly large.
  • the function of the device 38 from FIG. 3 will now be described with reference to FIG. 4d.
  • the facility 38 If the left quantized audio spectral component 50a is reduced by a quantization level, as is represented by the spectral component 50a ', the situation is such that the situation is such that the interference introduced by the watermark is too large, as is represented by the spectral component 50a', this becomes the spectral component not selected by the device 38, which is so noticeable in the changed watermark spectral values after the line selection that the changed watermark has a spectral line of 0 at this point.
  • the quantized audio spectral values are now based on the watermark signal, ie using the sign of the watermark signal by z. B. plus or minus changed a quantization level.
  • This procedure has advantages in that computing time can be saved since the quantization and inverse quantization (device 28a of FIG. 2) and the weighting of the watermark (device 26 of FIG. 2) can be omitted without replacement.
  • the maximum watermark (FIG. 4c) is determined line by line on the basis of the audio spectra already precalculated, ie the original spectrum and the original spectrum minus n quantization levels or the original spectrum plus n quantization levels. This results as the difference between the original spectrum (FIG. 4a) and the audio spectrum changed by a number of n quantization levels (FIG. 4b), the difference having the same sign as the unweighted watermark.
  • the line selection algorithm which is executed in the device 38, takes into account the amount of the unweighted watermark spectral lines, the masking threshold 24 and possibly a bit savings bank function 44 of the audio encoder.
  • the lines of the maximum watermark in such a way that the watermark spreading band signal is embedded in a broadband manner, i. H. that as many lines of the quantized audio signal as possible are changed.
  • the structure of the watermark should be changed as little as possible within a frequency band.
  • bit savings bank function which can provide additional bits to later signal blocks, as has been carried out.
  • the line selection strategy is preferably adapted to the fill level of the bit savings bank, so as to allow, for example, when the bit savings bank is filled, that even quantized audio spectral values of the original audio signal that have the value 0 are watermarked, which would normally not be permitted due to the bit requirement , This can noticeably improve watermark detection.
  • the original values are also available after the transformation into the frequency range.
  • the quantization of the original audio spectral values can also be seen as a kind of watermark embedding, since a certain disturbance of the audio spectrum results in both the quantization and the addition of a watermark signal. Due to its random nature, the disturbance introduced by the quantization should not be regarded as a watermark. However, if the introduced disturbance is correct with the watermark due to the quantization, the quantization noise supports the detectability of the watermark. The following cases result from this.
  • the watermark is introduced with the correct sign.
  • the device 38 of FIG. 3 is preferably arranged such that, due to the fact that the quantization is already in phase with the watermark spectral value for one certain frequency a disturbance has been introduced, arranged to dispense with the introduction of another watermark disturbance.
  • a quantization level could be added to further improve the detectability.
  • the psychoacoustic masking threshold is not calculated line by line, but by scale factor band. This means that energies of individual spectral lines are not considered, but the total energies z. B. 20 spectral lines in a scale factor band. However, in a scale factor band in which many watermark spectral lines are tolerable, a few lines in the sense of good audio quality can be dispensed with without the watermark detectability suffering significantly.
  • This functionality can also be achieved in the exemplary embodiment shown in FIG. 2 in that the weighting control 34 of FIG.
  • the concept according to the invention is such that a spectrally represented watermark signal is first generated. This is weighted using weighting factors. The weighted signal is added to the original audio signal, which is available in a spectral representation. Alternatively, a change in the lines of the original audio signal, which is available in a spectral representation, is carried out on the basis of the watermark signal. The disturbance introduced after the quantization is then determined, the disturbance being determined by quantizing, inverse quantizing and forming the difference from the original, or the disturbance being pre-calculated.
  • new weighting factors are determined, using the masking threshold, using a line selection strategy, or using a line selection strategy in particular in such a way that the sign and amount of the spectral lines of the unweighted watermark are used, and that the sum of the watermark line and the original spectral line is such it is determined that this new spectral line falls within a different quantization interval than the original spectral line.
  • the concept according to the invention is advantageous in that it can be used both for bitstream watermarking methods and for methods which carry out audio coding and watermark embedding in one step. Another advantage of the concept according to the invention is that full control over the introduced disturbance can be achieved. This makes it possible to specifically set the method in favor of optimal watermark detection or optimal audio quality.
  • Another advantage of the concept according to the invention is full control over the frequency distribution of the watermark spreading band signal into the audio signal.

Description

Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
Beschreibung
Die vorliegende Erfindung bezieht sich auf das Gebiet der Audiocodierung und insbesondere auf Verfahren und Vorrichtungen zum Einbetten eines Wasserzeichens in ein Audiosig- nal.
Moderne Audiocodierverfahren verarbeiten zeitdiskrete Audio-Abtastwerte, um einen Bitstrom zu liefern, der gegenüber dem ursprünglichen Audiosignal komprimiert ist. Der Strom von zeitdiskreten Audio-Abtastwerten wird zunächst gefenstert, um aus dem Strom von Audio-Abtastwerten aufeinanderfolgende Blöcke von gefensterten Audio-Abtastwerten zu erzeugen. Die weitere Verarbeitung findet blockweise statt. Ein durch Fensterung erzeugter Block von Audio-Abtastwerten wird typischerweise mittels einer Analyse-Filterbank in eine spektrale Darstellung umgesetzt. Die spektrale Darstellung umfaßt frequenzmäßig nebeneinanderliegende Spektralwerte von der Frequenz 0 bis zur maximalen Audio-Frequenz, welche beispielsweise bei 16 kHz liegen kann. Die Audio- Spektralwerte werden in Skalenfaktorbändern gruppiert und quantisiert. Die Quantisierung findet derart statt, daß das durch die Quantisierung eingeführte Quantisierungsrauschen derart dimensioniert ist, daß es von dem Audiosignal maskiert wird. Hierzu wird ein psychoakustisches Modell einge- setzt, das auf der Basis des Audiosignals für jedes Skalen- faktorband einen Energiewert liefert, der angibt, bis zu welchem Energiepegel Quantisierungsrauschen maskiert wird, d. h. im wieder decodierten Audiosignal nicht hörbar sein wird. Liegt das durch den Quantisierer eingeführte Quanti- sierungsrauschen dagegen oberhalb der psychoakustischen Maskierungsschwelle, so wird das wieder decodierte Audiosignal hörbare Störungen enthalten. Die Quantisierungsstufen des Quantisierers werden abhängig von der Maskierungs- schwelle berechnet. Wenn die Quantisierungsstufen berechnet sind, werden die Audio-Spektralwerte anhand dieser Quantisierungsstufen quantisiert, um quantisierte Audio- Spektralwerte zu erhalten. Aus Dateneffizienzgründen werden die quantisierten Audiospektralwerte einer Entropie- Codierung, wie z. B. eine Huffman-Codierung, unterzogen, um einen Bitstrom mit Codeworten zu liefern, die die Audiospektralwerte darstellen. Mittels eines Bitstrom- Multiplexers werden dem Strom von Codeworten Seiteninforma- tionen hinzugefügt, welche unter anderem die Skalenfaktoren umfassen, auf deren Basis ein Audio-Decodierer die Quantisierungsstufen ermitteln kann, die im Codierer verwendet worden sind.
Zur Audio-Decodierung wird der Bitstrom samt Seiteninformationen mittels eines Bitstrom-Demultiplexers in einerseits Codewörter und andererseits Seiteninformationen aufgesplit- tet. Zunächst wird die Entropie-Codierung rückgängig gemacht. Anschließend werden die Entropie-decodierten Werte, d. h. die quantisierten Audio-Spektralwerte, einer inversen Quantisierung unterzogen, um invers quantisierte Spektral¬ werte zu erhalten. Diese werden dann mittels einer Synthese-Filterbank vom Frequenzbereich in den Zeitbereich umgesetzt. Am Ausgang der Synthese-Filterbank liegt das wieder decodierte Audiosignal vor.
Es sei darauf hingewiesen, daß es sich hierbei um ein verlustbehaftetes Codierverfahren handelt, da im Codierer eine Quantisierung vorgenommen worden ist. Das wieder decodierte Audiosignal entspricht nicht exakt dem ursprünglichen Audiosignal. Wenn die Codierung und Decodierung erfolgreich war, wird jedoch der subjektive Höreindruck des decodierten Audiosignals dem subjektiven Höreindruck des ursprünglichen Audiosignals entsprechen, da das durch den Quantisierer im Codierer eingeführte Quantisierungsrauschen wegmaskiert wird, d. h. es wird unterhalb der psychoakustischen Maskierungsschwelle "versteckt". Aus Dateneffizienzgründen wird es bevorzugt, möglichst große Quantisierungsschritte zu verwenden. Andererseits führen zu große Quantisierungsschritte zu einem zu großen Quantisierungsrauschen, das sich im wieder decodierten Signal als hörbare Störung äußern kann. Moderne Audiocodierverfahren versuchen einen optimalen Kompromiß zwischen diesen beiden Forderungen zu erreichen.
Die psychoakustische Maskierungsschwelle eines Audiosignal- abschnitts hängt von dem tatsächlichen Eingangs-Audiosignal ab. Ändert sich das Audiosignal über der Zeit, so ändern sich auch die Maskierungseigenschaften über der Zeit. Aus Dateneffizienzgründen wird es bevorzugt, immer so viel Quantisierungsrauschen in das Audiosignal einzuführen, wie möglich ist, d. h. das Quantisierungsrauschen sollte möglichst gut der psychoakustischen Maskierungsschwelle entsprechen. Audiosignalabschnitte mit guten Maskierungseigenschaften können daher mit einem relativ geringen Bitaufwand codiert werden, während andererseits Audiosignalabschnitte mit relativ schlechten Maskierungseigenschaften, wie z. B. tonale Audiosignalabschnitte, sehr fein quantisiert werden müssen, was wiederum bedeutet, daß zur Codierung dieser Audiosignalabschnitte eine große Anzahl von Bits aufgewendet werden muß. Ein Codierer, der versucht, immer genau die Menge an Störung einzuführen, die durch die Maskierungsschwelle gegeben wird, wird daher ein Audiosignal mit konstanter Qualität erzeugen. Aufgrund des zeitlich variierenden Wesens des Eingangssignals führt dies jedoch am Ausgang des Codierers zu einer variablen Bitrate. Obgleich ein Co- dieren mit konstanter Qualität - und damit mit variabler Bitrate - aus Dateneffizienz-Gründen einerseits und Audio- qualitäts-Gründen andererseits attraktiv ist, ist dieses Konzept dahingehend nachteilig, daß es nur für Anwendungen geeignet, die eine variable Übertragungsrate unterstützen, wie z. B. die Speicherung von komprimierten Audiosignalen oder die Übertragung von komprimierten Audiosignalen über Paket-basierte Netze, wie z. B. das Internet. Viele Anwendungen fordern jedoch einen Audiocodierer mit einer konstanten Übertragungsrate. Aufgrund der zeitlich variierenden spektralen und zeitlichen Eigenschaften eines Audiosignals führt dies unweigerlich zu einer variablen Qualität. Insbesondere kann je nach Bitrate der Fall entstehen, in dem Abschnitte des Audiosignals, die relativ geringe Maskierungseigenschaften haben, nicht ausreichend fein quantisiert werden können, d. h. unter-codiert werden und im decodierten Signal unter Umständen hörbare Störungen enthalten, während andererseits leicht zu codierende Segmente, d. h. Audiosignalabschnitt mit guten Maskierungseigenschaften, genauer als nötig codiert werden müssen, d. h. über-codiert werden.
Um die Nachteile des Über-Codierens und Unter-Codierens zu überwinden, wird üblicherweise eine Bitsparkassenfunktion eingesetzt. Die Bitsparkasse wird gefüllt, wenn leicht zu codierende Audioabschnitte codiert werden, derart, daß Bits, die nicht benötigt werden, um diese leicht zu codie- renden Abschnitte zu codieren, nicht einfach durch eine feiner als nötige Quantisierung "verschwendet" werden, sondern daß dennoch eine gröbere Quantisierung verwendet wird und die überzähligen Bits in die Bitsparkasse "gesteckt" werden.
Kommen dagegen Audioabschnitte vor, die schwer zu codieren sind, d. h. bei denen eine geringere Quantisiererschritt- weite eingesetzt werden muß als eigentlich durch die geforderte konstante mittlere Datenrate möglich ist, so wird zu diesem Zweck die Bitsparkasse "geleert", um trotz der ge¬ forderten Datenrate eine feinere Quantisierung als eigent¬ lich möglich einzusetzen, so daß im decodierten Audiosignal auch in diesen Abschnitten keine hörbare Störung enthalten ist. Die Bitsparkassenfunktion fungiert somit als Puffer,
nach "außen" einen Audiocodierer mit konstanter Bitrate zu machen. Heutzutage entwickelt sich die Musikverteilung beispielsweise über das Internet zu einer zunehmend wichtigeren Technologie. Der meiste Musikinhalt ist komprimiert, um Speicherplatz zu sparen und die Übertragung über Übertra- gungskanäle mit begrenzter Bandbreite zu beschleunigen. Das Überwachen der Verwendung der in Übertragungsnetzen verteilten Musikstücke oder das Verfolgen von illegalen Kopien derselben wird jedoch zu einem immer größeren Problem. Während einerseits eine breite Verteilung von Audiostücken wünschenswert ist, müssen dennoch Urheberrechte respektiert werden. In diesem Zusammenhang stellt die "Wasserzeichentechnik" (Watermarking) einen nützlichen Mechanismus dar, um solche illegalen Kopien zu verfolgen, oder um Urheberrechts-Informationen oder allgemein das geistige Eigentum an den Stücken im Audiosignal unterzubringen.
Das Einbringen von Wasserzeichen in nicht-komprimierte Multimediadaten, wie z. B. Bildern, Video, Audio usw. ist bekannt. Um Wasserzeichen in komprimiertes Material einzu- bringen, wird jedoch ein schnelles, Qualitäts-bewahrendes Wasserzeichenverfahren benötigt.
Die Fachveröffentlichung "Audio Watermarking of MPEG-2-AAC Bit Streams", Christian Neubauer, Jürgen Herre, 108. AES Convention, Paris 2000, Preprint 5101 lehrt zunächst, eine spektrale Darstellung eines Audiosignals zu erzeugen. Zu dieser wird dann ein gespreiztes und spektral transformiertes Wasserzeichensignal addiert. Aus dem Summensignal wird durch Quantisierung und Huffman-Codierung ein neuer Bit- ström erzeugt. Dieses sogenannte Bitstrom- Wasserzeichenverfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da keine volle Decodierung des mit einem Wasserzeichen zu versehenden Bitstroms erfolgen muß. Weiterhin hat dieses Verfahren den Vorteil der hohen Audio- qualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch aufeinander abgestimmt werden können, wenn die durch das Wasserzeichen in das Audiosignal eingeführte E- nergie unterhalb der psychoakustischen Maskierungsschwelle liegt. Das Verfahren zeichnet sich ferner durch eine hohe Robustheit aus, da das Wasserzeichen nicht aus dem wieder decodierten Audiosignal beispielsweise durch einen illegalen Verbreiter des Audiosignals entfernt werden kann, ohne die Audioqualität zu beeinträchtigen.
Nachteilig an dem beschriebenen Verfahren ist jedoch die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.
Ein weiteres Wasserzeichenverfahren ist die Einbettung des Wasserzeichens während der Komprimierung des Audiosignals. Dieses Konzept ist in der Fachveröffentlichung "Combined Compression/Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer und Jürgen Herre, 110. AES Convention, 12. bis 15 Mai 2001, Amsterdam, Preprint 5344, beschrieben. Zunächst wird ein unkomprimiertes Audiosignal einem psychoakustischen Modell zugeführt, um die Maskie- rungsschwelle zu bestimmen. Hierauf wird das Audiosignal in den Frequenzbereich transformiert. Das gespreizte, spektral repräsentierte Wasserzeichensignal wird anhand der Maskierungsschwelle im Frequenzbereich gewichtet und zum Spektrum des Eingangsaudiosignals addiert. Anhand der Maskierungs- schwelle werden die Parameter für die Quantisierung ermittelt, woraufhin das Wasserzeichen-beaufschlagte Signal quantisiert und codiert wird. Auch dieses Verfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z. B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in eine spektrale Darstellung, nur einmal durchgeführt werden müssen. Das Verfahren liefert ferner üblicherweise eine gute Audioqualität, da Quantisierungsgeräusch und Wasserzeichengeräusch aufeinander abgestimmt werden können.
Nachteilig an diesem Verfahren ist jedoch ebenfalls die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist wieder darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.
Wenn die spektrale Darstellung des Audiosignals betrachtet wird, so ist eine Vielzahl von Audiospektralwerten zu sehen. Das gespreizte Wasserzeichensignal ist ebenfalls durch eine Vielzahl von Spektrallinien gekennzeichnet. Damit das Wasserzeichen jedoch nicht zu hörbaren Störungen im wieder decodierten Audiosignal führt, ist die Höhe der Wasserzei- chen-Spektrallinien wesentlich geringer als die Höhe der Audiosignal-Spektrallinien. Nach einer Addition des Wasserzeichen-Spektrums zum Audio-Spektrum ist das kombinierte Spektrum nur leicht gegenüber dem ursprünglichen Spektrum verändert. Die dann folgende Quantisierung des kombinierten Spektrums wird das Wasserzeichen immer dann ersatzlos entfernen, wenn die Quantisierungs-Schrittweite größer ist als die Höhe der Wasserzeichen-Spektrallinien, die mit dieser Quantisiererschrittweite quantisiert werden. Werden zu viele Wasserzeichen-Spektrallinien durch das darauffolgende Quantisieren "wegquantisiert", so kann der Wasserzeichendetektor kein eindeutiges Wasserzeichen mehr extrahieren.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Einbetten eines Wasserzeichens in ein Audiosignal zu schaffen, das einerseits eine gute Audioqualität liefert, und das andererseits auch eine gute Wasserzeichen-Detektierbarkeit sicherstellt . Diese Aufgabe wird durch ein Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 1 oder durch eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 16 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine bessere Wasserzeichendetektierbarkeit erreicht wird, wenn bei der Wasserzeicheneinbettung die Tatsache berücksichtigt wird, daß das Audiosignal samt Wasserzeichen einer Quantisierung unterzogen wird. Ein Wasserzeichen wird nur dann detektierbar sein, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, durch das Wasserzeichen in eine andere Quantisierungsstufe fällt als wenn kein Wasserzeichen eingebettet wird. Nur in diesem Fall wird ein Wasserzeichendetektor, der lediglich quantisierte Informationen erhält, ein Wasserzeichen detektieren können. In anderen Worten ausgedrückt bedeutet dies, daß dann, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, in dieselbe Quantisierungsstufe fällt wie die ent- sprechende Spektrallinie, die nur das Audiosignal darstellt, die Wasserzeicheneinbettung vergeblich war, da im quantisierten Signal kein Energieanteil, der von dem Wasserzeichen herrührt, zu sehen sein wird. Das Wasserzeichen ist wegquantisiert worden.
Erfindungsgemäß wird daher die spektrale Darstellung des Wasserzeichensignals derart verarbeitet, daß sichergestellt wird, daß das durch den Schritt des Verarbeitens verarbeitete Wasserzeichensignal so gestaltet ist, daß es auch nach einer Quantisierung noch vorhanden sein wird. Um dies zu erreichen wird ein vorbestimmter Wasserzeichen-Startwert gewählt, welcher von der spektralen Darstellung des Wasserzeichensignals abhängt. Natürlich darf das Wasserzeichen zu keiner oder nur zu einer sehr geringen Störung des Audio- Signals führen. Aus diesem Grund wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals eingeführte Störung ermittelt, bei der jedoch die Verhältnisse nach einer Quantisierung der spektralen Darstellung des Audiosignals zugrunde gelegt werden. Damit ist es einerseits möglich, zu sehen, ob nach der Quantisierung etwas vom Wasserzeichen verbleibt. Andererseits kann sichergestellt werden, daß die Störung des Wasserzeichens nach der Quantisierung so ist, wie sie sein soll. Falls die durch den Wasserzeichen-Startwert eingeführte Störung größer als eine vorbestimmte Storungsschwelle ist, wird der Wasserzeichen-Startwert so lange verändert, bis die durch einen veränderten Wasserzeichen- Startwert in die spektrale Darstellung nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbe¬ stimmten Störschwelle ist. Der dadurch erhaltene veränderte Wasserzeichen-Startwert wird dann mit dem Audiosignal kombiniert, um das Wasserzeichen-behaftete Audiosignal zu er- halten, in das das Wasserzeichen eingebettet ist.
Ein Vorteil der vorliegenden Erfindung liegt darin, daß nun nicht mehr Verhältnisse berücksichtigt werden, die letztendlich nicht den Ausgangsverhältnissen entsprechen, näm- lieh die Audiosignal/Wasserzeichen-Verhältnisse vor der Quantisierung, sondern daß das Wasserzeichen z. B. iterativ so lange verändert wird, bis eine gewünschte Wasserzeichen- "Störenergie" gefunden ist. Erfindungsgemäß werden nunmehr die Verhältnisse nach dem Quantisierer berücksichtigt, d. h. die Verhältnisse, die für den Audiosignal-Decodierer und für den Wasserzeichen-Extraktor maßgeblich sind.
Obgleich im Stand der Technik üblicherweise die Wasserzeichenenergie derart eingestellt worden ist, daß die Wasser- Zeichenenergie kleiner oder gleich der psychoakustischen Maskierungsschwelle ist, blieb dennoch die Unwägbarkeit zurück, was mit dem Wasserzeichensignal während der Quantisierung geschieht. Wie es ausgeführt worden ist, konnte zum einen der Fall auftreten, daß das Wasserzeichen wegquanti- siert wird, was dazu führt, daß im decodierten Signal kein Wasserzeichen oder nur ein sehr schwaches Wasserzeichen extrahiert werden konnte. Andererseits konnte auch der Fall auftreten, daß durch das Wasserzeichen, obwohl es so ge- wichtet worden ist, daß es unterhalb der Maskierungsschwelle liegt, dennoch Störungen eingeführt worden sind, die im decodierten Signal hörbar waren.
Erfindungsgemäß wird nunmehr aufgrund der Verarbeitung des Wasserzeichens auf der Basis der Verhältnisse nach der Quantisierung eine genaue Kontrolle erreicht. Diese Kontrolle hat den Vorteil, daß nicht nur einerseits sichergestellt werden kann, daß das Wasserzeichen zu keiner oder nur minimal hörbaren Störung führt, sondern daß gleichzeitig auch eine ausreichende Wasserzeichen-Detektierbarkeit sichergestellt wird. Andererseits liefert das erfindungsgemäße Verfahren den Vorteil, daß für Fälle, bei denen es besonders auf eine gute Detektierbarkeit ankommt, auch bewußt zugunsten einer höheren Wasserzeichen-Detektierbarkeit gewisse - tolerierbare - Störungen in das Audiosignal eingeführt werden, während in anderen Fällen, bei denen die Wasserzeichen-Detektierbarkeit nicht unter allen Umständen zu jedem Zeitpunkt sichergestellt werden muß, Kompromisse hin- sichtlich der Wasserzeichen-Detektierbarkeit eingegangen werden können, um höchste Audioqualitäts-Ansprüche zu erfüllen.
Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird das Wasserzeichensignal vor der Quantisierung dem Audiosignal hinzugefügt, um ein kombiniertes Signal zu erhalten. Das kombinierte Signal wird dann quanti- siert und wieder invers quantisiert und mit dem ursprünglichen Audiosignal verglichen. Aus dem Vergleich wird be- stimmt, ob die durch das Wasserzeichen eingeführte Störung tolerabel ist. Wird festgestellt, daß die Störung nicht to- lerabel ist, so wird das Spektrum des Wasserzeichensignals iterativ unter Verwendung bestimmter Strategien gewichtet, um dann wieder eine Quantisierung und inverse Quantisierung durchzuführen, bis festgestellt wird, daß die Störung nun tolerabel ist. Das durch diese Verarbeitung erhaltene Wasserzeichen-Spektrum wird dann dem ursprünglichen Audiospektrum hinzuaddiert. Das addierte bzw. kombinierte Signal wird dann quantisiert, Entropie-codiert und mit Seiteninformationen versehen, um einen Audiobitstrom zu erhalten, in dem das Wasserzeichen vorhanden ist.
Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung wird das ursprüngliche Audiosignal quantisiert. Dem Audiosignal wird ein quantisiertes Wasserzeichen hinzuaddiert, um das kombinierte Signal zu erhalten. Das kombinierte Signal wird dann nicht mehr, wie beim ersten Ausfüh- rungsbeispiel, noch einmal quantisiert, sondern unmittelbar Entropie-codiert. Das dem quantisierten Audiosignal hinzugefügte "quantisierte" Wasserzeichensignal wird hierbei derart eingestellt, daß einerseits die Forderung nach tole- rabler Störung erfüllt ist und andererseits eine erwünschte Wasserzeichen-Detektierbarkeit erreicht wird.
Unabhängig davon, ob das kombinierte Signal noch quantisiert wird, oder ob das kombinierte Signal bereits in quan- tisierter Form vorliegt, wird gemäß der vorliegenden Erfin- düng eine genaue Steuerung der durch das Wasserzeichen eingeführten Störung in das auf dem Signal erreicht.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal;
Fig. 2 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbringen eines Wasserzeichens in ein Audiosignal gemäß einem ersten Ausführungsbeispiel;
Fig. 3 eine erfindungsgemäße Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel; und Fig. 4a bis 4d eine schematische Erläuterung des Liniense- lektions-Algorithmus beim zweiten Ausführungsbeispiel der vorliegenden Erfindung.
Die in Fig. 1 gezeigte erfindungsgemäße Vorrichtung umfaßt einen Audioeingang 10 und einen Wasserzeicheneingang 12. Sowohl das Audiosignal an dem Audioeingang 10 als auch das Wasserzeichensignal an dem Wasserzeicheneingang 12 werden mittels einer Einrichtung 14 bzw. 16 in eine spektrale Darstellung überführt. Die spektrale Darstellung des Audiosignals umfaßt Audiospektralwerte, während die spektrale Darstellung des Wasserzeichensignals Wasserzeichenspektralwerte aufweist. In einer Einrichtung 18 zum Kombinieren werden die Audiospektralwerte mit veränderten Wasserzeichen- Spektralwerten kombiniert, um an einem Ausgang 20 das kombinierte Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist. Erfindungsgemäß ist hierzu eine Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Was- serzeichensignals abhängig von einer über einen Eingang 24 gelieferten psychoakustischen Maskierungsschwelle vorgesehen. Die spektrale Darstellung des Wasserzeichensignals wird abhängig von der über den Eingang 24 erhaltenen psychoakustischen Maskierungsschwelle verarbeitet, um ein ver- arbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingeführte Störung unter einer vorbestimmten Störungs- schwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt.
Hierzu umfaßt die Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Wasserzeichensignals eine Einrichtung 26 zum Wählen eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt. In einer Einrichtung 28 wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführte Störung ermit- telt. Hierzu werden von einer Einrichtung 30 zum Liefern von Quantisierungsinformationen Quantisierungsinformationen zugeführt. Die Einrichtung 30 liefert Quantisierungsinformationen, die von dem ursprünglichen Audiosignal, also dem Audiosignal ohne Wasserzeichen, abhängen.
In einer Einrichtung 32 wird untersucht, ob die ermittelte Störung größer als die vorbestimmte Störschwelle ist. Ist dies nicht der Fall, d. h. ist die Störung akzeptabel, so wird der Wasserzeichen-Startwert unmittelbar der Einrichtung 18 zum Kombinieren zugeführt. Ist dies dagegen der Fall, d. h. ist die eingeführte Störung zu groß, bzw. anders als gewünscht, so wird eine Einrichtung 34 zum Verändern des Wasserzeichen-Startwerts aktiviert, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Zu diesem Zweck muß die in der Einrichtung 22 zum Verarbeiten skizzierte Schleife möglicherweise mehrmals iterativ durchlaufen werden, um irgendwann am Ausgang der Einrichtung 32 einen veränderten Wasserzeichen-Startwert zu erhalten, der als verarbeitetes Wasserzeichensignal verwendet wird und der Einrichtung 18 zum Kombinieren zugeführt wird, um das Audiosignal am Ausgang 20 zu erhalten, in das das Wasserzeichen eingebettet ist.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung, das in Fig. 2 gezeigt ist, wird das Kombinieren mittels einer Addition 18 vor dem Quantisieren durchge- führt. Die Einrichtung 28 zum Ermitteln der durch den Block Wasserzeichen-Gewichtung 26 festgelegten Startwert in das Audiosignal eingeführten Störung wird dadurch ermittelt, daß zunächst in einer Quantisierer/Inversquantisierer- Einrichtung 28a das kombinierte Signal quantisiert und in- vers quantisiert wird. In einer Einrichtung 28b wird dann beispielsweise durch Differenzbilden und Quadrieren der Differenzwerte die durch das Wasserzeichen eingeführte Störung berechnet und dann in der Einrichtung 32 mit der psy- choakustischen Maskierungsschwelle 24 verglichen. Ist die Störung zu groß, wird die Einrichtung 34, die in Fig. 2 mit "Gewichtungskontrolle" bezeichnet ist, angesteuert, um dem Block 26 veränderte Gewichtungsfaktoren zuzuführen, um dann das verändert gewichtete Wasserzeichen-Spektrum in der Einrichtung 18 mit dem ursprünglichen Audiosignal in spektraler Darstellung zu kombinieren und die Iterationsschleife von neuem zu durchlaufen.
Bei dem in Fig. 2 dargestellten Ausführungsbeispiel wird es bevorzugt, als Wasserzeichen-Startwert das mit einem für alle Spektrallinien gleich gewichteten Wasserzeichen- Spektrum zu nehmen. Der Gewichtungsfaktor für jede Spektrallinie ist daher für alle Spektrallinien gleich einer Konstanten, die so gewählt ist, daß die Wasserzeichenenergie über der Maskierungsschwelle liegt. Dann wird die Wasserzeichenenergie schrittweise reduziert, um dann die Energie des Wasserzeichens unter die Maskierungsschwelle zu „i- terieren" .
Wenn also zunächst von der Einrichtung 32 festgestellt wird, daß die Störung zu groß wird, ist die Einrichtung 34 zur Kontrolle der Gewichtungsfaktoren ausgebildet, um alle Gewichtungsfaktoren zu verkleinern, z. B. zu halbieren. Wenn dann die Störung immer noch zu groß ist, könnten in einem nächsten Iterationsschritt alle aktuellen Gewichtungsfaktoren erneut halbiert werden usw. Dies kann fortgeführt werden, bis die Einrichtung 32 feststellt, daß die Störung nun in Ordnung ist.
Nachdem die Kombination von Audiosignal und verarbeitetem Wasserzeichensignal im Spektralbereich, also nicht im Quantisierungsbereich, sondern vor der Quantisierung stattfindet, muß noch eine Quantisierung durchgeführt werden. Hier- zu empfiehlt es sich, den Quantisierer-Abschnitt der Einrichtung 28a zu verwenden, um die Ausgangswerte des Quanti- siererabschnitts als Audiosignal samt eingebettetem Wasserzeichen auszugeben. Mittels einer Analyse-Synthese-Iteration, wie sie in Fig. 2 gezeigt ist, wird somit die durch das Wasserzeichen nach der Quantisierung entstandene Störung bestimmt. Somit läßt sich einerseits sicherstellen, daß auch nach der Quantisierung Wasserzeichenenergie im Signal verbleibt. Andererseits kann die tatsächlich eingebrachte Störung ermittelt werden, was zur Erzielung einer hohen Audioqualität von Vorteil ist. Das spektral dargestellte Wasserzeichensignal wird so- mit, wie es anhand von Fig. 2 ausgeführt worden ist, mittels einer Gewichtungsfilterbank, die in dem Block 26 enthalten sein kann, spektral mit den von dem Block 34 zur Verfügung gestellten aktuellen Gewichtungsfaktoren gewich- tet . Das entstehende Signal wird zu dem ursprünglichen Au- diosignal addiert. Wie es ausgeführt worden ist, wird das kombinierte Signal am Ausgang der Einrichtung 18 quantisiert und invers quantisiert und ergibt das am Ausgang der Einrichtung 28a vorliegende Signal, das in die Einrichtung 28b genauso wie das ursprüngliche Audiosignal eingespeist wird. Die Einrichtung 28b vergleicht nunmehr das Originalsignal mit dem quantisierten und wieder invers quantisierten Signal und bestimmt daraus das Quantisierungs- Fehlersignal, das der Einrichtung 32 zugeführt wird. Anhand der Einrichtung 32 wird wiederum die Gewichtungskontrolle im Block 34 angesteuert, um neue bessere Gewichtungsfaktoren zu bestimmen. Hierzu steht die von dem Maskierungsmodellen ermittelte Maskierungsschwelle zur Verfügung, die angibt, wieviel Störung in das Signal an einer bestimmten Stelle im Signalspektrum "erlaubt" ist. Wenn der Block Ge- wichtungskontrolle 34 optimale Gewichtungsfaktoren hinsichtlich auf die gewünschte Audiosignalstörung und gewünschte Wasserzeichendetektierbarkeit, d. h. Wasserzeichenenergie, ermittelt hat, bricht das Verfahren ab. Die zuletzt von dem Block 28a ermittelten quantisierten Spekt- ralwerte des Kombinationssignals werden dann als Resultat zum Bitstrommultiplexer weitergegeben, um dort mit den Seiteninformationen zusammen zu einem Audio-Bitstrom geformt zu werden. Im nachfolgenden wird auf Fig. 3 eingegangen, um eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel der vorlie- genden Erfindung darzustellen. Im Gegensatz zu dem in Fig. 2 gezeigten ersten Ausführungsbeispiel, bei dem ein nicht- quantisiertes Audiosignal mit einem nicht-quantisierten Wasserzeichensignal kombiniert wird, findet diese Kombination 18 in Fig. 3 im "Quantisierungsbereich" statt, d. h. es wird ein quantisiertes Audiosignal mit einem quantisierten Wasserzeichen kombiniert. Dies kann dadurch erreicht werden, daß entweder mittels eines Quantisierers 42 durch Quantisieren des ursprünglichen Audiosignals die Quantisie- rerstufen berechnet werden, oder daß die Quantisierungsstu- fen aus einem codierten Audiosignal extrahiert werden. Ansprechend auf die durch die Einrichtung 42 bereitgestellten Quantisierungsstufen wird eine Einrichtung 40a zum Berechnen des quantisierten Audiosignals minus einer vorbestimmten Anzahl von n Quantisierungsstufen und eine Einrichtung 40b zum Berechnen des quantisierten Audiosignals plus eine vorbestimmte Anzahl von n Quantisierungsstufen betrieben.
Im Gegensatz zu dem in Fig. 2 gezeigten Ausführungsbeispiel, bei dem für jedes kombinierte Audiosignal eine Quan- tisierungsberechnung und eine inverse Quantisierungsberechnung durch die Einrichtung 28a durchzuführen war, und zwar innerhalb der Iterationsschleife, findet dies bei dem in Fig. 3 gezeigten zweiten Ausführungsbeispiel a-priori statt, d. h. durch eine Vorberechnung außerhalb einer Ite- rationsschleife. Hierzu wird zunächst als vorbestimmter Wasserzeichen-Startwert mittels einer Einrichtung 36 ein sogenanntes "maximales" Wasserzeichen berechnet. Zur Berechnung des vorbestimmten maximalen Wasserzeichens werden zunächst nur die Vorzeichen des Wasserzeichen-Spektrums verwendet. Hat das Wasserzeichen-Spektrum ein positives Vorzeichen, so wird der entsprechende Spektralwert des ursprünglichen quantisierten Audiosignals um n Quantisierungsstufen vergrößert, wobei n eine Ganzzahl größer oder gleich 1 ist. Ist das Vorzeichen eines Wasserzeichen- Spektralwerts dagegen negativ, so wird der entsprechende quantisierte Spektralwert, d. h. der Spektralwert des Audiosignals bei derselben Frequenz wie der Spektralwert des Wasserzeichensignals, dessen Vorzeichen gerade betrachtet wird, um n Quantisierungsstufen verkleinert. Hieraus ergibt sich ein maximales Wasserzeichen, wobei der Ausdruck "maximal" dahingehend zu verstehen ist, daß das maximale Wasserzeichensignal auf jede Spektrallinie des ursprünglichen Au- diosignals nach der Quantisierung eine Auswirkung hat. Dieser Fall ist zwar hinsichtlich einer sehr guten Wasserzei- chendetektierbarkeit wünschenswert, dürfte jedoch erfahrungsgemäß zu viel Störung in das Audiosignal einführen. Um die Störung auf ein vertretbares Maß zurückzunehmen, wobei ein vertretbares Maß beispielsweise die psychoakustische Maskierungsschwelle sein kann, wird eine Einrichtung 38, die einen Linienselektionsalgorithmus implementiert, vorgesehen. Die Einrichtung 38 ermittelt die durch das von der Einrichtung 36 zur Verfügung gestellte maximale Wasserzei- chen eingeführte Störung in das Audiosignal. Falls die Störung größer als die vorbestimmte Storungsschwelle ist, wird durch die Einrichtung 38 das "maximale" Wasserzeichen durch Selektion von einzelnen Linien so lange verändert, bis die durch das Wasserzeichen eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Ist diese Bedingung erfüllt, wird das - bereits in quantisierter Form - vorliegende Wasserzeichen ebenso wie das quantisierte ursprüngliche Audiosignal dem Addierer 18 zugeführt, um aus- gangsseitig das quantisierte Wasserzeichen-behaftete Audio- signal zu erhalten.
Im nachfolgenden wird anhand der Fig. 4a bis 4d auf die Funktion und Arbeitsweise der Einrichtung 36 und 38 eingegangen. Fig. 4a zeigt beispielshalber ein quantisiertes Au- diosignal, das aufgrund der Übersichtlichkeit der Darstellung lediglich drei Spektralwerte 50a-50c darstellt. Typischerweise hat ein Audiospektrum je nach gewählter Fensterlänge und Transformation z. B. 1024 Spektralwerte. Die An- zahl der von Null verschiedenen quantisierten Spektralwerte ist abhängig davon, wie viele Audiospektralwerte auf 0 quantisiert worden sind. Selbstverständlich haben die quantisierten Audiospektralwerte im realen Fall unterschiedli- ehe Höhen. Fig. 4b zeigt nun ein mit plus bzw. minus n Quantisierungsstufen (abhängig vom Vorzeichen der Wasserzeichen-Spektralwerte) beaufschlagtes Audiospektrum. Die dem Audiospektralwert 50a von Fig. 4a entsprechende Spektralkomponente des Wasserzeichens hat für das in Fig. 4b ge- zeigte Beispiel ein negatives Vorzeichen. Die Spektralkomponente des Wasserzeichens, die dem Audiospektralwert 50b von Fig. 4a entspricht, hat bei dem in Fig. 4b gezeigten Beispiel ein positives Vorzeichen, während die dritte Spektralkomponente des Wasserzeichens wiederum ein negati- ves Vorzeichen hatte. Der Betrag der Wasserzeichen- Spektralkomponenten spielt zunächst keine Rolle, da davon ausgegangen wird, daß eine Wasserzeichendetektion bereits dann möglich ist, wenn die quantisierten Audiospektralwerte 50a-50c durch das Wasserzeichen verändert werden. Das maxi- male Wasserzeichen, das durch die Einrichtung 36 von Fig. 3 bestimmt wird, ist für den in Fig. 4b gezeigten Fall in Fig. 4c dargestellt. Es hat ein Spektrum, das sich dadurch auszeichnet, daß jeder quantisierte ursprüngliche Audiospektralwert um eine Quantisierungsstufe verändert wird, und zwar entweder vergrößert, wenn das Wasserzeichen ein positives Vorzeichen hat, oder verkleinert, wenn das Wasserzeichen ein negatives Vorzeichen hatte.
Bei dem in Fig. 4b gezeigten Beispiel könnte der Betrag ei- ner Wasserzeichen-Spektrallinie dahingehend berücksichtigt werden, daß nicht nur um eine Quantisierungsstufe inkremen- tiert bzw. dekrementiert wird, sondern daß um mehrere Quantisierungsstufen inkrementiert bzw. dekrementiert wird, wenn der Betrag der Wasserzeichen-Spektrallinie entspre- chend groß ist.
Anhand von Fig. 4d wird nunmehr die Funktion der Einrichtung 38 von Fig. 3 beschrieben. Stellt die Einrichtung 38 fest, daß für die linke quantisierte Audiospektralkomponente die Situation so ist, daß die durch das Wasserzeichen eingeführte Störung zu groß ist, wenn die linke quantisierte Audiospektralkomponente 50a um eine Quantisierungsstufe verringert wird, wie es durch die Spektralkomponente 50a' dargestellt ist, so wird diese Spektralkomponente von der Einrichtung 38 nicht selektiert, was sich in den veränderten Wasserzeichen-Spektralwerten nach der Linienselektion so bemerkbar macht, daß das veränderte Wasserzeichen an dieser Stelle eine Spektrallinie von 0 hat. Bei der mittleren und der rechten Spektralkomponente des quantisierten Audiosignals wurde dagegen festgestellt, daß die durch die Spektrallinien 50b' und 50c' eingeführten Störungen in Ordnung waren, so daß an diesen Stellen so viel Wasserzeichen- energie zu den quantisierten Audiospektralwerten hinzugefügt werden kann, daß diese um eine Quantisierungsstufe erhöht (50b') bzw. um eine Quantisierungsstufe verringert (50c') werden können.
Aus dieser Betrachtung wird deutlich, daß durch Vorberechnung der Quantisierungsstufen durch die Einrichtungen 40a und 40b der Schritt der Quantisierung und inversen Quantisierung, d. h. die Einrichtung 28a von Fig. 2, entfallen kann, da die Größe der Störung durch Veränderung des Quan- tisierungs-Index a-priori vorberechnet werden kann. Ferner ist aus Fig. 3 zu sehen, daß auch die Einrichtung 26, d. h. die Gewichtung der Wasserzeichen-Spektrallinien, entfallen ist .
Die quantisierten Audio-Spektralwerte werden nunmehr anhand des Wasserzeichensignals, d. h. anhand des Vorzeichens des Wasserzeichensignals um z. B. plus oder minus eine Quantisierungsstufe verändert. Dieses Prozedere bringt Vorteile dahingehend, daß Rechenzeit eingespart werden kann, da die Quantisierung und inverse Quantisierung (Einrichtung 28a von Fig. 2) und die Gewichtung des Wasserzeichens (Einrichtung 26 von Fig. 2) ersatzlos entfallen können. Anhand der bereits vorberechneten Audiospektren, d. h. des Originalspektrums und des Originalspektrums minus n Quantisierungsstufen oder des Originalspektrums plus n Quantisierungsstufen wird linienweise das maximale Wasserzeichen (Fig. 4c) bestimmt. Dies ergibt sich als Differenz zwischen dem Originalspektrum (Fig. 4a) und dem um eine Anzahl von n Quantisierungsstufen veränderten Audiospektrum (Fig. 4b), wobei die Differenz das gleiche Vorzeichen wie das unge- wichtete Wasserzeichen hat.
Der Linienselektions-Algorithmus, der in der Einrichtung 38 ausgeführt wird, berücksichtigt den Betrag der ungewichte- ten Wasserzeichenspektrallinien, die Maskierungsschwelle 24 und gegebenenfalls eine Bitsparkassenfunktion 44 des Audio- codierers.
Um sowohl eine gute Audioqualität als auch eine gute Was- serzeichendetektierbarkeit sicherzustellen, wird es bevorzugt, die Linien des maximalen Wasserzeichens so zu selek- tieren, daß das Wasserzeichen-Spreizbandsignal breitbandig eingebettet wird, d. h. daß möglichst viele Linien des quantisierten Audiosignals verändert werden. Weiterhin soll die Maskierungsschwelle oder, falls eine von der Maskierungsschwelle abweichende Schwelle verwendet wird, diese vorbestimmte Storungsschwelle nicht verletzt werden. Schließlich soll die Struktur des Wasserzeichens innerhalb eines Frequenzbandes möglichst wenig verändert werden.
Alle anderen Linien des maximalen Wasserzeichens werden nicht berücksichtigt. Dies bedeutet, daß nach der Addition des Wasserzeichens die quantisierten Audiospektralwerte der selektierten Linien um plus bzw. minus n Quantisierungsstufen verändert werden, während die quantisierten Audiospektralwerte der nicht selektierten Wasserzeichen-Linien unver- ändert übernommen werden. Das quantisierte Wasserzeichen-behaftete Audiosignal am Ausgang 20 der in Fig. 3 gezeigten Vorrichtung muß nunmehr noch Entropie-codiert werden.
Abhängig von dem verwendeten Audiocodierverfahren, in das das erfindungsgemäße Konzept integriert ist, existiert eine Bitsparkassenfunktion, die späteren Signalblöcken zusätzliche Bits zur Verfügung stellen kann, wie es ausgeführt worden ist. Die Linienselektionsstrategie ist vorzugsweise an den Füllstand der Bitsparkasse angepaßt, um so beispielsweise bei gefüllter Bitsparkasse zu erlauben, daß auch quantisierte Audiospektralwerte des ursprünglichen Audiosignals, die den Wert 0 haben, mit einem Wasserzeichen beaufschlagt werden, was normalerweise aufgrund des Bitbe- darfs nicht zulässig wäre. Damit kann die Wasserzeichende- tektion spürbar verbessert werden.
Bei der Anwendung der kombinierten Einbettung/Codierung stehen neben den bereits quantisierten Audiospektralwerten zusätzlich die Originalwerte nach der Transformation in den Frequenzbereich zur Verfügung. Die Quantisierung der originalen Audiospektralwerte kann ebenfalls als eine Art Wasserzeicheneinbettung angesehen werden, da sowohl bei der Quantisierung als auch bei der Addition eines Wasserzei- chensignals eine gewisse Störung des Audiospektrums resultiert. Die durch die Quantisierung eingebrachte Störung ist dabei aufgrund ihrer zufälligen Natur nicht als Wasserzeichen anzusehen. Wenn jedoch die eingebrachte Störung aufgrund der Quantisierung vorzeichenrichtig mit dem Wasser- zeichen ist, unterstützt das Quantisierungsrauschen die De- tektierbarkeit des Wasserzeichens. Hieraus ergeben sich folgende Fälle.
Durch die Quantisierung einer Audiospektrallinie wird das Wasserzeichen vorzeichenrichtig eingebracht. Hier ist die Einrichtung 38 von Fig. 3 vorzugsweise so angeordnet, daß sie aufgrund der Tatsache, daß bereits durch die Quantisierung phasenrichtig zum Wasserzeichen-Spektralwert für eine bestimmte Frequenz eine Störung eingebracht worden ist, angeordnet, um auf das Einbringen einer weiteren Wasserzeichen-Störung zu verzichten. Alternativ könnte noch eine Quantisierungsstufe hinzugefügt werden, um die Detektier- barkeit noch weiter zu verbessern.
Wenn dagegen durch die Quantisierung einer Audiospektrallinie eine Störung eingebracht wird, die das entgegengesetzte Vorzeichen hat wie das Wasserzeichensignal, was dazu führt, daß das Wasserzeichen durch die gegenläufige Quantisierung gewissermaßen verschlechtert wird, ist aufgrund der Linienselektionsstrategien, die weiter oben ausgeführt worden sind, abzuwägen, ob für diese Linie die Robustheit des Wasserzeichens gewährleistet werden muß und somit der quanti- sierte Audiospektralwert verändert werden muß, um das Quantisierungsrauschen gewissermaßen wieder "rückgängig" zu machen, oder ob in Hinblick auf eine bessere Audioqualität das eingebettete Wasserzeichen an dieser Stelle, d. h. das Quantisierungsrauschen an dieser Stelle, ein "falsches" Vorzeichen besitzen soll.
Wie es bereits ausgeführt worden ist, findet bei modernen Codierverfahren die Berechnung der psychoakustischen Maskierungsschwelle nicht linienweise statt, sondern skalen- faktorbandweise. Dies bedeutet, daß nicht Energien einzelner Spektrallinien betrachtet werden, sondern die Gesamtenergien z. B. 20 Spektrallinien in einem Skalenfaktorband. Es kann jedoch in einem Skalenfaktorband, in dem viele Wasserzeichen-Spektrallinien tolerierbar sind, ohne weiteres auf ein paar Linien im Sinne einer guten Audioqualität verzichtet werden, ohne daß die Wasserzeichen-Detektierbarkeit signifikant leidet. Diese Funktionalität kann auch bei dem in Fig. 2 gezeigten Ausführungsbeispiel dadurch erreicht werden, daß die Gewichtungskontrolle 34 von Fig. 2 derart ausgestaltet ist, daß nicht über der Frequenz gleiche Gewichtungsfaktoren eingesetzt werden, sondern daß unterschiedliche Gewichtungsfaktoren für verschiedene Spektralwerte eingesetzt werden, und daß insbesondere auf Gewich- tungsfaktoren von 0 für einzelne Spektrallinien vorkommen. Als vorbestimmter Wasserzeichen-Startwert kann es bei dem in Fig. 2 gezeigten Ausführungsbeispiel auch von Vorteil sein, vor dem Beginn der Iteration die Wasserzeichen- Gewichtung so zu gestalten, daß sie von der psychoakustischen Maskierungsschwelle abgeleitet ist.
Zusammenfassend stellt sich das erfindungsgemäße Konzept derart dar, daß zunächst ein spektral dargestelltes Wasser- zeichensignal erzeugt wird. Dies wird mittels Gewichtungsfaktoren gewichtet. Das gewichtete Signal wird zum Original-Audiosignal, das in spektraler Darstellung vorliegt, hinzuaddiert. Alternativ wird auf der Basis des Wasserzeichen-Signals eine Veränderung der Linien des Original- Audiosignals, das in spektraler Darstellung vorliegt, durchgeführt. Hierauf wird die nach der Quantisierung eingebrachte Störung bestimmt, wobei die Störung durch Quanti- sieren, invers Quantisieren und Differenzbildung zum Original ermittelt wird, oder wobei die Störung vorberechnet ist.
Anschließend werden neue Gewichtungsfaktoren bestimmt, wobei die Maskierungsschwelle verwendet wird, wobei eine Linienselektionsstrategie angewendet wird, oder wobei eine Linienselektionsstrategie insbesondere derart angewendet wird, daß Vorzeichen und Betrag der Spektrallinien des un- gewichteten Wasserzeichens verwendet werden, und daß die Summe von Wasserzeichenlinie und Originalspektrallinie so bestimmt wird, daß diese neue Spektrallinie in ein anderes Quantisierungsintervall fällt als die ursprüngliche Spektrallinie.
Das erfindungsgemäße Konzept ist dahingehend vorteilhaft, daß es sowohl für Bitstrom-Wasserzeichen-Verfahren als auch Verfahren einsetzbar ist, die Audiocodierung und Wasserzeicheneinbettung in einem Schritt vornehmen. Ein weiterer Vorteil des erfindungsgemäßen Konzepts besteht darin, daß eine volle Kontrolle über die eingebrachte Störung erzielbar ist. Dadurch ist es möglich, das Verfahren gezielt zugunsten optimaler Wasserzeichendetektion oder op- timaler Audioqualität einzustellen.
Ein weiterer Vorteil des erfindungsgemäßen Konzepts ist eine volle Kontrolle über die frequenzmäßige Verteilung des Wasserzeichen-Spreizbandsignals in das Audiosignal.

Claims

Patentansprüche
1. Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Schritten:
Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Audio-Spektralwerten aufweist;
Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;
Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Audiosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß ei- ne durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Storungsschwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt; und
Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichenbehaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,
wobei der Schritt des Verarbeitens (22) folgende Teilschritte aufweist:
Wählen (26) eines vorbestimmten Wasserzeichen- Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;
Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Au- diosignal nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführten Störung; und
falls die durch den Wasserzeichen-Spektralwert einge- führte Störung größer als die vorbestimmte Storungsschwelle ist (32), Verändern (34) des Wasserzeichen- Startwerts, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung des Audiosignals einge- führte Störung kleiner oder gleich der vorbestimmten Storungsschwelle ist, und Verwenden des veränderten Wasserzeichen-Startwerts als das verarbeitete Wasserzeichensignal .
Verfahren nach Anspruch 1,
bei dem im Teilschritt des Wählens 26 Wasserzeichen- Spektralwerte mit Start-Gewichtungsfaktoren gewichtet sind;
bei dem im Schritt des Ermitteins (28) die mit den Start-Gewichtungsfaktoren gewichteten Wasserzeichen- Spektralwerte zu den Audiospektralwerten addiert werden, um Additions-Spektralwerte zu erhalten,
bei dem die Additions-Spektralwerte quantisiert und anschließend invers quantisiert werden (28a), um invers quantisierte Additions-Spektralwerte zu erhalten;
bei dem die invers quantisierten Additions- Spektralwerte mit den Audiospektralwerten verglichen werden (28b) , um zu ermitteln, ob die in den Additi- ons-Spektralwerten enthaltene Störung unter der vorbestimmten Storungsschwelle ist (32); und
bei dem im Teilschritt des Veränderns (34) die Start- Gewichtungsfaktoren verändert werden.
3. Verfahren nach Anspruch 2, bei dem die Start- Gewichtungsfaktoren für alle Wasserzeichenspektralwerte gleich sind und einen Betrag haben, der so gewählt ist, daß die Energie des Wasserzeichens oberhalb der psychoakustischen Maskierungsschwelle liegt.
4. Verfahren nach Anspruch 2, bei dem die Start- Gewichtungsfaktoren durch Gewichten der Wasserzeichenspektralwerte mit der psychoakustischen Maskierungs- schwelle erhalten werden, so daß die Energie der mit der psychoakustischen Maskierungsschwelle gewichteten Wasserzeichenspektralwerte an die psychoakustische Maskierungsschwelle angenähert ist und insbesondere kleiner oder gleich der psychoakustischen Maskierungs- schwelle ist.
5. Verfahren nach Anspruch 3 oder 4, bei dem die Start- Gewichtungsfaktoren im Teilschritt des Veränderns (34) pro einem Iterationsschritt verkleinert werden.
6. Verfahren nach einem der Ansprüche 2 bis 5, bei dem der Schritt des Kombinierens (18) das Kombinieren der Spektralwerte des Audiosignals und der Spektralwerte des verarbeiteten Wasserzeichensignals und anschlie- ßend den Schritt des Quantisierens des Wasserzeichenbehafteten Audiosignals unter Verwendung von Quantisierungsstufen aufweist, die durch Quantisieren der Audiospektralwerte ohne Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle er- mittelt wurden, um ein quantisiertes Wasserzeichenbehaftetes Audiosignal zu erhalten.
7. Verfahren nach Anspruch 1,
bei dem der Teilschritt des Wählens (26) eines Wasserzeichen-Startwerts folgende Unterschritte aufweist: Ermitteln (42) von Quantisierungsstufen für die Audiospektralwerte ohne das Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle (24);
Quantisieren (42) der Audiospektralwerte unter Verwendung der ermittelten Quantisierungsstufen, um quantisierte Audiospektralwerte zu erhalten;
Extrahieren von Vorzeichen der Wasserzeichen- Spektralwerte;
Berechnen (36) von quantisierten Spektralwerten des Wasserzeichen-Startwerts, so daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals positiv ist, und daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich dem Negativen einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals negativ ist; und
bei dem der Schritt (34) des Veränderns den Schritt des Einsteilens der Anzahl von Quantisierungsstufen und/oder den Schritt des Selektierens (38) von Spektrallinien des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert aufweist .
8. Verfahren nach Anspruch 7, bei dem für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, keine Spektralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.
9. Verfahren nach Anspruch 7, bei dem eine Bitsparkassenfunktion (44) vorhanden ist, und bei dem abhängig von einer Füllung der Bitsparkasse für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, Spekt- ralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.
10. Verfahren nach einem der Ansprüche 1 bis 9, bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß eine möglichst große Anzahl von veränderten Wasserzeichen-Spektralwerten ungleich 0 ist.
11. Verfahren nach einem der Ansprüche 1 bis 10,
bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß der Verlauf des veränderten Wasserzeichen-Startwerts über der Frequenz dem spektralen Verlauf des Wasserzeichen-Signals so weit als möglich entspricht.
12. Verfahren nach einem der Ansprüche 7 bis 11,
bei dem quantisierte Audiospektralwerte zu selektier- ten Wasserzeichen-Spektralwerten hinzuaddiert werden, um ein quantisiertes Wasserzeichen-behaftetes Audiosignal zu erhalten.
13. Verfahren nach einem der vorhergehenden Ansprüche,
bei dem der Teilschritt des Veränderns (34) abgebrochen wird, wenn die Storungsschwelle erreicht oder unterschritten ist, und wenn zugleich die Anzahl der veränderten Wasserzeichen-Spektralwerte über einer vorbestimmten Schwelle ist.
14. Verfahren nach Anspruch 13, bei dem die vorbestimmte Energieschwelle dadurch definiert ist, daß eine vorbestimmte Anzahl von Audiospektralwerten eines Signals, das die Audiospektralwerte und die veränderten Wasserzeichen-Spektralwerte umfaßt, um zumindest eine Quantisierungsstufe gegenüber den quantisierten Spektralwerten des Audiosignals allein verändert sind.
15. Verfahren nach einem der vorhergehenden Ansprüche,
bei dem die psychoakustische Maskierungsschwelle (24) einen Wert pro einem Skalenfaktorband aufweist, und bei dem der Schritt des Verarbeitens (22) skalenfak- torbandweise durchgeführt wird.
16. Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Merkmalen:
einer Einrichtung zum Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Au- dio-Spektralwerten aufweist;
einer Einrichtung zum Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;
einer Einrichtung zum Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Au- diosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Storungsschwelle ist, die von der psychoakustischen Maskierungsschwelle ab- hängt; und
einer Einrichtung zum Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichen-behaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,
wobei die Einrichtung zum Verarbeiten (22) folgende Merkmale aufweist: eine Einrichtung zum Wählen (26) eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;
eine Einrichtung zum Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignal nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführ- ten Störung;
eine Einrichtung (32) zum Feststellen, ob die durch den Wasserzeichen-Startwert eingeführte Störung größer als die vorbestimmte Storungsschwelle ist; und
eine Einrichtung (34) zum Verändern der Wasserzeichen- Spektralwerte, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist, und zum Verwenden der veränderten Wasserzeichen- Spektralwerte als das verarbeitete Wasserzeichensignal.
EP02740586A 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal Expired - Lifetime EP1382038B1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10129239A DE10129239C1 (de) 2001-06-18 2001-06-18 Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
DE10129239 2001-06-18
PCT/EP2002/005173 WO2002103695A2 (de) 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Publications (2)

Publication Number Publication Date
EP1382038A2 true EP1382038A2 (de) 2004-01-21
EP1382038B1 EP1382038B1 (de) 2005-06-29

Family

ID=7688519

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02740586A Expired - Lifetime EP1382038B1 (de) 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Country Status (5)

Country Link
US (1) US7346514B2 (de)
EP (1) EP1382038B1 (de)
AT (1) ATE298921T1 (de)
DE (2) DE10129239C1 (de)
WO (1) WO2002103695A2 (de)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738495B2 (en) * 1995-05-08 2004-05-18 Digimarc Corporation Watermarking enhanced to withstand anticipated corruptions
US20030133592A1 (en) 1996-05-07 2003-07-17 Rhoads Geoffrey B. Content objects with computer instructions steganographically encoded therein, and associated methods
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
US7602940B2 (en) 1998-04-16 2009-10-13 Digimarc Corporation Steganographic data hiding using a device clock
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US7239981B2 (en) 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
EP2782337A3 (de) 2002-10-15 2014-11-26 Verance Corporation Media-Überwchung, Verwaltung und Informationssystem
US7352878B2 (en) * 2003-04-15 2008-04-01 Digimarc Corporation Human perceptual model applied to rendering of watermarked signals
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
JP2005084625A (ja) * 2003-09-11 2005-03-31 Music Gate Inc 電子透かし合成方法及びプログラム
US7616776B2 (en) * 2005-04-26 2009-11-10 Verance Corproation Methods and apparatus for enhancing the robustness of watermark extraction from digital host content
US9055239B2 (en) * 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
DE102004021404B4 (de) * 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
DE102004021403A1 (de) 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
EP1961181B1 (de) * 2005-12-16 2009-04-15 Dolby Sweden AB Vorrichtung zum erzeugen und interpretieren eines datenstroms mit einer reihe von segmenten unter verwendung von daten in nachfolgenden datenrahmen
US7809018B2 (en) * 2005-12-16 2010-10-05 Coding Technologies Ab Apparatus for generating and interpreting a data stream with segments having specified entry points
EP1999999B1 (de) 2006-03-24 2011-11-02 Dolby Sweden AB Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
US8010370B2 (en) * 2006-07-28 2011-08-30 Apple Inc. Bitrate control for perceptual coding
US8032371B2 (en) * 2006-07-28 2011-10-04 Apple Inc. Determining scale factor values in encoding audio data with AAC
WO2008046203A1 (en) * 2006-10-18 2008-04-24 Destiny Software Productions Inc. Methods for watermarking media data
CA2858944C (en) 2007-11-12 2017-08-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8457951B2 (en) * 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
CN102625982B (zh) 2009-05-01 2015-03-18 尼尔森(美国)有限公司 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
US8838977B2 (en) 2010-09-16 2014-09-16 Verance Corporation Watermark extraction and content screening in a networked environment
EP2544179A1 (de) * 2011-07-08 2013-01-09 Thomson Licensing Verfahren und Vorrichtung zur Quantisierindexmodulation zur Wasserzeichenmarkierung eines Eingangssignals
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US20140075469A1 (en) 2012-09-13 2014-03-13 Verance Corporation Content distribution including advertisements
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9225310B1 (en) * 2012-11-08 2015-12-29 iZotope, Inc. Audio limiter system and method
US9262793B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
EP2881941A1 (de) * 2013-12-09 2015-06-10 Thomson Licensing Verfahren und Vorrichtung zur Wassermarkierung eines Audiosignals
KR101731770B1 (ko) 2014-03-13 2017-04-28 베란스 코오포레이션 임베디드 코드를 사용한 양방향 콘텐츠 획득
CN105244033B (zh) * 2014-07-09 2019-07-16 意法半导体亚太私人有限公司 用于数字水印的系统和方法
US10043527B1 (en) 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
KR102021739B1 (ko) * 2018-06-04 2019-11-05 채령 양자암호키로 생성한 암호화 제품정보 데이터와 해시함수 2차 행렬 (x,y) 좌표 값으로 마킹하는 복제 위변조 방지 양자암호마킹기 및 양자암호마킹 물품관리 시스템
CN113035213B (zh) * 2020-12-24 2022-07-22 中国电影科学技术研究所 数字音频水印检测方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5319735A (en) * 1991-12-17 1994-06-07 Bolt Beranek And Newman Inc. Embedded signalling
PL183573B1 (pl) * 1994-03-31 2002-06-28 Arbitron Co System do kodowania i system do dekodowania sygnału dźwiękowego
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
EP0875107B1 (de) * 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
JP4226687B2 (ja) 1998-05-01 2009-02-18 ユナイテッド・モジュール・コーポレーション 電子透かし埋め込み装置及びオーディオ符号化装置
JP2000209097A (ja) 1999-01-14 2000-07-28 Sony Corp 信号処理装置とその方法、信号記録装置、信号再生装置および記録媒体
DE19906512C2 (de) * 1999-02-17 2001-01-25 Frank Kurth Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
DE19938095A1 (de) * 1999-08-12 2001-03-01 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in ein Audiosignal und Verfahren und Vorrichtung zum Ermitteln von in einem Audiosignal eingebrachten Informationen
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US20040006696A1 (en) * 2000-06-08 2004-01-08 Seung-Won Shin Watermark embedding and extracting method for protecting digital audio contents copyright and preventing duplication and apparatus using thereof
WO2002015587A2 (en) * 2000-08-16 2002-02-21 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO02103695A2 *

Also Published As

Publication number Publication date
EP1382038B1 (de) 2005-06-29
WO2002103695A3 (de) 2003-05-22
US20040184369A1 (en) 2004-09-23
ATE298921T1 (de) 2005-07-15
WO2002103695A2 (de) 2002-12-27
DE50203511D1 (de) 2005-08-04
US7346514B2 (en) 2008-03-18
DE10129239C1 (de) 2002-10-31

Similar Documents

Publication Publication Date Title
EP1382038B1 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE60313332T2 (de) Audiocodierung mit niedriger bitrate
DE19921122C1 (de) Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
DE60209888T2 (de) Kodieren eines audiosignals
EP1687810B1 (de) Vorrichtung und verfahren zum ermitteln einer quantisierer-schrittweite
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
EP1112621B1 (de) Vorrichtung und verfahren zum entropie-codieren von informationswörtern und vorrichtung und verfahren zum decodieren von entropie-codierten informationswörtern
EP0910928A1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
WO1998003036A1 (de) Verfahren zum codieren und decodieren von stereoaudiospektralwerten
EP1212857B1 (de) Verfahren und vorrichtung zum einbringen von informationen in einen datenstrom sowie verfahren und vorrichtung zum codieren eines audiosignals
WO2005083678A1 (de) Vorrichtung und verfahren zum verarbeiten eines multikanalsignals
WO2002063611A1 (de) Verfahren und vorrichtung zum erzeugen bzw. decodieren eines skalierbaren datenstroms unter berücksichtigung einer bitsparkasse, codierer und skalierbarer codierer
DE10200653A1 (de) Skalierbarer Codierer und Decodierer für einen skalierten Datenstrom
WO2001043503A2 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
EP1016319A1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
WO2002058054A1 (de) Verfahren und vorrichtung zum erzeugen eines skalierbaren datenstroms und verfahren und vorrichtung zum decodieren eines skalierbaren datenstroms
DE69823458T2 (de) Mehrband-Sprachdecoder
DE69931932T2 (de) Verfahren und Vorrichtung zum Dekodieren und Einfügen eines Wasserzeichens in einen Datenstrom
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE602004006401T2 (de) Aktualisieren eines verborgenen datenkanals

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20031118

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIN1 Information on inventor provided before grant (corrected)

Inventor name: SIEBENHAAR, FRANK

Inventor name: KULESSA, RALPH

Inventor name: HERRE, JUERGEN

Inventor name: NEUBAUER, CHRISTIAN

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20050629

Ref country code: IE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REF Corresponds to:

Ref document number: 50203511

Country of ref document: DE

Date of ref document: 20050804

Kind code of ref document: P

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: GERMAN

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050929

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050929

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051010

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20050919

REG Reference to a national code

Ref country code: SE

Ref legal event code: TRGR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051207

REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060531

26N No opposition filed

Effective date: 20060330

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060510

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 15

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 16

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 17

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20210519

Year of fee payment: 20

Ref country code: FR

Payment date: 20210521

Year of fee payment: 20

Ref country code: DE

Payment date: 20210525

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: BE

Payment date: 20210519

Year of fee payment: 20

Ref country code: AT

Payment date: 20210518

Year of fee payment: 20

Ref country code: SE

Payment date: 20210521

Year of fee payment: 20

Ref country code: CH

Payment date: 20210525

Year of fee payment: 20

Ref country code: GB

Payment date: 20210526

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50203511

Country of ref document: DE

REG Reference to a national code

Ref country code: NL

Ref legal event code: MK

Effective date: 20220509

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: BE

Ref legal event code: MK

Effective date: 20220510

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20220509

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK07

Ref document number: 298921

Country of ref document: AT

Kind code of ref document: T

Effective date: 20220510

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20220509