DE60310716T2 - System für die audiokodierung mit füllung von spektralen lücken - Google Patents

System für die audiokodierung mit füllung von spektralen lücken Download PDF

Info

Publication number
DE60310716T2
DE60310716T2 DE60310716T DE60310716T DE60310716T2 DE 60310716 T2 DE60310716 T2 DE 60310716T2 DE 60310716 T DE60310716 T DE 60310716T DE 60310716 T DE60310716 T DE 60310716T DE 60310716 T2 DE60310716 T2 DE 60310716T2
Authority
DE
Germany
Prior art keywords
spectral components
spectral
signal
subband signals
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60310716T
Other languages
English (en)
Other versions
DE60310716T8 (de
DE60310716D1 (de
Inventor
Mead Michael Missouri City TRUMAN
Allen Grant San Francisco DAVIDSON
Conrad c/o Dolby Laboratories Matthew San Francisco FELLERS
Stuart c/o Dolby Laboratories Mark San Francisco VINTON
Aubrey Matthew Sugar Land WATSON
Quito c/o Dolby Laboratories Charles San Francisco ROBINSON
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of DE60310716D1 publication Critical patent/DE60310716D1/de
Publication of DE60310716T2 publication Critical patent/DE60310716T2/de
Publication of DE60310716T8 publication Critical patent/DE60310716T8/de
Active legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Elements Other Than Lenses (AREA)
  • Stereophonic System (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Adornments (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Optical Communication System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Optical Filters (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich insgesamt auf Audiokodiersysteme und betrifft insbesondere die Verbesserung der wahrgenommenen Qualität der von Audiokodiersystemen erhaltenen Audiosignale.
  • EINSCHLÄGIGER STAND DER TECHNIK
  • Audiokodiersysteme werden benutzt, um ein Audiosignal zu einem zur Übertragung oder Speicherung geeigneten kodierten Signal zu kodieren und um anschließend das kodierte Signal zu empfangen oder rückzugewinnen und es zu dekodieren, um eine Version des ursprünglichen Audiosignals für die Wiedergabe zu erhalten. Mit perzeptuellen Audiokodiersystemen versucht man, ein Audiosignal zu einem kodierten Signal zu kodieren, welches geringere Erfordernisse hinsichtlich der Informationskapazität hat als das ursprüngliche Audiosignal, und dann anschließend das kodierte Signal zu dekodieren, um als Ausgang ein vom ursprünglichen Audiosignal nicht wahrnehmbar unterscheidbares Signal zu erhalten. Ein Beispiel eines derartigen perzeptuellen Audiokodiersystems ist im Dokument A52 (1994) des Advanced Television Standards Committee (ATSC) beschrieben, auf das als Dolby AC-3 Bezug genommen wird. Ein weiteres Beispiel ist beschrieben von Bosi et al. "ISO/IEC MPEG-2 Advanced Audio Coding." J. AES, Bd. 45 Nr. 10, Oktober 1997, SS. 789-814, auf das als Advanced Audio Coding (AAC) Bezug genommen wird. Diese beiden Kodiersysteme und viele weitere perzeptuelle Kodiersysteme wenden auf ein Audiosignal eine Analysefilterbank an, um in Gruppen von Frequenzbanden angeordnete Spektralkomponenten zu erhalten. Die Bandbreiten sind üblicherweise unterschiedlich und entsprechen den Breiten der sogenannten kritischen Banden des menschlichen Hörsystems.
  • Perzeptuelle Kodiersysteme können angewandt werden, um die Informationskapazitätserfordernisse eines Audiosignals zu verringern, aber dabei ein subjektives oder wahrgenommenes Maß an Tonqualität zu erhalten, so daß eine kodierte Wiedergabe des Tonsignals über einen Nachrichtenkanal mit weniger Bandbreite übermittelt oder auf einem Aufzeichnungsträger auf kleinerem Raum aufgezeichnet werden kann. Informationskapazitätserfordernisse werden durch Quantisieren der Spektralkomponenten reduziert. Durch das Quantisieren tritt Rauschen in das quantisierte Signal ein, aber perzeptuelle Audiokodiersysteme arbeiten meistens mit psychoakustischen Modellen im Bemühen darum, die Amplitude des Quantisierungsrauschens so zu steuern, daß es von Spektralkomponenten im Signal maskiert oder unhörbar gemacht wird.
  • Die Spektralkomponenten innerhalb einer gegebenen Bande werden häufig auf die gleiche Quantisierungsauflösung quantisiert, und es wird ein psychoakustisches Modell benutzt, um die größte minimale Quantisierungsauflösung oder den kleinsten Rauschabstand (SNR) zu bestimmen, der möglich ist, ohne ein hörbares Niveau an Quantisierungsrauschen einzuführen. Diese Technik funktioniert ganz gut für schmale Banden, aber nicht so gut für breitere Banden, wenn Informationskapazitätserfordernisse das Kodiersystem auf die Verwendung einer relativ groben Quantisierauflösung beschränken. Die größerwertigen Spektralkomponenten in einer breiten Bande werden üblicherweise auf einen Nichtnull-Wert quantisiert, der die gewünschte Auflösung hat, aber kleinerwertige Spektralkomponenten in der Bande werden auf Null quantisiert, wenn ihre Größe unter dem Mindestquantisierniveau liegt. Die Zahl der Spektralkomponenten in einer Bande, die auf Null quantisiert werden, nimmt insgesamt mit zunehmender Bandbreite zu, sie nimmt zu, wenn der Unterschied zwischen den größten und kleinsten Spektralkomponentenwerten innerhalb der Bande zunimmt, und sie nimmt zu, wenn das Mindestquantisierniveau zunimmt.
  • Leider kann das Vorhandensein vieler auf Null quantisierter Spektralkomponenten (quantized-to-zero - QTZ) in einem kodierten Signal die wahrgenommene Qualität des Audiosignals verschlechtern, auch wenn das resultierende Quantisierrauschen niedrig genug gehalten wird, um für unhörbar oder als durch Spektralkomponenten im Signal psychoakustisch maskiert gehalten zu werden. Für diese Verschlechterung gibt es drei Ursachen. Erste Ursache ist die Tatsache, daß das Quantisierrauschen möglicherweise deshalb nicht unhörbar ist, weil das Niveau der psychoakustischen Maskierung geringer ist als vom psychoakustischen Modell vorhergesagt, welches für die Bestimmung der Quantisierauflösung benutzt wurde, eine zweite Ursache ist die Tatsache, daß die Schaffung so vieler QTZ-Spektralkomponenten die Energie oder Leistung des dekodierten Audiosignals im Vergleich zur Energie oder Leistung des ursprünglichen Audiosignals hörbar reduzieren kann. Eine dritte Ursache ist für Kodierverfahren relevant, die mit Verzerrungs-Annulier-Filterbänken arbeiten, beispielsweise die Quadrature Mirror Filter (QMF) Transformation oder eine bestimmte modifizierte Discrete Cosine Transform (DCT) und modifizierte Inverse Discrete Cosine Transform (IDCT), die als Time-Domain Aliasing Cancellation (TDAC) Transformation bekannt ist; und die von Princen et al. beschrieben wurden in "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation,"ICASSP 1987 Conf. Proc. Mai 1987, SS. 2161-64.
  • Kodiersysteme, in denen Verzerrungs-Annulier-Filterbänke, beispielsweise die QMF- oder TDAC-Transformationen angewandt werden, benutzen eine Analysefilterbank im Kodierprozeß, mit der in das kodierte Signal Verzerrungs- oder Störkomponenten eingeführt werden, aber sie benutzen im Dekodierprozeß eine Synthesefilterbank, die mindestens theoretisch die Verzerrung aufheben kann. In der Praxis kann allerdings die Fähigkeit der Synthesebank, die Verzerrung aufzuheben, signifikant beeinträchtigt sein, wenn die Werte einer oder mehrerer Spektralkomponenten im Kodierprozeß signifikant geändert wurden. Aus diesem Grund können QTZ-Spektralkomponenten die wahrgenommene Qualität eines dekodierten Audiosignals selbst dann beeinträchtigen, wenn das Quantisierungsrauschen unhörbar ist, weil Änderungen in den Werten der Spektralkomponenten die Fähigkeit der Synthesefilterbank zum Annulieren der durch die Analysefilterbank eingeführten Verzerrung beeinträchtigen können.
  • Mit in bekannten Kodiersystemen angewandten Techniken sind Teillösungen dieser Probleme gefunden worden. Beispielsweise haben Dolby AC-3 und AAC-Transformationskodiersysteme eine gewisse Fähigkeit, aus einem kodierten Signal ein Ausgangssignal zu erzeugen, welches den Signalpegel des ursprünglichen Audiosignals beibehält, indem für gewisse QTZ-Spektralkomponenten im Dekodierer Rauschen ersetzt wird. Bei diesen beiden Systemen bietet der Kodierer im kodierten Signal einen Leistungshinweis für ein Frequenzband, und der Dekodierer benutzt diesen Leistungshinweis, um die QTZ-Spektralkomponenten im Frequenzband durch einen entsprechenden Pegel an Rauschen zu ersetzen. Ein Dolby AC-3 Kodierer liefert eine grobe Schätzung des kurzfristigen Leistungsspektrums, welches zum Erzeugen eines angemessenen Rauschpegels benutzt werden kann. Wenn alle Spektralkomponenten einer Bande auf Null gesetzt sind, füllt der Dekodierer die Bande mit Rauschen von etwa der gleichen Leistung wie der in der groben Schätzung des kurzfristigen Leistungsspektrums angedeuteten. Beim AAC-Kodiersystem wird eine Technik mit dem Namen perzeptueller Rauschersatz (Perceptual Noise Substitution – PNS) angewandt, mit der die Leistung für eine gegebene Bande ausdrücklich übertragen wird. Ein Beispiel dieser Technik ist im Dokument DE 1950 9149 offenbart. Der Dekodierer benutzt diese Information, um der Leistung angepaßtes Rauschen hinzuzufügen. Beide Systeme fügen Rauschen nur in denjenigen Banden hinzu, die keine Nichtnull-Spektralkomponenten enthalten.
  • Leider dienen diese Systeme nicht dazu, Leistungsniveaus in Banden aufrechtzuerhalten, die eine Mischung aus QTZ- und Nichtnull-Spektralkomponenten enthalten. Tabelle 1 zeigt eine hypothetische Bande von Spektralkomponenten für ein ursprüngliches Audiosignal, eine 3-Bit quantisierte Darstellung jeder Spektralkomponente, die zu einem kodierten Signal zusammengefügt ist, und die entsprechenden Spektralkomponenten, die ein Dekodierer aus dem kodierten Signal erhält. Die quantisierte Bande im kodierten Signal enthält eine Kombination aus QTZ- und Nichtnull-Spektralkomponenten.
  • Figure 00030001
    Tabelle 1
  • Die erste Spalte der Tabelle zeigt einen Satz unsignierter binärer Zahlen, die Spektralkomponenten im ursprünglichen Audiosignal wiedergeben, welche zu einer einzigen Bande gruppiert sind. Die zweite Spalte zeigt eine Darstellung der Spektralkomponenten, die zu drei Bits quantisiert sind. Für dieses Beispiel ist ein Teil jeder Spektralkomponente unterhalb der 3-Bit Auflösung durch Abtrennen entfernt worden. Die quantisierten Spektralkomponenten werden an den Dekodierer übermittelt und anschließend dadurch dequantisiert, daß 0 Bits angehängt werden, um die ursprüngliche Spektralkomponentenlänge wieder herzustellen. Die dequantisierten Spektralkomponenten sind in der dritten Spalte gezeigt. Da eine Mehrheit der Spektralkomponenten auf Null quantisiert wurde, enthält die Bande dequantisierter Spektralkomponenten weniger Energie als die Bande der ursprünglichen Spektralkomponenten, und diese Energie ist in wenigen Nichtnull-Spektralkomponenten konzentriert. Diese Verringerung der Energie kann die wahrgenommene Qualität des dekodierten Signals, wie schon gesagt, verschlechtern.
  • OFFENBARUNG DER ERFINDUNG
  • Es ist eine Aufgabe der vorliegenden Erfindung, die wahrgenommene Qualität der von Audiokodiersystemen erhaltenen Audiosignale dadurch zu verbessern, daß eine mit nullwertigen quantisierten Spektralkomponenten in Beziehung stehende Verschlechterung vermieden oder verringert wird.
  • Gemäß einem, in den unabhängigen Ansprüchen 1, 16 und 31 beschriebenen Aspekt der vorliegenden Erfindung wird Audioinformation durch das Empfangen eines Eingangssignals bereitgestellt, aus dem ein Satz von Teilbandsignalen erhalten wird, die je mehr als eine oder mehrere Spektralkomponenten besitzen, welche den Spektralgehalt eines Audiosignals wiedergeben. Innerhalb des Satzes der Teilbandsignale wird ein bestimmtes Teilbandsignal identifiziert, in dem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein einer Schwelle entsprechendes Mindestquantisierniveau hat, und in dem eine Vielzahl von Spektralkomponenten einen Null-Wert hat. Es werden synthetisierte Spektralkomponenten erzeugt, die jeweiligen nullwertigen Spektralkomponenten in dem betreffenden Teilbandsignal entsprechen und die in Übereinstimmung mit einer Skalierhüllkurve unterhalb oder gleich der Schwelle skaliert werden. Ein modifizierter Satz von Teilbandsignalen wird dadurch erzeugt, daß die synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem betreffenden Teilbandsignal gesetzt werden, und durch Anlegen einer Synthesefilterbank an den modifizierten Satz von Teilbandsignalen wird Audioinformation erzeugt.
  • Gemäß einem weiteren, in den unabhängigen Ansprüchen 12, 27 und 42 beschriebenen Aspekt der vorliegenden Erfindung wird ein Ausgangssignal, vorzugsweise ein kodiertes Ausgangssignal bereitgestellt, indem ein Satz von Teilbandsignalen erzeugt wird, die je eine oder mehrere Spektralkomponenten besitzen, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, die durch Anlegen einer Analysefilterbank an Audioinformation erhalten wird. Innerhalb des Satzes der Teilbandsignale wird ein bestimmtes Teilbandsignal identifiziert, in dem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein einer Schwelle entsprechendes Mindestquantisierniveau hat, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat. Vom Spektralgehalt des Audiosignals wird Skaliersteuerinformation abgeleitet, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und an die Stelle der Spektralkomponenten mit einem Null-Wert in einem Empfänger gesetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt. Das Ausgangssignal wird erzeugt durch Zusammenfügen der Skaliersteuerinformation und von Information, die den Satz der Teilbandsignale wiedergibt.
  • Die verschiedenen Merkmale der vorliegenden Erfindung und ihre bevorzugten Ausführungsbeispiele sind anhand der nachfolgenden Beschreibung und der beigefügten Zeichnungen besser verständlich, wobei in den einzelnen Figuren für gleiche Elemente gleiche Bezugszeichen verwendet sind. Der Inhalt der folgenden Beschreibung und Zeichnungen dient lediglich als Beispiel und sollte nicht als Begrenzung des Umfangs der vorliegenden, in den Ansprüchen beschriebenen Erfindung verstanden werden.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Es zeigt:
  • 1a ein schematisches Blockschaltbild eines Audiokodierers;
  • 1b ein schematisches Blockschaltbild eines Audiodekodierers;
  • 2a-2c graphische Darstellungen von Quantisierfunktionen;
  • 3 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals;
  • 4 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit einigen auf Null gesetzten Spektralkomponenten.
  • 5 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten anstelle nullwertiger Spektralkomponenten;
  • 6 eine graphische schematische Darstellung eines hypothetischen Frequenzganges für einen Filter in einer Analysefilterbank;
  • 7 eine graphische schematische Darstellung einer Skalierhüllkurve, die an den in 6 gezeigten Frequenzgangabfall des Spektralstreufaktors angenähert ist;
  • 8 eine graphische schematische Darstellung von Skalierhüllkurven, die vom Ausgang eines anpaßbaren Filters abgeleitet sind;
  • 9 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetischen Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an den in 6 gezeigten Frequenzgangabfall des Spektralstreufaktors angenähert ist;
  • 10 eine graphische schematische Darstellung hypothetischer psychoakustischer Maskierschwellen;
  • 11 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetischen Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an psychoakustische Maskierschwellen angenähert ist;
  • 12 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals;
  • 13 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals mit einigen auf Null gesetzten Spektralkomponenten;
  • 14 eine graphische schematische Darstellung einer hypothetischen, zeitlichen psychoakustischen Maskierschwelle;
  • 15 eine graphische schematische Darstellung eines hypothetischen Teilbandsignals mit synthetisierten Spektralkomponenten, die durch eine Skalierhüllkurve gewichtet sind, welche an die zeitlichen psychoakustischen Maskierschwellen angenähert ist;
  • 16 eine graphische schematische Darstellung des Spektrums eines hypothetischen Audiosignals mit durch Spektralduplikation erzeugten synthetisierten Spektralkomponenten;
  • 17 ein schematisches Blockschaltbild einer Vorrichtung, die zur Verwirklichung verschiedener Aspekte der vorliegenden Erfindung in einem Kodierer oder einem Dekodierer verwendbar ist.
  • MÖGLICHKEITEN ZUM AUSFÜHREN DER ERFINDUNG
  • A. Überblick
  • Verschiedene Aspekte der vorliegenden Erfindung können in eine große Vielfalt an Signalverarbeitungsmethoden und Bausteinen, einschließlich der in 1a und 1b gezeigten eingebaut werden. Einige Aspekte können durch eine Verarbeitung ausgeführt werden, die nur in einem Dekodierverfahren oder Baustein ausgeführt wird, andere Aspekte erfordern ein zusammenwirkendes Verarbeiten, welches sowohl in Kodier- als auch Dekodierverfahren oder -bausteinen durchgeführt wird. Eine Beschreibung von Prozessen, die zur Verwirklichung dieser verschiedenen Aspekte der vorliegenden Erfindung benutzt werden können, folgt im Anschluß an einen Überblick typischer Bausteine, die für die Durchführung dieser Prozesse verwendbar sind.
  • 1. Kodierer
  • 1a veranschaulicht eine Verwirklichung eines Teilband-Audiokodierers, in dem eine Analysefil terbank 12 vom Weg 11 Audioinformation empfängt, die ein Audiosignal wiedergibt, und als Reaktion darauf digitale Information bereitstellt, die Frequenzteilbänder des Audiosignals wiedergibt. Die digitale Information in jedem der Frequenzteilbänder wird von einem entsprechenden Quantisierr 14, 15, 16 quantisiert und dem Kodierer 17 zugeleitet. Der Kodierer 17 erzeugt eine kodierte Wiedergabe der quantisierten Information, die an den Formatierer 18 weitergeleitet wird. Bei der speziellen, in der Figur gezeigten Verwirklichung werden die Quantisierfunktionen in den Quantisierern 14, 15, 16 in Abhängigkeit von Quantisiersteuerinformation angepaßt, die vom Modell 13 empfangen wird, welches die Quantisiersteuerinformation in Abhängigkeit von der vom Weg 11 empfangenen Audioinformation erzeugt. Der Formatierer setzt die kodierte Wiedergabe der quantisierten Information und die Quantisiersteuerinformation zu einem Ausgangssignal zusammen, welches zum Übertragen oder Speichern geeignet ist, und gibt das Ausgangssignal längs des Weges 19 weiter.
  • In vielen Audioanwendungen werden lineare Quantisierfunktionen q(x) benutzt, beispielsweise die 3-Bit asymmetrische Mittelstufen-Quantisierfunktion, die in 2a dargestellt ist; aber für die vorliegende Erfindung ist keine bestimmte Form der Quantisierung wichtig. Beispiele von zwei weiteren verwendbaren Funktionen q(x) sind in 2b und 2c gezeigt. Bei jedem dieser Beispiele bietet die Quantisierfunktion q(x) einen Ausgangswert gleich Null für jeden beliebigen Eingangswert x in dem Intervall vom Wert bei Punkt 30 bis zum Wert bei Punkt 31. In vielen Anwendungsfällen sind die beiden Werte an den Punkten 30 und 31 in der Größe gleich, haben aber entgegengesetztes Vorzeichen; aber, wie 2b zeigt, ist dies nicht nötig. Um die Beschreibung zu erleichtern, wird von einem Wert x, der innerhalb des Intervalls von Eingabewerten liegt, die mit einer bestimmten Quantisierfunktion q(x) auf Null (QTZ) quantisiert werden, gesagt, er sei geringer als das Mindestquantisierniveau dieser Quantisierfunktion.
  • In der vorliegenden Offenbarung sollen Ausdrücke wie "Kodierer" und "Kodieren" keine bestimmte Art von Informationsverarbeitung implizieren. Zum Beispiel wird Kodieren oft benutzt, um Informationskapazitätserfordernisse zu verringern. Aber diese Ausdrücke in der vorliegenden Beschreibung beziehen sich nicht notwendigerweise auf diese Art von Verarbeitung. Der Kodierer 17 kann im wesentlichen jede beliebige gewünschte Art der Verarbeitung durchführen. Bei einer bestimmten Verwirklichung wird quantisierte Information zu Gruppen skalierter Zahlen kodiert, die einen gemeinsamen Skalierfaktor haben. Im Dolby AC-3 Kodiersystem beispielsweise werden quantisierte Spektralkomponenten zu Gruppen oder Banden von Fließpunktzahlen angeordnet, wo die Zahlen in jeder Bande einen Fließpunktexponenten gemeinsam haben. Im AAC-Kodiersystem wird Entropiekodieren, beispielsweise Huffman-Kodieren angewandt. Bei einer anderen Verwirklichung ist der Kodierer 17 weggelassen, und die quantisierte Information wird unmittelbar mit dem Ausgangssignal zusammengeführt. Für die vorliegende Erfindung ist keine bestimmte Art des Kodierens wichtig.
  • Das Modell 13 kann im wesentlichen jede Art einer gewünschten Verarbeitung durchführen. Ein Beispiel ist ein Prozeß, der ein psychoakustisches Modell auf Audioinformation anwendet, um die psychoakustischen Maskiereffekte unterschiedlicher Spektralkomponenten in dem Audiosignal zu schätzen. Es sind viele Veränderungen möglich. So kann das Modell 13 zum Beispiel die Quantisiersteuerinformation in Abhängigkeit von der Frequenzteilbandinformation erzeugen, die am Ausgang der Analysefilterbank 12 verfügbar ist, anstatt oder zusätzlich zu der Audioinformation, die am Eingang der Filterbank verfügbar ist. Als weiteres Beispiel kann das Modell 13 weggelassen sein, und die Quantisierer 14, 15 und 16 benutzen Quantisierfunktionen, die nicht angepaßt sind. Für die vorliegende Erfindung ist kein bestimmter Modellierprozeß wichtig.
  • 2. Dekodierer
  • 1b zeigt eine Verwirklichung des Teilband-Audiodekodierers, in dem der Deformatierer 22 vom Weg 21 ein Eingangssignal empfängt, welches eine kodierte Darstellung quantisierter Digitalinformation übermittelt, die Frequenzteilbänder eines Audiosignals wiedergeben. Der Deformatierer 22 erhält die kodierte Darstellung vom Eingangssignal und gibt sie an den Dekodierer 23 weiter. Der Dekodierer 23 dekodiert die kodierte Darstellung zu Frequenzteilbändern quantisierter Information. Die quantisierte digitale Information in jedem der Frequenzteilbänder wird von einem jeweiligen Dequantisier 25, 26, 27 dequantisiert und einer Synthesefilterbank 28 zugeleitet, die längs des Weges 29 Audioinformation erzeugt, die ein Audiosignal wiedergibt. Bei der in der Figur gezeigten Verwirklichung werden die Dequantisierfunktionen in den Dequantisierern 25, 26, 27 in Abhängigkeit von Quantisiersteuerinformation angepaßt, die vom Modell 24 empfangen wird, das die Quantisiersteuerinformation in Abhängigkeit von Steuerinformation erzeugt, die der Deformatierer vom Ausgangssignal erhalten hat.
  • In dieser Offenbarung soll mit Ausdrücken wie "Dekodierer" und "Dekodieren" keine bestimmte Art von Informationsverarbeitung impliziert werden. Der Dekodierer 23 kann im wesentlichen jede Art von Verarbeitung durchführen, die benötigt oder gewünscht wird. Bei einer Verwirklichung ist dies umgekehrt zu einem vorstehend beschriebenen Kodierprozeß, wobei quantisierte Information in Gruppen von Fließpunktzahlen, die sich in Exponenten teilen, zu individuellen, quantisierten Komponenten dekodiert werden, die sich keine Exponenten teilen. Bei einer anderen Verwirklichung wird Entropiedekodierung, beispielsweise Huffman Dekodierung angewandt. Bei einer anderen Implementierung wird der Dekodierer 23 weggelassen, und die quantisierte Information wird unmittelbar vom Deformatierer 22 erhalten. Für die vorliegende Erfindung ist keine bestimmte Art des Dekodierens wichtig.
  • Das Modell 24 kann im wesentlichen jede beliebige, gewünschte Art der Verarbeitung durchführen. Ein Beispiel ist ein Prozeß, der ein psychoakustisches Modell auf Information anwendet, die vom Eingangssignal erhalten wird, um die psychoakustischen Maskiereffekte unterschiedlicher Spektralkomponenten in einem Audiosignal zu schätzen. Als weiteres Beispiel wird das Modell 24 weggelassen, und die Dequantisierer 25, 26, 27 können entweder Quantisierfunktionen benutzen, die nicht angepaßt sind, oder sie können Quantisierfunktionen benutzen, die in Abhängigkeit von Quantisiersteuerinformation angepaßt werden, die der Deformatierer 22 direkt vom Eingangssignal erhalten hat. Für die vorliegende Erfindung ist kein bestimmter Prozeß wichtig.
  • 3. Filterbänke
  • Die in den 1a und 1b gezeigten Bausteine zeigen Komponenten für drei Frequenzteilbänder. Bei einer typischen Anwendung werden viel mehr Teilbänder benutzt, aber aus Gründen der Klarheit der Darstellung sind hier nur drei gezeigt. Im Prinzip ist für die vorliegende Erfindung keine bestimmte Anzahl wichtig.
  • Die Analyse- und Synthesefilterbänke können im wesentlichen auf jede beliebige, gewünschte Art und Weise verwirklicht sein, einschließlich eines großen Bereiches an digitalen Filtertechnologien, Blocktransformationen und Wavelet-Transformationen. Bei einem Audiokodiersystem mit einem Kodierer und einem Dekodierer, wie den vorstehend beschriebenen, ist die Analysefilterbank 12 durch die TDAC-modifizierte DCT verwirklicht und die Synthesefilterbank 28 durch die TDAC-modifizierte IDCT verwirklicht, die schon erwähnt wurden. Es ist allerdings im Prinzip keine bestimmte Verwirklichung wichtig.
  • Analysefilterbänke, die durch Blocktransformationen verwirklicht sind, teilen einen Block oder ein Intervall eines Eingangssignals in einen Satz von Transformationskoeffizienten auf, der den Spektralgehalt dieses Intervalls des Signals wiedergibt. Eine Gruppe aus einem oder mehr benachbarten Transformationskoeffizienten gibt den Spektralgehalt innerhalb eines bestimmten Frequenzteilbandes wieder, dessen Bandbreite der Anzahl Koeffizienten in der Gruppe angepaßt ist.
  • Analysefilterbänke, die durch irgendeine Art eines digitalen Filters verwirklicht sind, beispielsweise einen Polyphasenfilter statt von einer Blocktransformation, teilen ein Eingangssignal in einen Satz von Teilbandsignalen auf. Jedes Teilbandsignal ist eine zeitbasierte Wiedergabe des Spektralgehalts des Eingangssignals innerhalb eines bestimmten Frequenzteilbandes. Vorzugsweise wird das Teilbandsignal so dezimiert, daß jedes Teilbandsignal eine Bandbreite hat, die an die Anzahl der Abtastwerte im Teilbandsignal für eine Zeitintervalleinheit angepaßt ist.
  • Die folgende Beschreibung bezieht sich mehr im einzelnen auf Verwirklichungen, die von Blocktransformationen, beispielsweise der oben genannten TDAC-Transformation Gebrauch machen. In dieser Beschreibung bezieht sich der Ausdruck "Teilbandsignal" auf Gruppen aus einem oder mehr benachbarten Transformationskoeffizienten, und der Ausdruck "Spektralkomponenten" bezieht sich auf die Transformationskoeffizienten. Da Grundsätze der vorliegenden Erfindung auch auf andere Arten der Verwirklichung anwendbar sind, kann der Ausdruck "Teilbandsignal" insgesamt so verstanden werden, daß er sich auch auf ein zeitbasiertes Signal bezieht, welches den Spektralgehalt eines bestimmten Frequenzteilbandes eines Signals wiedergibt, und der Ausdruck "Spektralkomponenten" kann insgesamt so verstanden werden, daß er sich auf Abtastwerte eines zeitbasierten Teilbandsignals bezieht.
  • 4. Implementation
  • Verschiedene Aspekte der vorliegenden Erfindung können auf verschiedenste Weise verwirklicht werden, einschließlich durch Software in einem Universalrechnersystem oder in irgendeiner anderen Vorrichtung, die stärker spezialisierte Bauelemente enthält, beispielsweise eine digitale Signalverarbeitungsschaltung (DSP), die mit Bauelementen ähnlich denen in einem Universalrechnersystem gekoppelt ist. 17 ist ein Blockschaltbild eines Bausteins 70, der zum Verwirklichen verschiede ner Aspekte der vorliegenden Erfindung in einem Audiokodierer oder Audiodekodierer verwendbar ist. DSP 72 stellt Rechenressourcen bereit. RAM 73 ist ein Systemdirektzugriffspeicher (RAM), den der DSP 72 für die Signalverarbeitung benutzt. ROM 74 stellt irgendeine Form dauerhafter Speicherung dar, beispielsweise einen Festwertspeicher (ROM) zum Speichern von Programmen, die zur Betätigung des Bausteins 70 nötig sind und zum Ausführen verschiedener Aspekte der vorliegenden Erfindung. Eine I/O Steuerung 75 stellt einen Schnittstellenschaltkreis zum Empfangen und Senden von Signalen über Kommunikationskanäle 76, 77 dar. In der I/O Steuerung 75 können nach Wunsch Analog/Digital-Umsetzer und Digital/Analog-Umsetzer enthalten sein, um analoge Audiosignale zu empfangen und/oder zu senden. Im gezeigten Ausführungsbeispiel sind alle hauptsächlichen Systembauelemente an einen Bus 71 angeschlossen, der mehr als einen physischen Bus darstellen kann. Aber eine Busarchitektur ist nicht erforderlich, um die vorliegende Erfindung zu verwirklichen.
  • In Ausführungsbeispielen, die in einem Universalrechnersystem verwirklicht sind, können zusätzliche Bauelemente als Schnittstellen zu Bauelementen, wie einer Tastatur oder einer Maus und einem Bildschirm eingeschlossen sein, und zum Steuern einer Speichervorrichtung, die einen Datenträger, beispielsweise ein Magnetband oder eine Magnetplatte oder einen optischen Träger umfaßt. Der Datenträger kann zum Aufzeichnen von Befehlsprogrammen für Betriebssysteme, Dienstprogrammen und Anwendungen benutzt werden und kann Ausführungsbeispiele von Programmen umfassen, die verschiedene Aspekte der vorliegenden Erfindung verwirklichen.
  • Die zum Ausführen verschiedener Aspekte der vorliegenden Erfindung erforderlichen Funktionen können von den Bauelementen durchgeführt werden, die auf verschiedenste Weise verwirklicht sind, einschließlich diskreter Logikbausteine, einer oder mehrerer anwendungsspezifischer integrierter Schaltungen und/oder programmgesteuerter Prozessoren. Die Art, in der diese Bauelemente verwirklicht sind, ist für die vorliegende Erfindung nicht wichtig.
  • Verwirklichungen der vorliegenden Erfindung in Software können durch eine Vielfalt an maschinenlesbaren Trägern übermittelt werden, beispielsweise als Basisband oder modulierte Nachrichtenübermittlungswege über das ganze Spektrum hinweg, einschließlich von Ultraschall bis zu Ultraviolettfrequenzen oder Datenträgern, einschließlich solcher, die Informationen mittels im wesentlichen jeder beliebigen magnetischen oder optischen Aufzeichnungstechnologie übermitteln, einschließlich Magnetband, Magnetplatte und Bildplatte. Verschiedene Aspekte können auch in verschiedenen Bauelementen des Rechnersystems 70 durch Verarbeitungsschaltkreise, wie anwendungsspezifische integrierte Schaltungen, integrierte Universalschaltungen, Mikroprozessoren, die von in verschiedenen Formen von ROM oder RAM verkörperten Programmen gesteuert werden, und anderen Techniken verwirklicht werden.
  • B. Dekodierer
  • Verschiedene Aspekte der vorliegenden Erfindung können in einem Dekodierer ausgeführt werden, die keine spezielle Verarbeitung oder Information von einem Kodierer erfordern. Diese Aspekte sind in diesem Abschnitt der Offenbarung beschrieben. Andere Aspekte, die keine spezielle Verarbeitung oder Information von einem Kodierer benötigen, sind im folgenden Abschnitt beschrieben.
  • 1. Spektrallücken
  • 3 ist eine graphische Darstellung des Spektrums eines Intervalls eines hypothetischen Audiosignals, das mittels eines Transformationskodiersystems kodiert werden soll. Das Spektrum 41 stellt eine Hüllkurve der Größe von Transformationskoeffizienten oder Spektralkomponenten dar. Während des Kodierprozesses werden alle Spektralkomponenten, deren Größe unterhalb der Schwelle 40 liegt, auf Null quantisiert. Wenn eine Quantisierfunktion, wie die in 2a gezeigte Funktion q(x) benutzt wird, entspricht die Schwelle 40 den Mindestquantisierniveaus 30, 31. Die Schwelle 40 ist über den gesamten Frequenzbereich aus Gründen der zweckmäßigeren Darstellung mit einem gleichmäßigen Wert gezeigt. Dies ist in vielen Kodiersystemen nicht typisch. In perzeptuellen Audiokodiersystemen, welche Spektralkomponenten innerhalb jedes Teilbandsignals quantisieren, ist beispielsweise die Schwelle 40 innerhalb jedes Frequenzteilbandes einheitlich, aber sie unterscheidet sich von Teilband zu Teilband. Bei anderen Verwirklichungen kann die Schwelle 40 auch innerhalb eines gegebenen Frequenzteilbandes variieren.
  • 4 ist eine graphische Darstellung des Spektrums des hypothetischen Audiosignals, welches von quantisierten Spektralkomponenten wiedergegeben ist. Das Spektrum 42 stellt eine Hüllkurve der Größe von Spektralkomponenten dar, die quantisiert worden sind. Das in dieser Figur und auch in weiteren Figuren dargestellte Spektrum zeigt nicht die Auswirkungen des Quantisierens der Spektralkomponenten, deren Größen oberhalb der Schwelle 40 oder gleich dieser sind. Der Unterschied zwischen den QTZ-Spektralkomponenten im quantisierten Signal und den entsprechenden Spektralkomponenten im Ursprungssignal ist schraffiert dargestellt. Diese schraffierten Bereiche stellen "Spektrallücken" in der quantisierten Wiedergabe dar, die mit synthetisierten Spektralkomponenten gefüllt werden sollen.
  • Bei einer Verwirklichung der vorliegenden Erfindung empfängt ein Dekodierer ein Eingangssignal, das eine kodierte Wiedergabe quantisierter Teilbandsignale übermittelt, wie in 4 gezeigt. Der Dekodierer dekodiert die kodierte Darstellung und identifiziert jene Teilbandsignale, in denen eine oder mehrere Spektralkomponenten Nichtnull-Werte haben, und eine Vielzahl von Spektralkomponenten einen Null-Wert haben. Vorzugsweise sind die Frequenzerstreckungen aller Teilbandsignale entweder a priori dem Dekodierer bekannt, oder sie werden durch Steuerinformation im Eingangssignal definiert. Der Dekodierer erzeugt synthetisierte Spektralkomponenten, die den nullwertigen Spektralkomponenten entsprechen, mit Hilfe eines Prozesses, wie den nachfolgend beschriebenen. Die synthetisierten Komponenten werden entsprechend einer Skalierungshüllkurve skaliert, die unterhalb oder gleich der Schwelle 40 ist, und die skalierten, synthetisierten Spektralkomponenten treten an die Stelle der nullwertigen Spektralkomponenten im Teilbandsignal. Der Dekodierer braucht keine Information vom Kodierer, die ausdrücklich das Niveau der Schwelle 40 angibt, wenn die Mindestquantisierniveaus 30, 31 der zum Quantisieren der Spektralkomponenten verwendeten Quantisierfunktion q(x) bekannt ist.
  • 2. Skalierung
  • Die Skalierhüllkurve kann auf verschiedene Art und Weise eingerichtet werden, von denen einige nachfolgend beschrieben werden; es können auch mehrere benutzt werden. Zum Beispiel kann eine zusammengesetzte Skalierhüllkurve abgeleitet werden, die dem Maximum aller auf verschiedene Weise erhaltenen Hüllkurven gleicht, oder durch Anwenden verschiedener Möglichkeiten zum Einrichten oberer und/oder unterer Grenzen für die Skalierhüllkurve. Die Einrichtungsmöglichkeiten können entsprechend Merkmalen des kodierten Signals angepaßt oder ausgewählt werden, und sie können als Funktion der Frequenz angepaßt oder ausgewählt werden.
  • a) Einheitliche Hüllkurve
  • Eine Möglichkeit ist für Dekodierer in Audiotransformations-Kodiersystemen und in Systemen geeignet, in denen andere Verwirklichungen einer Filterbank vorgesehen sind. Auf diese Weise wird eine einheitliche Skalierhüllkurve eingerichtet, wenn sie der Schwelle 40 entsprechend gesetzt wird. Ein Beispiel einer solchen Skalierhüllkurve ist in 5 gezeigt, wo schraffierte Bereiche die Spektrallücken veranschaulichen, die mit synthetisierten Spektralkomponenten gefüllt werden. Das Spektrum 43 gibt eine Hüllkurve der Spektralkomponenten eines Audiosignals wieder, bei dem die Spektrallücken mit synthetisierten Spektralkomponenten gefüllt sind. Die Obergrenzen der schraffierten Bereiche, die in dieser und späteren Figuren gezeigt sind, geben nicht die tatsächlichen Niveaus der synthetisierten Spektralkomponenten selbst wieder, sondern stellen lediglich eine Skalierhüllkurve für die synthetisierten Komponenten dar. Die zum Füllen von Spektrallücken verwendeten synthetisierten Komponenten haben Spektralniveaus, die nicht über die Skalierhüllkurve hinausgehen.
  • b) Spektralstreufaktor
  • Eine zweite Möglichkeit zum Einrichten einer Skalierhüllkurve ist gut geeignet für Dekodierer in Audiokodiersystemen, die mit Blocktransformationen arbeiten, aber sie basiert auf Grundsätzen, die auch auf andere Verwirklichungen von Filterbanken anwendbar sind. Hierbei wird eine nicht einheitliche Skalierhüllkurve geschaffen, die sich entsprechend Eigenschaften des Spektralstreufaktors des Frequenzganges des Prototypfilters bei einer Blocktransformation ändert.
  • Der in 6 gezeigte Frequenzgang 50 ist eine graphische Darstellung eines hypothetischen Frequenzganges für einen Transformationsprototypfilter, der einen Spektralstreufaktor zwischen Koeffizienten zeigt. Der Frequenzgang hat eine Hauptkeule, die normalerweise als Paßband des Prototypfilters bezeichnet wird, und eine Anzahl von der Hauptkeule benachbarten Nebenkeulen, deren Niveau für Frequenzen weiter weg von der Mitte des Paßbandes abnimmt. Die Nebenkeulen stellen Spektralenergie dar, die vom Paßband in benachbarte Frequenzbänder streut. Die Rate, mit der das Niveau dieser Nebenkeulen abnimmt, wird als Rate des Frequenzgangabfalls der Spektralstreuung bezeichnet.
  • Die Spektralstreucharakteristiken eines Filters legen der Spektralisolation zwischen einander benachbarten Frequenzteilbändern Grenzen auf. Wenn ein Filter eine große Menge Spektralstreuung hat, können die Spektralniveaus in einander benachbarten Teilbändern sich nicht so stark unterscheiden, wie das für Filter mit geringerem Ausmaß an Spektralstreuung möglich ist. Die in 7 gezeigte Hüllkurve 41 ist des Frequenzgangabfalls der in 6 gezeigten Spektralstreuung angenähert. Synthetisierte Spektralkomponenten können auf eine solche Hüllkurve skaliert werden, oder diese Hüllkurve kann alternativ als eine untere Grenze für eine Skalierhüllkurve dienen, die auf andere Weise abgeleitet wird.
  • Das in 9 gezeigte Spektrum 44 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten, die entsprechend einer Hüllkurve skaliert sind, die sich des Frequenzgangabfalls der Spektralstreuung nähert. Die Skalierhüllkurve für Spektrallücken, die zu beiden Seiten von Spektralenergie begrenzt sind, ist eine Zusammensetzung aus zwei individuellen Hüllkurven, einer für jede Seite. Die Zusammensetzung ist dadurch gebildet, daß die größere der beiden individuellen Hüllkurven genommen wird.
  • c) Filter
  • Eine dritte Möglichkeit zum Einrichten einer Skalierhüllkurve ist gleichfalls gut geeignet für Dekodierer in Audiokodiersystemen, die Blocktransformationen anwenden, beruht aber gleichfalls auf Grundsätzen, die auch auf andere Verwirklichungen der Filterbank anwendbar sind. Mit dieser Einrichtungsmöglichkeit wird eine nicht einheitliche Skalierhüllkurve geschaffen, die vom Ausgang eines Frequenzbereichsfilters abgeleitet ist, der zur Transformation von Koeffizienten im Frequenzbereich angewandt wird. Der Filter kann ein Vorhersagefilter, ein Tiefpaßfilter oder im wesentlichen jede beliebige andere Art von Filter sein, der die gewünschte Skalierhüllkurve bereitstellt. Für diese Art werden normalerweise mehr Rechenressourcen benötigt als für die beiden vorstehend beschriebenen Arten erforderlich sind, aber sie erlaubt Änderungen der Skalierhüllkurve als Funktion der Frequenz.
  • 8 ist eine graphische Darstellung von zwei Skalierhüllkurven, die vom Ausgang eines anpaßbaren Frequenzbereichsfilters abgeleitet sind. Die Skalierhüllkurve 52 könnte zum Beispiel benutzt werden, um Spektrallücken in Signalen oder Teilen von Signalen zu füllen, die eher als tonartig erachtet werden, und die Skalierhüllkurve 53 könnte zum Füllen von Spektrallücken in Signalen oder Teilen von Signalen benutzt werden, die eher als rauschartig erachtet werden. Ton- und Rauscheigenschaften eines Signals können auf verschiedenste Weise bewertet werden, von denen einige nachfolgend beschrieben werden. Als Alternative könnte die Skalierhüllkurve 52 zum Füllen von Spektrallücken niedrigerer Frequenzen benutzt werden, wo Audiosignale häufig eher tonartig sind, und die Skalierhüllkurve 53 könnte zum Füllen von Spektrallücken bei höheren Frequenzen benutzt werden, wo Audiosignale häufig eher rauschartig sind.
  • d) Perzeptuelles Maskieren
  • Eine vierte Art zum Einrichten einer Skalierhüllkurve ist auf Dekodierer in Audiokodiersystemen anwendbar, die Filterbänke mit Blocktransformationen und andere Arten von Filtern implementieren.
  • Mit dieser Möglichkeit wird eine nicht einheitliche Skalierhüllkurve geschaffen, die sich entsprechend geschätzter psychoakustischer Maskiereffekte ändert.
  • 10 zeigt zwei hypothetische psychoakustische Maskierschwellen. Die Schwelle 61 stellt die psychoakustischen Maskiereffekte einer niederfrequenten Spektralkomponente 60 dar, und die Schwelle 64 stellt die psychoakustischen Maskiereffekte einer höherfrequenten Spektralkomponente 63 dar. Maskierschwellen wie diese können benutzt werden, um die Form der Skalierhüllkurve abzuleiten.
  • Das in 11 gezeigte Spektrum 45 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Ersatzspektralkomponenten, die in Übereinstimmung mit Hüllkurven skaliert sind, welche auf psychoakustischer Maskierung beruhen. Im Fall des gezeigten Beispiels ist die Skalierhüllkurve in der Spektrallücke der niedrigsten Frequenz vom unteren Teil der Maskierschwelle 61 abgeleitet. Die Skalierhüllkurve in der mittleren Spektrallücke ist eine Zusammensetzung aus dem oberen Teil der Maskierschwelle 61 und dem unteren Teil der Maskierschwelle 64. Die Skalierhüllkurve in der Spektrallücke mit der höchsten Frequenz ist vom oberen Teil der Maskierschwelle 64 abgeleitet.
  • e) Tonalität
  • Eine fünfte Möglichkeit zum Einrichten einer Skalierhüllkurve beruht auf einer Beurteilung der Tonalität des gesamten Audiosignals oder eines Teils des Signals, beispielsweise für ein oder mehr Teilbandsignale. Tonalität kann auf verschiedene Weise beurteilt werden, einschließlich der Berechnung eines Maßes spektraler Flachheit (SFM), bei dem es sich um einen normierten Quotienten des arithmetischen Mittelwertes von Signalabtastwerten, dividiert durch den geometrischen Mittelwert der Signalabtastwerte handelt. Ein Wert in der Nähe von Eins zeigt an, daß ein Signal sehr rauschartig ist, und ein Wert in der Nähe von Null zeigt ein Signal an, das sehr tonartig ist. SFM kann unmittelbar benutzt werden, um die Skalierhüllkurve anzupassen. Wenn SFM Null ist, werden keine synthetisierten Komponenten benutzt, um eine Spektrallücke zu füllen. Ist SFM hingegen Eins, wird das maximal erlaubte Niveau synthetisierter Komponenten benutzt, die Spektrallücke zu füllen. Insgesamt kann jedoch ein Kodierer ein besseres SFM berechnen, weil er Zugang auf das gesamte ursprüngliche Audiosignal vor dem Kodieren hat. Es ist wahrscheinlich, daß ein Dekodierer kein genaues SFM berechnet, weil QTZ-Spektralkomponenten vorhanden sind.
  • Ein Dekodierer kann auch die Tonalität dadurch beurteilen, daß er die Anordnung oder Verteilung der nicht nullwertigen und der nullwertigen Spektralkomponenten analysiert. Bei einer Verwirklichung wird ein Signal eher tonartig als rauschartig erachtet, wenn lange Strecken von nullwertigen Spektralkomponenten zwischen wenigen großen nicht nullwertigen Komponenten verteilt sind, weil diese Anordnung eine Struktur spektraler Spitzen impliziert.
  • Bei noch einer weiteren Verwirklichung wendet ein Dekodierer auf ein oder mehr Teilbandsignale einen Vorhersagefilter an und bestimmt die Vorhersageverstärkung. Mit zunehmender Vorhersageverstärkung wird ein Signal für mehr tonartig gehalten.
  • f) Zeitliche Skalierung
  • 12 ist eine graphische Darstellung eines hypothetischen Teilbandsignals, welches kodiert werden soll. Die Linie 46 stellt eine zeitliche Hüllkurve der Größe von Spektralkomponenten dar. Dieses Teilbandsignal kann aus einer gemeinsamen Spektralkomponente oder einem Transformationskoeffizienten in einer Folge von Blöcken zusammengesetzt sein, die von einer Analysefilterbank erhalten werden, welche durch eine Blocktransformation verwirklicht ist, oder es kann sich um ein Teilbandsignal handeln, welches von einer anderen Art von Analysefilterbank erhalten ist, die durch einen anderen digitalen Filter als eine Blocktransformation verwirklicht ist, beispielsweise einen QMF. Während des Kodierprozesses werden alle Spektralkomponenten, deren Größe unterhalb der Schwelle 40 liegt, auf Null quantisiert. Die Schwelle 40 ist wegen der zweckmäßigeren Darstellung mit einem einheitlichen Wert über das ganze Zeitintervall gezeigt. Dies ist nicht typisch für viele Kodiersysteme mit Filterbänken, die durch Blocktransformationen verwirklicht sind.
  • 13 ist eine graphische Darstellung des hypothetischen Teilbandsignals, welches von quantisierten Spektralkomponenten wiedergegeben ist. Die Linie 47 stellt eine zeitliche Hüllkurve der Größe von Spektralkomponenten dar, die quantisiert wurden. Die in dieser Figur und auch in weiteren Figuren gezeigte Linie zeigt nicht die Auswirkungen des Quantisierens der Spektralkomponenten, deren Größen oberhalb oder gleich der Schwelle 40 sind. Der Unterschied zwischen den QTZ-Spektralkomponenten im quantisierten Signal und den entsprechenden Spektralkomponenten im ursprünglichen Signal ist schraffiert gezeigt. Der schraffierte Bereich stellt eine Spektrallücke innerhalb eines Zeitintervalls dar, die mit synthetisierten Spektralkomponenten zu füllen ist.
  • Bei einer Verwirklichung der vorliegenden Erfindung empfängt ein Dekodierer ein Eingangssignal, welches eine kodierte Darstellung quantisierter Teilbandsignale übermittelt, wie in 13 gezeigt. Der Dekodierer dekodiert die kodierte Wiedergabe und identifiziert jene Teilbandsignale, in denen eine Vielzahl der Spektralkomponenten einen Wert Null haben und denen Spektralkomponenten mit Nichtnull-Werten vorausgehen und/oder folgen. Der Dekodierer erzeugt mit einem Prozeß wie den nachfolgend beschriebenen synthetisierte Spektralkomponenten, die den nullwertigen Spektralkomponenten entsprechen. Die synthetisierten Komponenten werden entsprechend einer Skalierhüllkurve skaliert. Vorzugsweise erklärt die Skalierhüllkurve die zeitlichen Maskiereigenschaften des menschlichen Hörsystems.
  • 14 zeigt eine hypothetische zeitliche psychoakustische Maskierschwelle. Die Schwelle 68 gibt die zeitlichen psychoakustischen Maskiereffekte einer Spektralkomponente wieder. Der Teil der Schwelle links von der Spektralkomponente 67 gibt vor-zeitliche Maskiereigenschaften oder das Maskieren wieder, das dem Auftreten der Spektralkomponente vorausgeht. Der Teil der Schwelle rechts von der Spektralkomponente 67 stellt nach-zeitliche Maskiereigenschaften oder Maskieren dar, welches auf das Erscheinen der Spektralkomponente folgt. Nachmaskiereffekte haben insgesamt eine Dauer, die viel länger ist als die Dauer von Vormaskiereffekten. Eine zeitliche Maskierschwelle, wie diese hier, kann zum Ableiten einer zeitlichen Gestalt der Skalierhüllkurve benutzt werden.
  • Die Linie 48 in 15 ist eine graphische Darstellung eines hypothetischen Teilbandsignals mit synthetisierten Ersatzspektralkomponenten, die in Übereinstimmung mit Hüllkurven skaliert sind, welche auf zeitlichen psychoakustischen Maskiereffekten beruhen. Im gezeigten Beispiel ist die Skalierhüllkurve eine Zusammensetzung aus zwei individuellen Hüllkurven. Die individuelle Hüllkurve für den niederfrequenten Teil der Spektrallücke ist vom Nachmaskierteil der Schwelle 68 abgeleitet. Die individuelle Hüllkurve für den höherfrequenten Teil der Spektrallücke ist vom Vormaskierteil der Schwelle 68 abgeleitet.
  • 3. Erzeugen synthetisierter Komponenten
  • Die synthetisierten Spektralkomponenten können auf verschiedene Weise generiert werden, von denen zwei nachfolgend beschrieben werden. Es können viele Wege benutzt werden. Zum Beispiel können unterschiedliche Wege in Abhängigkeit von Eigenschaften des kodierten Signals oder als Funktion der Frequenz gewählt werden.
  • Auf einem ersten Weg wird ein rauschartiges Signal erzeugt. Im wesentlichen kann irgendeine einer Vielfalt von Methoden zum Erzeugen von Pseudorauschsignalen angewandt werden.
  • Im Fall eines zweiten Weges wird eine Technik angewandt, die als spektrale Translation oder spektrale Duplikation bezeichnet wird, mit der Spektralkomponenten aus einem oder mehr Frequenzteilbändern kopiert werden. Niederfrequente Spektralkomponenten werden üblicherweise kopiert, um Spektrallücken bei höheren Frequenzen zu füllen, denn höherfrequente Komponenten stehen oft in irgendeiner Weise in Beziehung zu niederfrequenten Komponenten. Im Prinzip können jedoch Spektralkomponenten auf höhere oder niedrigere Frequenzen kopiert werden.
  • Das in 16 gezeigte Spektrum 49 ist eine graphische Darstellung des Spektrums eines hypothetischen Audiosignals mit synthetisierten Spektralkomponenten, die durch spektrale Duplikation erzeugt sind. Ein Teil der spektralen Spitze ist in der Frequenz viele Male auf- und abdupliziert, um Spektrallücken bei den niedrigen bzw. mittleren Frequenzen zu füllen. Ein Abschnitt der Spektralkomponenten in der Nähe des hohen Endes des Spektrums wird in der Frequenz nach oben dupliziert, um die Spektrallücke am hohen Ende des Spektrums zu füllen. Im gezeigten Beispiel sind die duplizierten Komponenten mit einer einheitlichen Skalierhüllkurve skaliert. Im wesentlichen kann aber irgendeine Form von Skalierhüllkurve benutzt werden.
  • C. Kodierer
  • Die vorstehend beschriebenen Aspekte der vorliegenden Erfindung können in einem Dekodierer durchgeführt werden, ohne daß an bestehenden Kodierern irgendeine Abwandlung vorgenommen werden muß. Diese Aspekte können gefördert werden, wenn der Kodierer modifiziert wird, um zusätzliche Steuerinformation bereitzustellen, die sonst für den Dekodierer nicht zur Verfügung stünde. Die zusätzliche Steuerinformation kann dazu benutzt werden, die Art und Weise anzupassen, in der im Dekodierer synthetisierte Spektralkomponenten erzeugt und skaliert werden.
  • 1. Steuerinformation
  • Ein Kodierer kann eine Vielfalt an Skaliersteuerinformation bereitstellen, die ein Dekodierer zum Anpassen der Skalierhüllkurve für synthetisierte Spektralkomponenten benutzen kann. Jedes der nachfolgend beschriebenen Beispiele kann für ein gesamtes Signal und/oder für Frequenzteilbänder des Signals vorgesehen werden.
  • Wenn ein Teilband Spektralkomponenten enthält, die deutlich unterhalb des Mindestquantisierniveaus liegen, kann ein Kodierer dem Dekodierer Information zur Verfügung stellen, die diesen Zustand anzeigt. Die Information kann eine Art von Index sein, den ein Dekodierer zum Auswählen unter zwei oder mehr Skalierniveaus benutzen kann, oder die Information kann irgendein Maß des Spektralniveaus übermitteln, beispielsweise Durchschnittsleistung oder Effektivleistung (RMS). Der Dekodierer kann die Skalierhüllkurve in Abhängigkeit von dieser Information anpassen.
  • Wie schon gesagt, kann ein Dekodierer die Skalierhüllkurve in Abhängigkeit von psychoakustischen Maskiereffekten anpassen, die anhand des kodierten Signals selbst geschätzt wurden. Es ist aber auch möglich, daß der Kodierer eine bessere Schätzung dieser Maskiereffekte abgibt, wenn der Kodierer Zugang zu Merkmalen des Signals hat, die durch einen Kodierprozeß verloren gehen. Das läßt sich erreichen, wenn man das Modell 13 psychoakustische Information an den Formatierer 18 liefern läßt, die ansonsten vom kodierten Signal nicht verfügbar ist. Wenn man diese Art von Information benutzt, kann der Dekodierer die Skalierhüllkurve anpassen, um die synthetisierten Spektralkomponenten in Übereinstimmung mit einem oder mehr psychoakustischen Kriterien zu gestalten.
  • Die Skalierhüllkurve kann auch in Abhängigkeit von einer Beurteilung der rauschartigen oder tonartigen Qualitäten eines Signals oder Teilbandsignals angepaßt werden. Diese Beurteilung kann auf verschiedene Weise entweder vom Kodierer oder vom Dekodierer durchgeführt werden. Allerdings ist ein Kodierer normalerweise für eine bessere Beurteilung geeignet. Die Ergebnisse dieser Beurteilung können mit dem kodierten Signal zusammengeführt werden. Eine Beurteilung ist das oben beschriebene SFM.
  • Eine Angabe des SFM kann auch von einem Dekodierer für seine Auswahl des Prozesses für das Generieren synthetisierter Spektralkomponenten benutzt werden. Bei einem SFM nahe bei Eins kann die Technik zum Erzeugen von Rauschen angewandt werden. Ist das SFM nahe bei Null, kann die Technik der spektralen Duplikation benutzt werden.
  • Ein Kodierer kann einen Hinweis auf Leistung für die Nichtnull und die QTZ-Spektralkomponenten, beispielsweise das Verhältnis dieser beiden Leistungen liefern. Der Dekodierer kann die Leistung der Nichtnull-Spektralkomponenten berechnen und dann dieses Verhältnis oder eine sonstige Angabe benutzen, um die Skalierhüllkurve ordnungsgemäß anzupassen.
  • 2. Null-Spektralkoeffizienten
  • In der vorstehenden Beschreibung wird manchmal auf nullwertige Spektralkomponenten als QTZ (auf Null quantisierte) Komponenten Bezug genommen, weil die Quantisierung eine gemeinsame Quelle für nullwertige Komponenten in einem kodierten Signal ist. Dies ist nicht von essentieller Bedeutung. Der Wert von Spektralkomponenten in einem kodierten Signal kann im wesentlichen durch jedes beliebige Verfahren auf Null gesetzt werden. Zum Beispiel kann ein Kodierer die größte oder zwei Spektralkomponenten in jedem Teilbandsignal oberhalb einer bestimmten Frequenz identifizieren und alle anderen Spektralkomponenten in diesen Teilbandsignalen auf Null setzen. Alternativ kann ein Kodierer alle Spektralkomponenten in gewissen Teilbändern auf Null setzen, die niedriger sind als irgendeine Schwelle. Ein Dekodierer, der, wie beschrieben, verschiedene Aspekte der vorliegenden Erfindung verkörpert, kann Spektrallücken unbeachtlich des Prozesses füllen, der für deren Entstehung verantwortlich ist.

Claims (45)

  1. Verfahren zum Erzeugen von Audioinformation, aufweisend: Empfangen eines Eingangssignals und Erhalten eines Satzes von Teilbandsignalen von demselben, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes der Teilbandsignale, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat; Erzeugen synthetisierter Spektralkomponenten, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und gemäß einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist; Erzeugen eines modifizierten Satzes von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem bestimmten Teilbandsignal; und Erzeugen der Audioinformation durch Anwenden einer Synthesefilterbank auf den modifizierten Satz von Teilbandsignalen.
  2. Verfahren nach Anspruch 1, bei dem die Skalierhüllkurve einheitlich ist.
  3. Verfahren nach Anspruch 1 oder 2, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird, die zwischen benachbarten Spektralkomponenten eine Spektralstreuung hat, und die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate des Frequenzgangabfalls der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
  4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren aufweist: Anwenden eines Frequenzbereichsfilters auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen; und Ableiten der Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters.
  5. Verfahren nach Anspruch 4, welches das Ändern des Ansprechens des Frequenzbereichsfilters als Funktion der Frequenz aufweist.
  6. Verfahren nach einem der Ansprüche 1 bis 5, aufweisend: Erhalten eines Maßes der Tonalität des durch den Satz von Teilbandsignalen wiedergege benen Audiosignals; und Anpassen der Skalierhüllkurve als Reaktion auf das Maß der Tonalität.
  7. Verfahren nach Anspruch 6, mit dem das Maß der Tonalität vom Eingangssignal erhalten wird.
  8. Verfahren nach Anspruch 6, welches das Maß der Tonalität von der Art ableitet, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
  9. Verfahren nach einem der Ansprüche 1 bis 8, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren aufweist: Erhalten einer Folge von Sätzen von Teilbandsignalen aus dem Eingangssignal; Identifizieren eines gemeinsamen Teilbandsignals in der Folge der Sätze von Teilbandsignalen, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert und eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Identifizieren einer gemeinsamen Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, welche einen Nullwert in einer Vielzahl benachbarter Sätze in der Folge hat, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt; Skalieren der synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve, die sich von Satz zu Satz in der Folge in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; Erzeugen einer Folge modifizierter Sätze von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen; und Erzeugen der Audioinformation durch Anwenden der Synthesefilterbank auf die Folge modifizierter Sätze von Teilbandsignalen.
  10. Verfahren nach einem der Ansprüche 1 bis 9, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht wird und das Verfahren die synthetisierten Spektralkomponenten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
  11. Verfahren nach einem der Ansprüche 1 bis 10, bei dem die Skalierhüllkurve sich entsprechend zeitlicher Maskiereigenschaften des menschlichen Hörsystems ändert.
  12. Verfahren zum Erzeugen eines Ausgangssignals, aufweisend: Erzeugen eines Satzes von Teilbandsignalen, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, welche durch Anwenden einer Analysefilterbank auf Audioinformation erhalten wird; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes von Teilbandsignalen, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Ableiten von Skaliersteuerinformation von dem Spektralgehalt des Audiosignals, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und durch die die Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger ersetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und Erzeugen des Ausgangssignals durch Zusammenführen der Skaliersteuerinformation und Information, die den Satz der Teilbandsignale wiedergibt.
  13. Verfahren nach Anspruch 12, aufweisend: Erhalten eines Maßes von Tonalität des Audiosignals, welches durch den Satz von Teilbandsignalen wiedergegeben wird; und Ableiten der Skaliersteuerinformation von dem Maß der Tonalität.
  14. Verfahren nach Anspruch 12 oder 13, aufweisend: Erhalten einer geschätzten psychoakustischen Maskierschwelle des Audiosignals, welches durch den Satz von Teilbandsignalen wiedergegeben wird; und Ableiten der Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle.
  15. Verfahren nach einem der Ansprüche 12 bis 14, aufweisend: Erhalten von zwei Spektralniveaumaßen für Teile des Audiosignals, die von den nichtnullwertigen und den nullwertigen Spektralkomponenten wiedergegeben werden; und Ableiten der Skaliersteuerinformation von den beiden Maßen der Spektralniveaus.
  16. Vorrichtung zum Erzeugen von Audioinformation, aufweisend: einen Deformatierer, der ein Eingangssignal empfängt und von diesem einen Satz von Teilbandsignalen erhält, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; einen mit dem Deformatierer gekoppelten Dekodierer, der innerhalb des Satzes der Teilbandsignale ein bestimmtes Teilbandsignal identifiziert, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben, der synthetisierte Spektralkomponenten erzeugt, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und entsprechend einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist, und der einen modifizierten Satz von Teilbandsignalen erzeugt, indem er die synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in das bestimmte Teilbandsignal einsetzt; und eine mit dem Dekodierer gekoppelte Synthesefilterbank, welche die Audioinformation in Abhängigkeit von dem modifizierten Satz von Teilbandsignalen erzeugt.
  17. Vorrichtung nach Anspruch 16, bei der die Skalierhüllkurve einheitlich ist.
  18. Vorrichtung nach Anspruch 16 oder 17, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, die zwischen benachbarten Spektralkomponenten Spektralstreuung hat, und bei der die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate der Frequenzgangsenkung der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
  19. Vorrichtung nach einem der Ansprüche 16 bis 18, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und der Dekodierer einen Frequenzbereichsfilter auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen anwendet; und die Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters ableitet.
  20. Vorrichtung nach Anspruch 19, bei der der Dekodierer den Frequenzgang des Frequenzbereichsfilters als Funktion der Frequenz ändert.
  21. Vorrichtung nach einem der Ansprüche 16 bis 20, bei der der Dekodierer ein Maß der Tonalität des Audiosignals erhält, welches von dem Satz von Teilbandsignalen wiedergegeben wird; und die Skalierhüllkurve in Abhängigkeit von dem Tonalitätsmaß anpaßt.
  22. Vorrichtung nach Anspruch 21, welche das Tonalitätsmaß vom Eingangssignal erhält.
  23. Vorrichtung nach Anspruch 21, bei der der Dekodierer das Tonalitätsmaß von der Art ableitet, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
  24. Vorrichtung nach einem der Ansprüche 16 bis 23, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, und der Deformatierer eine Folge von Sätzen von Teilbandsignalen vom Eingangssignal erhält; der Dekodierer ein gemeinsames Teilbandsignal in der Folge der Teilbandsignalsätze identifiziert, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und eine Vielzahl von Spektralkomponenten einen Null-Wert haben, eine gemeinsame Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, welche einen Nullwert hat, in einer Vielzahl benachbarter Sätze in der Folge identifiziert, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt, die synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve skaliert, die sich von Satz zu Satz in der Folge gemäß zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; und eine Folge modifizierter Sätze von Teilbandsignalen erzeugt, indem er die synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen einsetzt; und die Synthesefilterbank die Audioinformation in Abhängigkeit von der Folge modifizierter Sätze von Teilbandsignalen erzeugt.
  25. Vorrichtung nach einem der Ansprüche 16 bis 24, bei der die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und der Dekodierer die synthetisierten Spektralkomponen ten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
  26. Vorrichtung nach einem der Ansprüche 16 bis 25, bei der die Skalierhüllkurve sich entsprechend zeitlicher Maskiereigenschaften des menschlichen Hörsystems ändert.
  27. Vorrichtung zum Erzeugen eines Ausgangssignals, aufweisend: eine Analysefilterbank, die in Abhängigkeit von Audioinformation einen Satz von Teilbandsignalen erzeugt, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; mit der Analysebank gekoppelte Quantisierer, welche die Spektralkomponenten quantisieren; einen mit den Quantisierern gekoppelten Kodierer, der innerhalb des Satzes von Teilbandsignalen ein bestimmtes Teilbandsignal identifiziert, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben, der Skaliersteuerinformation vom Spektralgehalt des Audiosignals ableitet, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und anstelle der Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger eingesetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und einen mit dem Kodierer gekoppelten Formatierer, der das Ausgangssignal durch das Zusammenführen der Skaliersteuerinformation und von Information, die den Satz von Teilbandsignalen wiedergibt, erzeugt.
  28. Vorrichtung nach Anspruch 27, die ein Maß der Tonalität des Audiosignals erhält, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skaliersteuerinformation von dem Tonalitätsmaß ableitet.
  29. Vorrichtung nach Anspruch 27 oder 28, die eine Modulierkomponente aufweist, welche eine geschätzte psychoakustische Maskierschwelle des von dem Teilbandsignalsatz wiedergegebenen Audiosignals erhält und die Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle ableitet.
  30. Vorrichtung nach einem der Ansprüche 27 bis 29, die zwei Spektralniveaumaße für Teile des Audiosignals erhält, die von den nichtnullwertigen und den nullwertigen Spektralkomponenten wiedergegeben sind; und die Skaliersteuerinformation von den beiden Maßen der Spektralniveaus ableitet.
  31. Träger, der ein Befehlsprogramm übermittelt und von einem Gerät zum Ausführen des Befehlsprogramms lesbar ist, um ein Verfahren zum Erzeugen von Audioinformation durchzuführen, wobei das Verfahren folgendes aufweist: Empfangen eines Eingangssignals und Erhalten eines Satzes von Teilbandsignalen von demselben, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes der Teilbandsignale, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert hat; Erzeugen synthetisierter Spektralkomponenten, die jeweiligen nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal entsprechen und gemäß einer Skalierhüllkurve skaliert sind, die unterhalb oder gleich der Schwelle ist; Erzeugen eines modifizierten Satzes von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle entsprechender nullwertiger Spektralkomponenten in dem bestimmten Teilbandsignal; und Erzeugen der Audioinformation durch Anwenden einer Synthesefilterbank auf den modifizierten Satz von Teilbandsignalen.
  32. Träger nach Anspruch 31, bei dem die Skalierhüllkurve einheitlich ist.
  33. Träger nach Anspruch 31 oder 32, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist, die zwischen benachbarten Spektralkomponenten Spektralstreuung hat und die Skalierhüllkurve sich mit einer Rate ändert, die einer Rate des Frequenzgangabfalls der Spektralstreuung der Blocktransformation im wesentlichen gleich ist.
  34. Träger nach einem der Ansprüche 31 bis 33, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren aufweist, einen Frequenzbereichsfilter auf eine oder mehrere Spektralkomponenten in dem Satz von Teilbandsignalen anzuwenden, und die Skalierhüllkurve von einer Ausgabe des Frequenzbereichsfilters abzuleiten.
  35. Träger nach Anspruch 34, bei dem das Verfahren aufweist, den Frequenzgang des Frequenzbereichsfilters als Funktion der Frequenz zu ändern.
  36. Träger nach einem der Ansprüche 31 bis 35, bei dem das Verfahren aufweist, ein Maß der Tonalität des Audiosignals zu erhalten, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skalierhüllkurve in Abhängigkeit von dem Tonalitätsmaß anzupassen.
  37. Träger nach Anspruch 36, bei dem das Verfahren das Tonalitätsmaß vom Eingangssignal erhält.
  38. Träger nach Anspruch 36, bei dem das Verfahren aufweist, das Maß der Tonalität von der Art abzuleiten, in der die nullwertigen Spektralkomponenten in dem bestimmten Teilbandsignal angeordnet sind.
  39. Träger nach einem der Ansprüche 31 bis 38, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren aufweist: eine Folge von Sätzen von Teilbandsignalen vom Eingangssignal zu erhalten; ein gemeinsames Teilbandsignal in der Folge der Teilbandsätze zu identifizieren, wo für jeden Satz in der Folge eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Identifizieren einer gemeinsamen Spektralkomponente innerhalb des gemeinsamen Teilbandsignals, die in einer Vielzahl einander benachbarter Sätze in der Folge einen Null-Wert hat, denen ein Satz mit den gemeinsamen Spektralkomponenten, die einen Nichtnull-Wert haben, entweder vorausgeht oder nachfolgt; Skalieren der synthetisierten Spektralkomponenten, die den nullwertigen gemeinsamen Spektralkomponenten entsprechen, gemäß der Skalierhüllkurve, die sich von Satz zu Satz in der Folge in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert; Erzeugen einer Folge modifizierter Sätze von Teilbandsignalen durch Einsetzen der synthetisierten Spektralkomponenten anstelle der entsprechenden nullwertigen gemeinsamen Spektralkomponenten in den Sätzen; und Erzeugen der Audioinformation durch Anwenden der Synthesefilterbank auf die Folge modifizierter Sätze von Teilbandsignalen.
  40. Träger nach einem der Ansprüche 31 bis 39, bei dem die Synthesefilterbank durch eine Blocktransformation verwirklicht ist und das Verfahren die synthetisierten Spektralkomponenten durch Spektraltranslation anderer Spektralkomponenten in dem Satz von Teilbandsignalen erzeugt.
  41. Träger nach einem der Ansprüche 31 bis 40, bei dem die Skalierhüllkurve sich in Übereinstimmung mit zeitlichen Maskiereigenschaften des menschlichen Hörsystems ändert.
  42. Träger, der ein Befehlsprogramm übermittelt und von einem Gerät zum Ausführen des Befehlsprogramms lesbar ist, um ein Verfahren zum Erzeugen eines Ausgangssignals durchzuführen, wobei das Verfahren aufweist: Erzeugen eines Satzes von Teilbandsignalen, die je eine oder mehrere Spektralkomponenten haben, welche den Spektralgehalt eines Audiosignals wiedergeben, durch Quantisieren von Information, welche durch Anwenden einer Analysefilterbank auf Audioinformation erhalten wird; Identifizieren eines bestimmten Teilbandsignals innerhalb des Satzes von Teilbandsignalen, in welchem eine oder mehrere Spektralkomponenten einen Nichtnull-Wert haben und von einem Quantisierer quantisiert sind, der ein Mindestquantisierniveau hat, das einer Schwelle entspricht, und in welchem eine Vielzahl von Spektralkomponenten einen Null-Wert haben; Ableiten von Skaliersteuerinformation von dem Spektralgehalt des Audiosignals, wobei die Skaliersteuerinformation das Skalieren synthetisierter Spektralkomponenten steuert, die synthetisiert und durch die die Spektralkomponenten, die einen Null-Wert haben, in einem Empfänger ersetzt werden sollen, der Audioinformation in Abhängigkeit von dem Ausgangssignal erzeugt; und Erzeugen des Ausgangssignals durch Zusammenführen der Skaliersteuerinformation und Information, die den Satz der Teilbandsignale wiedergibt.
  43. Träger nach Anspruch 42, bei dem das Verfahren aufweist, ein Maß der Tonalität des Audiosignals zu erhalten, welches von dem Satz von Teilbandsignalen wiedergegeben ist; und die Skaliersteuerinformation von dem Tonalitätsmaß abzuleiten.
  44. Träger nach Anspruch 42 oder 43, bei dem das Verfahren aufweist, eine geschätzte psychoakustische Maskierschwelle des von dem Satz von Teilbandsignalen wiedergegebenen Audiosignals zu erhalten; und die Skaliersteuerinformation von der geschätzten psychoakustischen Maskierschwelle abzuleiten.
  45. Träger nach einem der Ansprüche 42 bis 44, bei dem das Verfahren aufweist, zwei Spektralniveaumaße für Teile des Audiosignals zu erhalten, die von den nicht nullwertigen und den nullwertigen Spektralkomponenten wiedergegeben sind; und die Skaliersteuerinformation von den beiden Maßen der Spektralniveaus abzuleiten.
DE60310716T 2002-06-17 2003-05-30 System für die audiokodierung mit füllung von spektralen lücken Active DE60310716T8 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US174493 1993-12-28
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling
PCT/US2003/017078 WO2003107328A1 (en) 2002-06-17 2003-05-30 Audio coding system using spectral hole filling

Publications (3)

Publication Number Publication Date
DE60310716D1 DE60310716D1 (de) 2007-02-08
DE60310716T2 true DE60310716T2 (de) 2007-10-11
DE60310716T8 DE60310716T8 (de) 2008-01-31

Family

ID=29733607

Family Applications (3)

Application Number Title Priority Date Filing Date
DE60310716T Active DE60310716T8 (de) 2002-06-17 2003-05-30 System für die audiokodierung mit füllung von spektralen lücken
DE60333316T Expired - Lifetime DE60333316D1 (de) 2002-06-17 2003-05-30 Verfahren zur Erzeugung von Toninformationen
DE60332833T Expired - Lifetime DE60332833D1 (de) 2002-06-17 2003-06-09 Audiocodierungssystem, das eigenschaften eines decodierten signals zur anpassung synthetisierter spektralkomponenten verwendet

Family Applications After (2)

Application Number Title Priority Date Filing Date
DE60333316T Expired - Lifetime DE60333316D1 (de) 2002-06-17 2003-05-30 Verfahren zur Erzeugung von Toninformationen
DE60332833T Expired - Lifetime DE60332833D1 (de) 2002-06-17 2003-06-09 Audiocodierungssystem, das eigenschaften eines decodierten signals zur anpassung synthetisierter spektralkomponenten verwendet

Country Status (20)

Country Link
US (4) US7447631B2 (de)
EP (6) EP1736966B1 (de)
JP (6) JP4486496B2 (de)
KR (5) KR100991450B1 (de)
CN (1) CN100369109C (de)
AT (7) ATE536615T1 (de)
CA (6) CA2736055C (de)
DE (3) DE60310716T8 (de)
DK (3) DK1514261T3 (de)
ES (1) ES2275098T3 (de)
HK (6) HK1070728A1 (de)
IL (2) IL165650A (de)
MX (1) MXPA04012539A (de)
MY (2) MY136521A (de)
PL (1) PL208344B1 (de)
PT (1) PT2216777E (de)
SG (3) SG177013A1 (de)
SI (2) SI2209115T1 (de)
TW (1) TWI352969B (de)
WO (1) WO2003107328A1 (de)

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
CN1666571A (zh) * 2002-07-08 2005-09-07 皇家飞利浦电子股份有限公司 音频处理
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE378677T1 (de) * 2004-03-12 2007-11-15 Nokia Corp Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
EP1744139B1 (de) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Dekodierungsvorrichtung und verfahren dafür
EP3118849B1 (de) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Codierungsvorrichtung, decodierungsvorrichtung und verfahren dafür
JP2008510197A (ja) * 2004-08-17 2008-04-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルなオーディオ符号化
EP1794744A1 (de) * 2004-09-23 2007-06-13 Koninklijke Philips Electronics N.V. System und verfahren zur verarbeitung von audiodaten, programmelement und computerlesbares medium
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US20070053603A1 (en) * 2005-09-08 2007-03-08 Monro Donald M Low complexity bases matching pursuits data coding and decoding
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN101410892B (zh) 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
DE602006002381D1 (de) * 2006-04-24 2008-10-02 Nero Ag Erweiterte vorrichtung zur kodierung digitaler audiodaten
RU2417514C2 (ru) 2006-04-27 2011-04-27 Долби Лэборетериз Лайсенсинг Корпорейшн Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP4940308B2 (ja) 2006-10-20 2012-05-30 ドルビー ラボラトリーズ ライセンシング コーポレイション リセットを用いるオーディオダイナミクス処理
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2168122B1 (de) 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Tonverarbeitung mittels auditorischer szenenanalyse und spektraler asymmetrie
WO2009029037A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
DK3591650T3 (da) 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
EP2191465B1 (de) * 2007-09-12 2011-03-09 Dolby Laboratories Licensing Corporation Spracherweiterung mit anpassung von geräuschpegelschätzungen
US8583426B2 (en) * 2007-09-12 2013-11-12 Dolby Laboratories Licensing Corporation Speech enhancement with voice clarity
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2009084918A1 (en) * 2007-12-31 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
WO2010003556A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
CA2836871C (en) * 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
EP2320416B1 (de) * 2008-08-08 2014-03-05 Panasonic Corporation Spektralglättungsvorrichtung, Kodierungsvorrichtung, Dekodierungsvorrichtung, Kommunikationsendgerät, Basisstationsvorrichtung und Spektralglättungsverfahren
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
EP2182513B1 (de) * 2008-11-04 2013-03-20 Lg Electronics Inc. Vorrichtung zur Verarbeitung eines Audiosignals und Verfahren dafür
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
TWI618351B (zh) 2009-02-18 2018-03-11 杜比國際公司 用於高頻重建之複指數調變濾波器組
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
EP2407965B1 (de) * 2009-03-31 2012-12-12 Huawei Technologies Co., Ltd. Verfahren und einrichtung zur audiosignalentrauschung
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
BR112012009446B1 (pt) 2009-10-20 2023-03-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método e aparelho de armazenamento de dados
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
PT2524371T (pt) 2010-01-12 2017-03-15 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método de codificação de uma informação de áudio, método de descodificação de uma informação de áudio e programa de computador que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
ES2930203T3 (es) 2010-01-19 2022-12-07 Dolby Int Ab Transposición armónica basada en bloque de sub bandas mejorada
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
EP2555192A4 (de) * 2010-03-30 2013-09-25 Panasonic Corp Audiovorrichtung
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
CN105225669B (zh) 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
PT2684190E (pt) * 2011-03-10 2016-02-23 Ericsson Telefon Ab L M Preenchimento de sub-vectores não codificados em sinais de aúdio codificados por transformação
DK3067888T3 (en) 2011-04-15 2017-07-10 ERICSSON TELEFON AB L M (publ) DECODES FOR DIMAGE OF SIGNAL AREAS RECONSTRUCTED WITH LOW ACCURACY
EP2707874A4 (de) * 2011-05-13 2014-12-03 Samsung Electronics Co Ltd Bit-zuweisung sowie audiokodierung und -dekodierung
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP2013007944A (ja) 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US20130332171A1 (en) * 2012-06-12 2013-12-12 Carlos Avendano Bandwidth Extension via Constrained Synthesis
EP2717263B1 (de) * 2012-10-05 2016-11-02 Nokia Technologies Oy Verfahren, Vorrichtung und Computerprogrammprodukt zur kategorischen räumlichen Analyse-Synthese des Spektrums eines Mehrkanal-Audiosignals
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
PL2939235T3 (pl) 2013-01-29 2017-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptacyjna względem tonalności kwantyzacja o niskiej złożoności sygnału audio
AU2014211544B2 (en) * 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
ES2628127T3 (es) * 2013-04-05 2017-08-01 Dolby International Ab Cuantificador avanzado
JP6157926B2 (ja) * 2013-05-24 2017-07-05 株式会社東芝 音声処理装置、方法およびプログラム
EP2830059A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rauschfüllungsenergieanpassung
EP2830055A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kontextbasierte Entropiecodierung von Probenwerten einer spektralen Hüllkurve
EP2830060A1 (de) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rauschfüllung bei mehrkanaliger Audiocodierung
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
EP2919232A1 (de) 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierer, Decodierer und Verfahren zur Codierung und Decodierung
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2572664C2 (ru) * 2014-06-04 2016-01-20 Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации Устройство активного гашения вибрации
EP2980794A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer und -decodierer mit einem Frequenzdomänenprozessor und Zeitdomänenprozessor
EP2980795A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiokodierung und -decodierung mit Nutzung eines Frequenzdomänenprozessors, eines Zeitdomänenprozessors und eines Kreuzprozessors zur Initialisierung des Zeitdomänenprozessors
FI3177281T3 (fi) 2014-08-08 2024-03-13 Ali Res S R L Rasvahappojen ja palmitoyylietanoliamidin seos käytettäväksi tulehduksellisten ja allergisten patologioiden hoitoon
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
KR102033603B1 (ko) * 2014-11-07 2019-10-17 삼성전자주식회사 오디오 신호를 복원하는 방법 및 장치
US20160171987A1 (en) 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for compressed audio enhancement
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
TW202242853A (zh) 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US20170024495A1 (en) * 2015-07-21 2017-01-26 Positive Grid LLC Method of modeling characteristics of a musical instrument
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102034455B1 (ko) * 2016-12-09 2019-10-21 주식회사 엘지화학 밀봉재 조성물
EP3483884A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signalfiltrierung
EP3483878A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiodecoder mit auswahlfunktion für unterschiedliche verlustmaskierungswerkzeuge
EP3483879A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analyse-/synthese-fensterfunktion für modulierte geläppte transformation
EP3483880A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Zeitliche rauschformung
EP3483883A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiokodierung und -dekodierung mit selektiver nachfilterung
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Steuerung der bandbreite in codierern und/oder decodierern
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483886A1 (de) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Auswahl einer grundfrequenz
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3544005B1 (de) 2018-03-22 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung mit geditherten quantisierung
CA3152262A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
EP3785260A1 (de) 2018-04-25 2021-03-03 Dolby International AB Integration von hochfrequenz-audiorekonstruktionstechniken
TW202334940A (zh) * 2021-12-23 2023-09-01 紐倫堡大學 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備
WO2023117145A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods
TW202333143A (zh) * 2021-12-23 2023-08-16 弗勞恩霍夫爾協會 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備
WO2023117146A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3995115A (en) 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (de) 1986-04-30 1992-01-29 International Business Machines Corporation Sprachkodierungsverfahren und Einrichtung zur Ausführung dieses Verfahrens
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH02183630A (ja) * 1989-01-10 1990-07-18 Fujitsu Ltd 音声符号化方式
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
ATE138238T1 (de) 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
US5394466A (en) * 1993-02-16 1995-02-28 Keptel, Inc. Combination telephone network interface and cable television apparatus and cable television module
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3186489B2 (ja) * 1994-02-09 2001-07-11 ソニー株式会社 ディジタル信号処理方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
US5758315A (en) * 1994-05-25 1998-05-26 Sony Corporation Encoding/decoding method and apparatus using bit allocation as a function of scale factor
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
EP0764939B1 (de) * 1995-09-19 2002-05-02 AT&T Corp. Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1091199A (ja) * 1996-09-18 1998-04-10 Mitsubishi Electric Corp 記録再生装置
US5924064A (en) 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
EP0878790A1 (de) 1997-05-15 1998-11-18 Hewlett-Packard Company Sprachkodiersystem und Verfahren
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0926658A4 (de) * 1997-07-11 2005-06-29 Sony Corp Informationsdekodierer und dekodierverfahren, informationskodierer und kodierverfahren und verteilermedium
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
WO2000063886A1 (en) * 1999-04-16 2000-10-26 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
JP2001324996A (ja) * 2000-05-15 2001-11-22 Japan Music Agency Co Ltd Mp3音楽データ再生方法及び装置
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
JP3538122B2 (ja) 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Also Published As

Publication number Publication date
KR20100086067A (ko) 2010-07-29
SG177013A1 (en) 2012-01-30
ATE536615T1 (de) 2011-12-15
CA2736065A1 (en) 2003-12-24
CN100369109C (zh) 2008-02-13
KR20050010950A (ko) 2005-01-28
SI2209115T1 (sl) 2012-05-31
KR100986153B1 (ko) 2010-10-07
ATE526661T1 (de) 2011-10-15
SG10201702049SA (en) 2017-04-27
IL216069A0 (en) 2011-12-29
EP2207170A1 (de) 2010-07-14
JP2012103718A (ja) 2012-05-31
US20030233234A1 (en) 2003-12-18
DE60333316D1 (de) 2010-08-19
EP1736966A3 (de) 2007-11-07
KR100991450B1 (ko) 2010-11-04
KR20050010945A (ko) 2005-01-28
US8050933B2 (en) 2011-11-01
ES2275098T3 (es) 2007-06-01
HK1070728A1 (en) 2005-06-24
KR100986150B1 (ko) 2010-10-07
CN1662958A (zh) 2005-08-31
CA2489441C (en) 2012-04-10
US20030233236A1 (en) 2003-12-18
JP5063717B2 (ja) 2012-10-31
CA2489441A1 (en) 2003-12-24
IL165650A0 (en) 2006-01-15
EP2207169A1 (de) 2010-07-14
EP2216777A1 (de) 2010-08-11
EP2207170B1 (de) 2011-10-19
DK2207169T3 (da) 2012-02-06
WO2003107328A1 (en) 2003-12-24
EP2207169B1 (de) 2011-10-19
IL216069A (en) 2015-11-30
US8032387B2 (en) 2011-10-04
SG2014005300A (en) 2016-10-28
SI2207169T1 (sl) 2012-05-31
HK1146146A1 (en) 2011-05-13
CA2735830C (en) 2014-04-08
MXPA04012539A (es) 2005-04-28
IL165650A (en) 2010-11-30
HK1070729A1 (en) 2005-06-24
PL372104A1 (en) 2005-07-11
TWI352969B (en) 2011-11-21
US20090138267A1 (en) 2009-05-28
US7447631B2 (en) 2008-11-04
CA2736055C (en) 2015-02-24
JP5345722B2 (ja) 2013-11-20
EP1736966B1 (de) 2010-07-07
AU2003237295A1 (en) 2003-12-31
CA2736060A1 (en) 2003-12-24
EP2209115A1 (de) 2010-07-21
ATE529858T1 (de) 2011-11-15
KR20100086068A (ko) 2010-07-29
ATE470220T1 (de) 2010-06-15
ATE529859T1 (de) 2011-11-15
EP1514261A1 (de) 2005-03-16
JP2010156990A (ja) 2010-07-15
MY159022A (en) 2016-11-30
HK1141624A1 (en) 2010-11-12
US7337118B2 (en) 2008-02-26
PT2216777E (pt) 2012-03-16
ATE349754T1 (de) 2007-01-15
HK1146145A1 (en) 2011-05-13
JP5705273B2 (ja) 2015-04-22
JP2012212167A (ja) 2012-11-01
KR20100063141A (ko) 2010-06-10
KR100991448B1 (ko) 2010-11-04
DK1514261T3 (da) 2007-03-19
CA2736060C (en) 2015-02-17
DK1736966T3 (da) 2010-11-01
TW200404273A (en) 2004-03-16
EP1736966A2 (de) 2006-12-27
EP2209115B1 (de) 2011-09-28
CA2736055A1 (en) 2003-12-24
KR100986152B1 (ko) 2010-10-07
JP5253565B2 (ja) 2013-07-31
JP2013214103A (ja) 2013-10-17
DE60310716T8 (de) 2008-01-31
HK1141623A1 (en) 2010-11-12
DE60332833D1 (de) 2010-07-15
CA2736065C (en) 2015-02-10
MY136521A (en) 2008-10-31
ATE473503T1 (de) 2010-07-15
JP4486496B2 (ja) 2010-06-23
CA2736046A1 (en) 2003-12-24
EP2216777B1 (de) 2011-12-07
JP5253564B2 (ja) 2013-07-31
DE60310716D1 (de) 2007-02-08
JP2005530205A (ja) 2005-10-06
JP2012078866A (ja) 2012-04-19
PL208344B1 (pl) 2011-04-29
US20090144055A1 (en) 2009-06-04
CA2735830A1 (en) 2003-12-24
EP1514261B1 (de) 2006-12-27

Similar Documents

Publication Publication Date Title
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE60004814T2 (de) Quantisierung in perzeptuellen audiokodierern mit kompensation des durch den synthesefilter verschmierten rauschens
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE602004013031T2 (de) Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE19730130C2 (de) Verfahren zum Codieren eines Audiosignals
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE60313332T2 (de) Audiocodierung mit niedriger bitrate
DE602004010885T2 (de) Audio-transkodierung
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE10217297A1 (de) Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition