DE69934275T2

DE69934275T2 - Gerät und Verfahren um die Benutzerschnittstelle der integrierten Sprachantwortsystemen zu verbessern

Info

Publication number: DE69934275T2
Application number: DE69934275T
Authority: DE
Inventors: William Cupertino Beyda; Shmuel Palo Alto Shaffer
Original assignee: Siemens Communications Inc
Current assignee: Siemens Communications Inc
Priority date: 1998-07-17
Filing date: 1999-06-11
Publication date: 2007-04-05
Anticipated expiration: 2019-06-12
Also published as: EP0973314A3; EP0973314B1; EP0973314A2; US20010014146A1; JP2000078296A; US6487277B2; DE69934275D1

Description

HINTERGRUND DER ERFINDUNG
Gebiet der Erfindung
Die vorliegende Erfindung betrifft Bedienerführungssysteme und insbesondere ein Verfahren zum Verbessern einer Benutzerschnittstelle für ein Bedienerführungssystem.
Beschreibung des Standes der Technik Telefongestützte Bedienerführungssysteme werden in zunehmendem Maße verwendet, sowohl um eine Schnittstelle für Voice-Mail-Systeme zur Verfügung zu stellen als auch um eine Schnittstelle für interaktive Sprachantwortsysteme zur Verfügung zu stellen, wie etwa für Reservierungen bei Fluggesellschaften, Kontoverbindungen von Bankkunden und andere Verbindungen von Institutionen und Einrichtungen, wie etwa für staatliche Behörden, Versorgungsunternehmen, Kreditkartenfirmen und ähnliches. Auf viele Systeme, wie etwa diejenigen, die zum Banking oder für den Aktienhandel verwendet werden, kann von einzelnen Benutzern häufig zugegriffen werden, oft mehrmals am Tage. In solchen Systemen werden Benutzern hierarchische Ebenen von Aufforderungen präsentiert, durch die navigiert wird, indem Tasten auf der Telefontastatur gedrückt werden. Die resultierenden DTMF-Signale (Dual Tone Multifrequency, Zweiton-Mehrfrequenzsignale) werden von dem Bedienerführungssystem empfangen und verwendet, um auf eine andere Ebene in der Hierarchie zuzugreifen oder um auf eine bestimmte Funktion zuzugreifen.
Oft sorgen solche Bedienerführungssysteme dadurch für Unmut bei den Benutzern, dass sie nur eine vorgegebene Menge von Aufforderungen in einer vorgegebenen Reihenfolge zur Verfügung stellen. Dem Benutzer, welcher seinen Weg durch die Menge von Aufforderungen zum Erreichen eines bestimmten Ziels kennt, müssen trotzdem gesprochene Mitteilungen präsentiert werden, welche die einzelnen Aufforderungszustände kennzeichnen. Obwohl sequentielle Übersteuerungen verfügbar sind, muss der Benutzer nach wie vor eine Tastatureingabe für jeden Zustand vornehmen.
Gewisse bekannte Telefon-Bedienerführungssysteme ermöglichen einem Benutzer, eine Funktion zu wählen, welche die Aufforderungen abkürzt. So könnte dem Benutzer zum Beispiel anstelle von Aufforderungen wie "Wenn Sie Informationen wünschen, welche Ankünfte und Abflüge betreffen, drücken Sie bitte jetzt die 1" die Aufforderung "Ankünfte und Abflüge – 1 drücken" präsentiert werden. Bei solchen Systemen ist es jedoch nach wie vor erforderlich, dass der Benutzer durch die einzelnen Aufforderungen navigiert, bevor er eine gewünschte Funktion erreicht. In ähnlicher Weise ermöglichen andere Systeme dem Benutzer, von einer hierarchischen Ebene zu einer anderen hierarchischen Ebene zu springen, jedoch erst, wenn ihm eine gesonderte Aufforderung übermittelt wird.
Derartige Systeme weisen noch weitere Nachteile auf. Insbesondere gestatten diese Systeme keine dynamische Aktualisierung; d.h. sie passen sich nicht automatisch an Benutzungsmuster an, welche sich im Laufe der Zeit ändern.
Dies ist besonders in Systemen von Nachteil, auf welche von Benutzern häufig zugegriffen wird. Jeder Benutzer muss eine vorgegebene Menüpräsentation abwarten, welche oft unnötig ist, wenn der Benutzer wiederholt nach einem festgelegten Muster dieselben Menüoptionen auswählt. Beträchtliche Zeitersparnisse können dadurch erzielt werden, dass das Menü so umgeordnet wird, dass die häufiger gewählten Optionen zuerst präsentiert werden.
Zum Beispiel können in einem Sprachantwortsystem eines Personal-Servicecenters einer Firma verschiedene menügesteuerte Sprachantwort-Optionen zur Verfügung stehen, wie etwa Salden von Pensionskassen, Angaben zum Arbeitsverhältnis, Angaben zu Zahlungen für medizinische Leistungen oder ähnliches. Zahlreiche Anforderungen von Informationen über das Sozialzulagensystem der Firma können während der Woche eingehen, die einer angekündigten Änderung unmittelbar folgt. Vor der Änderung waren möglicherweise Auskünfte zum Arbeitsverhältnis die am häufigsten angeforderte Option. Bei einem herkömmlichen Sprachantwortsystem müssten Mitarbeiter der Firma die Änderung in den Anrufmustern erkennen und das Menü manuell umordnen, um die populärsten Optionen zuerst zu präsentieren. Andernfalls müssten alle Anrufer eine möglicherweise sehr lange Menüpräsentation durchlaufen, bevor ihnen die gewünschte Option zur Verfügung gestellt wird.
Nicht von Institutionen und Einrichtungen betriebene, dynamische Bedienerführungssysteme (d. h. solche, welche nicht bereits "fixiert" sind), wie etwa die für firmeninterne Voice-Mail-Systeme, weisen in ähnlicher Weise Unzulänglichkeiten bei der Speicherung und beim Wiederabruf auf. Insbesondere haben Benutzer solcher Systeme, welche Nachrichten speichern möchten, keine Möglichkeit, die gespeicherten Nachrichten zu organisieren, wenn sie eine Schnittstelle ohne Display wie etwa ein Telefon verwenden. Solche Benutzer haben nur die Wahl, die Nachrichten zu speichern oder nicht zu speichern. Die Nachrichten werden dann in einer linearen Warteschlange gespeichert. Oft werden solche Nachrichten in der Reihenfolge ihres Eintreffens oder in der umgekehrten Reihenfolge gespeichert, ohne irgendwelche weiteren hinzugefügten Informationen. Wenn eine der gespeicherten Nachrichten wieder abgerufen werden soll, muss der Benutzer die einzelnen Aufforderungen für die einzelnen Nachrichten oder für deren Nachrichtenkopf (Header) anhören. Der Benutzer ist somit nicht in der Lage, seine gespeicherten Nachrichten nach einer speziellen gewünschten Nachricht zu durchsuchen.
Obwohl die Verwendung einer graphischen Benutzerschnittstelle (Graphical User Interface, GUI) wie etwa von der Art, wie sie bei Systemen mit Computer-Telefonie- Schnittstelle (Computer-Telephony Interface, CTI) zur Verfügung stehen, eine Möglichkeit bietet, Nachrichten zu organisieren, stehen solche GUI oft nicht zur Verfügung, wenn Benutzer per Fernabfrage auf Nachrichten zugreifen möchten.
EP 0 827 320 beschreibt ein Verfahren und ein System zur Sprachmenü-Optimierung.
WO 98/02836 beschreibt ein computergestütztes medizinisches Diagnosesystem, bei dem eine listenbasierte Verarbeitung benutzt wird.
Benötigt wird daher ein verbessertes Verfahren zum Navigieren zwischen und über hierarchische Menüebenen in einem Telefon-Bedienerführungssystem. Insbesondere besteht Bedarf an einem Bedienerführungssystem, in welchem ein Benutzer schneller zu einer gewünschten Funktion navigieren kann. Ferner besteht Bedarf an einem verbesserten Verfahren des Organisierens von Voice-Mail- oder Multimedia-Nachrichten von einer nicht über ein Display verfügenden Schnittstelle aus. Insbesondere besteht Bedarf an einem Bedienerführungs- oder Nachrichtenübermittlungssystem, welches operative Sprachkennzeichnung (Voice Labelling) und Nachrichtenorganisation ermöglicht. Ferner besteht Bedarf an einem System, welches eine automatische Aktualisierung und Neukonfiguration der Menüoptionen in einem interaktiven Sprachantwortsystem (Interactive Voice Response System, IVR-System) ermöglicht.
ZUSAMENFASSUNG DER ERFINDUNG
Diese und andere Nachteile des Standes der Technik werden durch ein System und ein Verfahren gemäß der vorliegenden Erfindung zum großen Teil überwunden.
Gemäß der vorliegenden Erfindung wird ein in einem interaktiven Sprachantwortsystem (IVR-System) implementiertes Verfahren zur Bedienerführung eines Benutzers bereitgestellt, welches gekennzeichnet ist durch: Überwachen wenigstens eines ankommenden Rufes für das IVR-System, um ein Muster der Auswahl einer Aufforderung aus einer Vielzahl von Aufforderungen zu bestimmen; Anpassen einer Reihenfolge der Präsentation der besagten Vielzahl von Aufforderungen auf der Basis des Musters der Auswahl einer Aufforderung; und Bedienerführung des Benutzers entsprechend der angepassten Reihenfolge der Präsentation von Aufforderungen.
Gemäß der vorliegenden Erfindung wird außerdem ein interaktives Sprachantwortsystem (IVR-System) bereitgestellt, welches gekennzeichnet ist durch ein Vermittlungssteuermodul, das dazu dient, wenigstens einem Telefonie-Endgerät zu ermöglichen, auf das IVR-System zuzugreifen; eine mit dem Vermittlungssteuermodul gekoppelte Zentraleinheit; eine erste auf der Zentraleinheit ausführbare Softwareroutine zum Übertragen einer Vielzahl von Aufforderungen zu dem wenigstens einen Telefonie-Endgerät; eine zweite auf der Zentraleinheit ausführbare Softwareroutine zum Kompilieren von Aufforderungsauswahl-Statistiken auf der Basis einer Vielzahl von Anruferantworten auf die Aufforderungen; und eine dritte Softwareroutine zum Anpassen der Reihenfolge der Präsentation von Aufforderungen auf der Basis der Aufforderungsauswahl-Statistiken.
KURZBESCHREIBUNG DER ZEICHNUNGEN
Ein besseres Verständnis der vorliegenden Erfindung wird durch das Studium der nachfolgenden ausführlichen Beschreibung in Verbindung mit den beigefügten Zeichnungen erreicht, wobei:
1 ein Blockschaltbild eines Telefon-Bedienerführungssystems gemäß einer Ausführungsform der vorliegenden Erfindung ist;
2 ein detaillierteres Blockschaltbild eines Sprachnachrichtenservers gemäß einer Ausführungsform der vorliegenden Erfindung ist;
3 eine Darstellung eines hierarchischen Menüsystems gemäß einer Ausführungsform der vorliegenden Erfindung ist;
4 ein Flussdiagramm eines Verfahrens gemäß einer Ausführungsform der vorliegenden Erfindung ist;
5 ein Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform der vorliegenden Erfindung ist;
6 ein Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform der vorliegenden Erfindung ist;
7 ein Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform der vorliegenden Erfindung ist;
8 ein Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform der vorliegenden Erfindung ist;
9a–b das Aktualisieren der Reihenfolge einer Menüpräsentation gemäß einer Ausführungsform der vorliegenden Erfindung zeigen;
10 ein Flussdiagramm eines Verfahrens zum Konfigurieren der Reihenfolge der Präsentation von Menüoptionen gemäß einer weiteren Ausführungsform der vorliegenden Erfindung ist.
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
Es wird nun auf die Zeichnungen und insbesondere auf 1 Bezug genommen; sie zeigt ein Blockschaltbild, welches ein interaktives Sprachantwortsystem (Interactive Voice Response System, IVR-System) 101 gemäß einer Ausführungsform der vorliegenden Erfindung darstellt. Es ist anzumerken, dass, obwohl ein IVR-System dargestellt ist, ein Nachrichtenübermittlungssystem eines beliebigen Typs verwendet werden kann, wie etwa ein integriertes Sprachkommunikations- und E-Mail-System. Das IVR-System 101 kann ein zur Kundenbetreuung eingesetztes Bedienerführungssystem oder ein Voice-Mail-System oder irgendeine Kombination davon sein. Das System 101 ist so gestaltet, dass es im Vergleich zu früheren IVR-Systemen eine verbesserte Organisation und Navigation ermöglicht. Das interaktive Sprachantwortsystem 101 umfasst eine Nebenstellenanlage (PBX, private branch exchange) 100. Es ist anzumerken, dass, obwohl eine PBX 100 dargestellt ist, gemäß der vorliegenden Erfindung auch vielfältige andere Vermittlungs- und/oder Steuerungseinrichtungen verwendet werden können. Somit dient 1 lediglich als Beispiel. Die PBX 100 enthält eine Zentraleinheit (CPU, Central Processing Unit) 102 zur Steuerung der Funktionen der PBX 100. Die Zentraleinheit 102 steht stellvertretend für einen Prozessor zum Beispiel vom Typ Pentium, Pentium Pro oder Pentium II, der von der Intel Corp. mit Sitz in Santa Clara, Kalifornien hergestellt wird, oder für einen damit kompatiblen Prozessor. Die Zentraleinheit 102 ist mit einer Speichervorrichtung 104 gekoppelt. Die Speichervorrichtung 104 wird verwendet, um Routing-Informationen zu speichern, die mit dem hierarchischen Bedienerführungssystem zusammenhängen. Die Zentraleinheit 102 ist ferner mit einem Spracherzeugungsmodul 106 zur Erzeugung von vorgegebenen Sprachmitteilungen gekoppelt. Solche Spracherzeugungssysteme sind in der Technik wohlbekannt. Das Spracherzeugungsmodul 106 kann entweder ein echter Sprachsynthesizer oder eine Speichervorrichtung mit vorprogrammierten oder zuvor aufgezeichneten Nachrichten sein. Die Zentraleinheit 102 ist mit einem Vermittlungssteuermodul 108 gekoppelt, welches die Umschaltung zwischen einer Vielzahl von Vorrichtungen steuert, welche auf funktionsfähige Weise mit der PBX 100 gekoppelt sind. Das Vermittlungssteuermodul 108 enthält ferner ein Zweiton-Mehrfrequenzmodul (DTMF-Modul, Dual Tone Multi-Frequency Unit) 110, das so beschaffen ist, dass es DTMF-Signale und Digitalsignale empfangen und senden kann, und ein Anruferidentifikations-Empfangsmodul 111. Eine Vielzahl von Telefonie-Endgeräten 112a–112c, wie etwa Telefone, Faxgeräte und ähnliches, ist mit der PBX 100 gekoppelt. Außerdem können die Telefonie-Endgeräte verschiedene Personalcomputer 112d, 112e, mit denen Telefone 113a, 113b gekoppelt sind, umfassen. Die Computer und Telefone können so konfiguriert sein, dass sie unter Verwendung von TAPI- oder TSAPI-Protokollen interagieren. Die PBX 100 ist ferner mit dem öffentlichen Fernsprechnetz (PSTN, Public Switched Telephone Network) 114 gekoppelt.
Gemäß einer Ausführungsform der Erfindung ist die Zentraleinheit 102 ferner so konfiguriert, dass sie Auswahlen von Menüaufforderungen überwacht. Zum Beispiel überwacht die Zentraleinheit 102 den DTMF-Empfänger 110 und zeichnet die Auswahlen spezieller Antworten auf, die in Reaktion auf spezielle Menüangebote empfangen wurden. Die Ergebnisse werden dann von der Zentraleinheit 102 im Speichermodul 104 gespeichert. Der Ergebnisse können entweder für alle Benutzer oder für bestimmte Benutzer gespeichert werden. Wenn der Benutzer das nächste Mal anruft, werden die Menübefehle des Benutzers in einer aktualisierten Reihenfolge entsprechend der Häufigkeit der Benutzung zur Verfügung gestellt. Zum Beispiel kann, wenn der Benutzer das nächste Mal anruft, die Zentraleinheit 102 von dem Anruferidentifikations-Empfangsmodul 111 Benutzerkennungs-Informationen empfangen.
Das Anruferidentifikations-Empfangsmodul 111 kann ein standardmäßiges Anruferidentifikationsmodul sein, welches so konfiguriert ist, dass es Anruferidentifikations-Informationen überwacht, die von den Telefonie-Endgeräten geliefert werden. Die Zentraleinheit 102 kann die Anruferidentifikations-Informationen erkennen und sie verwenden, um auf eine gespeicherte Menü-Reihenfolge zuzugreifen, die dem betreffenden Benutzer entspricht. Stattdessen kann die Zentraleinheit 102 auch darauf warten, dass ein Anrufer eine Kennnummer eingibt, wie etwa eine Kontonummer, Sozialversicherungsnummer, PIN oder ähnliches, bevor sie die personalisierte Menühierarchie zur Verfügung stellt. Das Abrufen eines personalisierten Menüs kann im "Huckepackverfahren" zusammen mit anderen Funktionen erfolgen, die eine PIN oder Kontonummer erfordern, wie etwa zusammen mit einer Benutzerauthentifikation oder mit Sicherheitsprüfungen.
Außerdem kann ein Sprachnachrichtenserver 103 mit der PBX 100 gekoppelt sein und so konfiguriert sein, dass er einer Vielzahl von Benutzern Voice-Mail-Dienste zur Verfügung stellt. Entsprechend einer Ausführungsform der Erfindung kann die Reihenfolge der Menüpräsentation so aktualisiert werden, dass sie die von den Benutzern am häufigsten gewählten Optionen widerspiegelt, wie weiter unten erläutert wird. Es sind ein Spracherkennungsmodul 105, eine Steuereinheit 107 und ein Speicher 109 vorgesehen, um gesprochene Begriffe zu identifizieren, die verwendet werden sollen, um eine Ordner-Hierarchie zu erzeugen und zu unterhalten. Das Spracherkennungsmodul 105 und die Steuereinheit 107 sind so konfiguriert, dass sie vorgegebene gesprochene Worte erkennen und sie in Text umwandeln oder auf andere Weise die gesprochenen Worte verwenden, um eine "Betreff-Zeile" oder einen Ordner-Titel für die Nachricht zu liefern, und die Betreff-Kategorien verwenden, um eine Ordner-ähnliche Hierarchie herzustellen. Die "Betreff-Zeilen" und/oder Namen von Ordnern können in Text konvertiert werden und können von einer graphischen Benutzerschnittstelle (nicht dargestellt), die in den Personalcomputern 112d, 112e enthalten ist, verwendet werden. Außerdem können die Betreff-Zeilen auch entweder mittels Sprache oder mittels Tastatureingabe navigierbar sein.
Ein detaillierteres Blockschaltbild eines Sprachnachrichtenservers 103 ist in 2 dargestellt. Wie oben erläutert, umfasst ein Sprachnachrichtenserver 103 eine Steuereinheit 107, die mit einem Speichermodul 109 gekoppelt ist, und ein Spracherkennungsmodul 105. Die Steuereinheit 107 kann zum Beispiel ein Mikroprozessor wie etwa ein Pentium oder Pentium Pro sein. Es ist anzumerken, dass der Sprachnachrichtenserver 103, obwohl er hier als ein von der PBX 100 getrenntes Modul dargestellt ist, auch in diese integriert sein kann, und dass die Zentraleinheit 102 auch die Steuerfunktionen der Spracherkennung ausführen kann.
Das Spracherkennungsmodul 105 ist so geschaltet, dass es codierte Sprachdaten empfängt: zum Beispiel Filterkoeffizienten der linearen prädiktiven Codierung (linear predictive coding) und/oder Excitation Encoding Indizes, wie sie von einem VSELP (Vector Sum Excited Linear Prediction) -Codierer geliefert werden. Bei einem VSELP-Codierer sind die Filterkoeffizienten zum Beispiel für die Resonanzpeaks oder Formanten der eingegebenen Sprache repräsentativ. Es können auch andere Arten der Codierung angewendet werden.
Das Spracherkennungsmodul 105 enthält eine Frequenzgang- und Peakdetektor-Schaltung 50, die so konfiguriert ist, dass sie die Peakwerte von Sprachfrequenzen erfasst. Ein Formantenextraktions-Modul 52 ist mit dem Ausgang des Peakdetektors 50 gekoppelt, um die Formanten der charakterisierten Sprache zu extrahieren. Die Formanten werden von der Steuereinheit 107 verwendet, um eine Phonem-Datenbank im Speichermodul 109 zu durchsuchen, welche Informationen in Form einer Datenbank enthält, welche Formanten mit Phonemen korrelieren. Die Steuereinheit 107 interagiert mit der Datenbank derart, dass das beste repräsentative Phonem gewählt wird, und gibt diese Daten in einen Phonem-zu-Text-Konverter ein. Der Phonem-zu-Text-Konverter erzeugt eine Textdarstellung der zugehörigen Phonem-Sprachmuster. Die zu Text konvertierten Sprachmuster können zum Beispiel für Themen, Betreff-Zeilen, Ordner-Titel, Eingabekoordinaten oder ähnliches repräsentativ sein.
Obwohl oben ein spezielles Spracherkennungsmodul beschrieben wurde, kann es sich bei dem Spracherkennungsmodul 105 um jedes beliebige bekannte Spracherkennungsmodul handeln, wie etwa Phonem-gestützte Spracherkennungssysteme mit der Fähigkeit, neue Wörter einzuführen und sie operativ ("fliegend", d. h. ohne dass eine Unterbrechung erforderlich ist) verfügbar zu machen. In solchen Systemen kann eine Phonem-Vorverarbeitung eines genügend umfangreichen Vokabulars oder Lexikons angewendet werden, entweder über Sprach- oder über Texteingabe. Zum Beispiel kann das Spracherkennungsmodul 105 eine Spracherkennungskarte wie etwa die Spracherkennungs-Platine DVM-4S sein, die von Voice Control Systems, Inc., Dallas, Texas bezogen werden kann, oder in ihm können Systeme verwendet werden wie diejenigen, die in Hunt et al., US-Patent Nr. 5.499.288, das an Voice Control Systems, Inc. übertragen wurde, beschrieben werden, oder wie das System, das in Vollert, US-Patent Nr. 5.166.971, das an die Siemens AG übertragen wurde, beschrieben wird, oder wie das System, das in Arbel et al., US-Patent Nr. 5.276.731, das an Siemens Business Communications Systems, Inc. übertragen wurde, beschrieben wird, wobei diese Systeme hiermit durch Bezugnahme in ihrer Gesamtheit mit einbezogen werden, so als ob sie hier vollständig dargelegt wären. Ein anderes System, welches verwendet werden kann, ist das von De Vos und Kämmerer, "Algorithm and DSP Implementation for a Speaker-Independent Single-Word Speech Recognizer with Additional Speaker-Dependent Say-In Facility", Proceedings, Dritter Internationaler Workshop über Interaktive Sprachtechnologie für Telekommunikations-Anwendungen, 30. September bis 1. Oktober 1996, Basking Ridge, New Jersey, das ebenfalls durch Bezugnahme in seiner Gesamtheit mit einbezogen wird, so als ob es hier vollständig dargelegt wäre. In ähnlicher Weise kann eine Text-zu-Phonem-Konvertierung unter Verwendung des Systems PureSpeech ReCite! durchgeführt werden, das von Pure Speech, Inc. bezogen werden kann.
Das Spracherkennungsmodul 105 kann sowohl auf Anrufer als auch auf Benutzer reagieren. Ein Anrufer kann das Spracherkennungsmodul 105 verwenden oder mit ihm interagieren, um eine Betreff-Zeile zu liefern, wenn er eine Nachricht für den Benutzer hinterlässt. Wenn zum Beispiel der Anrufer anruft und zur Sprachmailbox des Benutzers geleitet wird, wird der Anrufer aufgefordert, eine Nachricht zu hinterlassen. Entweder bevor er beginnt, die Nachricht aufzuzeichnen, oder nachdem er die Aufzeichnung der Nachricht beendet hat, fordert das Voice-Mail-System den Benutzer auf, einen Betreff in sein Telefon zu sprechen. Das Spracherkennungsmodul 105 erkennt die Sprache und konvertiert die Betreff-Zeile in einen äquivalenten Text, wie weiter unten ausführlicher erläutert wird, welcher zusammen mit der Sprachnachricht gespeichert wird.
Es können auch andere Verfahren angewendet werden, um eine Betreff-Zeile einzugeben. Zum Beispiel kann der Anrufer einen aus ein oder zwei Wörtern bestehenden Betreff in eine Tonwahl-Tastatur eingeben, oder er kann den Betreff in einen PC-Netz-Computer oder ein Endgerät eingeben, welches über das Telefon an das Voice-Mail-System angeschlossen ist. Anschließend kann eine Text-zu-Phonem-Konvertierung für eine Phonem-gestützte Analyse (und eine Erkennung einer künftigen Spracheingabe) erfolgen, wie weiter unten ausführlicher erläutert wird. Die Text-zu-Phonem-Konvertierung kann unter Verwendung des Systems PureSpeech ReCite! durchgeführt werden, das von Pure Speech, Inc. bezogen werden kann. Schließlich kann der Anrufer auch einfach den Betreff hinzufügen, indem er in den Handapparat spricht und die Stimme als ein Audio-Betreff aufgezeichnet wird, ohne dass irgendeine Konvertierung in Text erfolgt. Stattdessen kann das System auch die gesamte Nachricht oder einen vorgegebenen Teil davon (z. B. 10 Sekunden) überwachen, um nach Begriffen zu suchen, die als Themen identifizierbar sind.
Sobald die von dem Anrufer gelieferte Betreff-Zeile hinzugefügt und zu Text konvertiert worden ist, kann das System in den Betreff-Zeilen von noch nicht abgespielten Nachrichten Suchen durchführen, so dass der Benutzer anhand des Betreffs auf seine Nachrichten zugreifen kann. Falls keine Konvertierung zu Text vorgesehen ist, können trotzdem Suchen durchgeführt werden, wobei diese jedoch auf der Analyse und dem Vergleich von Phonemen beruhen müssen, was zeitaufwendiger ist als eine Textsuche. Falls keine Bereitstellung einer Betreff-Zeile erfolgt, kann das Spracherkennungsmodul 105 trotzdem noch vorgesehen sein, um die empfangenen Sprachsignale zu analysieren. Die Nachricht kann in ihrer Gesamtheit zu Text konvertiert oder einfach in Form von Phonemen gespeichert werden.
Wenn der Benutzer auf seine noch nicht abgespielten Nachrichten zugreifen möchte, kann er dies anhand des Betreffs tun; zum Beispiel, indem er ein Thema ansagt wie etwa "Budget". Das System durchsucht daraufhin alle empfangenen und noch nicht abgespielten Nachrichten mit dem Ziel, Verwendungen des Ausdrucks "Budget" zu finden. Anschließend präsentiert das System dem Benutzer alle noch nicht abgespielten Nachrichten, die mit dem Thema "Budget" zusammenhängen.
Das Voice-Mail-System bietet dann dem Benutzer die Option, die Nachricht zu speichern. Daraufhin kann der Benutzer die Betreff-Zeile als den Namen eines Ordners akzeptieren, oder er kann einen anderen Namen ansagen oder per Tastatur eingeben. Falls der Name gesprochen wird, wird der Begriff (entweder Text oder Phonem) mit den gespeicherten Betreffs verglichen, und es wird auf die entsprechende Nachricht zugegriffen. Der Name kann entweder der Name eines existierenden Ordners oder der Name eines neuen Ordners sein. Wie weiter unten ausführlicher erläutert wird, kann der Benutzer, um auf gespeicherte Nachrichten zuzugreifen, entweder den Namen eines Ordners sprechen, um zu sämtlichen zu dem betreffenden Thema gehörenden Ordnern geleitet zu werden, oder er kann eine Koordinate des Ordners oder einer speziellen Nachricht ansagen oder über die Tastatur eingeben, oder er kann eine alphanumerische Kennung für den speziellen Ordner oder die spezielle Nachricht über die Tastatur eingeben. Außerdem kann die Erzeugung der Ordner-Hierarchie unter Verwendung einer Schnittstelle ohne Display auch eine Aktualisierung eines textbasierten Ordnersystems einer graphischen Benutzerschnittstelle auslösen. Zum Beispiel kann der Suchbegriff oder des Suchthema als Ordnername verwendet werden und die Nachricht darunter mit einer bestimmten Kennung gespeichert werden. Wenn der Benutzer das nächste Mal seinen Computer verwendet, kann er auf seine Nachricht per Text oder mittels einer Ordner-Graphik zugreifen.
Es wird nun auf 3 Bezug genommen; sie zeigt ein Schema, das allgemein ein hierarchisches Bedienerführungssystem 200 darstellt. Ein Anrufer ruft das Voice-Mail-System des Benutzers an und hinterlässt eine Nachricht. Der Voice-Mail-Server 103 kann dem Anrufer die Option zur Verfügung stellen, einen Nachrichtenkopf oder eine Betreff-Zeile zu hinterlassen. Das Spracherkennungsmodul 105 identifiziert den Betreff, welcher von der Steuereinheit 107 verwendet wird, um die Nachricht zu klassifizieren und in einem geeigneten Ordner zu speichern. Stattdessen kann das System auch so konfiguriert sein, dass im Hauptteil der Nachricht nach einem bestimmten Wort oder einer bestimmten Wendung gesucht wird und die Nachricht dann wieder entsprechend gespeichert wird.
Wenn ein entfernter Benutzer eines Telefonie-Endgerätes 112a–112c auf das System zugreift, ruft er das System an, und die Zentraleinheit 102 greift sowohl auf die Speichervorrichtung 104 als auch auf das Spracherzeugungsmodul 106 zu, um Sprachantworten auf verschiedene Benutzereingaben zu liefern. Das System kann für Spracherkennung ansprechbar sein, oder es kann ein Navigationssystem mit Eingabe von Koordinaten mittels Tastatur vorgesehen sein. Zu Beginn kann eine Begrüßungsmeldung 202 präsentiert werden. Der Benutzer kann die Möglichkeit haben, eine Betreff-Zeile oder einen Ordnernamen anzusagen, welcher dann vom System erkannt wird. In einem stärker begrenzten System erkennt das Spracherkennungsmodul möglicherweise nur einige Wörter oder Zahlen. In diesem Falle kann der Benutzer "weiter" sagen oder eine Koordinate nennen, wie weiter unten ausführlicher erläutert wird. Der Benutzer wird dann zu der entsprechenden Ebene geleitet. Stattdessen kann auch die Begrüßungsmeldung 202 den Eintritt in eine erste hierarchische Ebene 204 von Menüs oder Aufforderungen gewährleisten. Anschließend werden nacheinander mehrere Aufforderungen 204a–204c präsentiert. Bei jeder Aufforderung kann dem Benutzer die Option zur Verfügung gestellt werden, eine bestimmte Taste zu drücken oder bestimmte Worte zu sprechen, um zu einer nächsten Funktion oder Ebene zu gelangen. So wird der Benutzer zum Beispiel bei einer Aufforderung 204a zu einer zweiten Ebene von Aufforderungen 206 geleitet. Bei einer Aufforderung 204b wird der Benutzer zu einer zweiten Ebene von Aufforderungen 208 geleitet.
Im dargestellten Beispiel ist die Aufforderung 204c ein Endpunkt. Wenn dem Benutzer die Aufforderung 204c präsentiert wird, drückt er eine Taste, woraufhin eine Funktion ausgeführt wird (wie etwa die Zustellung einer Nachricht oder die Übermittlung von Kontostands-Informationen in einem IVR-System). Jede Aufforderung auf der zweiten Ebene von Aufforderungen 206, 208 kann selbst eine Funktion sein, oder sie kann die Option zur Verfügung stellen, weiter zu einer nächsten Ebene von Aufforderungen zu gelangen. Eine dritte Ebene von Aufforderungen, in die man von der Aufforderung 208c der Aufforderungsebene 208 aus gelangt, ist als Aufforderungsebene 210 dargestellt.
Wie oben erläutert wurde, kann den Benutzern auf jeder hierarchischen Aufforderungsebene eine Aufforderungsmeldung präsentiert werden. Zum Beispiel kann dem Benutzer auf der ersten hierarchischen Aufforderungsebene 204 eine Meldung bei der Aufforderung 204a präsentiert werden. Wenn der Benutzer zu diesem Zeitpunkt keine Aktion durchführt, wird dem Benutzer eine Meldung bei der Aufforderung 204b präsentiert, und wenn keine weitere Aktion durchgeführt wird, wird dem Benutzer bei der Aufforderung 204c eine Benutzer-Aufforderungsmeldung präsentiert. Wenn der Benutzer nicht die gesamten Meldungen bei den Aufforderungen 204a und 204b abwarten möchte, sondern stattdessen mit einer Auswahl bei 204c fortfahren möchte, muss der Benutzer nicht warten. Stattdessen kann der Benutzer eine Taste wählen, zum Beispiel die Rautetaste (#) oder die Sterntaste (*), während die Aufforderung bei 204a übermittelt wird. Stattdessen kann der Besucher auch "weiter" sagen. Das Wählen der Rautetaste oder der Sterntaste bzw. das gesprochene Wort "weiter" bewirkt, dass die Aufforderungsmeldung von der Aufforderung 204a zur Aufforderung 204b springt. Wenn die Aufforderungsmeldung 204b beginnt und der Benutzer die Aufforderung 204b überspringen möchte, kann der Benutzer erneut sprechen oder die Rautetaste oder die Sterntaste drücken, und er wird dann zur Aufforderungsmeldung bei der Aufforderung 204c geleitet.
Der Benutzer kann einen bestimmten zurückgelegten Weg speichern, so dass der Benutzer bei einer späteren Gelegenheit nicht durch das gesamte Bedienerführungssystem navigieren muss, bevor er zu der gewünschten Funktion gelangt. So hat zum Beispiel ein Benutzer möglicherweise auf das System zugegriffen, ist zum Beispiel anhand eines Passwortes (oder einer Kontonummer) identifiziert worden und ist zu einer Funktion auf der dritten hierarchischen Ebene 210 navigiert, speziell zur Funktion 210a. Entweder bevor oder nachdem die Funktion ausgeführt worden ist, kann dem Benutzer die Option zur Verfügung gestellt werden, den zurückgelegten Funktionspfad, d. h. die gewählte Endfunktion, zu speichern. Wenn der Benutzer die Option annimmt, zum Beispiel indem er die Rautetaste oder die Sterntaste drückt, kann dem Benutzer, wenn er sich das nächste Mal anmeldet, die Option zur Verfügung gestellt werden, direkt zu der betreffenden Funktion zu gelangen.
Zum Beispiel speichert die Zentraleinheit 102 im Speichermodul 104 eine Verknüpfung der Funktion mit dem Benutzer. Wenn sich der Benutzer das nächste Mal anmeldet, kann dem Benutzer eine neue Aufforderung übermittelt werden, und eine neue Benutzermitteilung vom Spracherzeugungsmodul 106 geliefert werden, welche dem Benutzer die Option zur Verfügung stellt, eine Funktionstaste zu wählen, um die durch die Aufforderung bei 210a gekennzeichnete Funktion direkt auszuführen. Falls der Benutzer die Funktion nicht verwenden möchte, kann der Benutzer wieder in das standardmäßige Aufforderungs-Navigationssystem gelangen.
Stattdessen kann das System auch dem Benutzer bei der Anmeldung die Option zur Verfügung stellen, die Koordinaten der zuletzt gewählten Funktion einzugeben. So würde zum Beispiel, wenn die zuletzt gewählte Funktion die mit der Aufforderung 210a verknüpfte Funktion war, dem Benutzer die Option zur Verfügung gestellt, die Ziffern (3,1) einzugeben (entweder durch Tastatureingabe oder durch Sprechen), welche die dritte hierarchische Ebene, erste Funktion bezeichnen. Der Benutzer würde anschließend direkt zu dieser Funktion gelangen. Auch in diesem Falle kann der Benutzer, falls er diese Funktion nicht wünscht, diese überspringen oder entsprechend dem normalen Ablauf zur standardmäßigen Navigations-Hierarchie gelangen.
Bei einer weiteren Ausführungsform dieser Koordinatenfunktion wird nicht zu Beginn bei der Anmeldung eine Aufforderung übermittelt, sondern es wird lediglich die Eingabe von Koordinaten akzeptiert, welche bewirken, dass der Benutzer unmittelbar zu der gewünschten Funktion springt. So kann der Benutzer zum Beispiel, wenn ihm die Aufforderungsmeldung bei der Aufforderung 204a präsentiert wird, die Rautetaste (#) und danach bestimmte Ziffern auf der Tastatur (3,1) drücken, um anzuzeigen, dass er unmittelbar zu der Funktion bei der Aufforderung 210a springen möchte.
Stattdessen kann der Benutzer auch die Wörter (3,1) sprechen und zur Aufforderung 210a geleitet werden.
Die Zentraleinheit 102 kann im Speichermodul 104 ein Menü von Koordinaten zur Navigation zwischen den Funktionen speichern, welches dem Benutzer ermöglicht, auf eine angegebene Funktion zuzugreifen. Zum Beispiel kann der Benutzer zu einem beliebigen Zeitpunkt die Präsentation von bestimmten Aufforderungsmeldungen unterbrechen und zu einem Menü geleitet werden. Zum Beispiel kann der Benutzer die Rautetaste oder die Sterntaste drücken und zu dem Menüsystem geleitet werden. Dieses kann zum Beispiel eine Ansage einer Liste von abgekürzten Aufforderungen beinhalten, gefolgt von Tasten, die gedrückt werden müssen, um direkt zu der angegebenen Funktion zu gelangen. Bei einer Ausführungsform kann der Benutzer Zahlen eingeben, welche Buchstaben auf der alphanumerischen Tastatur entsprechen. So kann der Benutzer zum Beispiel, wenn er Informationen zum Kontostand ("balance") wünscht, die Tasten (2,2,5)(BAL) drücken, um zur Funktion "Kontostands-Informationen" zu gelangen. Stattdessen könnte dem Benutzer auch bei jeder Aufforderung eine Koordinatenadresse der betreffenden Aufforderung präsentiert werden. Wenn der Benutzer zu einem späteren Zeitpunkt während seiner Sitzung am Bedienerführungssystem zu der einer gewünschten Funktion entsprechenden Aufforderung zurückkehren möchte, braucht er nur die numerische Adresse, die ihm zuvor gegeben wurde, über die Tastatur einzugeben. So braucht zum Beispiel der Benutzer, wenn er sich bei der Funktion befindet, die bei der Aufforderung 210b definiert ist, jedoch nun eine Funktion bei der Aufforderung 208b ausführen möchte, nur (#,2,5) zu drücken, um zu dieser Funktion zurückzukehren.
Schließlich kann der Benutzer auch zu einem beliebigen Zeitpunkt während der Sitzung zur Anfangs-Aufforderung auf einer angegebenen Aufforderungsebene zurückkehren. Wenn sich zum Beispiel der Benutzer auf der Aufforderungsebene 3 befindet, jedoch zur Aufforderungsebene 1 zurückkehren möchte, so kann der Benutzer (*,1) drücken (oder "zurück, 1" sagen), um zur Aufforderungsebene 1 zurückzukehren. In diesem Falle wird dem Benutzer die Aufforderung 204a präsentiert. Stattdessen kann das System auch so konfiguriert sein, dass der Benutzer eine vorgegebene Anzahl von Ebenen zurückgehen kann, entsprechend der Eingabe des Benutzers. Zum Beispiel kann der Benutzer (*) drücken, gefolgt von "2", oder "zurück, 2" sagen, um von der Aufforderungsebene 3 zur Aufforderungsebene 1 zurückzukehren.
Wie oben erläutert, betrifft ein Aspekt der vorliegenden Erfindung das automatische Aktualisieren der Reihenfolge der Menüpräsentation in IVR-, Multimedia- oder Sprachnachrichtenübermittlungs-Systemen auf der Basis der Häufigkeit der Verwendung. Zum Beispiel ist in den 9a–b ein Schema dargestellt, das die Aktualisierung der Menüreihenfolge gemäß einer Ausführungsform der vorliegenden Erfindung veranschaulicht. In dem dargestellten Beispiel ist ein beispielhaftes IVR-System einer Bank dargestellt. Insbesondere ermöglicht das IVR-System vier Funktionen: Kontostände, Geldüberweisungen, Überprüfung von Depotbeständen, Überprüfung von Schecks. Es ist anzumerken, dass in der Praxis eine Hierarchie verwendet werden kann, die der von 3 ähnlich ist; daher stellen die 9a–b lediglich Beispiele dar. Unter den anfänglichen Bedingungen präsentiert das System dem Benutzer die oben erwähnten Optionen in einer vorgegebenen Präsentationsreihenfolge, wie in 9a dargestellt. Die Auswahl der Aufforderungen kann durch das System überwacht werden, um zu ermitteln, wie häufig jede der Optionen gewählt wird. Auf der Basis der Häufigkeit der Auswahl durch die Benutzer kann die Präsentationsreihenfolge der Optionen so aktualisiert werden, dass die populärsten Optionen zuerst präsentiert werden. Ein Beispiel einer aktualisierten Präsentationsreihenfolge ist in
9b dargestellt. Die Benutzung des Systems wird wie oben erläutert überwacht, so dass die Anzahl der Benutzer, welche zum Beispiel Option 3 (SCHECK VERRECHNET) wählen, überwacht und ihre Benutzung gezählt wird. Wenn der Benutzer das nächste Mal anruft, hat das System möglicherweise die Menüpräsentation entsprechend der Häufigkeit der Benutzung aktualisiert. Dementsprechend kann das aktualisierte Menü in der folgenden Reihenfolge präsentiert werden: 3 DRÜCKEN, um zu sehen, ob ein Scheck verrechnet wurde; 2 DRÜCKEN, um Geld zu überweisen; 1 DRÜCKEN, um Kontostände zu prüfen; und 4 DRÜCKEN, um ein Depot zu überprüfen. Somit wird die Reihenfolge der Präsentation der Menüoptionen entsprechend der Häufigkeit der Benutzung geändert. Die Zahlen, welche auszuwählen sind, haben sich jedoch nicht geändert. Obwohl sich die Zahlen gemäß einer Ausführungsform ändern können, ist es vorzuziehen, dass sie unverändert bleiben, da sich die Benutzer oft ihre gewählten Optionen merken. Daher könnte ein Ändern der Zahlen zusätzlich zur Änderung der verbalen Reihenfolge Verwirrung verursachen. Zum Beispiel kann nach einer bestimmten Nutzungsdauer X das IVR-System erkennen, dass 20 % der Anrufe die Prüfung des Kontostands betreffen, 25 % Geldüberweisungen, 50 % das Verrechnen von Schecks und 5 % das Überprüfen eines Depots. Nach einer zweiten Zeitdauer, zum Beispiel Y Stunden, wird das Menü umgeordnet. Es ist anzumerken, dass die Zeitdauern Y und X in irgendeiner Beziehung zueinander stehen könnten.
Die Häufigkeit, mit welcher jede Aufforderung gewählt wird, kann bestimmt werden, indem gezählt wird, wie oft Benutzer eine bestimmte Option innerhalb eines vorgegebenen Zeitintervalls wählen. Das Zeitintervall der Stichprobenentnahme kann so gewählt werden, dass es Veränderungen hinsichtlich der Benutzung des Systems widerspiegelt. Wenn zum Beispiel das System wenig benutzt wird, kann das Zeitintervall der Stichprobenentnahme verlängert werden, so dass das Menü weniger oft aktualisiert wird. Umgekehrt kann in Zeitabschnitten intensiver Benutzung das Zeitintervall der Stichprobenentnahme verkürzt werden, so dass das Menü schnell aktualisiert werden kann, um Veränderungen hinsichtlich der Benutzung zu widerspiegeln. Die Benutzungsmuster können aus den Auswahlen bestimmt werden, die von einer Vielzahl von Benutzern getroffen wurden. Stattdessen können auch die Benutzungsmuster einzelner Benutzer verfolgt werden, um personalisierte Reihenfolgen der Menüpräsentation festzulegen. Einzelne Benutzungsmuster können verfolgt werden, indem ankommende Rufe überwacht werden und die von den Anrufern gewählten Optionen entweder einer Anrufer-Kennnummer oder einer von dem Anrufer eingegebenen PIN zugeordnet werden. Die Benutzungsmuster-Statistiken können von der Zentraleinheit 102 erstellt und in der Speichervorrichtung 104 gespeichert werden (1).
Es wird nun auf 4 Bezug genommen; sie zeigt ein Flussdiagramm der Funktionsweise eines Multimedia- oder IVR-Systems. In einem Schritt 302 wird einem Benutzer ermöglicht, auf das Telefon-Benutzerführungs-Menüsystem zuzugreifen, und ihm wird auf einer ersten Ebene eine Meldung geliefert.
Anschließend wird dem Benutzer in einem Schritt 304 eine erste Aufforderung aus einer Folge von Aufforderungen präsentiert. Während der Präsentation einer Aufforderungsmeldung kann der Benutzer in einem Schritt 306 eine Funktionstaste oder eine Folge von Tasten wählen oder einen Befehl sprechen. Falls der Benutzer dies tut, wird dem Benutzer in einem Schritt 310 eine Aufforderungsmeldung präsentiert, die entweder einer nächsten Aufforderung auf derselben Ebene oder einer angegebenen Aufforderung auf einer niedrigeren Ebene oder auf derselben Ebene entspricht. Falls der Benutzer jedoch im Schritt 306 keine Funktionstaste gedrückt hat, so wird dem Benutzer in einem Schritt 308 lediglich die Folge von Aufforderungen übermittelt. Es ist anzumerken, dass das System ein Timeout oder eine Trennung der Verbindung vorsehen kann, falls innerhalb eines vorgegebenen Zeitintervalls keine Eingabe empfangen wird. Wenn der Benutzer im Schritt 308 eine Taste wählen würde, so würde der Benutzer anschließend in einem Schritt 310 zu einer nächsten Ebene von Aufforderungen geleitet. Wie oben erläutert, kann die Wahl einer oder mehrerer Funktionstasten im Schritt 306 beinhalten: 1) Zugreifen auf eine vorprogrammierte alphanumerische Adresse; 2) auf eine vorgegebene höhere Ebene oder Ebenen über der gegenwärtigen Ebene; oder 3) auf eine nächste Aufforderung auf derselben Aufforderungsebene. Sie kann ferner dem Benutzer ermöglichen, den Namen eines Ordners, eines Kennsatzes oder einer Aufforderung zu sagen, oder den Start der Anwendung oder eine Koordinate, und zu dem entsprechenden Ordner oder der entsprechenden Anwendung geleitet zu werden. Es kann entweder eine textbasierte oder eine sprachbasierte Suchroutine angewendet werden.
Es wird nun auf 5 Bezug genommen; sie zeigt ein Flussdiagramm 400, welches ein Verfahren zum Aufzeichnen und Speichern eines Navigationspfades oder -ziels veranschaulicht. Das Verfahren von 5 ist insbesondere in einem System von Nutzen, welches über keine oder nur über begrenzte Mittel zur Spracherkennung verfügt. In einem Anfangsschritt, zum Beispiel in einer Begrüßungsmeldung, kann die Zentraleinheit 102 auf den Sprachsynthesizer 106 zugreifen, um einem Benutzer eine Mitteilung zu übermitteln, so dass der Benutzer in einem Schritt 402 in einen Aufzeichnungsmodus eintritt. Der Eintritt in den Aufzeichnungsmodus 402 kann zum Beispiel erfolgen, indem der Benutzer eine bestimmte Taste oder Tastenfolge auf seiner Telefontastatur wählt oder indem er bestimmte Wörter spricht. Falls der Benutzer in den Aufzeichnungsmodus eintritt, wird dem Benutzer in einem Schritt 404 eine Folge von Aufforderungen in der standardmäßigen Reihenfolge präsentiert. Auf jeder Stufe entlang des Weges kann der Benutzer in einem Schritt 406 mittels Sprach- oder Tastatureingabe eine Aufforderung wählen.
Die Wahl einer Aufforderung durch den Benutzer kann das Springen zu einer Aufforderung auf einer anderen Ebene oder zu einer anderen Aufforderung auf derselben Ebene beinhalten, oder sie kann das Durchlaufen der Aufforderungen auf die standardmäßige Weise beinhalten. In jedem Falle zeichnet die Zentraleinheit 102 in einem Schritt 408 die Wahl auf und verknüpft sie mit der Kennnummer des Benutzers. Der Benutzer wird dann in einem Schritt 410 zu der entsprechenden Ebene geleitet, woraufhin der Benutzer in einem Schritt 412 die gewünschte Wahl vornimmt. Die Zentraleinheit 102 führt dann in einem Schritt 414 die gewünschte Funktion aus und zeichnet die endgültige Wahl auf. Falls der Benutzer dies noch nicht getan hat, kann der Benutzer in einem Schritt 416 einen Kennungscode speichern, welchen die Zentraleinheit dann im Speichermodul 104 speichert. Der Kennungscode kann zum Beispiel eine Kontonummer oder ein anderes standardmäßiges Kennungsmittel sein. Wenn sich der Benutzer das nächste Mal im System anmeldet, wird dem Benutzer die Option zur Verfügung gestellt, den aufgezeichneten Zielpfad wie oben beschrieben zu wählen.
Es wird nun auf 6a Bezug genommen; sie zeigt ein Flussdiagramm, welches ein Verfahren zur Verarbeitung empfangener Voice-Mail-Nachrichten veranschaulicht. Genauer, in einem Schritt 602 kann ein Anrufer eine Verbindung mit der Mailbox des Benutzers herstellen. Das Voice-Mail-System ermöglicht dann dem Anrufer, eine Nachricht zuzustellen, und fordert den Anrufer in einem Schritt 604 auf, eine Betreff-Zeile anzugeben. Die Betreff-Zeile wird in einem Schritt 608 empfangen. Bei der Betreff-Zeile kann es sich um eine gesprochene Betreff-Zeile oder eine Text-Betreff-Zeile handeln, welche ihrerseits in Phoneme konvertiert werden kann. Das Spracherkennungsmodul 105 kann Schlüsselsätze erkennen, zum Beispiel durch Extraktion und Vergleich von Phonemen, wie oben beschrieben. Falls die Betreff-Zeile als eine gesprochene Nachricht eingegeben wird, kann diese in einem Schritt 610 zu Text konvertiert werden. Das Konvertieren der empfangenen Nachricht zu Text umfasst zum Beispiel das Analysieren des Frequenzspektrums und das Identifizieren von Phonemen, welche entsprechenden Sprachsignalen und Parametern entsprechen. Schließlich werden, nachdem die Betreff-Zeile eingegeben und identifiziert worden ist, die Nachrichten für die Zustellung entsprechend der Betreff-Zeile gespeichert.
Ein anderes Verfahren zur Organisation von Nachrichten, die nach Themen zu Gruppen zusammengefasst werden, ist als Flussdiagramm in 6b dargestellt. Genauer, ein Anrufer kann in einem Schritt 614 eine Verbindung zu einer Mailbox herstellen. Der Anrufer kann anschließend in einem Schritt 616 eine Nachricht aufzeichnen. Falls in einem Schritt 618 eine gesprochene Betreff-Zeile hinzugefügt werden soll, so kann der Benutzer in einem Schritt 622 die Betreff-Zeile sprechen. Die entsprechenden Sprachdaten werden dann in einem Schritt 624 gespeichert. Falls jedoch im Schritt 618 keine Betreff-Zeile verfügbar wäre, könnte der Anrufer einfach die gesamte Nachricht sprechen, und das System würde in einem Schritt 620 die gesamte Nachricht oder einen vorgegebenen Teil davon analysieren. In einem Schritt 624 können dann relevante Begriffe, die möglicherweise im Voraus aufgezeichnet wurden, klassifiziert und als Phoneme gespeichert werden. Wenn der Benutzer auf seine Nachrichten zugreifen möchte, kann er dies tun, indem er ein Thema nennt, und sie werden zugestellt.
6c zeigt ein Flussdiagramm eines Verfahrens, gemäß dem ein Benutzer auf eine Mailbox zugreifen kann. In einem Schritt 626 greift der Benutzer auf seine Mailbox zu, zum Beispiel indem er im Anschluss an die Eingabe seiner Mailbox-Nummer einen Kennungscode per Tastatur eingibt oder spricht. In einem Schritt 628 kann das Voice-Mail-System eine Liste von Betreffs von Nachrichten aufzählen. Es ist anzumerken, dass die Betreffs oder Kennsätze entweder vom Anrufer geliefert (im Falle von noch nicht abgespielten Nachrichten) oder benutzerdefiniert (im Falle von bereits abgespielten, gespeicherten Nachrichten) sein können. Im Falle von noch nicht abgespielten Nachrichten wird am Ende jeder Nennung eines Betreffs dem Benutzer die Option zur Verfügung gestellt, in einem Schritt 630 eine Taste zu drücken oder einen Befehl zu sprechen, um auf die Nachricht zuzugreifen. Im Falle von gespeicherten Nachrichten kann der Zugriff direkt auf die Nachricht erfolgen, wie oben beschrieben (z. B. durch Eingeben der Koordinate oder durch Sprechen des Betreffs oder des Kennsatz-Namens). Sobald der Benutzer die Taste drückt oder mit "ja" antwortet, wird in einem Schritt 632 die Nachricht zugestellt. Wie weiter unten ausführlicher erläutert wird, kann im Falle des Zugreifens auf noch nicht abgespielte Nachrichten dem Benutzer dann die Option zur Verfügung gestellt werden, die Nachricht entsprechend dem vom Anrufer angegebenen Betreff zu speichern oder den vom Anrufer angegebenen Betreff in einen vom Benutzer selbst gewählten Betreff zu ändern.
Ein anderes Verfahren zum Zugreifen auf Nachrichten in einer Mailbox ist in 6d dargestellt. Wie oben greift der Benutzer in einem Schritt 634 auf seine Mailbox zu. In einem Schritt 636 kann der Benutzer zum Beispiel eine Betreff-Zeile oder ein Thema nennen. Die Betreff-Zeile bzw. das Thema kann entweder die bzw. das von noch nicht abgespielten oder von gespeicherten Nachrichten sein. In einem Sortierschritt 638 analysiert dann das Spracherkennungsmodul 105 des Voice-Mail-Systems die gesprochene Eingabe und vergleicht die Phoneme mit denen der gespeicherten Betreff-Zeilen. In einem Schritt 640 identifiziert dann das System die entsprechende Betreff-Zeile und übermittelt die Nachricht. Auch in diesem Falle kann, wie weiter unten ausführlicher erläutert wird, der Benutzer im Falle von noch nicht abgespielten Nachrichten dann die Nachricht operativ entsprechend einer neu erzeugten oder einer schon vorhandenen Ordner-Hierarchie speichern.
Ein Flussdiagramm eines solchen Verfahrens zum Organisieren von Nachrichten in einer Mailbox zeigt 7. Genauer, in einem Schritt 702 kann der Zugriff eines Benutzers auf eine Mailbox ermöglicht werden. Das Voice-Mail-System kann dann in einem Schritt 704 die noch nicht abgespielten entsprechenden Nachrichten abspielen. Wie oben erläutert wurde, können die noch nicht abgespielten Nachrichten in einer "Eingangs-Box" entsprechend einer vom Anrufer definierten Betreff-Zeile gespeichert werden. Sobald die Nachrichten abgespielt werden, kann dem Benutzer in einem Schritt 706 die Option zur Verfügung gestellt werden, die Nachrichten zu speichern. Falls der Benutzer die Nachrichten nicht speichern möchte, fordert das Voice-Mail-System dann den Benutzer auf, das Mailboxsystem zu verlassen oder auf eine andere Nachricht zuzugreifen. Falls der Benutzer jedoch die Nachricht speichern möchte, wird ihm in einem Schritt 708 die Gelegenheit gegeben, den entsprechenden Ordner zu benennen, in welchem die Nachricht gespeichert werden soll. Eine durch den Benutzer erfolgende Festlegung einer Kennung des Ordners oder eines Kennsatzes überschreibt die Betreff-Zeile oder den Kennsatz, die bzw. der eventuell vom Anrufer geliefert wurde. Der Benutzer kann den Ordner mit einer Kennung versehen, indem er Buchstaben über eine Tonwahl-Tastatur eingibt, oder indem er den Namen des Ordners ansagt. Falls das System über Spracherkennungs-Funktionen verfügt, wird das gesprochene Wort mit den Betreffs der gespeicherten Ordner verglichen. Dieser Vergleich kann entweder über Sprachanalyse erfolgen (d. h. indem die Phoneme der gesprochenen Wörter direkt mit denjenigen verglichen werden, welche die Ordner kennzeichnen), oder indem die gesprochenen Wörter zu Text konvertiert werden und die zu Text konvertierte Betreff-Zeile mit den zu Text konvertierten Namen der Ordner verglichen wird, oder indem der zu Phonemen konvertierte Text mit gespeicherten Phonemen verglichen wird. Falls der Ordner in einem Schritt 710 als ein existierender Ordner identifiziert wird, wird die Nachricht in einem Schritt 714 in diesem Ordner gespeichert.
Falls jedoch im Schritt 710 die Nachricht als nicht zu einem existierenden Ordner gehörend identifiziert würde, so würde in einem Schritt 712 ein neuer Ordner angelegt, und die Nachricht würde in einem Schritt 714 in diesem gespeichert. Das Erzeugen des neuen Nachrichten-Ordners kann entweder mit Hilfe von Sprachmethoden erfolgen, oder durch Eingabe über eine Telefontastatur, oder über eine an einen Computer angeschlossene Tastatur. An eine solche Tastatureingabe kann sich eine Konvertierung zu Phonemen anschließen. Nachdem die Ordner mit einer Kennung versehen worden sind, können sie im Computer gespeichert und zu Text konvertiert werden, so dass ein Benutzer über eine textbasierte graphische Benutzerschnittstelle auf sie zugreifen kann.
Es wird nun auf 8 Bezug genommen; sie zeigt ein Flussdiagramm 800, welches ein Verfahren zum Erstellen von Mailbox-Makros veranschaulicht. Genauer, die vorliegende Erfindung stellt eine Funktion zur Verfügung, um operativ ("fliegend", d. h. ohne dass eine Unterbrechung erforderlich ist) Mailing-Listen, einschließlich von "Weiterleitungs"-Listen oder "Verteiler"-Listen, Zeitpläne für die externe Benachrichtigung (Outcalling) und Nachrichten zu erstellen. In einem Schritt 802 gibt der Benutzer, der von einer Schnittstelle ohne Display aus auf das Nachrichtenübermittlungssystem zugreift, einen Befehl ein, um eine Mailing-Liste zu erstellen. Dies kann zum Beispiel beinhalten, dass er sagt: "Liste erstellen." Stattdessen kann der Benutzer auch eine vorgegebene Folge von Tasten drücken, wie oben erläutert. Sobald der Benutzer auf die Funktion "Liste erstellen" zugegriffen hat, kann er in einem Schritt 804 die eigentliche Liste erstellen. Dies kann zum Beispiel auf die Weise erfolgen, dass der Benutzer eine gewünschte Weiterleitungs-Nummer und einen Namen eines Empfängers ansagt.
Nachdem die gewünschte Mailing-Liste erstellt worden ist, speichert der Benutzer in einem Schritt 806 die Liste in einem Ordner mit einem Betreff-Kopf. Dies kann zum Beispiel auf die Weise erfolgen, dass der Benutzer den Namen der Mailing-Liste sagt; das System verknüpft dann den Betreff-Namen mit dem Ordner der Mailing-Liste auf eine ähnliche Weise wie oben erläutert.
Die Liste kann dann verwendet werden, um Nachrichten weiterzuleiten und/oder um Nachrichten gemäß einem vordefinierten Zeitplan zu senden. Zum Beispiel kann der Benutzer in einem Schritt 808 auf eine Nachricht zugreifen. Dabei kann es sich darum handeln, dass auf eine neu empfangene Nachricht zugegriffen wird, dass eine gespeicherte Nachricht abgefragt wird oder dass eine neue Nachricht erstellt wird. Nachdem auf die Nachricht zugegriffen worden ist oder die Nachricht erstellt worden ist, kann der Benutzer in einem Schritt 810 die Nachricht an die Gruppe weiterleiten oder senden, die in der Mailing-Liste definiert ist. Zum Beispiel kann der Benutzer, wenn er vom Nachrichtenübermittlungssystem die Anfrage erhält, ob er die Nachricht weiterleiten möchte, den Namen des Ordners der Mailing-Liste nennen. Der Benutzer kann auch einen bestimmten Zeitpunkt nennen, zu dem er wünscht, dass die Nachricht gesendet wird. Das System greift auf den Ordner zu, welcher die Mailing-Liste definiert, liest die Namen und Nummern der Empfänger und leitet die Nachricht dementsprechend weiter.
Es wird nun auf 10 Bezug genommen; sie zeigt ein Flussdiagramm 1000, welches die Funktionsweise des Menüaktualisierungs-Merkmals gemäß der vorliegenden Erfindung darstellt. Genauer, in einem Schritt 1002 überwacht das System alle Anrufe, die empfangen werden. In einem Schritt 1004 weist die Zentraleinheit die vom Benutzer getroffene Auswahl zu oder aktualisiert einen Auswahlzähler im Speichermodul 104. In einem Schritt 1006 vergleicht die Zentraleinheit nach einer vorgegebenen Zeit die Nutzungen, d.h. vergleicht die Anzahl der "Treffer" einer bestimmten Menüauswahl. Schließlich aktualisiert die Zentraleinheit 102 in einem Schritt 1008 die Reihenfolge der Präsentation derart, dass, wenn das nächste Mal eine Menüauswahl vorgenommen wird, die Menüreihenfolge der neu aktualisierten Reihenfolge entspricht. Das Menü kann so angeordnet werden, dass die häufiger gewählten Optionen zuerst präsentiert werden.
Das Menüaktualisierungs-Merkmal, das in 10 beschrieben ist, kann in Verbindung mit IVR-Systemen ebenso wie mit Multimedia- und Sprachnachrichtenübermittlungs-Systemen verwendet werden.

Claims

Verfahren zur Bedienerführung eines Benutzers, das in einem interaktiven Sprachantwortsystem (IVR-System) implementiert ist, gekennzeichnet durch: Überwachen (1002) wenigstens eines ankommenden Rufes für das IVR-System, um ein Muster der Auswahl einer Aufforderung aus einer Vielzahl von Aufforderungen zu bestimmen; Anpassen (1006) einer Reihenfolge der Präsentation der besagten Vielzahl von Aufforderungen auf der Basis des Musters der Auswahl einer Aufforderung; und Bedienerführung (1008) des Benutzers entsprechend der angepassten Reihenfolge der Präsentation von Aufforderungen.
Verfahren nach Anspruch 1, welches ferner umfasst: Überwachen einer Vielzahl von ankommenden Rufen von einer Vielzahl von Benutzern, um das Muster der Auswahl einer Aufforderung zu erzeugen.
Verfahren nach Anspruch 1, welches ferner umfasst: Überwachen einer Vielzahl von ankommenden Rufen von dem Benutzer, um das Muster der Auswahl einer Aufforderung zu erzeugen.
Verfahren nach Anspruch 1, welches ferner umfasst: Wählen der Präsentationsreihenfolge als eine Funktion einer Anruferkennung, die dem Benutzer entspricht.
Verfahren nach Anspruch 1, welches ferner umfasst: Wählen der Präsentationsreihenfolge als eine Funktion einer persönlichen Identifikationsnummer (PIN), die von dem Benutzer eingegeben wird.
Verfahren nach Anspruch 1, wobei die am häufigsten gewählte Aufforderung in der angepassten Präsentationsreihenfolge zuerst erscheint.
Interaktives Sprachantwortsystem (IVR-System) (101), gekennzeichnet durch ein Vermittlungssteuermodul (108), das dazu dient, wenigstens einem Telefonie-Endgerät (112–113) zu ermöglichen, auf das IVR-System zuzugreifen; eine mit dem Vermittlungssteuermodul gekoppelte Zentraleinheit; eine erste auf der Zentraleinheit ausführbare Softwareroutine zum Übertragen einer Vielzahl von Aufforderungen zu dem wenigstens einen Telefonie-Endgerät; eine zweite auf der Zentraleinheit ausführbare Softwareroutine zum Kompilieren von Aufforderungsauswahl-Statistiken auf der Basis einer Vielzahl von Anruferantworten auf die Aufforderungen; und eine dritte Softwareroutine zum Anpassen der Reihenfolge der Präsentation von Aufforderungen auf der Basis der Aufforderungsauswahl-Statistiken.
System nach Anspruch 7, welches ferner umfasst: eine mit der Zentraleinheit gekoppelte Speichervorrichtung (104) zum Speichern der Aufforderungsauswahl-Statistiken.
System nach Anspruch 7, welches ferner umfasst: ein Anruferidentifikationsmodul (111), das mit der Zentraleinheit gekoppelt ist, wobei das Anruferidentifikationsmodul (111) dazu dient, Anruferidentifikations-Informationen zu überwachen, die von Telefonie-Endgeräten geliefert werden.
System nach Anspruch 7, welches ferner umfasst: ein Zweiton-Mehrfrequenzmodul (DTMF-Modul) (110), das mit der Zentraleinheit gekoppelt ist und dazu dient, der zweiten Softwareroutine die Anruferantworten zur Verfügung zu stellen.