-
HINTERGRUND DER ERFINDUNG
-
Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft Bedienerführungssysteme und insbesondere
ein Verfahren zum Verbessern einer Benutzerschnittstelle für ein Bedienerführungssystem.
-
Beschreibung
des Standes der Technik Telefongestützte Bedienerführungssysteme
werden in zunehmendem Maße
verwendet, sowohl um eine Schnittstelle für Voice-Mail-Systeme zur Verfügung zu
stellen als auch um eine Schnittstelle für interaktive Sprachantwortsysteme
zur Verfügung
zu stellen, wie etwa für
Reservierungen bei Fluggesellschaften, Kontoverbindungen von Bankkunden
und andere Verbindungen von Institutionen und Einrichtungen, wie
etwa für
staatliche Behörden,
Versorgungsunternehmen, Kreditkartenfirmen und ähnliches. Auf viele Systeme,
wie etwa diejenigen, die zum Banking oder für den Aktienhandel verwendet
werden, kann von einzelnen Benutzern häufig zugegriffen werden, oft mehrmals
am Tage. In solchen Systemen werden Benutzern hierarchische Ebenen
von Aufforderungen präsentiert,
durch die navigiert wird, indem Tasten auf der Telefontastatur gedrückt werden.
Die resultierenden DTMF-Signale
(Dual Tone Multifrequency, Zweiton-Mehrfrequenzsignale) werden von dem
Bedienerführungssystem
empfangen und verwendet, um auf eine andere Ebene in der Hierarchie
zuzugreifen oder um auf eine bestimmte Funktion zuzugreifen.
-
Oft
sorgen solche Bedienerführungssysteme dadurch
für Unmut
bei den Benutzern, dass sie nur eine vorgegebene Menge von Aufforderungen
in einer vorgegebenen Reihenfolge zur Verfügung stellen. Dem Benutzer,
welcher seinen Weg durch die Menge von Aufforderungen zum Erreichen
eines bestimmten Ziels kennt, müssen
trotzdem gesprochene Mitteilungen präsentiert werden, welche die
einzelnen Aufforderungszustände kennzeichnen.
Obwohl sequentielle Übersteuerungen
verfügbar
sind, muss der Benutzer nach wie vor eine Tastatureingabe für jeden
Zustand vornehmen.
-
Gewisse
bekannte Telefon-Bedienerführungssysteme
ermöglichen
einem Benutzer, eine Funktion zu wählen, welche die Aufforderungen
abkürzt.
So könnte
dem Benutzer zum Beispiel anstelle von Aufforderungen wie "Wenn Sie Informationen wünschen,
welche Ankünfte
und Abflüge
betreffen, drücken
Sie bitte jetzt die 1" die
Aufforderung "Ankünfte und
Abflüge – 1 drücken" präsentiert
werden. Bei solchen Systemen ist es jedoch nach wie vor erforderlich,
dass der Benutzer durch die einzelnen Aufforderungen navigiert,
bevor er eine gewünschte Funktion
erreicht. In ähnlicher
Weise ermöglichen
andere Systeme dem Benutzer, von einer hierarchischen Ebene zu einer
anderen hierarchischen Ebene zu springen, jedoch erst, wenn ihm
eine gesonderte Aufforderung übermittelt
wird.
-
Derartige
Systeme weisen noch weitere Nachteile auf. Insbesondere gestatten
diese Systeme keine dynamische Aktualisierung; d.h. sie passen sich
nicht automatisch an Benutzungsmuster an, welche sich im Laufe der
Zeit ändern.
-
Dies
ist besonders in Systemen von Nachteil, auf welche von Benutzern
häufig
zugegriffen wird. Jeder Benutzer muss eine vorgegebene Menüpräsentation
abwarten, welche oft unnötig
ist, wenn der Benutzer wiederholt nach einem festgelegten Muster dieselben
Menüoptionen
auswählt.
Beträchtliche
Zeitersparnisse können
dadurch erzielt werden, dass das Menü so umgeordnet wird, dass die
häufiger
gewählten
Optionen zuerst präsentiert
werden.
-
Zum
Beispiel können
in einem Sprachantwortsystem eines Personal-Servicecenters einer
Firma verschiedene menügesteuerte
Sprachantwort-Optionen zur Verfügung
stehen, wie etwa Salden von Pensionskassen, Angaben zum Arbeitsverhältnis, Angaben
zu Zahlungen für
medizinische Leistungen oder ähnliches.
Zahlreiche Anforderungen von Informationen über das Sozialzulagensystem
der Firma können
während
der Woche eingehen, die einer angekündigten Änderung unmittelbar folgt. Vor
der Änderung
waren möglicherweise
Auskünfte zum
Arbeitsverhältnis
die am häufigsten
angeforderte Option. Bei einem herkömmlichen Sprachantwortsystem
müssten
Mitarbeiter der Firma die Änderung in
den Anrufmustern erkennen und das Menü manuell umordnen, um die populärsten Optionen
zuerst zu präsentieren.
Andernfalls müssten
alle Anrufer eine möglicherweise
sehr lange Menüpräsentation
durchlaufen, bevor ihnen die gewünschte
Option zur Verfügung
gestellt wird.
-
Nicht
von Institutionen und Einrichtungen betriebene, dynamische Bedienerführungssysteme
(d. h. solche, welche nicht bereits "fixiert" sind), wie etwa die für firmeninterne
Voice-Mail-Systeme,
weisen in ähnlicher
Weise Unzulänglichkeiten
bei der Speicherung und beim Wiederabruf auf. Insbesondere haben Benutzer
solcher Systeme, welche Nachrichten speichern möchten, keine Möglichkeit,
die gespeicherten Nachrichten zu organisieren, wenn sie eine Schnittstelle
ohne Display wie etwa ein Telefon verwenden. Solche Benutzer haben
nur die Wahl, die Nachrichten zu speichern oder nicht zu speichern.
Die Nachrichten werden dann in einer linearen Warteschlange gespeichert.
Oft werden solche Nachrichten in der Reihenfolge ihres Eintreffens
oder in der umgekehrten Reihenfolge gespeichert, ohne irgendwelche
weiteren hinzugefügten
Informationen. Wenn eine der gespeicherten Nachrichten wieder abgerufen
werden soll, muss der Benutzer die einzelnen Aufforderungen für die einzelnen
Nachrichten oder für
deren Nachrichtenkopf (Header) anhören. Der Benutzer ist somit
nicht in der Lage, seine gespeicherten Nachrichten nach einer speziellen
gewünschten
Nachricht zu durchsuchen.
-
Obwohl
die Verwendung einer graphischen Benutzerschnittstelle (Graphical
User Interface, GUI) wie etwa von der Art, wie sie bei Systemen
mit Computer-Telefonie- Schnittstelle
(Computer-Telephony Interface, CTI) zur Verfügung stehen, eine Möglichkeit
bietet, Nachrichten zu organisieren, stehen solche GUI oft nicht
zur Verfügung,
wenn Benutzer per Fernabfrage auf Nachrichten zugreifen möchten.
-
EP 0 827 320 beschreibt
ein Verfahren und ein System zur Sprachmenü-Optimierung.
-
WO
98/02836 beschreibt ein computergestütztes medizinisches Diagnosesystem,
bei dem eine listenbasierte Verarbeitung benutzt wird.
-
Benötigt wird
daher ein verbessertes Verfahren zum Navigieren zwischen und über hierarchische Menüebenen in
einem Telefon-Bedienerführungssystem.
Insbesondere besteht Bedarf an einem Bedienerführungssystem, in welchem ein
Benutzer schneller zu einer gewünschten
Funktion navigieren kann. Ferner besteht Bedarf an einem verbesserten
Verfahren des Organisierens von Voice-Mail- oder Multimedia-Nachrichten
von einer nicht über
ein Display verfügenden
Schnittstelle aus. Insbesondere besteht Bedarf an einem Bedienerführungs-
oder Nachrichtenübermittlungssystem,
welches operative Sprachkennzeichnung (Voice Labelling) und Nachrichtenorganisation
ermöglicht.
Ferner besteht Bedarf an einem System, welches eine automatische
Aktualisierung und Neukonfiguration der Menüoptionen in einem interaktiven
Sprachantwortsystem (Interactive Voice Response System, IVR-System) ermöglicht.
-
ZUSAMENFASSUNG DER ERFINDUNG
-
Diese
und andere Nachteile des Standes der Technik werden durch ein System
und ein Verfahren gemäß der vorliegenden
Erfindung zum großen
Teil überwunden.
-
Gemäß der vorliegenden
Erfindung wird ein in einem interaktiven Sprachantwortsystem (IVR-System)
implementiertes Verfahren zur Bedienerführung eines Benutzers bereitgestellt,
welches gekennzeichnet ist durch: Überwachen wenigstens eines ankommenden
Rufes für
das IVR-System, um ein Muster der Auswahl einer Aufforderung aus
einer Vielzahl von Aufforderungen zu bestimmen; Anpassen einer Reihenfolge
der Präsentation
der besagten Vielzahl von Aufforderungen auf der Basis des Musters
der Auswahl einer Aufforderung; und Bedienerführung des Benutzers entsprechend
der angepassten Reihenfolge der Präsentation von Aufforderungen.
-
Gemäß der vorliegenden
Erfindung wird außerdem
ein interaktives Sprachantwortsystem (IVR-System) bereitgestellt,
welches gekennzeichnet ist durch ein Vermittlungssteuermodul, das
dazu dient, wenigstens einem Telefonie-Endgerät zu ermöglichen, auf das IVR-System
zuzugreifen; eine mit dem Vermittlungssteuermodul gekoppelte Zentraleinheit;
eine erste auf der Zentraleinheit ausführbare Softwareroutine zum Übertragen
einer Vielzahl von Aufforderungen zu dem wenigstens einen Telefonie-Endgerät; eine
zweite auf der Zentraleinheit ausführbare Softwareroutine zum
Kompilieren von Aufforderungsauswahl-Statistiken auf der Basis einer Vielzahl
von Anruferantworten auf die Aufforderungen; und eine dritte Softwareroutine
zum Anpassen der Reihenfolge der Präsentation von Aufforderungen
auf der Basis der Aufforderungsauswahl-Statistiken.
-
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
Ein
besseres Verständnis
der vorliegenden Erfindung wird durch das Studium der nachfolgenden ausführlichen
Beschreibung in Verbindung mit den beigefügten Zeichnungen erreicht,
wobei:
-
1 ein
Blockschaltbild eines Telefon-Bedienerführungssystems
gemäß einer
Ausführungsform
der vorliegenden Erfindung ist;
-
2 ein
detaillierteres Blockschaltbild eines Sprachnachrichtenservers gemäß einer
Ausführungsform
der vorliegenden Erfindung ist;
-
3 eine
Darstellung eines hierarchischen Menüsystems gemäß einer Ausführungsform der
vorliegenden Erfindung ist;
-
4 ein
Flussdiagramm eines Verfahrens gemäß einer Ausführungsform
der vorliegenden Erfindung ist;
-
5 ein
Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform
der vorliegenden Erfindung ist;
-
6 ein Flussdiagramm eines Verfahrens gemäß einer
anderen Ausführungsform
der vorliegenden Erfindung ist;
-
7 ein
Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform
der vorliegenden Erfindung ist;
-
8 ein
Flussdiagramm eines Verfahrens gemäß einer anderen Ausführungsform
der vorliegenden Erfindung ist;
-
9a–b das Aktualisieren
der Reihenfolge einer Menüpräsentation
gemäß einer
Ausführungsform
der vorliegenden Erfindung zeigen;
-
10 ein
Flussdiagramm eines Verfahrens zum Konfigurieren der Reihenfolge
der Präsentation
von Menüoptionen
gemäß einer
weiteren Ausführungsform
der vorliegenden Erfindung ist.
-
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
-
Es
wird nun auf die Zeichnungen und insbesondere auf 1 Bezug
genommen; sie zeigt ein Blockschaltbild, welches ein interaktives
Sprachantwortsystem (Interactive Voice Response System, IVR-System) 101 gemäß einer
Ausführungsform
der vorliegenden Erfindung darstellt. Es ist anzumerken, dass, obwohl
ein IVR-System dargestellt ist, ein Nachrichtenübermittlungssystem eines beliebigen Typs
verwendet werden kann, wie etwa ein integriertes Sprachkommunikations- und E-Mail-System.
Das IVR-System 101 kann ein zur Kundenbetreuung eingesetztes
Bedienerführungssystem
oder ein Voice-Mail-System oder irgendeine Kombination davon sein.
Das System 101 ist so gestaltet, dass es im Vergleich zu
früheren
IVR-Systemen eine verbesserte Organisation und Navigation ermöglicht.
Das interaktive Sprachantwortsystem 101 umfasst eine Nebenstellenanlage
(PBX, private branch exchange) 100. Es ist anzumerken,
dass, obwohl eine PBX 100 dargestellt ist, gemäß der vorliegenden
Erfindung auch vielfältige
andere Vermittlungs- und/oder Steuerungseinrichtungen verwendet
werden können.
Somit dient 1 lediglich als Beispiel. Die
PBX 100 enthält
eine Zentraleinheit (CPU, Central Processing Unit) 102 zur
Steuerung der Funktionen der PBX 100. Die Zentraleinheit 102 steht
stellvertretend für
einen Prozessor zum Beispiel vom Typ Pentium, Pentium Pro oder Pentium
II, der von der Intel Corp. mit Sitz in Santa Clara, Kalifornien
hergestellt wird, oder für
einen damit kompatiblen Prozessor. Die Zentraleinheit 102 ist
mit einer Speichervorrichtung 104 gekoppelt. Die Speichervorrichtung 104 wird
verwendet, um Routing-Informationen zu speichern, die mit dem hierarchischen
Bedienerführungssystem
zusammenhängen.
Die Zentraleinheit 102 ist ferner mit einem Spracherzeugungsmodul 106 zur
Erzeugung von vorgegebenen Sprachmitteilungen gekoppelt. Solche Spracherzeugungssysteme
sind in der Technik wohlbekannt. Das Spracherzeugungsmodul 106 kann entweder
ein echter Sprachsynthesizer oder eine Speichervorrichtung mit vorprogrammierten
oder zuvor aufgezeichneten Nachrichten sein. Die Zentraleinheit 102 ist
mit einem Vermittlungssteuermodul 108 gekoppelt, welches
die Umschaltung zwischen einer Vielzahl von Vorrichtungen steuert,
welche auf funktionsfähige
Weise mit der PBX 100 gekoppelt sind. Das Vermittlungssteuermodul 108 enthält ferner ein
Zweiton-Mehrfrequenzmodul (DTMF-Modul, Dual Tone Multi-Frequency
Unit) 110, das so beschaffen ist, dass es DTMF-Signale
und Digitalsignale empfangen und senden kann, und ein Anruferidentifikations-Empfangsmodul 111.
Eine Vielzahl von Telefonie-Endgeräten 112a–112c,
wie etwa Telefone, Faxgeräte
und ähnliches,
ist mit der PBX 100 gekoppelt. Außerdem können die Telefonie-Endgeräte verschiedene
Personalcomputer 112d, 112e, mit denen Telefone 113a, 113b gekoppelt
sind, umfassen. Die Computer und Telefone können so konfiguriert sein,
dass sie unter Verwendung von TAPI- oder TSAPI-Protokollen interagieren.
Die PBX 100 ist ferner mit dem öffentlichen Fernsprechnetz
(PSTN, Public Switched Telephone Network) 114 gekoppelt.
-
Gemäß einer
Ausführungsform
der Erfindung ist die Zentraleinheit 102 ferner so konfiguriert, dass
sie Auswahlen von Menüaufforderungen überwacht.
Zum Beispiel überwacht
die Zentraleinheit 102 den DTMF-Empfänger 110 und zeichnet
die Auswahlen spezieller Antworten auf, die in Reaktion auf spezielle
Menüangebote
empfangen wurden. Die Ergebnisse werden dann von der Zentraleinheit 102 im Speichermodul 104 gespeichert.
Der Ergebnisse können
entweder für
alle Benutzer oder für
bestimmte Benutzer gespeichert werden. Wenn der Benutzer das nächste Mal
anruft, werden die Menübefehle
des Benutzers in einer aktualisierten Reihenfolge entsprechend der
Häufigkeit
der Benutzung zur Verfügung
gestellt. Zum Beispiel kann, wenn der Benutzer das nächste Mal
anruft, die Zentraleinheit 102 von dem Anruferidentifikations-Empfangsmodul 111 Benutzerkennungs-Informationen
empfangen.
-
Das
Anruferidentifikations-Empfangsmodul 111 kann ein standardmäßiges Anruferidentifikationsmodul
sein, welches so konfiguriert ist, dass es Anruferidentifikations-Informationen überwacht,
die von den Telefonie-Endgeräten
geliefert werden. Die Zentraleinheit 102 kann die Anruferidentifikations-Informationen erkennen
und sie verwenden, um auf eine gespeicherte Menü-Reihenfolge zuzugreifen, die
dem betreffenden Benutzer entspricht. Stattdessen kann die Zentraleinheit 102 auch
darauf warten, dass ein Anrufer eine Kennnummer eingibt, wie etwa eine
Kontonummer, Sozialversicherungsnummer, PIN oder ähnliches,
bevor sie die personalisierte Menühierarchie zur Verfügung stellt.
Das Abrufen eines personalisierten Menüs kann im "Huckepackverfahren" zusammen mit anderen Funktionen erfolgen, die
eine PIN oder Kontonummer erfordern, wie etwa zusammen mit einer
Benutzerauthentifikation oder mit Sicherheitsprüfungen.
-
Außerdem kann
ein Sprachnachrichtenserver 103 mit der PBX 100 gekoppelt
sein und so konfiguriert sein, dass er einer Vielzahl von Benutzern Voice-Mail-Dienste
zur Verfügung
stellt. Entsprechend einer Ausführungsform
der Erfindung kann die Reihenfolge der Menüpräsentation so aktualisiert werden,
dass sie die von den Benutzern am häufigsten gewählten Optionen
widerspiegelt, wie weiter unten erläutert wird. Es sind ein Spracherkennungsmodul 105,
eine Steuereinheit 107 und ein Speicher 109 vorgesehen,
um gesprochene Begriffe zu identifizieren, die verwendet werden
sollen, um eine Ordner-Hierarchie
zu erzeugen und zu unterhalten. Das Spracherkennungsmodul 105 und
die Steuereinheit 107 sind so konfiguriert, dass sie vorgegebene
gesprochene Worte erkennen und sie in Text umwandeln oder auf andere
Weise die gesprochenen Worte verwenden, um eine "Betreff-Zeile" oder einen Ordner-Titel für die Nachricht
zu liefern, und die Betreff-Kategorien verwenden, um eine Ordner-ähnliche
Hierarchie herzustellen. Die "Betreff-Zeilen" und/oder Namen von
Ordnern können
in Text konvertiert werden und können
von einer graphischen Benutzerschnittstelle (nicht dargestellt),
die in den Personalcomputern 112d, 112e enthalten
ist, verwendet werden. Außerdem
können
die Betreff-Zeilen auch entweder mittels Sprache oder mittels Tastatureingabe
navigierbar sein.
-
Ein
detaillierteres Blockschaltbild eines Sprachnachrichtenservers 103 ist
in 2 dargestellt. Wie oben erläutert, umfasst ein Sprachnachrichtenserver 103 eine
Steuereinheit 107, die mit einem Speichermodul 109 gekoppelt
ist, und ein Spracherkennungsmodul 105. Die Steuereinheit 107 kann zum
Beispiel ein Mikroprozessor wie etwa ein Pentium oder Pentium Pro
sein. Es ist anzumerken, dass der Sprachnachrichtenserver 103,
obwohl er hier als ein von der PBX 100 getrenntes Modul
dargestellt ist, auch in diese integriert sein kann, und dass die
Zentraleinheit 102 auch die Steuerfunktionen der Spracherkennung
ausführen
kann.
-
Das
Spracherkennungsmodul 105 ist so geschaltet, dass es codierte
Sprachdaten empfängt: zum
Beispiel Filterkoeffizienten der linearen prädiktiven Codierung (linear
predictive coding) und/oder Excitation Encoding Indizes, wie sie
von einem VSELP (Vector Sum Excited Linear Prediction) -Codierer
geliefert werden. Bei einem VSELP-Codierer sind die Filterkoeffizienten
zum Beispiel für
die Resonanzpeaks oder Formanten der eingegebenen Sprache repräsentativ.
Es können
auch andere Arten der Codierung angewendet werden.
-
Das
Spracherkennungsmodul 105 enthält eine Frequenzgang- und Peakdetektor-Schaltung 50, die
so konfiguriert ist, dass sie die Peakwerte von Sprachfrequenzen
erfasst. Ein Formantenextraktions-Modul 52 ist mit dem
Ausgang des Peakdetektors 50 gekoppelt, um die Formanten
der charakterisierten Sprache zu extrahieren. Die Formanten werden
von der Steuereinheit 107 verwendet, um eine Phonem-Datenbank
im Speichermodul 109 zu durchsuchen, welche Informationen
in Form einer Datenbank enthält,
welche Formanten mit Phonemen korrelieren. Die Steuereinheit 107 interagiert
mit der Datenbank derart, dass das beste repräsentative Phonem gewählt wird,
und gibt diese Daten in einen Phonem-zu-Text-Konverter ein. Der
Phonem-zu-Text-Konverter erzeugt eine Textdarstellung der zugehörigen Phonem-Sprachmuster.
Die zu Text konvertierten Sprachmuster können zum Beispiel für Themen,
Betreff-Zeilen, Ordner-Titel, Eingabekoordinaten oder ähnliches
repräsentativ
sein.
-
Obwohl
oben ein spezielles Spracherkennungsmodul beschrieben wurde, kann
es sich bei dem Spracherkennungsmodul 105 um jedes beliebige
bekannte Spracherkennungsmodul handeln, wie etwa Phonem-gestützte Spracherkennungssysteme mit
der Fähigkeit,
neue Wörter
einzuführen
und sie operativ ("fliegend", d. h. ohne dass
eine Unterbrechung erforderlich ist) verfügbar zu machen. In solchen
Systemen kann eine Phonem-Vorverarbeitung eines genügend umfangreichen
Vokabulars oder Lexikons angewendet werden, entweder über Sprach- oder über Texteingabe.
Zum Beispiel kann das Spracherkennungsmodul 105 eine Spracherkennungskarte
wie etwa die Spracherkennungs-Platine DVM-4S
sein, die von Voice Control Systems, Inc., Dallas, Texas bezogen
werden kann, oder in ihm können
Systeme verwendet werden wie diejenigen, die in Hunt et al., US-Patent
Nr. 5.499.288, das an Voice Control Systems, Inc. übertragen
wurde, beschrieben werden, oder wie das System, das in Vollert, US-Patent
Nr. 5.166.971, das an die Siemens AG übertragen wurde, beschrieben
wird, oder wie das System, das in Arbel et al., US-Patent Nr. 5.276.731, das
an Siemens Business Communications Systems, Inc. übertragen
wurde, beschrieben wird, wobei diese Systeme hiermit durch Bezugnahme
in ihrer Gesamtheit mit einbezogen werden, so als ob sie hier vollständig dargelegt
wären.
Ein anderes System, welches verwendet werden kann, ist das von De
Vos und Kämmerer, "Algorithm and DSP
Implementation for a Speaker-Independent Single-Word Speech Recognizer
with Additional Speaker-Dependent Say-In Facility", Proceedings, Dritter
Internationaler Workshop über
Interaktive Sprachtechnologie für
Telekommunikations-Anwendungen,
30. September bis 1. Oktober 1996, Basking Ridge, New Jersey, das ebenfalls
durch Bezugnahme in seiner Gesamtheit mit einbezogen wird, so als
ob es hier vollständig
dargelegt wäre.
In ähnlicher
Weise kann eine Text-zu-Phonem-Konvertierung unter Verwendung des
Systems PureSpeech ReCite! durchgeführt werden, das von Pure Speech,
Inc. bezogen werden kann.
-
Das
Spracherkennungsmodul 105 kann sowohl auf Anrufer als auch
auf Benutzer reagieren. Ein Anrufer kann das Spracherkennungsmodul 105 verwenden
oder mit ihm interagieren, um eine Betreff-Zeile zu liefern, wenn
er eine Nachricht für
den Benutzer hinterlässt.
Wenn zum Beispiel der Anrufer anruft und zur Sprachmailbox des Benutzers
geleitet wird, wird der Anrufer aufgefordert, eine Nachricht zu hinterlassen.
Entweder bevor er beginnt, die Nachricht aufzuzeichnen, oder nachdem
er die Aufzeichnung der Nachricht beendet hat, fordert das Voice-Mail-System den Benutzer
auf, einen Betreff in sein Telefon zu sprechen. Das Spracherkennungsmodul 105 erkennt
die Sprache und konvertiert die Betreff-Zeile in einen äquivalenten
Text, wie weiter unten ausführlicher
erläutert
wird, welcher zusammen mit der Sprachnachricht gespeichert wird.
-
Es
können
auch andere Verfahren angewendet werden, um eine Betreff-Zeile einzugeben.
Zum Beispiel kann der Anrufer einen aus ein oder zwei Wörtern bestehenden
Betreff in eine Tonwahl-Tastatur
eingeben, oder er kann den Betreff in einen PC-Netz-Computer oder ein
Endgerät
eingeben, welches über
das Telefon an das Voice-Mail-System angeschlossen ist. Anschließend kann
eine Text-zu-Phonem-Konvertierung für eine Phonem-gestützte Analyse
(und eine Erkennung einer künftigen Spracheingabe)
erfolgen, wie weiter unten ausführlicher
erläutert
wird. Die Text-zu-Phonem-Konvertierung kann unter Verwendung des
Systems PureSpeech ReCite! durchgeführt werden, das von Pure Speech,
Inc. bezogen werden kann. Schließlich kann der Anrufer auch
einfach den Betreff hinzufügen,
indem er in den Handapparat spricht und die Stimme als ein Audio-Betreff
aufgezeichnet wird, ohne dass irgendeine Konvertierung in Text erfolgt.
Stattdessen kann das System auch die gesamte Nachricht oder einen
vorgegebenen Teil davon (z. B. 10 Sekunden) überwachen, um nach Begriffen
zu suchen, die als Themen identifizierbar sind.
-
Sobald
die von dem Anrufer gelieferte Betreff-Zeile hinzugefügt und zu
Text konvertiert worden ist, kann das System in den Betreff-Zeilen
von noch nicht abgespielten Nachrichten Suchen durchführen, so
dass der Benutzer anhand des Betreffs auf seine Nachrichten zugreifen
kann. Falls keine Konvertierung zu Text vorgesehen ist, können trotzdem
Suchen durchgeführt werden,
wobei diese jedoch auf der Analyse und dem Vergleich von Phonemen
beruhen müssen,
was zeitaufwendiger ist als eine Textsuche. Falls keine Bereitstellung
einer Betreff-Zeile erfolgt, kann das Spracherkennungsmodul 105 trotzdem
noch vorgesehen sein, um die empfangenen Sprachsignale zu analysieren.
Die Nachricht kann in ihrer Gesamtheit zu Text konvertiert oder
einfach in Form von Phonemen gespeichert werden.
-
Wenn
der Benutzer auf seine noch nicht abgespielten Nachrichten zugreifen
möchte,
kann er dies anhand des Betreffs tun; zum Beispiel, indem er ein
Thema ansagt wie etwa "Budget". Das System durchsucht
daraufhin alle empfangenen und noch nicht abgespielten Nachrichten
mit dem Ziel, Verwendungen des Ausdrucks "Budget" zu finden. Anschließend präsentiert das System dem Benutzer
alle noch nicht abgespielten Nachrichten, die mit dem Thema "Budget" zusammenhängen.
-
Das
Voice-Mail-System bietet dann dem Benutzer die Option, die Nachricht
zu speichern. Daraufhin kann der Benutzer die Betreff-Zeile als
den Namen eines Ordners akzeptieren, oder er kann einen anderen
Namen ansagen oder per Tastatur eingeben. Falls der Name gesprochen
wird, wird der Begriff (entweder Text oder Phonem) mit den gespeicherten
Betreffs verglichen, und es wird auf die entsprechende Nachricht
zugegriffen. Der Name kann entweder der Name eines existierenden
Ordners oder der Name eines neuen Ordners sein. Wie weiter unten
ausführlicher
erläutert
wird, kann der Benutzer, um auf gespeicherte Nachrichten zuzugreifen,
entweder den Namen eines Ordners sprechen, um zu sämtlichen
zu dem betreffenden Thema gehörenden Ordnern
geleitet zu werden, oder er kann eine Koordinate des Ordners oder
einer speziellen Nachricht ansagen oder über die Tastatur eingeben,
oder er kann eine alphanumerische Kennung für den speziellen Ordner oder
die spezielle Nachricht über
die Tastatur eingeben. Außerdem
kann die Erzeugung der Ordner-Hierarchie
unter Verwendung einer Schnittstelle ohne Display auch eine Aktualisierung
eines textbasierten Ordnersystems einer graphischen Benutzerschnittstelle
auslösen.
Zum Beispiel kann der Suchbegriff oder des Suchthema als Ordnername verwendet
werden und die Nachricht darunter mit einer bestimmten Kennung gespeichert
werden. Wenn der Benutzer das nächste
Mal seinen Computer verwendet, kann er auf seine Nachricht per Text
oder mittels einer Ordner-Graphik zugreifen.
-
Es
wird nun auf 3 Bezug genommen; sie zeigt
ein Schema, das allgemein ein hierarchisches Bedienerführungssystem 200 darstellt.
Ein Anrufer ruft das Voice-Mail-System des Benutzers an und hinterlässt eine
Nachricht. Der Voice-Mail-Server 103 kann
dem Anrufer die Option zur Verfügung
stellen, einen Nachrichtenkopf oder eine Betreff-Zeile zu hinterlassen.
Das Spracherkennungsmodul 105 identifiziert den Betreff,
welcher von der Steuereinheit 107 verwendet wird, um die
Nachricht zu klassifizieren und in einem geeigneten Ordner zu speichern.
Stattdessen kann das System auch so konfiguriert sein, dass im Hauptteil
der Nachricht nach einem bestimmten Wort oder einer bestimmten Wendung
gesucht wird und die Nachricht dann wieder entsprechend gespeichert
wird.
-
Wenn
ein entfernter Benutzer eines Telefonie-Endgerätes 112a–112c auf
das System zugreift, ruft er das System an, und die Zentraleinheit 102 greift
sowohl auf die Speichervorrichtung 104 als auch auf das
Spracherzeugungsmodul 106 zu, um Sprachantworten auf verschiedene
Benutzereingaben zu liefern. Das System kann für Spracherkennung ansprechbar
sein, oder es kann ein Navigationssystem mit Eingabe von Koordinaten
mittels Tastatur vorgesehen sein. Zu Beginn kann eine Begrüßungsmeldung 202 präsentiert
werden. Der Benutzer kann die Möglichkeit
haben, eine Betreff-Zeile oder einen Ordnernamen anzusagen, welcher
dann vom System erkannt wird. In einem stärker begrenzten System erkennt
das Spracherkennungsmodul möglicherweise
nur einige Wörter
oder Zahlen. In diesem Falle kann der Benutzer "weiter" sagen oder eine Koordinate nennen,
wie weiter unten ausführlicher
erläutert
wird. Der Benutzer wird dann zu der entsprechenden Ebene geleitet.
Stattdessen kann auch die Begrüßungsmeldung 202 den
Eintritt in eine erste hierarchische Ebene 204 von Menüs oder Aufforderungen
gewährleisten.
Anschließend
werden nacheinander mehrere Aufforderungen 204a–204c präsentiert.
Bei jeder Aufforderung kann dem Benutzer die Option zur Verfügung gestellt
werden, eine bestimmte Taste zu drücken oder bestimmte Worte zu
sprechen, um zu einer nächsten
Funktion oder Ebene zu gelangen. So wird der Benutzer zum Beispiel
bei einer Aufforderung 204a zu einer zweiten Ebene von Aufforderungen 206 geleitet.
Bei einer Aufforderung 204b wird der Benutzer zu einer
zweiten Ebene von Aufforderungen 208 geleitet.
-
Im
dargestellten Beispiel ist die Aufforderung 204c ein Endpunkt.
Wenn dem Benutzer die Aufforderung 204c präsentiert
wird, drückt
er eine Taste, woraufhin eine Funktion ausgeführt wird (wie etwa die Zustellung
einer Nachricht oder die Übermittlung von
Kontostands-Informationen in einem IVR-System). Jede Aufforderung auf der zweiten
Ebene von Aufforderungen 206, 208 kann selbst
eine Funktion sein, oder sie kann die Option zur Verfügung stellen, weiter
zu einer nächsten
Ebene von Aufforderungen zu gelangen. Eine dritte Ebene von Aufforderungen, in
die man von der Aufforderung 208c der Aufforderungsebene 208 aus
gelangt, ist als Aufforderungsebene 210 dargestellt.
-
Wie
oben erläutert
wurde, kann den Benutzern auf jeder hierarchischen Aufforderungsebene eine
Aufforderungsmeldung präsentiert
werden. Zum Beispiel kann dem Benutzer auf der ersten hierarchischen
Aufforderungsebene 204 eine Meldung bei der Aufforderung 204a präsentiert
werden. Wenn der Benutzer zu diesem Zeitpunkt keine Aktion durchführt, wird
dem Benutzer eine Meldung bei der Aufforderung 204b präsentiert,
und wenn keine weitere Aktion durchgeführt wird, wird dem Benutzer
bei der Aufforderung 204c eine Benutzer-Aufforderungsmeldung präsentiert.
Wenn der Benutzer nicht die gesamten Meldungen bei den Aufforderungen 204a und 204b abwarten
möchte,
sondern stattdessen mit einer Auswahl bei 204c fortfahren
möchte,
muss der Benutzer nicht warten. Stattdessen kann der Benutzer eine
Taste wählen,
zum Beispiel die Rautetaste (#) oder die Sterntaste (*), während die
Aufforderung bei 204a übermittelt
wird. Stattdessen kann der Besucher auch "weiter" sagen. Das Wählen der Rautetaste oder der
Sterntaste bzw. das gesprochene Wort "weiter" bewirkt, dass die Aufforderungsmeldung
von der Aufforderung 204a zur Aufforderung 204b springt.
Wenn die Aufforderungsmeldung 204b beginnt und der Benutzer
die Aufforderung 204b überspringen
möchte,
kann der Benutzer erneut sprechen oder die Rautetaste oder die Sterntaste
drücken,
und er wird dann zur Aufforderungsmeldung bei der Aufforderung 204c geleitet.
-
Der
Benutzer kann einen bestimmten zurückgelegten Weg speichern, so
dass der Benutzer bei einer späteren
Gelegenheit nicht durch das gesamte Bedienerführungssystem navigieren muss, bevor
er zu der gewünschten
Funktion gelangt. So hat zum Beispiel ein Benutzer möglicherweise
auf das System zugegriffen, ist zum Beispiel anhand eines Passwortes
(oder einer Kontonummer) identifiziert worden und ist zu einer Funktion
auf der dritten hierarchischen Ebene 210 navigiert, speziell
zur Funktion 210a. Entweder bevor oder nachdem die Funktion
ausgeführt
worden ist, kann dem Benutzer die Option zur Verfügung gestellt
werden, den zurückgelegten
Funktionspfad, d. h. die gewählte
Endfunktion, zu speichern. Wenn der Benutzer die Option annimmt,
zum Beispiel indem er die Rautetaste oder die Sterntaste drückt, kann
dem Benutzer, wenn er sich das nächste
Mal anmeldet, die Option zur Verfügung gestellt werden, direkt
zu der betreffenden Funktion zu gelangen.
-
Zum
Beispiel speichert die Zentraleinheit 102 im Speichermodul 104 eine
Verknüpfung
der Funktion mit dem Benutzer. Wenn sich der Benutzer das nächste Mal
anmeldet, kann dem Benutzer eine neue Aufforderung übermittelt
werden, und eine neue Benutzermitteilung vom Spracherzeugungsmodul 106 geliefert
werden, welche dem Benutzer die Option zur Verfügung stellt, eine Funktionstaste
zu wählen,
um die durch die Aufforderung bei 210a gekennzeichnete
Funktion direkt auszuführen.
Falls der Benutzer die Funktion nicht verwenden möchte, kann der
Benutzer wieder in das standardmäßige Aufforderungs-Navigationssystem
gelangen.
-
Stattdessen
kann das System auch dem Benutzer bei der Anmeldung die Option zur
Verfügung stellen,
die Koordinaten der zuletzt gewählten
Funktion einzugeben. So würde
zum Beispiel, wenn die zuletzt gewählte Funktion die mit der Aufforderung 210a verknüpfte Funktion
war, dem Benutzer die Option zur Verfügung gestellt, die Ziffern
(3,1) einzugeben (entweder durch Tastatureingabe oder durch Sprechen),
welche die dritte hierarchische Ebene, erste Funktion bezeichnen.
Der Benutzer würde
anschließend
direkt zu dieser Funktion gelangen. Auch in diesem Falle kann der
Benutzer, falls er diese Funktion nicht wünscht, diese überspringen
oder entsprechend dem normalen Ablauf zur standardmäßigen Navigations-Hierarchie
gelangen.
-
Bei
einer weiteren Ausführungsform
dieser Koordinatenfunktion wird nicht zu Beginn bei der Anmeldung
eine Aufforderung übermittelt,
sondern es wird lediglich die Eingabe von Koordinaten akzeptiert,
welche bewirken, dass der Benutzer unmittelbar zu der gewünschten
Funktion springt. So kann der Benutzer zum Beispiel, wenn ihm die
Aufforderungsmeldung bei der Aufforderung 204a präsentiert
wird, die Rautetaste (#) und danach bestimmte Ziffern auf der Tastatur
(3,1) drücken,
um anzuzeigen, dass er unmittelbar zu der Funktion bei der Aufforderung 210a springen
möchte.
-
Stattdessen
kann der Benutzer auch die Wörter
(3,1) sprechen und zur Aufforderung 210a geleitet werden.
-
Die
Zentraleinheit 102 kann im Speichermodul 104 ein
Menü von
Koordinaten zur Navigation zwischen den Funktionen speichern, welches
dem Benutzer ermöglicht,
auf eine angegebene Funktion zuzugreifen. Zum Beispiel kann der
Benutzer zu einem beliebigen Zeitpunkt die Präsentation von bestimmten Aufforderungsmeldungen
unterbrechen und zu einem Menü geleitet
werden. Zum Beispiel kann der Benutzer die Rautetaste oder die Sterntaste drücken und
zu dem Menüsystem
geleitet werden. Dieses kann zum Beispiel eine Ansage einer Liste von
abgekürzten
Aufforderungen beinhalten, gefolgt von Tasten, die gedrückt werden
müssen,
um direkt zu der angegebenen Funktion zu gelangen. Bei einer Ausführungsform
kann der Benutzer Zahlen eingeben, welche Buchstaben auf der alphanumerischen Tastatur
entsprechen. So kann der Benutzer zum Beispiel, wenn er Informationen
zum Kontostand ("balance") wünscht, die
Tasten (2,2,5)(BAL) drücken,
um zur Funktion "Kontostands-Informationen" zu gelangen. Stattdessen
könnte
dem Benutzer auch bei jeder Aufforderung eine Koordinatenadresse
der betreffenden Aufforderung präsentiert
werden. Wenn der Benutzer zu einem späteren Zeitpunkt während seiner
Sitzung am Bedienerführungssystem
zu der einer gewünschten
Funktion entsprechenden Aufforderung zurückkehren möchte, braucht er nur die numerische
Adresse, die ihm zuvor gegeben wurde, über die Tastatur einzugeben.
So braucht zum Beispiel der Benutzer, wenn er sich bei der Funktion
befindet, die bei der Aufforderung 210b definiert ist,
jedoch nun eine Funktion bei der Aufforderung 208b ausführen möchte, nur
(#,2,5) zu drücken,
um zu dieser Funktion zurückzukehren.
-
Schließlich kann
der Benutzer auch zu einem beliebigen Zeitpunkt während der
Sitzung zur Anfangs-Aufforderung auf einer angegebenen Aufforderungsebene
zurückkehren.
Wenn sich zum Beispiel der Benutzer auf der Aufforderungsebene 3 befindet, jedoch
zur Aufforderungsebene 1 zurückkehren möchte, so
kann der Benutzer (*,1) drücken
(oder "zurück, 1" sagen), um zur Aufforderungsebene
1 zurückzukehren.
In diesem Falle wird dem Benutzer die Aufforderung 204a präsentiert.
Stattdessen kann das System auch so konfiguriert sein, dass der
Benutzer eine vorgegebene Anzahl von Ebenen zurückgehen kann, entsprechend
der Eingabe des Benutzers. Zum Beispiel kann der Benutzer (*) drücken, gefolgt von "2", oder "zurück,
2" sagen, um von
der Aufforderungsebene 3 zur Aufforderungsebene 1 zurückzukehren.
-
Wie
oben erläutert,
betrifft ein Aspekt der vorliegenden Erfindung das automatische
Aktualisieren der Reihenfolge der Menüpräsentation in IVR-, Multimedia-
oder Sprachnachrichtenübermittlungs-Systemen
auf der Basis der Häufigkeit
der Verwendung. Zum Beispiel ist in den 9a–b ein Schema
dargestellt, das die Aktualisierung der Menüreihenfolge gemäß einer
Ausführungsform
der vorliegenden Erfindung veranschaulicht. In dem dargestellten
Beispiel ist ein beispielhaftes IVR-System einer Bank dargestellt.
Insbesondere ermöglicht
das IVR-System vier Funktionen: Kontostände, Geldüberweisungen, Überprüfung von
Depotbeständen, Überprüfung von
Schecks. Es ist anzumerken, dass in der Praxis eine Hierarchie verwendet
werden kann, die der von 3 ähnlich ist; daher stellen die 9a–b lediglich
Beispiele dar. Unter den anfänglichen
Bedingungen präsentiert
das System dem Benutzer die oben erwähnten Optionen in einer vorgegebenen
Präsentationsreihenfolge,
wie in 9a dargestellt. Die Auswahl
der Aufforderungen kann durch das System überwacht werden, um zu ermitteln,
wie häufig
jede der Optionen gewählt
wird. Auf der Basis der Häufigkeit
der Auswahl durch die Benutzer kann die Präsentationsreihenfolge der Optionen
so aktualisiert werden, dass die populärsten Optionen zuerst präsentiert
werden. Ein Beispiel einer aktualisierten Präsentationsreihenfolge ist in
-
9b dargestellt.
Die Benutzung des Systems wird wie oben erläutert überwacht, so dass die Anzahl
der Benutzer, welche zum Beispiel Option 3 (SCHECK VERRECHNET) wählen, überwacht
und ihre Benutzung gezählt
wird. Wenn der Benutzer das nächste
Mal anruft, hat das System möglicherweise die
Menüpräsentation
entsprechend der Häufigkeit der
Benutzung aktualisiert. Dementsprechend kann das aktualisierte Menü in der
folgenden Reihenfolge präsentiert
werden: 3 DRÜCKEN,
um zu sehen, ob ein Scheck verrechnet wurde; 2 DRÜCKEN, um
Geld zu überweisen;
1 DRÜCKEN,
um Kontostände
zu prüfen;
und 4 DRÜCKEN,
um ein Depot zu überprüfen. Somit
wird die Reihenfolge der Präsentation
der Menüoptionen
entsprechend der Häufigkeit
der Benutzung geändert.
Die Zahlen, welche auszuwählen sind,
haben sich jedoch nicht geändert.
Obwohl sich die Zahlen gemäß einer
Ausführungsform ändern können, ist
es vorzuziehen, dass sie unverändert bleiben,
da sich die Benutzer oft ihre gewählten Optionen merken. Daher
könnte
ein Ändern
der Zahlen zusätzlich
zur Änderung
der verbalen Reihenfolge Verwirrung verursachen. Zum Beispiel kann
nach einer bestimmten Nutzungsdauer X das IVR-System erkennen, dass
20 % der Anrufe die Prüfung
des Kontostands betreffen, 25 % Geldüberweisungen, 50 % das Verrechnen
von Schecks und 5 % das Überprüfen eines
Depots. Nach einer zweiten Zeitdauer, zum Beispiel Y Stunden, wird
das Menü umgeordnet. Es
ist anzumerken, dass die Zeitdauern Y und X in irgendeiner Beziehung
zueinander stehen könnten.
-
Die
Häufigkeit,
mit welcher jede Aufforderung gewählt wird, kann bestimmt werden,
indem gezählt
wird, wie oft Benutzer eine bestimmte Option innerhalb eines vorgegebenen
Zeitintervalls wählen. Das
Zeitintervall der Stichprobenentnahme kann so gewählt werden,
dass es Veränderungen
hinsichtlich der Benutzung des Systems widerspiegelt. Wenn zum Beispiel
das System wenig benutzt wird, kann das Zeitintervall der Stichprobenentnahme
verlängert werden,
so dass das Menü weniger
oft aktualisiert wird. Umgekehrt kann in Zeitabschnitten intensiver Benutzung
das Zeitintervall der Stichprobenentnahme verkürzt werden, so dass das Menü schnell
aktualisiert werden kann, um Veränderungen
hinsichtlich der Benutzung zu widerspiegeln. Die Benutzungsmuster
können
aus den Auswahlen bestimmt werden, die von einer Vielzahl von Benutzern
getroffen wurden. Stattdessen können
auch die Benutzungsmuster einzelner Benutzer verfolgt werden, um
personalisierte Reihenfolgen der Menüpräsentation festzulegen. Einzelne
Benutzungsmuster können
verfolgt werden, indem ankommende Rufe überwacht werden und die von
den Anrufern gewählten
Optionen entweder einer Anrufer-Kennnummer oder einer von dem Anrufer
eingegebenen PIN zugeordnet werden. Die Benutzungsmuster-Statistiken
können
von der Zentraleinheit 102 erstellt und in der Speichervorrichtung 104 gespeichert
werden (1).
-
Es
wird nun auf 4 Bezug genommen; sie zeigt
ein Flussdiagramm der Funktionsweise eines Multimedia- oder IVR-Systems. In einem
Schritt 302 wird einem Benutzer ermöglicht, auf das Telefon-Benutzerführungs-Menüsystem zuzugreifen,
und ihm wird auf einer ersten Ebene eine Meldung geliefert.
-
Anschließend wird
dem Benutzer in einem Schritt 304 eine erste Aufforderung
aus einer Folge von Aufforderungen präsentiert. Während der Präsentation
einer Aufforderungsmeldung kann der Benutzer in einem Schritt 306 eine
Funktionstaste oder eine Folge von Tasten wählen oder einen Befehl sprechen.
Falls der Benutzer dies tut, wird dem Benutzer in einem Schritt 310 eine
Aufforderungsmeldung präsentiert,
die entweder einer nächsten
Aufforderung auf derselben Ebene oder einer angegebenen Aufforderung
auf einer niedrigeren Ebene oder auf derselben Ebene entspricht.
Falls der Benutzer jedoch im Schritt 306 keine Funktionstaste
gedrückt hat,
so wird dem Benutzer in einem Schritt 308 lediglich die
Folge von Aufforderungen übermittelt.
Es ist anzumerken, dass das System ein Timeout oder eine Trennung
der Verbindung vorsehen kann, falls innerhalb eines vorgegebenen
Zeitintervalls keine Eingabe empfangen wird. Wenn der Benutzer im
Schritt 308 eine Taste wählen würde, so würde der Benutzer anschließend in
einem Schritt 310 zu einer nächsten Ebene von Aufforderungen
geleitet. Wie oben erläutert,
kann die Wahl einer oder mehrerer Funktionstasten im Schritt 306 beinhalten:
1) Zugreifen auf eine vorprogrammierte alphanumerische Adresse;
2) auf eine vorgegebene höhere
Ebene oder Ebenen über der
gegenwärtigen
Ebene; oder 3) auf eine nächste Aufforderung
auf derselben Aufforderungsebene. Sie kann ferner dem Benutzer ermöglichen,
den Namen eines Ordners, eines Kennsatzes oder einer Aufforderung
zu sagen, oder den Start der Anwendung oder eine Koordinate, und
zu dem entsprechenden Ordner oder der entsprechenden Anwendung geleitet
zu werden. Es kann entweder eine textbasierte oder eine sprachbasierte
Suchroutine angewendet werden.
-
Es
wird nun auf 5 Bezug genommen; sie zeigt
ein Flussdiagramm 400, welches ein Verfahren zum Aufzeichnen
und Speichern eines Navigationspfades oder -ziels veranschaulicht.
Das Verfahren von 5 ist insbesondere in einem
System von Nutzen, welches über
keine oder nur über
begrenzte Mittel zur Spracherkennung verfügt. In einem Anfangsschritt,
zum Beispiel in einer Begrüßungsmeldung,
kann die Zentraleinheit 102 auf den Sprachsynthesizer 106 zugreifen,
um einem Benutzer eine Mitteilung zu übermitteln, so dass der Benutzer
in einem Schritt 402 in einen Aufzeichnungsmodus eintritt.
Der Eintritt in den Aufzeichnungsmodus 402 kann zum Beispiel
erfolgen, indem der Benutzer eine bestimmte Taste oder Tastenfolge
auf seiner Telefontastatur wählt
oder indem er bestimmte Wörter spricht.
Falls der Benutzer in den Aufzeichnungsmodus eintritt, wird dem
Benutzer in einem Schritt 404 eine Folge von Aufforderungen
in der standardmäßigen Reihenfolge
präsentiert.
Auf jeder Stufe entlang des Weges kann der Benutzer in einem Schritt 406 mittels
Sprach- oder Tastatureingabe eine Aufforderung wählen.
-
Die
Wahl einer Aufforderung durch den Benutzer kann das Springen zu
einer Aufforderung auf einer anderen Ebene oder zu einer anderen
Aufforderung auf derselben Ebene beinhalten, oder sie kann das Durchlaufen
der Aufforderungen auf die standardmäßige Weise beinhalten. In jedem
Falle zeichnet die Zentraleinheit 102 in einem Schritt 408 die
Wahl auf und verknüpft
sie mit der Kennnummer des Benutzers. Der Benutzer wird dann in
einem Schritt 410 zu der entsprechenden Ebene geleitet, woraufhin
der Benutzer in einem Schritt 412 die gewünschte Wahl
vornimmt. Die Zentraleinheit 102 führt dann in einem Schritt 414 die
gewünschte
Funktion aus und zeichnet die endgültige Wahl auf. Falls der Benutzer
dies noch nicht getan hat, kann der Benutzer in einem Schritt 416 einen
Kennungscode speichern, welchen die Zentraleinheit dann im Speichermodul 104 speichert.
Der Kennungscode kann zum Beispiel eine Kontonummer oder ein anderes standardmäßiges Kennungsmittel
sein. Wenn sich der Benutzer das nächste Mal im System anmeldet, wird
dem Benutzer die Option zur Verfügung
gestellt, den aufgezeichneten Zielpfad wie oben beschrieben zu wählen.
-
Es
wird nun auf 6a Bezug genommen; sie zeigt
ein Flussdiagramm, welches ein Verfahren zur Verarbeitung empfangener
Voice-Mail-Nachrichten veranschaulicht. Genauer, in einem Schritt 602 kann
ein Anrufer eine Verbindung mit der Mailbox des Benutzers herstellen.
Das Voice-Mail-System ermöglicht
dann dem Anrufer, eine Nachricht zuzustellen, und fordert den Anrufer
in einem Schritt 604 auf, eine Betreff-Zeile anzugeben. Die Betreff-Zeile wird
in einem Schritt 608 empfangen. Bei der Betreff-Zeile kann
es sich um eine gesprochene Betreff-Zeile oder eine Text-Betreff-Zeile
handeln, welche ihrerseits in Phoneme konvertiert werden kann. Das
Spracherkennungsmodul 105 kann Schlüsselsätze erkennen, zum Beispiel
durch Extraktion und Vergleich von Phonemen, wie oben beschrieben.
Falls die Betreff-Zeile als eine gesprochene Nachricht eingegeben
wird, kann diese in einem Schritt 610 zu Text konvertiert
werden. Das Konvertieren der empfangenen Nachricht zu Text umfasst
zum Beispiel das Analysieren des Frequenzspektrums und das Identifizieren
von Phonemen, welche entsprechenden Sprachsignalen und Parametern
entsprechen. Schließlich werden,
nachdem die Betreff-Zeile eingegeben und identifiziert worden ist,
die Nachrichten für
die Zustellung entsprechend der Betreff-Zeile gespeichert.
-
Ein
anderes Verfahren zur Organisation von Nachrichten, die nach Themen
zu Gruppen zusammengefasst werden, ist als Flussdiagramm in 6b dargestellt.
Genauer, ein Anrufer kann in einem Schritt 614 eine Verbindung
zu einer Mailbox herstellen. Der Anrufer kann anschließend in
einem Schritt 616 eine Nachricht aufzeichnen. Falls in
einem Schritt 618 eine gesprochene Betreff-Zeile hinzugefügt werden
soll, so kann der Benutzer in einem Schritt 622 die Betreff-Zeile
sprechen. Die entsprechenden Sprachdaten werden dann in einem Schritt 624 gespeichert.
Falls jedoch im Schritt 618 keine Betreff-Zeile verfügbar wäre, könnte der
Anrufer einfach die gesamte Nachricht sprechen, und das System würde in einem
Schritt 620 die gesamte Nachricht oder einen vorgegebenen
Teil davon analysieren. In einem Schritt 624 können dann
relevante Begriffe, die möglicherweise
im Voraus aufgezeichnet wurden, klassifiziert und als Phoneme gespeichert werden.
Wenn der Benutzer auf seine Nachrichten zugreifen möchte, kann
er dies tun, indem er ein Thema nennt, und sie werden zugestellt.
-
6c zeigt
ein Flussdiagramm eines Verfahrens, gemäß dem ein Benutzer auf eine
Mailbox zugreifen kann. In einem Schritt 626 greift der
Benutzer auf seine Mailbox zu, zum Beispiel indem er im Anschluss
an die Eingabe seiner Mailbox-Nummer einen
Kennungscode per Tastatur eingibt oder spricht. In einem Schritt 628 kann
das Voice-Mail-System eine Liste von Betreffs von Nachrichten aufzählen. Es
ist anzumerken, dass die Betreffs oder Kennsätze entweder vom Anrufer geliefert (im
Falle von noch nicht abgespielten Nachrichten) oder benutzerdefiniert
(im Falle von bereits abgespielten, gespeicherten Nachrichten) sein
können.
Im Falle von noch nicht abgespielten Nachrichten wird am Ende jeder
Nennung eines Betreffs dem Benutzer die Option zur Verfügung gestellt,
in einem Schritt 630 eine Taste zu drücken oder einen Befehl zu sprechen,
um auf die Nachricht zuzugreifen. Im Falle von gespeicherten Nachrichten
kann der Zugriff direkt auf die Nachricht erfolgen, wie oben beschrieben
(z. B. durch Eingeben der Koordinate oder durch Sprechen des Betreffs
oder des Kennsatz-Namens). Sobald der Benutzer die Taste drückt oder
mit "ja" antwortet, wird
in einem Schritt 632 die Nachricht zugestellt. Wie weiter
unten ausführlicher
erläutert
wird, kann im Falle des Zugreifens auf noch nicht abgespielte Nachrichten
dem Benutzer dann die Option zur Verfügung gestellt werden, die Nachricht
entsprechend dem vom Anrufer angegebenen Betreff zu speichern oder
den vom Anrufer angegebenen Betreff in einen vom Benutzer selbst
gewählten
Betreff zu ändern.
-
Ein
anderes Verfahren zum Zugreifen auf Nachrichten in einer Mailbox
ist in 6d dargestellt. Wie oben greift
der Benutzer in einem Schritt 634 auf seine Mailbox zu.
In einem Schritt 636 kann der Benutzer zum Beispiel eine
Betreff-Zeile oder ein Thema nennen. Die Betreff-Zeile bzw. das
Thema kann entweder die bzw. das von noch nicht abgespielten oder
von gespeicherten Nachrichten sein. In einem Sortierschritt 638 analysiert
dann das Spracherkennungsmodul 105 des Voice-Mail-Systems die gesprochene
Eingabe und vergleicht die Phoneme mit denen der gespeicherten Betreff-Zeilen.
In einem Schritt 640 identifiziert dann das System die
entsprechende Betreff-Zeile und übermittelt
die Nachricht. Auch in diesem Falle kann, wie weiter unten ausführlicher
erläutert
wird, der Benutzer im Falle von noch nicht abgespielten Nachrichten
dann die Nachricht operativ entsprechend einer neu erzeugten oder
einer schon vorhandenen Ordner-Hierarchie speichern.
-
Ein
Flussdiagramm eines solchen Verfahrens zum Organisieren von Nachrichten
in einer Mailbox zeigt 7. Genauer, in einem Schritt 702 kann der
Zugriff eines Benutzers auf eine Mailbox ermöglicht werden. Das Voice-Mail-System
kann dann in einem Schritt 704 die noch nicht abgespielten
entsprechenden Nachrichten abspielen. Wie oben erläutert wurde,
können
die noch nicht abgespielten Nachrichten in einer "Eingangs-Box" entsprechend einer
vom Anrufer definierten Betreff-Zeile gespeichert werden. Sobald
die Nachrichten abgespielt werden, kann dem Benutzer in einem Schritt 706 die
Option zur Verfügung
gestellt werden, die Nachrichten zu speichern. Falls der Benutzer
die Nachrichten nicht speichern möchte, fordert das Voice-Mail-System
dann den Benutzer auf, das Mailboxsystem zu verlassen oder auf eine
andere Nachricht zuzugreifen. Falls der Benutzer jedoch die Nachricht
speichern möchte, wird
ihm in einem Schritt 708 die Gelegenheit gegeben, den entsprechenden
Ordner zu benennen, in welchem die Nachricht gespeichert werden
soll. Eine durch den Benutzer erfolgende Festlegung einer Kennung
des Ordners oder eines Kennsatzes überschreibt die Betreff-Zeile
oder den Kennsatz, die bzw. der eventuell vom Anrufer geliefert
wurde. Der Benutzer kann den Ordner mit einer Kennung versehen,
indem er Buchstaben über
eine Tonwahl-Tastatur eingibt, oder indem er den Namen des Ordners
ansagt. Falls das System über
Spracherkennungs-Funktionen
verfügt,
wird das gesprochene Wort mit den Betreffs der gespeicherten Ordner
verglichen. Dieser Vergleich kann entweder über Sprachanalyse erfolgen
(d. h. indem die Phoneme der gesprochenen Wörter direkt mit denjenigen
verglichen werden, welche die Ordner kennzeichnen), oder indem die
gesprochenen Wörter
zu Text konvertiert werden und die zu Text konvertierte Betreff-Zeile
mit den zu Text konvertierten Namen der Ordner verglichen wird, oder
indem der zu Phonemen konvertierte Text mit gespeicherten Phonemen
verglichen wird. Falls der Ordner in einem Schritt 710 als
ein existierender Ordner identifiziert wird, wird die Nachricht
in einem Schritt 714 in diesem Ordner gespeichert.
-
Falls
jedoch im Schritt 710 die Nachricht als nicht zu einem
existierenden Ordner gehörend
identifiziert würde,
so würde
in einem Schritt 712 ein neuer Ordner angelegt, und die
Nachricht würde
in einem Schritt 714 in diesem gespeichert. Das Erzeugen
des neuen Nachrichten-Ordners kann entweder mit Hilfe von Sprachmethoden
erfolgen, oder durch Eingabe über
eine Telefontastatur, oder über
eine an einen Computer angeschlossene Tastatur. An eine solche Tastatureingabe
kann sich eine Konvertierung zu Phonemen anschließen. Nachdem
die Ordner mit einer Kennung versehen worden sind, können sie
im Computer gespeichert und zu Text konvertiert werden, so dass
ein Benutzer über
eine textbasierte graphische Benutzerschnittstelle auf sie zugreifen
kann.
-
Es
wird nun auf 8 Bezug genommen; sie zeigt
ein Flussdiagramm 800, welches ein Verfahren zum Erstellen
von Mailbox-Makros veranschaulicht. Genauer, die vorliegende Erfindung
stellt eine Funktion zur Verfügung,
um operativ ("fliegend", d. h. ohne dass
eine Unterbrechung erforderlich ist) Mailing-Listen, einschließlich von "Weiterleitungs"-Listen oder "Verteiler"-Listen, Zeitpläne für die externe Benachrichtigung
(Outcalling) und Nachrichten zu erstellen. In einem Schritt 802 gibt
der Benutzer, der von einer Schnittstelle ohne Display aus auf das Nachrichtenübermittlungssystem
zugreift, einen Befehl ein, um eine Mailing-Liste zu erstellen.
Dies kann zum Beispiel beinhalten, dass er sagt: "Liste erstellen." Stattdessen kann
der Benutzer auch eine vorgegebene Folge von Tasten drücken, wie
oben erläutert.
Sobald der Benutzer auf die Funktion "Liste erstellen" zugegriffen hat, kann er in einem Schritt 804 die
eigentliche Liste erstellen. Dies kann zum Beispiel auf die Weise
erfolgen, dass der Benutzer eine gewünschte Weiterleitungs-Nummer
und einen Namen eines Empfängers
ansagt.
-
Nachdem
die gewünschte
Mailing-Liste erstellt worden ist, speichert der Benutzer in einem Schritt 806 die
Liste in einem Ordner mit einem Betreff-Kopf. Dies kann zum Beispiel
auf die Weise erfolgen, dass der Benutzer den Namen der Mailing-Liste
sagt; das System verknüpft
dann den Betreff-Namen mit dem Ordner der Mailing-Liste auf eine ähnliche
Weise wie oben erläutert.
-
Die
Liste kann dann verwendet werden, um Nachrichten weiterzuleiten
und/oder um Nachrichten gemäß einem
vordefinierten Zeitplan zu senden. Zum Beispiel kann der Benutzer
in einem Schritt 808 auf eine Nachricht zugreifen. Dabei
kann es sich darum handeln, dass auf eine neu empfangene Nachricht
zugegriffen wird, dass eine gespeicherte Nachricht abgefragt wird
oder dass eine neue Nachricht erstellt wird. Nachdem auf die Nachricht
zugegriffen worden ist oder die Nachricht erstellt worden ist, kann der
Benutzer in einem Schritt 810 die Nachricht an die Gruppe
weiterleiten oder senden, die in der Mailing-Liste definiert ist.
Zum Beispiel kann der Benutzer, wenn er vom Nachrichtenübermittlungssystem die
Anfrage erhält,
ob er die Nachricht weiterleiten möchte, den Namen des Ordners
der Mailing-Liste nennen. Der Benutzer kann auch einen bestimmten Zeitpunkt
nennen, zu dem er wünscht,
dass die Nachricht gesendet wird. Das System greift auf den Ordner
zu, welcher die Mailing-Liste definiert, liest die Namen und Nummern
der Empfänger
und leitet die Nachricht dementsprechend weiter.
-
Es
wird nun auf 10 Bezug genommen; sie zeigt
ein Flussdiagramm 1000, welches die Funktionsweise des
Menüaktualisierungs-Merkmals
gemäß der vorliegenden
Erfindung darstellt. Genauer, in einem Schritt 1002 überwacht
das System alle Anrufe, die empfangen werden. In einem Schritt 1004 weist
die Zentraleinheit die vom Benutzer getroffene Auswahl zu oder aktualisiert
einen Auswahlzähler
im Speichermodul 104. In einem Schritt 1006 vergleicht die
Zentraleinheit nach einer vorgegebenen Zeit die Nutzungen, d.h.
vergleicht die Anzahl der "Treffer" einer bestimmten
Menüauswahl.
Schließlich
aktualisiert die Zentraleinheit 102 in einem Schritt 1008 die Reihenfolge
der Präsentation
derart, dass, wenn das nächste
Mal eine Menüauswahl
vorgenommen wird, die Menüreihenfolge
der neu aktualisierten Reihenfolge entspricht. Das Menü kann so
angeordnet werden, dass die häufiger
gewählten
Optionen zuerst präsentiert
werden.
-
Das
Menüaktualisierungs-Merkmal,
das in 10 beschrieben ist, kann in
Verbindung mit IVR-Systemen ebenso wie mit Multimedia- und Sprachnachrichtenübermittlungs-Systemen verwendet
werden.