DE69835792T2 - Verfahren und Apparat zum Erzeugen semantisch konsistenter Eingaben für einen Dialog-Manager - Google Patents

Verfahren und Apparat zum Erzeugen semantisch konsistenter Eingaben für einen Dialog-Manager Download PDF

Info

Publication number
DE69835792T2
DE69835792T2 DE69835792T DE69835792T DE69835792T2 DE 69835792 T2 DE69835792 T2 DE 69835792T2 DE 69835792 T DE69835792 T DE 69835792T DE 69835792 T DE69835792 T DE 69835792T DE 69835792 T2 DE69835792 T2 DE 69835792T2
Authority
DE
Germany
Prior art keywords
task
user
identified
goals
objectives
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69835792T
Other languages
English (en)
Other versions
DE69835792D1 (de
Inventor
Alicia Scotch Plains Abella
Allen Louis Berkeley Heights Gorin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Application granted granted Critical
Publication of DE69835792D1 publication Critical patent/DE69835792D1/de
Publication of DE69835792T2 publication Critical patent/DE69835792T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft ein Dialogsystem und -verfahren, das die Anfrage eines Benutzers interpretiert und ein oder mehrere Aufgaben-Ziele implementiert.
  • 2. Beschreibung des Standes der Technik
  • Es gibt eine große Anzahl an Systemen mit gesprochenen Dialogen, deren Dialogmanager sich in den Strategien, die sie anwenden, in der Art, wie sie das Wissen über Aufgaben darstellen und verarbeiten, und darin, wie viel Initiative sie ergreifen, unterscheiden. Oft ist es der Fall, dass die Äußerung eines Benutzers eine Klärung erfordert, entweder weil der Benutzer zu viele Informationen oder aber nicht genügend Informationen geliefert hat. Bestehende Dialogmanager haben Probleme, wenn Vieldeutigkeiten in den Äußerungen des Benutzers enthalten sind oder wenn der Benutzer einen Wunsch äußert, mehr als ein Ziel zu erreichen. Das Dokument "Generating semantically consistent input to a dialog manager", A. Abella und A.L. Gorin, Eurospeech 1997, Rhodos, Griechenland, S. 1879–1882, offenbart einen solchen Dialogmanager.
  • Es besteht ein Bedarf an einem Dialogmanager, der auf die Absicht des Benutzers schließt, das Vorhandensein von Vieldeutigkeiten anhand des Wissens über die Aufgabe erkennt, eine semantisch konsistente Darstellung der Absicht des Benutzers konstruiert und das Ziel des Benutzers logisch implementiert.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die Erfindung ist wie in den unabhängigen Ansprüchen 1 und 12 beansprucht. Ein Dialogmanager-System und -Verfahren verwendet Dialogstrategien, um einen Benutzer in einen Dialog einzubinden, falls dies nötig ist, um Aufgaben-Ziele zu implementieren. Diese Strategie beruht auf einer nach Prioritäten ge staffelten Hierarchie von Aufgabenarten durch Bestimmung eines semantisch konsistenten Satzes von Aufgaben-Zielen aus der Eingabe eines Benutzers.
  • Das System und Verfahren verwendet eine Vererbungs-Hierarchie von Anruf- oder Aufgabenarten (Diensten). Diese Hierarchie wird vom Dialogmanager benutzt, um eine semantisch konsistente Kombination von Anruf- oder Aufgabenarten in Form einer Booleschen Formel zu erstellen. Die Boolesche Formel wird dann vom Dialogmanager verwendet, um zu ermitteln, ob es nötig ist, klärende Fragen zu stellen, weitere Informationen anzufordern, die notwendig sind, um die Transaktion durchzuführen, und um zu bestimmen, in welcher Reihenfolge diese Fragen gestellt werden sollen. Diese Formel wird durch einen Minimierungsprozess für Boolesche Formeln gewonnen und ergibt immer eine minimale und konsistente Kombination von Anruf- oder Aufgabenarten. Weiterhin erfordert eine Änderung der Hierarchie keine Änderung des Dialogmanagers.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung wird mit Bezug auf die folgenden Zeichnungen beschrieben, worin gleiche Bezugszeichen gleiche Elemente bezeichnen und worin:
  • 1 die Vererbungs-Hierarchie für eine Teilmenge von Anrufarten darstellt;
  • 2 ein Beispiel für Anrufarten und ihre dazugehörigen Attribute darstellt;
  • 3 ein Blockdiagramm des Dialogmanagers der Erfindung ist;
  • 4 Anfangs-Bitstrings darstellt, die die Werte der Variablen für jede Zelle darstellen;
  • 5 das Ergebnis der Anwendung einer Minimierung mit einer Booleschen Formel darstellt;
  • 6 ein Flussdiagramm eines der Algorithmen ist, die vom Dialogmanager verwendet werden;
  • 7 ein Funktionsblock-Diagramm eines Systems ist, in dem der Dialogmanager der Erfindung eingesetzt werden kann, und
  • 8 ein Flussdiagramm ist, das die Methodik darstellt, wie der Dialogmanager der Erfindung gemäß dem in 7 dargestellten System eingesetzt werden kann.
  • DETAILLIERTE BESCHREIBUNG BEVORZUGTER AUSFÜHRUNGSFORMEN
  • Es gibt viele Verwendungen in verschiedenen Industriezweigen für das offenbarte System und das Verfahren. Der Dialogmanager kann in jeder Situation und mit jedem System, ob bekannt oder zukünftig entwickelt, verwendet werden, worin eine Maschine mit einem Menschen interagieren muss. Als erläuterndes Beispiel wird die Erfindung jedoch auf eine Telefonanlage angewandt werden, wie unten ausgeführt.
  • Die Beziehung zwischen den Anrufarten und zusätzlichen Konzepten (fett gedruckt) ist in der Vererbungs-Hierarchie in 1 dargestellt. Die Äußerungen eines Benutzers werden analysiert, um mögliche Anrufs-Routing-Ziele zu bestimmen, die als eine oder mehrere von z. B. 15 Anrufarten klassifiziert werden (eine Teilmenge ist in 1 dargestellt). Falls die Äußerungen des Benutzers nicht klassifiziert werden können, nachdem ein Dialog zwischen Benutzer und System durchgeführt wurde, wird der Benutzer für Klärungszwecke an einen menschlichen Agenten (ANDERE) verwiesen. Die Anrufarten sind in drei Kategorien unterteilt, INFORMATION, DIAL-FOR-ME (WÄHLE-FÜR-MICH), BILLING CREDIT (GEBÜHRENBERECHNUNGS-GUTHABEN) und, zusätzlich, ANDERE. Der Stand der Technik von Dialog-Management nutzt die Beziehungen zwischen Anrufarten nicht auf diese Art. Dieser neue Ansatz nutzt diese Hierarchie, um die semantisch konsistente Kombination von Anrufarten zu erzeugen, die für die Frage des Anrufers kennzeichnend sind.
  • Jede Anrufart ist als eine Klasse dargestellt. Jede Klasse kann damit verbundene Attribute haben, welche die Klasse beschreiben. Diese Attribute können spezifisch für die Klasse sein oder von anderen Klassen geerbt werden. 2 zeigt ein Beispiel für mehrere Anrufarten, wie z. B. DIAL-FOR-ME (WÄHLE-FÜR-MICH), BILLING (GEBÜHRENBERECHNUNG), CARD (KARTE), COLLECT (R-GESPRÄCH) und THIRD-NUMBER (DRITTE NUMMER). Da DIAL-FOR-ME eine Vorgängerklasse von BILLING ist und BILLING wiederum eine Vorgängerklasse von CARD, COLLECT und THIRD-NUMBER ist, erben sie jeweils, wie in der Abbildung dargestellt, das forward number-Attribut von DIAL-FOR-ME. CARD hat zusätzlich card number, und THIRD-NUMBER hat billing number. Da COLLECT nur forward number benötigt, benötigt es keine zusätzlichen Attribute.
  • Die Hierarchie arbeitet so, dass sie verschiedene Anrufarten nach Priorität sortiert, was, je nach der Priorität der Anrufart in der Hierarchie, in folgenden Szenarien resultieren kann: konjunktiv, sich gegenseitig ausschließend, ersetzend, unverlangte Informationen und Kontext-ändernde Szenarien.
  • Ein konjunktives Szenario tritt auf, wenn das System feststellt, dass der Anrufer zwei oder mehr Anrufarten implementieren möchte, die zwei nicht verwandten Zweigen der Vererbungs-Hierarchie angehören, was bedeutet, dass der (die) Anrufer(in) möchte, dass das System seine (ihre) beiden Anforderungen erfüllt. Mit jeder Anrufart ist eine Priorität verbunden. Die Hierarchie kann eine Priorisierung der Anrufarten codieren, die vom Dialogmanager verwendet werden kann, um festzustellen, welche Frage zuerst beantwortet werden soll. Zum Beispiel haben in 1 Informationsanfragen die höchste Priorität und werden daher zuerst beantwortet.
  • Ein Szenario des gegenseitigen Ausschlusses tritt auf, wenn das System feststellt, dass der Anrufer zwei oder mehr Anrufarten implementieren möchte, die zu zwei verwandten Zweigen der Vererbungs-Hierarchie gehören, so dass nur eines der Ziele erreicht werden kann. In diesem Szenario wird der (die) Anrufer(in) aufgefordert, sein (ihr) gewünschtes Routing-Ziel klarzustellen.
  • Ein Ersetzungsszenario tritt auf, wenn das System feststellt, dass der Anrufer zwei oder mehr Anrufarten implementieren möchte, wie im konjunktiven Szenario. Da jedoch eine Anrufart ein Vorgänger einer anderen Anrufart (Abkömmling) ist, ist impliziert, dass der Abkömmling seinen Vorgänger ersetzt. Diese Vererbungsstruktur wird ausgenutzt, um den Dialog auf die abhängige Anrufart zu fokussieren, da sie spezifischer ist.
  • Ein Bestätigungsszenario tritt dann auf, wenn das System die Notwendigkeit feststellt, die Absicht des Anrufers zu überprüfen, weil der Vertrauensgrad des Systems nicht hoch genug war. Es ist jedoch oftmals nicht notwendig, dass das System den (die) Anrufer(in) auffordert, seine (ihre) Anfrage zu wiederholen, sondern stattdessen die Informationen zu überprüfen, die in der ursprünglichen Äußerung enthalten waren.
  • Eine Kontextänderung findet statt, wenn der Anrufer oder das Spoken Language Understanding-Modul (Modul zum Verständnis der gesprochenen Sprache) z. B. einen Fehler macht und diesen dann korrigiert. Der (die) Anrufer(in) gibt eine gültige Antwort, das System reagiert in Form einer überprüfenden Frage. Der (die) Anrufer(in) beantwortet dann die überprüfende Frage negativ und fügt danach hinzu, dass er (sie) eine andere Anrufart mit einer entsprechend anderen Priorität implementieren möchte. Das System verarbeitet dann die zweite Antwort und stellt eine Überprüfungsfrage auf der Grundlage dieser Äußerung.
  • Die obigen Szenarien sind exemplarischer Natur. Es kann viele andere Situationen geben, um die Vererbungs-Hierarchie dieser Erfindung zu nutzen. Um weiter zu verdeutlichen, wie die Vererbungs-Hierarchie in diesen Szenarien genutzt wird, sind unten mehrere Beispiele aufgeführt.
  • 3 beschreibt, wie der Dialogmanager die Ausgabe des Spoken Language Understanding-Moduls (SLU) und die Vererbungs-Hierarchie der Erfindung nutzt. Das SLU-Modul 310 empfängt eingegebene Sprache von einem Erkennungsmodul und verknüpft die erkannte Sprache mit einem oder mehreren einer Reihe von Aufgaben-Zielen. Das SLU-Modul 310 stellt eine Liste von Aufgaben-Zielen anhand der erkannten eingegebenen Sprache zusammen und erteilt eine Bewertung im Zusammenhang mit der Wahrscheinlichkeit, dass der Benutzer die Implementierung eines bestimmten Aufgaben-Ziels wünscht. Das Verfahren zur Erkennung von Sprache und zur Zuweisung einer Bewertung im Zusammenhang mit der Wahrscheinlichkeit der Implementierung eines Aufgaben-Ziels auf der Grundlage erkannter Sprache kann mit jedem Verfahren durchgeführt werden, das dem Fachmann bekannt ist, einschließlich des Verfahrens, das in WO 9710589 offenbart ist.
  • Die Liste von Aufgaben-Zielen und ihre dazugehörigen Bewertungen werden vom SLU-Modul 310 in den Dialogmanager 330 eingegeben. Der Dialogmanager 330 wendet einen Grenzwert auf die Liste von Aufgaben-Zielen an, um das (die) wahrscheinlichste(n) eine oder mehreren Aufgaben-Ziel(e) zu bestimmen, die der Benutzer implementieren möchte. Der angewandte Grenzwert kann z. B. vorgegeben oder berechnet werden. Wenn keines der Aufgaben-Ziele auf der Liste von Aufgaben-Zielen den Grenzwert einhält, ordnet der Dialogmanager 330 an, dass dem Benutzer eine. Frage zur Klärung gestellt wird (z. B. "Das System hat Ihre Antwort nicht verstanden. Bitte versuchen Sie es noch einmal.") Sobald der Grenzwert angewandt wurde, wird auf die Liste mit wahrscheinlichen Aufgaben-Zielen eine Vererbungs-Hierarchie 320 angewandt, wie z. B. diejenige, die in 1 dargestellt und oben beschrieben ist. Der nächste Abschnitt beschreibt anhand mehrerer Beispiele, wie der Dialogmanager 330 die oben genannte Vererbungs-Hierarchie 320 und das Wissen über die Aufgaben nutzt.
  • Wenn der Benutzer eine Anfrage äußert, gibt das Erkennungsmodul sein Ergebnis an das SLU-Modul 310 weiter, das einen Satz von Anrufarten mit den bewerteten Wahrscheinlichkeiten erstellt, dass ein Anrufer die einzelnen Dienste jeweils wünscht. Die folgenden Beispiele verdeutlichen die Nutzung der Vererbungs-Hierarchie 320 zusammen mit dem SLU-Modul 310 durch den Dialogmanager zur Erstellung einer Booleschen Formel. Die Boolesche Formel wird vom Dialogmanager zur Erzeugung einer Antwort verwendet.
  • Koniunktives Szenario
    • Benutzer: Ich möchte ein Person-to-Person-Gespräch (Person-zu-Person-Gespräch) nach Tokio führen, aber können Sie mir sagen, wie spät es dort jetzt ist ? SLU-Ausgabe: {(PERSON-TO-PERSON, 0.97), (TIME (Zeit), 1.00)} Boolesche Formel: TIME UND PERSON-TO-PERSON
    • System: Es ist jetzt 11.00. Wie möchten Sie diesen Anruf verrechnen ?
  • In diesem Beispiel untersucht der Dialogmanager 330 die Vererbungs-Hierarchie 320, um festzustellen, dass die beiden Anrufarten, die vom SLU-Modul 310 zurückgeliefert werden, zu zwei nicht verwandten Zweigen der Vererbungs-Hierarchie gehören, was bedeutet, dass der (die) Anrufer(in) möchte, dass das System seine (ihre) beiden Anfragen beantwortet. Da mit jeder Anrufart eine Priorität verknüpft ist, werden die Anrufarten mit höchster Priorität zuerst beantwortet. In diesem Beispiel wird TIME, ein Abkömmling von INFORMATION, zuerst verarbeitet. Der Dialogmanager 330 schreitet dann fort zur Verarbeitung der PERSON-TO-PERSON-Anforderung, was zunächst eine Abfrage des Verrechnungsverfahrens erfordert.
  • Szenario des gegenseitigen Ausschlusses
    • Benutzer: Ich möchte diesen Anruf verrechnen. SLU-Ausgabe: {(THIRD-NUMBER, 0.75), (CARD, 0.24)} Boolesche Formel: THIRD-NUMBER ODER CARD
    • System: Wie möchten Sie diesen Anruf verrechnen ?
  • In diesem Beispiel ist es notwendig, dass der Dialogmanager 330 einen Klärungsdialog initiiert, um zu ermitteln, welches Verrechnungsverfahren angewandt werden soll. Auch hier untersucht der Dialogmanager 330 die Vererbungs-Hierarchie 320, um festzustellen, dass diese Anrufarten sich gegenseitig ausschließen, da es nur ein Verrechnungsverfahren geben kann. Die Beziehung des gegenseitigen Ausschlusses wird durch Einführung des Konzepts von MUTUAL EXCLUSION (GEGENSEITIGES AUSSCHLIEßEN als Vorgänger von BILLING implementiert, wie in 1 dargestellt.
  • Ersetzungsszenario
    • Benutzer: Ich versuche, einen Anruf mit der Telefonkarte durchzuführen; können Sie mir beim Wählen helfen ? SLU-Ausgabe: {(DIAL-FOR-ME, 0.78), (CARD, 0.96)} Boolesche Formel: CARD
    • System: Kann ich bitte Ihre Kartennummer haben ?
    • Benutzer: 000-123-4567-000
    • System: Welche Nummer möchten Sie anrufen ?
  • In diesem Beispiel war es nicht nötig, dass der Dialogmanager 330 nach dem Verrechnungsverfahren fragt, wie es der Fall wäre, wenn nur die Anrufart DIAL-FOR-ME zurückgeliefert worden wäre. Stattdessen kann er jetzt schon nach der Nummer der Telefonkarte und der Telefonnummer fragen, weil DIAL-FOR-ME ein Vorgänger von CARD ist, was bedeutet, dass CARD DIAL-FOR-ME ersetzt. Jedes Attribut einer Anrufart hat eine damit verknüpfte Priorität. Diese Priorität zwischen Attributen ist anders als die Priorität zwischen Anrufarten und wird verwendet, um zu bestimmen, nach welchem Attribut zuerst gefragt werden soll. Für die CARD-Anrufart hat das Attribut "Kartennummer" eine höhere Priorität als die Telefonnummer und wird daher zuerst abgefragt.
  • Bestätigungsszenario
    • Benutzer: Ja, Vermittlung, ich versuche 123 4567 anzurufen, aber ich komme nicht durch. SLU-Ausgabe: {(DIAL-FOR-ME, 0.84)} Boolesche Formel: (DIAL-FOR-ME)
    • System: Möchten Sie jemanden anrufen ?
    • Benutzer: Ja.
    • System: Würden Sie bitte die Nummer wiederholen ?
    • Benutzer: 555 4567
  • In diesem Fall war es nötig, zu überprüfen, ob der Benutzer jemanden anrufen wollte, da das Vertrauen nicht groß genug war. Es war jedoch nicht notwendig, den Benutzer explizit zu fragen "Welche Nummer möchten Sie wählen ?", sondern nur die Telefonnummer zu überprüfen, die in der ursprünglichen Äußerung genannt wurde.
  • Kontextänderungs-Szenario
    • Benutzer: Ähm...äh...kann ich ein R-Gespräch führen ? SLU-Ausgabe: {(COLLECT, 0.80)} Boolesche Formel: (COLLECT)
    • System: Möchten Sie ein R-Gespräch führen ?
    • Benutzer: Nein, nein, ziehen Sie das von meiner Telefonkarte ab. SLU-Ausgabe: {(CARD, 0.85)} Boolesche Formel: (CARD)
    • System: Möchten Sie mit der Karte telefonieren ?
    • Benutzer: Ja.
  • Es ist sehr nützlich, wenn das System eine Kontextänderung bearbeiten kann, besonders wenn der Benutzer einen Fehler gemacht hat und ihn rückgängig machen will, was hier der Fall ist.
  • Der Minimierungsalgorithmus für die Boolesche Formel zur Erzeugung der minimalen und konsistenten Kombination von Anrufarten beseitigt die oftmals komplexe Codierung von Implikationsregeln, die häufig mit Dialogmanagern 330 verbunden sind. Der Dialogmanager 330 der Erfindung ist datengesteuert, er wird mit der Vererbungs-Hierarchie 320 bereitgestellt, und er wendet den Minimierungsalgorithmus für die Boolesche Formel an. Wenn wir die Vererbungs-Hierarchie 320 ändern, müssen wir keinen neuen Dialogmanager 330 erstellen. Ein anderer Vorteil dieses datengesteuerten Ansatzes besteht in seiner Fähigkeit, die Übertragbarkeit in andere Anwendungen zu erleichtern. Die Verwendung des Dialogmanagers 330 in einer anderen Anwendung erfordert die Erstellung einer neuen Vererbungs-Hierarchie 320, aber nicht eines neuen Dialogmanagers 330.
  • Wir beschreiben den Algorithmus zur Erstellung der Booleschen Formel anhand eines Beispiels:
    • Benutzer: Ich möchte ein P-Gespräch verrechnen. SLU-Ausgabe: {(THIRD-NUMBER, 0.67), (CARD, 0.25), (PERSON-TO-PERSON, 0.97)} Boolesche Formel: (PERSON-TO-PERSON UND THIRD-NUMBER) ODER (PERSON-TO-PERSON UND CARD)
    • System: Wie möchten Sie diesen Anruf verrechnen ?
  • Von der Vererbungs-Hierarchie 320 weiß das System, dass CARD und THIRD-NUMBER sich gegenseitig ausschließen und dass PERSON-TO-PERSON in Verbindung mit jeder dieser beiden Anrufarten durchgeführt werden kann. Folglich ist die semantisch konsistente Kombination von Anrufarten (PERSON-TO-PERSON UND THIRD-NUMBER) ODER (PERSON-TO-PERSON UND CARD). Der Dialogmanager 330 bildet die ursprüngliche Interpretation auf eine Interpretation ab, die auf der Vererbungs-Hierarchie 320 beruht, und nutzt dies, um zu bestimmen, welche seiner Dialogstrategien er anwenden soll. Die ursprüngliche Interpretation, d. h. PERSON-TO-PERSON UND THIRD-NUMBER UND CARD, wird anhand der Vererbungs-Hierarchie 320 in eine mehrdeutige Interpretation abgebildet, da THIRD-NUMBER UND CARD nicht kompatibel sind. Der Dialogmanager 330 wendet dann eine Vereindeutigungs-Strategie an, um den Benutzer aufzufordern, das Gebührenberechnungs-Verfahren zu bestimmen. Anders als bei einem Beispiel, das die Abfrage fehlender Informationen erfordert, ist dieses Szenario mehrdeutig, weil das SLU-Modul 310 zwei Berechnungsverfahren bereitgestellt hat, im Gegensatz zu keinem.
  • Im Allgemeinen kann mit der Minimierung der Booleschen Formel die semantisch konsistente Kombination von Anrufarten gefunden werden. Die 46 verdeutlichen den Algorithmus mit Hilfe des Karnaugh-Tabellenverfahrens zur Minimierung Boolescher Formeln. Wir beginnen durch Abstrahierung der Anrufarten aus diesem Beispiel zu A, B und C, worin A und B sich gegenseitig ausschließen. Aufgrund dessen sollte die resultierende Formel nicht A UND B enthalten.
  • 6 ist ein Flussdiagramm des Algorithmus, der vom Dialogmanager zur Erzeugung der Booleschen Formel verwendet wird. Im Schritt S605 werden die SLU-Ausgabe und die Vererbungs-Hierarchie eingegeben. Im Schritt S610 wird eine Karnaugh-Tabelle erstellt, deren Zellen jeweils einen Bitstring enthalten, der die Werte der Variablen für diese Zelle (gezeigt im schattierten Bereich von 4) darstellt. Im Schritt S615 wird auf alle Variablen, die sich gegenseitig ausschließen (in diesem Beispiel A und B), die Transformation A=B=A∨B angewandt. Das Ergebnis dieser Transformation ist im nicht schattierten Bereich von 4 dargestellt. Im Schritt S620 wird für alle nicht schattierten Zellen in 4 X=A∧B∧C ausgewertet, um die Einsen und Nullen zu ergeben, die in der Standard-Karnaugh-Tabelle verwendet werden. Im Schritt S625 wird durch das Karnaugh-Tabellen-Verfahren auf X eine Minimierung der Booleschen Formel vorgenommen wie in 5 dargestellt. Schließlich wird im Schritt S630 eine Boolesche Formel ausgegeben.
  • Wenn wir diesen Algorithmus auf das obige Beispiel anwenden, ist die Ausgabe die Boolesche Formel (A UND C) ODER (B UND C). Der Dialogmanager verwendet dann diese Formel, um festzustellen, dass er Klärungsfragen stellen muss.
  • 7 zeigt ein Blockdiagramm einer möglichen Struktur, in welcher der Dialogmanager der Erfindung implementiert werden kann. Wie aus der Zeichnung ersichtlich ist, umfasst die Struktur zwei verwandte Teilsysteme: Meaningful Phrase Cluster Generation Subsystem 1 (Teilsystem zur Erzeugung sinnvoller Satz-Cluster) und Input Speech Classification Subsystem 2 (Teilsystem zur Klassifizierung eingegebener Sprache). Das Meaningful Phrase Cluster Generation Subsystem 1 arbeitet auf einer Datenbank einer großen Anzahl von Äußerungen, von denen jede mit einem aus einem vordefinierten Satz von Routing-Zielen zusammenhängt, worin jede Äußerung mit ihrem dazugehörigen Routing-Ziel markiert ist. Die Arbeit dieses Teilsystems wird im Wesentlichen vom Meaningful Phrase Selector 5 (Selektor sinnvoller Sätze) durchgeführt, der als Ausgabe einen Satz sinnvoller Sätze auswählt, die eine stochastische Beziehung zu einem oder mehreren aus dem Satz vordefinierter Routing-Ziele haben, mit dem die eingegebenen sprachlichen Äußerungen verknüpft sind. Die ausgewählten sinnvollen Sätze werden dann in ein Meaningful Phrase Clustering Device 15 (Vorrichtung zur Gruppierung sinnvoller Sätze) eingegeben, welche diejenigen sinnvollen Sätze gruppiert, die semantisch verwandt sind. Die Arbeitsweise des Meaningful Phrase Selector 5 und des Meaningful Phrase Clustering Device 10 wird allgemein in Übereinstimmung mit einem beliebigen bekannten Algorithmus zur Auswahl und Gruppierung sinnvoller Sätze festgelegt.
  • Die Arbeit des Input Speech Classification Subsystem 2 beginnt mit der Eingabe der Zielaufgaben-Anforderung eines Benutzers, in der natürlichen Sprache des Benutzers, in den Input Speech Recognizer 15. Der Input Speech Recognizer 15 kann jede gewünschte Konstruktion haben und erfüllt die Funktion des Erkennens eines oder mehrerer sinnvoller Sätze in der eingegebenen Sprache. Ein Meaningful Phrase Cluster Detector 20 (Detektor für sinnvolle Satzgruppen) erfasst dann die sinnvollen Satz-Cluster, die unter den sinnvollen erkannten Sätzen vorhanden sind. Wie in der Figur zu sehen ist, werden die sinnvollen Satz-Cluster, die vom Meaningful Phrase Generation Subsystem 1 erzeugt werden, dem Meaningful Phrase Cluster Detector 20 als Eingabe zur Verfügung gestellt, um die Routing-Ziele zu bestimmen, die mit sinnvollen Satz-Clustern zusammenhängen, und um den Wahrscheinlichkeitsgrad der Beziehung solcher eingegebenen sinnvollen Satz-Cluster zu einem bestimmten Routing-Ziel zu ermitteln.
  • Die Ausgabe des Meaningful Phrase Cluster Detector 20, welche die erfassten sinnvollen Satz-Cluster umfasst, die in der Routing-Ziel-Anfrage des Anrufers vorkommen, wird dem Interpretationsmodul 30 zur Verfügung gestellt. Das Interpretationsmodul 30 erstellt eine Liste wahrscheinlicher Routing-Ziele auf der Grundlage der stochastischen Beziehung zwischen den erkannten sinnvollen Satz-Clustern und den ausgewählten Routing-Zielen. Das Interpretationsmodul 30 wendet dann einen Grenzwert auf die Liste von Routing-Zielen an, um die Liste der Möglichkeiten zu begrenzen. Die Liste wird dann in den Dialogmanager 25 eingegeben, wo eine Vererbungs-Hierarchie und eine Boolesche Formel angewendet werden, um eine Entscheidung zu treffen, ob das ausgewählte Routing-Ziel implementiert werden soll, mit einer Benachrichtigung des Anrufers, dass ein solches Ziel implementiert wird (wenn nur ein Ziel möglich ist), oder ob zusätzliche Informationen und/oder Bestätigung vom Anrufer abgefragt werden sollen (wenn kein oder mehr als ein Ziel möglich ist).
  • Anhand der Rückmeldung des Anrufers als Reaktion auf eine solche Abfrage wendet der Dialogmanager 25 erneut die Vererbungs-Hierarchie und die Boolesche Formel an, um zu bestimmen, ob eine Entscheidung, ein bestimmtes Routing-Ziel zu implementieren, angemessen ist. Dieser Rückmeldungsprozess wird fortgesetzt, bis entweder eine eindeutige Entscheidung zur Implementierung eines bestimmten Routing-Ziels getroffen werden kann oder aber festgelegt wird, dass eine solche Entscheidung nicht wahrscheinlich ist; in diesem Fall wird der Anrufer per Vorgabe an eine Vermittlungsposition weitergeleitet.
  • 8 ist ein Flussdiagramm, das die Methodik der Erfindung darstellt. Die automatisierten Anruf-Routingfunktionen beginnen mit Schritt S205, wo einem Anrufer, der auf den Router zugreift, ein Gruß gesagt wird, wie z. B. "Was kann ich für Sie tun ?" Die Antwort des Anrufers auf diesen Gruß findet im Schritt S210 statt und wird auf das Vorhandensein eines oder mehrerer sinnvoller Satz-Cluster untersucht. Wie in der Figur zu sehen ist, wird der Satz sinnvoller Satz-Cluster sowohl Schritt S215 als auch Schritt S220 als Eingabe zur Verfügung gestellt.
  • In Schritt S220 wird eine nach Priorität sortierte Liste von Aufgaben-Zielen erstellt, basierend auf den erkannten sinnvollen Satz-Clustern, die aus der eingegebenen Sprache des Anrufers erkannt wurden. Im Schritt S221 wird ein Grenzwert auf die Liste von Aufgaben-Zielen angewandt, um zu ermitteln, ob irgendeine Anzahl von Aufgaben-Zielen im Zusammenhang mit der Sprache des Benutzers möglich ist. Im Schritt S222 werden dann eine Vererbungs-Hierarchie und eine Boolesche Formel auf die Liste von Aufgaben-Zielen angewandt, um weiter die möglichen Aufgaben zu bestimmen, die der Benutzer implementieren möchte. Im Schritt S225 wird anhand der Ergebnisse oder der Vererbungs-Hierarchie und der Booleschen Formel eine Entscheidung getroffen, ob keins, eines oder mehrere Ziele implementiert werden können. Wenn nur ein Ziel möglich ist und den Grenzwert einhält, wird das Ziel im Schritt S245 implementiert. Wenn keins oder mehrere der Ziele möglich sind, bittet der Dialogmanager 25 im Schritt S230 je nach Bedarf um eine Bestätigung vom Benutzer oder fordert zusätzliche Informationen an.
  • Ein solcher Dialog beginnt typischerweise mit einer Anfrage an den Benutzer in der Form "Möchten Sie...?" Wenn der Benutzer eine solche Anfrage verneint, kehrt das Verfahren im Schritt 5235 zum Schritt S210 zurück, wo der Benutzer seine Anfrage neu formuliert. Ein "Ja" oder ein Schweigen des Benutzers lässt den Prozess zum Schritt S240 fortschreiten, wo überprüft wird, ob weitere Informationen benötigt werden, um das Ziel zu erreichen, das in der eingegebenen Sprache nicht enthalten war – z. B. im Falle einer Gutschrift-Anfrage die Nummer, auf die der Betrag gutgeschrieben werden soll. Wenn zusätzliche Informationen benötigt werden, kehrt der Prozess zum Schritt S230 zurück, um einen weiteren Dialog mit dem Benutzer durchzuführen. Wenn keine zusätzlichen Informationen erforderlich sind, wird das Ziel im Schritt S245 implementiert.
  • Diese Erfindung bietet ein Verfahren zur Bestimmung eines Satzes semantisch konsistenter Anrufarten. Wissen über Aufgaben ist in einer Vererbungs-Hierarchie dargestellt, und Beziehungen (ersetzend und sich gegenseitig ausschließend) zwischen Anrufarten sind definiert. Diese Beziehungen steuern die Erzeugung des endgültigen Satzes semantisch konsistenter Anrufarten. Dieser Satz wird mit Hilfe eines Minimierungsalgorithmus für Boolesche Formeln erzeugt. Es ist dieser endgültige Satz von Anrufarten, der das Dialogverhalten steuert.
  • Obwohl die vorliegenden Ausführungsformen der Erfindung detailliert beschrieben wurden, versteht es sich, dass verschiedene Änderungen, Modifikationen und Ersetzungen darin vorgenommen werden können, ohne vom Schutzumfang der Erfindung, wie durch die beigefügten Ansprüche definiert, abzuweichen.

Claims (23)

  1. Ein Verfahren zum Interpretieren einer Anfrage eines Benutzers und Implementieren eines oder mehrerer Aufgaben-Ziele, das Folgendes umfasst: Erstellung einer Hierarchie von Aufgaben-Zielen, wobei die Hierarchie eine Vielzahl von Kategorien von Aufgaben-Zielen einschließt, wobei jedem der Aufgaben-Ziele eine unterschiedliche Priorität zugewiesen wird; Identifizierung eines oder mehrerer der Aufgaben-Ziele aus der Eingabe des Benutzers, gekennzeichnet durch Zuweisung eines Wertes zu jedem der identifizierten einen oder mehreren der Aufgaben-Ziele, wobei der Wert mit einer Wahrscheinlichkeit verknüpft ist, dass der Benutzer die Implementierung eines bestimmten Aufgaben-Zieles wünscht, Anwendung eines Grenzwertes auf das eine oder die mehreren mit Werten versehenen Aufgaben-Ziele, und für jeden der einen oder mehreren Aufgaben-Ziele, die den Grenzwert einhalten, Bestimmung einer Reihenfolge der Implementierung der den Grenzwert einhaltenden Aufgaben-Ziele auf der Grundlage der Prioritäten, die jedem der identifizierten Aufgaben-Ziele zugewiesen wurden.
  2. Das Verfahren von Anspruch 1, das weiter den Schritt des Implementierens der Aufgaben-Ziele auf der Grundlage der bestimmten Implementierungs-Reihenfolge umfasst.
  3. Das Verfahren von Anspruch 1, worin die identifizierten Aufgaben-Ziele, die den Grenzwert nicht einhalten, nicht implementiert werden.
  4. Das Verfahren von Anspruch 1, worin die Hierarchie von Aufgaben-Zielen weiter eine Vielzahl an Kategorien von Aufgaben-Zielen umfasst, die eine aus dem Folgenden sind: gegenseitig ausschließend, ersetzend oder konjunktiv sind.
  5. Das Verfahren von Anspruch 4, worin, wenn gegenseitig ausschließende Aufgaben-Ziele identifiziert werden, ein Dialog-Manager ein Signal erzeugt, das anzeigt, dass ein Dialog mit dem Benutzer stattfinden sollte.
  6. Das Verfahren von Anspruch 1, worin jeder der Kategorien von Aufgaben-Zielen eine unterschiedliche Priorität zugewiesen wird.
  7. Das Verfahren von Anspruch 6, worin die Kategorien der identifizierten Aufgaben-Ziele und eine Implementierungs-Reihenfolge der Aufgaben-Ziele auf Grund der Prioritäten bestimmt werden, die den identifizierten Kategorien zugewiesen wurden.
  8. Das Verfahren von Anspruch 3, worin, wenn der Grenzwert auf die identifizierten einen oder mehreren Aufgaben-Ziele angewandt wird und die identifizierten Aufgaben-Ziele, die den Grenzwert nicht einhalten, nicht sofort implementiert werden, ein Dialog mit dem Benutzer durchgeführt wird.
  9. Das Verfahren von Anspruch 8, das weiter folgenden Schritt umfasst: Identifizieren eines oder mehrerer der Aufgaben-Ziele aus einer vom Benutzer gelieferten Eingabe, nachdem der Dialog durchgeführt wurde.
  10. Das Verfahren von Anspruch 1, worin die Eingabe des Benutzers Sprache ist.
  11. Das Verfahren von Anspruch 1, worin jede der Aufgaben-Arten ein oder mehrere Attribute hat und jedem Attribut auf der Grundlage der Eingabe des Benutzers eine Priorität zugewiesen wird.
  12. Ein System zum Interpretieren einer Anfrage und Interagieren mit einem Benutzer, um ein oder mehrere Aufgaben-Ziele zu implementieren, Folgendes umfassend: ein Vererbungs-Hierarchie-Modul, das eine Hierarchie von Aufgaben-Zielen erstellt, wobei die Hierarchie eine Vielzahl von Kategorien von Aufgaben-Zielen einschließt, wobei jedem der Aufgaben-Ziele eine unterschiedliche Priorität zugewiesen wird, ein Interpretations-Modul, das aus den Äußerungen des Benutzers ein oder mehrere der Aufgaben-Ziele indetifiziert, gekennzeichnet durch ein Wertigkeitsmodul zur Zuweisung eines Wertes zu jedem der identifizierten einen oder mehreren der Aufgaben-Ziele, wobei der Wert mit einer Wahrscheinlichkeit verknüpft ist, dass der Benutzer die Implementierung eines bestimmten Aufgaben-Zieles wünscht, ein Grenzwertmodul zur Anwendung eines Grenzwertes auf das eine oder die mehreren mit Werten versehenen Aufgaben-Ziele, und einen Dialog-Manager, der eine Implementierungs-Reihenfolge für jedes der einen oder mehreren Aufgaben-Ziele, die den Grenzwert einhalten, auf der Grundlage der Prioritäten, die jedem der identifizierten Aufgaben-Ziele zugewiesen wurden, bestimmt.
  13. Das System von Anspruch 12, das weiter Folgendes umfasst: ein Implementierungsmodul, das konfiguriert ist, um die identifizierten einen oder mehreren Aufgaben-Ziele auf der Grundlage der bestimmten Implementierungs-Reihenfolge implementieren.
  14. Das System von Anspruch 12, worin die identifizierten Aufgaben-Ziele, die den Grenzwert nicht einhalten, nicht sofort implementiert werden.
  15. Das System von Anspruch 12, worin die Hierarchie von Aufgaben-Zielen weiter eine Vielzahl von Kategorien von Aufgaben-Zielen umfasst, die eine aus dem Folgenden sind: gegenseitig ausschließend, ersetzend oder konjunktiv sind.
  16. Das System von Anspruch 13, worin, wenn das Interpretations-Modul gegenseitig ausschließende Aufgaben-Ziele identi fiziert, der Dialog-Manager ein Signal erzeugt, das anzeigt, dass ein Dialog mit dem Benutzer stattfinden sollte.
  17. Das System von Anspruch 12, worin das Vererbungs-Hierarchie-Modul jeder der Kategorien von Aufgaben-Zielen eine andere Priorität zuweist.
  18. Das System von Anspruch 17, worin der Dialog-Manager die Kategorien der identifizierten Aufgaben-Ziele bestimmt und auf der Grundlage der Prioritäten der identifizierten Kategorien eine Implementierungs-Reihenfolge der Aufgaben-Ziele bestimmt.
  19. Das System von Anspruch 14, worin, wenn der Grenzwert auf die identifizierten einen oder mehreren Aufgaben-Ziele angewandt wird und die identifizierten Aufgaben-Ziele, die den Grenzwert nicht einhalten, nicht sofort implementiert werden, ein Dialog mit dem Benutzer durchgeführt wird.
  20. Das System von Anspruch 19, worin, nachdem der Dialog mit dem Benutzer durchgeführt wird und der Benutzer eine zusätzliche Eingabe liefert, die zusätzliche Eingabe des Benutzers dann zurück in das Interpretations-Modul eingegeben wird.
  21. Das System von Anspruch 12, worin die Eingabe des Benutzers Sprache ist.
  22. Das System von Anspruch 21, worin das Interpretations-Modul ein Modul ist, das gesprochene Sprache versteht (Spoken Language Understanding Modul).
  23. Das System von Anspruch 12, worin jede der Aufgaben-Arten ein oder mehrere Attribute hat und jedem Attribut auf der Grundlage der Eingabe des Benutzers eine Priorität zugewiesen wird.
DE69835792T 1997-10-03 1998-10-02 Verfahren und Apparat zum Erzeugen semantisch konsistenter Eingaben für einen Dialog-Manager Expired - Lifetime DE69835792T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US943944 1997-10-03
US08/943,944 US6192110B1 (en) 1995-09-15 1997-10-03 Method and apparatus for generating sematically consistent inputs to a dialog manager

Publications (2)

Publication Number Publication Date
DE69835792D1 DE69835792D1 (de) 2006-10-19
DE69835792T2 true DE69835792T2 (de) 2007-09-13

Family

ID=25480526

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69835792T Expired - Lifetime DE69835792T2 (de) 1997-10-03 1998-10-02 Verfahren und Apparat zum Erzeugen semantisch konsistenter Eingaben für einen Dialog-Manager

Country Status (5)

Country Link
US (1) US6192110B1 (de)
EP (1) EP0907130B1 (de)
CA (1) CA2248715C (de)
DE (1) DE69835792T2 (de)
MX (1) MXPA98008052A (de)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173261B1 (en) 1998-09-30 2001-01-09 At&T Corp Grammar fragment acquisition using syntactic and semantic clustering
US7590224B1 (en) * 1995-09-15 2009-09-15 At&T Intellectual Property, Ii, L.P. Automated task classification system
JP3178426B2 (ja) * 1998-07-29 2001-06-18 日本電気株式会社 自然言語対話システム及び自然言語対話プログラム記録媒体
WO2000022549A1 (en) * 1998-10-09 2000-04-20 Koninklijke Philips Electronics N.V. Automatic inquiry method and system
TW501046B (en) * 1999-06-11 2002-09-01 Ind Tech Res Inst A portable dialogue manager
WO2001008135A1 (en) * 1999-07-23 2001-02-01 Intervoice Limited Partnership System and method to facilitate speech enabled user interfaces
US6510411B1 (en) * 1999-10-29 2003-01-21 Unisys Corporation Task oriented dialog model and manager
US8392188B1 (en) 1999-11-05 2013-03-05 At&T Intellectual Property Ii, L.P. Method and system for building a phonotactic model for domain independent speech recognition
US6681206B1 (en) 1999-11-05 2004-01-20 At&T Corporation Method for generating morphemes
US7085720B1 (en) 1999-11-05 2006-08-01 At & T Corp. Method for task classification using morphemes
US7286984B1 (en) 1999-11-05 2007-10-23 At&T Corp. Method and system for automatically detecting morphemes in a task classification system using lattices
US7050977B1 (en) * 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US6785651B1 (en) * 2000-09-14 2004-08-31 Microsoft Corporation Method and apparatus for performing plan-based dialog
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
US20020087310A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented intelligent dialogue control method and system
US7257537B2 (en) * 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US6950793B2 (en) 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
US7127402B2 (en) * 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
US6751591B1 (en) 2001-01-22 2004-06-15 At&T Corp. Method and system for predicting understanding errors in a task classification system
WO2002073452A1 (en) * 2001-03-14 2002-09-19 At & T Corp. Method for automated sentence planning
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US6839896B2 (en) * 2001-06-29 2005-01-04 International Business Machines Corporation System and method for providing dialog management and arbitration in a multi-modal environment
DE10209928A1 (de) * 2002-03-07 2003-09-18 Philips Intellectual Property Verfahren zum Betrieb eines Sprach-Dialogsystems
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US7190768B2 (en) * 2002-08-20 2007-03-13 Avaya Technology Corp. Method and apparatus for human-assisted adaptive outbound telephone call classification based on pattern recognition
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US8645122B1 (en) * 2002-12-19 2014-02-04 At&T Intellectual Property Ii, L.P. Method of handling frequently asked questions in a natural language dialog service
US8818793B1 (en) * 2002-12-24 2014-08-26 At&T Intellectual Property Ii, L.P. System and method of extracting clauses for spoken language understanding
US8849648B1 (en) * 2002-12-24 2014-09-30 At&T Intellectual Property Ii, L.P. System and method of extracting clauses for spoken language understanding
US20050165607A1 (en) * 2004-01-22 2005-07-28 At&T Corp. System and method to disambiguate and clarify user intention in a spoken dialog system
US7933774B1 (en) * 2004-03-18 2011-04-26 At&T Intellectual Property Ii, L.P. System and method for automatic generation of a natural language understanding model
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US7634409B2 (en) * 2005-08-31 2009-12-15 Voicebox Technologies, Inc. Dynamic speech sharpening
US7599861B2 (en) 2006-03-02 2009-10-06 Convergys Customer Management Group, Inc. System and method for closed loop decisionmaking in an automated care system
US7809663B1 (en) 2006-05-22 2010-10-05 Convergys Cmg Utah, Inc. System and method for supporting the utilization of machine language
US8379830B1 (en) 2006-05-22 2013-02-19 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US8346555B2 (en) * 2006-08-22 2013-01-01 Nuance Communications, Inc. Automatic grammar tuning using statistical language model generation
US20080091423A1 (en) * 2006-10-13 2008-04-17 Shourya Roy Generation of domain models from noisy transcriptions
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8909528B2 (en) * 2007-05-09 2014-12-09 Nuance Communications, Inc. Method and system for prompt construction for selection from a list of acoustically confusable items in spoken dialog systems
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8589161B2 (en) * 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
JP2011033680A (ja) * 2009-07-30 2011-02-17 Sony Corp 音声処理装置及び方法、並びにプログラム
WO2011059997A1 (en) 2009-11-10 2011-05-19 Voicebox Technologies, Inc. System and method for providing a natural language content dedication service
US9171541B2 (en) * 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US9898459B2 (en) 2014-09-16 2018-02-20 Voicebox Technologies Corporation Integration of domain information into state transitions of a finite state transducer for natural language processing
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
JP6334815B2 (ja) * 2015-03-20 2018-05-30 株式会社東芝 学習装置、方法、プログラムおよび音声対話システム
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5586171A (en) * 1994-07-07 1996-12-17 Bell Atlantic Network Services, Inc. Selection of a voice recognition data base responsive to video data
US5675707A (en) * 1995-09-15 1997-10-07 At&T Automated call router system and method
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5999611A (en) * 1996-11-19 1999-12-07 Stentor Resource Centre Inc. Subscriber interface for accessing and operating personal communication services

Also Published As

Publication number Publication date
CA2248715C (en) 2002-02-12
EP0907130A3 (de) 2004-09-08
EP0907130B1 (de) 2006-09-06
MXPA98008052A (es) 2004-10-14
US6192110B1 (en) 2001-02-20
EP0907130A2 (de) 1999-04-07
DE69835792D1 (de) 2006-10-19
CA2248715A1 (en) 1999-04-03

Similar Documents

Publication Publication Date Title
DE69835792T2 (de) Verfahren und Apparat zum Erzeugen semantisch konsistenter Eingaben für einen Dialog-Manager
DE69814114T2 (de) Natürliche sprache verstehendes verfahren und verstehende vorrichung zur sprachsteuerung einer anwendung
DE112009002000B4 (de) Adaptives Verfahren und Vorrichtung zur Umwandlung von Nachrichten zwischen unterschiedlichen Datenformaten
DE69908047T2 (de) Verfahren und System zur automatischen Bestimmung von phonetischen Transkriptionen in Verbindung mit buchstabierten Wörtern
DE60007620T2 (de) Spracherkennungsverfahren
DE602006000907T2 (de) Zugangssteuerungssystem, Regelmaschinen-Anpasseinrichtung, regelbasierte Erzwingungsplattform und Verfahren zum Ausführen einer Zugriffssteuerung
EP3652664A1 (de) Verfahren zur dialogführung zwischen mensch und computer
DE602005000308T2 (de) Vorrichtung für sprachgesteuerte Anwendungen
DE112017006151T5 (de) Anpassbare Verarbeitungskomponenten
DE112018005167T5 (de) Aktualisieren von trainingsdaten
DE102015121509A1 (de) Methodik und Vorrichtung zur Konsistenzprüfung durch Vergleich von Ontologiemodellen
DE19706419A1 (de) Verfahren und Vorrichtung zur Steuerung von Prozessen unter Verwendung einer Technologie zur maschinellen Sprachverarbeitung
DE102021126866A1 (de) Erleichterung eines automatisierten, interaktiven, konversationellen Dialogs zur Fehlerbehebung bei einem Produktunterstützungsproblem über einen Chatbot
EP0901658B1 (de) Verfahren zur optimierung eines fuzzy-regelsatzes durch einen rechner
DE69909360T2 (de) Verfahren und System um Dokumente über eine elektronische Datei wiederaufzufinden
EP1231596B1 (de) Trainingsmethode von den freien Parameten eines Maximum-Entropie-Sprachmodells
DE19849855C1 (de) Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem
DE60121445T2 (de) Speicherverwaltung für Sprachdialogsystem
EP3570189B1 (de) Computerimplementiertes verfahren zum bereitstellen eines adaptiven dialogsystems und ein adaptives dialogsystem
EP3776539B1 (de) Verfahren zum rechnergestützten lernen eines roboters über einen sprachdialog
EP1533940A1 (de) Transformation Function eines TMN Systems
DE10131157C1 (de) Dynamisches Grammatikgewichtungsverfahren für Spracherkennungssysteme
DE202022104673U1 (de) System zur Rückverfolgbarkeit von sozialen Netzwerken
Khosla et al. Constructs for building complex symbolic-connectionist systems
EP1454212A2 (de) Cpl-editor

Legal Events

Date Code Title Description
8364 No opposition during term of opposition