DE4436175B4 - Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat - Google Patents

Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat Download PDF

Info

Publication number
DE4436175B4
DE4436175B4 DE4436175A DE4436175A DE4436175B4 DE 4436175 B4 DE4436175 B4 DE 4436175B4 DE 4436175 A DE4436175 A DE 4436175A DE 4436175 A DE4436175 A DE 4436175A DE 4436175 B4 DE4436175 B4 DE 4436175B4
Authority
DE
Germany
Prior art keywords
audio
user
text
computer
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE4436175A
Other languages
English (en)
Other versions
DE4436175A1 (de
Inventor
James A. Beaverton Larson
Scott Beaverton Boss
Murali Beaverton Veeramoney
Mike Portland Rosenzweig
Roger Hillsboro Hurwitz
Scott Beaverton Colville
Thiru Vilwamalai Raman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dialogic Corp Canada
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of DE4436175A1 publication Critical patent/DE4436175A1/de
Application granted granted Critical
Publication of DE4436175B4 publication Critical patent/DE4436175B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00206Transmitting or receiving computer data via an image communication device, e.g. a facsimile transceiver
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2854Wide area networks, e.g. public data networks
    • H04L12/2856Access arrangements, e.g. Internet access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/247Telephone sets including user guidance or feature selection means facilitating their use
    • H04M1/2473Telephone terminals interfacing a personal computer, e.g. using an API (Application Programming Interface)
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/6505Recording arrangements for recording a message from the calling party storing speech in digital form
    • H04M1/651Recording arrangements for recording a message from the calling party storing speech in digital form with speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/06Simultaneous speech and data transmission, e.g. telegraphic transmission over the same conductors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/56Details of telephonic subscriber devices including a user help function
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42314Systems providing special services or facilities to subscribers in private branch exchanges
    • H04M3/42323PBX's with CTI arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0065Converting image data to a format usable by the connected apparatus or vice versa
    • H04N2201/0067Converting to still picture data

Abstract

Vorrichtung zum Fern-Zugreifen auf einen Computer (12) ausgehend von einem Telefonhandapparat (14), der eine Eingabeeinrichtung (18) und eine Ausgabeeinrichtung (15) aufweist, umfassend:
einen Computer (12), der Daten speichert, die elektronische Post (e-mail), einen Dateimanager, eine Sprachnachricht, eine Datenbank und ein Telefax repräsentieren;
eine Schnittstellenschaltung, die der Telefonhandapparateingabeeinrichtung den Zugriff auf einen einer Mehrzahl von Audio-Dialogen über eine einzige Telefonziffer ermöglicht, wobei über die Audio-Dialoge auf die elektronische Post, den Dateimanager, die Sprachnachricht, die Datenbank und das Telefax zugegriffen werden kann;
eine Text-zu-Sprache-Maschine (138), die Audio-Nachricht-Daten erzeugen kann, die einem Text in einer Dokument-Datei entsprechen;
eine Sprachschaltungsanordnung (106, 134) zum Erzeugen von Audio-Nachrichten, die aus dem Computer zu der Ausgabeeinrichtung (15) des Telefonhandapparates (14) übermittelt werden sollen, wobei die Sprachschaltungsanordnung eine Klang-Task-Schnittstelle (134) aufweist, welche eine vorab aufgezeichnete Klang-Nachricht-Datei, die von einer Klang-Maschine (186) zur Verfügung gestellt wird, mit den von der Text-zu-Sprache-Maschine (138) zur Verfügung gestellten...

Description

  • Die Erfindung betrifft ein Telefonzugriffssystem, welches einem Benutzer gestattet, mit einem Computer über einen Telefonapparat in Wechselwirkung zu treten.
  • Computer können Informationen über eine Vielzahl unterschiedlicher Kommunikationsgeräte übermitteln, empfangen und anzeigen. Beispielsweise können Personalcomputer interne Fax- und Modem-Platinen enthalten, die es dem System gestatten, Faxe und elektronische Post zu senden und zu empfangen. Der Computer kann außerdem digitale Möglichkeiten zur Klangerzeugung und zur Umsetzung von Sprache in Text haben, welche es dem System gestatten, aufgezeichnete Sprachnachrichten zu speichern und zu erzeugen. Diese Kommunikationswerkzeuge sind zusätzlich zu den herkömmlichen Systemdateien, Spreadsheets, usw. vorgesehen.
  • Die Schnittstelle zwischen einem Personalcomputer und einem Benutzer stellt gegenwärtig ein Bildschirm und eine Tastatur dar. Die Schnittstelle kann durch eine "Maus" unterstützt werden, welche es dem Benutzer gestattet, den Bildschirmcursor zu einem grafischen Bildschirmsymbol zu bewegen und eine Funktion auszuwählen, die dem Bildschirmsymbol entspricht. Um beispielsweise den Inhalt eines Dokuments durchzusehen, muß der Benutzer zunächst den Text auf dem Bildschirm anzeigen, indem er typischerweise eine Anzahl von Tastatur- und/oder Maus-Eingaben erzeugt. Sobald das Dokument auf dem Bildschirm angezeigt ist, kann der Benutzer den Inhalt des Dokuments visuell lesen. Die Kommunikation über ein Fax oder über elektronische Post wird ebenfalls ausgeführt, indem eine Anzahl von Tastatur/Maus-Eingaben entsprechend den Instruktionen vorgesehen wird, die von einer der Operation des Kommunikationsgeräts angepaßten Software zur Verfügung gestellt werden.
  • Es kann der Fall eintreten, daß Computer lebenswichtige Nachrichten, Dokumente, Zeitpläne usw. enthalten, die von dem Benutzer durchgesehen werden müssen, selbst wenn der Benutzer nicht in der Lage ist, die Tastatur des Systems zu bedienen. Beispielsweise kann es sein, daß der Benutzer auf Reisen ist und ein Dokument durchsehen muß oder in ein "Kalender-Programm" sehen muß, wobei sich das Dokument bzw. das Programm auf einem in einem Büro aufgestellten Computer befindet.
  • Aus der Technik sind Systeme bekannt, die eine sprachliche Schnittstelle für Computersysteme bereitstellen.
  • Ein Terminal-System, das mit einer Sprachausgabe ausgestattet ist, um Daten in sprachlicher Wiedergabe über ein Telefon wiederzugeben, ist in der US 4 716 583 beschrieben.
  • Die EP 0 214 347 A1 beschreibt ein automatisiertes Lernsystem, bei dem ein Lernender über ein Telefon ein automatisiertes Bildungs- und Testcenter anrufen kann. Dem Anrufenden werden automatisiert eine Reihe Fragen gestellt und mögliche Antworten vorgeschlagen die durch Druck auf eine Taste auswählbar sind.
  • In Muller, M.J.; Daniel, J.E.: Toward a Definition of Voice Documents. in: Proceedings of COIS, 1990, S. 174-183 wird eine Verwendung von Sprachdokumenten in einem Sprach-I/O-Hypermedia-System und insbesondere die Navigation, Verwaltung und Autorisierung solcher Sprachdokumente beschrieben.
  • Die US 5 179 585 beschreibt ein integriertes Nachrichtenübermittlungs-/interaktives Sprachantwortsystem, bei dem ein Zugriff auf eine Mehrzahl verschiedener Verarbeitungsanwendungsmodule über eine Telefonleitung bereitgestellt wird.
  • Ein sprachbetriebenes Faxverteilungssystem zum Übermitteln speziell angeforderter Grafik- und/oder Textdaten aus einer Datenbank zu einem Faxgerät eines Anforderers wird in der US 5 136 634 beschrieben.
  • Die bekannten Systeme weisen jedoch oft insbesondere klangliche Defizite auf.
  • Es ist daher ein Aufgabe der Erfindung, eine Vorrichtung zu schaffen, die eine klanglich verbesserte Sprach-Schnittstelle zur Wiedergabe von Daten und gleichzeitig eine große Funktionalität aufweist.
  • Die Aufgabe wird erfindungsgemäß gelöst durch eine Vorrichtung mit den Merkmalen des Patentanspruchs 1.
  • Die Erfindung schafft ein Telefonzugriffssystem, welches einen Fern-Zugriff und eine Fern-Kommunikation mit einem Computer über einen Telefonhandapparat ermöglicht. Das System stellt Audiobefehle zur Verfügung, die es einem Benutzer gestatten, zwischen einer Mehrzahl von Audiodialogen auszuwählen. Die Audiodialoge gestatten einen Zugriff auf Sprach-Post, elektronische Post, einen Dateimanager (Dokumente, Datenbank usw.), Faksimiles und andere Daten, die in dem Computer gespeichert sind. Einmal innerhalb eines Audiodialogs stellt das System eine Reihe von Instruktionen und Kontrollen zur Verfügung, welche es dem Benutzer gestatten, die in dem Computer gespeicherten Informationen zu manipulieren. Beispielsweise kann das System dem Benutzer gestatten, eine über elektronische Post empfangene Nachricht zu hören und dann auf die Nachricht zu antworten. Das System kann außerdem dem Benutzer gestatten, den Text eines Dokuments zu hören und das Dokument zu einem fernen Ort zu faxen. Das System gestattet dem Benutzer, mit einem Computer unter Verwendung eines Telefons zu kommunizieren, um viele der Aufgaben auszuführen, die gegenwärtig mit einer Tastatur und einem Bildschirm ausgeführt werden.
  • Das System ist so konstruiert, daß eine Vielzahl von statischen Funktionen einem Tastensatz auf dem Tastenfeld des Telefonapparates zugeordnet sind. Beispielsweise bewirkt ein Drükken der Sternchen-Taste stets ein Wiederholen der von dem System zur Verfügung gestellten Audioinstruktionen. Die statischen Tasten gestatten es dem Benutzer, schnell mit dem System vertraut zu werden, so daß der Benutzer schnell die verschiedenen Audiodialoge und Steuerfunktionen innerhalb der Dialoge durchsuchen oder überfliegen kann.
  • Das System weist einen Audiomechanismus auf, welcher zuvor aufgezeichnete Tonfrequenznachrichten mit gespeicherten aus Text in Sprache umgewandelten Audio-Nachrichten so verschmilzt, daß dem Benutzer Instruktionen ohne Lücken zwischen den Worten der Tonfrequenznachricht und der Audio-Text-Zu-Sprache-Nachricht zur Verfügung gestellt werden. Der Audiomechanismus kann außerdem eine Audio-Hintergrundnachricht zur Verfügung stellen, um ein Wort oder einen Satz hörbar hervorzuheben, das bzw. der in dem gespeicherten elektronischen Text grafisch hervorgehoben ist. Außerdem gestattet das System dem Benutzer, ein Dokument durchzusehen, und liefert dem Benutzer die ausgesprochene Form eines Wortes innerhalb des Dokumententextes.
  • Das System schafft eine Programmierschnittstelle, die Bausteine enthält, welche einem Programmierer gestatten, das Telefonzugriffssystem auf die Anwendung zuzuschneiden. Um die Fehlerbeseitigung (Debugging) in jedem Programm durchzuführen, stellt das System eine Tastatur-/grafische Schnittstelle zur Verfügung, welche einen Telefonhandapparat simuliert. Ein grafischer Handapparat erscheint auf einem Computerbildschirm und wird mittels einer Tastatur und/oder Maus betätigt, um Eingabekommandos in das System einzugeben, die mit dem Drücken von Tasten des Telefonapparats korrelieren.
  • Die Erfindung schafft ein System, welches einem Benutzer einen Fern-Zugriff auf einen Computer über einen Telefonhandapparat gestattet. Das erfindungsgemäße System ist von dem Betreiber des Systems leicht zu benutzen.
  • Die Erfindung schafft ein Computer-Telefonzugriffssystem, welches einem Benutzer Audioinstruktionen zur Verfügung stellt, ohne Lücken zwischen den zuvor aufgezeichneten Tonfrequenznachrichten und Audionachrichten, die durch Umwandlung von elektronischen Text in Sprache gebildet wurden, entstehen zu lassen.
  • Das erfindungsmäße System gestattet es einem Benutzer, den Text eines in einem Computer gespeicherten Dokuments über einen fernen Telefonhandapparat durchzusehen. Darüberhinaus kann mit Hilfe des erfindungsgemäßen Systems ein Text, der in dem ge speicherten elektronischen Text grafisch hervorgehoben ist, hörbar hervorgehoben werden.
  • Das erfindungsgemäße System gestattet es einem Programmierer, die Fehler in einem Anwendungsprogramm für ein Computer-Telefonzugriffssystem zu beseitigen, ohne einen Telefonhandapparat zu benutzen.
  • Mit Hilfe des erfindungsgemäßen Systems ist es ferner möglich, aus der Ferne über einen Telefonhandapparat die Übertragung von Informationen per Faksimile zu initiieren.
  • Im folgenden wird die Erfindung anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher beschrieben. In der Zeichnung zeigt:
  • 1 eine schematische Veranschaulichung eines Computer-Telefonzugriffssystems;
  • 2a–c stellen ein Ablaufdiagramm dar, das die Interaktion mit einem Satz von Audiodialogen in einem Computer über einen Telefonhandapparat zeigt;
  • 3 ist eine schematische Darstellung der Computerschnittstelle des Systems;
  • 4 ist eine schematische Darstellung eines Systems für eine grafisch unterstützte Fehlerbeseitigung in einer Anwendung des Systems;
  • 5 ist eine schematische Darstellung einer Schnittstelle, die eine Faksimileübertragung von Informationen von dem Computer über einen Telefonhandapparat gestattet;
  • 6a–c zeigen ein Ablaufdiagramm, das die Fax-Übertragung eines Dokuments durch die Fax-Schnittstelle zeigt;
  • 7 zeigt eine schematische Darstellung eines Audiodialogs, welcher eine Mehrzahl von Audiosteuerungen hat;
  • 8 ist eine der Darstellung gemäß 7 ähnliche Darstellung, die einen Audiodialog mit einer Anzahl unterschiedlicher Audiosteuerungen zeigt;
  • 9 ist eine schematische Darstellung eines Tastenfeldes eines Telefonhandapparats mit den Tasten zugewiesenen Funktionen;
  • 10 ist ein Schema, das die Moden zeigt, welche es einem Benutzer gestatten, den Text eines Dokuments über einen Telefonhandapparat durchzusehen;
  • 11 ist ein Schema einer Textdurchsichtshierarchie.
  • 1 stellt ein erfindungsgemäßes Telefonzugriffssystem 10 dar. Das System 10 gestattet es einem Benutzer, über einen Telefonhandapparat auf einen Computer zuzugreifen und wechselseitig mit diesem zusammenzuwirken. Das System weist einen Computer 12 auf, der über ein öffentliches Telefonnetz (PTSN – public telephone System network) 16 mit einem Telefonhandapparat 14 gekoppelt ist. Der Telefonhandapparat 14 kann irgendein herkömmlicher allgemein verfügbarer Handapparat sein. Der Telefonhandapparat 14 kann in dem erfindungsgemäßen System ohne irgendwelche Hinzufügungen oder Modifikationen verwendet werden. Der Handapparat enthält üblicherweise eine Hörmuschel 15, eine Sprechmuschel 17 und ein Tastenfeld 18.
  • Herkömmliche Handapparat-Tastenfelder weisen 12 Tasten auf; zehn den Ziffern 0–9 zugeordnete Tasten, eine *-Taste und eine #-Taste. Der Handapparat 14 kann an ein öffentliches Telefonnetz 16 entweder über Kabel oder drahtlos gekoppelt sein.
  • Der Computer 12 kann der Auftisch- oder Laptop-Personalcomputer sein, der normalerweise von dem Benutzer benutzt wird. Der Computer 12 hat eine Schnittstelle 19, die es dem Computer gestattet, mit einem PTSN- oder PBX-System zu kommunizieren. Bei dem bevorzugten Ausführungsbeispiel ist die Schnittstelle 19 eine interne Telemodem-Karte, welche sowohl über Modem- als auch Faksimile-Protokolle kommunizieren kann.
  • Der Computer 12 des Benutzers kann mit einem anderen Computer 20 über ein lokales Netzwerk (LAN) 22 mittels bekannter Hardware und Software gekoppelt sein. Das LAN-System 22 gestattet es dem Benutzer, sich elektronische Nachrichten enthaltende Informationen mit anderen Computern 20 zu teilen. Der Computer 12 kann außerdem mit einem Fax-Gerät 24 über das PTSN 16 gekoppelt sein. Obwohl nur ein Fax-Gerät und ein einziger zusätzlicher Computer 20 gezeigt sind, ist es klar, daß der Computer 12 mit einer Mehrzahl unterschiedlicher Computer und Fax-Geräte gekoppelt sein kann.
  • Die 2a–c zeigen ein Beispiel eines Nachrichtenaustauschs zwischem dem Benutzer und dem Computer 12 über den Handapparat 14. Wie im Verarbeitungsblock 50 gezeigt ist, hat der Computer 12 eine elektronische Nachricht vom Computer 20 zusammen mit einem von dem Benutzer durchzusehenden Dokument empfangen. Im Block 52 wählt der Benutzer eine Telefonnummer, welche von dem Computer empfangen und bestätigt wird. Der Computer beantwortet den Ruf und verbindet sich mit dem Benutzer. Der Benutzer drückt dann die *-Taste und gibt über das Tastenfeld 20 des Handapparats 14 ein Passwort ein (Verarbeitungsblock 54). Das System ist typischerweise so eingerichtet, daß es dem Benutzer gestattet ist, eine Anzahl n von Versuchen zur Eingabe des korrekten Passworts vorzunehmen. Beispielsweise können dem Benutzer drei Chancen eingeräumt werden, daß korrekte Passwort einzugeben. Wenn der Benutzer nach n Versuchen nicht das richtige Passwort eingibt, sperrt das System den Benutzer aus, so daß er nicht auf den Computer zugreifen kann.
  • Sobald das richtige Passwort eingegeben worden ist, stellt der Computer dem Benutzer ein Audiodialogmenü zusammen mit Instruktionen darüber zur Verfügung, wie jeder Audiodialog aus dem Menü auszuwählen ist (Block 56). Beispielsweise kann die Audionachricht lauten: "Um eine Datei durchzusehen, drücken Sie 1; um Ihre elektronische Post durchzusehen, drücken Sie 2; ...". Jeder Dialog kann eine Zusammenfassung enthalten, die den Inhalt des Dialogs beschreibt. Beispielsweise kann die Audionachricht lauten: "Ihre elektronische Post enthält fünf Nachrichten; um die Nachricht Ihrer elektronischen Post durchzusehen, drücken Sie 2".
  • Der Benutzer wählt ein Audiodialog (Datei, elektronische Post, Fax, Sprachpost usw.) aus, indem er im Verarbeitungsblock 58 die geeignete Taste auf dem Handapparat 14 drückt. Beispielsweise kann der Benutzer ein Durchsehen der elektronischen Post durch Drücken der "2"-Taste auf dem Handapparat 14 auswählen. Im Block 60 stellt der Computer 12 dann dem Benutzer eine Reihe von Audio-Steuerfunktions-Instruktionen zur Verfügung, welche von dem Benutzer durch Drücken der geeigneten Tasten beantwortet werden. Im Block 62 "liest" der Computer die Nachricht der elektronischen Post dem Benutzer vor, indem er den elektronischen Text in hörbare Sprache konvertiert.
  • Im Block 64 kann der Computer 12 Instruktionen darüber zur Verfügung stellen, was mit der elektronischen Post zu geschehen hat, nachdem sie dem Benutzer "vorgelesen" worden ist. Beispielsweise kann der Computer 12 sagen: "Um die Nachricht zu sichern, drücken Sie 1; um die Nachricht zu faxen, drücken Sie 2; um auf die Nachricht zu antworten, drücken Sie 3; ...". In Block 66 drückt der Benutzer eine "3", wobei der Computer mit der Audionachricht antwortet: "Bitte zeichnen Sie die Nachricht nach dem Ton auf". Die Nachricht des Benutzers wird in digitaler Form von dem Computer 12 in Block 68 aufgezeichnet. Im Block 70 gibt der Benutzer "4" ein, um die Antwortnachricht zum Computer 20 zu senden, wobei der Computer 12 die aufgezeichnete Nachricht dem Computer 20 über das LAN-System 22 sendet.
  • Nachdem die aufgezeichnete Nachricht zum Computer 20 gesendet worden ist, liefert der Computer 12 im Verarbeitungsblock 72 erneut eine Audionachricht, die die ursprüngliche Nachricht der elektronischen Post betrifft (zum Beispiel: "Um auf die Nachricht zu antworten, drücken Sie 1; um die Nachricht zu faxen, drücken Sie 2"). Im Block 74 gibt der Benutzer die "2" ein, um die Nachricht und das Dokument zu faxen. In Verarbeitungsblock 76 stellt der Computer 12 dem Benutzer eine Instruktion zur Verfügung, die ihn nach der Telefonnummer des Fax-Geräts fragt. Im Block 78 gibt der Benutzer die Fax-Nummer ein und hängt auf. Der Computer 12 faxt die Nachricht und das Dokument zu dem Fax-Gerät (Block 80).
  • Das erfindungsgemäße System 10 gestattet es einem Benutzer, über einen Handapparat auf einen Computer zuzugreifen und mit diesem in Wechselwirkung zu treten. Wie oben beschrieben, kann der Benutzer über einen Telefonhandapparat Nachrichten durchsehen, auf Nachrichten antworten und Dokumente faxen. Die oben beschriebene Kommunikation zwischen Benutzer und dem Computer ist ein das System veranschaulichendes Beispiel. Das System ist in der Lage, viele andere Möglichkeiten zur Verfügung zu stellen, welche unten beschrieben werden sollen.
  • 3 zeigt eine Computerschnittstelle 100 des Systems. Die Schnittstelle 100 weist eine Telefon-Anwendungsprogrammier-Schnittstelle (TAPI – telephone application programming Interface) 102 auf, welche es dem Computer 12 gestattet, mit dem PTSN 16 zu kommunizieren. Die TAPI 102 schafft eine Einrichtung, mit der der Computer Telefonanrufe aus dem PTSN empfangen und steuern sowie auf diese antworten kann. Die TAPI 102 findet sich in dem Microsoft-Windows-Betriebssystem und wird als Windows-Telephony-API bezeichnet. Die Schnittstelle 100 weist außerdem einen Kommunikationsanwendungsspezifikations-Manager CAS MNGR (communication application specification manager) 104 auf, welcher eine Low-Level-Fax-Schnittstelle mit dem PTSN 16 zur Verfügung stellt. Ein solches Programm wird gegenwärtig von der Intel Corp. unter der Bezeichnung "DCA/Intel Communication Application Specification" vermarktet und ist mit einer von Intel unter der Handelsbezeichnung "SatisFaxtion" verkauften Fax-Hardware versehen. Anstelle des CAS MNGR 104 können auch andere Low-Level-Fax-Schnittstellen verwendet werden.
  • Die Schnittstelle des Computersystems weist außerdem eine Tonfrequenz-Anwendungsprogramm-Schnittstelle (WAPI – wave application program Interface) 106 auf, welche digitale in analoge Audiosignale und umgekehrt analoge in digitale Audiosignale konvertiert. Eine solche Schnittstelle befindet sich gegenwärtig in dem Windows-Betriebssystem und wird als WAVEFORM API bezeichnet.
  • Das System weist eine Telefonzugriffs-Bibliothek (TAL – telephone access library) 108 auf, die mit der TAPI 102, der WAPI 106 und dem CAS MNGR 104 gekoppelt ist. Die TAL 108 ist über einen Telefonzugriffs-Manager (TAM – telephone access manager) 116 mit den Telefonzugriffsanwendungsprogrammen 110 gekoppelt. Die Telefonzugriffsanwendungsprogramme (TAA – telephone access application) 110 sind Programme, die modifiziert werden, um entsprechend den Eingaben von einem Telefonhandapparat zu laufen. Beispielsweise können die Telefonzugriffsanwendungsprogramme einen Zugriff auf Anwendungsprogramme für Microsoft-Windows zur Verfügung stellen, wie beispielsweise einem Adreß- und Kalender-Programm, das als PACKRAT verkauft wird, einen Dateimanager wie beispielsweise den Windows-Dateimanager oder ein Fax-Programm, wie beispielsweise FAXability. Auf diese Programme wird gegenwärtig über den Bildschirm und die Tastatur/die Maus des Computers zugegriffen. Die Telefonzugriffsanwendungen werden über den Telefonzugriffsmanager installiert und konfiguriert.
  • Das System der Erfindung gestattet es dem Anwendungsprogrammierer, das Programm zu modifizieren, um eine Kommunikation über ein Telefonsystem zu gestatten. Diese modifizierten Anwendungsprogramme werden als "Tapplets" bezeichnet. Indem er auf ein Tapplet zugreift, kann der Benutzer mit einer der Anwendungen innerhalb des Computers über den Telefonhandapparat kommunizieren. Beispielsweise kann der Benutzer auf ein Tapplet zugreifen, das eine Verbindung zu einem Programm für elektronische Post zur Verfügung stellt. Sobald er mit dem Tapplet für elektronische Post verbunden ist, kann der Benutzer den Inhalt der elektronischen Post "durchsehen". Ein anderes Tapplet kann eine Verbindung zu einem Dateimanager zur Verfügung stellen, wobei der Benutzer auf eine Datei innerhalb des Computers zugreifen kann. Die Kommunikationen zwischen dem Benutzer und einem Tapplet werden als Audiodialoge bezeichnet.
  • Die TAL 108 stellt eine Schnittstelle zur Verfügung, welche auf Eingaben von der Telefonzugriffsanwendung 110 oder dem Benutzer antwortet und die die zum Ausführen des Programms erforderliche Task (Aufgabe) verwaltet. Insbesondere stellt die TAL dem Tapplet Dienste höherer Ordnung zur Verfügung, die Telefo nie, Tonfrequenzerzeugung, Umwandlung von Text in Sprache und Fax einschließen. Die TAL stellt ein Vielzahl von einfachen Grundbausteinen zur Verfügung, welche es dem Programmierer gestatten, ein Tapplet zu erzeugen. Beispielsweise könnte ein Tapplet für eine Antwortmaschine mit den folgenden Abstraktionen geschrieben werden.
    WaitForCall;
    AnswerCall;
    PlayWave greeting.wav;
    Record message.wav;
  • Bei diesem Beispiel stellt das Tapplet eine Eingabe zu. der TAL zur Verfügung, um auf einen Ruf zu warten und auf diesen zu antworten. Wenn ein Ruf beantwortet wird, dann stellt die TAL Instruktionen zu der WAPI zur Verfügung, um eine für den Benutzer hörbare Nachricht zu erzeugen, die in der Datei "greeting.wav" gespeichert ist, was der Instruktion "PlayWave greeting.wav;" von dem Tapplet entspricht. Die TAL stellt außerdem einen Mechanismus zum Aufzeichnen der Audionachricht von dem Benutzer zur Verfügung. Die Eingaben von dem Telefonhandapparat werden von der TAPI in ein digitales Format konvertiert und der TAL als Programmeingabe zur Verfügung gestellt.
  • Die TAL kann asynchrone Funktionen handhaben, die für das Tapplet unsichtbar sind. Beispielsweise kann der Benutzer Ziffern eingeben, bevor die Anwendung einen Schritt in dem Audiodialog erreicht, der die Ziffern anfordert. Die TAL speichert die Ziffern in einer Eingabewarteschlange. Wenn das Tapplet explizit eine Eingabe anfordert, kann die TAL den Inhalt der Eingabewarteschlange zur Verfügung stellen. Wenn die Eingabewarteschlange nicht voll ist, kann das Tapplet "schlafen" gehen, bis die Warteschlange mit den eingegebenen Ziffern voll ist. Die TAL stellt außerdem eine Einrichtung zum Steuern der Systemausgabe in Abhängigkeit von der vom Telefonhandapparat empfangenen Eingabe zur Verfügung. Beispielsweise kann die TAL einer Ausgabe gestatten, übersprungen zu werden, ohne sequentiell jede In struktion der Ausgabe dem Benutzer zur Verfügung zu stellen. In dem oben genannten Beispiel kann das Tapplet eine Reihe von Instruktionen erfordern beginnend mit "zum Zugreifen auf die elektronische Post, drücke 1" gefolgt von der Instruktion "zum Zugreifen auf Fax, drücke 2" usw. Wenn der Benutzer nach der Instruktion für die elektronische Post eine 2 eingibt, unterbricht die TAL die Routine, um auf den Fax-Dialog zu springen, ohne die Instruktion "zum Zugreifen auf Fax, drücke 2" abzuspielen.
  • Im folgenden wird auf 3 bezug genommen. Die TAL 108 ist mit der TAPI 102 über eine dynamische Verbindungsbibliothek (DLL – dynamic link library) verbunden, die als Telefonzugriffs-Dienste-Anbieter (telephone access services provider) 112 bezeichnet wird. Die TAPI 102 ist außerdem mit einem Telefonmanager 114 verbunden. Der Telefonmanager 114 empfängt die hereinkommenden Telefonanrufe und zeigt die Rufe auf dem Bildschirm des Computers an.
  • Wenn der Computer einen hereinkommenden Ruf empfängt, bestimmt die TAPI zunächst, ob der Anruf eine Sprach-, eine Faksimile- oder eine Modem-Daten-Übertragung ist. Wenn der Ruf eine Sprach-Übertragung ist, stellt die TAPI 102 dem Telefonmanager 114 eine Neue-Ruf-Nachricht zur Verfügung. Der Ruf wird dann auf dem Computerbildschirm 118 angezeigt. Wenn sich der Benutzer an dem Computer 12 befindet und den Ruf beantwortet, so nimmt das System einen herkömmlichen Sprachkommunikationsmodus an, bei dem der Benutzer mit anderen Parteien über das PTSN kommuniziert. Wenn der Benutzer das Telefon nicht nach einer vorgegebenen Anzahl von Rufzeichen abhebt, kennzeichnet der Telefonmanager den Ruf als gespeicherte Sprachnachricht und übergibt den Ruf der TAPI 102, welche die gespeicherte Sprachnachricht an den TAM 116 über den Telefonzugriffs-Dienste-Anbieter 112 weitergibt.
  • Die TAM 116 kann mit einer Antwortmaschine 120 gekoppelt sein, die eine hörbare Nachricht, wie beispielsweise "Bitte sprechen Sie eine Nachricht nach dem Ton", zur Verfügung stellt. Vor dem Abschluß der Routine der Antwortmaschine kann der Benutzer eine Eingabe zur Verfügung stellen, wie beispielsweise das Drücken der *-Taste auf dem Telefonhandapparat 14. Bei Empfang der Eingabe * fordert die TAM 116 ein Passwort von dem Benutzer an. Die TAM empfängt dann und überprüft das nachfolgende von dem Benutzer eingegebene Passwort. Wenn der Benutzer keine *-Eingabe eingibt oder kein korrektes Passwort zur Verfügung stellt, beendet die TAM 116 den Anruf durch Aufhängen. Wenn der Benutzer nicht versucht, ein Passwort einzugeben, zeichnet die Antwortmaschine eine beliebige nachfolgende von dem Benutzer zur Verfügung gestellte Sprachnachricht auf.
  • Der hereinkommende Ruf von der TAPI 102 wird an den Telefonzugriffs-Dienste-Anbieter 112 weitergeleitet. Das System kann eine Anzahl unterschiedlicher hereinkommender Rufe bedienen. Um die unterschiedlichen Rufe zu verfolgen, kennzeichnet der Dienste-Anbieter 112 jeden Ruf mit einen speziellen Ruf ID zur zukünftigen Verwendung durch die TAL 108. Beispielsweise kann die TAL eine Anzahl unterschiedlicher Eingabewarteschlangen für jeden Ruf erstellen. Die Eingaben von jedem Anrufer werden dann in die jeweilige entsprechende Eingabewarteschlange zur nachfolgenden Verwendung durch die Tapplets eingegeben.
  • Wie in 4 gezeigt ist, kann das System einen Erzeuger 122 für ein grafisches Telefon enthalten, der mit einem auf dem Bildschirm 118 des Computers angezeigten Telefon 123 einer grafischen Benutzerschnittstelle (GUI – graphical user interface) gekoppelt ist. Der Erzeuger 122 des grafischen Telefons simuliert ein Telefon und gestattet es dem Benutzer, eine Taste des Tastensatzes des Handapparats über die Tastatur/Maus des Computers auszuwählen.
  • In Betrieb erschafft die GUI eine "Neuer-Anruf"-Schaltfläche auf dem Computerbildschirm 118. Der Programmierer ruft dann die "Neuer-Anruf"-Funktion über die Tastatur/Maus-Schnittstelle des Computers auf. Der Grafiktelefonerzeuger 122 erstellt eine Telefonverbindung mit dem System, indem er die Meldung eines neuen Anrufs an die TAL 108 in der gleichen Weise sendet, wie die TAPI 102 die TAL über einen neuen von dem PTSN gelieferten Anruf informieren würde. Der Grafiktelefonerzeuger erschafft dann einen simulierten Handapparat auf dem Bildschirm. Der Benutzer kann dann über die Tastatur/Maus-Schnittstelle eine Taste auf dem Tastenfeld auswählen. Bei Auswahl einer Taste liefert der Grafiktelefonerzeuger 122 die geeignete Bestätigung an das System, die der ausgewählten Taste entspricht.
  • Die TAL hat vorzugsweise einen Eingang, welcher zwischen "lokal" und "fern" hin und her geschaltet werden kann, wobei das System über das PTSN 16 arbeitet, wenn es sich in dem Fern-Modus befindet, und über den Telefonerzeuger 122, wenn es sich in dem Lokal-Modus befindet. Der Telefonerzeuger 122 ist über die WAPI 106 mit einem Lautsprecher 124 verbunden, welcher es dem Benutzer gestattet, die von dem Computer erzeugten hörbaren Nachrichten zu hören. In dem "lokalen" Modus sichert der Telefonerzeuger 122, daß die lokalen Tonfrequenzgeräte (wave devices) mit dem Lautsprecher 124 und einem Mikrofon 126 gekoppelt sind. Der Telefonerzeuger 122 kann außerdem mit dem Mikrofon 126 gekoppelt sein und eine Eingabeeinrichtung zur Verfügung stellen, die es dem Benutzer gestattet, Nachrichten in dem System aufzuzeichnen. Der Telefonerzeuger 122, der Lautsprecher 124 und das Mikrofon 126 simulieren gemeinsam den Betrieb eines Telefonhandapparats und gestatten es einem Programmierer, die Fehler in einem Tapplet zu beseitigen (debug), ohne physikalisch das System mit einem öffentlichen Telefonnetz (PTSN) zu verbinden.
  • Im folgenden wird auf 3 bezug genommen. Die TAL 108 enthält eine Fax-Schnittstelle 128, welche in Abhängigkeit von der Eingabe von dem Telefonhandapparat Informationen von dem Computer über das PTSN per Fax senden kann. 5 zeigt die Fax-Schnittstelle 128, welche drei primäre Aufgaben erfüllt: Sammeln von Dateien, Wiedergeben von Dateien und Senden von Dateien, nachdem der Benutzer das Telefon aufgehängt hat. Um diese Aufgaben auszuführen, enthält die TAL eine Fax-Warteschlange 130 und eine Statustafel 132. Die Fax-Warteschlange 130 speichert Fax-Anforderungen von den Benutzern, wie sie empfangen werden, und faxt diese Informationen auf einer zuersthinein-zuerst-hinaus-Grundlage (FIFO). Jedes angeforderte Doku ment wird mit einer entsprechenden Fax-Telefonnummer, die von dem Benutzer eingegeben wurde, gekennzeichnet. Die Statustafel 132 listet sämtliche angeforderten Dateien auf und bestimmt dann, ob diese Dokumente in das Fax-Protokoll konvertiert werden können. Wenn das System die Dokumente nicht in ein Fax-Protokoll konvertieren kann, liefert der Computer an den Benutzer eine Sprach-Nachricht, die anzeigt, daß das Dokument nicht konvertiert werden kann.
  • 6 zeigt die Übertragung eines Dokuments per Faksimile über den Handapparat. Anfänglich greift der Benutzer auf das System zu und gibt eine Anforderung nach verschiedenen Fax-Dokumenten ein (Verarbeitungsblock 150). Das System holt diese Dokumente heran (Block 152). Im Entscheidungsblock 154 bestimmt die Fax-Schnittstelle 128 dann, ob das Dokument in das Fax-Protokoll mit Hife der Software des Systems konvertiert werden kann. Wenn das System das Dokument nicht konvertieren kann, trägt die Fax-Schnittstelle 128 ein "N" in der Statustafel ein (Block 156).
  • Wenn das Dokument konvertiert werden kann, wird das Dokument in die Fax-Warteschlange plaziert (Verarbeitungsblock 158). Die Fax-Schnittstelle 128 fährt im Entscheidungsblock 160 damit fort nachzusehen, ob es ein weiteres zu konvertierendes Dokument gibt. Nachdem sämtliche Dokumente durchgesehen worden sind, informiert das System den Benutzer der Fax-Anforderung über die Statustafel (Block 161). Im Block 162 hängt der Benutzer den Telefonhandapparat auf.
  • Wenn das System das Dokument konvertieren kann, wird das Dokument angefertigt. Die angeforderten Dokumenten können angefertigt werden, indem zunächst der Standarddrucker des Computers auf den DCX-Drucker geändert wird (Block 164). Im Verarbeitungsblock 166 geht die TAL zu der Ressourcendatenbasis des Computerbetriebssystems, um das Kommando zum Drucken zu finden, und "druckt" das Dokument in die Datei "DCX-Drucker-Anschluß". In Block 168 wird das Dokument von der Fax-Schnittstelle 128 mit Hilfe des CAS MNGR 104 gefaxt.
  • Anstelle dessen, daß die TAL zu der Ressourcendatenbasis geht, um das Druckkommando zu gewinnen, und dann das Kommando ausgibt, kann das System in einem alternativen Ausführungsbeispiel eine universelle Dokument-Ansicht-Anwendung, beispielsweise die von der Systems Compatibility Corp. unter der Handelsbezeichnung OUTSIDE IN angebotene Anwendung, enthalten, welche irgendeine Art eines Dokuments ansehen kann. Bei der alternativen Lösung wird der Standarddrucker in den DCX-Drucker geändert und danach fordert die TAL das Programm OUTSIDE IN auf, das Dokument an den DCX-Drucker zu drucken, wo das Dokument konvertiert und dann an die Telemodem-Platine angelegt wird.
  • Im folgenden wird auf 3 bezug genommen. Die TAL hat eine Klang-Task-Wiedergabe-Schnittstelle 134 (play wavetask Interface), welche zum Erzeugen von hörbaren Nachrichten verwendet wird. Die Klang-Task ist mit einer Klangmaschine (wave engine) 136 und einer Text-in-Sprache-Umwandlungsmaschine (TTS-Maschine; text to speech engine) 138 verbunden. Die TTS-Maschine 138 kann ein Programm, wie beispielsweise das von First Byte unter der Handelsbezeichnung PROVOICE verkaufte, sein, welches elektronischen Text in ein Format konvertiert, welches in hörbare Nachrichten konvertiert werden kann. Die TTS-Maschine 138 ist mit einem Textpuffer 139 verbunden. Die Klangmaschine 136 ist mit einer beliebigen Anzahl vor-aufgezeichneter Klangdateien 140 gekoppelt, die digitalisierte vor-aufgezeichnete Hörnachrichten enthalten. Die Klangdatei ist üblicherweise auf dem Festplattenlaufwerk des Computers angeordnet.
  • Die Erfindung schafft sowohl eine Klang-Erzeugung als auch eine Umwandlung von Text in Sprache, wobei jede der beiden Möglichkeiten Vorteile hat, die von dem Programmierer genutzt werden können. Beispielsweise hat die Klangerzeugung exzellente Klangqualitäten und keine zeitliche Verzögerung bei der Erzeugung des Ausgangssignals, aber sie hat einen begrenzten Umfang vor-aufgezeichneter Worte und sie erfordert eine große Speichermenge. Die Umwandlung von Text in Sprache ermöglicht einen großen Wortumfang und erfordert eine relativ geringe Speicher menge, aber sie liefert eine schlechte Klangqualität und möglicherweise eine große Zeitverzögerung bei der Erzeugung der Sprache.
  • Die Klang-Task-Schnittstelle (wavetask interface) 134 fordert an und empfängt Puffer von Daten von den Maschinen entsprechend den Instruktionen von der TAL 108. Die Klang-Task-Schnittstelle 134 stellt dann die Datenpuffer der WAPI 106 zur Verfügung, welche die Daten über die Telemodem-Karte 19 zu dem Handapparat 14 sendet. Die Klang-Task-Schnittstelle 134 hat vorzugsweise zwei Puffer (nicht gezeigt), welche typischerweise alternieren zwischen dem Senden von Datenpuffern zu der WAPI 106, wobei ein Puffer Datenpuffer von einer Maschine empfängt, während der andere Puffer Datenpuffer zu der WAPI 106 sendet.
  • Wenn die TAL 108 ein Spracherzeugungseingangssignal von der TAA 110 (d.h. von einem Tapplet) empfängt, reiht die TAL den Inhalt der Spracheingabekommandos in eine Warteschlange ein. Beispielsweise kann das Tapplet das folgende Programm enthalten:
    Playwave X.wave;
    PlayTTS "5";
    Playwave Y.wave;,
    welches der Hörnachricht "Sie haben 5 Nachrichten" entspricht. Bei Empfang des Eingangssignals reiht die TAL jeden Schritt in eine globale Warteschlange ein und instruiert die Klang-Task, Sprache entsprechend dem Kommando in der ersten Warteschlange "Playwave X.wave" zu initiieren. Die Klang-Task 134 stellt dann ein Kommando "initiateWave" der Klang-Maschine 136 zur Verfügung, um Puffer von der X.wave-Datei innerhalb einer gesetzten Anzahl von Puffern und mit einem vorgegebenen ID eines Klang-Treibergeräts zu erzeugen. Die Klang-Maschine 136 holt die X.wave-Datei aus der Klangdatei 140 heran. Wenn die Klang-Task 134 bereit ist, die Puffer zu empfangen, erzeugt die Schnittstelle 134 ein Kommando "RequestWaveBuffer" (Fordere Klang-Puffer an) an die Klang-Maschine 136. Die Klang-Maschine stellt dann der Klang-Task 134 die Datenpuffer zur Verfügung. Die Datenpuffer haben jeweils einen Maschinen-Kopfteil, welcher im einzelnen angibt, welche Maschine die Puffer (Klänge oder aus Text erzeugte Sprache) erzeugt, sowie einen Puffer-Kopfteil, welcher das Gewicht des Puffers innerhalb des Pufferstroms (1. Puffer, letzter Puffer usw.) identifiziert.
  • Zu Beginn jeder Spracherzeugungsanforderung werden zwei Instruktionen "RequestSpeechBuffer" (für die TTS-Maschine 138) oder zwei Instruktionen "RequestWaveBuffer" (für die Klang-Maschine 136) vorgesehen, um beide Puffer innerhalb der Klang-Task-Schnittstelle zu füllen. Nachdem die Puffer anfänglich gefüllt sind und einer der Puffer gesendet und von der WAPI 106 zurückgegeben wurde, stellt die Schnittstelle 134 ein Kommando "RequestSpeechBuffer" (sofern erforderlich) und ein Komando "ReturnSpeechBuffer" für die TTS-Maschine 138 zur Verfügung bzw. entsprechende Kommandos "RequestWaveBuffer" und "ReturnWaveBuffer" für die Klang-Maschine 136. Die Datenpuffer, die von der WAPI 106 abgespielt worden sind, werden von der Klang-Task 134 zu der Klang-Maschine 136 gemeinsam mit der Instruktion "ReturnSpeechBuffer" zurückgegeben. Die Klang-Maschine 136 gibt dann die Datenpuffer für eine erneute Benutzung durch das System zurück.
  • Die Puffer müssen mit Hilfe von Windows GlobalAloc zugewiesen und mit GlobalLock verriegelt werden. Wenn die Puffer zu der Klang-Task von der WAPI zurückgegeben werden, werden die Puffer entriegelt unter Verwendung von Windows GlobalUnlock und befreit mit Hilfe von GlobalFree. Die globale Speicherzuweisung (Global memory allocation) wird außerdem verwendet für die Maschine und Puffer-Kopfteile.
  • Bei Empfang des letzten Datenpuffers von der Klang-Maschine für das Kommando "Playwave X.wave;" und bevor der letzte Datenpuffer an die WAPI 106 angelegt wird, stellt die Klang-Task-Schnittstelle 134 ein Kommando "InitiateSpeech" (initiiere Sprache) der TTS-Maschine 138 zur Verfügung, um Datenpuffer für die Hörnachricht "5" zu erzeugen. Die TTS-Maschine 138 konvertiert dann den Text in ein Tonsignal und stellt die Puffer der Klang-Task 134 in Antwort auf eine "RequestSpeechBuffer"-Anforderung von der Schnittstelle 134 zur Verfügung. Wenn der letzte Datenpuffer von der TTS-Maschine 138 empfangen worden ist, initiiert die Klang-Task-Schnittstelle 134 die Klang-Maschine 136 für das Kommando "Playwave Y.wave;". Das Initiieren der nächsten Maschine (engine) vor dem Anlegen des letzten Datenpuffers an die WAPI 106 eliminiert irgendwelche Lücken in der Sprachnachricht, wobei ein realistischerer Klang erzeugt wird.
  • Die Erzeugung von Sprache von den Maschinen wird durch ein Kommando "TerminateSpeech" (beende Sprache) von der Klang-Task 134 beendet. Bei Empfang des Kommandos "TerminateSpeech" stoppen die Maschinen sofort das Senden von Datenpuffern an die Klang-Task. Dieses Merkmal gestattet es dem Benutzer, Sprachnachrichten zu überspringen, ohne die gesamte Nachricht zu hören. Beispielsweise kann der Benutzer eine Eingabe am Handapparat vorsehen, um die Nachricht zu überspringen, nachdem die WAPI die Sprachnachricht "Sie ..." erzeugt hat, wobei die Klang-Task eine Instruktion "TerminateSpeech" der TTS-Maschine 138 oder eine Instruktion "TerminateWave" der Klang-Maschine 136 liefert, um die Übertragung von Datenpuffern zu beenden. Die Kommandos "TerminateSpeech" und/oder "TerminateWave" werden in Antwort auf eine Eingabe von der TAL erzeugt, welche die Handapparateingaben des Benutzers über die TAPI 102 empfängt. Die gesamte Sitzung (session) wird geschlossen, wenn die Klang-Task-Schnittstelle 134 ein Kommando "ShutdownSpeech" bzw. "ShutdownWave" den Maschinen 136 und 138 liefert.
  • Die Schnittstelle 100 weist außerdem eine Klang-Task-Aufzeichnungs-Schnittstelle (record wavetask Interface) auf, die mit einer Klang-Maschine verbunden ist und die ein digitales Aufzeichnen von Sprachnachrichten von dem Benutzer gestattet.
  • Die Klang-Maschinen haben bestimmte Sprachparameter, auf welche über die WAVEHDR-Struktur (WAVEHDR – wave header) jedes Puffers zugegriffen werden kann. Diese Parameter enthalten einen Maschinen-Kopfteil für jeden Puffer. Der Maschinen-Kopfteil kann ein Feld dwKind enthalten, welches die Art der Maschine spezifiziert. Dieser Parameter kann ausgedehnt werden, um eine andere Maschine hinzuzufügen. Der Maschinen-Kopfteil enthält außerdem ein Feld dwFlag, welches Flags für den ersten, mittlere und den letzten Datenpuffer zur Verfügung stellt. Der Kopfteil kann außerdem ein Feld dwUser enthalten, was von dem Programmierer definiert wird, und ein Feld dwReserved. Tabelle I listet zusätzliche steuerbare Sprachparameter auf, die von dem System zur Verfügung gestellt werden.
  • Tabelle I
    Figure 00210001
  • Die TTS-Maschine 138 kann außerdem In-Text-Kommandos zur Verfügung stellen, welche den Kontext der Hörnachricht variieren. Beispielsweise kann das In-Text-Kommando den Abstand (pitch) des erzeugten Klanges variieren oder ein Fenster des Schweigens vor der Erzeugung des nächsten Wortes einfügen.
  • Grafischer Text hat üblicherweise Hervorhebungen, wie beispielsweise Unterstreichungen oder Fettdruck. Es ist wünschenswert, eine hörbare Anzeige solcher Hervorhebungen für den Benutzer zur Verfügung zu stellen. Das erfindungsgemäße System stellt solche Hervorhebungen zur Verfügung, indem es einen Klanghintergrund dem gesprochenen Wort beimischt. Beispielsweise könnte ein musikalisches Glockenspiel gleichzeitig mit dem von der TTS-Maschine erzeugten gesprochenen Wort erzeugt werden. Um eine hörbare Hervorhebung zu erzeugen, könnte das Tapplet-Programm wie folgt geschrieben werden:
    Playwave X.wave;
    Play TTS "5", Z.wave;
    Playwave Y.wave;
  • Um hörbar die Nummer "5" hervorzuheben, würde die Klang-Task-Schnittstelle 134 ein Kommando "InitiateSpeech" der TTS-Maschine 138 und ein Kommando "InitiateWave" der Klang-Maschine 136 zur Verfügung stellen, um dem Text "5" bzw. die Z.wave zu erzeugen. Die Klang-Task 134 stellt eine Pufferanforderung den Maschinen zur Verfügung, um Datenpuffer von den Maschinen zu empfangen. Die Klang-Task 134 mischt abwechselnd die Puffer, so daß die WAPI 106 gemischte Datenpuffer von der Klang-Maschine 136 empfängt. Die Klang-Task 134 mischt die Puffer, indem sie eine erste Einheit von dem Puffer der Klang-Maschine 136 zu einer ersten Einheit der TTS-Maschine 138, eine zweite Einheit der TTS-Maschine 138 zu der zweiten Einheit der Klang-Maschine 136 und so weiter hinzufügt. Die Klang-Task mischt die Puffer, so daß der Hintergrundklang gleichzeitig mit dem gesprochenen Wort erzeugt wird.
  • Im folgenden wird auf 3 bezug genommen. Das System weist außerdem eine RecTask-Schnittstelle 142 auf, welche aufgezeichnete Puffer von der Klang-API 106 empfängt und in eine Klang-Datei 144 schreibt.
  • Ein Tapplet kann eine Vielzahl unterschiedlicher Audiodialoge enthalten. Wie in 7 gezeigt ist, enthält jeder Dialog typischerweise eine Anzahl von Audiosteuerungen. Die Audiosteuerungen stellen dem Benutzer eine Kombination von Eingabe-, Ausgabe- und/oder Steuerfunktionen zur Verfügung. Beispielsweise kann ein Audiodialog eine Kommunikation mit einem Dateimanager darstellen. Nachdem der Benutzer den Dateimanager-Dialog ausgewählt hat, kann eine erste Audio-Steuer-Nachricht lauten "Um die Directory A durchzusehen, drücken Sie 1; um die Directory B durchzusehen, drücken Sie 2; ...". Der Benutzer kann die 2 auswählen (Directory B), und die nächste Audio-Steuer-Nachricht kann lauten: "Zum Durchsehen der Datei X drücken Sie 1, zum Durchsehen der Datei Y drücken Sie 2, ...".
  • Wie in 3 zu sehen ist, weist das System eine Audio-Steuer-Bibliothek (ACL – audio control library) 146 auf. Die ACL 146 stellt dem Programmierer der Telefonzugriffsanwendungen eine Anzahl von Audio-Steuer-Abstraktionen zur Verfügung. Tabelle II zeigt eine Anzahl unterschiedlicher Audio-Steuerungen, die von dem System zur Verfügung gestellt werden.
  • Tabelle II
    Figure 00240001
  • 8 zeigt ein Beispiel eines Dialogs mit unterschiedlichen Audio-Steuerungen. Die erste Steuerung kann den Audiodialog identifizieren. Die zweite Audio-Steuerung fordert eine alphanumerische Zeichenkette an. Beispielsweise kann die Audio-Nachricht lauten: "Bitte geben Sie Ihren Dateinamen nach dem Ton ein". Die dritte Audio-Steuerung fordert zur Eingabe einer Ziffern-Zeichenkette auf. Die letzte Audio-Steuernachricht fordert zur Abgabe einer Sprachnachricht auf.
  • 9 zeigt ein bevorzugtes erfindungsgemäßes Telefon-Tastenfeld. Den Nummern 1–4 sind dynamische Funktionen zugeordnet, während den Nummern 0, 5–9 und der *- und der #-Taste statische Funktionen zugewiesen sind. Die Tasten 1–4 können eine beliebige Art von Funktionen entsprechend den Kommandos der Audio-Steuerungen zur Verfügung stellen. Beispielsweise kann bei einem Dateimanager-Audiodialog die Taste 1 in einer Audio-Steuerung eine Datei faxen und in einer nachfolgenden Audio-Steuerung eine Datei "sichern". In gleicher Weise kann die Nummer 2 in der ersten Audio-Steuerung eine Datei löschen und in einer nachfolgenden Audio-Steuerung die Datei faxen.
  • Die statischen Tasten 0, 5–9, * und # haben bei sämtlichen Dialogen und sämtlichen Audio-Steuerungen die gleichen Funktionen. Im bevorzugten Ausführungsbeispiel hat die Nummer 5 eine "Rückkehr"-Funktion, welche den Benutzer in den vorangegangenen Audiodialog führt. Die Nummer 6 ist einer Sprung-Funktion zugeordnet. Wenn die Nummer 6 ausgewählt wird, wird dem Benutzer ein Sprachmenü geliefert, das vier unterschiedliche Optionen hat. Option 1 gestattet dem Benutzer, eine vorgegebene Anzahl von Punkten innerhalb des Audiodialogs vorwärts zu springen. Option 2 gestattet dem Benutzer, eine vorgegebene Anzahl von Punkten zurückzuspringen. Weder Option 1 noch Option 2 gestatten es dem Benutzer, aus dem Audiodialog herauszuspringen. Option 3 gestattet einen Sprung des Benutzer an den Beginn des Tapplets. Option 4 bewirkt einen Sprung des Benutzers zu dem TAM, so daß der Benutzer ein anderes Tapplet auswählen kann. Die Sprungfunktion gestattet es dem Benutzer, sich schnell zu der interessierenden Audio-Steuerung zu bewegen oder schnell die Audio-Steuerung zu verlassen.
  • Die Nummer 7 auf dem Handapparat ist einer "Zuvor"-Funktion gewidmet, welche dem Benutzer stets zu der vorhergehenden Audio-Steuerung bewegt. Die "Zuvor"-Funktion weist eine Umlauf-Möglichkeit auf, welche den Benutzer zu der letzten Audio-Steuerung innerhalb eines Audiodialogs führt, wenn der Benutzer sich gegenwärtig in der ersten Audio-Steuerung befindet. Der Nummer 8 ist eine "Auswahl"-Funktion zugeordnet, welche es dem Benutzer gestattet, sich zu einem anderen Audiodialog zu bewegen. Die Nummer 9 ist einer "Nächste"-Funktion gewidmet, welche es dem Benutzer gestattet, sich zu der nächsten Audio-Steuerung zu bewegen. Wie die "Zuvor"-Funktion hat auch die "Nächste"-Funktion eine Umlauf-Möglichkeit.
  • Die *-Taste ist einer "Wiederhole"-Funktion zugeordnet, welche die jüngste Audio-Nachricht des Computers wiederholt.
  • Die #-Taste gestattet es dem Benutzer, zu "pausieren" und den Audiodialog wieder aufzunehmen. Um den Dialog zu unterbrechen, wählt der Benutzer die #-Taste aus. Um den Dialog wieder aufzunehmen, drückt der Benutzer dann eine beliebige Taste. Die Nummer 0 ist einer Unterstützungsfunktion zugeordnet. Die Unterstützungsfunktion liefert drei Optionen. Option 1 stellt eine Hilfefunktion zur Verfügung, um dem Benutzer bei dem Audiodialog zu helfen. Option 2 gestattet es dem Benutzer, Parameter innerhalb des Tapplets zu stetzen. Option 3 gestattet es dem Benutzer, allgemeine Systemparameter zu setzen. Tabelle III listet die Parameter auf, die über die Unterstützungfunktion gesetzt werden können.
  • Tabelle III
    Figure 00270001
  • Die Schieberegler-Steuerungen gestatten es dem Benutzer, einen Parameter entweder zu erhöhen oder zu senken. Beispielsweise kann die Schieberegler-Audio-Steuerung lauten: "Die aktuelle Sprechgeschwindigkeit beträgt 180 Worte pro Minute; um die Geschwindigkeit um 10 Worte pro Minute zu erhöhen, drücken Sie 3; um die Geschwindigkeit um 10 Worte pro Minute zu senken, drücken Sie 1".
  • Die Kombination von statischen und dynamischen Funktionen gestattet es dem Benutzer, sich leicht durch die Audiodialoge des Systems zu bewegen. Die Zuordnung bestimmter Tasten des Ta stenfelds zu statischen Funktionen gestattet es dem Benutzer, schnell mit den statischen Funktionen vertraut zu werden. Die statischen Funktionen gestatten es einem Benutzer, der bereits den Audiodialog kennt, sich zu der interessierenden Audio-Steuerung zu bewegen, ohne sämtliche Nachrichten zu hören.
  • Alphanumerische Zeichenketten können entweder mit einem Einzel-Ton oder einem Zwei-Ton-Eintrag eingegeben werden. Bei einem Zwei-Ton-Schema sind zwei Tasteneingaben für jeden eingegebenen Buchstaben oder jede eingegebene Nummer vorgesehen. Tabelle IV listet die Kombination von Einträgen und die kodierten Nummern, Buchstaben usw. auf, die diesen Einträgen zugeordnet sind.
  • Tabelle IV
    Figure 00290001
  • Beispielsweise kann die Audio-Steuerung lauten: "Bitte geben Sie den Dateinamen ein". Um den Dateinamen DOE einzugeben, drückt der Benutzer die Taste 3 und dann entweder die Tasten 1, 4 oder 7, um den Buchstaben D einzugeben, dann die Taste 6 und dann entweder die Taste 3, 6 oder 9, um den Buchstaben O einzugeben, und so weiter.
  • Bei einem Einzel-Ton-Schema betätigt der Benutzer die dem Buchstaben zugeordnete Taste. Wie in 1 gezeigt ist, sind jeder Taste eines Telefonhandapparates 14 Buchstaben zugeordnet. Die Nummer 2 ist den Buchstaben A, B und C zugeordnet. Die Nummer 3 ist den Buchstaben D, E und F zugeordnet usw. Wenn der Benutzer eine alphanumerische Zeichenkette eingegeben hat, präsentiert der Computer hörbar dem Benutzer die wahrscheinlichsten Worte. Wenn beispielsweise der Benutzer die Tasten 3–6–3 drückt, liefert der Computer dem Benutzer die Optionen DOE oder FOE. Der Benutzer kann dann durch Überspringen und Durchsehen durch die Optionen gehen und die gewünschte alphanumerische Zeichenkette auswählen. Der Benutzer kann im Rückwärtsschritt ein alphanumerisches Zeichen durch Eingabe von *1, *4 oder *7 und den gesamten aktuellen Inhalt durch Drücken von *0 löschen.
  • Das System weist Audiodialoge zum Aufzeichnen und Wiedergeben von Audio-Nachrichten auf. Der Schallaufzeichnungsdialog gestattet das Aufzeichnen von Audio-Nachrichten des Benutzers. Die Aufzeichnung beginnt, wenn der Benutzer die Auswahl-Taste drückt. Die Nachricht kann durch Drücken der Tasten *0 gelöscht werden. Der Klang-Leser steuert vorhandene Optionen, die es dem Benutzer gestatten, die Audio-Nachricht durchzusehen und außerdem die Nachrichten schnell vorwärts und rückwärts zu spulen.
  • Elektronisch gespeicherter Text, wie beispielsweise ein Dokument oder eine Nachricht der elektronischen Post, kann von dem System innerhalb einer Hierarchie durch die schematisch in 10 gezeigten Moden strukturiert werden. Das System weist einen Extraktor 200 auf, welcher Text aus einem Dokument extrahiert. Der Formatierer 202 erschafft eine Hierarchie des Textes und stellt Kennetiketten für jedes unterschiedliche Objekt innerhalb der Hierarchie zur Verfügung. 11 stellt ein Beispiel einer für ein Buch erstellten Hierarchie dar. Der Formatierer 202 kennzeichnet jedes Kapitel, jeden Abschnitt, jeden Absatz, jeden Satz und jedes Wort des Textes.
  • Der in 10 gezeigte Umriß-Blätterer (outline browser) 204 gestattet es dem Benutzer, sich in der Hierarchie des Buches zu bewegen. Für jedes Objekt stellt der Blätterer eine Zusammenfassung zur Verfügung. Jedesmal dann, wenn der Benutzer zu einem neuen Kapitel gelangt, gibt das System die Kapitelnummer und den Titel aus. Jeder neue Abschnitt liefert eine Abschnittsnummer und einen Titel. Wenn sich der Benutzer zu einem bestimmten Absatz bewegt, liefert das System den ersten Satz des Absatzes, so daß der Benutzer feststellen kann, ob er den Inhalt des Absatzes durchsehen will. Das System liefert das erste Worte jedes neuen Satzes als Satzzusammenfassung.
  • Das System erschafft die Hierarchie, indem es jeden Buchstaben in dem Text lokalisiert. Wenn es ein Leerzeichen nach dem Buchstaben feststellt, so wird die Kombination der vorangehenden Buchstaben als Wort aufgelistet. Wenn es einen Satzpunkt, ein Fragezeichen oder ein Ausrufezeichen nach dem Wort feststellt, so wird die Kombination der vorangehenden Worte als Satz aufgelistet. Wenn es ein Absatzsymbol findet, wird die vorhergehende Kombination von Sätzen als Absatz aufgelistet. Abschnitte und Kapitel werden in der gleichen Weise aufgelistet.
  • Der Benutzer kann sich durch den Umriß-Blätterer 204 bewegen, um einen bestimmten Abschnitt des Textes zu erreichen. Der Benutzer kann sich zu dem vorgehenden Objekten des gleichen Typs (zum Beispiel von Kapitel 2 zu Kapitel 1) bewegen, indem er die Zuvor-Taste (7) drückt, oder zum nächsten Objekt des gleichen Typs, indem er die Nächste-Taste (9) drückt. Der Benutzer kann zu einem übergeordneten Objekt gehen (zum Beispiel vom Absatz zum Kapitel), indem er die Rückkehr-Taste (5) drückt, oder zu einem untergeordneten Objekt (zum Beispiel vom Absatz zum Satz), indem er die Auswahl-Taste (8) drückt. Das System gestattet dem Benutzer, sich durch ein Dokument zu bewegen und den Text des Dokuments zu hören.
  • Der Text-Leser 206 liest den Text des aktuellen Objekts. Wenn der Benutzer beispielsweise sich innerhalb des Kapitels 1 befindet, liest der Text-Leser 206 den gesamten Inhalt des Ka pitels 1. Der Umriß-Leser 208 liefert einen Gesamtumriß des Dokuments, indem er die Objekte in einer Tiefe erster Ordnung zusammenfaßt. Der Buchstabierer 210 buchstabiert jedes Wort Buchstabe für Buchstabe, zunächst unter Verwendung des normalen Alphabets (zum Beispiel "A", "Be", "Ce" usw.) und dann mit Hilfe eine Militäralphabets (zum Beispiel "Alpha", "Bravo", "Charly" usw.). Der Benutzer hört dann eine Definition des Worts von einem On-line-Wörterbuch. Eine typische Audio-Nachricht innerhalb des Textdialogs kann lauten: "Um den Text zu hören, drücken Sie 1; um den Umriß zu lesen, drücken Sie 2; um die Worte buchstabieren zu lassen, drücken Sie 3; um den Text zu blättern, drükken Sie 4". Der Benutzer kann dann eine dieser Optionen oder eine der statischen Tasten 0, 5–9, * oder # drücken. Tabelle V liefert eine Auflistung der Tasten-Kommandos der unterschiedlichen Funktionsblöcke des Text-Audiodialogs.
  • Tabelle V
    Figure 00330001
  • Das System weist außerdem einen Audiodialog auf, der es dem Benutzer gestattet, eine Datenbank, wie beispielsweise eine Kalkulationstabelle (spreadsheet), zu lesen. Der Datenbank-Audiodialog gestattet es dem Benutzer, sich in der Datenbank spaltenweise zu bewegen. Der Benutzer kann sich von Spalte zu Spalte bewegen, indem er die "Nächste" und "Zuvor"-Taste drückt. Der Benutzer kann die Werte hören, indem er eine "Auswahl"-Taste drückt. Der Benutzer kann sich außerdem durch eine Kalender-Datenbank bewegen, welche in einer Hierarchie angeordnet ist, die Objekte, wie beispielsweise das Jahr, den Monat, den Tag, die Stunde und die Minute, enthält. Der Benutzer kann sich durch die Kalender-Datenbank mit Hilfe der Auswahl- und statischen Tasten bewegen, um ein bestimmtes Datum und eine bestimmte Zeit zu erreichen. Das System kann eine Audio-Nachricht zur Verfügung stellen, welche den Inhalt des Kalenders zu dem Datum und den Zeitpunkt wiedergibt ("Sie haben eine Verabredung mit Mr. Doe"). Das System kann dem Kalenderprogramm gestatten, eine dritte Partei anzurufen, um diese Partei daran zu erinnern, daß ein Treffen zu einem bestimmten Datum stattfinden soll, oder die Partei über eine Änderung des Treffens zu informieren. Das System kann darüberhinaus dem Benutzer gestatten, das Treffen durch Wechselwirkung mit dem Kalenderprogramm über den Telefonhandapparat zu organisieren.
  • Die Erfindung stellt somit ein System zur Verfügung, welches einem Benutzer gestattet, über einen Telefonhandapparat auf einen Computer zuzugreifen und mit diesem zu kommunizieren. Die Einbindung einer Vielzahl von Audiodialogen, statischen Tastenfeld-Funktionen und eines lückenlosen Klangerzeugungsmechanismus' schafft ein System, das einen umfassenden Anwendungsbereich hat, leicht zu benutzen ist und eine realistische Sprachqualität zur Verfügung stellt. Das System gestattet darüberhinaus einem Programmierer, Tapplets einsatzbereit zu konstruieren, welche in dem System verwendet werden können. Beispielsweise gestattet das System einem Programmierer, auf einfache Weise ein Tapplet zu schreiben, das auf einen Personalinformations-Manager zugreifen kann, wie er beispielsweise von Polaris unter der Handelsbezeichnung PACKRAT vermarktet wird. Die Anwendung PACKRAT unterstützt einen dynamischen Austauschmechanismus, der von anderen Anwendungen benutzt werden kann, um in PACKRAT gespeicherte Daten heranzuholen. Mit Hilfe dieses Mechanismus kann ein Tapplet Daten über ein Mehrzahl von Audiodialogen gewinnen und präsentieren. Das System gestattet es einem Benutzer, über einen Telefonhandapparat mit einem Programm, wie beispielsweise PACKRAT, in Verbindung zu treten.

Claims (11)

  1. Vorrichtung zum Fern-Zugreifen auf einen Computer (12) ausgehend von einem Telefonhandapparat (14), der eine Eingabeeinrichtung (18) und eine Ausgabeeinrichtung (15) aufweist, umfassend: einen Computer (12), der Daten speichert, die elektronische Post (e-mail), einen Dateimanager, eine Sprachnachricht, eine Datenbank und ein Telefax repräsentieren; eine Schnittstellenschaltung, die der Telefonhandapparateingabeeinrichtung den Zugriff auf einen einer Mehrzahl von Audio-Dialogen über eine einzige Telefonziffer ermöglicht, wobei über die Audio-Dialoge auf die elektronische Post, den Dateimanager, die Sprachnachricht, die Datenbank und das Telefax zugegriffen werden kann; eine Text-zu-Sprache-Maschine (138), die Audio-Nachricht-Daten erzeugen kann, die einem Text in einer Dokument-Datei entsprechen; eine Sprachschaltungsanordnung (106, 134) zum Erzeugen von Audio-Nachrichten, die aus dem Computer zu der Ausgabeeinrichtung (15) des Telefonhandapparates (14) übermittelt werden sollen, wobei die Sprachschaltungsanordnung eine Klang-Task-Schnittstelle (134) aufweist, welche eine vorab aufgezeichnete Klang-Nachricht-Datei, die von einer Klang-Maschine (186) zur Verfügung gestellt wird, mit den von der Text-zu-Sprache-Maschine (138) zur Verfügung gestellten Audio-Nachricht-Daten derart kombiniert, daß eine Lücke zwischen der vorab aufgezeichneten Klang-Nachricht und der Audio-Nachricht vermieden wird; und eine Eingabeschaltung, die wahlweise Nachrichten aus der elektronischen Post wiedergewinnt, Nachrichten aus der Sprachnachricht wiedergewinnt, Daten aus der Datenbank wiedergewinnt oder Dateien mit Hilfe des Dateimanagers durchsieht, sichert und löscht, indem einer der Mehrzahl von Audio- Dialogen ausgewählt wird und Antworten auf Abfragen aus dem ausgewählten Audio-Dialog über die Telefonhandapparateingabeeinrichtung zur Verfügung gestellt werden.
  2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß jeder Audio-Dialog eine Mehrzahl von Audio-Steuerfunktionen enthält.
  3. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß eine Anrufbeantwortereinrichtung vorgesehen ist, welche Sprachnachrichten speichern kann, die über den Telefonhandapparat bereitgestellt worden sind.
  4. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Text-Zu-Sprache-Maschine eine hörbare Anzeige eines hervorgehobenen Textes innerhalb eines Dokuments zur Verfügung stellen kann.
  5. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Text-Zu-Sprache-Maschine ferner einen Formatierer zum Formatieren eines Dokuments in eine Mehrzahl von Objekten umfaßt.
  6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, daß die Objekte Seiten, Absätze, Sätze und Worte umfassen.
  7. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, daß die Text-Zu-Sprache-Maschine Audio-Nachrichten erzeugt, die ein aktuelles Objekt identifizieren, und sich in Beantwortung einer Eingabe aus dem Telefonhandapparat zu einem weiteren Objekt bewegt.
  8. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, daß die Text-Zu-Sprache-Maschine Audio-Nachrichten erzeugt, die einen Umriß des Objekts identifizieren und zur Verfügung stellen.
  9. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Text-Zu-Sprache-Maschine einen Buchstabierer umfaßt, welcher ein Wort des Textes buchstabieren kann.
  10. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Eingabeschaltung eine statische Funktion aufweist, die einer zugehörigen Taste an dem Telefonhandapparat zugeordnet ist.
  11. Vorrichtung nach Anspruch 10, dadurch gekennzeichnet, daß die statische Funktion die Auswahl eines bestimmten Audio-Dialogs und das Zurückbewegen zu einem zuvor ausgewählten Audio-Dialog umfaßt.
DE4436175A 1993-10-12 1994-10-10 Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat Expired - Lifetime DE4436175B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13501893A 1993-10-12 1993-10-12
US135018 1993-10-12

Publications (2)

Publication Number Publication Date
DE4436175A1 DE4436175A1 (de) 1995-04-13
DE4436175B4 true DE4436175B4 (de) 2005-02-24

Family

ID=22466130

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4436175A Expired - Lifetime DE4436175B4 (de) 1993-10-12 1994-10-10 Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat

Country Status (2)

Country Link
US (1) US5825854A (de)
DE (1) DE4436175B4 (de)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953392A (en) 1996-03-01 1999-09-14 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
US6996609B2 (en) * 1996-05-01 2006-02-07 G&H Nevada Tek Method and apparatus for accessing a wide area network
TW406508B (en) * 1996-06-07 2000-09-21 Murata Machinery Ltd Communication method and customer premise equipment (CPE)
WO1997049251A1 (en) * 1996-06-18 1997-12-24 Compuserve Incorporated Integrated voice, facsimile and electronic mail messaging system
EP0906683A4 (de) * 1996-06-27 2002-05-08 Mci Communications Corp Schnurloses und intelligentes telefon
KR100280045B1 (ko) * 1997-05-02 2001-02-01 윤종용 외부전화를이용한메일독출방법및그장치
US6023700A (en) * 1997-06-17 2000-02-08 Cranberry Properties, Llc Electronic mail distribution system for integrated electronic communication
CA2242065C (en) * 1997-07-03 2004-12-14 Henry C.A. Hyde-Thomson Unified messaging system with automatic language identification for text-to-speech conversion
KR19990015748A (ko) * 1997-08-09 1999-03-05 구자홍 전자우편
US6212551B1 (en) * 1997-09-15 2001-04-03 Advanced Micro Devices, Inc. Digitized audio data attachment to text message for electronic mail
US6396907B1 (en) 1997-10-06 2002-05-28 Avaya Technology Corp. Unified messaging system and method providing cached message streams
US6115814A (en) * 1997-11-14 2000-09-05 Compaq Computer Corporation Memory paging scheme for 8051 class microcontrollers
US6104788A (en) * 1997-12-04 2000-08-15 Siemens Information And Communication Networks, Inc. Apparatus and method for using a telephone for remote scheduling
DE19754556A1 (de) * 1997-12-10 1999-06-17 Mercovend Muenzpfand Automaten Einkaufs- oder Gepäckwagen/Pfandschloß
US6122348A (en) * 1997-12-22 2000-09-19 Nortel Networks Corporation System and method for managing incoming communication events using multiple media options
SE517709C2 (sv) * 1997-12-29 2002-07-09 Ericsson Telefon Ab L M Ett personligt informationshanteringssystem
US6269248B1 (en) * 1998-02-03 2001-07-31 Nortel Networks Limited Method and apparatus for programming a cellular line access unit utilizing an extension telephone
JP3848455B2 (ja) * 1998-02-16 2006-11-22 富士通株式会社 情報読み上げシステム及び当該システムに用いる情報端末並びに記録媒体
FR2775403B1 (fr) * 1998-02-23 2000-06-23 Schlumberger Ind Sa Systeme de consultation d'un serveur de courrier electronique
JP3843178B2 (ja) * 1998-03-03 2006-11-08 富士通株式会社 電子メール管理機能付電話機、電子メール管理方法および電子メール管理プログラムを記録した記憶媒体
JP4282037B2 (ja) * 1998-04-13 2009-06-17 キヤノン株式会社 リモートで指示された転送設定を自動的に設定可能な通信装置およびその制御方法
GB2336503B (en) * 1998-04-17 2003-07-23 Mitel Corp System for item selection in a telephony auto-attendant
US6292799B1 (en) * 1998-06-05 2001-09-18 Netnumber.Com, Inc. Method and apparatus to automatically address a voice mail reply to a voice mail message
US7522931B2 (en) * 1998-06-05 2009-04-21 Netnumber, Inc. Method and apparatus for accessing a network computer to establish a push-to-talk session
US6539077B1 (en) 1998-06-05 2003-03-25 Netnumber.Com, Inc. Method and apparatus for correlating a unique identifier, such as a PSTN telephone number, to an internet address to enable communications over the internet
US6483899B2 (en) * 1998-06-19 2002-11-19 At&T Corp Voice messaging system
US7277424B1 (en) 1998-07-21 2007-10-02 Dowling Eric M Method and apparatus for co-socket telephony
US6246983B1 (en) * 1998-08-05 2001-06-12 Matsushita Electric Corporation Of America Text-to-speech e-mail reader with multi-modal reply processor
FR2783993B1 (fr) * 1998-09-24 2000-12-22 Kortex Internat Systeme et procede de communication entre serveur et telephone vocal
AU6499799A (en) * 1998-09-24 2000-04-10 Crossmedia Networks Corporation Interactive voice dialog application platform and methods for using the same
US6718015B1 (en) * 1998-12-16 2004-04-06 International Business Machines Corporation Remote web page reader
US6640242B1 (en) 1999-01-29 2003-10-28 Microsoft Corporation Voice access through a data-centric network to an integrated message storage and retrieval system
US6263064B1 (en) 1999-01-29 2001-07-17 International Thinklink Corporation Centralized communication control center for visually and audibly updating communication options associated with communication services of a unified messaging system and methods therefor
JP2000259385A (ja) * 1999-03-09 2000-09-22 Canon Inc 画像読み取り装置、方法、画像形成装置、方法、画像通信システム、方法及びコンピュータ読み取り可能な記憶媒体
US6600814B1 (en) * 1999-09-27 2003-07-29 Unisys Corporation Method, apparatus, and computer program product for reducing the load on a text-to-speech converter in a messaging system capable of text-to-speech conversion of e-mail documents
KR20020064889A (ko) * 1999-10-26 2002-08-10 핑텔 코오포레이션 프로그래머블 기능을 가지는 1 이상의 텔레포니 통신장치를 포함하는 분산형 통신 네트워크
US6711714B1 (en) * 2000-02-02 2004-03-23 Siemens Corporate Research, Inc. Linearization of framesets for audibly rendering frames
WO2001075555A2 (en) * 2000-03-06 2001-10-11 Conita Technologies, Inc. Personal virtual assistant
US6784899B1 (en) 2000-03-31 2004-08-31 Ricoh Company, Ltd. Systems and methods for providing rich multimedia messages to remote users using telephones and facsimile machines
DE10035523A1 (de) * 2000-07-21 2002-01-31 Deutsche Telekom Ag Virtuelles Testbett
US20020019851A1 (en) * 2000-07-26 2002-02-14 Jordan Pollack System and method for the electronic mail based management and manipulation of stored files
GB2366488A (en) * 2000-08-25 2002-03-06 Nokia Mobile Phones Ltd Telecommunication terminal
US6529586B1 (en) 2000-08-31 2003-03-04 Oracle Cable, Inc. System and method for gathering, personalized rendering, and secure telephonic transmission of audio data
US8140627B2 (en) * 2000-11-15 2012-03-20 Pacific Datavision, Inc. Systems and methods for push-to-email communication with location information
US7054863B2 (en) * 2000-11-15 2006-05-30 Pacific Datavision, Inc. System and method for originating, storing, processing and delivering message data
US8577843B1 (en) 2000-11-15 2013-11-05 Pacific Datavision, Inc. System and methods for using a plurality of receiver identifications to create and retrieve a digital project log
US7743073B2 (en) * 2000-11-15 2010-06-22 Pacific Datavision, Inc. Systems and methods for push-to-talk wireless applications
US7653691B2 (en) * 2000-11-15 2010-01-26 Pacific Datavision Inc. Systems and methods for communicating using voice messages
US6775358B1 (en) 2001-05-17 2004-08-10 Oracle Cable, Inc. Method and system for enhanced interactive playback of audio content to telephone callers
US20040205451A1 (en) * 2001-08-13 2004-10-14 International Business Machines Corporation Method and system for identifying and distinguishing words contained within an electronic message in order to convey significance
DE10163277C2 (de) * 2001-12-21 2003-11-20 Speech Design Carrier Systems Verfahren zum Versenden einer Nachricht an eine Rufnummer, sowie Vorrichtung hierfür
EP1327973B1 (de) * 2002-01-11 2006-06-21 Alcatel Verfahren und Vorrichtung zur Erzeugung von Sprachansagen
US20040034690A1 (en) * 2002-06-18 2004-02-19 Schmitz Kennen R. System and method for selectively forwarding text messages to users by voice telephone
AU2002365108A1 (en) * 2002-11-29 2004-06-23 Vladimir Bykovnikov Mobile communication device with wireless handset
US7379872B2 (en) * 2003-01-17 2008-05-27 International Business Machines Corporation Method, apparatus, and program for certifying a voice profile when transmitting text messages for synthesized speech
DE10338512A1 (de) * 2003-08-22 2005-03-17 Daimlerchrysler Ag Unterstützungsverfahren für Sprachdialoge zur Bedienung von Kraftfahrzeugfunktionen
US7764771B2 (en) * 2003-12-24 2010-07-27 Kimberly-Clark Worldwide, Inc. Method of recording invention disclosures
US7281148B2 (en) * 2004-03-26 2007-10-09 Intel Corporation Power managed busses and arbitration
US7606960B2 (en) * 2004-03-26 2009-10-20 Intel Corporation Apparatus for adjusting a clock frequency of a variable speed bus
CN1989733A (zh) * 2004-05-21 2007-06-27 电缆优势软件有限公司 远程访问系统和方法以及其智能代理
US8488758B1 (en) * 2008-03-26 2013-07-16 Bryan Rone Method and system for documenting interactions with professional service providers
US10468014B1 (en) 2019-02-06 2019-11-05 Capital One Services, Llc Updating a speech generation setting based on user speech

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0214347A1 (de) * 1985-09-02 1987-03-18 Stuart F. Eckmann Interaktives mit Lautenreagierendes Lernsystem, zugänglich mittels eines tonerzeugenden Telephons
US4716583A (en) * 1983-11-16 1987-12-29 Speech Plus, Inc. Verbal computer terminal system
US5136634A (en) * 1989-03-10 1992-08-04 Spectrafax Corp. Voice operated facsimile machine network
US5179585A (en) * 1991-01-16 1993-01-12 Octel Communications Corporation Integrated voice messaging/voice response system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6126983Y2 (de) * 1979-05-31 1986-08-12
EP0085209B1 (de) * 1982-01-29 1986-07-30 International Business Machines Corporation Terminal mit Sprachausgabe zur Anwendung in Datenverarbeitungsanlagen
US4785408A (en) * 1985-03-11 1988-11-15 AT&T Information Systems Inc. American Telephone and Telegraph Company Method and apparatus for generating computer-controlled interactive voice services
US4674115A (en) * 1985-09-20 1987-06-16 Jabil Circuit Company Programmable telephone switcher
US4837798A (en) * 1986-06-02 1989-06-06 American Telephone And Telegraph Company Communication system having unified messaging
US5031206A (en) * 1987-11-30 1991-07-09 Fon-Ex, Inc. Method and apparatus for identifying words entered on DTMF pushbuttons
US4996707A (en) * 1989-02-09 1991-02-26 Berkeley Speech Technologies, Inc. Text-to-speech converter of a facsimile graphic image
US4899369A (en) * 1989-05-05 1990-02-06 Nynex Radio-analogue method of audio presentation and control for audiotex services
US4974254A (en) * 1989-05-10 1990-11-27 Perine Michael C Interactive data retrieval system for producing facsimile reports
JP2880546B2 (ja) * 1990-01-16 1999-04-12 キヤノン株式会社 ファクシミリ装置と前記装置における通信制御方法
US5187735A (en) * 1990-05-01 1993-02-16 Tele Guia Talking Yellow Pages, Inc. Integrated voice-mail based voice and information processing system
EP0542900A4 (en) * 1990-08-06 1994-07-27 Motorola Inc Portable office cordless telephone
US5309509A (en) * 1992-07-27 1994-05-03 At&T Bell Laboratories Graphical user interface workstation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4716583A (en) * 1983-11-16 1987-12-29 Speech Plus, Inc. Verbal computer terminal system
EP0214347A1 (de) * 1985-09-02 1987-03-18 Stuart F. Eckmann Interaktives mit Lautenreagierendes Lernsystem, zugänglich mittels eines tonerzeugenden Telephons
US5136634A (en) * 1989-03-10 1992-08-04 Spectrafax Corp. Voice operated facsimile machine network
US5179585A (en) * 1991-01-16 1993-01-12 Octel Communications Corporation Integrated voice messaging/voice response system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MULLER, M.J., DANIEL, J.E.: Toward a Definition of Voice Documents, In: Proceedings of COIS, 1990, S. 174-183
MULLER, M.J., DANIEL, J.E.: Toward a Definition ofVoice Documents, In: Proceedings of COIS, 1990, S. 174-183 *

Also Published As

Publication number Publication date
DE4436175A1 (de) 1995-04-13
US5825854A (en) 1998-10-20

Similar Documents

Publication Publication Date Title
DE4436175B4 (de) Vorrichtung zum Fernzugreifen auf einen Computer ausgehend von einem Telefonhandapparat
US5970141A (en) Down-line transcription system for manipulating real-time testimony
DE60001765T2 (de) Verfahren und Gerät zur Zusammensetzung und Präsentation von strukturierten Sprachpostnachrichten
DE60217241T2 (de) Fokussierte Sprachmodelle zur Verbesserung der Spracheingabe von strukturierten Dokumenten
DE69835718T2 (de) Verfahren und Gerät zur Sprachinteraktion über ein Netzwerk unter Verwendung von parametrierbaren Interaktionsdefinitionen
DE60314877T2 (de) Verfahren und vorrichtung zur bereitstellung elektronischer post an ein mobiles gerät
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
DE69333681T2 (de) Techniken zur Erzeugung von Personalcomputeranzeigen und gedruckten Transkripten aus Sprachpostnachrichten
US7908145B2 (en) Down-line transcription system using automatic tracking and revenue collection
DE10125406A1 (de) Verfahren und Einrichtung zum Koppeln eines Visual Browsers mit einem Voice Browser
DE3843662A1 (de) Vorrichtung und verfahren zum speichern und weitergeben von tonsignalen
US20070250315A1 (en) Downline Transcription System Using Automatic Tracking And Revenue Collection
DE69532883T2 (de) Mehrsprachige betriebs- und wartungsschnittstelle für eine fernmeldevermittlung
DE3844132A1 (de) Verfahren und vorrichtung zur speicherung und zum transport von sprachsignalen und zur erzeugung von antworten
DE3910467A1 (de) Verfahren und vorrichtung zur erzeugung von berichten
DE19842688A1 (de) Standard-Benutzerschnittstellen-Steuerung für einen Datenanbieter
DE3339794A1 (de) Sprachdatenaufbereitungssystem
Gould et al. Speech filing—An office system for principals
EP0986227A2 (de) Verfahren zum Übertragen von an die Leistungsfähigkeit einer Endeinrichtung angepassten Informationen über ein Kommunikationsnetz
DE69933614T2 (de) System zur verteilung, übertragung und zum empfang von nachrichten sowie verfahren zur verteilung von nachrichten
DE60119101T2 (de) System für telephonischen gruss während der nichtverfügbarkeit eines teilnehmers
DE69232964T2 (de) Informationsansageeinrichtung
DE3726366A1 (de) Nachrichtennetzwerk und nachrichtenuebertragungsverfahren
DE10130510A1 (de) Einrichtung und Verfahren zum Erzeugen einer Audioaufzeichnung mit angekoppelten Daten
DE10118125A1 (de) Automatisches Auskunftssystem

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: DIALOGIC CORP.,, MONTREAL, QUEBEC, CA

8328 Change in the person/name/address of the agent

Representative=s name: BETTE - BRINK, 55116 MAINZ

R071 Expiry of right
R071 Expiry of right