CN1252592A - 会话自然语言的命令边界鉴别器 - Google Patents
会话自然语言的命令边界鉴别器 Download PDFInfo
- Publication number
- CN1252592A CN1252592A CN99121518.4A CN99121518A CN1252592A CN 1252592 A CN1252592 A CN 1252592A CN 99121518 A CN99121518 A CN 99121518A CN 1252592 A CN1252592 A CN 1252592A
- Authority
- CN
- China
- Prior art keywords
- identification text
- order
- language
- equipment
- boundary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本发明的在会话自然语言系统中自动鉴别命令边界的设备包括:变换输入信号为识别文本的语音识别器和与该语音识别器连接、接收该识别文本和确定在该识别文本中是否存在命令的边界鉴别器,该边界鉴别器在识别文本中存在命令时输出该命令。还公开了在会话自然语言系统中鉴别命令边界的方法。
Description
本发明涉及语音识别,尤其涉及鉴别自然会话语言的命令边界的设备和方法。
自然语言用户接口系统包括允许说话人通过说出命令向其输入命令的系统。但是,已有的会话自然语言用户接口系统要求用户利用某种形式的手动输入、例如在命令之间停顿或用鼠标点击显示器上的麦克风控制按钮来指明命令的结束、即命令的边界。这种要求造成用户接口使用起来相当不方便,并且会产生不希望有的延迟。
因此,需要能够自动鉴别会话自然语言用户接口中的命令边界的可训练系统。
根据本发明,自动鉴别会话自然语言系统中的命令边界的设备包括把输入信号变换为识别文本的语音识别器和与该语音识别器连接的边界鉴别器,该边界鉴别器接收识别文本,确定在该识别文本中是否存在命令,如果存在命令,就输出该命令。
在另一实施例中,边界鉴别器可向执行命令的应用程序输出。边界鉴别器可包括对识别文本进行处理的输入处理器。该输入处理器可以通过给识别文本中的每一个字添加该字关于假设的命令边界的相对位置来对该识别文本进行处理。边界鉴别器可进一步包括与该输入处理器连接的特征检测器,该特征检测器确定在已处理的识别文本中存在一组特征函数中的哪些特征函数。边界鉴别器可进一步包括根据对应于已处理的识别文本中的那些特征函数的一组特征权重判断在已处理的识别文本中是否存在命令的判定装置。该判定装置可以与特征检测器连接,可确定已处理的识别文本是否包含命令边界。
在再一实施例中,还可包括把设备训练成为能够识别文本和能够识别完整命令的训练系统。该训练系统可包括对由包含完整命令和非完整命令的话语组成的一组数据进行处理的输入处理器。该输入处理器可在训练数据中在每一话语前插入标记。该输入处理器可在识别文本中在第一个话语前、和在识别文本中在每一个命令后插入标记。可设置特征提取器来提取包含字和这些字关于于假设的命令边界位置的相对位置的特征函数。语音识别器可包括已利用训练数据进行了训练的语言模型,该训练数据包含被插入来表示训练数据中命令边界的位置的标记。语音识别器可包括标记的可加基本型。语音识别器可产生包含标记的识别文本。边界鉴别器可在识别文本中存在过长的寂静时断言存在命令边界。
机器可读的程序存储设备,真实体现可被机器执行来完成鉴别识别文本中的命令的方法步骤的指令程序,这些方法步骤包括:输入识别文本,通过给识别文本中的字添加关于假设的命令边界的相对位置来对该识别文本进行处理,根据一组特征函数确定在已处理的识别文本中的特征函数,利用所确定的特征函数判断已处理的识别文本是否包含命令,这种判断是根据特征函数的加权作出,以及如果包含命令就输出该命令。
在另一实施例中,可以包括通过输入由包含命令和非命令的话语组成的训练数据来训练程序存储设备的指令程序。可以包含在每一话语前设置标记的步骤。还可以包含在话语所包含的每一命令边界后设置标记的步骤。训练程序存储设备的指令程序可以包含从训练数据中提取特征函数的步骤。训练程序存储设备的指令程序可以包含为所有特征函数确定特征权重的步骤。处理识别文本的指令程序可以包含在识别文本中在第一个话语前和在识别文本中在每一个命令后设置标记的步骤。程序存储设备可进一步包括提供识别文本的语音识别器。
识别自然会话语言中的命令的方法包括以下步骤:输入识别文本,通过给识别文本中的字添加关于假设的命令边界的相对位置来对该识别文本进行处理,根据一组特征函数确定在已处理的识别文本中的特征函数,利用所确定的特征函数判断已处理的识别文本是否包含命令,这种判断是根据特征函数的加权作出,以及如果包含命令就输出该命令。
在另一方法中,可以包含输入包括由命令和非命令组成的话语的训练数据的步骤。还可以包含在训练数据的每一话语前设置标记的步骤。该方法可以进一步包含在话语所包含的命令边界后设置标记的步骤。该方法可以包含从训练数据中提取特征函数的步骤。该方法可进一步包含为所有特征函数确定特征权重的步骤。可以包含在识别文本中在第一个话语前和在识别文本中在每一个命令后设置标记的步骤。还可以包含把命令输出给执行该命令的设备的步骤,该设备包括提供识别文本的语音识别器。
本发明的这些以及其它目的、特点和优点在阅读了以下参看附图对其例示性实施例的详细描述之后将一目了然。
在以下参看附图的对最佳实施例的说明中详细描述本发明,其中:
图1是本发明的包括边界鉴别器的系统/方法的方框图/流程图;
图2是本发明的使用边界鉴别器产生的完整命令的应用的方框图/流程图;
图3是本发明的边界鉴别器的方框图/流程图;
图4是本发明的产生供边界鉴别器使用的特征函数和特征权重的设备的方框图/流程图;
图5是本发明的产生将供边界鉴别器使用的识别文本的语音识别器的方框图。
本发明涉及语音识别,尤其涉及鉴别自然会话语言的命令边界的设备和方法。本发明包括自动识别会话自然语言的命令字或短语的可训练系统。本发明提供了更加用户友好的接口,这种接口使用户能够更自然和连续地说话,不必手动指出命令边界。最好使用具有所有已标出的正确命令边界的最大熵识别模型。在训练期间,利用训练数据迭代选择一组特征及其权重。这些特征包括单词和短语,以及它们关于话语中的可能命令边界的相对位置。本发明的另一实施例包括用来为该识别模型产生有用标记的更有效的语言模型。
本发明提供了能够在会话自然语言用户接口中自动识别命令边界的设备。最好是,本发明可利用附加数据进行训练来改善性能,或可利用新域的数据进行训练以便可在该新域中使用该设备。本发明还可识别及分离单个话语中所包含的多个命令。本发明在识别期间使用极少的计算资源,使之可在实时系统中应用。
本发明使用来自自然语言理解和语音识别的统计技术。
最好通过利用最大熵识别模型首先给训练数据标记上命令边界。对于每一命令边界,给在窗口内的所有邻近字(包括在该边界左侧和右侧的字)加上标记,以指出它们关于边界的相对位置。然后对被进行了如此处理的训练数据执行最大熵特征提取,这些特征包括单词和短语以及它们关于边界的相对位置。利用迭代算法估算这些特征的相应权重。在译码期间,类似于标记当前串中每一个字关于命令边界的假设位置的相对位置处理测试句子。如果可能,还标记在边界的该假设位置之后出现的字。然后通过检查所出现的特征的权重的积确定是否把该假设位置认为是命令边界。
本发明还包括增强最大熵识别模型的方法。一种这样的增强包括在语音识别级使用更有效的语言模型。最好给语言模型训练数据中的命令边界加上标记,并使该模型包括边界的一组可加基本型(大多数基本型对应于各种形式的寂静)。由于这种添加,语音识别引擎将产生带有附加标记的一串文本来表明可能的命令边界。还描述了对识别模型的其它改进,例如利用延长的寂静时间的优点。
除识别命令边界外,本发明还可被用来识别同一句子中的多个命令。这就减轻了构成和支持复合命令的需要,这是由于利用相同的命令边界识别过程可自动分解多个命令的缘故。
应当懂得图1-5中所示的各部件可以用各种形式的硬件、软件或它们的组合来实现。最好在一台或多台恰当编程的、具有处理器、存储器和输入/输出接口的通用数字计算机上用软件来实现这些部件。现在参看在其中相同的标号表示相同或相似部件的各附图,首先参看图1,该图表示本发明的包括边界鉴别器的系统8的一个例子的流程图/方框图。音频输入10由系统8的用户产生,具有向系统8发出的口头命令的形式。例如,如果该系统是电子邮件应用,则用户发出的命令的一个例子可以是“检查新邮件”或“给我显示下面信息”。音频输入10被语音识别器20变换为识别文本30。语音识别器20的结构为本领域普通技术人员所了解。识别文本30是边界鉴别器40的输入,它产生完整命令50作为输出。如果识别文本30是完整命令,就把其作为输出进行传送。如果识别文本30不是完整命令,就没有输出被传送。对于该电子邮件应用,可以是一完整命令的识别文本的例子是“检查新邮件”和“给我显示下面信息”,不是完整命令的识别文本的例子是“检查新”、“给我显示”和“检查新邮件显示”。完整命令50被应用60使用。应用60最好是软件应用,完整命令50可用来打开该软件应用以及其它情况下与之有关的接口。本发明用途广泛,例如系统8可以与机械设备或电子设备对接。系统8能够把口头命令或音频信号变换为可执行信号,以便例如接通/关闭器具或调整设备/装置的特性或功能。
参看图2,该图表示使用完整命令的应用60的一个例子的方框图/流程图。应用60最好包括自然语言理解系统61和命令执行器62。自然语言系统61分析和解析完整命令50所包含的信息,产生正式命令,该正式命令被命令执行器61执行。例如,如果完整命令是“我有新信息吗?”,则自然语言理解系统可以把其变换为例如CheckNewMessage()这样的命令,并将该命令提供给命令执行器62。参看图3,该图表示边界鉴别器40一实例的方框图/流程图。边界鉴别器40把识别文本30作为输入,产生完整命令50作为输出。边界鉴别器40包括特征函数41、特征权重42、特征检测器43、输入处理器44和判定装置45。现在举例描述边界鉴别器40。在本发明的范围内可使用其它边界符号。识别文本30可用S来表示,边界鉴别器40判断S是否是一完整命令。如果S是一完整命令,就把用T表示的判定设定为T=1,否则设定为T=0。如果S是一完整命令,就把识别文本30作为边界识别器40的输出-它就是完整命令50-进行传送。因此边界鉴别器就负责了对两种T值估算条件概率P(T|S),选择使P(T|S)最小的T作为判定。
边界鉴别器40需要根据能够产生值P(T|S)的训练数据建立的模型。本发明最好通过利用最大熵原理产生值P(T|S),A.Berger等人发表在“计算语言学”(1996年3月,22卷,1期,39-71页)上的论文“自然语言处理的最大熵研究”对最大熵原理进行了描述,在此援引该论文作为参考。其它部件,例如特征检测器43、输入处理器44和判定装置45以及特征函数41和特征权重42将在下面详细进行描述。
参看图4,该图表示最大熵模型结构一实例的方框图/流程图。训练数据70包括包括大量与对应于完整命令的域相关的训练话语。根据这些话语,产生不对应于完整命令的一组话语,并同样将它们放入训练数据之中。对于这组扩大的训练数据的每一个条目,同样可确定正确的判定(T=0或T=1)。对于以上讨论的在话语“检查新邮件”后跟有“给我显示第一条消息”的电子邮件的例子,可在训练数据中作出以下条目。
检查//T=0
检查新//T=0
检查新邮件//T=1
检查新邮件显示//T=0
检查新邮件给我显示//T=0
在最后两个条目中,已加入了来自后面话语的字词,即“显示”和“给我显示”。有时需要这样的条目来解决可能产生的某些不定性。例如,象“删除”、“删除这”和“删除这一个”这样的话语都是完整的命令。在这些情况下,虽然“删除”本身可以是一完整命令,但当后面跟有“这”时就不是一完整命令了,同样,当后面跟有“这一个”时,“删除这”就不是一完整命令。因此,需要这种“向前看”步骤,向前看的字数-也称为向前看步骤的窗口尺寸-是本发明的参数之一。虽然根据应用的不同可设置其它窗口尺寸,但在本发明一实施例中,窗口尺寸是两个字。
输入处理器44处理训练数据70。对于命令边界的每一可能的位置,也称为命令边界的假设位置,如果训练集合中的一个字在假设命令边界左侧n个位置,输入处理器44就把给字添加-n,如果该字在假设命令边界右侧n个位置,输入处理器44就给该字添加+n。在输入处理器进行了处理之后,在被处理训练集合中的条目将变成:
检查-1//T=0
检查-2新-1//T=0
检查-3新-2邮件-1//T=1
检查-4新-3邮件-2显示-1//T=0
检查-5新-4邮件-3给我-2显示-1//T=0
检查-3新-2邮件-1显示+1//T=1
检查-3新-2邮件-1给我+1显示+2//T=1
检查-4新-3邮件-2给我-1显示+1//T=0
在以上例子中,加进了这些附加条目来适应上述向前看处理。
再参看图4,输入处理器44处理训练数据70,被处理的训练数据被特征提取器46用来产生特征函数41。在本发明一实施例中,可使用具有以下形式的特征函数:
其中i是特征的索引,i=1,…,n,特征的总数是n。特征函数包括被处理训练数据中的一个或多个字,还包括正确的判定。例如,考虑特征
f(新-2,邮件-1),(T=1)
如果在T=1的情况下,话语S包括分别在假设命令边界左侧第一和第二个位置处的字“新”和“邮件”,就使用这一特征。特征的总数n是本发明的一个参数,其值依赖于应用。每一个特征函数41包括带有被添加的相对位置的一个或多个字,还包括相应的判定(T=0或T=1)。从被输入处理器处理的训练数据中选择特征函数在已有技术中是公知的,可如Papineni等人在1997年在希腊Rhodes召开的EUROSPEECH大会上发表的论文“基于特征的语言理解”中所描述的那样进行选择,该论文援引于此作参考。
再参看图4,在特征提取器46产生了特征函数41之后,对于全部n个特征函数,特征权重计算器47计算特征权重42,包括特征函数ft,s i。的权重αi。在本发明一实施例中,为例计算特征权重42,使用S.Della Pietra等人在1995年发表在卡内基梅隆大学计算机科学学院“技术报告CMU-CS95-144”上的论文“随机域的引发特征(inducing features of random fields)”中所描述的改进的迭代定标算法,该算法援引于此作为参考。联合分布P(T|S)的最大熵模型由以下公式2确定,该模型见A..Ratnaparkhi于1997年5月发表在宾西法尼亚大学识别科学研究所“报告97-08”上的论文“自然语言处理的最大熵模型简介”,该论文援引于此作为参考,其中μ是规一化常数。
参看图3,对于识别文本30中的每一话语,输入处理器44给该话语中的每一字词添加关于给定的假设命令边界位置的相对位置,对于所有可能的命令边界位置重复这种添加。特征检测器43确定哪一个特征函数41在一给定的被处理话语中出现,判定装置45作该给定的被处理话语是否是一完整命令的最后判定。判定装置首先计算由公式3确定的P(T=1|S):
当且仅当
P(T=1|S)>P(T=0|S) (公式4)
才认为话语S是一完整的命令。
本发明一实施例可用来改进本发明的性能。该实施例包括使用新标记来表示话语的开始。使用例如标记“SB”表示话语的开始,则被处理训练集合中的条目如下:
SB-4检查-3新-2邮件-1//T=1
SB-5检查-4新-3邮件-2显示-1//T=0
SB-4检查-3新-2邮件-1给我+1显示+2//T=1
SB-5检查-4新-3邮件-2给我-1显示+1//T=0
这给图3和图4中的输入处理器44的处理增加了一额外步骤。在图4中,训练数据70中的每一话语可包括位于每一话语开头的SB标记。在图3中,SB标记可插在第一个话语之前,对于后续话语,SB标记最好插在每一个被认可的命令边界之后。根据本发明,还可设想其它标记及其插入的位置。
参看图5,该图表示本发明另一实施例的方框图/流程图。语音识别器20包括一语言模型21和其它部件22。在本发明一实施例中,语言模型21是一增强模型,使语音识别器20能够产生还包含了表示命令边界的可能位置的新标记、例如SE的识别文本30。利用这种增强模型,语音识别器20产生包含例如“检查新邮件SE给我显示第一条信息SE…”这样的话语的识别文本30。为此,最好利用具有插在每一完整命令末尾处的SE标记的数据来建立语言模型21。可利用以上援引作为参考的由F.Jelinek描述的步骤来建立语言模型。为了支持该新的SE标记,给语音识别器20增加该标记的声学基本型。给该模型增加对应于各种形式寂静的该标记的声学基本型。在一实施例中,以下的声学基本型用于SE标记:
D$
X
XX
XXX
X AA X
X AO M X
X AO X
X AX X
X F X
X HH X
X K X
X P X
X TD X
再参看图4,训练数据70首先输入给语音识别器20,以产生SE标记,输入处理器44产生如下的被处理数据:
SB-5检查-4新-3邮件-2 SE-1//T=1
SB-6检查-5新-4邮件-3 SE-2显示-1//T=0
SB-5检查-4新-3邮件-2 SE-1给我+1显示+2//T=1
SB-6检查-5新-4邮件-3给我-2 SE-1显示+1//T=0
本发明另一实施例利用了话语中存在的任何持续的寂静阶段。根据该实施例,图3的判定装置45可在公式4规定的条件得到满足时、或在话语之间存在持续的寂静阶段时断言命令边界。在本发明一实施例中,如果存在例如3秒或3秒以上的寂静,判定装置45就断言命令边界。在本发明另一实施例中,用户可利用由接口向系统8提供的选择功能来选择所希望的寂静长度。
此处描述的鉴别命令边界的发明还可用来鉴别同一条话语中的多个命令的存在。命令边界可设置在对应一完整命令的每一部分话语的后面,由此把输入的话语分解成多个命令。例如,如果输入句子“检查新邮件给我显示第一个邮件”,则输出可以是:
SB-5检查-4新-3邮件-2 SE-1//T=1
SB-7给我-6显示-5第一-4个-3邮件-2 SE-1//T=1
已描述了会话自然语言的命令边界鉴别器的最佳实施例(这些最佳实施例用于说明而不是用于限制),注意本领域普通技术人员根据上述描述可作出各种改进和改动。因此应认识到可对在由所附权利要求书概括的本发明的范围和精髓之内的、在此所公开的本发明的具体实施例作出各种改动。如是已详细并特别根据专利法的要求描述了本发明,要求保护的内容在权利要求书中给出。
Claims (32)
1.会话自然语言系统中自动鉴别命令边界的设备,包括:语音识别器,把输入信号变换为识别文本;和边界鉴别器,与该语音识别器连接,接收该识别文本,确定在该识别文本中是否存在命令,如果在该识别文本中存在命令,该边界鉴别器就输出该命令。
2.权利要求1的设备,其中的边界鉴别器向执行命令的应用输出。
3.权利要求1的设备,其中的边界鉴别器包括处理识别文本的输入处理器。
4.权利要求3的设备,其中的输入处理器通过给识别文本中的每一个字添加该字关于假设命令边界的相对位置来处理识别文本。
5.权利要求3的设备,其中的边界鉴别器还包括与输入处理器连接的特征检测器,该特征检测器确定一组特征函数中的哪些特征函数在被处理的识别文本中出现。
6.权利要求5的设备,其中的边界鉴别器还包括判定装置,根据对应于在被处理的识别文本中的那些特征函数的一组特征权重,确定在该被处理的识别文本中是否存在命令。
7.权利要求6的设备,其中的判定装置与特征检测器连接,确定被处理的识别文本中是否包括命令边界。
8.权利要求1的设备,还包括训练该设备识别文本和识别完整命令的训练系统。
9.权利要求8的设备,其中的训练系统包括对由一些话语组成的一组训练数据进行处理的输入处理器,这些话语包括完整命令和非完整命令。
10.权利要求9的设备,其中的输入处理器在训练数据的每一话语前插入标记。
11.权利要求9的设备,其中的输入处理器在识别文本的第一个话语前、在识别文本的每一命令后插入标记。
12.权利要求8的设备,还包括提取特征函数的特征提取器,特征函数包含一些单词和这些单词关于假设边界位置的相对位置。
13.权利要求1的设备,其中的语音识别器包括已被利用训练数据进行了训练的语言模型,该训练数据包含插入来表示在其内的命令边界的位置的标记。
14.权利要求13的设备,其中的语音识别器包括标记的附加基本型。
15.权利要求14的设备,其中的语音识别器产生包含标记的识别文本。
16.权利要求1的设备,其中的边界鉴别器在识别文本中存在持续的寂静阶段时断言命令边界。
17.机器可读的程序存储设备,真实体现可被该机器执行来完成鉴别识别文本中的命令的方法步骤的指令程序,这些方法步骤包括:
输入识别文本;
通过给识别文本中的单词添加相对于假设命令边界的位置来对该识别文本进行处理;
确定在被处理的识别文本中的、与一组特征函数一致的那些特征函数;
判断具有被确定的那些特征函数的被处理的识别文本是否包含命令,这种判断是根据特征函数的加权作出;以及
如果包含命令,就输出该命令。
18.权利要求17的程序存储设备,还包括通过输入包含由命令和非命令组成的话语的训练数据来训练该程序存储设备的指令程序。
19.权利要求18的程序存储设备,其中的训练该程序存储设备的指令程序包含在每一话语前设置标记的步骤。
20.权利要求18的程序存储设备,其中的训练该程序存储设备的指令程序包含在话语包含的每一命令边界后设置标记的步骤。
21.权利要求17的程序存储设备,其中的训练该程序存储设备的指令程序包含从训练数据中提取特征函数的步骤。
22.权利要求17的程序存储设备,其中的训练该程序存储设备的指令程序包含为所有特征函数确定特征权重的步骤。
23.权利要求17的程序存储设备,其中的处理识别文本的指令程序包含在该识别文本的第一个话语前和在该识别文本的每一个命令后设置标记的步骤。
24.权利要求17的程序存储设备,还包括提供识别文本的语音识别器。
25.鉴别自然会话语言中的命令的方法,包括以下步骤:
输入识别文本;
通过给识别文本中的单词添加相对于假设命令边界的位置来对该识别文本进行处理;
确定在被处理的识别文本中的、与一组特征函数一致的那些特征函数;
判断具有被确定的那些特征函数的被处理的识别文本是否包含命令,这种判断是根据特征函数的加权作出;以及
如果包含命令,就输出该命令。
26.权利要求25的方法,还包括向输入处理器输入包含由命令和非命令组成的话语的训练数据的步骤。
27.权利要求25的方法,还包括在训练数据的每一话语前设置标记的步骤。
28.权利要求26的方法,还包含在话语包含的命令边界后设置标记的步骤。
29.权利要求26的方法,还包含从训练数据中提取特征函数的步骤。
30.权利要求26的方法,还包含为所有特征函数确定特征权重的步骤。
31.权利要求26的方法,还包含在识别文本的第一个话语前和在识别文本的每一个命令后设置标记的步骤。
32.权利要求25的方法,还包含输出命令给执行该命令的设备的步骤,该设备包括提供识别文本的语音识别器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/181,322 | 1998-10-28 | ||
US09/181,322 US6453292B2 (en) | 1998-10-28 | 1998-10-28 | Command boundary identifier for conversational natural language |
US09/181322 | 1998-10-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1252592A true CN1252592A (zh) | 2000-05-10 |
CN1125436C CN1125436C (zh) | 2003-10-22 |
Family
ID=22663797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN99121518.4A Expired - Lifetime CN1125436C (zh) | 1998-10-28 | 1999-10-14 | 会话自然语言的命令边界鉴别器及鉴别方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6453292B2 (zh) |
JP (1) | JP3476006B2 (zh) |
CN (1) | CN1125436C (zh) |
GB (1) | GB2343285B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855720A (zh) * | 2012-09-11 | 2013-01-02 | 深圳市豪恩安全科技有限公司 | 一种可自动切换的红外对射器 |
CN103345922A (zh) * | 2013-07-05 | 2013-10-09 | 张巍 | 一种长篇幅语音全自动切分方法 |
CN105006235A (zh) * | 2014-04-23 | 2015-10-28 | 谷歌公司 | 基于词比较的语音端点定位 |
CN107146602A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种语音识别方法、装置及电子设备 |
Families Citing this family (236)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7941647B2 (en) | 1999-01-28 | 2011-05-10 | Ati Technologies Ulc | Computer for executing two instruction sets and adds a macroinstruction end marker for performing iterations after loop termination |
US8127121B2 (en) | 1999-01-28 | 2012-02-28 | Ati Technologies Ulc | Apparatus for executing programs for a first computer architechture on a computer of a second architechture |
US8121828B2 (en) | 1999-01-28 | 2012-02-21 | Ati Technologies Ulc | Detecting conditions for transfer of execution from one computer instruction stream to another and executing transfer on satisfaction of the conditions |
US6978462B1 (en) * | 1999-01-28 | 2005-12-20 | Ati International Srl | Profiling execution of a sequence of events occuring during a profiled execution interval that matches time-independent selection criteria of events to be profiled |
US6954923B1 (en) | 1999-01-28 | 2005-10-11 | Ati International Srl | Recording classification of instructions executed by a computer |
US8074055B1 (en) | 1999-01-28 | 2011-12-06 | Ati Technologies Ulc | Altering data storage conventions of a processor when execution flows from first architecture code to second architecture code |
WO2001013255A2 (en) | 1999-08-13 | 2001-02-22 | Pixo, Inc. | Displaying and traversing links in character array |
WO2001022228A1 (en) | 1999-09-17 | 2001-03-29 | Nortel Networks Limited | System and method for producing a verification system for verifying procedure interfaces |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US20020072914A1 (en) * | 2000-12-08 | 2002-06-13 | Hiyan Alshawi | Method and apparatus for creation and user-customization of speech-enabled services |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7669134B1 (en) | 2003-05-02 | 2010-02-23 | Apple Inc. | Method and apparatus for displaying information during an instant messaging session |
US6925928B2 (en) * | 2003-09-18 | 2005-08-09 | Anthony Fox | Trash compactor for fast food restaurant waste |
US7680659B2 (en) * | 2005-06-01 | 2010-03-16 | Microsoft Corporation | Discriminative training for language modeling |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US7634409B2 (en) | 2005-08-31 | 2009-12-15 | Voicebox Technologies, Inc. | Dynamic speech sharpening |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US7805305B2 (en) * | 2006-10-12 | 2010-09-28 | Nuance Communications, Inc. | Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8364694B2 (en) | 2007-10-26 | 2013-01-29 | Apple Inc. | Search assistant for digital media assets |
CN101424973A (zh) * | 2007-11-02 | 2009-05-06 | 夏普株式会社 | 输入装置 |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US9177551B2 (en) | 2008-01-22 | 2015-11-03 | At&T Intellectual Property I, L.P. | System and method of providing speech processing in user interface |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
CA2680304C (en) * | 2008-09-25 | 2017-08-22 | Multimodal Technologies, Inc. | Decoding-time prediction of non-verbalized tokens |
US8352268B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8352272B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8396714B2 (en) | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8355919B2 (en) | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8494857B2 (en) | 2009-01-06 | 2013-07-23 | Regents Of The University Of Minnesota | Automatic measurement of speech fluency |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9583095B2 (en) * | 2009-07-17 | 2017-02-28 | Nec Corporation | Speech processing device, method, and storage medium |
WO2011059997A1 (en) | 2009-11-10 | 2011-05-19 | Voicebox Technologies, Inc. | System and method for providing a natural language content dedication service |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8626511B2 (en) * | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US9104670B2 (en) | 2010-07-21 | 2015-08-11 | Apple Inc. | Customized search or acquisition of digital media assets |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
KR20130014893A (ko) * | 2011-08-01 | 2013-02-12 | 한국전자통신연구원 | 음성 인식 장치 및 방법 |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
WO2013128508A1 (ja) | 2012-02-27 | 2013-09-06 | Necカシオモバイルコミュニケーションズ株式会社 | 音声入力装置、音声入力方法及びプログラム |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9576593B2 (en) | 2012-03-15 | 2017-02-21 | Regents Of The University Of Minnesota | Automated verbal fluency assessment |
US9317605B1 (en) | 2012-03-21 | 2016-04-19 | Google Inc. | Presenting forked auto-completions |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US10019994B2 (en) | 2012-06-08 | 2018-07-10 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9799328B2 (en) * | 2012-08-03 | 2017-10-24 | Veveo, Inc. | Method for using pauses detected in speech input to assist in interpreting the input during conversational interaction for information retrieval |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
US9189465B2 (en) * | 2012-09-28 | 2015-11-17 | International Business Machines Corporation | Documentation of system monitoring and analysis procedures |
KR20230137475A (ko) | 2013-02-07 | 2023-10-04 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11151899B2 (en) | 2013-03-15 | 2021-10-19 | Apple Inc. | User training by intelligent digital assistant |
US9922642B2 (en) | 2013-03-15 | 2018-03-20 | Apple Inc. | Training an at least partial voice command system |
WO2014168730A2 (en) | 2013-03-15 | 2014-10-16 | Apple Inc. | Context-sensitive handling of interruptions |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
US9646606B2 (en) | 2013-07-03 | 2017-05-09 | Google Inc. | Speech recognition using domain knowledge |
JP6163266B2 (ja) | 2013-08-06 | 2017-07-12 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
TWI536366B (zh) * | 2014-03-18 | 2016-06-01 | 財團法人工業技術研究院 | 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
EP3480811A1 (en) * | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9866954B2 (en) * | 2014-07-07 | 2018-01-09 | Adobe Systems Incorporated | Performance metric based stopping criteria for iterative algorithms |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10388270B2 (en) * | 2014-11-05 | 2019-08-20 | At&T Intellectual Property I, L.P. | System and method for text normalization using atomic tokens |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10269341B2 (en) | 2015-10-19 | 2019-04-23 | Google Llc | Speech endpointing |
KR101942521B1 (ko) | 2015-10-19 | 2019-01-28 | 구글 엘엘씨 | 음성 엔드포인팅 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
EP3482393A4 (en) | 2016-07-08 | 2019-12-18 | Asapp, Inc. | AUTOMATIC RESPONSE TO A REQUEST FROM A USER |
US10083451B2 (en) | 2016-07-08 | 2018-09-25 | Asapp, Inc. | Using semantic processing for customer support |
US10403275B1 (en) * | 2016-07-28 | 2019-09-03 | Josh.ai LLC | Speech control for complex commands |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
JP2018048965A (ja) * | 2016-09-23 | 2018-03-29 | 株式会社鷺宮製作所 | 圧力センサ |
US10109275B2 (en) * | 2016-12-19 | 2018-10-23 | Asapp, Inc. | Word hash language model |
US10650311B2 (en) | 2016-12-19 | 2020-05-12 | Asaap, Inc. | Suggesting resources using context hashing |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10929754B2 (en) | 2017-06-06 | 2021-02-23 | Google Llc | Unified endpointer using multitask and multidomain learning |
WO2018226779A1 (en) | 2017-06-06 | 2018-12-13 | Google Llc | End of query detection |
US10497004B2 (en) | 2017-12-08 | 2019-12-03 | Asapp, Inc. | Automating communications using an intent classifier |
US10489792B2 (en) | 2018-01-05 | 2019-11-26 | Asapp, Inc. | Maintaining quality of customer support messages |
US10210244B1 (en) | 2018-02-12 | 2019-02-19 | Asapp, Inc. | Updating natural language interfaces by processing usage data |
US10586538B2 (en) | 2018-04-25 | 2020-03-10 | Comcast Cable Comminications, LLC | Microphone array beamforming control |
US10169315B1 (en) | 2018-04-27 | 2019-01-01 | Asapp, Inc. | Removing personal information from text using a neural network |
US11216510B2 (en) | 2018-08-03 | 2022-01-04 | Asapp, Inc. | Processing an incomplete message with a neural network to generate suggested messages |
US10747957B2 (en) | 2018-11-13 | 2020-08-18 | Asapp, Inc. | Processing communications using a prototype classifier |
US11551004B2 (en) | 2018-11-13 | 2023-01-10 | Asapp, Inc. | Intent discovery with a prototype classifier |
CN109949803B (zh) * | 2019-02-11 | 2020-01-31 | 特斯联(北京)科技有限公司 | 基于语义指令智能识别的建筑服务设施控制方法及系统 |
CN110138654B (zh) * | 2019-06-06 | 2022-02-11 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
US11425064B2 (en) | 2019-10-25 | 2022-08-23 | Asapp, Inc. | Customized message suggestion with user embedding vectors |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03203794A (ja) | 1989-12-29 | 1991-09-05 | Pioneer Electron Corp | 音声リモートコントロール装置 |
JP2764343B2 (ja) * | 1990-09-07 | 1998-06-11 | 富士通株式会社 | 節/句境界抽出方式 |
JP2924555B2 (ja) * | 1992-10-02 | 1999-07-26 | 三菱電機株式会社 | 音声認識の境界推定方法及び音声認識装置 |
KR950704772A (ko) * | 1993-10-15 | 1995-11-20 | 데이비드 엠. 로젠블랫 | 시스템 트레이닝 방법, 트레이닝된 장치 및 그 사용 방법(A method for training a system, the resulting apparatus, and method of use thereof) |
US5594834A (en) * | 1994-09-30 | 1997-01-14 | Motorola, Inc. | Method and system for recognizing a boundary between sounds in continuous speech |
US5729656A (en) * | 1994-11-30 | 1998-03-17 | International Business Machines Corporation | Reduction of search space in speech recognition using phone boundaries and phone ranking |
US5638487A (en) * | 1994-12-30 | 1997-06-10 | Purespeech, Inc. | Automatic speech recognition |
US5794196A (en) * | 1995-06-30 | 1998-08-11 | Kurzweil Applied Intelligence, Inc. | Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules |
US5794189A (en) | 1995-11-13 | 1998-08-11 | Dragon Systems, Inc. | Continuous speech recognition |
-
1998
- 1998-10-28 US US09/181,322 patent/US6453292B2/en not_active Expired - Lifetime
-
1999
- 1999-08-17 JP JP23021799A patent/JP3476006B2/ja not_active Expired - Fee Related
- 1999-09-13 GB GB9921422A patent/GB2343285B/en not_active Expired - Fee Related
- 1999-10-14 CN CN99121518.4A patent/CN1125436C/zh not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855720A (zh) * | 2012-09-11 | 2013-01-02 | 深圳市豪恩安全科技有限公司 | 一种可自动切换的红外对射器 |
CN103345922A (zh) * | 2013-07-05 | 2013-10-09 | 张巍 | 一种长篇幅语音全自动切分方法 |
CN103345922B (zh) * | 2013-07-05 | 2016-07-06 | 张巍 | 一种长篇幅语音全自动切分方法 |
CN105006235A (zh) * | 2014-04-23 | 2015-10-28 | 谷歌公司 | 基于词比较的语音端点定位 |
CN105006235B (zh) * | 2014-04-23 | 2020-07-17 | 谷歌有限责任公司 | 基于词比较的语音端点定位 |
CN107146602A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种语音识别方法、装置及电子设备 |
CN107146602B (zh) * | 2017-04-10 | 2020-10-02 | 北京猎户星空科技有限公司 | 一种语音识别方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
GB9921422D0 (en) | 1999-11-10 |
CN1125436C (zh) | 2003-10-22 |
GB2343285A (en) | 2000-05-03 |
JP3476006B2 (ja) | 2003-12-10 |
JP2000132186A (ja) | 2000-05-12 |
US20010056344A1 (en) | 2001-12-27 |
US6453292B2 (en) | 2002-09-17 |
GB2343285B (en) | 2003-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1125436C (zh) | 会话自然语言的命令边界鉴别器及鉴别方法 | |
US11562737B2 (en) | Generating topic-specific language models | |
CN1260704C (zh) | 语音合成方法 | |
WO2018157789A1 (zh) | 一种语音识别的方法、计算机、存储介质以及电子装置 | |
CN105957531B (zh) | 基于云平台的演讲内容提取方法及装置 | |
CN1950882A (zh) | 语音识别系统中的语音结束检测 | |
CN1573924A (zh) | 语音识别设备、语音识别方法、会话控制设备以及会话控制方法 | |
KR20080069990A (ko) | 음성 세그먼트 색인 및 검색 방법과 컴퓨터 실행 가능명령어를 갖는 컴퓨터 판독 가능 매체 | |
CN1667699A (zh) | 为字母-声音转换生成有互信息标准的大文法音素单元 | |
CN101075435A (zh) | 一种智能聊天系统及其实现方法 | |
CA3158353A1 (en) | Audio-outputting method and system thereof | |
WO2007005884A2 (en) | Generating chinese language couplets | |
CN110120221A (zh) | 用于车机系统的用户个性化离线语音识别方法及其系统 | |
US20080133220A1 (en) | Leveraging back-off grammars for authoring context-free grammars | |
CN105551485A (zh) | 语音文件检索方法及系统 | |
JP2012181358A (ja) | テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム | |
CN103559880A (zh) | 语音输入系统和方法 | |
CN108710653B (zh) | 一种绘本朗读点播方法、装置及系统 | |
CN1932976A (zh) | 一种实现视音频处理中字幕与语音同步的方法和系统 | |
CN108052630B (zh) | 一种基于中文教育视频提取拓展词的方法 | |
JP2017045054A (ja) | 言語モデル改良装置及び方法、音声認識装置及び方法 | |
US20220399013A1 (en) | Response method, terminal, and storage medium | |
Ries | Segmenting conversations by topic, initiative, and style | |
CN1159701C (zh) | 执行句法置换规则的语音识别装置 | |
CN1190772C (zh) | 语音识别系统及用于语音识别系统的特征矢量集的压缩方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: WEICHA COMMUNICATION CO.,LTD. Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP. Effective date: 20090731 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20090731 Address after: Massachusetts, USA Patentee after: Nuance Communications Inc. Address before: American New York Patentee before: International Business Machines Corp. |
|
CX01 | Expiry of patent term |
Granted publication date: 20031022 |
|
CX01 | Expiry of patent term |