CN103310785B

CN103310785B - 使用语音识别控制电源的电子装置和方法

Info

Publication number: CN103310785B
Application number: CN201310082900.0A
Authority: CN
Inventors: 李智贤; 郑昌柱
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2012-03-15
Filing date: 2013-03-15
Publication date: 2017-08-11
Anticipated expiration: 2033-03-15
Also published as: US20130246071A1; US9190059B2; EP2639793A1; CN103310785A; EP2639793B1

Abstract

提供了电子装置和电源控制方法。电子装置包括：语音输入单元，其在电子装置的待机模式下接收音频输入；语音感测单元，其确定接收到的音频输入是否是用户语音，而且如果输入了用户语音，则输出电源控制信号；以及电源控制语音识别单元，如果从语音感测单元接收到电源控制信号，则电源控制语音识别单元开启并执行与输入的用户语音有关的语音识别。

Description

使用语音识别控制电源的电子装置和方法

相关申请的交叉引用

本申请要求2012年3月15日向美国专利商标局提交的第61/611,175号美国临时申请以及2012年5月21日向韩国知识产权局提交的第2012-0053407号韩国专利申请的权益，其公开通过引用整体并入此处。

技术领域

与示范性实施例一致的装置和方法涉及用于控制电源的电子装置和方法，并且更具体地，涉及使用语音识别控制电子装置的电源的电子装置以及用于控制电子装置的电源的方法。

背景技术

随着电子技术的发展，已经开发了以各种方式控制电子装置的方法。在相关技术中，已经使用电子装置或与该电子装置分开提供的遥控器上的按钮来控制电子装置。

然而，如果像相关技术那样使用电子装置或与该电子装置分开提供的遥控器上的按钮来控制电子装置，则用户必须频繁携带电子装置或遥控器，这给用户造成不便。特别是，如果用户处于难以携带电子装置或遥控器（例如，如果手是脏的，或如果难以找到遥控器）的情况下，则用户可能在控制电子装置方面遇到不便。

最近，已经开发了使用语音识别和运动识别的新技术以解决上述问题。特别是，即使遥控器在远处也能控制电子装置的、使用语音识别控制电子装置的方法已经变得流行。

然而，在使用语音识别控制电子装置的电源的相关技术中，电子装置的语音识别模块即使在待机模式下也应该被一直打开，这在待机模式下浪费了相当大量的电力。

发明内容

一个或多个示范性实施例的方面涉及电子装置以及控制该电子装置的电源的方法，以便防止在待机模式下不必要地浪费功率；当在待机模式下通过语音感测单元识别到用户语音时，该电子装置开启电子装置的语音识别单元的电源。

根据示范性实施例的一方面，提供了一种电子装置，包括：语音输入单元，其接收音频；语音感测单元，其感测在电子装置的待机模式下是否通过语音输入单元输入了用户语音，而且如果输入了用户语音，则其输出第一电源控制信号；以及电源控制语音识别单元，如果从语音感测单元接收到第一电源控制信号，则电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别。

电源控制语音识别单元可以识别输入的语音并且确定输入的语音是否是用于控制电子装置的电源的语音。

该装置还可以包括控制电子装置的主控制单元，而且如果确定输入的语音是用于控制电子装置的电源的语音，则电源控制语音识别单元可以将第二电源控制信号发送到主控制单元，并且如果从电源控制语音识别单元接收到第二电源控制信号，则主控制单元可以将电子装置的模式从待机模式转换到工作模式。

在确定了输入的语音是用于控制电子装置的电源的语音后，在经过了预定时间之后，电源控制语音识别单元可以再次关闭电源控制语音识别单元的电源。

该装置还可以包括主语音识别单元，其识别通过语音输入单元接收到的用户语音，而且在工作模式下，主控制单元可以根据通过主语音识别单元识别到的用户语音来控制电子装置。

在确定了输入的语音不是用于控制电子装置的电源的用户语音后，如果在预定时间内没有再次输入用户语音，则电源控制语音识别单元可以再次关闭电源。

电源控制语音识别单元可以仅存储与用于控制电子装置的电源的用户语音相对应的命令。

当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加了超过预定值时，语音感测单元可以感测到输入了用户语音。

在电子装置的待机模式下，只有语音输入单元和语音感测单元可以被开启。

根据另一示范性实施例的一方面，提供了一种用于控制电子装置的电源的方法，该方法包括：通过语音感测单元感测在电子装置的待机模式下是否输入了用户语音；如果感测到用户语音，则通过语音感测单元将第一电源控制信号发送到电源控制语音识别单元；以及如果从语音感测单元接收到第一电源控制信号，则通过电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别。

该方法还可以包括通过利用电源控制语音识别单元识别输入的语音来确定输入的语音是否是用于控制电子装置的电源的用户语音。

该方法还可以包括：如果确定输入的语音是用于控制电子装置的电源的用户语音，则通过电源控制语音识别单元将第二电源控制信号发送到主控制单元；以及如果从电源控制语音识别单元接收到第二电源控制信号，则通过主控制单元将电子装置的模式从待机模式转换到工作模式。

该方法还可以包括，在确定了输入的语音是用于控制电子装置的电源的用户语音后，在经过了预定时间之后，再次关闭电源控制语音识别单元的电源。

该方法还可以包括在工作模式下，通过主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。

该方法还可以包括，如果确定了输入的语音不是用于控制电子装置的电源的用户语音、而且在预定时间内没有再次输入用户语音，则再次关闭电源控制语音识别单元的电源。

电源控制语音识别单元可以只存储与用于控制电子装置的电源的用户语音相对应的命令。

所述感测可以包括，当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加超过预定值时，感测到输入了用户语音

根据另一示范性实施例的一方面，提供了一种用于控制电子装置的电源的方法，该方法包括：响应于确定接收到的音频输入对应于预定声音，向电子装置的电源控制语音识别单元供电；以及响应于向电源控制语音识别单元供电，执行与接收到的音频输入有关的语音识别。

附图说明

从结合附图对示范性实施例的以下描述，这些和/或其他方面和优点将变得明显和更容易理解，在附图中：

图1是示出根据示范性实施例的电子装置的配置的框图；

图2是详细示出根据示范性实施例的电子装置的电源控制单元的配置的框图；

图3是解释根据示范性实施例的电子装置的电源控制方法的流程图；以及

图4是详细解释根据示范性实施例的在待机模式下电子装置的电源控制方法的流程图。

具体实施方式

现在将详细参考示范性实施例，附图中示出了其示例，其中相同的附图标记始终指代相同的元件。下面描述实施例，以便通过参考附图解释本发明。

图1是简要地示出根据示范性实施例的电子装置100的配置的框图。如图1所示，电子装置100包括语音输入单元110、电源控制单元120、主语音识别单元130、存储单元140和主控制单元150。根据示范性实施例的电子装置100可以是电视，但这仅仅是例子。电子装置100可以是各种电子装置，例如智能电话、平板PC、笔记本计算机、台式计算机、个人数字助理（PDA）、工作站、专用计算机、机顶盒、数字多媒体再现装置、游戏设备、显示设备、投影仪设备等。

语音输入单元110从外部接收音频输入。在这种情况下，语音输入单元110可以不仅接收用户语音，而且接收各种类型的音频（例如，内部噪声）。

特别是，语音输入单元110将输入的音频信号转换成电信号，并将转换的电信号发送到电源控制单元120或主语音识别单元130。如果电子装置100处于待机模式，则语音输入单元110可以将转换的电信号发送到电源控制单元120，并且，如果电子装置100处于工作模式，则语音输入单元110可以将转换的电信号发送到主语音识别单元130。这里，电子装置100的待机模式可以是低功率模式，例如，不向除了电源控制单元120以外的任何其他元件施加电力、同时等待开启电子装置100的用户命令的模式。另外，工作模式可以是通过向电子装置100的主控制单元150施加电力、根据用户的命令控制电子装置100的模式。

在这种情况下，语音输入单元110可以被实现为麦克风，该麦克风或者以全内置（all-in-one）形式与电子装置100在一起（例如，集成在一起），或者与电子装置100分开。与电子装置100分开提供的语音输入单元100可以经由线缆或无线连接（例如，红外、蓝牙、无线网络等）连接到电子装置100。

电源控制单元120控制电子装置100的电源状态。在这种情况下，电源控制单元120可以以各种方式控制电子装置100的电源状态。具体来说，电源控制单元120可以通过识别用户语音来控制电子装置100的电源状态。电源控制单元120使用用户语音控制电子装置的电源状态的具体方法将参照图2详细解释。

图2是示出根据示范性实施例的电子装置100的电源控制单元120的配置的框图。如图2所示，电源控制单元120包括语音感测单元121和电源控制语音识别单元122。

如果电子装置100处于待机模式，则语音感测单元121感测通过语音输入单元110输入的音频是否是用户语音。即使电子装置100处于待机模式，语音感测单元121也被开启。

在这种情况下，如果通过语音输入单元110接收到的音频的音量与先前输入音频相比增加超过预定值，则语音感测单元121可以确定输入了用户语音。在一般的家庭环境或一般的办公环境中，除了用户语音之外的各种类型的音频都可能被输入到语音输入单元110。由于一般的家庭环境或一般的办公环境中的噪声（例如，空调的噪音）具有一定的音量，因此语音感测单元121可以仅在当前输入的音频与通常输入的音频（例如，一般的噪声）相比具有增加超过预定值的音量时才确定输入了用户语音。例如，如果普通音频的音量为20dB，则语音感测单元121可以确定只有音量比通常输入音频的音量大超过预定值（例如，12dB）的音频是用户语音。然而，可以理解的是，一个或多个其它示范性实施例不限于此。例如，根据另一示范性实施例，语音感测单元121可以在当前输入音频的音量大于预定值的时候确定输入了用户语音。

如果语音感测单元121确定输入了用户语音，则语音感测单元121将电源控制信号发送到电源控制语音识别单元122。

在电子装置100的待机模式下，电源控制语音识别单元122被关闭。如果从语音感测单元121接收到电源控制信号，则电源控制语音识别单元122被开启。在待机模式下关闭电源控制语音识别单元122的电源，而且当从语音感测单元121接收到电源控制信号时开启电源控制语音识别单元122。因此，可以防止在待机模式下不必要的功耗。

随后，电源控制语音识别单元122从语音输入单元110和语音感测单元121中的至少一个接收与感测到的用户语音相对应的电信号。

电源控制语音识别单元122使用与接收到的用户语音相对应的电信号来执行语音识别。具体而言，电源控制语音识别单元122使用语音识别模块和电源控制语音识别单元122中的语音数据库来识别语音。在这种情况下，仅用于控制电子装置100的电源的命令可以被存储在电源控制语音识别单元122的语音数据库中。例如，开启电子装置100的电源的命令，诸如“开始(start)”、“开启（turn-on）”和“嗨（hi）”，可以被存储在语音数据库中。然而，应该理解的是，一个或多个其它示范性实施例不限于此，而且其他命令也可以被存储在语音数据库中。

根据输入语音的类型，语音识别可以被划分为孤立词识别(isolated wordrecognition)、连续语音识别(continuous speech recognition)和关键词检出(keywordspotting)；孤立词识别按照每个词识别说出的语音；连续语音识别识别连续的词、连续的句子和会话语音；关键词检出是孤立词识别和连续语音识别之间的识别形式，其检测和识别预定的关键词。

如果输入了用户语音，则电源控制语音识别单元122通过检测输入语音信号内的用户说出的语音的开始和结束来确定语音段。电源控制语音识别单元122可以计算输入语音信号的能量、基于计算的能量对语音信号的能量级别进行分类、并通过动态编程检测语音段。电源控制语音识别单元122基于声学模型从检测到的语音段内的语音信号检测音素(phoneme)并由此生成音素数据，音素是语音的基本单位。电源控制语音识别单元122通过对已生成的音素数据应用隐式马尔可夫模型（Hidden Markov Model，HMM）来生成文本信息。然而，应该理解的是，用于识别用户语音的以上方法仅是示范性实施例，而且在一个或多个其它的示范性实施例中可以使用其他方式识别用户语音。

电源控制语音识别单元122基于用户语音的识别结果确定用户语音是否是用于控制电子装置100的电源的。具体而言，电源控制语音识别单元122可以通过搜索识别到的用户语音是否存储在用于控制电源的语音数据库中来确定识别到的用户语音是否是用于控制电子装置100的电源的。

如果输入的用户语音是用于控制电子装置100的电源的，则电源控制语音识别单元122将电源控制信号发送到主控制单元150。

如果在预定时间内没有输入用于控制电子装置100的电源的用户语音，则可以再次关闭电源控制语音识别单元122。

可替换地，如果输入的用户语音不是用于控制电子装置100的电源的，则电源控制语音识别单元122可以在预定时间（例如，30秒）内等待控制电子装置100的电源的用户语音被输入，而且如果在预定时间之后没有输入用户语音，则可以再次关闭电源控制语音识别单元122。

如上所述，可以使用电源控制单元120控制电子装置100的电源，因此可以防止待机模式和工作模式下电子装置100的不必要的功耗。

同时，电源控制单元120可以以除了上述使用用户语音控制电源的方法以外的各种方法（例如，使用通过选择从外部提供的按钮来控制电源的方法）控制电源。

返回参照图1，主语音识别单元130识别从语音输入单元110输入的用户语音并且将识别结果发送到主控制单元150。如上所述，在电子装置100的工作模式中主语音识别单元130可以识别从语音输入单元110输入的用户语音。

由主语音识别单元130识别用户语音的方法与通过电源控制语音识别单元122识别用户语音的方法类似，因此，将不提供对它的详细描述。主语音识别单元130可以具有内部语音识别模块和语音数据库，就像电源控制语音识别单元122一样，但是这只是例子，而且一个或多个其它的示范性实施例不限于此。例如，根据另一示范性实施例，主语音识别单元130可以使用存储在外部存储单元140中的语音数据库来执行语音识别。

存储单元140可以存储各种程序和数据以用于驱动电子装置100。此外，存储单元140可以存储语音识别模块和语音数据库以用于识别通过语音输入单元110输入的语音。在这种情况下，语音数据库可以与电子装置100的预先设定的语音和任务相匹配，并存储在存储单元140中。

通过从电源控制单元120的电源控制语音识别单元122发送的电源控制信号开启主控制单元150。因此，主控制单元150将电子装置100的待机模式转换到工作模式。

在工作模式中，主控制单元150根据通过语音输入单元110输入的用户语音和各种用户输入（例如，触摸输入和遥控器输入）来控制电子装置100。

同时，主语音识别单元130和主控制单元150也可以实现为独立的芯片，但是这仅仅是例子，而且一个或多个其它的示范性实施例不限于此。例如，主语音识别单元130和主控制单元150可以被实现为单一芯片。

下文中，将参照图3和图4解释使用语音识别控制电子装置100的电源的方法。

图3是解释根据示范性实施例的电子装置的电源控制方法的流程图。

在电子装置100的待机模式下，语音感测单元121感测是否输入了用户语音（操作S310）。例如，在电子装置100的待机模式下，语音感测单元121可以通过比较输入音频的音量和先前输入的音频的音量来确定是否输入了用户语音。也就是说，如果通过语音输入单元110接收到的音频与先前输入的音频相比增加了超过预定值，则语音感测单元121可以确定输入了用户语音。

如果语音感测单元121感测输入了用户语音（操作S310的是），则语音感测单元121将电源控制信号发送到电源控制识别单元122（操作S320）。

如果从语音感测单元121发送了电源控制信号，则电源控制语音识别单元122被开启并识别输入用户语音（操作S330）。如果电源控制语音识别单元122确定输入的用户语音是用于控制电子装置100的电源，则电源控制语音识别单元122可以将电源控制信号发送到主控制单元150。主控制单元150可以将电子装置100的待机模式转换到工作模式。

如上所述，在待机模式下，电源控制单元120的语音感测单元121被开启而电源控制语音识别单元122和主控制单元150被关闭，因此电子装置100可以防止功率被不必要地浪费。

图4是详细解释根据示范性实施例的待机模式下电子装置的电源控制方法的流程图。

语音输入单元110接收外部音频输入（操作S405），并将输入的音频发送到语音感测单元121（操作S410）。

语音感测单元121确定输入的音频是否是用户语音（操作S415）。例如，在电子装置100的待机模式下，语音感测单元121可以比较通过语音输入单元110输入的音频的音量和先前输入的音频的音量，并在通过语音输入单元110输入的音频的音量与先前输入的音频的音量相比增加了超过预定值的情况下确定输入了用户语音。

如果确定输入的音频是用户语音（操作S415的是），则语音感测单元121发送电源控制信号（操作S420）。

如果从语音感测单元121发送了电源控制信号，则电源控制语音识别单元122被开启（操作S425）。

随后，电源控制语音识别单元122识别输入的用户语音（操作S430）。在这种情况下，电源控制语音识别单元122可以从语音输入单元110和语音感测单元121中的至少一个接收输入的用户语音。

电源控制语音识别单元122确定输入的用户语音是否是用于控制电子装置100的电源的（操作S435）。具体而言，电源控制语音识别单元122可以通过确定识别到的用户语音是否与存储在语音数据库中的用于开启电子装置100的电源的命令（例如，“开始”和“开启”）一致，来确定输入的用户语音是否是用于控制电子装置100的电源的。

如果输入的用户语音是用于控制电子装置100的电源的（操作S435的是），则电源控制语音识别单元122将电源控制信号发送到主控制单元150（操作S440）。

如果从电源控制语音识别单元122发送了电源控制信号，则主控制单元150将电子装置100的待机模式转换到工作模式（操作S445）。

如果将电子装置100的模式转换到工作模式，则可以再次关闭电源控制语音识别单元122（操作S450）。

然而，如果输入的用户语音不是用于控制电子装置100的电源的语音（操作S435的否），则电源控制语音识别单元122被再次关闭并等待控制电源的用户语音被输入。

如上所述，可以使用语音识别来控制电子装置的电源，因此用户可以更容易和更方便地控制电源。此外，由于当在待机模式下通过语音感测单元识别到用户语音时开启电源控制语音识别单元的电源，因此可以防止待机模式下的不必要的功耗。

执行上述方法的程序代码可以存储在计算机可读的非临时性记录介质中。记录介质包括能够由终端读取的硬盘、可移动盘、存储卡、USB存储器、CD-ROM、光学介质等等。此外，应当理解，在示范性实施例中，上述装置100的一个或多个单元可以包括电路、处理器、微处理器等，并可以执行存储在计算机可读介质中的计算机程序。

虽然已经示出和描述了几个示范性实施例，但是本领域技术人员可以理解，可以对这些示范性实施例做出改变而不脱离本发明的原理和精神，本发明的范围由权利要求及其等同物限定。

Claims

1.一种电子装置，包括：

语音输入单元，其接收音频；

语音感测单元，其感测在电子装置的待机模式下是否通过语音输入单元输入了用户语音，而且如果输入了用户语音，则其输出第一电源控制信号；

电源控制语音识别单元，如果从语音感测单元接收到第一电源控制信号，则电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别，其中，所述电源控制语音识别单元识别输入的语音并且确定输入的语音是否是用于控制电子装置的电源的语音；以及

主控制单元，其控制电子装置，

其中，如果确定输入的语音是用于控制电子装置的电源的语音，则电源控制语音识别单元将第二电源控制信号发送到主控制单元，

其中，如果从电源控制语音识别单元接收到第二电源控制信号，则主控制单元将电子装置的模式从待机模式转换到工作模式。

2.如权利要求1所述的装置，其中，在确定了输入的语音是用于控制电子装置的电源的语音后，在经过了预定时间之后，所述电源控制语音识别单元再次关闭电源控制语音识别单元的电源。

3.如权利要求1所述的装置，还包括：

主语音识别单元，其识别通过语音输入单元接收到的用户语音，

其中，在工作模式下，主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。

4.如权利要求1所述的装置，其中，在确定了输入的语音不是用于控制电子装置的电源的语音后，如果在预定时间内没有再次输入用户语音，则电源控制语音识别单元再次关闭电源。

5.如权利要求1所述的装置，其中，所述电源控制语音识别单元仅存储与用于控制电子装置的电源的用户语音相对应的命令。

6.如权利要求1所述的装置，其中，当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加超过预定值时，所述语音感测单元感测到输入了用户语音。

7.如权利要求1所述的装置，其中，在电子装置的待机模式下，只有语音输入单元和语音感测单元被开启。

8.一种用于控制电子装置的电源的方法，包括：

通过语音感测单元感测在电子装置的待机模式下是否输入了用户语音；

如果感测到用户语音，则通过语音感测单元将第一电源控制信号发送到电源控制语音识别单元；

如果从语音感测单元接收到第一电源控制信号，则通过电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别；

通过由电源控制语音识别单元识别输入的用户语音来确定输入的用户语音是否是用于控制电子装置的电源的用户语音；

如果确定输入的语音是用于控制电子装置的电源的用户语音，则通过电源控制语音识别单元将第二电源控制信号发送到主控制单元；以及

如果从电源控制语音识别单元接收到第二电源控制信号，则通过主控制单元将电子装置的模式从待机模式转换到工作模式。

9.如权利要求8所述的方法，还包括：

在确定了输入的语音是用于控制电子装置的电源的用户语音后，在经过了预定时间之后，再次关闭电源控制语音识别单元的电源。

10.如权利要求8所述的方法，还包括：

在工作模式下，通过主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。

11.如权利要求8所述的方法，还包括：

如果确定了输入的用户语音不是用于控制电子装置的电源的用户语音、而且在预定时间内没有再次输入用户语音，则再次关闭电源控制语音识别单元的电源。