CN103310785B - 使用语音识别控制电源的电子装置和方法 - Google Patents

使用语音识别控制电源的电子装置和方法 Download PDF

Info

Publication number
CN103310785B
CN103310785B CN201310082900.0A CN201310082900A CN103310785B CN 103310785 B CN103310785 B CN 103310785B CN 201310082900 A CN201310082900 A CN 201310082900A CN 103310785 B CN103310785 B CN 103310785B
Authority
CN
China
Prior art keywords
voice
power supply
unit
input
electronic installation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310082900.0A
Other languages
English (en)
Other versions
CN103310785A (zh
Inventor
李智贤
郑昌柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120053407A external-priority patent/KR20130105219A/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103310785A publication Critical patent/CN103310785A/zh
Application granted granted Critical
Publication of CN103310785B publication Critical patent/CN103310785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0251Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
    • H04W52/0254Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity detecting a user operation or a tactile contact or a motion of the device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

提供了电子装置和电源控制方法。电子装置包括:语音输入单元,其在电子装置的待机模式下接收音频输入;语音感测单元,其确定接收到的音频输入是否是用户语音,而且如果输入了用户语音,则输出电源控制信号;以及电源控制语音识别单元,如果从语音感测单元接收到电源控制信号,则电源控制语音识别单元开启并执行与输入的用户语音有关的语音识别。

Description

使用语音识别控制电源的电子装置和方法
相关申请的交叉引用
本申请要求2012年3月15日向美国专利商标局提交的第61/611,175号美国临时申请以及2012年5月21日向韩国知识产权局提交的第2012-0053407号韩国专利申请的权益,其公开通过引用整体并入此处。
技术领域
与示范性实施例一致的装置和方法涉及用于控制电源的电子装置和方法,并且更具体地,涉及使用语音识别控制电子装置的电源的电子装置以及用于控制电子装置的电源的方法。
背景技术
随着电子技术的发展,已经开发了以各种方式控制电子装置的方法。在相关技术中,已经使用电子装置或与该电子装置分开提供的遥控器上的按钮来控制电子装置。
然而,如果像相关技术那样使用电子装置或与该电子装置分开提供的遥控器上的按钮来控制电子装置,则用户必须频繁携带电子装置或遥控器,这给用户造成不便。特别是,如果用户处于难以携带电子装置或遥控器(例如,如果手是脏的,或如果难以找到遥控器)的情况下,则用户可能在控制电子装置方面遇到不便。
最近,已经开发了使用语音识别和运动识别的新技术以解决上述问题。特别是,即使遥控器在远处也能控制电子装置的、使用语音识别控制电子装置的方法已经变得流行。
然而,在使用语音识别控制电子装置的电源的相关技术中,电子装置的语音识别模块即使在待机模式下也应该被一直打开,这在待机模式下浪费了相当大量的电力。
发明内容
一个或多个示范性实施例的方面涉及电子装置以及控制该电子装置的电源的方法,以便防止在待机模式下不必要地浪费功率;当在待机模式下通过语音感测单元识别到用户语音时,该电子装置开启电子装置的语音识别单元的电源。
根据示范性实施例的一方面,提供了一种电子装置,包括:语音输入单元,其接收音频;语音感测单元,其感测在电子装置的待机模式下是否通过语音输入单元输入了用户语音,而且如果输入了用户语音,则其输出第一电源控制信号;以及电源控制语音识别单元,如果从语音感测单元接收到第一电源控制信号,则电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别。
电源控制语音识别单元可以识别输入的语音并且确定输入的语音是否是用于控制电子装置的电源的语音。
该装置还可以包括控制电子装置的主控制单元,而且如果确定输入的语音是用于控制电子装置的电源的语音,则电源控制语音识别单元可以将第二电源控制信号发送到主控制单元,并且如果从电源控制语音识别单元接收到第二电源控制信号,则主控制单元可以将电子装置的模式从待机模式转换到工作模式。
在确定了输入的语音是用于控制电子装置的电源的语音后,在经过了预定时间之后,电源控制语音识别单元可以再次关闭电源控制语音识别单元的电源。
该装置还可以包括主语音识别单元,其识别通过语音输入单元接收到的用户语音,而且在工作模式下,主控制单元可以根据通过主语音识别单元识别到的用户语音来控制电子装置。
在确定了输入的语音不是用于控制电子装置的电源的用户语音后,如果在预定时间内没有再次输入用户语音,则电源控制语音识别单元可以再次关闭电源。
电源控制语音识别单元可以仅存储与用于控制电子装置的电源的用户语音相对应的命令。
当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加了超过预定值时,语音感测单元可以感测到输入了用户语音。
在电子装置的待机模式下,只有语音输入单元和语音感测单元可以被开启。
根据另一示范性实施例的一方面,提供了一种用于控制电子装置的电源的方法,该方法包括:通过语音感测单元感测在电子装置的待机模式下是否输入了用户语音;如果感测到用户语音,则通过语音感测单元将第一电源控制信号发送到电源控制语音识别单元;以及如果从语音感测单元接收到第一电源控制信号,则通过电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别。
该方法还可以包括通过利用电源控制语音识别单元识别输入的语音来确定输入的语音是否是用于控制电子装置的电源的用户语音。
该方法还可以包括:如果确定输入的语音是用于控制电子装置的电源的用户语音,则通过电源控制语音识别单元将第二电源控制信号发送到主控制单元;以及如果从电源控制语音识别单元接收到第二电源控制信号,则通过主控制单元将电子装置的模式从待机模式转换到工作模式。
该方法还可以包括,在确定了输入的语音是用于控制电子装置的电源的用户语音后,在经过了预定时间之后,再次关闭电源控制语音识别单元的电源。
该方法还可以包括在工作模式下,通过主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。
该方法还可以包括,如果确定了输入的语音不是用于控制电子装置的电源的用户语音、而且在预定时间内没有再次输入用户语音,则再次关闭电源控制语音识别单元的电源。
电源控制语音识别单元可以只存储与用于控制电子装置的电源的用户语音相对应的命令。
所述感测可以包括,当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加超过预定值时,感测到输入了用户语音
在电子装置的待机模式下,只有语音输入单元和语音感测单元可以被开启。
根据另一示范性实施例的一方面,提供了一种用于控制电子装置的电源的方法,该方法包括:响应于确定接收到的音频输入对应于预定声音,向电子装置的电源控制语音识别单元供电;以及响应于向电源控制语音识别单元供电,执行与接收到的音频输入有关的语音识别。
附图说明
从结合附图对示范性实施例的以下描述,这些和/或其他方面和优点将变得明显和更容易理解,在附图中:
图1是示出根据示范性实施例的电子装置的配置的框图;
图2是详细示出根据示范性实施例的电子装置的电源控制单元的配置的框图;
图3是解释根据示范性实施例的电子装置的电源控制方法的流程图;以及
图4是详细解释根据示范性实施例的在待机模式下电子装置的电源控制方法的流程图。
具体实施方式
现在将详细参考示范性实施例,附图中示出了其示例,其中相同的附图标记始终指代相同的元件。下面描述实施例,以便通过参考附图解释本发明。
图1是简要地示出根据示范性实施例的电子装置100的配置的框图。如图1所示,电子装置100包括语音输入单元110、电源控制单元120、主语音识别单元130、存储单元140和主控制单元150。根据示范性实施例的电子装置100可以是电视,但这仅仅是例子。电子装置100可以是各种电子装置,例如智能电话、平板PC、笔记本计算机、台式计算机、个人数字助理(PDA)、工作站、专用计算机、机顶盒、数字多媒体再现装置、游戏设备、显示设备、投影仪设备等。
语音输入单元110从外部接收音频输入。在这种情况下,语音输入单元110可以不仅接收用户语音,而且接收各种类型的音频(例如,内部噪声)。
特别是,语音输入单元110将输入的音频信号转换成电信号,并将转换的电信号发送到电源控制单元120或主语音识别单元130。如果电子装置100处于待机模式,则语音输入单元110可以将转换的电信号发送到电源控制单元120,并且,如果电子装置100处于工作模式,则语音输入单元110可以将转换的电信号发送到主语音识别单元130。这里,电子装置100的待机模式可以是低功率模式,例如,不向除了电源控制单元120以外的任何其他元件施加电力、同时等待开启电子装置100的用户命令的模式。另外,工作模式可以是通过向电子装置100的主控制单元150施加电力、根据用户的命令控制电子装置100的模式。
在这种情况下,语音输入单元110可以被实现为麦克风,该麦克风或者以全内置(all-in-one)形式与电子装置100在一起(例如,集成在一起),或者与电子装置100分开。与电子装置100分开提供的语音输入单元100可以经由线缆或无线连接(例如,红外、蓝牙、无线网络等)连接到电子装置100。
电源控制单元120控制电子装置100的电源状态。在这种情况下,电源控制单元120可以以各种方式控制电子装置100的电源状态。具体来说,电源控制单元120可以通过识别用户语音来控制电子装置100的电源状态。电源控制单元120使用用户语音控制电子装置的电源状态的具体方法将参照图2详细解释。
图2是示出根据示范性实施例的电子装置100的电源控制单元120的配置的框图。如图2所示,电源控制单元120包括语音感测单元121和电源控制语音识别单元122。
如果电子装置100处于待机模式,则语音感测单元121感测通过语音输入单元110输入的音频是否是用户语音。即使电子装置100处于待机模式,语音感测单元121也被开启。
在这种情况下,如果通过语音输入单元110接收到的音频的音量与先前输入音频相比增加超过预定值,则语音感测单元121可以确定输入了用户语音。在一般的家庭环境或一般的办公环境中,除了用户语音之外的各种类型的音频都可能被输入到语音输入单元110。由于一般的家庭环境或一般的办公环境中的噪声(例如,空调的噪音)具有一定的音量,因此语音感测单元121可以仅在当前输入的音频与通常输入的音频(例如,一般的噪声)相比具有增加超过预定值的音量时才确定输入了用户语音。例如,如果普通音频的音量为20dB,则语音感测单元121可以确定只有音量比通常输入音频的音量大超过预定值(例如,12dB)的音频是用户语音。然而,可以理解的是,一个或多个其它示范性实施例不限于此。例如,根据另一示范性实施例,语音感测单元121可以在当前输入音频的音量大于预定值的时候确定输入了用户语音。
如果语音感测单元121确定输入了用户语音,则语音感测单元121将电源控制信号发送到电源控制语音识别单元122。
在电子装置100的待机模式下,电源控制语音识别单元122被关闭。如果从语音感测单元121接收到电源控制信号,则电源控制语音识别单元122被开启。在待机模式下关闭电源控制语音识别单元122的电源,而且当从语音感测单元121接收到电源控制信号时开启电源控制语音识别单元122。因此,可以防止在待机模式下不必要的功耗。
随后,电源控制语音识别单元122从语音输入单元110和语音感测单元121中的至少一个接收与感测到的用户语音相对应的电信号。
电源控制语音识别单元122使用与接收到的用户语音相对应的电信号来执行语音识别。具体而言,电源控制语音识别单元122使用语音识别模块和电源控制语音识别单元122中的语音数据库来识别语音。在这种情况下,仅用于控制电子装置100的电源的命令可以被存储在电源控制语音识别单元122的语音数据库中。例如,开启电子装置100的电源的命令,诸如“开始(start)”、“开启(turn-on)”和“嗨(hi)”,可以被存储在语音数据库中。然而,应该理解的是,一个或多个其它示范性实施例不限于此,而且其他命令也可以被存储在语音数据库中。
根据输入语音的类型,语音识别可以被划分为孤立词识别(isolated wordrecognition)、连续语音识别(continuous speech recognition)和关键词检出(keywordspotting);孤立词识别按照每个词识别说出的语音;连续语音识别识别连续的词、连续的句子和会话语音;关键词检出是孤立词识别和连续语音识别之间的识别形式,其检测和识别预定的关键词。
如果输入了用户语音,则电源控制语音识别单元122通过检测输入语音信号内的用户说出的语音的开始和结束来确定语音段。电源控制语音识别单元122可以计算输入语音信号的能量、基于计算的能量对语音信号的能量级别进行分类、并通过动态编程检测语音段。电源控制语音识别单元122基于声学模型从检测到的语音段内的语音信号检测音素(phoneme)并由此生成音素数据,音素是语音的基本单位。电源控制语音识别单元122通过对已生成的音素数据应用隐式马尔可夫模型(Hidden Markov Model,HMM)来生成文本信息。然而,应该理解的是,用于识别用户语音的以上方法仅是示范性实施例,而且在一个或多个其它的示范性实施例中可以使用其他方式识别用户语音。
电源控制语音识别单元122基于用户语音的识别结果确定用户语音是否是用于控制电子装置100的电源的。具体而言,电源控制语音识别单元122可以通过搜索识别到的用户语音是否存储在用于控制电源的语音数据库中来确定识别到的用户语音是否是用于控制电子装置100的电源的。
如果输入的用户语音是用于控制电子装置100的电源的,则电源控制语音识别单元122将电源控制信号发送到主控制单元150。
如果在预定时间内没有输入用于控制电子装置100的电源的用户语音,则可以再次关闭电源控制语音识别单元122。
可替换地,如果输入的用户语音不是用于控制电子装置100的电源的,则电源控制语音识别单元122可以在预定时间(例如,30秒)内等待控制电子装置100的电源的用户语音被输入,而且如果在预定时间之后没有输入用户语音,则可以再次关闭电源控制语音识别单元122。
如上所述,可以使用电源控制单元120控制电子装置100的电源,因此可以防止待机模式和工作模式下电子装置100的不必要的功耗。
同时,电源控制单元120可以以除了上述使用用户语音控制电源的方法以外的各种方法(例如,使用通过选择从外部提供的按钮来控制电源的方法)控制电源。
返回参照图1,主语音识别单元130识别从语音输入单元110输入的用户语音并且将识别结果发送到主控制单元150。如上所述,在电子装置100的工作模式中主语音识别单元130可以识别从语音输入单元110输入的用户语音。
由主语音识别单元130识别用户语音的方法与通过电源控制语音识别单元122识别用户语音的方法类似,因此,将不提供对它的详细描述。主语音识别单元130可以具有内部语音识别模块和语音数据库,就像电源控制语音识别单元122一样,但是这只是例子,而且一个或多个其它的示范性实施例不限于此。例如,根据另一示范性实施例,主语音识别单元130可以使用存储在外部存储单元140中的语音数据库来执行语音识别。
存储单元140可以存储各种程序和数据以用于驱动电子装置100。此外,存储单元140可以存储语音识别模块和语音数据库以用于识别通过语音输入单元110输入的语音。在这种情况下,语音数据库可以与电子装置100的预先设定的语音和任务相匹配,并存储在存储单元140中。
通过从电源控制单元120的电源控制语音识别单元122发送的电源控制信号开启主控制单元150。因此,主控制单元150将电子装置100的待机模式转换到工作模式。
在工作模式中,主控制单元150根据通过语音输入单元110输入的用户语音和各种用户输入(例如,触摸输入和遥控器输入)来控制电子装置100。
同时,主语音识别单元130和主控制单元150也可以实现为独立的芯片,但是这仅仅是例子,而且一个或多个其它的示范性实施例不限于此。例如,主语音识别单元130和主控制单元150可以被实现为单一芯片。
下文中,将参照图3和图4解释使用语音识别控制电子装置100的电源的方法。
图3是解释根据示范性实施例的电子装置的电源控制方法的流程图。
在电子装置100的待机模式下,语音感测单元121感测是否输入了用户语音(操作S310)。例如,在电子装置100的待机模式下,语音感测单元121可以通过比较输入音频的音量和先前输入的音频的音量来确定是否输入了用户语音。也就是说,如果通过语音输入单元110接收到的音频与先前输入的音频相比增加了超过预定值,则语音感测单元121可以确定输入了用户语音。
如果语音感测单元121感测输入了用户语音(操作S310的是),则语音感测单元121将电源控制信号发送到电源控制识别单元122(操作S320)。
如果从语音感测单元121发送了电源控制信号,则电源控制语音识别单元122被开启并识别输入用户语音(操作S330)。如果电源控制语音识别单元122确定输入的用户语音是用于控制电子装置100的电源,则电源控制语音识别单元122可以将电源控制信号发送到主控制单元150。主控制单元150可以将电子装置100的待机模式转换到工作模式。
如上所述,在待机模式下,电源控制单元120的语音感测单元121被开启而电源控制语音识别单元122和主控制单元150被关闭,因此电子装置100可以防止功率被不必要地浪费。
图4是详细解释根据示范性实施例的待机模式下电子装置的电源控制方法的流程图。
语音输入单元110接收外部音频输入(操作S405),并将输入的音频发送到语音感测单元121(操作S410)。
语音感测单元121确定输入的音频是否是用户语音(操作S415)。例如,在电子装置100的待机模式下,语音感测单元121可以比较通过语音输入单元110输入的音频的音量和先前输入的音频的音量,并在通过语音输入单元110输入的音频的音量与先前输入的音频的音量相比增加了超过预定值的情况下确定输入了用户语音。
如果确定输入的音频是用户语音(操作S415的是),则语音感测单元121发送电源控制信号(操作S420)。
如果从语音感测单元121发送了电源控制信号,则电源控制语音识别单元122被开启(操作S425)。
随后,电源控制语音识别单元122识别输入的用户语音(操作S430)。在这种情况下,电源控制语音识别单元122可以从语音输入单元110和语音感测单元121中的至少一个接收输入的用户语音。
电源控制语音识别单元122确定输入的用户语音是否是用于控制电子装置100的电源的(操作S435)。具体而言,电源控制语音识别单元122可以通过确定识别到的用户语音是否与存储在语音数据库中的用于开启电子装置100的电源的命令(例如,“开始”和“开启”)一致,来确定输入的用户语音是否是用于控制电子装置100的电源的。
如果输入的用户语音是用于控制电子装置100的电源的(操作S435的是),则电源控制语音识别单元122将电源控制信号发送到主控制单元150(操作S440)。
如果从电源控制语音识别单元122发送了电源控制信号,则主控制单元150将电子装置100的待机模式转换到工作模式(操作S445)。
如果将电子装置100的模式转换到工作模式,则可以再次关闭电源控制语音识别单元122(操作S450)。
然而,如果输入的用户语音不是用于控制电子装置100的电源的语音(操作S435的否),则电源控制语音识别单元122被再次关闭并等待控制电源的用户语音被输入。
如上所述,可以使用语音识别来控制电子装置的电源,因此用户可以更容易和更方便地控制电源。此外,由于当在待机模式下通过语音感测单元识别到用户语音时开启电源控制语音识别单元的电源,因此可以防止待机模式下的不必要的功耗。
执行上述方法的程序代码可以存储在计算机可读的非临时性记录介质中。记录介质包括能够由终端读取的硬盘、可移动盘、存储卡、USB存储器、CD-ROM、光学介质等等。此外,应当理解,在示范性实施例中,上述装置100的一个或多个单元可以包括电路、处理器、微处理器等,并可以执行存储在计算机可读介质中的计算机程序。
虽然已经示出和描述了几个示范性实施例,但是本领域技术人员可以理解,可以对这些示范性实施例做出改变而不脱离本发明的原理和精神,本发明的范围由权利要求及其等同物限定。

Claims (11)

1.一种电子装置,包括:
语音输入单元,其接收音频;
语音感测单元,其感测在电子装置的待机模式下是否通过语音输入单元输入了用户语音,而且如果输入了用户语音,则其输出第一电源控制信号;
电源控制语音识别单元,如果从语音感测单元接收到第一电源控制信号,则电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别,其中,所述电源控制语音识别单元识别输入的语音并且确定输入的语音是否是用于控制电子装置的电源的语音;以及
主控制单元,其控制电子装置,
其中,如果确定输入的语音是用于控制电子装置的电源的语音,则电源控制语音识别单元将第二电源控制信号发送到主控制单元,
其中,如果从电源控制语音识别单元接收到第二电源控制信号,则主控制单元将电子装置的模式从待机模式转换到工作模式。
2.如权利要求1所述的装置,其中,在确定了输入的语音是用于控制电子装置的电源的语音后,在经过了预定时间之后,所述电源控制语音识别单元再次关闭电源控制语音识别单元的电源。
3.如权利要求1所述的装置,还包括:
主语音识别单元,其识别通过语音输入单元接收到的用户语音,
其中,在工作模式下,主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。
4.如权利要求1所述的装置,其中,在确定了输入的语音不是用于控制电子装置的电源的语音后,如果在预定时间内没有再次输入用户语音,则电源控制语音识别单元再次关闭电源。
5.如权利要求1所述的装置,其中,所述电源控制语音识别单元仅存储与用于控制电子装置的电源的用户语音相对应的命令。
6.如权利要求1所述的装置,其中,当通过语音输入单元接收到的音频的音量与先前输入的音频的音量相比增加超过预定值时,所述语音感测单元感测到输入了用户语音。
7.如权利要求1所述的装置,其中,在电子装置的待机模式下,只有语音输入单元和语音感测单元被开启。
8.一种用于控制电子装置的电源的方法,包括:
通过语音感测单元感测在电子装置的待机模式下是否输入了用户语音;
如果感测到用户语音,则通过语音感测单元将第一电源控制信号发送到电源控制语音识别单元;
如果从语音感测单元接收到第一电源控制信号,则通过电源控制语音识别单元开启电源并执行与输入的用户语音有关的语音识别;
通过由电源控制语音识别单元识别输入的用户语音来确定输入的用户语音是否是用于控制电子装置的电源的用户语音;
如果确定输入的语音是用于控制电子装置的电源的用户语音,则通过电源控制语音识别单元将第二电源控制信号发送到主控制单元;以及
如果从电源控制语音识别单元接收到第二电源控制信号,则通过主控制单元将电子装置的模式从待机模式转换到工作模式。
9.如权利要求8所述的方法,还包括:
在确定了输入的语音是用于控制电子装置的电源的用户语音后,在经过了预定时间之后,再次关闭电源控制语音识别单元的电源。
10.如权利要求8所述的方法,还包括:
在工作模式下,通过主控制单元根据通过主语音识别单元识别的用户语音来控制电子装置。
11.如权利要求8所述的方法,还包括:
如果确定了输入的用户语音不是用于控制电子装置的电源的用户语音、而且在预定时间内没有再次输入用户语音,则再次关闭电源控制语音识别单元的电源。
CN201310082900.0A 2012-03-15 2013-03-15 使用语音识别控制电源的电子装置和方法 Active CN103310785B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261611175P 2012-03-15 2012-03-15
US61/611,175 2012-03-15
KR10-2012-0053407 2012-05-21
KR1020120053407A KR20130105219A (ko) 2012-03-15 2012-05-21 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법

Publications (2)

Publication Number Publication Date
CN103310785A CN103310785A (zh) 2013-09-18
CN103310785B true CN103310785B (zh) 2017-08-11

Family

ID=47844064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310082900.0A Active CN103310785B (zh) 2012-03-15 2013-03-15 使用语音识别控制电源的电子装置和方法

Country Status (3)

Country Link
US (1) US9190059B2 (zh)
EP (1) EP2639793B1 (zh)
CN (1) CN103310785B (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
TWI474317B (zh) * 2012-07-06 2015-02-21 Realtek Semiconductor Corp 訊號處理裝置以及訊號處理方法
JP5677650B2 (ja) * 2012-11-05 2015-02-25 三菱電機株式会社 音声認識装置
US10020008B2 (en) 2013-05-23 2018-07-10 Knowles Electronics, Llc Microphone and corresponding digital interface
WO2014189931A1 (en) 2013-05-23 2014-11-27 Knowles Electronics, Llc Vad detection microphone and method of operating the same
US9711166B2 (en) 2013-05-23 2017-07-18 Knowles Electronics, Llc Decimation synchronization in a microphone
US9609600B2 (en) * 2013-06-21 2017-03-28 Micron Electronics LLC Wireless communication system with enhanced power management
US9502028B2 (en) 2013-10-18 2016-11-22 Knowles Electronics, Llc Acoustic activity detection apparatus and method
US9147397B2 (en) 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
KR102345611B1 (ko) * 2013-11-18 2021-12-31 삼성전자주식회사 디스플레이 장치 및 제어 방법
US20150142441A1 (en) * 2013-11-18 2015-05-21 Samsung Electronics Co., Ltd. Display apparatus and control method thereof
WO2015094369A1 (en) * 2013-12-20 2015-06-25 Intel Corporation Transition from low power always listening mode to high power speech recognition mode
KR102179506B1 (ko) 2013-12-23 2020-11-17 삼성전자 주식회사 전자장치 및 그 제어방법
US9516165B1 (en) * 2014-03-26 2016-12-06 West Corporation IVR engagements and upfront background noise
CN106062661B (zh) * 2014-03-31 2021-09-07 英特尔公司 用于常开常听的语音识别系统的位置感知功率管理方案
US9549273B2 (en) 2014-08-28 2017-01-17 Qualcomm Incorporated Selective enabling of a component by a microphone circuit
EP2999199B1 (en) 2014-09-16 2018-03-07 Nxp B.V. Mobile device
KR102306537B1 (ko) 2014-12-04 2021-09-29 삼성전자주식회사 소리 신호를 처리하는 방법 및 디바이스.
FR3030177B1 (fr) 2014-12-16 2016-12-30 Stmicroelectronics Rousset Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement
CN104598192B (zh) * 2014-12-29 2018-08-07 联想(北京)有限公司 信息处理方法及电子设备
TW201640322A (zh) 2015-01-21 2016-11-16 諾爾斯電子公司 用於聲音設備之低功率語音觸發及方法
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
CN104866067A (zh) * 2015-05-11 2015-08-26 联想(北京)有限公司 一种低功耗控制方法及电子设备
US9478234B1 (en) 2015-07-13 2016-10-25 Knowles Electronics, Llc Microphone apparatus and method with catch-up buffer
KR102591413B1 (ko) * 2016-11-16 2023-10-19 엘지전자 주식회사 이동단말기 및 그 제어방법
CN108663942B (zh) * 2017-04-01 2021-12-07 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN107146617A (zh) * 2017-06-15 2017-09-08 成都启英泰伦科技有限公司 一种新型语音识别设备及方法
CN107358954A (zh) * 2017-08-29 2017-11-17 成都启英泰伦科技有限公司 一种实时更换唤醒词的设备及方法
KR102338376B1 (ko) * 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
KR102527278B1 (ko) * 2017-12-04 2023-04-28 삼성전자주식회사 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
CN108055617B (zh) * 2017-12-12 2020-12-15 广东小天才科技有限公司 一种麦克风的唤醒方法、装置、终端设备及存储介质
CN111123799A (zh) * 2019-12-31 2020-05-08 蔚蓝计划(北京)科技有限公司 一种语音垃圾桶及其省电控制方法、装置和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226090A (en) * 1989-12-29 1993-07-06 Pioneer Electronic Corporation Voice-operated remote control system
US5983186A (en) * 1995-08-21 1999-11-09 Seiko Epson Corporation Voice-activated interactive speech recognition device and method
US7418392B1 (en) * 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
WO2012025784A1 (en) * 2010-08-23 2012-03-01 Nokia Corporation An audio user interface apparatus and method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US6188986B1 (en) * 1998-01-02 2001-02-13 Vos Systems, Inc. Voice activated switch method and apparatus
US20020116196A1 (en) * 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US20060287864A1 (en) * 2005-06-16 2006-12-21 Juha Pusa Electronic device, computer program product and voice control method
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226090A (en) * 1989-12-29 1993-07-06 Pioneer Electronic Corporation Voice-operated remote control system
US5983186A (en) * 1995-08-21 1999-11-09 Seiko Epson Corporation Voice-activated interactive speech recognition device and method
US7418392B1 (en) * 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
WO2012025784A1 (en) * 2010-08-23 2012-03-01 Nokia Corporation An audio user interface apparatus and method

Also Published As

Publication number Publication date
US20130246071A1 (en) 2013-09-19
US9190059B2 (en) 2015-11-17
EP2639793A1 (en) 2013-09-18
CN103310785A (zh) 2013-09-18
EP2639793B1 (en) 2016-04-20

Similar Documents

Publication Publication Date Title
CN103310785B (zh) 使用语音识别控制电源的电子装置和方法
KR102029820B1 (ko) 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법
US10418027B2 (en) Electronic device and method for controlling the same
CN104881276B (zh) 动态命令歧义消除
EP2941895B1 (en) Display apparatus and method of controlling a display apparatus in a voice recognition system
KR102426717B1 (ko) 발화 인식 모델을 선택하는 시스템 및 전자 장치
CN106575293A (zh) 孤立话语检测系统和方法
CN105635777A (zh) 用于登记用户命令的显示装置和方法
US11048293B2 (en) Electronic device and system for deciding duration of receiving voice input based on context information
CN104282302A (zh) 用于识别语音和文本的设备和方法
EP3608906A1 (en) System for processing user voice utterance and method for operating same
US11495223B2 (en) Electronic device for executing application by using phoneme information included in audio data and operation method therefor
US10950221B2 (en) Keyword confirmation method and apparatus
KR102594838B1 (ko) 사용자 발화에 응답하여 통화를 포함하는 태스크를 수행하는 전자 장치 및 그 동작 방법
US11361750B2 (en) System and electronic device for generating tts model
JP2008257566A (ja) 電子機器
KR102617265B1 (ko) 사용자 음성 입력을 처리하는 장치
KR20190134107A (ko) 사용자의 음성을 처리하는 전자 장치를 포함하는 시스템 및 전자 장치의 음성 인식 제어 방법
CN113470649A (zh) 语音交互方法及装置
CN111222334A (zh) 命名实体识别方法、装置、设备及介质
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
CN104699668A (zh) 确定词语相似度的方法及装置
KR102124396B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
US11450325B1 (en) Natural language processing
JP7018850B2 (ja) 端末装置、決定方法、決定プログラム及び決定装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant