CN1582545A - 利用脚本信息识别和查明节目的广告部分的方法 - Google Patents

利用脚本信息识别和查明节目的广告部分的方法 Download PDF

Info

Publication number
CN1582545A
CN1582545A CNA028220293A CN02822029A CN1582545A CN 1582545 A CN1582545 A CN 1582545A CN A028220293 A CNA028220293 A CN A028220293A CN 02822029 A CN02822029 A CN 02822029A CN 1582545 A CN1582545 A CN 1582545A
Authority
CN
China
Prior art keywords
period
advertising segment
word
pause
during
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028220293A
Other languages
English (en)
Inventor
L·A·阿格尼霍特里
N·蒂米特罗瓦
T·F·M·麦格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1582545A publication Critical patent/CN1582545A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/72Systems specially adapted for using specific information, e.g. geographical or meteorological information using electronic programme guides [EPG]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/48Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side

Abstract

广告需要在较短的时间段中传递他们的消息。这就导致在商业广播中频繁重复产品名称、公司名称和其它标识特征。脚本信息能通过检测在广告中频繁出现的词语而用于检测广告。这也能用来将个别广告与其它广告区分开。一旦各个广告已经被识别,就可以将对应于每个广告的脚本信息存储在数据库中,以识别随后广播中的广告,或者提供用于在数据库中搜索特定广告的搜索机制。

Description

利用脚本信息识别和查明节目的广告部分的方法
发明背景
发明领域
本发明涉及一种用于识别和查明的在诸如广播电视节目的节目期间广告的方法和电视观看系统,更具体来说涉及利用脚本信息识别和查明广播电视节目期间的广告的方法。
相关技术说明
存在这样的电视观看系统,它能自动地检测电视信号的被选择的片段,诸如商业广告或节目中不希望要的部分。这些广告检测系统通常被用来在节目中出现不希望要的部分时将电视广播的声频部分消音,或者用于控制视频播放器在录制或回放期间跳过节目的不希望要的部分。尽管已经开发了各种各样的技术用于检测电视节目的被选择的部分,现有技术的系统都不监测电视节目的脚本信息(例如闭路字幕(closed captioned)信息),以识别和查明在节目期间出现的广告部分。此外,现有技术的系统都不识别、划分(segment)和存储在节目的广告片段期间出现的单独广告供以后使用,例如用于建立一个广告库,以便识别随后的电视广播的相应的广告部分。
发明目的和概要
因此,本发明的一个目的是提供一种识别和查明广播节目的广告部分的方法。
本发明的另一个目的是提供一种监测与广播节目对应的脚本信息以识别和查明该广播节目的广告部分的方法。
本发明的另一个目的是提供一种通过分析与广播节目相关联的脚本信息以识别、划分和查明在广播节目的广告片段期间所广播的单独广告的方法。
本发明的另一个目的是提供一种能克服已知的广告检测方法的固有缺点的识别和查明广播节目的广告部分的方法。
本发明的另一个目的是提供一种识别和查明在节目期间出现的广告片段的电视观看系统。
按照本发明的一种形式,一种识别节目期间的广告片段的方法包括以下步骤:使用与节目相关联的脚本信息,检测在第一时段期间脚本信息中出现次数超过预定数目的“非停顿”(non-stop)词语,检测在第二时段期间脚本信息中出现次数超过预定数目的“非停顿”词语,以及比较在第一时段期间检测到的非停顿词语与在第二时段期间检测到的“非停顿”词语。
按照本发明的另一种形式,一种查明和存储在节目期间出现的广告片段的方法包括以下步骤:识别在节目期间出现的一个可能的(possible)广告片段,把该可能的广告片段的“非停顿”词语与以前识别过的很可能的(probable)广告片段的列表中每一个片段的“非停顿”词语作比较,以确定至少一个匹配的很可能的广告片段,比较该可能的广告片段的脚本文本与该至少一个匹配的很可能的广告片段的脚本文本,存储该可能的广告片段与该至少一个匹配的很可能的广告片段二者共同的脚本文本,将该至少一个匹配的存储的很可能的广告片段从该很可能的广告片段的列表中删除,以及将该至少一个匹配的很可能的广告片段添加到一个候选广告片段的列表中。
按照本发明的另一种形式,一种查明和存储在节目期间出现的广告片段的方法包括以下步骤:识别在节目期间出现的一个可能的广告片段,比较该可能的广告片段的“非停顿”词语与以前识别的候选广告片段的列表中的每个片段的“非停顿”词语,以确定至少一个匹配的候选广告片段,比较该可能的广告片段的脚本文本与该至少一个匹配的候选广告片段的脚本文本,存储该可能的广告片段与该至少一个匹配的候选广告片段二者共同的脚本文本,将该至少一个匹配的候选广告片段从该候选广告片段的列表中删除,以及将该至少一个匹配的候选广告片段添加到一个已找到的广告片段的列表中。
按照本发明的另一种形式,一种查明和存储在节目期间出现的广告片段的方法包括以下步骤:识别在节目期间出现的一个可能的广告片段,比较该可能的广告片段的“非停顿”词语与一个以前识别的已找到的广告片段的列表中的每个片段的“非停顿”词语,以确定至少一个匹配的已找到的广告片段,比较该可能的广告片段的脚本文本与该至少一个匹配的已找到的广告片段的脚本文本,存储该可能的广告片段与该至少一个匹配的已找到的广告片段二者共同的脚本文本,以及使指示该至少一个匹配的已找到的广告片段的出现频率的计数器递增。该方法也进一步包括将该已找到的广告片段添加到一个已找到的广告的列表中。
按照本发明的另一种形式,一种检索一个存储的广告片段的方法包括以下步骤:识别至少一个表示所希望要的广告片段的非停顿词语,识别与所识别的非停顿词语对应的已存储的广告片段,以及输出与所识别的非停顿词语相对应的已识别的存储的广告片段。该方法进一步包括将所识别的存储的广告片段标记为广告区。
按照本发明的另一种形式,一种识别节目期间的广告片段的电视观看系统包含:用于接收与节目相关联的脚本信息的装置;用于检测在第一时段期间脚本信息中出现次数超过预定数目的“非停顿”词语的装置;用于检测在第二时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;以及用于比较在第一时段期间检测到的非停顿词语与在第二时段期间检测到的“非停顿”词语的装置。
按照本发明的另一种形式,一种查明和存储在节目期间出现的广告片段的电视观看系统包含:用于识别在节目期间出现的一个可能的广告片段的装置;用于比较该可能的广告片段的“非停顿”词语与一个以前识别的很可能的广告片段的列表中的每个片段的“非停顿”词语以确定至少一个匹配的很可能的广告片段的装置;用于比较该可能的广告片段的脚本文本与该至少一个匹配的很可能的广告片段的脚本文本的装置;用于存储该可能的广告片段与该至少一个匹配的很可能的广告片段二者共同的脚本文本的装置;用于将该至少一个匹配的存储的很可能的广告片段从该很可能的广告片段的列表中删除的装置;以及用于将该至少一个匹配的很可能的广告片段添加到候选广告片段的列表和已找到的广告片段的列表的至少之一中的装置。
本发明的上述和其它目的、特点和优点,将在以下要参照附图而阅读的对本发明的详细说明中变得非常明显。
附图说明
图1是按照本发明的利用脚本信息识别节目的广告部分的方法的流程图;
图2是按照本发明的利用脚本信息识别节目的广告部分的方法的流程图,图2是图1的继续;
图3是按照本发明的查明节目的广告部分的方法的流程图。
具体实施方式
现在参看各附图,图中示出了按照本发明的利用脚本信息识别和查明节目中的广告部分的方法。术语“脚本信息”用来表示通常与视频节目的传输(声频/数据/视频)信号一起提供的、对应于视频节目的口述的(spoken)或非口述的(non-spoken)事件的文本-例如闭路字幕文本,或者像EPG(电子节目指南)数据那样的其它文本源。脚本信息能从视频文本或屏幕文本中(例如通过检测视频的字幕(subtitle))获得,或者通过对提取的文本应用光学字符识别(OCR)而获得,例如在美国专利文件“Video Stream Classification System IsolationMethod and System”(视频流分类系统的分离方法和系统)(美国专利申请号09/441,943,申请日1999-11-17)和美国专利文件“Symbol Classification With Features Applied to a NeuralNetwork”(用于神经网络的带特征符号分类)(美国专利申请号09/441,949,申请日1999-11-17)公开了上述技术,在此全文引用这两个专利申请作为参考。
如果声频/数据/视频信号不包括一个文本部分(即,不包括脚本信息),则可以用现有技术中已知的诸如语音-文本转换等技术来生成脚本信息(如果存在字幕,则采用利用OCR的字幕识别来生成脚本信息)。脚本信息也可以从第三方来源—例如通过因特网的电视指南—获得。
本发明所根据的知识是:节目的脚本信息能够用诸如关键词检索和统计文本标引和检索等已知的检索技术进行检索和分析。总的来说,该用于广告片段识别的方法包括分析对应于某节目(声频、视频、数字之类)的脚本信息,确定该节目的一个广告部分的开始(或者如下文详细说明的那样通过识别脚本信息中的“进入广告”的提示而确定该节目的一个非广告部分的结尾)。一旦该节目的一个广告部分的开始被识别,该方法分析该脚本信息,以单独地识别在所识别的节目的广告部分内含有的个别广告。然后将个别地识别的广告的特征(signa ture)与在数据库中作为单独的实体存储的、以前识别的(以前存储的)广告片段的特征进行比较,以识别该广告片段的特定广告部分。一旦广告片段已经被存储在数据库中,用户就能访问数据库,以搜索某个特定的广告。作为前述方法的替代,可以用任何基于声频/视频特征的标准广告检测技术来尝试性地确定广告区,这些技术例如在以下专利申请中公开:美国专利文件“Automatic Signature-BaseSpotting,Learning and Extracting of Commercials and OtherVideo Content”(广告和其它视频内容的基于信号的自动认定、查明和抽取)(美国专利申请号09/417,288,申请日1999-10-13,发明人Dimitrova、McGee和Agnihotri)和美国专利文件“Apparatus andMethod for Locating a Commercial Disposed Within a Video DataStream”(找出分布在视频数据流中的广告的设备和方法)(美国专利申请号09/123,444,申请日1998-7-28,发明人Dimitrova、McGee、Elenbaas、Leyvi、Ramsey和Berkowitz)公开了上述技术,在此全文引用这两项专利申请作为参考。
首先参看图1,图中显示本发明的一个优选实施例。该方法包括确定对于所接收的(声频/数据/视频)节目信号是否有EPG(电子节目指南)数据可用(步骤8)。如果没有EPG数据可用(步骤8中的否),该方法继续执行步骤62(见图2)。如果有EPG数据可用(步骤8中的是),该方法确定所接收的节目(声频/数据/视频)信号是否包括该节目的娱乐(非广告)部分和广告部分的脚本信息(步骤10)。如果所接收的节目信号不包括用于娱乐和广告部分的脚本信息,且该脚本信息不能从第三方来源获得,则本发明方法采用已知的语音-文本转换技术来提供必需的脚本信息。如果节目信号包括用于节目的娱乐部分的脚本信息但是不包括用于节目的广告部分的脚本信息(步骤10中的否),并且如果不能从第三方来源获得用于节目的广告部分的脚本信息,则将节目的不包括脚本信息的各部分标记为非节目区(即广告区)(步骤12)。然后运用语音-文本转换(步骤14)为非节目区生成必需的脚本信息。
如果节目信号包括用于节目的娱乐和广告部分的脚本信息(步骤10中的是),则从节目信号中抽取脚本信息(步骤16)。然后对EPG数据信号进行分析,以确定节目的类型(例如脱口秀、新闻节目等等)。可以采用其它的节目类型确定方法,诸如在下述专利申请中公开的那些分析脚本信息而获得节目类型提示的方法:美国专利文件“Apparatus and Method of Program Classification UsingObserved Cues in the Transcript Information”(使用在脚本信息中观察到的提示对节目分类的设备和方法)(美国专利申请号09/739,476,申请日2000-12-18,发明人Kavitha Devara)和美国专利文件“ Apparatus and Method for the Summarization andIndexing of Video Programs Using Transcript Information”(利用脚本信息概括和标引视频节目的设备和方法)(美国专利申请号09/721,681,申请日2000-11-14,发明人Lalitha Agnihotri,Kavitha Devara,和Nevenka Dimitrova),在此全文引用这两项专利申请作为参考。
如果EPG数据指示该节目是那种在口述文本中对广告出现会提供提示的类型(诸如新闻节目或脱口秀),则将这个事实记录下来(步骤22)。新闻节目或脱口秀用诸如“当我们回来时”(when we come back)、“后面的内容是”(still ahead)、“这些消息之后”(after thesemessages)、“插播广告之后”(after the commercial break)和“下面紧接着”(up next)等短语来对广告的出现提供提示。如果这些短语在脚本信息中被识别,则接着马上要播广告就有高度的确定性。如果节目是脱口秀或新闻节目(步骤22中的22),则监测脚本信息中的对广告的出现的提示(步骤24)。如果监测到一个广告提示,则将该区标记为节目的广告片段的开始(步骤26)。然后,就监测脚本信息在第一时段中其出现次数超过预定阈值的“非停顿”词语(步骤30)。应当注意的是,当新闻节目或脱口秀的主持人说“欢迎回来”(welcomeback)之类的话时,新闻节目和脱口秀也就在文本中提供了关于从广告插播返回到正常节目的提示。如果这些短语在脚本信息中被识别,则很可能广告片段要结束。
非停顿词语是“an”、“the”、“of”等以外的词语。发明人发现广告主希望在很短的时段内传递他们的消息。在加标记的(labeling)广告中我们能认识到品牌名称/数据库辅助手段(database aids)。这导致产品名称、公司名称和其它识别特征在一个广告片段中被频繁重复。如果非停顿词语(对于被广告的产品来说是共同的)在节目期间中的较短时段内出现大量的次数,这就是广告的表征。在一个实施例中,该时段是15秒钟,该方法确定非停顿词语在这个时段内被提及的次数是否多于一次。
如果在步骤30中识别到超过预定阈值的非停顿词语(步骤30中的X>1),则该脚本文本在第二个时段再作检测(该时段最好与在前的时段重叠),并将在第二个时段内出现次数超过预定数目的非停顿词语记录下来(步骤32)。如果至少一个非停顿词语出现的次数超过预定的数目(步骤32中的X>1),则判断当前时段的非停顿词语是否与在前时段的非停顿词语相符(步骤36)。
如果在当前时段中识别的非停顿词语与在在前时段中识别的非停顿词语不相符(就是说,它们没有至少一个共同的非停顿词语)(步骤36的否),则当前的和在前的时段不是同一广告片段的一部分(步骤38),于是将当前时段的开始标记为一个新的广告片段的开始(步骤40)。之后,该脚本文本在下一个时段被检测(该时段至少与在前的时段重叠),并将出现次数超过预定数目的非停顿词语记录下来(步骤42)。
如果在步骤42中识别到超过预定阈值的非停顿词语(步骤42中的X>1),则判断当前时段的非停顿词语是否与在前时段的非停顿词语相符(步骤46)。如果当前时段的非停顿词语与在前时段的非停顿词语相符(步骤46的是),则将当前时段是与在前时段的相同的广告片段的一部分这个事实记录下来(步骤48)。之后,判断当前脚本信息是否对应于向节目的非广告部分的返回(步骤50)。如果确定当前脚本信息对应于向节目的非广告部分的返回(步骤50中的是)(例如节目主持人说“欢迎回来”),该方法返回到步骤24。然而,如果判定当前脚本信息不表示向节目的非广告部分的返回(步骤50中的否),则该方法返回到步骤32,以监测脚本信息一个新的时段。
如果在步骤36确定当前时段的非停顿词语与一个在前时段的非停顿词语相符(步骤36中的是),则就确定了该在前时段和当前时段是相同广告片段的一部分(步骤52)。然后,检测下一个时段的该脚本文本,该时段最好至少与该在前时段重叠。将出现次数超过预定数目的非停顿词语记录下来(步骤54)。
如果在当前时段中非停顿词语出现的次数超过预定数目(步骤54中X>1),则判断当前时段的非停顿词语是否与在前时段的非停顿词语相符(步骤58)。如果当前时段的非停顿词语不与任何一个在前时段的非停顿词语相符(步骤58的否),则将当前时段的开始标记为一个新的广告片段的开始(步骤60)。之后,该方法返回到步骤32。
如果在当前时段所确定的非停顿词语与在前时段中之一个时段的非停顿词语相符(步骤58中的是),则将该当前时段是与具有相同非停顿词语的对应在前时段的同一广告的一部分这一事实记录下来(步骤62)。然后判断当前脚本信息是否是要返回到节目的非广告部分的表征(步骤50)。如果判定当前脚本信息是向节目的非广告部分返回的表征(步骤50中的是),该方法返回到步骤24。然而,如果判定当前脚本信息不是向节目的非广告部分返回的表征(步骤50中的否),该方法返回到步骤32。
现在返回到步骤8,如果判定没有EPG数据可用(步骤8中的否),则该方法继续执行图2中所示的步骤63。类似地,如果在步骤22判定当前的节目不是脱口秀、新闻节目或其他提供指示节目的广告片段的开始的广告提示的节目(步骤22中的否),则该方法继续执行图2中所示的步骤63。
现在转看图2,如果广告片段的开始既不能通过广告提示也不能通过EPG数据得到识别,则在特定的时段对节目的脚本信息继续监测,以识别出现的非停顿词语。然后记录在预定的时段内出现各非停顿词语每一个的出现次数(步骤63)。之后,判断所检测的非停顿词语在该时段内出现的次数是否超过预定的数目(步骤64)。如果非停顿词语在该时段内出现的次数没有超过预定的数目(步骤64中的否),则方法回到步骤63,在其中对脚本信息检测其非停顿词语。但是,如果非停顿词语在该时段内出现的次数超过预定的数目(步骤64中的是),则将对应于该时段的节目部分确定为一个广告片段的开始(步骤66)。之后,对脚本信息监测与在前时段重叠的下一个时段,并记录出现次数超过预定数目的非停顿词语(步骤68)。如果个别非停顿词语在该时段出现的次数超过预定的数目(步骤68中的X>1),则判断当前时段的非停顿词语是否与一个在前时段的非停顿词语相符(步骤72)。
如果当前时段的非停顿词语与该在前时段的非停顿词语不相符(步骤72中的否),则当前和在前时段不是同一广告片段的一部分(步骤74),于是将当前时段的开始标记为一个新的广告片段的开始(步骤76)。之后,在至少与在前时段相重叠的下一个时段内监测脚本信息,并且记录其出现次数超过预定阈值的非停顿词语(步骤78)。
如果在步骤78中识别到出现次数超过预定数目的非停顿词语(步骤78中的X>1),则判断当前时段的非停顿词语是否与在前时段的非停顿词语相符(步骤82)。如果当前时段的非停顿词语与在前时段的非停顿词语相符(步骤82中的是),则将当前时段是与在前时段的同一广告片段的一部分这个事实记录下来(步骤84)。之后,判断当前脚本信息是否对应于要返回到节目的非广告部分(步骤86)。如果确定当前脚本信息对应于要返回到节目的非广告部分(步骤86中的是)则该方法返回到步骤62。然而,如果判定当前脚本信息不表示返回到节目的非广告部分(步骤86中的否),则该方法返回到步骤68,监测脚本信息一个新的时段。
如果在步骤72中判定当前时段的非停顿词语与在前时段的非停顿词语相符(步骤72中的是),则确定该在前时段和当前时段是同一广告片段的一部分(步骤88)。然后,最好在至少与前时段相重叠的下一个时段上对脚本信息进行监测,并将出现次数超过预定数目的非停顿词语记录下来(步骤90)。如果在当前时段中非停顿词语出现的次数超过预定数目(步骤90中X>1),则对当前时段的非停顿词语是否与在前时段的非停顿词语相符作出判断(步骤94)。如果当前时段的非停顿词语与任何一个在前时段的非停顿词语不相符(步骤94的否)则将当前时段的开始标记为一个新的广告的开始(步骤98)。之后,该方法返回到步骤68。如果在当前时段所确定的非停顿词语与在前时段中的非停顿词语相符(步骤94中的是),则将该当前时段是与具有相同非停顿词语的在前时段的同一广告的一部分这一事实记录下来(步骤96)。然后判断当前脚本信息是否是要返回到节目的非广告部分的表征(步骤86)。如果判定当前脚本信息对应于要返回到节目的非广告部分的表征(步骤86中的是),该方法返回到步骤62。然而,如果判定当前脚本信息不是向节目的非广告部分的返回的表征(步骤86中的否),则该方法返回到步骤68。
根据以上分析,如果非停顿词语在给定时段出现多次,并且相同的词语出现在例如下两个重叠的时段,该方法就把从第一时段的开始到第三时段的结尾的脚本文本作为一个可能的广告存储起来。此外,如果某些词语在第三时段出现多次,并且还继续出现一直到第六时间段,则本方法就把从第三时段的开始到第六时段的结尾的脚本文本作为下一个广告存储起来。下一次观察到类似的关键词语时,则可以用(下文解释的)一个子段匹配方法将当前可能的广告与被存储的这两个广告匹配。这将使一个文本与其它可能的广告文本的重叠部分相匹配。假设当前广告是被与在前出现的该同一广告的不同广告所包围,则下一次该广告出现时,只有这两段的中心部分匹配当前广告。这就能够从所存储的广告中去除广告片段的无关部分,所剩下的只有主题广告。这可能仅包括第一时段的一部分、整个第二时段和第三时段的一部分,作为实际的广告。
作为本发明的结果,一个广播节目的多广告部分的各个广告可以用脚本信息被识别,并能被互相分开,单独地存储在存储器中,以用于各种用途,例如用于在节目期间识别各个广告,以及用于搜索特定类型的广告(汽车)或特定产品的广告(本田雅确(Honda Accord))。
根据对实际广播广告的分析,本发明人已经确定:如果非停顿词语在预定时段(15秒)内出现至少三次,这就是广告出现的表征。发明人已经发现,在任何15秒的间隔期间内,非停顿词语在节目的非广告部分出现的次数不大可能超过3次。
以下文本是从David Letterman主持的包含两个广告的Late-Night Show节目中抽取的闭路字幕文本。
1367275    I’ll tell you what,ladies and
1368707    gentlemen,when we come back
1369638    we’ll be playing here.
1373075    (cheers and applause)
1374847    (band playing)of using a dandruff shampoo
1426340    Note how isolated it makes people feel.
1430736    Note its unpleasant smell,the absence of richlather.
1433842    Note its name.Nizora a-d.
1437276    The world’s #1 prescribed ingredient fordandruff...
1440019    In non-prescription strength.
1442523    People can stay dandruff free by doing this withnizoral a-d
1444426    only twice a week.
1447560    Only twice a week.What a pity.
1449023    Nizora a-d
1451597    I see skies of blues
1507456    and clouds of white
1509419    the bright,blessed day
1512724    the dogs say good night
1515728    and I think to myself...
1518432    Discover estee lauder pleasures
1520105    and lauder pleasures for men.
1521937    Pleasure to go.For her.
1524842    For him.
1526674    Each set free with a purchase
1527806    of estee lauder pleasures
1528947    of lauder pleasures for men.
1530450    ...Oh,yeah.
1532052
1534155
1566922    (Band playing)
l586770    >>dave:It’s flue shot Friday.
1587572    You know,I’d like to take a
1588473    minute here to mention the...
闭路字幕文本展示了本发明的有效性,其中词语“Nizoral”、“A-D”、“dandruff”、和“shampoo”在时间戳1374847与1449032之间的第一个广告(15秒)片段中出现至少三次。此外,词语“lauder”和“pleasures”在时间戳1451597与1528947之间第二个广告中出现三次以上。这所根据的事实是,广告主想要在短时间内传达他们的消息,因此必须频繁地向听众重复产品名称、公司和产品的其它标识特征,以便在短时间内传达所希望的消息和信息。通过检测脚本信息中的这些非停顿词语在预定时段内的出现,各个广告就能被检测到并被互相分开。
在节目的广告部分已经被识别后,最好将广播的广告部分内的各个广告相互分开,并存储在存储器/数据库中,供以后在存储这各个广告的存储器/数据库内检索(例如,这样用户就能通过搜索广告存储器/数据库来检索汽车广告),以向用户提供符合用户要求的广告。
现在转至图3,图中显示了用于查明广告的方法,其中存储所识别的广告的存储器/数据库包括被存储在找到的广告列表中的、候选广告列表中的和很可能的广告的列表中的广告片段。
首先,进行对一个新广告区的搜索(步骤120)。对广告区的搜索,可以对应于上述的图1和2中所示的方法,或者如下列专利所公开的其它已知的广告检测方法:美国专利文件“Apparatus and Method forLocating a Commercial Disposed Within a Video Data Stream”(找到分布在视频数据流中的广告的设备和方法)(美国专利申请号09/123,444,申请日1998-7-28,发明人Nevenka Dimitrova、ThomasMcGee、Herman Elenbaas、Eugene Leyvi、Carolyn Ramsey和DavidBerkowitz)公开了上述技术,在此全文引用该专利申请作为参考。然后对是否检测到一个新的广告区作出判断(步骤122)。如果检测不到新的广告区(步骤122中的否),则该方法返回到步骤120,继续搜索新的广告区。然而,如果找到新的广告区(步骤122中的是),则将对应于该广告区中其出现次数超过预定数目的非停顿词语与“已找到的”广告列表的一部分的广告中非停顿词语进行比较。已找到的广告列表对应于已经被识别两次以上的广告,因此该“非停顿”词语和被存储的脚本文本的正确性就存在着高度的确定性。如果在新广告区的非停顿词语与找到的广告列表中的所列的广告之一的非停顿词语之间识别到一个匹配(步骤126中的YES),则递增对应于所识别的广告的计数器,以指示有一个仍然在广播节目期间出现的活动广告(步骤128)。如果该计数器有一段时间(例如1个月)没有被递增,则将该广告和对应的非停顿词语和脚本文本从存储器中清除,因为该广告是不活动的。或者,可以将该广告无限期地保留在数据库中。
如果新广告区的非停顿词语与已找到的广告列表中含有的广告的非停顿词语不对应(步骤126中的否),则在新广告区的非停顿词语与候选广告列表中的广告的非停顿词语之间进行比较(步骤130)。如果新广告区的非停顿词语与候选广告列表中的至少一个广告的非停顿词语匹配(步骤132中的是),则把在候选列表中已识别的广告从候选列表中删除,并与对应的非停顿词语和脚本文本一起转移到已找到的广告列表中(步骤134)。然而,如果新广告区的非停顿词语与候选广告列表中含有的广告的非停顿词语不匹配(步骤132中的否),则在新广告区的非停顿词语与很可能的广告列表中含有的非停顿词语之间进行比较(步骤136)。如果发现在新广告区的非停顿词语与很可能的广告列表中含有的广告之一的非停顿词语之间有一个匹配(步骤138中的是),则将在很可能的列表中所识别的广告从很可能的列表中删除,并转移到候选广告列表中(步骤140)。然而,如果在新广告区的非停顿词语与很可能的广告列表中所含有的各广告之一的非停顿词语之间得不到匹配,则将包括所识别的非停顿词语的新广告区和脚本文本存储在很可能的广告列表中。
从图3中所示的方法看来,每当检测到一个新的潜在的广告区,就将在脚本信息中所识别的非停顿词语与以前所识别的已找到的广告列表中的、候选广告列表中的、和很可能的广告列表中的非停顿词语进行比较。如果该新的潜在广告的非停顿词语与在已找到的广告列表中、候选广告列表中、或很可能的广告列表中所识别的非停顿词语不匹配,则将该新的潜在广告添加到很可能的广告列表中。就是说,将该新的潜在广告的非停顿词语以及一个新的潜在广告的实际脚本添加到很可能的广告列表中。然而,如果该新的潜在广告的有些非停顿词语与在已找到的广告列表、候选广告列表、或很可能的广告列表中至少一种表中所识别的非停顿词语匹配,则将该新的潜在广告和广告列表中匹配的广告的脚本文本用一种近似匹配技术进行比较,该近似匹配技术例如是近似串匹配“Shift-Or Algorithm”(移位-或算法),它发表在:Computer Science and Engineering Handbook,(计算机科学和工程手册),186-192页,作者Allen C.Tucker,其公开内容在此引用作为参考。“Shift-Or Algorithm”说明了脚本文本因是从多个来源获得或生成的而可能引入到文本中的虚假特征(词语、短语、句子)。通过使用“Shift-Or Algorithm”,对新的潜在广告和由广告的列表所识别的广告来说是共同的脚本文本被保留,而不一致的文本则被忽略。一般来说,被忽略的文本在实际广告的开始或结尾处出现,这是由于没有非停顿词语或者由于这些部分属于一个与新识别的广告片段相邻的(邻接的)的广告片段。
重要的是要注意上述查明过程对于不含有“进入广告的提示”的节目是连续运行的。
本发明设计成要将脚本以及任选地将信号与广告一起存储在数据库中。也可以将系统连接到服务提供者(service provider),它下载当前广播的广告或提供对当前广播的广告的访问,或者将当前广告的存储器/数据库与系统相连以在系统的初始启动时提供广告知识。当用户需要检索特定类型的广告(例如汽车广告)时,用户可提供搜索参数,通过按顺序搜索已找到的列表、候选列表和很可能的列表,一个简单的串匹配操作就将检索出所需要的广告。此外,被存储的广告的脚本能被用作在以后的广播节目期间识别该广告的特征(signature)。特征也可以被广告主用来保证他们的广告已经被播出。
应当提及的是,监测非停顿词语的时段可以是任何希望的长度。由于广告一般只有15-30秒长,一经发现这样的时段最好应是15秒的延续时间。尽管预见到各时段不必重叠,但是已经确定重叠的时段是优选的。在一个例子中,第一时段覆盖从0秒到15秒的时间,第二时段覆盖从5秒到20秒的时间段,第三时段覆盖从10秒到25秒的时段,第四时段覆盖15秒到30秒的时段。用这种时段结构,就能提供对广告片段的开始和结尾的更确定的指示。如果确定第一、第二和第三时段有相同的非停顿词语,则将第一、第二和第三时段的脚本信息一起存储在数据库中。
应当注意到,应当将能够被连接在一起的时段的总数设定一个限度(大约等于1或2分钟),以便不会因某些词语或名称的重复而将整个节目存储起来。例如,由于广告很少会超过1分钟长,不会将如上所述的12个重叠的15秒时间窗口组合在一起作为一个可能的广告。
应当注意到,预期本发明能提供用户以用户可能有兴趣访问的、与被观看的广告有关的链接。例如,如果某用户正在观看某个汽车广告,可以向用户呈现贷款广告、汽车保险广告和/或其广告被存储在数据库中的汽车代理业务。
预期本发明装置也能包括一个广告和品牌名称的数据库。如果被数据库识别的某个品牌名称在预定的时段被多次提及,这就是广告出现的表征。广告和广告名数据库也能有助于将某个广告标记为用于某一特定产品的,并且有助于确定在一个给定的广告片段中有多少广告。
可以预见,节目的广告片段也能通过观察闭路字幕文本的每行长度(例如字数)而确定。系统能确定词语/行的连续平均(runningaverage)。如果在一个特定数目的行中字数超过连续平均,或者如果闭路字幕格式改变,这就是广告片段的表征。
至此结合附图说明了本发明的具体实施例,应当知道,本发明并不限于这些具体的实施例,本领域的熟练人员在不偏离由后附的权利要求书定义本发明的精神和范围的情况可以实现对这些实施例的各种改变和修改。

Claims (20)

1.一种识别节目期间的广告片段的方法,包括以下步骤:
a.使用与节目相关联的脚本信息;
b.检测在第一时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;
c.检测在第二时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;以及
d.比较在第一时段期间检测到的非停顿词语与在第二时段期间检测到的“非停顿”词语。
2.按照权利要求1的识别节目期间的广告片段的方法,进一步包含下列步骤:
检测在第三时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;
其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语不同,则第一时段是第一广告片段的表征,第二时段是第二广告片段的表征;
其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语中的至少一个与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语中的至少一个相同,则第一时段和第二时段是一个共同的广告片段的表征;
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语不同,则第三时段是一个与第一时段或第二时段的广告片段都不关联的广告片段的表征,和
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和第一时段期间中的至少一个期间检测到的出现次数超过预定数目的“非停顿”词语相同,则第三时段是一个与对应的第一或第二时段的广告片段相关联的广告片段的表征。
3.按照权利要求2的识别节目期间的广告片段的方法,其中,第二时段在时间上与第一时段重叠,第三时段在时间上至少与第二时段重叠。
4.按照权利要求1的识别节目期间的广告片段的方法,其中,如果在预定时段期间“非停顿”词语的出现次数至少等于一个预定值,则检测到一个广告片段的开始。
5.按照权利要求1的识别节目期间的广告片段的方法,进一步包含以下步骤:
接收包括脚本信息和电子节目指南(EPG)数据中至少一个的声频/数据/视频信号;和
分析脚本信息和电子节目指南(EPG)数据,以确定正在广播的节目的类型以及该正在广播的节目的类型是否包括“进入广告”和“退出广告”的提示。
6.按照权利要求1的识别节目期间的广告片段的方法,进一步包含以下步骤:
接收包括脚本信息和电子节目指南(EPG)数据中至少一个的声频/数据/视频信号;和
连续地在脚本信息中搜索一个广告片段的结尾,
其中,当已经识别到一个广告片段的开始或结尾时,存储插在该广告片段的开始与结尾之间的“非停顿”词语和脚本信息中至少一种。
7.一种查明和存储在节目期间出现的广告片段的方法,包括以下步骤:
a.识别在节目期间出现的一个可能的广告片段;
b.比较该可能的广告片段的“非停顿”词语与一个以前识别的很可能的广告片段的列表中的每一个的“非停顿”词语,以确定至少一个匹配的很可能的广告片段;
c.比较该可能的广告片段的脚本文本与该至少一个匹配的很可能的广告片段的脚本文本;
d.存储该可能的广告片段与该至少一个匹配的很可能的广告片段二者共同的脚本文本;
e.将该至少一个匹配的很可能的广告片段从该很可能的广告片段的列表中删除;以及
f.将该至少一个匹配的很可能的广告片段添加到候选广告片段的列表和已找到的广告片段的列表之一中。
8.按照权利要求7的查明和存储广告片段的方法,其中,如果不能识别很可能的广告片段的至少之一的“非停顿”词语与可能的广告片段的“非停顿”词语匹配,则该方法进一步包含:
将可能的广告片段添加到很可能的广告片段的列表中和将可能的广告片段与很可能的广告片段的列表进行比较这二这两个步骤中至少之一。
9.按照权利要求7的查明和存储广告片段的方法,其中步骤a包含以下步骤:
1.使用与节目相关联的脚本信息;
2.检测在第一时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;
3.检测在第二时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;以及
4.比较在第一时段期间检测到的非停顿词语与第二时段期间检测到的“非停顿”词语。
10.按照权利要求9的查明和存储广告片段的方法,其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语不同,则第一时段是第一广告片段的表征,第二时段是第二广告片段的表征;
其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语的至少一个与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语的至少一个是相同的,则第一时段和第二时段是一个共同广告片段的表征。
11.按照权利要求10的查明和存储广告片段的方法,进一步包含以下步骤:
检测在第三时段期间脚本信息中出现次数超过预定数目的“非停顿”词语,
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和在第一时段期间检测到的“非停顿”词语不同,则第三时段是一个与第一时段和第二时段的广告片段都不关联的广告片段的表征,和
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和第一时段期间中至少之一检测到的“非停顿”词语相同,则第三时段是一个与对应的第一或第二时段的广告片段相关联的广告片段的表征。
12.一种查明和存储在节目期间出现的广告片段的方法,包括以下步骤:
a.识别在节目期间出现的一个可能的广告片段;
b.把该可能的广告片段的“非停顿”词语与以前识别的已找到的广告片段列表中的每一个的“非停顿”词语作比较,以确定至少一个匹配的已找到的广告片段;
c.比较该可能的广告片段的脚本文本与该至少一个匹配的已找到的广告片段的脚本文本;
d.存储该可能的广告片段与该至少一个匹配的已找到的广告片段这二者共同的脚本文本;以及
e.使一个计数器递增,该计数器指示该至少一个匹配的已找到的广告片段的出现频率。
13.按照权利要求12的查明和存储广告片段的方法,其中,如果已找到的广告片段的至少一个的“非停顿”词语没有被识别为匹配该可能的广告片段的“非停顿”词语,则将该可能的广告片段的“非停顿”词语与一个候选广告片段列表的“非停顿”词语作比较;和
其中如果所存储的广告片段的至少一个的“非停顿”词语没有被识别为匹配该可能的广告片段的“非停顿”词语,则将该可能的广告片段添加到该很可能的广告片段列表。
14.一种检索一个存储的广告片段的方法,包括以下步骤:
a.识别至少一个表征需要的广告片段的非停顿词语;
b.识别与所识别的非停顿词语对应的存储的广告片段;以及
c.输出所识别的与至少一个所识别的非停顿词语相对应的存储的广告片段。
15.按照权利要求14的检索一个存储的广告片段的方法,进一步包括将所识别的存储的广告片段标记为广告区。
16.一种识别节目期间的广告片段的电视观看系统,包含:
用于接收与节目相关联的脚本信息的装置;
用于检测在第一时段期间脚本信息中出现次数超过预定数目的“非停顿”词语的装置;
用于检测在第二时段期间脚本信息中出现次数超过预定数目的“非停顿”词语;以及
用于比较在第一时段期间检测到的“非停顿”词语与在第二时段期间检测到的“非停顿”词语的装置。
17.按照权利要求16的电视观看系统,进一步包含:
用于检测在第三时段期间脚本信息中出现次数超过预定数目的“非停顿”词语的装置;
其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语不同,则第一时段是第一广告片段的表征,第二时段是第二广告片段的表征;
其中,如果在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语的至少一个与在第二时段期间检测到的出现次数超过预定数目的“非停顿”词语的至少一个相同,则第一时段和第二时段是一个共同广告片段的表征;
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和在第一时段期间检测到的出现次数超过预定数目的“非停顿”词语不同,则第三时段是一个与第一时段和第二时段的广告片段都不关联的广告片段的表征,和
其中,如果在第三时段期间检测到的出现次数超过预定数目的“非停顿”词语与在第二时段期间和第一时段期间中至少之一检测的出现次数超过预定数目的“非停顿”词语相同,则第三时段是一个与对应的第一或第二时段的广告片段相关联的广告片段的表征。
18.一种查明和存储在节目期间出现的广告片段的电视观看系统,包含:
用于识别在节目期间出现的一个可能的广告片段的装置;
用于比较该可能的广告片段的“非停顿”词语与一个以前识别的很可能的广告片段列表中的每一个的“非停顿”词语、以确定至少一个匹配的很可能的广告片段的装置;
用于比较该可能的广告片段的脚本文本与该至少一个匹配的很可能的广告片段的脚本文本的装置;
用于存储该可能的广告片段与该至少一个匹配的很可能的广告片段这二者共同的脚本文本的装置;
用于将该至少一个匹配的存储的很可能的广告片段从该很可能的广告片段列表中删除的装置;以及
用于将该至少一个匹配的很可能的广告片段添加到一个候选广告片段列表和一个已找到的广告片段列表中至少之一的装置。
19.一种查明和存储在节目期间出现的广告片段的电视观看系统,包含:
用于识别在节目期间出现的一个可能的广告片段的装置;
用于将该可能的广告片段的“非停顿”词语与一个以前识别的已找到的广告片段列表中的每一个的“非停顿”词语进行比较以确定至少一个匹配的已找到的广告片段的装置;
用于将该可能的广告片段的脚本文本与该至少一个匹配的已找到的广告片段的脚本文本进行比较的装置;
用于存储该可能的广告片段与该至少一个匹配的已找到的广告片段这二者共同的脚本文本的装置;以及
用于递增一个计数器的装置,该计数器指示该至少一个匹配的已找到的广告片段的出现频率。
20.一种检索一个存储的广告片段的电视观看系统,包含:
用于识别至少一个表征所需要的广告片段的“非停顿”词语的装置;
用于识别与所识别的“非停顿”词语相对应的存储的广告片段的装置;以及
用于输出所识别的与该至少一个所识别的“非停顿”词语相对应的存储的广告片段的装置。
CNA028220293A 2001-09-04 2002-09-03 利用脚本信息识别和查明节目的广告部分的方法 Pending CN1582545A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/945,871 US7089575B2 (en) 2001-09-04 2001-09-04 Method of using transcript information to identify and learn commercial portions of a program
US09/945,871 2001-09-04

Publications (1)

Publication Number Publication Date
CN1582545A true CN1582545A (zh) 2005-02-16

Family

ID=25483638

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028220293A Pending CN1582545A (zh) 2001-09-04 2002-09-03 利用脚本信息识别和查明节目的广告部分的方法

Country Status (6)

Country Link
US (1) US7089575B2 (zh)
EP (1) EP1433274A2 (zh)
JP (1) JP4216190B2 (zh)
KR (1) KR20040031047A (zh)
CN (1) CN1582545A (zh)
WO (1) WO2003021954A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984585A (zh) * 2011-09-20 2013-03-20 北京鹏润鸿途科技有限公司 一种确定广告视频的方法及装置
CN104185017A (zh) * 2013-05-23 2014-12-03 中国科学院深圳先进技术研究院 视频匹配方法和系统
CN112948636A (zh) * 2021-03-24 2021-06-11 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN113194332A (zh) * 2021-04-27 2021-07-30 北京市博汇科技股份有限公司 基于多策略的新广告发现方法、电子设备和可读存储介质

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809154B2 (en) 2003-03-07 2010-10-05 Technology, Patents & Licensing, Inc. Video entity recognition in compressed digital video streams
US7694318B2 (en) 2003-03-07 2010-04-06 Technology, Patents & Licensing, Inc. Video detection and insertion
US20050177847A1 (en) * 2003-03-07 2005-08-11 Richard Konig Determining channel associated with video stream
US7738704B2 (en) 2003-03-07 2010-06-15 Technology, Patents And Licensing, Inc. Detecting known video entities utilizing fingerprints
US7788696B2 (en) * 2003-10-15 2010-08-31 Microsoft Corporation Inferring information about media stream objects
WO2005046237A1 (en) * 2003-11-10 2005-05-19 Koninklijke Philips Electronics, N.V. Providing additional information
JP2008527888A (ja) 2005-01-14 2008-07-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 仮想ビデオチャネルを構築する方法及びシステム
US20060195860A1 (en) * 2005-02-25 2006-08-31 Eldering Charles A Acting on known video entities detected utilizing fingerprinting
US20060195859A1 (en) * 2005-02-25 2006-08-31 Richard Konig Detecting known video entities taking into account regions of disinterest
US7400364B2 (en) * 2005-04-26 2008-07-15 International Business Machines Corporation Sub-program avoidance redirection for broadcast receivers
US7690011B2 (en) 2005-05-02 2010-03-30 Technology, Patents & Licensing, Inc. Video stream modification to defeat detection
US20090103886A1 (en) * 2005-06-27 2009-04-23 Matsushita Electric Industrial Co., Ltd. Same scene detection method, device, and storage medium containing program
US9026511B1 (en) * 2005-06-29 2015-05-05 Google Inc. Call connection via document browsing
JP4187011B2 (ja) * 2006-06-01 2008-11-26 ソニー株式会社 情報処理システム、情報処理装置および方法、並びにプログラム
US8151291B2 (en) * 2006-06-15 2012-04-03 The Nielsen Company (Us), Llc Methods and apparatus to meter content exposure using closed caption information
KR100916717B1 (ko) * 2006-12-11 2009-09-09 강민수 플레이 되고 있는 동영상 내용 맞춤형 광고 콘텐츠 제공방법 및 그 시스템
US10489795B2 (en) * 2007-04-23 2019-11-26 The Nielsen Company (Us), Llc Determining relative effectiveness of media content items
US9848157B2 (en) 2007-08-28 2017-12-19 Cable Television Laboratories, Inc. Method of automatically switching television channels
US8302120B2 (en) * 2008-02-19 2012-10-30 The Nielsen Company (Us), Llc Methods and apparatus to monitor advertisement exposure
US8763024B2 (en) * 2008-04-23 2014-06-24 At&T Intellectual Property I, Lp Systems and methods for searching based on information in commercials
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US9026668B2 (en) 2012-05-26 2015-05-05 Free Stream Media Corp. Real-time and retargeted advertising on multiple screens of a user watching television
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US9386356B2 (en) 2008-11-26 2016-07-05 Free Stream Media Corp. Targeting with television audience data across multiple screens
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US8260055B2 (en) * 2009-03-27 2012-09-04 The Nielsen Company (Us), Llc Methods and apparatus for identifying primary media content in a post-production media content presentation
US8769584B2 (en) 2009-05-29 2014-07-01 TVI Interactive Systems, Inc. Methods for displaying contextually targeted content on a connected television
US10949458B2 (en) 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US10375451B2 (en) 2009-05-29 2019-08-06 Inscape Data, Inc. Detection of common media segments
US10116972B2 (en) 2009-05-29 2018-10-30 Inscape Data, Inc. Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US9055335B2 (en) 2009-05-29 2015-06-09 Cognitive Networks, Inc. Systems and methods for addressing a media database using distance associative hashing
US8930980B2 (en) * 2010-05-27 2015-01-06 Cognitive Networks, Inc. Systems and methods for real-time television ad detection using an automated content recognition database
US8925024B2 (en) 2009-12-31 2014-12-30 The Nielsen Company (Us), Llc Methods and apparatus to detect commercial advertisements associated with media presentations
US10192138B2 (en) 2010-05-27 2019-01-29 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
US9838753B2 (en) 2013-12-23 2017-12-05 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US8677385B2 (en) 2010-09-21 2014-03-18 The Nielsen Company (Us), Llc Methods, apparatus, and systems to collect audience measurement data
US20130100346A1 (en) * 2011-10-19 2013-04-25 Isao Otsuka Video processing device, video display device, video recording device, video processing method, and recording medium
US9069850B2 (en) * 2011-11-08 2015-06-30 Comcast Cable Communications, Llc Content descriptor
US8615161B2 (en) * 2011-12-02 2013-12-24 International Business Machines Corporation Optimizing recording space in digital video recording of television programs containing commercials
US9020817B2 (en) * 2013-01-18 2015-04-28 Ramp Holdings, Inc. Using speech to text for detecting commercials and aligning edited episodes with transcripts
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
CN108337925B (zh) 2015-01-30 2024-02-27 构造数据有限责任公司 用于识别视频片段以及显示从替代源和/或在替代设备上观看的选项的方法
CA2982797C (en) 2015-04-17 2023-03-14 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
WO2017011792A1 (en) 2015-07-16 2017-01-19 Vizio Inscape Technologies, Llc Prediction of future views of video segments to optimize system resource utilization
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
CN108293140B (zh) 2015-07-16 2020-10-02 构造数据有限责任公司 公共媒体段的检测
KR20180030885A (ko) 2015-07-16 2018-03-26 인스케이프 데이터, 인코포레이티드 미디어 세그먼트를 식별함에 있어 향상된 효율성을 위해 검색 인덱스를 나누는 시스템 및 방법
CN106776971A (zh) * 2016-12-05 2017-05-31 广州阿里巴巴文学信息技术有限公司 视频与电子书关联方法、设备、客户端设备和服务器
BR112019019430A2 (pt) 2017-04-06 2020-04-14 Inscape Data Inc sistema, método e produto de programa de computador
US10311874B2 (en) 2017-09-01 2019-06-04 4Q Catalyst, LLC Methods and systems for voice-based programming of a voice-controlled device

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4857999A (en) * 1988-12-20 1989-08-15 Peac Media Research, Inc. Video monitoring system
IT1254579B (it) * 1992-05-15 1995-09-28 Edico Srl Circuito per la ricezione di segnali televisivi con mezzi analizzatoridi caratteristiche.
AU5408894A (en) * 1992-10-30 1994-05-24 Roy J. Mankovitz Apparatus and methods for music and lyrics broadcasting
EP0618726B1 (en) * 1993-03-29 2001-11-28 S.I.SV.EL. S.p.A. Use of certification signals being included on a determined active line of a television signal for identifying a publicity insert contained in a television signal and control circuit for identifying publicity inserts according to such use
US5481296A (en) 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
DE4431383A1 (de) * 1994-08-29 1996-03-14 Kaiser Matthias Dr Schnittstelle zur Verarbeitung von Videotextdaten
US5835667A (en) 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
EP0757485B1 (en) * 1995-07-31 2008-03-05 Kabushiki Kaisha Toshiba Interactive television system
US5794249A (en) 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US6061056A (en) * 1996-03-04 2000-05-09 Telexis Corporation Television monitoring system with automatic selection of program material of interest and subsequent display under user control
US6002443A (en) * 1996-11-01 1999-12-14 Iggulden; Jerry Method and apparatus for automatically identifying and selectively altering segments of a television broadcast signal in real-time
US6771316B1 (en) * 1996-11-01 2004-08-03 Jerry Iggulden Method and apparatus for selectively altering a televised video signal in real-time
WO1998020675A1 (en) 1996-11-01 1998-05-14 Jerry Iggulden Method and apparatus for automatically identifying and selectively altering segments of a television broadcast signal in real-time
US6637032B1 (en) * 1997-01-06 2003-10-21 Microsoft Corporation System and method for synchronizing enhancing content with a video program using closed captioning
EP0903676A3 (en) 1997-09-17 2002-01-02 Sun Microsystems, Inc. Identifying optimal thumbnail images for video search hitlist
US6141678A (en) * 1998-04-29 2000-10-31 Webtv Networks, Inc. Presenting information relating to a program by recognizing text in closed captioning data
US6100941A (en) 1998-07-28 2000-08-08 U.S. Philips Corporation Apparatus and method for locating a commercial disposed within a video data stream
US6457010B1 (en) * 1998-12-03 2002-09-24 Expanse Networks, Inc. Client-server based subscriber characterization system
US7051351B2 (en) * 1999-03-08 2006-05-23 Microsoft Corporation System and method of inserting advertisements into an information retrieval system display
US20010003214A1 (en) * 1999-07-15 2001-06-07 Vijnan Shastri Method and apparatus for utilizing closed captioned (CC) text keywords or phrases for the purpose of automated searching of network-based resources for interactive links to universal resource locators (URL's)
US6708335B1 (en) * 1999-08-18 2004-03-16 Webtv Networks, Inc. Tracking viewing behavior of advertisements on a home entertainment system
US6704929B1 (en) * 1999-08-18 2004-03-09 Webtv Networks, Inc. Tracking viewing behavior of a home entertainment system
US6580437B1 (en) * 2000-06-26 2003-06-17 Siemens Corporate Research, Inc. System for organizing videos based on closed-caption information
US20030023972A1 (en) * 2001-07-26 2003-01-30 Koninklijke Philips Electronics N.V. Method for charging advertisers based on adaptive commercial switching between TV channels

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984585A (zh) * 2011-09-20 2013-03-20 北京鹏润鸿途科技有限公司 一种确定广告视频的方法及装置
CN102984585B (zh) * 2011-09-20 2015-09-23 北京鹏润鸿途科技有限公司 一种确定广告视频的方法及装置
CN104185017A (zh) * 2013-05-23 2014-12-03 中国科学院深圳先进技术研究院 视频匹配方法和系统
CN104185017B (zh) * 2013-05-23 2017-02-08 中国科学院深圳先进技术研究院 视频匹配方法和系统
CN112948636A (zh) * 2021-03-24 2021-06-11 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN112948636B (zh) * 2021-03-24 2022-09-27 黑龙江省能嘉教育科技有限公司 一种区域教育云资源共享系统及方法
CN113194332A (zh) * 2021-04-27 2021-07-30 北京市博汇科技股份有限公司 基于多策略的新广告发现方法、电子设备和可读存储介质
CN113194332B (zh) * 2021-04-27 2022-04-29 北京市博汇科技股份有限公司 基于多策略的新广告发现方法、电子设备和可读存储介质

Also Published As

Publication number Publication date
KR20040031047A (ko) 2004-04-09
EP1433274A2 (en) 2004-06-30
WO2003021954A2 (en) 2003-03-13
JP4216190B2 (ja) 2009-01-28
US7089575B2 (en) 2006-08-08
US20030050926A1 (en) 2003-03-13
JP2005502282A (ja) 2005-01-20
WO2003021954A3 (en) 2003-10-02

Similar Documents

Publication Publication Date Title
CN1582545A (zh) 利用脚本信息识别和查明节目的广告部分的方法
US9769545B2 (en) System and method for automatically authoring interactive television content
CN107124653B (zh) 电视用户画像的构建方法
US20040073919A1 (en) Commercial recommender
EP1138151B1 (en) Automatic signature-based spotting, learning and extracting of commercials and other video content
US20020078452A1 (en) Apparatus and method of program classification using observed cues in the transcript information
US20030093794A1 (en) Method and system for personal information retrieval, update and presentation
US20020092031A1 (en) System and method for generating metadata for programming events
US20020147782A1 (en) System for parental control in video programs based on multimedia content information
US20100161441A1 (en) Method and apparatus for advertising at the sub-asset level
CN1582576A (zh) 信息警报方法及系统
CN1441930A (zh) 通过时间分片进行文本的自动化分类的系统和方法
CN101286351A (zh) 生成流媒体增值描述文件及插播多媒体信息的方法、系统
CN101180633A (zh) 用于检测内容项目边界的方法和设备
Agnihotri et al. Summarization of video programs based on closed captions
CN1894964A (zh) 创建视听数据流的多媒体概要的方法和电路
KR20020074199A (ko) 프로그램들의 요약 및/또는 인덱싱
Hyder et al. TV ad detection using the Base64 encoding technique
Siddiqui et al. TV Ad Detection Using the Base64 Encoding Technique.
KR20100111907A (ko) 시청자 참여정보를 반영한 광고 제공장치 및 방법
WO2009126164A1 (en) Methods and apparatus to generate and use content- related watermarks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication