WO2009154241A1 - 検索式生成システム、検索式生成方法、検索式生成用プログラム、及び記録媒体 - Google Patents
検索式生成システム、検索式生成方法、検索式生成用プログラム、及び記録媒体 Download PDFInfo
- Publication number
- WO2009154241A1 WO2009154241A1 PCT/JP2009/061056 JP2009061056W WO2009154241A1 WO 2009154241 A1 WO2009154241 A1 WO 2009154241A1 JP 2009061056 W JP2009061056 W JP 2009061056W WO 2009154241 A1 WO2009154241 A1 WO 2009154241A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- search
- identifier
- input
- search expression
- structured document
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
Abstract
Description
次に、具体的な実施例を用いて、本発明の実施に好ましい形態の動作について説明する。図5は、本実施形態の検索生成システムを用いたHTML編集ルール記述システムの構成を示した図である。本実施例のHTML編集ルール記述システム500は、検索対象を指定するためのHTML510、HTML編集機能付きProxy580、HTML編集ルール記述機能付きブラウザ570、HTML編集ルール蓄積部560を有して構成される。
210 構造化文書
220,520 識別子付与部
230 識別子付き構造化文書
240 検索要素指定部
241,251 構造解析部
242,252 構造木蓄積部
250 検索式生成部
260 検索式蓄積部
500 HTML編集ルール記述システム
510 HTML
530 識別子付きHTML
560 HTML編集ルール蓄積部
570 HTML編集ルール記述機能付きブラウザ
580 HTML編集機能付きProxy
Claims (14)
- 構造化文書の要素に対して構造解析に依存しない属性として識別子を追加する識別子付与手段と、
前記識別子が付加された構造化文書を解析し、ユーザからの検索対象要素の入力を受け付け、入力された検索対象要素に追加された識別子を取得する検索要素指定手段と、
前記識別子が付加された構造化文書を解析し、前記検索要素指定手段から前記検索対象要素に対応する識別子の入力を受け付け、入力された識別子を用いて該解析された構造から検索対象要素を検索し、該検索対象要素の構造上の位置を示す検索式を生成する検索式生成手段と、
を有することを特徴とする検索式生成システム。 - 前記検索要素指定手段は、
前記識別子付与手段により識別子が追加された構造化文書を解析し、例示用構造木を作成する例示用構造解析手段を有し、
前記例示用構造解析手段で作成された例示用構造木をユーザに提示し、ユーザからの検索対象要素の入力を受け付けて該検索対象要素に追加された識別子を取得し、取得した識別子を前記検索式生成手段に入力することを特徴とする請求項1に記載の検索式生成システム。 - 前記検索式生成手段は、
前記識別子付与手段により識別子が追加された構造化文書を解析し、検索用構造木を作成する検索用構造解析手段を有し、
前記検索要素指定手段から前記検索対象要素に対応する識別子の入力を受け付け、前記検索用構造解析手段で作成された検索用構造木から前記入力された識別子を持つ要素を検索し、前記検索用構造木における前記検索された要素の構造上の位置を示す検索式を生成することを特徴とする請求項1又は2に記載の検索式生成システム。 - 前記検索式生成手段は、
前記識別子付与手段により識別子が追加された構造化文書を独自に解析し、検索用構造木を作成する検索用構造解析手段を複数有し、
前記それぞれの検索用構造解析手段で作成された各検索用構造木から前記入力された識別子を持つ要素を検索し、検索用構造解析手段ごとに検索用構造木における前記検索された要素の構造上の位置を示す検索式を生成することを特徴とする請求項1から3のいずれか1項に記載の検索式生成システム。 - 前記構造化文書はHTMLで表された文書であることを特徴とする請求項1から4のいずれか1項に記載の検索式生成システム。
- 前記検索式生成部は、生成した検索式を構造解析の種類ごとに対応させた検索式対応表を用いて該検索式を保存することを特徴とする請求項1から5のいずれか1項に記載の検索式生成システム。
- 前記検索式生成部は、生成された検索式を使用してHTML編集コマンドを生成する
ことを特徴とする請求項1から6のいずれか1項に記載の検索式生成システム。 - 構造化文書の要素に対して構造解析に依存しない属性として識別子を追加する識別子付与ステップと、
前記識別子が付加された構造化文書を解析し、ユーザからの検索対象要素の入力を受け付け、入力された検索対象要素に追加された識別子を取得する検索要素指定ステップと、
前記識別子が付加された構造化文書を解析し、前記検索要素指定ステップによる前記検索対象要素に対応する識別子の入力を受け付け、入力された識別子を用いて該解析された構造から検索対象要素を検索し、該検索対象要素の構造上の位置を示す検索式を生成する検索式生成ステップと、
を有することを特徴とする検索式生成方法。 - 前記検索要素指定ステップは、
前記識別子付与ステップにより識別子が追加された構造化文書を解析して例示用構造木を作成する例示用構造解析ステップを有し、
前記例示用構造解析ステップで作成された例示用構造木をユーザに提示し、ユーザからの検索対象要素の入力を受け付けて該検索対象要素に追加された識別子を取得し、取得した識別子を入力することを特徴とする請求項8に記載の検索式生成方法。 - 前記検索式生成ステップは、
前記識別子付与ステップにより識別子が追加された構造化文書を解析し、検索用構造木を作成する検索用構造解析ステップを有し、
前記検索要素指定ステップによる前記検索対象要素に対応する識別子の入力を受け付け、前記検索用構造解析ステップで作成された検索用構造木から前記入力された識別子を持つ要素を検索し、前記検索用構造木における前記検索された要素の構造上の位置を示す検索式を生成することを特徴とする請求項8又は9に記載の検索式生成方法。 - 記憶手段及び操作入力手段を備える検索式生成システムで用いられる検索式生成用プログラムであって、
前記記憶手段から読み込んだ又は外部端末から取得した構造化文書の要素に対して構造解析に依存しない属性として識別子を追加して記憶手段に格納する識別子付与機能と、
前記記憶手段から前記識別子が付加された構造化文書を読み込んで解析し、ユーザからの前記操作入力手段による検索対象要素の入力を受け付け、入力された検索対象要素に追加された識別子を取得する検索要素指定機能と、
前記記憶手段から前記識別子が付加された構造化文書を読み込んで解析し、前記検索要素指定機能による前記検索対象要素に対応する識別子の入力を受け付け、入力された識別子を用いて該解析された構造から検索対象要素を検索し、該検索対象要素の構造上の位置を示す検索式を生成する検索式生成機能と、
をコンピュータに実現させることを特徴とする検索式生成用プログラム。 - 前記検索式生成機能は、
前記識別子付与機能により識別子が追加された構造化文書を解析し、例示用構造木を作成して前記記憶手段に格納する例示用構造解析機能を有し、
前記例示用構造解析機能で作成された例示用構造木を前記記憶手段から読み出して画面表示し、ユーザからの前記操作入力手段による検索対象要素の入力を受け付けて該検索対象要素に追加された識別子を取得し、取得した識別子を入力することを特徴とする請求項11に記載の検索式生成用プログラム。 - 前記検索式生成機能は、
前記識別子付与機能により識別子が追加された構造化文書を解析し、検索用構造木を作成して前記記憶手段に格納する検索用構造解析機能を有し、
前記検索要素指定手段から前記検索対象要素に対応する識別子の入力を受け付け、前記検索用構造解析機能で作成された検索用構造木を前記記憶手段から読み出し、前記検索用構造木から前記入力された識別子を持つ要素を検索し、前記検索用構造木における前記検索された要素の構造上の位置を示す検索式を生成することを特徴とする請求項11又は12に記載の検索式生成用プログラム。 - 請求項11から13のいずれか1項に記載のプログラムを記録しコンピュータ読み取り可能なことを特徴とする記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010517951A JP5429165B2 (ja) | 2008-06-18 | 2009-06-17 | 検索式生成システム、検索式生成方法、検索式生成用プログラム、及び記録媒体 |
US12/996,918 US20110087698A1 (en) | 2008-06-18 | 2009-06-17 | Search expression creating system, search expression creating method, search expression creating program, and recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008-159160 | 2008-06-18 | ||
JP2008159160 | 2008-06-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2009154241A1 true WO2009154241A1 (ja) | 2009-12-23 |
Family
ID=41434157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2009/061056 WO2009154241A1 (ja) | 2008-06-18 | 2009-06-17 | 検索式生成システム、検索式生成方法、検索式生成用プログラム、及び記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20110087698A1 (ja) |
JP (1) | JP5429165B2 (ja) |
WO (1) | WO2009154241A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011108618A1 (ja) * | 2010-03-01 | 2011-09-09 | 日本電気株式会社 | 検索式更新装置、検索式更新方法 |
JP2013218627A (ja) * | 2012-04-12 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書からの情報抽出方法、装置、及びプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8214244B2 (en) | 2008-05-30 | 2012-07-03 | Strategyn, Inc. | Commercial investment analysis |
US8494894B2 (en) | 2008-09-19 | 2013-07-23 | Strategyn Holdings, Llc | Universal customer based information and ontology platform for business information and innovation management |
US8666977B2 (en) | 2009-05-18 | 2014-03-04 | Strategyn Holdings, Llc | Needs-based mapping and processing engine |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07225771A (ja) * | 1993-10-30 | 1995-08-22 | Fuji Xerox Co Ltd | 検索式作成支援システム |
JP2000003366A (ja) * | 1998-06-11 | 2000-01-07 | Hitachi Ltd | 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体 |
JP2000057152A (ja) * | 1998-08-06 | 2000-02-25 | Fuji Xerox Co Ltd | 文書関連付け装置、文書閲覧装置、文書関連付けプログラムを記録したコンピュータ読み取り可能な記録媒体及び文書閲覧プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004234192A (ja) * | 2003-01-29 | 2004-08-19 | Mitsubishi Electric Information Systems Corp | Htmlデータとxmlデータの編集システム及び編集プログラム |
JP2007011774A (ja) * | 2005-06-30 | 2007-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 文章解析装置、文章解析方法、プログラムおよび記憶媒体 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2242158C (en) * | 1997-07-01 | 2004-06-01 | Hitachi, Ltd. | Method and apparatus for searching and displaying structured document |
US6766330B1 (en) * | 1999-10-19 | 2004-07-20 | International Business Machines Corporation | Universal output constructor for XML queries universal output constructor for XML queries |
JP4039484B2 (ja) * | 2002-02-28 | 2008-01-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | XPath評価方法、これを用いたXML文書処理システム及びプログラム |
JP4036718B2 (ja) * | 2002-10-02 | 2008-01-23 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書検索システム、文書検索方法、文書検索を実行するためのプログラム |
US7171407B2 (en) * | 2002-10-03 | 2007-01-30 | International Business Machines Corporation | Method for streaming XPath processing with forward and backward axes |
JP3982623B2 (ja) * | 2003-03-25 | 2007-09-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、データベース検索システム及びプログラム |
US7124147B2 (en) * | 2003-04-29 | 2006-10-17 | Hewlett-Packard Development Company, L.P. | Data structures related to documents, and querying such data structures |
US20060106822A1 (en) * | 2004-11-17 | 2006-05-18 | Chao-Chun Lee | Web-based editing system of compound documents and method thereof |
-
2009
- 2009-06-17 JP JP2010517951A patent/JP5429165B2/ja not_active Expired - Fee Related
- 2009-06-17 WO PCT/JP2009/061056 patent/WO2009154241A1/ja active Application Filing
- 2009-06-17 US US12/996,918 patent/US20110087698A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07225771A (ja) * | 1993-10-30 | 1995-08-22 | Fuji Xerox Co Ltd | 検索式作成支援システム |
JP2000003366A (ja) * | 1998-06-11 | 2000-01-07 | Hitachi Ltd | 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体 |
JP2000057152A (ja) * | 1998-08-06 | 2000-02-25 | Fuji Xerox Co Ltd | 文書関連付け装置、文書閲覧装置、文書関連付けプログラムを記録したコンピュータ読み取り可能な記録媒体及び文書閲覧プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004234192A (ja) * | 2003-01-29 | 2004-08-19 | Mitsubishi Electric Information Systems Corp | Htmlデータとxmlデータの編集システム及び編集プログラム |
JP2007011774A (ja) * | 2005-06-30 | 2007-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 文章解析装置、文章解析方法、プログラムおよび記憶媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011108618A1 (ja) * | 2010-03-01 | 2011-09-09 | 日本電気株式会社 | 検索式更新装置、検索式更新方法 |
JP5440687B2 (ja) * | 2010-03-01 | 2014-03-12 | 日本電気株式会社 | 検索式更新装置、検索式更新方法 |
JP2013218627A (ja) * | 2012-04-12 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書からの情報抽出方法、装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20110087698A1 (en) | 2011-04-14 |
JPWO2009154241A1 (ja) | 2011-12-01 |
JP5429165B2 (ja) | 2014-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5112116B2 (ja) | 機械翻訳する装置、方法およびプログラム | |
KR101088983B1 (ko) | 데이터 탐색 시스템 및 방법과, 데이터 탐색 방법을수행하는 장치 | |
JP5121146B2 (ja) | 構造化文書管理装置、構造化文書管理プログラムおよび構造化文書管理方法 | |
JP2003242136A (ja) | 構文情報タグ付与支援システムおよび方法 | |
JP5429165B2 (ja) | 検索式生成システム、検索式生成方法、検索式生成用プログラム、及び記録媒体 | |
JP2006252381A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
KR100905744B1 (ko) | 사용자 제작 문답 데이터에 기반한 회화 사전 서비스 제공방법 및 시스템 | |
KR20050097444A (ko) | 엘리먼트 서치 방법 및 장치와 그 방법을 수행하기 위한프로그램이 저장된 기록 매체 | |
JP2008171181A (ja) | 構造化データ検索装置 | |
JP2014521159A (ja) | 文書の圧縮、解凍及び照会のための方法及び装置 | |
KR101221306B1 (ko) | 데이터 구조를 항해하기 위한 방법 및 시스템 | |
JP5342760B2 (ja) | 訳語学習のためのデータを作成する装置、方法、およびプログラム | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP4868733B2 (ja) | 構造化文書処理装置及び構造化文書処理方法、プログラム | |
JP2008077285A (ja) | Sql管理システムとsql管理方法およびプログラム | |
JP4207992B2 (ja) | 構造化文書処理システム及び構造化文書処理方法 | |
JP3785439B2 (ja) | 自然言語処理装置とその自然言語処理方法、及び自然言語処理プログラム | |
JP2005228234A (ja) | サービス情報生成方法及び実施システム並びに処理プログラム | |
JP5160120B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP2010218459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2003196306A (ja) | 画像検索装置及びその方法、プログラム | |
CN116108170A (zh) | 一种基于自然语言处理的应急预案文本抽取方法及系统 | |
JPH11328199A (ja) | 動的データベース検索システム、動的データベース検索方法、および記録媒体 | |
JP2011210193A (ja) | 機械翻訳装置および機械翻訳プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 09766689 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12996918 Country of ref document: US |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2010517951 Country of ref document: JP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 09766689 Country of ref document: EP Kind code of ref document: A1 |