CN1432944A - 用于鉴别中文地址数据的方法和系统 - Google Patents

用于鉴别中文地址数据的方法和系统 Download PDF

Info

Publication number
CN1432944A
CN1432944A CN02101736A CN02101736A CN1432944A CN 1432944 A CN1432944 A CN 1432944A CN 02101736 A CN02101736 A CN 02101736A CN 02101736 A CN02101736 A CN 02101736A CN 1432944 A CN1432944 A CN 1432944A
Authority
CN
China
Prior art keywords
database
data items
chinese
text data
chinese text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02101736A
Other languages
English (en)
Other versions
CN100442275C (zh
Inventor
刘罗梦华
俞欣
陈志伟
奚珍明
李来
曾顺达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dell Products LP
Original Assignee
Dell Products LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dell Products LP filed Critical Dell Products LP
Priority to CNB021017360A priority Critical patent/CN100442275C/zh
Priority to US10/080,815 priority patent/US7065484B2/en
Priority to TW91110251A priority patent/TWI237775B/zh
Priority to MYPI20023872A priority patent/MY135390A/en
Publication of CN1432944A publication Critical patent/CN1432944A/zh
Priority to HK04100452.7A priority patent/HK1059654A1/xx
Application granted granted Critical
Publication of CN100442275C publication Critical patent/CN100442275C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

一种用来在一订单管理系统中验证订单的系统,该系统涉及由第二方公布的具有中文地址的个人或机构。订单管理数据库的中文地址项和公布的个人及机构的数据库的中文地址项,在一个共用的书写系统即拼音拼写标准中,每个都可以被转换成各自相应的数据库。在转换过程中,能够被多种方法来转换的订单管理数据库中的简体汉字项目可以用这些方法中的每一种进行转换。而后这两个拼音数据库中的被转换项目即进行比较。

Description

用于鉴别中文地址数据的方法和系统
技术领域
本发明涉及用来比较两个中文项的数据库的方法和系统,尤其是,本发明用以将诸如个人和/或机构地址的数据项目进行比较。
背景技术
目前已存在多种书写中文文本的标准,除了传统的中文字符集(它仍然在台湾和香港这些地区广泛地使用),中华人民共和国是用简化的汉字来书写文本,另外中文可以被译成像“拼音字符”这样的罗马字母,或者是通过其他的系统,比如被定义成ALA-LC的罗马字母表的系统。
各种标准之间的转换是很常见的,例如一个传统的订单管理系统(SMARTS)需要通过使用拼音字符来键入订货和运输地址,然后该拼音字符被转换成存储于SMARTS数据库中的双字节简体汉字字符。注意,尽管如此,并非所有的转换都是很明确的,比如一单个的简体汉字字符可以对应(用拼音)几个罗马字母集。类似地,一单个罗马字母(用拼音)集也可能会对应多个简体汉字字符,这些简体汉字字符将会有不同的意义。
既然不同数据库中的中文字符可以用不同标准来被存储,因而比较不同数据库中的相应项目是一个困难的过程,比如一第二方已经颁布了“被拒绝方列表”(“DPL”),并且与列表中的所有方进行的交易都将被特殊处理。该列表只是用英文来发布(即,传统的英文文字和译自中文文字的罗马字母的混合体)并且没有任何迹象表明将来它会被翻译成简体汉语字符。因此使用存储于诸如SMARTS这样的订单管理系统中的名字来比较列表是很困难的。
比较这两个列表的困难会引起一种可能,它会让产品提供商错误地将产品提供给列于DPL表上的当事方,而未对该交易进行特殊处理。这样的错误可能对公司的利益造成损害。
发明内容
本发明试图解决上述问题,尤其是提供用来比较两个数据库的方法和系统,该两种数据库都包括中文文本数据项目比如个人或机构这样实体的地址,并且两种数据库对于中文文本数据项目采用不同的中文书写系统。
总的来说,本发明提出两种数据库的中文文本项都被转换成一共同的标准语言,尤其是拼音拼写标准(Pin Yin Transliteration standard)。在转换过程中,任何可以用多种方法转换的项目都被用这些方法中的进行转换,于是这两个被转换数据库中的项目即可以进行比较。
特别地,本发明的第一方面在于用来比较两个数据库的计算机应用方法,该两数据库的每一个都包括标明地址的中文文本数据项目,该方法包括:
对于每一个数据库,将任何一个并不是预先定义的共同中文语言格式的中文文本数据项目转换成共同格式,能够用多种方式转换成该共同格式的、且至少是在第一数据库中的任何项目都被用所有这些方法来转换成该共同格式;和
比较这些具有共同格式的数据项目,以便识别与该第二数据库中的中文文本数据项目相对应的该第一数据库中的中文文本数据项目。
本发明的第二方面在于提出了一种用于比较两个数据库的一种计算机系统,每个数据库都包括指明地址的中文文本数据项目,该计算机系统包括:
一第一转换单元,用来将第一数据库的中文文本数据项目转换成一预先定义的共同中文语言格式,并且能够用多种方法将它们转换成共同格式的第一数据库中的任意项目被用所有这些方法来转换以便生成具有共同格式的项目;
一第二转换单元,用来将该第二数据库的中文文本数据项目转换成该共同中文语言格式;和
一比较单元,用于比较被转换的数据项目,以便识别与该第二数据库中的中文文本数据项目相对应的该第一数据库中的中文文本数据项目。
注意如果该第二数据库中的数据项目已经是共同格式,那么可以省略该第二转换单元。
该共同中文语言格式优先采用拼音字符(Pin Yin Characters),该第一数据库可以是一订单管理系统,它具有包括运输和/或提货地址的数据项目,第一数据库中的中文文本数据项目可能是简体汉语字符。该第二数据库可能是英文或者是传统的英文文字和拼音的结合体,比如,该第二数据库可以是一些或者是全部的由由第二方所颁发的第三方列表。
“中文文本数据项目”可以被定义成中国语言的项目,比如说汉字,可选择地或附加地,“中文文本数据项目”可以被定义成包括或者是含有与位于指定的中国境内的地址有关的数据项目,比如中华人民共和国和/或可选的任何其他中文语言通用的领土内以便订货和/或运输(尤其是使用简体汉字字符地区)。
注意,除了中文文本数据项目之外,任何一个数据库可能包括非中文文本数据项目的项目,比如该订单管理系统可以包括与中国没有任何关系的方面的数据。类似地,该第二数据库(比如说是一些或者是全部的DPL方的情况)包括验证其实体的地址不位于指定的中国境内的项目。优先地,在任何一种情况下该转换过程仅仅将每一个数据库中的中文项目进行转换,并且只有该比较才确定该第一数据库的被转换项目是否与该第二数据库的被转换项目相对应。
附图说明
与所描述的本发明的实例相关的本发明的另外的优点和特征将要被讨论,仅仅作为一个例子,参考下列附图,它包括:
图1是用来显示作为本发明的具体实例的方法的方框图;
图2是作为本发明的具体实例的系统的结构方框图,它用来实现图1的方法;
图3显示了由图2中的系统产生的一个窗口,它被用来形成由拼音字符所得的简体汉语字符地址;
图4是由图2的系统所产生的一个窗口,它显示了存储于该系统中的用简体汉语字符表示的地址;
图5由图5(a)至5(c)所组成,它显示了图1中的将简体汉语字符转换成拼音字符的方法的步骤;
图6是图2的系统所产生的一个窗口,它显示了两个数据库进行比较的结果。
具体实施方式
图1显示了依据本发明的具体实施例的方法的步骤,它用来将潜在的接受物件方的地址与至少是发展方列表(DPL)中的一部分地址进行比较。该方法由图2中所示的系统来实现。
图2的系统含有一订单管理系统100,比如SMARTS系统,它包括一用来存储个人和/或公司的运输和/或提货地址的数据库110,个人和/或公司已经发出订单或者准备接受订单;和一个数据输入设备120,它使用拼音字符以便将数据输入至数据库110。仅仅显示了一个数据输入装置120,但是实际应用中可能有多个这样的单元。
该系统还包括一第二数据库130,它用来存储英文语言的DPL。
该系统另外包括一第一转换单元140,它用来将该第一数据库110中的简体汉字数据项目转换成拼音数据项目,以便形成第一拼音数据库150。该过程不删除数据库120。
该系统仍包括一第二转换单元160,用来将该第二数据库130中的英文语言数据转换成拼音数据项目,拼音数据项目在第二拼音数据库170中。这个过程不删除该第二数据库130。
最后,该系统包括一比较单元180,它用来比较该第一和第二数据库150,170中的拼音项,以及一输出单元190,用来将该第一和第二拼音数据库150,170中的各项目之间的任何相符合的情况通知给该系统的操作员,相符合的情况由比较单元180来完成发现。
图1的方法的头两个步骤(即,图1中短虚线以上的部分)是大家所熟知的将数据输入至该订单管理系统100的该第一数据库110中的步骤。特别地,在步骤10中,比如说销售代表中的用户使用数据输入装置120以便将诸如订货和运输地址这样的数据输入至订单管理系统100中。
图3中所示为由该订单管理系统100所产生的显示给用户的窗口。使用这个窗口,在步骤20中,通过用户的干预,该订单管理系统100将输入数据转换成简化的汉字双字节字符,以形成该第一数据库110中的项目。当从该第一数据库110中输出的项目被打印出来的时候它们是简体汉字的形式,通常被需要使用这些在运输和订货单的文档中。图4显示了从该第二数据库中输出的一个窗口,它具有用双字节简体汉字字符书写的全部的订货和邮寄地址。注意,数据库110有可能更进一步包含与中文无关的,并且甚至与本发明不相关的项目。这样的项目,如果它们已经是用英文语言的方式,有可能通过众所周知的方法直接地与数据库130中的项目(例如,非中文项目)进行比较。
在步骤30中,以简化的汉字双字节形式驻留在该第一数据库110中的订货和运输数据,由该第一转换单元140将它们转换成拼音字符,以便形成该第一拼音数据库150中的项目。如上所述,一单个的简体汉字字符可能对应多个拼音字符集。因此,对于每个该第一数据库110中的简体汉字项目,该第一转换单元140将生成所有可能的拼音字符集,它们能够由所述的项目派生出。而且这些拼音字符集中的每一个在数据库150中都形成一个项目。尽管如此,我们已经确认这种“简化的”过程不会损害鉴别过程的完整性。
特别地,在步骤30中由转换单元140完成的转换可以通过使用一个转换文件来实现,该转换文件比如像已经装载的微软视窗98的简体中文操作系统的缺省复制,对于每一个安装的该缺省文件系统的位置均能够在每一台PC机的C:\Windows\system\winpy.com处找到,其中在每个PC机里都安装了这种操作系统。
图5显示了步骤30的过程的一个例子。图4的窗口中所显示的地址是该第一数据库中的第4602249011号订单,如图5(a)中所示。图5(b)所示为能够将每个简体汉字字符转换成拼音的各种方法。大多数字符仅仅只有一个拼音译文,可是他们之中的三个具有两个拼音拼写,这两个拼音拼写中的一个用阴影显示出。
使用图5(b)的表格,简体汉字字符的字符串被转换成拼音字符的字符串。每个具有多个拼音表示符的简体汉字字符被转换成一个表示符后紧接着另外的表示符。通过指明对应于每个这样的汉字字符的其后紧接着另外的带阴影的拼音表示符的第一拼音表示符,这些字符串被显示于图5(c)中。
在步骤40中,通过该第二转换单元160,该第二数据库130中的中文地址被转换成拼音以形成该第二拼音数据库160的项目。注意,该转换过程必须由一个能说中文的操作者手工地正常地去完成,尽管在原则上该过程也可以自动地或半自动地被实现。
表1显示了这种转换操作。表1显示了图1的方法中由DPL表所产生的拼音字符的数据库。每一行对应于DPL列表中的一个实体(标为PIN_YIN_1至PIN_YIN_9),例如,实体PIN_YIN_2是“BeijingInstitute of Structure and Environmental Engineering(北京建筑和环境工程学院)”。第二方DPL表包括一对应于该实体的“No.36 Wanyuan RoadBeijing China(PRC)(中国北京万园路36号)”的地址(在表1中该地址被标为“BXA DPL地址”)。注意,该地址是一个常规的英文文字(如,“路”)和拼音(如,“万园”)的混合体。在步骤40中,该BXA DPL地址被转换成(比如,由一个操作员)一个完整的拼音地址。作为参考,相应的简体中文地址显示于表1的右手栏中,尽管,本发明并不需要产生这一栏目。
尽管在原理上,将DPL列表中的所有项目都转换成拼音是有可能的,但本实施例仅仅将DPL列表中的中文项目的地址进行转换,例如,在本上下文中的“中文”可以被定义成这样的项目,它们是中华人民共和国境内以及其他可选领土之内的地址。通过采用这种“简化的”的手段,转换的数目(因而同样对于紧接下来的比较)被大大地减少了。一般地来讲,由于鉴别过程基于地址的基础之上,而且地址的属性并没有发生“转变”,上述方法不会降低鉴别的完整性。
在步骤50中,对于该第一和第二拼音数据库150,170进行比较,以便确定它们是否相符合。这些是通过自动地抽取该第一数据库中的拼音字符串(例如,图5(c)中所示的字符串)与该第二数据库中的拼音字符串(表1的“拼音地址”栏目)之间的相符合情况来完成的。
图6所示为一可以选择地显示给用户的窗口,通过比较单元180以便让用户确定这些匹配是怎样被处理的。如图所示,已经发现了一个在订单号第402211081(如图4和5,以及图下的上半部分所示)与表1表中的实体PIN_YIN_4(如图6的下半部分所示)之后的可能相匹配的情况。注意,DPL列表中的实体名称(“BEIJING AEROSPACEAUTOMATIC CONTROL INSTITUTE(北京航空自动控制有限公司)”)与名称(“DALi Furniture(China)Ltd.)(大理家具(中国)有限公司)”)是不相同的,其中应用名称(大理家具(中国)有限公司)来制作订单;本实施例已经发现这种相符合情况只是单单基于地址的基础之上。通过向图6窗口中的适当的可选对话框中输入点击,然后点击“OK”,用户可以指示这种相符合情况是怎样被处理的。
如果愿意的话,步骤50可以由运行该订单管理系统的机构的DPL遵循部门来完成,该相符合的情况可以与地方的DPL列表相合作,即,运行该订单管理系统的机构将发展同表中所列的各方(可不同于发展方列表)进行交易,至少是没有筛选鉴别操作。紧接着,地方DPL列表有可能会被使用以便附加到出口管理系统中,用于出口法规的遵循鉴别的目的,这正如同出口/运输文件的产生一样。
因此,步骤30和40已经形成了一公共平台(拼音),这样在步骤50中即能够实现中国订单的地址的遵从一致的鉴别。
该实施例可以采用在处理的方式进行操作,其中该第一数据库110中的多个项目(比如,该第一数据库110中的所有中文项目)一个接一个地(例如,像一连续不断的序列)被转换成拼音项目,以便形成该数据库存50,然后数据库150中的每一个被转换项目均与该第二数据库170的被转换项目进行比较(比如说,一个接一个地)。
可以选择地,对于该第一数据库110的项目可以分别地进行步骤30(例如,每当有一新的项目被添加至该第一数据库110中),而通过将每个被转换的项目与该第二拼音数据库170的所有被转换项目进行比较,且为了数据库150中的所得项目可以进行步骤50。如果没有发现相符合的情况,该数据库150的内容可以舍弃掉,换句话说,在本实施例的变化中,该第一拼音数据库150在任何时候不需要含有比由数据库110中的简体汉字项目中的某一单个项目而派生出来的拼音项目的数目更多的拼音项目数目。
步骤50中的比较可以用如上所述的方法来进行。如果有任何一个匹配情况被发现,即要使用输出单元190以便通知该系统的操作员,他(她)可以对相应订单进行特殊处理。
表1
    ID     名称     BXA DPL地址     拼音地址 简体中文地址
PIN_YIN_1 ABC Jianguomenwai DiplomaticHousing Compound,Bldg 7-1,5th FLApartment 4BEIJIN,CHINA(PRC) ZHONGGUO BEIJING JIANGUO MEN WAI WAI JIAOPOU BU ZHU CHE ZHAIGOUQU 7-1,5 LOU 4CHANDANYUAN 中国北京建国门外外交部住宅区7-1,5楼4单元
PIN_YIN_2 BEIJING INSTITUTEOF STRENGTH ANDENVIRONMENTALENGINEERING No.36 Wanyuan RoadBEIJING,CHINA(PRC) ZHONGGUO BEIJING WANYUAN LUOLU 36 HAO 中国北京万园路36号
PIN_YIN_3 BEIJING INSTITUTEOF STRUCTUREANDENVIRONMENTALENGINEERING No.36 Wanyuan RoadBEIJING,CHINA(PRC) ZHONGGUO BEIJING WANYUAN LUOLU 36 HAO 中国北京万园路36号
PIN_YIN_4 BEIJINGAEROSPACEAUTOMATICCONTROLINSTITUTE 51 Yong Ding RoadBEIJING,CHINA(PRC) ZHONGGUOBEIJING YONGDING LUOLU 51 HAO 中国北京永定路51号
PIN_YIN_5 SHANGHAIACADEMY OFSPACEFLIGHTTECHNOLOGY Spaceflight Tower 222 Cao XiRoadSHANGHAI,CHINA(PRC) ZHONGGUO SHANG AI CAOXI LUOLU 222 XIAOHAOHANG TIAN DAIDA XIASHA 中国上海漕西路222号航天大厦
PIN_YIN_6 SHANGHAIINSTITUTE OFSPACE POWER-SOURCES 388 Cang Wu Rd.SHANGHAI,CHINA(PRC) ZHONGGUO SHANGHAICHUANG CANG WU LUOLU388 XIAOHAO 中国上海仓武路388号
PIN_YIN_7 BCD Jianguomenwai DiplomaticHousing CompoundBldg.7-15th Floor Apartment4BEIJING,CHINA(PRC) ZHONGGUO BEIJING JIANGUO MEN WAI WAI JIAOPOU BU ZHU CHE ZHAIGOUQU 7-1,5 LOU 4CHANDANYUAN 中国北京建国门外外交部住宅区7-1,5楼4单元
PIN_YIN_8 DEF Ta Yuan Cun-dipl.Office bldg.2-8-1BEIJING,CHINA(PRC) ZHONGGUO BEIJING DA TAYUAN CUN WAI JIAOBANGONG DAIDALOU 2-8-1XIAOHAO 中国北京塔元村外交办公大楼2-8-1号
PIN_YIN_9 FGH Unit 08-06/07,Liang MaTower8 North Dong San Huan Rd.,Chao Yang DistrictBEIJING,CHINA(PRC) ZHONGGUO BEIJINGZHAOCHAOYANG GOUQUDONG SAN HUAN BEILUOLU 8 XIAOHAO LIANGMA DAIDA XIASHA 08-06/07 中国北京朝阳区东三环北路8号亮马大厦08-06/07

Claims (15)

1.一种用于比较两个数据库的计算机应用方法,每个数据库都包含指明地址的中文文本数据项目,该方法包括:
对于每一个数据库,将任何一个并不是预先定义的共同中文语言格式的中文文本数据项目转换成共同格式,能够用多种方式转换成该共同格式的、且至少是在第一数据库中的任何项目都被用所有这些方法来转换成该共同格式;和
比较这些具有共同格式的数据项目,以便识别与该第二数据库中的中文文本数据项目相对应的该第一数据库中的中文文本数据项目。
2.一种如权利要求1所述的方法,其中该共同的中文语言格式是拼音字符(Pin Yin characters)。
3.一种如权利要求1或权利要求2所述的方法,其中该第一数据库是一个订单管理系统数据库,并且包括含有相应的运输和/或订货地址的数据项目。
4.一种如权利要求1至3中的任一项所述的方法,其中该第一数据库的中文文本数据项目使用简体汉语字符(Simplified Mandarincharacters)。
5.一种如前述的权利要求中的任一项所述的方法,其中该第二数据库是一个由第二方所颁发的第三方列表。
6.一种如前述的权利要求中的任一项所述的方法,其中不包括位于至少一个所指定中国领土之内地址的该第二数据库数据项目将不被转换成该共同格式。
7.一种如前述的权利要求中的任一项所述的方法,其中通过对具有该共同格式中文文本数据项目的比较,若发现它们之间相匹配,则编辑该第一数据库的相应项目。
8.一种用于比较两个数据库的计算机系统,其中每个数据库包括指明地址的中文文本数据项目,该计算机系统含有:
一第一转换单元,用来将第一数据库的中文文本数据项目转换成一预先定义的共同中文语言格式,并且能够用多种方法将它们转换成共同格式的第一数据库中的任意项目被用所有这些方法来转换以便生成具有共同格式的项目;
一第二转换单元,用来将该第二数据库的中文文本数据项目转换成该共同中文语言格式;和
一比较单元,用于比较被转换的数据项目,以便识别与该第二数据库中的中文文本数据项目相对应的该第一数据库中的中文文本数据项目。
9.一种如权利要求8所述的系统,其中该共同中文语言格式是拼音字符。
10.一种如权利要求8或权利要求9所述的系统,其中该第一数据库是一个订单管理系统数据库,并且包括含有相应的运输和/或订货地址的中文文本数据项目。
11.一种如权利要求8至10中的任一项所述的系统,其中该第一数据库的中文文本数据项目使用简体汉语字符。
12.一种如权利要求8至11中的任一项所述的系统,其中该第二数据库是一个由第二方所颁发的第三方列表。
13.一种如权利要求8至11中的任一项所述的系统,其中该第二转换单元并不转换那些不包含位于至少一个所指定的中国领土之内地址的该第二数据库数据项目。
14.一种如权利要求8至13中的任一项所述的系统,其中通过检测该具有共同格式的中文文本数据项目之间的相匹配情况,该比较单元用来操作输出装置以发送信号,因而使得该第一数据库相应项目被编辑。
15.一种如权利要求8至13中的任一项所述的系统,其中通过检测具有该共同格式的中文文本数据项目之间的相匹配情况,该比较单元用来编辑该第一数据库中的相应项目。
CNB021017360A 2002-01-17 2002-01-17 用于鉴别中文地址数据的方法和系统 Expired - Lifetime CN100442275C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CNB021017360A CN100442275C (zh) 2002-01-17 2002-01-17 用于鉴别中文地址数据的方法和系统
US10/080,815 US7065484B2 (en) 2002-01-17 2002-02-22 Method and systems for screening Chinese address data
TW91110251A TWI237775B (en) 2002-01-17 2002-05-16 Method and systems for screening Chinese address data
MYPI20023872A MY135390A (en) 2002-01-17 2002-10-17 Methods and systems for screening chinese address data
HK04100452.7A HK1059654A1 (en) 2002-01-17 2004-01-20 Method and systems for screening chinese address data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021017360A CN100442275C (zh) 2002-01-17 2002-01-17 用于鉴别中文地址数据的方法和系统

Publications (2)

Publication Number Publication Date
CN1432944A true CN1432944A (zh) 2003-07-30
CN100442275C CN100442275C (zh) 2008-12-10

Family

ID=4739602

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021017360A Expired - Lifetime CN100442275C (zh) 2002-01-17 2002-01-17 用于鉴别中文地址数据的方法和系统

Country Status (4)

Country Link
US (1) US7065484B2 (zh)
CN (1) CN100442275C (zh)
HK (1) HK1059654A1 (zh)
MY (1) MY135390A (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7257592B2 (en) * 2003-06-26 2007-08-14 International Business Machines Corporation Replicating the blob data from the source field to the target field based on the source coded character set identifier and the target coded character set identifier, wherein the replicating further comprises converting the blob data from the source coded character set identifier to the target coded character set identifier
US8137105B2 (en) 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US7789846B2 (en) * 2005-01-25 2010-09-07 Thermopeutix, Inc. System and methods for selective thermal treatment
US7676357B2 (en) * 2005-02-17 2010-03-09 International Business Machines Corporation Enhanced Chinese character/Pin Yin/English translator
US8463597B2 (en) * 2008-05-11 2013-06-11 Research In Motion Limited Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input
KR102244110B1 (ko) * 2015-02-17 2021-04-26 삼성전자주식회사 이종 언어간 동일성을 판단하는 전자 장치 및 방법
CN110866083B (zh) * 2019-12-04 2023-11-07 国网浙江省电力有限公司 一种电力标准结构化地址库的地址稽核方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8629908D0 (en) * 1986-12-15 1987-01-28 Kemano Ltd Words & characters computer input device
US5276616A (en) * 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
US5444843A (en) * 1993-10-13 1995-08-22 Atlantic Richfield Company Method for producing database coordinated drawings for a facility
US5590181A (en) * 1993-10-15 1996-12-31 Link Usa Corporation Call-processing system and method
US6321986B1 (en) * 1993-11-05 2001-11-27 Intermec Ip Corporation Robust machine-readable symbology and method and apparatus for printing and reading same
US5832428A (en) * 1995-10-04 1998-11-03 Apple Computer, Inc. Search engine for phrase recognition based on prefix/body/suffix architecture
JPH10303975A (ja) * 1997-04-28 1998-11-13 Nec Corp 電子メールの回答管理システム
US6233545B1 (en) * 1997-05-01 2001-05-15 William E. Datig Universal machine translator of arbitrary languages utilizing epistemic moments
CN1269542A (zh) * 1999-04-05 2000-10-11 深圳市粤丝实业有限公司 联想汉字输入系统
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US6522889B1 (en) * 1999-12-23 2003-02-18 Nokia Corporation Method and apparatus for providing precise location information through a communications network
GB2359399B (en) * 2000-02-21 2004-06-02 Kenwood Corp Character display
US6400287B1 (en) * 2000-07-10 2002-06-04 International Business Machines Corporation Data structure for creating, scoping, and converting to unicode data from single byte character sets, double byte character sets, or mixed character sets comprising both single byte and double byte character sets
US6393445B1 (en) * 2001-01-04 2002-05-21 Institute For Information Industry System for transforming Chinese character forms in real-time between a traditional character form and a simplified character form

Also Published As

Publication number Publication date
HK1059654A1 (en) 2004-07-09
CN100442275C (zh) 2008-12-10
US20030135359A1 (en) 2003-07-17
US7065484B2 (en) 2006-06-20
MY135390A (en) 2008-04-30

Similar Documents

Publication Publication Date Title
US5909570A (en) Template mapping system for data translation
US6449620B1 (en) Method and apparatus for generating information pages using semi-structured data stored in a structured manner
US8015198B2 (en) Method for automatically indexing documents
US20050119875A1 (en) Identifying related names
US20080005063A1 (en) System and method of member unique names
US20060248039A1 (en) Sharing of full text index entries across application boundaries
US20090319515A1 (en) System and method for managing entity knowledgebases
US6915303B2 (en) Code generator system for digital libraries
EP1128277A2 (en) Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
US9785707B2 (en) Method and system for converting audio text files originating from audio files to searchable text and for processing the searchable text
US20070011142A1 (en) Method and apparatus for non-redundant search results
CN101542475A (zh) 用于对具有象形表意内容的数据进行搜索和匹配的系统和方法
JP2007122732A (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法)
CN1620661A (zh) 通过任意国家语言的查询来检索匹配的文档
US20080089594A1 (en) Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text
JP2005135377A (ja) ランタイムおよび設計でのテキスト変換と多言語サポートをするラベルシステム
Younger Resource description in the digital age
CA2348239C (en) Culturally correct ordering of keyed records
CN104346415A (zh) 图像文档命名的方法
US6078920A (en) Computer program product and apparatus for retrieval of OLE enabled BLOBs from an RDBMS server
CN1432944A (zh) 用于鉴别中文地址数据的方法和系统
US8805820B1 (en) Systems and methods for facilitating searches involving multiple indexes
CN111897837A (zh) 数据查询方法、装置、设备和介质
Buranarach et al. A scalable framework for creating open government data services from open government data catalog
CN101140566A (zh) 一种校对的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1059654

Country of ref document: HK

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1059654

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20081210

CX01 Expiry of patent term