CN100356768C - 图像处理设备和图像处理方法 - Google Patents

图像处理设备和图像处理方法 Download PDF

Info

Publication number
CN100356768C
CN100356768C CNB2005100543009A CN200510054300A CN100356768C CN 100356768 C CN100356768 C CN 100356768C CN B2005100543009 A CNB2005100543009 A CN B2005100543009A CN 200510054300 A CN200510054300 A CN 200510054300A CN 100356768 C CN100356768 C CN 100356768C
Authority
CN
China
Prior art keywords
image
character
pixel
color
particular community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100543009A
Other languages
English (en)
Other versions
CN1649384A (zh
Inventor
长谷川史裕
关口优
宫泽利夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2004010225A external-priority patent/JP4237642B2/ja
Priority claimed from JP2004010223A external-priority patent/JP2005204206A/ja
Priority claimed from JP2004072668A external-priority patent/JP2005259017A/ja
Priority claimed from JP2004114076A external-priority patent/JP2005303506A/ja
Priority claimed from JP2004116827A external-priority patent/JP4471202B2/ja
Priority claimed from JP2004140831A external-priority patent/JP4235583B2/ja
Priority claimed from JP2004144887A external-priority patent/JP2005328348A/ja
Priority claimed from JP2004152864A external-priority patent/JP4446797B2/ja
Priority claimed from JP2004155767A external-priority patent/JP4504096B2/ja
Priority claimed from JP2004161082A external-priority patent/JP4311663B2/ja
Priority claimed from JP2004168016A external-priority patent/JP2005348279A/ja
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of CN1649384A publication Critical patent/CN1649384A/zh
Publication of CN100356768C publication Critical patent/CN100356768C/zh
Application granted granted Critical
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

一种图像处理设备,包括:获取作为处理对象图像的多级图像的单元,获取基于该多级图像创建的二值图像的单元,从多级图像中提取作为具有特定属性的区域的特定属性区域的单元,将二值图像中除特定属性区域之外的像素转换成白色像素的单元,创建其中用背景颜色改变特定属性区域的像素的多级图像的单元,确定特定属性区域颜色的单元,创建具有所确定的颜色的特定属性区域的图像的单元,分别对创建的两个或多个图像进行压缩编码的图像编码单元,以及创建其中合并了编码图像的组合文件的单元。

Description

图像处理设备和图像处理方法
技术领域
本发明涉及不需要将作为处理对象图像的多级图像的图像质量减少太多,就可以获得明显减小的文件尺寸的图像处理设备,图像处理程序,及存储介质。
背景技术
通常,由于彩色图像的文件尺寸非常大,彩色图像的传送需要大量时间,并且彩色图像的存储需要大量的存储区域。因此,为了彩色图像的传送和存储,需要提供一种不需要减少彩色图像的图像质量就可以减小文件尺寸的技术。
目前,执行JPEG压缩等方法来压缩图像已被广泛使用。这种JPEG压缩是用于对诸如照片之类的自然图像压缩的极好方法,但是它不适于含有字符的文档图像的压缩。具体地被称为蚊子噪声的异常噪声经常出现在颜色被急剧改变的文档图像区域中,诸如字符的边缘区域。此外,诸如文档图像的颜色被频繁地急剧改变的图像的压缩效率也不是很高。
尽管有可能强行提高可压缩性,但在这种情况下字符的边缘区域会发生变形,并且字符的可见度会急剧下降。
日本专利No.3095804公开了一种避免上述问题的建议方法。在日本专利No.3095804的方法中,将处理对象图像划分为预定尺寸的块,并且将每一块分成中间色调(halftone)区域和字符区域。对中间色调区域执行2维空间离散余弦变换,并使用量化表进行编码。该字符区域仅由亮度信号和分辨色代码组成,并执行字符区域的压缩编码。
根据上述方法,由于中间色调区域中几乎没有颜色改变,使用诸如JPEG压缩功能之类的离散余弦变换的压缩方法来对中间色调区域进行编码是非常有效的,并且使用不同的编码方法来编码字符区域。因此,通过使用上述方法可以将可压缩性和图像质量之间的平衡维持在一个高水平上。
然而,由于根据日本专利No.3095804的方法,将字符部分和中间色调部分取决于块的尺寸以块为基础进行分割,可能会出现字符区域和中间色调区域共存于同一块中的情况。
在这种情况下,相关块中的字符区域和中间色调区域之一的图像质量将会恶化。
解决该问题的可能的方法是使块的尺寸变小。但是,如果将块的尺寸变小,用于判断是字符区域还是中间色调区域的信息将会减少,且会增加判断错误的可能性以及降低准确度。
发明内容
本发明的目的是提供一种消除上述问题的改进了的图像处理设备、程序以及存储介质。
为了达到上述目的,本发明提供了一种图像处理设备,包括:多级图像获取单元,用于获取作为处理对象图像的多级图像;二值图像获取单元,用于获取基于多级图像而创建的二值图像;特定属性区域提取单元,用于从多级图像中提取为具有特定属性的区域的特定属性区域;白色像素置换单元,用于将二值图像中的特定属性区域之外的像素变为白色像素;特定属性区域消除图像创建单元,用于创建其中由背景颜色替换特定属性区域的像素的多级图像;特定属性区域颜色确定单元,用于确定特定属性区域的颜色;特殊属性像素图像创建单元,用于创建具有由特定属性区域颜色确定单元确定的颜色的特定属性区域的图像;图像编码单元,用于对分别由特定属性区域消除图像创建单元和特定属性像素图像创建单元所创建的两个或多个图像进行压缩编码;以及组合文件创建单元,用于创建合并了来自图像编码单元的编码图像的组合文件。
根据本发明,获取作为原始图像的多级图像和基于原始图像的二值图像,并基于该二值图像确定如字符区域那样的具有特定属性的区域(特定属性区域)的像素。创建包含确定颜色的特定属性区域的图像,该颜色是在根据这样的特定属性区域的存在而生成将特定属性区域之外的像素改变为白色像素的二值图像之后确定的。创建由其中特定属性区域的像素被改变为背景颜色的多级图像。对每幅图像进行编码并创建每个编码图像的组合文件。本发明可以无需将用作处理对象图像的多级图像的图像质量降低太多,便可实现文件尺寸的明显减小,而即使当原始图像包含诸如字符和格线之类的特定属性的特定属性区域时,也可以保持特定属性区域像素的可见度。
附图说明
本发明的其他目的、特征以及优点将通过以下结合附图的详细说明而展现。
图1是示出本发明优选实施例中图像处理设备的电气连接的方框图。
图2是用于解释本实施例中的图像处理设备的概要处理的流程图。
图3是用于解释本实施例中的图像处理设备的概念操作的示意图。
图4是本发明优选实施例中的图像处理设备的功能组合的方框图。
图5是用于解释本发明另一个优选实施例中图像处理设备的概要处理的流程图。
图6是用于解释在本实施例中为何执行多级图像的平滑处理的原理图。
图7是本实施例中图像处理设备的功能组合方框图。
图8是用于解释本发明的另一个优选实施例中图像处理设备的概要处理的流程图。
图9是本实施例中的图像处理设备的功能组合的方框图。
图10是用于解释本发明的另一个优选实施例中图像处理设备的附加处理的流程图。
图11是用于举例说明代表颜色计算方法的流程图。
图12A和12B是示出原始图像分割的范例的示意图。
图13是用于解释连通分量和网格区域之间的位置关系的示意图。
图14是示出本发明另一个优选实施例中图像处理设备的功能组合的方框图。
图15是用于解释本实施例中由特定属性区域消除图像创建单元执行的处理内容的流程图。
图16是本实施例中特定属性区域消除图像创建单元的方框图。
图17是用于解释边界像素的示意图。
图18是用于解释消除了字符并且示出位于边界位置的边界像素的多级图像的示意图。
图19是用于解释在字符的轮廓区域处理中的问题的示意图。
图20是用于解释本发明优选实施例中图像处理设备的概要处理的概要流程图。
图21是该处理的概念图。
图22是图像处理设备的功能方框图。
图23是示出处理的范例的示意图。
图24是示出字符识别处理的范例的示意图。
图25是示出组合范例的示意图。
图26是用于解释本发明的另一个优选实施例的概要处理的概要流程图。
图27是该处理的概念图。
图28是图像处理设备的功能方框图。
图29是示出处理的范例的示意图。
图30是示出组合的范例的示意图。
图31是示出本发明优选实施例中图像处理方法的处理的流程图。
图32是示出图31的处理中的线条提取处理步骤的详细流程的流程图。
图33是示出本发明优选实施例中图像处理设备的组成的方框图。
图34是示出本发明另一个优选实施例中图像处理方法的处理的流程图。
图35是示出本发明另一个优选实施例中图像处理设备的组成的方框图。
图36是示出为线条候选者而统一连通分量的处理情形的示意图。
图37是示出对字符图像以及照片图像中的线条候选者进行合并处理的情形的示意图。
图38是用于解释反转的删除条件、非反转图像的线条候选者提取以及重复线条的示意图。
图39是示出实施本发明的图像处理设备的计算机的组成的方框图。
图40A和图40B是示出本发明的优选实施例中的文档数据结构的示意图。
图41是示出本发明优选实施例中的文档转换设备的方框图。
图42是用于解释本发明的优选实施例的文档转换方法的示意图。
图43是示出本发明的优选实施例中的文档恢复设备的方框图。
图44是用于解释本发明优选实施例中的文档恢复方法的示意图。
图45A和45B是示出本发明的另一个优选实施例中的文档数据结构的示意图。
图46是用于解释本发明的另一个优选实施例的文档转换方法的示意图。
图47是用于解释本发明的另一个优选实施例中的文档恢复方法的示意图。
图48A和48B是示出本发明的另一个优选实施例中的文档数据结构的示意图。
图49是示出本发明的另一个优选实施例中的文档转换方法的示意图。
图50是示出本发明的另一个优选实施例的文档恢复方法的示意图。
图51A和图51B是示出本发明另一个优选实施例中的文档数据结构的示意图。
图52是用于解释本发明的另一个优选实施例中的文档转换方法的示意图。
图53是用于解释本发明另一个优选实施例中文档恢复方法的示意图。
图54A和图54B是示出本发明优选实施例中的文档数据结构的示意图。
图55是用于解释平面PLN(2)的低分辨率处理的示意图。
图56是示出本发明的优选实施例中文档转换设备的方框图。
图57是用于解释本发明优选实施例中的文档转换方法的示意图。
图58是用于解释本发明优选实施例中的文档恢复设备的示意图。
图59是用于解释本发明优选实施例中的文档恢复方法的示意图。
图60是用于解释图55中的平面PLN(2)的低分辨率处理的示意图。
图61是用于解释平面PLN(2)的低分辨率处理的流程图。
图62是示出本发明优选实施例中的图像处理设备的功能方框图。
图63是示出图62中的图像处理设备的处理流程的示意图。
图64A是示出图62的图像处理设备中将字符的一部分识别为独立字符的示意图。
图64B是示出图62的图像处理设备中正确识别字符的示意图。
图65是示出在原始图像中包含诸如照片之类的图像的情况下,本发明优选实施例中的图像处理设备的功能方块图。
图66是用于解释由图65的图像处理设备执行的处理流程的示意图。
图67A是示出包括相同颜色长游程提取单元和长游程连通分量创建单元的格线提取单元的示意图。
图67B是示出包括相同颜色短游程提取单元和短游程连通分量创建单元的格线提取单元的示意图。
图68是示出根据图67A的格线提取单元的格线提取的情形以及根据图67B的格线提取单元的格线提取的情形的示意图。
图69是示出可以识别图67A的格线提取单元接触的字符的格线以及不可以识别图67B的格线提取单元接触的字符的格线的示意图。
图70是由本发明优选实施例中的图像处理设备执行的处理的功能方框图。
图71是用于解释由字符颜色指定单元执行的处理的功能方框图。
图72是用于解释伽玛转换的示意图。
图73是用于解释由无字符图像创建单元执行的处理的功能方框图。
图74是本发明优选实施例中的图像处理设备的功能方框图。
图75是用于解释图像处理设备执行的处理的流程图。
图76A和图76B是用于解释接触字符的提取的示意图。
图77是用于解释提取接触字符的流程图。
图78是本发明另一个优选实施例中图像处理设备的功能方框图。
图79是用于解释由图78的图像处理设备执行的处理的流程图。
图80是用于解释解码及显示由图像处理设备创建的组合文件的流程图。
图81是用于解释本发明另一个优选实施例中的概要处理的概要流程图。
图82是该处理的概念图。
图83是本实施例中的图像处理设备的功能方框图。
图84是用于举例说明减少颜色的图像创建处理的概要流程图。
图85是用于举例说明代表颜色计算处理的概要流程图。
图86是用于举另一例子说明代表颜色计算处理的概要流程图。
图87是用于解释代表颜色分配处理的概要流程图。
图88是用于举例说明用背景颜色改变字符区域的处理的概要流程图。
图89是用于解释本发明另一个优选实施例的处理概要的概要流程图。
图90是用于解释一部分处理的概要流程图。
图91是本实施例中图像处理设备的功能方框图。
图92是示出特定属性像素指定单元的组成的功能方框图。
具体实施方式
现在将参考附图说明本发明的优选实施例。
参照图1至图4,将说明本发明优选实施例中的图像处理设备和程序。
图1示出了本实施例中图像处理设备1的电气连接。如图1所示,图像处理设备1是诸如个人计算机(PC)之类的计算机,包括CPU(中央处理单元)2,其共同执行图像处理设备1的各个部件的各种操作以及控制,包含各种类型ROM(只读存储器)和RAM(随机存取存储器)的存储器3,以及互联CPU2和存储器3的总线4。
图像处理设备1中还包括由总线4互联的诸如硬盘驱动器之类的磁存储器5、诸如键盘和鼠标之类的输入设备6、显示设备7、读取诸如光盘之类的存储介质8的存储介质读取设备9、读取图像的图像读取设备10、以及通过预定接口与网络11通信的通信控制设备12。图像处理设备1通过使用通信控制设备12经由网络11传送组合文件(其中合并了编码图像)。
另外,所使用的存储介质8可以是任何类型的介质,包括诸如CD和DVD之类的光盘、磁光盘、以及软盘(FD)。此外,根据所使用的存储介质8的种类,所使用的存储介质读取设备9可以是光盘驱动器、磁光盘驱动器、软盘驱动器等的任何一种。
图像处理设备1从存储介质8中读取使计算机执行根据本发明的实施例的图像处理的图像处理程序13,并将该程序安装到磁存储器5中。该程序可以经由诸如互联网之类的网络11下载到图像处理设备1中,并可以安装在磁存储器5中。
通过这种安装,图像处理设备1将处于能够执行以下将描述的图像处理的状态。另外,图像处理程序13可以在预定的OS(操作系统)上运行。
在本实施例中,通过使用图像处理程序13,不需要损失作为处理对象图像(原始图像)的多级图像中的字符可见性,便可以明显减小文件的尺寸。
图2是用于解释本实施例中的图像处理设备的概要处理的流程图。图3是用于解释本实施例中的图像处理设备的示意图。
在图2的处理中,使用诸如图像扫描仪之类的图像读取设备10获得图3(a)所示的用作处理对象图像的多级图像(步骤S1)。并通过多级图像的二值化创建图3(b)所示的二值图像(步骤S2)。随后,提取具有特定属性的区域(特定属性区域),诸如字符区域(步骤S3)。
如图3(c)所示,执行白色像素处理,其将除特定属性区域之外的像素,即二值图像中不具有特定属性的像素,变为白色像素,以使得结果图像仅包含字符(步骤S4)。也就是说,在二值图像中消除了字符以外的黑色像素。这种处理将允许示出字符每个像素的位置。
另一方面,如图3(d)所示,变换多级图像以使背景颜色填充到具有特定属性的区域(特定属性区域)中,如字符区域,以及消除具有特定属性的区域(特定属性区域),如字符区域(步骤S5)。
在接下来的步骤S6中,确定特定属性区域中的颜色。具体地确定位于彩色图像中构成特定属性区域的黑色像素位置的所有像素的颜色,并选择这种颜色数据中经常使用的一些主要颜色作为代表颜色。确定代表颜色中最接近构成字符的每一个像素的颜色或最接近每个连通分量的颜色的代表颜色。
接下来,如图3(e)所示,创建具有特定属性的像素具有为每个像素和每个连通分量所选择的代表颜色的图像(步骤S7)。在这种情况下,为每个所选择的代表颜色创建一个二值图像(或一个只具有有限颜色的多级图像)。
对在步骤S5中创建的消除了特定属性像素的图像以及在步骤S7中创建的仅包含特定属性像素的图像进行压缩编码(步骤S8)。举例来说,对前一个图像进行JPEG压缩编码,并对后一个图像进行MMR压缩编码。因此有效地减小了文件尺寸。
然后,根据与原始图像所保持的相同位置关系,创建组合文件,该文件格式(如PDF)可以将背景图像(消除了特定属性区域的图像)和字符图像(仅含有特定属性像素的图像)组合显示(步骤S9)。
无需减小通过上述处理创建的结果图像文件的可见性,文件尺寸可获得显著减少。理由如下所述。
尽管在图像存在像素值急剧改变的情况下,JPEG压缩不提供很高的压缩效率,但上述实施例的处理从多级图像中消除了字符区域,并且排除了字符区域的像素值的急剧改变,由此使得压缩率显著提高。此外,明显减少了字符区域中的颜色数量,并可以使得压缩率变得更高。
图4示出了本实施例中的图像处理设备1的操作组合。在本实施例中,如下所述基于图像处理程序13实现图像处理设备1的上述处理。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元21和二值图像获取单元22获取多级图像和二值图像(步骤S1和S2)。基于该多级图像,同时创建二值图像。
二值图像的创建需要使用固定阈值,以及将颜色大于该阈值的像素变为白色像素,将颜色小于该阈值的像素变为黑色像素。此外,二值图像和多级图像可能具有不同分辨率。
例如,通过上述方法创建二值图像之后,可以实现变薄处理,可以降低多级图像的分辨率,并且可以获取作为处理对象的多级图像的这种图像。
此外,可使用另一种设备来执行该二值图像的创建,并可获得通过其它设备创建的结果图像文件。
2、提取字符区域
通过使用特定属性区域提取单元24,确定字符在原始图像中的位置(步骤S3)。可以将特定属性区域提取单元24配置成从二值图像或多级图像中的任何一个获取字符区域。当从多级图像获取时,可以使用日本公开专利申请No.2002-288589提出的字符区域提取方法,当从二值图像中获取时,可以使用日本公开专利申请No.06-020092提出的字符区域提取方法。在本实施例中,基于二值图像提取构成字符的像素来作为具有特定属性的像素。
3、将字符区域以外的像素变为白色像素
通过使用白色像素置换单元25,将二值图像中的字符区域以外的像素(特定属性区域之外的像素)变为白色图像(步骤S4)。
4、创建无字符的多级图像
通过使用特定属性区域消除图像创建单元23,将背景颜色填充到相应于在上述第3项的处理中剩余的黑色像素区域的多级图像的字符区域中,并创建不包含字符的无字符多级图像(步骤S5)。
5、确定特定属性区域的颜色
通过使用特定属性区域颜色确定单元26,确定特定属性区域的颜色(步骤S6)。确定位于构成字符的黑色像素位置上的彩色图像的所有像素颜色,并选择在这种颜色数据中经常使用的一些主要颜色作为代表颜色。以及确定代表颜色中最接近构成字符的每个像素的颜色或最接近每个连通分量的颜色的代表颜色。
6、创建彩色图像
通过使用特定属性像素图像创建单元27,创建其中具有特定属性的像素具有为每个像素以及每个连通分量所选择的代表颜色的图像(步骤S7)。在这种情况下,为每一个所选择的代表颜色创建一幅二值图像(或仅含有有限颜色的一幅多级图像)。
7、图像编码
通过使用图像编码单元28,对于消除了特定属性像素的无字符图像,以及仅含有特定属性像素的减少颜色图像执行压缩编码,以便于有效减小尺寸(步骤S8)。举例来说,对无字符图像进行JPEG压缩编码以大大减小尺寸,并且这是不可逆的压缩编码。如果在降低分辨率之后进行压缩编码,尺寸将会更小。
此外,对减少颜色的图像进行可逆的压缩编码。如果是二值图像,适于进行PNG压缩编码或MMR压缩编码。如果是4级或16级图像,适于进行PNG压缩编码。
8、创建组合文件
通过使用组合文件创建单元29,将压缩的图像合并在单个文件中(步骤S9)。如果创建了能够使这些图像组合显示的文件格式,无需减少字符区域的可见性便可能创建明显减小了文件尺寸以及在某种程度上再现了原始图像的背景颜色的彩色图像。
根据本实施例,获取了作为原始图像的多级图像以及基于原始图像的二值图像,并基于该二值图像确定了具有特定属性的区域(特定属性区域)的像素,如字符区域。创建含有在生成二值图像之后确定的颜色的特定属性区域的图像,其中根据这种特定属性区域的存在,二值图像中不同于特定属性区域的像素被改变为白色像素。创建将其中的特定属性区域的像素转换为背景颜色的多级图像。执行每个图像的编码并创建每个编码图像的组合文件。本实施例无需大幅降低用作处理对象图像的多级图像的图像质量便可显著减少文件的尺寸,而即使当原始图像包含如字符和格线之类的具有特定属性的特定属性区域时,也仍然保持着特定属性区域的像素的可见性。
接下来,将根据图5至图7解释本发明的另一个优选实施例。
在图5至图7中,使用相同的附图标记来表示与图1至图4的在前述实施例中相应元素相同的元素,并将省略对它们的描述。本实施例还配置成增加对提高图像的质量及压缩率的处理。
在本实施例中,通过使用图像处理程序13实现显著的尺寸减少,不需要损失作为处理对象图像(原始图像)的多级图像中的字符可见性。
图5示出了本实施例中图像处理设备的概要处理。
首先,使用图像读取器10,诸如图像扫描仪,来获取如图3(a)所示的用作处理对象图像的多级图像(步骤S1)。
接下来,平滑处理所获取的多级图像(步骤S11)。执行该平滑处理的原因如下所述。存在这样一种情况,即由一组互不相同的精细的中间颜色的像素来表达彩色图像。如果在这种情况下为彩色图像进行二值化,字符笔划的内部变成带有内部空缺的二值图像,并且字符图像的压缩效率也降低了(见图6)。
通过对执行了这样的平滑处理的多级图像的二值化来创建如图3(b)所示的二值图像(步骤S2)。然后,提取带有特定属性的区域(特定属性区域),如字符区域(步骤S3)。
执行白色像素处理,该处理将二值图像中特定属性的区域之外的不带有特定属性的像素改变为白色像素,以使得结果图像中仅含有图3(c)所示的字符(步骤S4)。也就是说,消除了二值图像中除了字符以外的黑色像素。该处理允许按每一个像素指定字符位置。
此外,在执行白色像素处理之后,从消除了字符以外的黑色像素的二值图像中提取黑色像素的连通分量,以进一步消除太大和太小的字符(步骤S12)。太小的连通分量不是字符而是噪声的可能性被认为是很高的,并且如果不转换便创建二值图像,则会恶化压缩率。
另一方面,将多级图像转换成由背景颜色来填充带有诸如字符区域之类的特定属性的区域(特定属性区域)的图像,以创建消除了如图3(d)所示的诸如字符区域之类的具有特定属性的区域(特定属性区域)的图像(步骤S5)。
在接下来的步骤S6中,确定特定属性区域的颜色。具体地,确定位于构成特定属性区域的黑色像素的位置的彩色图像的所有像素的颜色,并选择作为代表颜色的通常在这些颜色中经常使用的一些主要颜色。以及确定代表颜色中最接近构成字符的每一个像素的颜色或最接近每个连通分量的颜色的代表颜色。
接下来,如图3(e)所示,创建其中具有特定属性的像素具有为每个像素和每个连通分量所选择的代表颜色的图像(步骤S7)。在这种情况下,为每个所选择的代表颜色创建一个二值图像(或一个只具有有限颜色的多级图像)。
随后,对在步骤S5创建的、消除了特定属性像素的图像(背景图像),以及在步骤S7创建的、仅含有特定属性像素的二值图像(字符图像)进行对比度转换(步骤S13),以削弱该对比度并创建平滑的图像。
此外,进行分辨率转换,并将消除了特定属性像素的图像(背景图像)转换为低分辨率(步骤S14)。
对在步骤S5创建的、消除了特定属性像素的图像(背景图像),以及在步骤S7创建的、仅含有特定属性像素的图像进行压缩编码(步骤S8)。例如,对前一个图像进行JPEG压缩编码,而对后一个图像进行MMR压缩编码。由此有效地减小文件尺寸。
接下来,根据与原始图像所保持的相同的位置关系,创建可以组合显示背景图像(消除了特定属性区域的图像)和字符图像(仅含有特定属性像素的图像)的格式的组合文件(步骤S9)。
无需减少上述处理所创建的结果图像文件的可见度,便可获得文件尺寸的明显减小。理由如下。尽管在图像具有像素值急剧改变的情况下JPEG压缩不提供很高压缩率,但本实施例中的上述处理从多级图像中消除了字符区域,并排除了字符区域的像素值的急剧改变,因此使得压缩率明显提高。另外,明显减少了字符区域中的颜色数量,压缩率可以变得更高。
图7示出了本实施例中图像处理设备1的功能组合。在本实施例中,基于图像处理程序13实现上述处理,并且在下面根据图7给出对它的描述。
1、获取作为处理对象图像的多级图像和基于该多级图像的二值图像
通过多级图像获取单元21和二值图像获取单元22获取多级图像和二值图像(步骤S1和S2)。基于该多级图像,创建二值图像。
接下来,通过使用平滑处理单元31对所获取的多级图像进行平滑处理(步骤S11)。执行该平滑处理的原因如下所述。存在由一组互不相同的精细的中间颜色的像素来表达彩色图像的情况。如果在这种情况下为彩色图像进行二值化处理,字符笔划的内部变成带有内部空缺的二值图像,并且字符图像的压缩效率也降低了(见图6)。
此外,可以对消除了字符区域的彩色图像(背景图像)进行图像平滑处理。理由如下。由于背景图像受到JPEG压缩编码,通过该平滑处理提高了压缩率,并且这对抑制由于低分辨率图像而可能出现的波纹是有效的。
创建二值图像所必需的是只是使用固定阈值,以及将具有亮于该阈值的颜色的像素改变为白色像素,以及将具有暗于该阈值的像素转化为黑色像素。此外,二值图像和多级图像可能具有不同的分辨率。
举例来说,在通过上述方法创建二值图像之后,可以实现变薄处理,多级图像的分辨率可以变得更低,并可以获取这种图像以作为处理对象的多级图像。
此外,可以使用另一种设备来执行二值图像的创建,以及可以获取由其它设备创建的结果图像文件。
2、提取字符区域
通过使用特定属性区域提取单元24,确定字符在原始图像中的位置(步骤S3)。可以将特定属性区域提取单元24配置成从二值图像或多级图像中获取字符区域。当从多级图像获取时,可以使用日本公开专利申请No.2002-288589提出的字符区域提取方法,当从二值图像中获取时,可以使用日本公开专利申请No.06-020092提出的字符区域提取方法。在本实施例中,基于二值图像提取构成字符的像素,作为具有特定属性的像素。
3、将字符区域以外的像素变为白色像素。
通过使用白色像素置换单元25,将二值图像中的字符区域以外的像素(特定属性区域以外的像素)变为白色图像(步骤S4)。
此外,在进行了白色像素处理之后,通过使用连通分量尺寸检查单元32,从消除了字符以外的黑色像素的二值图像中提取黑色像素的连通分量,以进一步消除太大和太小的字符(步骤S12)。理由如下。太小的连通分量不是字符而是噪声的可能性被认为是很高的,并且如果不进行转换便创建二值图像,则会恶化压缩率。由于字符区域的提取在技术上是困难的,并且无需提取正确的字符区域,因此,当图的区域以及照片区域位于在前图像中时,这其中也可能会出现错误并误认为是字符。
此外,太大的连通分量不是字符的可能性被认为是很高的。即使当大的连通分量确实是字符,却根据这种处理被意外地归分到背景中的时候,这种连通分量的尺寸对人眼的识别来说也是足够大的。
4、创建无字符的多级图像
通过使用特定属性区域消除图像创建单元23,获得多级图像,该多级图像相应于通过处理3保留的黑色像素区域,其通过背景颜色隐藏了多级图像的字符区域,并不含有字符(步骤S5)。
5、确定特定属性区域的颜色
通过使用特定属性区域颜色确定单元26,确定特定属性区域的颜色(步骤S6)。确定位于构成字符的黑色像素位置上的彩色图像的所有像素颜色,并选择在该颜色数据中经常使用的一些主要颜色作为代表颜色。以及确定代表颜色中最接近构成字符的每个像素的颜色或最接近每个连通分量的颜色的代表颜色。
6、创建彩色图像
通过使用特定属性像素图像创建单元27,创建其中具有特定属性的像素具有为每个像素以及每个连通分量选择的代表颜色的图像(步骤S7)。在这种情况下,为每一个所选择的代表颜色创建一幅二值图像(或仅含有有限颜色的一幅多级图像)。
此外,通过对比度调整单元33,将消除了特定属性像素的图像(背景图像)的转换与仅包含特定属性像素的二值图像(字符图像)进行对比度转换(步骤S13)。削弱对比度并随后进行图像的平滑处理。理由如下。当在进行背景图像的JPEG压缩编码的情况下像素值几乎没有改变时,压缩率变高。由于对字符图像进行了MMR压缩编码,即使在执行了对比度转换时,对尺寸也没有影响。然而,为了在显示组合文件时产生不自然的色调,对字符图像进行了与背景图像相同的对比度转换。
另外,对在步骤S5创建的、消除了特定属性像素的图像(背景图像)以及在步骤S7创建的、仅含有特定属性像素的二值图像(字符图像)进行对比度转换(步骤S13)。削弱该对比度并随后进行平滑处理。
此外,执行分辨率转换,以将消除了特定属性像素的图像(背景图像)的分辨率转换为低分辨率(步骤S14)。由于即使背景图像的分辨率稍有降低,对可见度的影响相对于字符图像来说是很小的,因此可考虑该压缩率并创建低分辨率。
7、图像编码
通过使用图像编码单元28,对不含有字符的多级图像以及组成字符的减少颜色的图像进行编码,并压缩图像的尺寸(步骤S8)。举例来说,对无字符图像进行JPEG压缩编码以大大减小尺寸,并且这是不可逆的压缩编码。如果在降低分辨率之后进行压缩编码,尺寸将会更小。
此外,对减少颜色的图像进行可逆的压缩编码。如果是二值图像,适于进行PNG压缩编码或MMR压缩编码。如果是4级或16级图像,适于进行PNG压缩编码。
8、创建组合文件
通过使用组合文件创建单元29,创建合并了编码图像的组合图像(步骤S9)。
如果将编码图像合并成能够集中显示这些图像的格式的文件,可以创建无需降低字符区域的可见度便可明显减小文件尺寸、以及在某种程度上再现了原始图像的背景颜色的彩色图像。
接下来,将参照图8和图9解释本发明的另一优选实施例。
在该实施例中,通过使用图像处理程序13实现显著的尺寸减少,无需损失作为处理对象图像(原始图像)的多级图像中的字符可见度。
参照图8的流程图来解释本实施例的概要处理。
在图8的处理中,使用诸如图像扫描仪之类的图像读取器10获取图3(a)示出的用作处理对象图像的多级图像(步骤S101)。
通过多级图像的二值化创建如图3(b)所示的二值图像(步骤S102)。然后,提取带有特定属性的区域(特定属性区域),如字符区域(步骤S103)。
如图3(c)所示,执行将二值图像中不具有特定属性的像素(特定属性区域以外的像素)改变为白色像素的白色像素处理,以便可以仅剩下字符(步骤S104)。也就是说,在二值图像中消除字符以外的黑色像素。该处理将按照每个像素示出字符的位置。
此外,从消除了字符之外的黑色像素的二值图像中提取黑色像素的连通分量,并进一步消除太大和太小的连通分量(步骤S105)。
由于噪声等,如果存在不是字符使其成为最顶端的二值图像的可能性,太小的连通分量将导致压缩率的降低。也就是说,在步骤S104和步骤S105将示按照每个像素出字符的位置。
另一方面,如图3(d)所示,多级图像使其成为由背景颜色中具有特定属性的区域(特定属性区域),如字符区域,填充的图像,并创建消除了诸如字符区域之类的具有特定属性的区域的图像(步骤S106)。
在接下来的步骤S107确定特定属性区域的颜色。具体地,确定位于构成特定属性区域的黑色像素位置上的彩色图像的所有像素颜色,并选择这些颜色数据中常用的一些主要颜色作为代表颜色。以及确定代表颜色中最接近构成字符的每个像素的颜色或最接近每个连通分量的颜色的代表颜色。
接下来,如图3(e)所示,创建其中具有特定属性的像素具有为每个连通分量判断的颜色以及每个像素的图像(步骤S108)。虽然多级图像仅具有有限颜色便足够了,并且每个颜色都可能具有它们的二值图像,假设每个颜色具有一个二值图像。
从在步骤S106创建的消除了特定属性像素的图像以及在步骤S108创建的仅由特定属性像素构成的图像中创建压缩图像(步骤S109)。例如,如果前一个执行JPEG压缩以及后一个执行MMR压缩,则文件尺寸将会有效变小。
然后,将编码图像合并在文件中,该文件的格式可以组合显示以下图像:具有与原始图像所保持的相同位置关系的背景图像(消除了特定属性区域的图像),以及字符图像(仅包含特定属性像素的图像)(步骤S110)。
无需减少上述处理所创建的图像文件的可见度,便可获得文件尺寸的显著压缩。理由如下。如果通过在此描述的方法消除了字符区域,尽管JPEG压缩对具有像素值急剧改变的图像不具有很好的压缩率,但由于将不会存在字符区域的像素值改变,压缩率将变好。另外,由于字符区域极大地减少了颜色数目,在此压缩效率也变好了。
参照图9,将解释说明图像处理设备1的功能组合。基于图像处理程序13通过图像处理设备1来实现这些功能。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元121和二值图像获取单元122获取多级图像和二值图像(步骤S101和S102)。基于该多级图像,创建二值图像。
二值化方法需要固定的阈值以及使用该方法,如将亮度高于该阈值的像素设定为白色像素,以及将较暗的像素设定为黑色像素。此外,不同的分辨率满足二值图像和多级图像。
例如,通过上述方法创建二值图像之后,可以进行变薄处理,降低多级图像的分辨率,并且可被获取作为处理对象的多级图像。
此外,可使用另一种设备来执行该二值图像的创建并获得所创建的图像文件。
2、提取字符区域
通过使用特定属性区域提取单元124,确定字符在原始图像中的位置(步骤S103)。可以将特定属性区域提取单元124配置成从二值图像或多级图像中获取字符区域。当从多级图像获取时,可以使用日本公开专利申请No.2002-288589提出的字符区域提取方法,当从二值图像中获取时,可以使用日本公开专利申请No.06-020092提出的字符区域提取方法。在本实施例中,基于二值图像提取构成字符的像素,作为具有特定属性的像素。
3、将字符区域之外的像素变为白色像素。
通过使用白色像素置换单元125,将二值图像中的字符区域以外的像素(特定属性区域以外的像素)变为白色像素(步骤S104)。
4、检查连通分量
连通分量尺寸检查单元128从消除了字符以外的分量的二值图像中提取的黑色像素的连通分量,并进一步消除太大和太小连通分量(步骤S105)。太小的连通分量不是字符而是噪声的可能性是很高的,并且如果没有改变就创建二值图像,将恶化压缩率。
此外,由于字符区域的提取在技术上是困难的,并且正确的字符区域是不需要提取的,因此当视图的区域或照片的区域在前一个图像中时,也存在误认为是字符的可能性。
此外,太大的连通分量不是字符的可能性被认为是很高的。即使当大的连通分量确实是字符却根据这种处理将其意外地归入到背景中时,这种连通分量的尺寸对于人眼的识别来说也是足够大的。
5、创建无字符的多级图像
通过使用特定属性区域消除图像创建单元123,将背景颜色填充到相应于在上述第3项的处理中剩余的黑色像素区域的多级图像的字符区域中,并创建不包含字符的无字符多级图像(步骤S106)。
6、确定特定属性区域的颜色
通过使用特定属性区域颜色确定单元126,确定特定属性区域的颜色(步骤S107)。确定位于构成字符的黑色像素位置上的彩色图像的所有像素颜色,并选择在这种颜色数据中经常使用的一些主要颜色作为代表颜色。以及确定代表颜色中最接近构成字符的像素的每个像素的颜色或最接近每个连通分量的颜色的代表颜色。
7、创建彩色图像
通过使用特定属性像素图像创建单元127,创建其中带有特定属性的像素具有为每个像素以及每个连通分量所选择的代表颜色的图像(步骤S108)。在这种情况下,为每一个所选择的代表颜色创建一幅二值图像(或仅含有有限颜色的一幅多级图像)。
8、图像编码
通过使用图像编码单元129,对不包含字符的多级图像以及构成字符的减少颜色的图像进行编码,以便于有效减小尺寸(步骤S109)。举例来说,对无字符图像进行JPEG压缩编码以便大大减小尺寸,并且这是不可逆的压缩编码。如果在降低了分辨率之后进行压缩编码,尺寸将会更小。
此外,对减少颜色的图像进行可逆的压缩编码。如果是二值图像,适于进行PNG压缩编码或MMR压缩编码。如果是4级或16级图像,适于进行PNG压缩编码。
9、创建组合文件
通过使用组合文件创建单元130,将压缩图像合并在一个单一文件中(步骤S110)。如果创建了能够使这些图像组合显示的格式的文件,便可能创建无需减少字符区域的可见性就可以明显减小文件尺寸以及在某种程度上再现原始图像的背景颜色的彩色图像。
根据本实施例,消除了具有特定属性的区域(特定属性区域),如字符区域,的像素值急剧改变。即使使用了不适于像素值急剧改变的图像的压缩技术,如JPEG压缩编码,压缩率也可能是适合的。可以通过急剧减少颜色数量来使得诸如字符区域这样的具有特定属性的区域(特定属性区域)的压缩率是适合的。无需将作为处理对象图像的多级图像的图像质量降低太多,便可以获得文件尺寸的明显减小。以及,即使存在如字符和格线之类的具有特定属性的区域(特定属性区域),也仍然可以保证特定属性区域的像素的可见性。
接下来,将参照图10-13解释说明本发明的另一个优选实施例。
在下文中,使用相同的附图标记来表示与在前实施例中相应元素相同的元素,并将省略对它们的描述。
在本实施例中,还增加了对提高图像质量和可压缩性的处理。
如之前对图8的描述,通过使用特定属性像素图像创建单元127在像素基础上或连通分量基础上确定颜色(步骤S108),但这种处理存在下述问题。
(1)如果执行每个像素的着色,当通过抖动来表示中间色调的字符时,像素颜色在非常精细的分量的单元上改变。在这种情况下,所创建的字符图像具有噪点的增长量,并且压缩率将恶化。
(2)如果执行每个连通分量的着色,当关于连通分量属于哪种颜色的确定是错误的时候,结果图像的质量将变差。虽然,即使每个像素的着色是错误的并不会对人眼产生很大的影响,但如果每个连通分量的着色是错误的,由于连通分量的尺寸很大,其将会是明显的。
为了避免这种问题,在本实施例中,通过将图像分割成固定尺寸网格部分并确定网格部分上的颜色,创建具有上述第(1)项和第(2)项之间的中间特征的图像。
网格部分的尺寸适于做成对人眼来几乎不明显的尺寸。假定本实施例中的网格部分的一个块由2×2个像素构成。
此外,由于即使连通分量的颜色中存在很小尺寸的错误也是不明显的,因此如果在这种情况下按照每个连通分量着色,当错误上升时,图像质量的压缩率也将不会有太大下降,而不是按照每个网格进行着色。
图10是用于解释所增加的处理的流程图。图10的流程图解释了图8的特定属性区域颜色确定(步骤S107)以及特定属性区域图像创建(步骤S108)的处理。
首先,在步骤S121计算字符区域的代表颜色。将解释说明字符区域的代表颜色的详细计算。图11是用于举例说明代表颜色计算方法的流程图。
计算在多级图像上与二值图像的黑色像素的位置相同的像素值,并创建像素值的直方图(步骤S151)。例如,需要将RGB空间分割成4×4×4的相等的块,确定目标像素位于相关块的什么位置,以及将相应空间的频率值加1。
确定具有高频率值的块,并根据频率值指定每个块的优先顺序(步骤S152)。这些块被称为代表颜色候选块。
从最高优先级的块开始,确定相关块是否无颜色或者是否非彩色(步骤S153)。假设如果块的RGB中心值(块的RGB中间值)几乎相同,则所述的块无颜色。
当步骤S153的结果是否定的,将控制转移到对下一个优先级的块的检查(步骤S157)。
如果步骤S153的结果是肯定的,确定上一级候选者中非彩色的数量是否大于第一给定数(步骤S154)。如果非彩色的数量达到第一给定数,则从代表颜色候选者中去除相应的块(步骤S156)。否则,递增非彩色的数量并进行下一个处理(步骤S155)。
重复步骤S152-S156的处理直到完成了对所有代表颜色候选块的检查(步骤S157)。
当步骤S157的结果是肯定时,从剩余的、没有被去除的代表颜色候选块的最高优先级开始将处于第二给定数的颜色作为代表颜色的颜色输出(步骤S158)。
回过来参照图10,在下一个步骤S122中,对步骤S121计算的字符区域的每个代表颜色创建具有代表颜色以及“透明”像素值的二值图像。使所有早先的像素值成为“透明”。
接下来,在步骤S123获取连通分量的信息。该连通分量是构成字符的像素的连通分量。
并在步骤S124检查连通分量的尺寸,当连通分量小于预先定义的尺寸时,向前执行(步骤S124为N)步骤S125,确定哪一种代表颜色应该按照每个连通分量来着色。
具体地,需要确定位于构成连通分量的像素位置的原始图像的平均像素值,计算其与代表颜色之间的距离,并选择最接近的代表颜色。
随后,将构成连通分量的像素写入到像素值中具有在步骤S125选择的代表颜色的二值图像中(步骤S126),以及将写入到二值图像结尾的连通分量信息消除(步骤S127)。
另一方面,当连通分量超过预先定义的尺寸时,返回到步骤S123(步骤S124为是),并获取另一个连通分量的信息。
重复以上步骤S123-S127的处理直到检查了所有的连通分量的信息(步骤S128为是)。
所有连通分量信息的检查的结尾将原始图像分割为网格形状(步骤S129)。(步骤S128为是)
如图12A和图12B所示,假设将整个图像分割成2×2像素大小的块。
接下来,顺序检查各个网格区域。
首先,确定目标网格区域是否在可被认为是字符的连通分量上(步骤S130)。由于当连通分量上没有像素时则表示其中不存在字符(步骤130为否)及其区域,则检查下一个网格。
当它在连通分量上时,则表示其中存在字符(步骤S130为是)以及可适用网格区域。
接着,确定网格区域是否在连通分量的边界部分(末端)(步骤S131)。如果是图13所示的整个网格构成连通分量的像素,则断定在边界上没有像素。
当断定在边界上没有像素时(像素在内部),计算网格内的像素值以及它们的平均值(步骤S131为否),并选择靠近该平均值的代表颜色(步骤S132)。
另一方面,当确定像素在边界中时(内部没有像素),在网格内并构成连通分量的像素中选择亮度最低的像素(步骤S131为是),并选择最接近它的代表颜色(步骤S133)。
因此,不对边界区域使用平均值的原因是由于在混合背景的颜色时,在许多情况下边界附近挤进这种像素值并取得平均值,背景颜色的影响具有很强值。
由于它是由实际字符颜色构成,因此倾向于断定背景颜色附近是最接近于代表颜色的颜色,并且如果背景颜色的影响很大,当它再次作为字符图像出现时将变得不自然。
将网格中构成连通分量的像素写到具有所选择的代表颜色作为像素颜色的二值图像中(步骤S134)。如图13所示,由于不是如其本身一样将网格的形式写入到二值图像中,而是仅将网格中构成连通分量的像素部分写入,因此分辨率不会下降。
重复上述步骤S130-S134的处理直到检查了所有网格部分(步骤S135为是)。
因此,在本实施例中,提供了分别确定不同颜色的多种颜色确定方法。例如,下述的多种颜色确定方法:
(1)确定每个连通分量的颜色的方法;
(2)确定每个块的颜色的方法(对代表颜色的选择使用平均颜色);
(3)确定每个块的颜色的方法(对代表颜色的选择使用最暗的颜色)。
通过选择其中一种方法以及根据情况结合使用上述方法,就可能平衡结果图像的质量和处理时间。
此外,如果在步骤S103中提取了具有特定属性的区域(特定属性区域),如字符区域,则可能使得当原始图像的分辨率较低时,在本实施例中错误地使用了具有高分辨率的图像。因此,当发现特定属性区域时,可以增加精确度。
相反,如果在原始图像的分辨率很高时,使用了低分辨率的图像,其将导致处理时间的缩短。
图8-图13的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,用于获取作为处理对象图像的多级图像;二值图像获取单元,用于获取基于多级图像而创建的二值图像;特定属性区域提取单元,用于从多值图像中提取为具有特定属性的区域的特定属性区域;白色像素置换单元,用于将二值图像中除特定属性区域之外的像素改变为白色像素;连通分量尺寸检查单元,用于从二值图像中提取黑色像素的连通分量,对连通分量的尺寸进行分类,并将太大或太小的部分改变为白色像素,其中在所述二值图像中,通过白色像素置换单元将其中的特定属性区域以外的像素改变为白色像素;特定属性区域消除图像创建单元,用于创建由背景颜色改变了特定属性区域的像素的多级图像;特定属性区域颜色确定单元,用于确定特定属性区域的颜色;特定属性像素图像创建单元,用于创建具有特定属性区域颜色确定单元所确定的颜色的特定属性区域的图像;图像编码单元,用于对分别由特定属性区域消除图像创建单元以及特定属性像素图像创建单元创建的两幅或多幅图像进行压缩编码;以及组合文件创建单元,用于创建合并了来自于图像编码单元的编码图像的组合文件。
根据本发明,消除了如字符区域那样的具有特定属性的区域(特定属性区域)的像素值的急剧改变。即使使用了不适于像素值急剧改变的图像的压缩技术,如JPEG压缩编码,也可能获得适当的压缩率。通过大量减少颜色数量,可以使得如字符区域那样具有特定属性的区域(特定属性区域)的压缩率变得合适。无需将用作处理对象图像的多级图像的图像质量减少太多,就可以得到文件尺寸的明显减少。并且即使存在如字符或格线那样具有特定属性的区域(特定属性区域),也可以保证特定属性的像素的可见度。
上述图像处理设备可以被配置为使得特定属性区域颜色确定单元包括:图像分割单元,用于将多级图像分割为固定的区域;和颜色确定单元,用于确定由图像分割单元创建的每一个固定区域的颜色。
上述图像处理设备可以被配置为使得颜色确定单元包括:多个颜色确定单元,用于分别确定不同的颜色,并使用从所述多个颜色确定单元中选择的一个、根据连通分量大小检查单元给定的连通分量的大小的分类来确定特定属性区域的颜色。
上述图像处理设备可以被配置为使得颜色确定单元包括:多个颜色确定单元,用于分别确定不同的颜色,并且,为了确定特定属性区域的颜色,在其中两个或多个像素位于特定属性区域的情况和其中两个或多个像素单元位于特定属性区域以外的区域与特定属性区域的边界上的情况之间选择多个颜色确定单元中的一个。
上述图像处理设备可以被配置为使得提供特定属性区域提取单元,当从多级图像中提取作为具有特定属性的区域的特定属性区域时,将多级图像的分辨率改变为另一种分辨率。
图8-图13的实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取基于多级图像而创建的二值图像;从多级图像中提取作为具有特定属性的区域的特定属性区域;将二值图像中的特定属性区域以外的像素变为白色像素;从二值图像中提取黑色像素的连通分量,其中由白色像素置换单元将特定属性区域以外的像素改变为白色像素;将连通分量的大小分类;将太大或太小的连通分量改变为白色像素;创建用背景颜色改变特定属性区域的像素的多级图像;确定特定属性区域的颜色;创建具有由特定属性区域颜色确定步骤所确定的颜色的特定属性区域的图像;分别对由特定属性区域消除图像创建步骤和特定属性像素图像创建步骤创建的两个或更多图像分别进行压缩编码;以及创建合并了在图像编码步骤创建的编码图像的组合文件。
上述计算机程序产品还被配置为使得特定属性区域颜色确定步骤包括步骤:将多级图像分割为固定的区域;和确定在图像分割步骤创建的每一个固定区域的颜色。
上述计算机程序产品可以被配置为使得,在颜色确定步骤中:分别提供多个颜色确定方法,用于确定不同的颜色,并使用从所述多个颜色确定方法中选择的一个、根据连通分量大小检查步骤中给定的连通分量的大小的分类来确定特定属性区域的颜色。
上述计算机程序产品可以被配置为使得,在颜色确定步骤中,提供多个颜色确定方法,用于分别确定不同的颜色,并且,为了确定特定属性区域的颜色,在其中两个或多个像素位于特定属性区域的情况和其中两个或多个像素单元位于特定属性区域以外的区域与特定属性区域的边界上的情况之间选择多个颜色确定方法中的一个。
上述计算机程序产品可以被配置为使得提供特定属性区域提取步骤,当从多级图像中提取作为具有特定属性的区域的特定属性区域时,将多级图像的分辨率改变为另一种分辨率。
图8-图13的上述实施例提供了一种计算机可读存储介质,存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取基于多级图像而创建的二值图像;从多级图像中提取作为具有特定属性的区域的特定属性区域;将二值图像中的特定属性区域以外的像素变为白色像素;从二值图像中提取黑色像素的连通分量,其中由白色像素置换单元将特定属性区域以外的像素改变为白色像素;将连通分量的大小分类;将太大或太小的连通分量改变为白色像素;创建用背景颜色改变特定属性区域的像素的多级图像;确定特定属性区域的颜色;创建具有由特定属性区域颜色确定步骤所确定的颜色的特定属性区域的图像;分别对由特定属性区域消除图像创建步骤和特定属性像素图像创建步骤创建的两个或更多图像进行压缩编码;以及创建合并了在图像编码步骤创建的编码图像的组合文件。
接下来,将根据图14至图18解释说明本发明的另一个优选实施例。
为了通过使用图3的方法提高可压缩性,创建仅包含消除了字符的背景的图像是很重要的。
通过消除字符,字符区域与周围区域的像素值之间的差异将变小,并且通过图像编码提高了压缩效率以及可以抑制蚊子(mosquito)噪声的出现。
然而,如图19(a)所示,在多级图像中平滑地变化字符的边界部分。尽管在执行了二值化(图19(b))的情况下,将位于使用某个阈值进行了平滑改变的位置上的边界变为单色,如果该位置是如其本身一样用作二值图像的黑色像素,其将保留,而不需要消除字符的轮廓区域(图19(c))。
由于仍将保有与周围的像素值的差异,保留的区域将使得压缩率降低以及由于蚊子噪声恶化图像的质量。
为了解决该问题,本实施例的技术目的是抑制在消除时间内保留字符轮廓的现象,以及改善可压缩性和图像质量。
图14示出了本实施例中图像处理设备1的功能组成。在本实施例中,如下所示,图像处理设备1的处理是基于图像处理程序13实现的。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元21和二值图像获取单元22获取多级图像和二值图像(S1,S2)。基于该多级图像,创建二值图像。
二值图像的创建所需要的是使用固定阈值,并将颜色亮于该阈值的像素改变为白色像素、以及颜色暗于该阈值的像素改变为黑色像素。此外,二值图像和多级图像可能具有不同分辨率。
例如,通过上述方法创建二值图像之后,可以进行变薄处理,降低多级图像的分辨率,并且可获取这种图像作为处理对象的多级图像。
此外,可使用另一种设备来执行该二值图像的创建,并通过其它设备获得所创建的结果图像文件。
2、获取字符区域
通过使用特定属性区域提取单元24,确定字符在原始图像中的位置(S3)。从二值图像还是多级图像中获取是无所谓的。当从多级图像获取时,可以使用日本公开专利申请No.2002-288589提出的字符区域提取方法,当从二值图像中获取时,可以使用日本公开专利申请No.06-020092提出的字符区域提取方法。在本实施例中,基于二值图像提取构成字符的像素,作为具有特定属性的像素。
3、将字符区域以外的像素变为白色像素。
通过使用白色像素置换单元25,将二值图像中的字符区域之外的像素(特定属性区域之外的像素)变为白色像素(S4)。
4、用背景颜色改变字符区域的像素
通过使用特定属性区域消除图像创建单元23,创建消除了特定属性区域(字符区域)的图像(S5)。所必需的恰是创建由彩色图像中的周围颜色来替换字符部分的像素的图像。
5、确定特定属性区域的颜色
通过使用特定属性区域颜色确定单元26,确定特定属性区域(字符区域)的颜色(S6)。确定位于构成字符的黑色像素位置上的彩色图像的所有像素颜色,并选择在这种颜色数据中经常使用的一些主要颜色作为代表颜色。以及确定代表颜色中最接近构成字符的每个像素的颜色或最接近每个连通分量的颜色的代表颜色。
6、创建特定属性像素图像
通过使用特定属性像素图像创建单元27,创建具有特定属性的像素具有为每个像素以及每个连通分量选择的代表颜色的图像(S7)。在这种情况下,为每一个所选择的代表颜色创建一幅二值图像(或仅含有有限颜色的一幅多级图像)。
7、图像编码
通过使用图像编码单元28,为其中消除了特定属性像素的无字符图像,以及仅含有特定属性像素的颜色减少图像执行压缩编码,以便于创建压缩图像(S8)。举例来说,为了有效减小文件尺寸,对无字符图像进行JPEG压缩编码,对减少了颜色的图像进行MMR压缩编码。
8、创建组合文件
通过使用组合文件创建单元29,将压缩图像合并在一个单一文件中(S9)。如果合并了这些图像,它变成字符粘贴于背景上的形式,并可以简单地将其认作为原始图像。
参照图15和图16的流程图示出的概括性功能框图将详细描述通过特定属性区域消除图像创建单元23执行的、尤其是通过这种操作形式表现的步骤S5的处理。此外,在图16中,省略并简单化了对不直接相关的部分的说明。
首先,获取处理对象图像(S5a)。处理对象图像是多值的原始图像,并且可以从多级图像获取单元21获得。
获取替换了像素值的像素(S5b)。这是步骤S4获取的二值图像,并且是黑色像素相应的部分。该图像可以通过白色像素置换单元25获取。
在替换处理后获取像素值(S5c)。将与作为替换对象的黑色像素的周围区域的白色像素的位置相同的像素值用作替换后的像素值。这通过置换像素获取单元23a来获得。
使用像素值置换单元23b将置换后的像素值取代要进行置换的像素的值(S5d)。
使用边界像素指定单元23c获取替换了的像素以及没有替换的像素的边界位置(S5e)。在本实施例中,将存在于构成字符的黑色像素的边界线以外部分的1个像素、以及构成字符以外部分的白色像素转换到边界位置,并且这是针对相关的像素。在图6示出的例子中,斜线部分是边界像素。
使用边界像素图像处理单元23d对边界位置中存在的像素进行图像处理(S5f)。
一些方法可认为适用于图像处理。将执行(R1,G1,B1)后的像素值以及在进行图像处理之前对像素值的图像处理设置为(R2,G2,B2)。
图18示出了消除了字符的多级图像的边界位置的边界像素。将对该边界像素(斜线部分)进行图像处理。
a.亮度补偿处理
通过与固定值相乘来提高亮度,如R2=R1×V,G2=G1×V,以及B2=B1×V(V是常数)。由于RGB每一部分的比例不改变,通常仅有亮度会改变。
b.色调补偿处理
使用固定值,如R2=R1+VR,G2=G1+VG,以及B2=B1×VB(VR,VG,以及VB是常数)。通过使用对RGB每一部分不同的值来改变色调。亮度也依靠该值来改变。
c.平滑处理
如果用(RL,GL,BL)以及(RR,GR,BR)来设置左右邻接的像素值,则通过R2=(RL+RR+R1)/3,G2=(GL+GR+G1)/3,B2=(BL+BR+B1)/3的计算来执行该平滑处理。
d.加权平均值运算处理
该处理也可以称为是一种平滑处理。例如,R2=(RL+RR+R1×2)/4,G2=(GL+GR+G1×2)/4,B2=(BL+BR+B1×2)/4的计算可以通过改变权值来改变字符轮廓的平滑量。
通过上述处理,在消除了字符的图像中,保留在轮廓区域的字符颜色淡化,并且可以期待对可压缩性以及抑制蚊子噪声的进一步改善。
图14-图18的上述实施例提供了一种图像处理设备,其包括:图像获取单元,获取处理对象图像;像素获取单元,获取处理对象图像中用于进行像素值置换的像素;像素值获取单元,获取像素值置换后的像素值;像素值置换单元,将所获取的像素的像素值改变为所获取的像素值;边界像素指定单元,在用于进行像素值置换的像素以及处理对象图像中不进行像素值置换的像素之间确定边界位置;以及边界像素图像处理单元,对处理对象图像中位于边界位置的像素的像素值执行图像处理。
根据本发明,当通过用预定像素值替换关于处理对象图像的预定像素的像素值来执行消除处理时,对在边界线的外部不替换像素值的像素部分执行预定图像处理(例如,光补偿、色调补偿、平滑、与周围像素的加权平均运算的处理等)。可以抑制其中相关像素部分保留为轮廓的现象,并因此可以达到改进可压缩性和改进图像质量的目的。
上述图像处理设备可以被配置为使得提供边界像素图像处理单元,对处理对象图像中位于进行像素值置换的像素以外位置的像素值执行图像处理。
上述图像处理设备可以被配置为使得提供边界位置指定单元,用于在处理对象图像中仅获取不进行像素值置换的像素。
上述图像处理设备可以被配置为使得图像处理是亮度补偿处理。
上述图像处理设备可以被配置为使得图像处理是色调补偿处理。
上述图像处理设备可以被配置为使得图像处理是平滑处理。
上述图像处理设备可以被配置为使得图像处理是与周围像素有关的加权平均运算。
图14-图18的上述实施例提供了一种图像处理方法,包括以下步骤:获取处理对象图像;获取处理对象图像中用于进行像素值置换的像素;获取像素值置换后的像素值;将所获取的像素的像素值改变为所获取的像素值;在用于进行像素值置换的像素以及处理对象图像中不进行像素值置换的像素之间确定边界位置;以及关于处理对象图像中位于边界位置的像素的像素值执行图像处理。
图14-图18的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取处理对象图像;获取处理对象图像中用于进行像素值置换的像素;获取像素值置换后的像素值;将所获取的像素的像素值改变为所获取的像素值;在用于进行像素值置换的像素以及处理对象图像中不进行像素值置换的像素之间确定边界位置;以及关于处理对象图像中位于边界位置的像素的像素值执行图像处理。
上述计算机程序产品可以被配置为使得关于处理对象图像中位于进行像素值置换的像素以外的像素的像素值而执行图像处理。
上述计算机程序产品可以被配置为使得在边界位置确定步骤中,仅获取在处理对象图像中不进行像素值置换的像素。
上述计算机程序产品可以被配置为使得图像处理是亮度补偿处理。
上述计算机程序产品可以被配置为使得图像处理是色调补偿处理。
上述计算机程序产品可以被配置为使得图像处理是平滑处理。
上述计算机程序产品可以被配置为使得图像处理是结合周围像素的加权平均运算。
图14-图18的上述实施例提供了一种计算机可读存储介质,存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括以下步骤:获取处理对象图像;获取处理对象图像中用于进行像素值置换的像素;获取像素值置换后的像素值;将所获取的像素的像素值改变为所获取的像素值;在用于进行像素值置换的像素以及处理对象图像中不进行像素值置换的像素之间确定边界位置;以及关于处理对象图像中位于边界位置的像素的像素值执行图像处理。
接下来,将参照图20至图25解释说明本发明的优选实施例。
在本实施例中,当实现尺寸明显减小时,通过使用图像处理程序13,无需损失作为处理对象图像(原始图像)的多级图像的字符可见性,便基于字符代码进行检索。
参照图20和图21解释说明本实施例的处理概况。
首先,使用图像读取器10,如图像扫描仪,获取如图21(a)所示的作为处理对象图像的原始图像的多级图像(彩色图像)(步骤S201)。
并通过二值化这种多级图像来创建图21(b)所示的二值图像(步骤S202)。接下来,提取字符部分(步骤S203)。以及执行白色像素处理,该处理通过二值图像将除字符部分以外的像素改变为白色像素,以便仅剩余字符部分,如图21(c)所示(步骤S204)。也就是说,在二值图像中消除字符以外的黑色像素。该处理将按照像素示出字符的位置。
在接下来的步骤S205中确定字符部分的颜色。具体地,确定彩色图像中位于构成字符部分的黑色像素位置上的所有像素的颜色,并从这些数据中选择经常使用的一些主要颜色作为代表颜色。以及确定是否每个像素以及构成字符的每个连通分量的像素最接近某个代表颜色。
接着,如图21(d)所示,创建具有特定属性的像素(字符部分)具有每个像素及为每个连通分量确定的颜色的图像(步骤S206)。尽管只带有有限颜色的多级图像是足够的,并且可以拥有每种颜色的每一个二值图像,假设每种颜色具有每一个二值图像。
另一方面,使多级图像成为用背景颜色改变字符部分的像素值的图像,并创建如图21(e)所示的消除了字符部分的图像(步骤S207)。填充了背景颜色的图像被认为是不具有重要信息的图像,并如图21(f)所示,执行低分辨率处理(步骤S208)。
从在步骤S208创建的消除了字符部分的低分辨率图像,以及在步骤S206创建的仅由字符部分构成的每种颜色的二值图像中创建压缩图像(步骤S209)。举例来说,如果对前一幅图像执行JPEG压缩并对后一幅图像进行MMR压缩,文件尺寸将明显变小。
在接下来的步骤S210中,进行字符识别处理并创建字符代码。对原始图像(彩色图像)或二进制字符图像(仅由字符部分构成的图像)进行字符识别处理。尽管处理时间需要对原始图像(彩色图像)进行字符识别处理的优点,却也获得了高精度字符识别处理。
在另一方面,虽然如果对通过上述处理获得的二值字符图像执行字符识别处理,由于将对二值图像执行字符识别处理是高速的,但另一方面由处理获得的二值图像质量的结果可能会下降。
接下来,需要选择执行字符识别处理的图像,并且只是通过是否需要高速执行字符识别处理或者是否需要执行高精确度的字符识别处理来使得图像转换。
此外,在原始图像以及每个字符图像中执行字符识别处理时,如果选择了更高可靠性的代码,从而使得字符识别结果的字符代码不同于坐标(coordinate)的相同字符图像的结果,则可能提高字符识别的精确度。
另外,在本实施例中,具有每一种颜色的二值字符图像,以及通过对每一个二值字符图像分别进行字符识别处理而改善精确度。
由于这种原因,对杂志进行纵向写入和横向写入的混合,并且另一部分(例如纵向写入)画出带有颜色的标识部分(如横向写入)。当执行这种字符识别处理时,可以称为是线条的提取出错了。
然而,在本实施例中,由于对每种颜色创建了另一幅二值图像,并且它创建了颜色不同的标识分割(如横向写入)以及其它部分(如纵向写入)的两幅图像,改善了字符识别的精确度。
此外,在本实施例中,具有对每种颜色的二值字符图像,以及分别对每幅二值字符图像执行字符识别处理,字符识别处理需要多倍的时间,并发生了高速处理是不可能的主题。于是,通过对每种颜色的二值字符图像执行OR处理,以及执行字符识别处理作为一页的字符图像以高速处理,来获得处理速度的改善。
接着,根据与原始图像保持的相同位置关系进行排列,这种排列的格式(如PDF文件类型)可以组合并显示,使得其包括无字符图像(消除了字符部分的图像)、二值字符图像(仅包含字符部分的图像)、字符识别结果的字符代码、以及它们的位置坐标(步骤S211)。
通过嵌入用于组合的字符代码以及它们的位置坐标,图像的可见度可以实现图像的检索,而无需降低可见度,其中位置坐标采用不同于图像的层上的透明文本的形式。
此外,尽管由PDF文件类型来组合,但也可以通过具有多层功能的方法来进行组合,如不仅仅是PDF文件类型,JPEG2000形式也可以,当然,采用多个文件来保存也是没有问题的。
当通过这种处理创建的图像文件没有减少可见度而获得文件尺寸的明显压缩时,可以基于字符代码进行搜索。理由如下。
尽管JPEG压缩对具有像素值急剧改变的图像没有很好的压缩效果,如果通过此处描述的方法消除了字符部分,由于字符部分的像素值的改变将丢失,因此效果将变好。
另外,由于字符部分急剧减少了颜色数量,也正因如此,压缩率变好。
参照示出了基于图像处理程序13实现这种流程的细节的图像处理设备1的功能的功能方框图图22,进行详细说明。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元221和二值图像获取单元222获取多级图像和二值图像(步骤S201和S202)。
基于该多级图像,创建二值图像。二值化方法所需要的是固定阈值以及仅仅使用该方法,例如将亮于该阈值的像素改变为白色像素、以及将暗像素转换为黑色像素。
此外,作为二值图像和多级图像,不同的分辨率是足够的。例如,通过该方法创建二值图像之后,可以进行变薄处理,降低多级图像的分辨率,并且可获取其作为处理对象的多级图像。
此外,可使用另一种设备来执行该二值图像的创建,并获得所创建的图像文件。
2、提取字符区域
通过使用字符部分提取单元224,创建字符存在于图像上的位置(步骤S203)。在本实施例中,基于二值图像确定构成字符的像素位置作为具有特定属性的像素。
3、将字符区域之外的像素变为白色像素
通过使用白色像素置换单元225,将二值图像中的字符区域之外的像素变为白色像素(步骤S204)。
4、确定字符区域的颜色
字符区域颜色确定单元226确定字符部分的颜色(步骤S205)。确定位于构成字符的黑色像素位置上的彩色图像的所有像素颜色,并在这种数据中选择经常使用的一些主要颜色作为代表颜色。以及确定每个像素以及构成每个连通分量的字符的像素是否最接近某一个代表颜色。
5、创建彩色图像
通过字符图像创建单元227,创建其中具有特定属性的像素(字符部分)具有每个像素及为每个连通分量断定的颜色的全彩图像(步骤S206)。尽管多级图像拥有有限的颜色已足够,并且每种颜色都具有每一个二值图像,假设每种颜色具有每一幅二值图像。
6、创建无字符的多级图像
通过使用字符部分消除图像创建单元223创建多级图像,其中该图像中相应于在上述第3项的处理中保留的黑色像素部分的字符部分的像素值被改变为背景颜色,并且不具有字符(步骤S207)。
7、图像编码
通过使用图像编码单元228,对没有字符的仅由多级图像构成的每种颜色的二值图像以及字符的二值图像进行编码,并压缩尺寸(步骤S209)。这其中,不具有字符的多级图像的重要信息表示不存在任何东西,并通过JPEG等实现不可逆的高度压缩。如果在降低了分辨率之后进行压缩,尺寸将会变得更小。
此外,实现仅包含字符的每种颜色的二值图像的可逆压缩。
如果是二值图像,适于进行PNG压缩或MMR压缩等,诸如4值或16值,适于进行PNG压缩编码等。
8、字符识别
通过字符识别单元230,对原始图像(彩色图像)或二值字符图像(仅由字符部分构成的图像)进行字符识别处理,并创建字符代码(步骤S210)。
特别的,字符识别处理不限于本方法,并建议使用迄今为止的不同字符识别方法来执行。
虽然,作为字符识别的结果,需要除了字符识别的字符代码之外的坐标位置。
9、创建组合文件
通过组合文件创建单元229,将压缩图像组合在一个文件中(步骤S211)。如果该组合到文件中的格式可以相互重复并能够显示,则可认为是字符部分的可见度没有下降的文件尺寸小的彩色图像,并且背景也在某种程度上进行了再现。
接下来参照图23至图25解释上述处理的一个例子。
在图23所示出的例子中,在黄色背景上,原始图像(彩色图像)用红色字符显示了“<方針発表会“plan meeting”>”,以及用黑色字符显示了“日期:xx月xx日”以及“地点xxx”。
上述处理从这种原始图像(彩色图像)中创建了仅有黄色背景的无字符图像a,红色字符的二值字符图像b,以及黑色字符的二值字符图像c。
随后,执行字符识别处理。在此,应对原始图像(彩色图像)进行字符识别处理。
首先字符识别处理执行对如图24(a)所示的原始图像(彩色图像)的辨别处理,并提取字符行。
在图24所示的例子中,提取“<plan meeting>”、“日期:xx月xx日”、以及“地点xxx”三行字符(参照图24(b))。
此外,通过使用从日本专利No.3278471等得知的技术来实现区域辨别处理。
接下来,从提取的字符行中提取字符。此处,示出了二值图像的字符是黑色连通分量(黑色像素块)的例子。
图24(c)示出了线条提取结果1的字符提取结果。然而,类似于“meeting(会议)”,即使在将原始黑色连通分量分割成多个部分的时候,通过图像组合,如图24(c)所示的在长度方向上(垂直于线书写方向)交迭的黑色连通分量的字符记录变得可能。
然而,如图24(c)所示,将針“needle”分割成金“gold”以及十“10”。需要的只是通过使用被称为字符识别处理或语言处理的路径选择的处理,从关于选项“needle”、“gold”以及“10”中对“needle”进行选择。
因此,根据正确的字符串“<plan meeting>”获取每个字符坐标(参照图24(d))。
最后,将字符识别结果的字符代码粘贴在结合字符坐标的位置上,并创建字符结果平面(参见图24(e))。
虽然可以看见图24(e)举例示出的字符代码“<plan(计划)...”,但由于实际上它是作为透明文本粘贴的(将颜色映射指定为透明的),因此人眼是看不到它的。
然而,当访问个人计算机等时,由于存在文本代码粘贴的平面,检索变得可能。
此外,通过在与原始图像相同的坐标位置上粘贴字符识别结果,使得通过执行字符代码的高亮显示,或执行反转视频作为检索的结果来告知用户检索位置变为可能。
最后,如图25所示,根据与原始图像所保持的相同的位置关系进行排列,该排列的格式(如PDF文件类型)可以被组合并显示,使得其包括作为背景图像的无字符图像、每种颜色的二值字符图像、字符识别结果的字符代码、以及其位置坐标。
通过以与图像不同的层中的透明文本的形式嵌入用于混合的字符代码以及它们的位置坐标,图像的可见度可以通过字符代码等实现图像检索,而无需降低可见度。
准备作为处理对象图像的多级图像,以及基于多级图像的二值图像,并从二值图像中提取字符部分,当创建由白色像素取代了字符部分之外的像素的二值字符图像,以及创建由背景颜色隐藏了多级图像中的字符部分的像素的无字符多级图像时,创建由构成字符部分的颜色组成的二值字符图像。
此外,至少对由每一种确定的颜色组成的二值字符图像以及多级图像中的一个进行字符识别处理,并获取字符代码。分别对由每种确定的颜色构成的二值字符图像以及无字符的多级图像进行编码,并与字符代码一起合并到组合文件中。
无需大大降低作为处理对象图像的多级图像的质量,便可以实现文件尺寸的急剧减小,即使在存在字符部分的时候,也可以保护字符部分的像素的可见度。由于可能基于字符代码进行搜索,可以创建能够搜索并保持图像质量的高压缩数据。
此外,借助具有每种颜色的二值字符图像,旨在通过分别对每一个二值字符图像进行字符识别处理,来改善字符识别的精确度变得可能。
接下来,根据图26至图30解释说明本发明的另一个优选实施例。
使用相同的附图标记来表示与在前实施例中相应元素相同的元素,并将省略对它们的描述。
尽管在前述实施中每一种颜色都应具有一幅二值字符图像,不是每一种颜色都具有二值字符图像,但要从本实施例中的二值字符图像中创建分离出的每个字符的颜色信息。
在本实施例中,当通过使用图像处理程序13实现尺寸明显减小,而不需要损失作为处理对象图像(原始图像)的多级图像的字符可见度时,可以基于字符代码进行检索。
根据图26和图27解释说明本实施例的处理概要。
首先,使用诸如图像扫描仪之类的图像读取器10来获取如图27(a)示出的、为用作处理对象图像的原始图像的多级图像(彩色图像)(步骤S221)。并通过二值化这种多级图像创建图27(b)示出的二值图像(步骤S222)。
接着,提取字符部分(步骤S223)。并进行将二值图像中字符部分以外的像素调换为白色像素的白色像素处理,以使得仅保留字符,如图27(c)所示(步骤S224)。也就是说,在二值图像中消除了字符以外的黑色像素。该处理将按照每个像素显示出字符的位置。
在下一个步骤S225中,如图27(d)所示,创建每个字符的颜色信息。
另一方面,使用背景颜色来隐藏多级图像的字符部分,并创建图27(e)所示的消除了字符部分的图像(步骤S226)。
这种填充了背景颜色的图像被认为是没有重要信息的,并如图27(f)所示,执行低分辨率处理(步骤S227)。
从在步骤S227创建的消除了字符部分的低分辨率图像、在步骤S224创建的、消除了字符以外的黑色像素的二值字符图像、以及在步骤S224创建的字符颜色信息中创建压缩图像(步骤S228)。
例如,如果在二值字符图像中,MMR压缩和字符的颜色信息执行JPEG压缩,其中从该二值字符图像中消除了字符部分的低分辨率图像消除了除JPEG压缩以及字符部分以外的黑色像素,文件尺寸将明显变小。
在接下来的步骤S229中,执行与第一操作形式的步骤S210相同的字符识别处理,并创建字符代码。
然后,根据与原始图像所保持的相同位置关系进行排列,该排列的格式(如PDF文件类型)可以被组合并显示,使得其包括无字符图像(消除了字符部分的图像)、二值字符图像(仅包含字符部分的图像)、字符颜色信息、字符识别结果的字符代码、及其位置坐标(步骤S230)。
图像的可见度可以借助字符代码等,通过以与图像不同的层中的透明文本的形式嵌入用于合成的字符代码及其位置坐标来实现图像的检索,而无需降低可见度。
此外,虽然通过PDF文件类型进行合成,但也可以使用具有多层性能的方法来组合,例如不仅可以是PDF文件类型,JPEG2000形式也可以,当然,即使用多个文件进行保存也是可以的。
当无需减少由这种处理创建的图像的可见度便获得文件尺寸的明显压缩时,可以基于字符代码进行搜索。理由如下。
尽管JPEG压缩对具有像素值急剧改变的图像没有很好的压缩效率,但如果通过此处描述的方法消除了字符部分,由于将不会发生字符部分的像素值的改变,因此效率将变好。
另外,由于字符部分急剧减少了颜色数量,也正因如此,压缩率变好。
根据示出了基于图像处理程序13实现这种程序细节的涉及图像处理设备1的功能方框图28,进行详细说明。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元221和二值图像获取单元222获取多级图像和二值图像(步骤S221,S222)。
基于该多级图像,应当创建二值图像。二值化方法所需要的是固定阈值以及仅仅使用该方法,例如将亮于该阈值的像素设置成白色像素、以及将暗于该阈值像素设置为黑色像素。
此外,作为二值图像和多级图像,不同的分辨率足够了。例如,通过该方法创建二值图像之后,可以实现变薄处理,降低多级图像的分辨率,并且可获取其作为处理对象的多级图像。此外,可使用另一种设备来执行该二值图像的创建,并获得所创建的图像文件。
2、获取字符区域
通过使用字符部分提取单元224,创建存在于图像上的字符的位置(步骤S223)。在本实施例中,基于该二值图像确定构成字符的像素位置作为具有特定属性的像素。
3、将字符以外的像素变为白色像素
通过使用白色像素置换单元225,将二值图像中的字符部分以外的像素转置为白色像素(S224)。
4、创建每个字符的颜色信息
使用字符颜色信息创建单元231来创建每个字符的颜色信息。这里,创建表示字符图像的颜色信息的字符颜色信息代码。
5、创建无字符的多级图像
通过使用字符部分消除图像创建单元223创建多级图像,其中该多级图像中相应于在上述第3项的处理中剩余的黑色像素部分的字符部分被用背景颜色改变,并且该图像不包含字符(步骤S226)。
6、图像编码
通过使用图像编码单元228,对二值字符图像以及仅包含没有字符的多级图像的每一个字符的颜色信息以及字符进行编码,并压缩尺寸(步骤S228)。这其中,带有不含有字符的重要多级图像的信息表示图像中没有任何东西,并通过JPEG等实现不可逆的高度压缩。如果在降低了分辨率之后进行压缩,尺寸将会变得更小。
此外,实现仅由字符构成的二值字符图像的可逆压缩。如果是二值图像,并且PNG压缩或MMR压缩等是诸如4值或16值的图像,适于进行PNG压缩等。此外,通过JPEG等方法高度实现每个字符的颜色信息的不可逆压缩。
7、字符识别
通过字符识别单元230,对原始图像(彩色图像)或二值字符图像(仅由字符部分构成的图像)进行字符识别处理,并创建字符代码(步骤S229)。
特别的,字符识别处理可以不限于本方法,并可使用迄今为止所建议的不同字符识别方法来执行。然而,作为字符识别的结果,还需要除了字符识别结果的字符代码之外的位置坐标。
8、创建组合文件
通过组合文件创建单元229,将压缩图像合并在一个文件中(步骤S230)。如果可以相互重复并能够显示的格式的文件中,则可认为是字符部分的可见度没有下降、并且背景也在某种程度上进行了再现的文件尺寸的小彩色图像。
接下来根据图29和图30解释说明上述处理的一个例子。
在图29所示出的例子中,在黄色背景上,将原始图像(彩色图像)用红色字符表示为“<方針発表会“plan meeting(计划会议)”>”,以及用黑色字符表示为“xx月xx日”以及“地点xxx”。
上述处理将原始图像(彩色图像)创建于仅有黄色背景的无字符图像a、二值字符图像b、以及字符颜色信息c。
此外,字符识别处理与之前的实施例是相同的,并省略这些描述。
最后,如图30所示,根据与原始图像所保持的相同的位置关系进行排列,该排列的格式(如PDF文件类型)可以被组合并显示,使得其包括作为背景图像的无字符图像、二值字符图像、字符的颜色信息、字符识别结果的字符代码、及其位置坐标。
图像的可见度可以借助字符代码等、通过在与图像不同的层中以透明文本的形式嵌入用于合成的字符代码以及它们的位置坐标来实现图像的检索,而无需降低可见度。
在此,准备作为处理对象图像的多级图像,以及基于多级图像的二值图像,并从二值图像中提取字符部分,当创建由白色像素取代了字符部分之外的像素的二值字符图像,以及创建由背景颜色隐藏了多级图像中的字符部分的像素的无字符多级图像时,创建了二值字符图像的每个字符部分的颜色信息。
此外,对多级图像以及二值字符图像的至少一个执行字符识别处理,并获取字符代码。以及分别对二值字符图像的每个字符部分的颜色信息,无字符的多级图像,以及二值字符图像进行编码,并与字符代码一起合并到组合文件中。
即使在存在字符部分的时候,也无需大大降低作为处理对象图像的多级图像的质量,便可以实现文件尺寸的急剧减小,也可以保护字符部分的像素的可见度。
由于可以基于字符代码进行搜索,可以创建能够搜索并保持图像质量的高度压缩数据。
图20-图30的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,获取作为处理对象图像的多级图像;二值图像获取单元,获取基于多级图像创建的二值图像;二值字符图像创建单元,创建将从二值图像中提取的字符区域以外的像素改变为白色像素的二值字符图像;无字符多级图像创建单元,创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像;颜色确定单元,确定字符区域的像素的颜色;基于颜色的字符图像创建单元,分别对每种确定的颜色创建二值字符图像;字符识别单元,对多级图像以及确定颜色的二值字符图像中至少一个执行字符识别处理,以获得字符代码;以及组合文件创建单元,用于分别对字符代码、无字符多级图像、以及确定颜色的二值字符图像中的每个执行压缩编码,并创建合并了该编码图像的组合文件。
根据本发明,获取作为处理对象图像的多级图像及基于多级图像创建的二值图像,从二值图像中提取字符部分,创建将字符区域以外的像素改变为白色像素的二值字符图像,创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像,创建包括构成字符区域的颜色的二值祖父图像。另外,至少对具有包括确定为多级图像的每种颜色的二值字符图像的一方执行字符识别处理,并获得字符代码。并通过分别对包括每种颜色的二值字符图像和无字符多级图像进行编码,使得创建具有字符代码的组合文件。有可能在不极大地减小用作处理对象图像的多级图像的图像质量的情况下实现文件尺寸的极大减小,甚至当存在字符部分时也可以保证字符部分的像素的可见度。
图20-图30的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,获取作为处理对象图像的多级图像;二值图像获取单元,获取基于多级图像创建的二值图像;二值字符图像创建单元,创建将从二值图像中提取的字符区域以外的像素改变为白色像素的二值字符图像;无字符多级图像创建单元,创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像;字符颜色数据创建单元,创建字符区域的像素的颜色数据;字符识别单元,对多级图像以及确定颜色的二值字符图像中至少一个执行字符识别处理,以获得字符代码;以及组合文件创建单元,用于分别对字符代码、无字符多级图像、以及确定颜色的二值字符图像中的每个执行压缩编码,并创建合并了该编码图像的组合文件。
上述图像处理设备可以被配置为使得将字符代码以透明文本的形式嵌入与图像不同的层中。
上述图像处理设备可以被配置为使得根据字符代码的位置坐标将字符代码以透明文本的形式嵌入与图像不同的层中。
图20-图30的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在多级图像的基础上创建的二值图像;创建将从二值图像中提取的字符区域以外的像素改变为白色像素的二值字符图像;创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像;确定字符区域的像素的颜色;分别对每种确定的颜色创建二值字符图像;对多级图像以及确定颜色的二值字符图像中至少一个执行字符识别处理,以获得字符代码;以及用于分别对字符代码、无字符多级图像、以及确定颜色的二值字符图像中的每一个执行压缩编码,并创建合并了该编码图像的组合文件。
图20-图30的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在多级图像的基础上创建的二值图像;创建将从二值图像中提取的字符区域以外的像素改变为白色像素的二值字符图像;创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像;创建字符区域的像素的颜色数据;对多级图像以及确定颜色的二值字符图像中至少一个执行字符识别处理,以获得字符代码;以及分别对颜色数据、字符代码、无字符多级图像、以及确定颜色的二值字符图像中的每一个执行压缩编码,并创建合并了该编码图像的组合文件。
上述计算机程序产品可以被配置为使得将字符代码以透明文本的形式嵌入与图像不同的层中。
上述计算机程序产品可以被配置为使得根据字符代码的位置坐标将字符代码以透明文本的形式嵌入与图像不同的层中。
图20-图30的上述实施例提供了一种计算机可读存储介质,其中存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括:获取作为处理对象图像的多级图像;获取在多级图像的基础上创建的二值图像;创建将从二值图像中提取的字符区域以外的像素改变为白色像素的二值字符图像;创建用背景颜色改变多级图像中的字符区域的像素的无字符多级图像;确定字符区域的像素的颜色;分别对每种确定的颜色创建二值字符图像;对多级图像以及确定颜色的二值字符图像中至少一个执行字符识别处理,以获得字符代码;以及分别对字符代码、无字符多级图像、以及确定颜色的二值字符图像中的每一个执行压缩编码,并创建合并了该编码图像的组合文件。
接下来,根据图31和图32描述本发明的另一个优选实施例。
图31示出了本实施例涉及的图像处理方法的处理过程,图32示出了图31中的线条提取处理(S303)的详细流程。此外,图33示出了本实施例涉及的图像处理设备的组成。
在图33的图像处理设备中,多级图像输入单元301是获取并存储处理对象的原始图像的设备(可通过输出彩色图像数据的文档读取设备进行操作,如扫描仪和图像拾取设备),将由多级图像输入单元301获取的原始多级图像数据发送给二值化单元303、连通分量创建单元307、代表颜色确定单元309、以及字符线条确定单元313。
此外,虽然阴影图像作为多级图像是足够的,但将给出假设多级图像作为彩色图像的解释说明。
二值化单元303将彩色图像(R,G,B)数据改变为二值化数据,并将结果二值图像数据输出给游程(run)创建单元305。此外,可以使用不同的方法来实现执行彩色图像(RGB)数据的二值化的单元,举例来说,可使用如对G颜色数据进行预定阈值处理这样的处理,并不限于特定的方法。
游程创建单元305是从二值化图像中创建像素游程、并将从黑色像素中创建的游程发送给连通分量创建单元307的设备。连通分量创建单元307是从像素游程创建连通分量、并将结果连通分量发送给代表颜色确定单元309以及外接矩形组合单元311的设备。
代表颜色确定单元309获取原始处理对象多级图像的像素值(R,G,B),该像素相应于构成由连通分量创建单元305获得的连通分量的像素,以及基于所获取的像素值确定代表每个连通分量的连通分量的像素值,并将确定的代表像素值发送给外接矩形组合单元311以及字符线条确定单元313。
外接矩形组合单元311将连通分量创建单元307创建的连通分量的外接矩形整合为一体,并将其发送给字符线条确定单元313。
字符线条确定单元313确定由外接矩形组合单元311整合的外接矩形(字符线条候选者)的线条相似率,将断定具有较低的线条相似率的字符线条删除,并将获得的正确的字符线条发送给字符区域输出单元315。
字符区域输出单元315是输出断定为字符线条的坐标的输出设备。
接下来,将根据图31和图32的流程图解释说明本实施例所涉及的图像处理方法。
此外,以下的说明也作为上述图像处理设备(图33)的操作说明。
根据图31的流程图,首先通过多级图像输入单元301获取用于处理的文档作为原始图像(彩色图像)(步骤S301)。
所获取的彩色图像采用每个R,G,B像素数据的形式,其中R,G,B数据通过图像传感器以主扫描以及次扫描方法检测。
随后,通过二值化单元303获取作为处理对象的彩色图像(多值)的二值化图像(步骤S302)。
该二值化方法设置固定阈值,并将像素值(例如,G颜色的像素数据)与该阈值相比较,可采用如下的方法来实现,如将亮于该阈值的像素改变为白色,并将暗像素改变为黑色。
虽然,基于所获取的黑色像素数据进行后续字符线条的提取处理,但即使实现用作处理对象的彩色(多值)图像的二值化,并首先采用这一过程,关于几乎所有字符生成(在以下提及的实施例中,示出与白色字符的对应关系)在提取中接收例外删除的白色字符,在提取中也几乎不存在引起删除的可能性。
下面参照图32的流程图解释说明字符线条的提取。
首先,基于二值图像数据获取黑色像素的连通分量(步骤S311)。该处理创建了黑色像素列表,游程创建单元305基于二值图像数据将列表中黑色像素水平连接,形成黑色像素游程。此外,概念“游程”表示当连续像素数据具有相同值时的连续像素阵列。
在通过传真等处理的二值图像中,通过考虑将在一维方向上延伸的白色像素或黑色像素的块作为“游程”来作为编码的单元的例子是公知的。
连通分量创建单元307,对于创建的在水平方向并列的黑色像素的游程,将通过把在垂直方向邻接的像素放入行中而创建的组作为连通分量来创建。因此,将提取构成字符的像素阵列作为连通分量。
接下来,代表颜色确定单元309确定每个连通分量的代表颜色。获取相应于构成连通分量的黑色像素的原始处理对象多值(彩色)图像的像素值(相应于黑色像素的位置的R,G,B3成分的像素数据)(步骤S312)。
根据连通分量的代表颜色的定义,基于所获取的像素值确定每个连通分量的代表颜色数据(步骤S313)。
此时,连通分量的代表颜色定义为构成连通分量的所有像素的颜色像素数据的平均值,根据这种定义计算连通分量一种代表颜色,并确定一个连通分量的一种代表颜色。
因此,在以后的部分中,当连通分量作为线条候选者进行结合时,所确定的连通分量的代表颜色被用作组合条件,更进一步,为了建立字符线条的相似率而使用该代表颜色。
接下来,通过外接矩形组合单元311进行从连通分量中创建字符线条候选者的一系列处理。
由于本处理包含在前段描述的处理步骤获得的连通分量中的字符的分量,因此要根据连通分量的字符线条候选者的结合(unifying)条件来判断连通分量能否合并,并创建字符线条候选者的矩形部分。分别地,将距离接近连通分量之间的关系,并假设该颜色与组合条件相同。
作为处理的过程,如图32的流程图所示,选择一个连通分量并将其记为线条候选者的第一阶段(步骤S314),取出另一个连通分量作为组合的首个线条候选者(步骤S315),并确定它们是否都满足组合条件。
这里,针对它们是否是连通分量、它们是否靠近、以及不是的情况来发现连通分量的外接矩形(定义外接于连通分量的矩形,并且最后以线条开始的区域也表示在该外接矩形的区域中)之间的距离,如果通过对发现的距离执行阈值处理来断定不远,将可以实现合并(步骤316-是)。
而且,通过比较在上述步骤S313中决定的各个连接分量的代表颜色数据并对求出的比较值进行阈值处理,判断连接分量之间的颜色是否相似。如果颜色相似,则可以组合(步骤S317为“是”)。
响应上述判断连通分量是否能合并的结果,外接矩形组合单元311为线条候选者进行连通分量的组合(步骤S318)。
由于根据与连通分量合并的线条候选者构成了如图36示出的为线条候选者进行连通分量的合并的处理情形中的连通分量的外接矩形(用虚线表示)区域,并在该图中示出了,将通过增加的连通分量的矩形部分把存在范围扩展到目标线条候选者。
此外,由于线条候选者根据组合结果而改变,所以需要在线条候选者的外接矩形中以及用上述判断组合条件的步骤S316和S317中提到的代表颜色来反映组合的结果,尽管对比度判断是在带有线条候选者的连通分量之间进行的。
也就是说,由于线条候选者由两个或多个连通分量组成,构成连通分量的外接矩形的位置以及构成连通分量的颜色的平均值确定了线条候选者的颜色。
由于对文档页的每个预定处理区域进行了为线条候选者合并连通分量的处理,检验了应核对组合条件的连通分量没有保留在处理区域中(步骤S319-是)。
此外,由于对文档页中的每个预定区域重复进行上述步骤S314-319,检验了在第一阶段不存在应记录到文档页中的连通分量存在的未处理的区域(步骤S320-是),并结束连通分量的组合处理。
此外,当该未处理的连通分量位于处理区域中时,存在应在第一阶段记录的连通分量存在的未处理的区域(步骤S319-否)(步骤S320-否),返回到每个处理循环的开始,并重复连通分量的组合处理。
如果确定实现上述分组(组合)的连通分量的外接矩形部分作为字符线条候选者,接下来,检查在以前的步骤由字符线条确定单元313确定的线条候选者的字符线条的相似性,判断出与字符线条完全不同的线条候选者,并执行根据该结果删除该线条候选者的处理。
在检查字符线条相似性的过程中,计算示出字符线条相似性的字符线条的特征量,特征量被看作是线条相似率,并且根据该线条相似率判断应删除的线条候选者。
在本实施例中,如下所示,计算特征的四个量,并从结果中创建线条相似率。
作为特征量1,计算线条候选者的纵横比(步骤S321)。这里,作为分组(组合)的连接分量的外接矩形区域来求线条候选者,因而越细长则认为越像线条,所以将其作为用于判断线条相似率的特征量。
作为特征量2,对构成线条候选者的连通分量进行计数(步骤S322)。如果不是太少的连通分量存在于线条中,由于这将很难从表面上说它就是线条,因此它被用作线条相似率判断的特征量。
作为特征量3,对线条候选者周围的黑色像素进行计数(步骤S323)。
图37示出了对线条候选者进行组合处理的情形,图37中的(A)示出了照片图像的例子以及图37中的(B)示出了字符图像的例子。如图37的(A)和(B)所示,分别提取由虚线围绕的线条候选者,作为原始图像的处理结果。
对于字符图像,由白色像素围绕线条候选者的四周,并且(A)具有大量白色像素以及作为字符线条的特征。
另一方面,(B)是照片图像,并且是从照片图像中提取一部分作为线条候选者的例子,在这种情况下存在加入线条中的连通分量的可能性较高,线条候选者的周围具有相对较多的黑色像素,并且不具有作为字符线条的特征。
因此,将(B)的照片图像中完全不像字符线条的线条候选者作为删除的对象是合适的,并且将线条候选者四周的黑色像素的数量用作判断线条相似率的特征量。
然而,由于长线条具有大量分开的围地(enclosure)中的像素,需要将怎样取出这些特征量中的长度或边界长度进行标准化。
作为特征量4,创建线条候选者的颜色与周围颜色的差别(步骤S324)。(R1,G1,B1),以及为线条候选者的颜色(可以使用在上述步骤S313确定的连通分量的代表颜色数据)获取周围像素的平均颜色为(R2,G2,B-2),它就是与周围的色差D。
色差D使用下述公式计算:D=|R1-R2|+|G1-G2|+|B1-B2|。由于通常字符是与背景不同的颜色而更具可读性,因此,与四周的色差一般趋向于很大。
因此,小的线条候选者适于作为删除的对象,并且将色差D考虑作为使用色差D判断线条相似率的特征量。
在计算了特征量1至4之后,基于所计算的特征量1至4计算表示字符线条相似性的线条相似率(步骤S315)。假设用F表示线条相似率,Fi表示特征量i的值,以及Wi表示与每个特征量i的值相乘的系数。
使用下述公式计算线条相似率F:F=SUM(Fi*Wi)(其中,i=1-4,SUM表示求和函数)。
示出了对每个特征量Fi的线条相似率的权(贡献程度)的权值Wi定义了可以提前绘制实验的正确结果的合适的系数。
随后,通过与预先定义的、根据所计算的线条相似率对保留或是删除线条候选者进行限制的阈值进行比较,画出字符线条判断的最终结果(步骤S326)。
此处,当计算的线条相似率大于阈值时,判定为字符线条。否则,判断为不是字符线条。
根据上述获得的字符线条判断的最终结果,从提取的线条候选者中删除没有判断为字符线条的候选者的线条数据(步骤S327)。
此外,例如当计算了某个特征量,例如该值与适合该线条的值相差很远时,以及尽管在计算了所有特征量之后综合地寻找线条相似物,当清楚地断定不是线条时,删除相关的线条候选者。
该处理判断线条候选者的字符线条相似性并根据结果删除线条候选者。由于对每个线条候选者都进行该处理,当检查出完成对所有应被检查的线条候选者的判断时(步骤S328),不存在没有被判断的线条候选者。
由于重复进行上述步骤S321-S327,检查出不存在未处理的线条候选者(步骤S328-是),并且结束字符线条的判断处理。
由于可删除被认为是错误提取的线条并可从获取的字符线条数据中提取适当的字符线条数据,其中该错误提取可能是由进行上述图31的线条提取处理的过程中(步骤S303,也就是图32的流程)的线条候选者产生的,字符区域输出单元31 5将相应的线条区域坐标值作为处理结果输出(S304),并结束该处理流程。
接下来的实施例给出了对上述实施例的改进,其中增加了对上述实施例中产生的白色字符的提取中的失去遗漏的改进。
如上述实施例所描述的,实现了作为处理对象的彩色(多值)图像的二值化,虽然在基于所获取的黑色像素数据的基础上执行字符线条提取处理时,在提取中遗漏几乎所有的字符的可能性很小,但在对白色字符的遗漏却例外地提高了。
为了改善这一点,在本实施例中,对二值化图像进行线条提取处理以反转二值化图像并进行反转,并结合使用未反转的提取处理。
此外,通过增加提取在分别基于反转的以及未反转的二值化图像确定的线条候选者之间交迭的线条候选者的处理来阻止错误提取,并删除交迭的线条候选者之一。
尽管是二值图像反转处理步骤、反转图像的线条提取处理步骤以及重复线条的排除处理步骤,如果新需要的用于实现上述改善的单元位于该设备中,则在图像反转单元中,重复区域排除单元以及该方法都依赖于所增加的组成部分以及在上述实施例中另外使用的除该组成部分以外的元素。
图34示出了本实施例涉及的图像处理方法的处理流程,并在之前的图32中示出了图34中线条提取处理(S303,S305)的详细流程。
此外,图35示出了本实施例涉及的图像处理设备的组成。
下面参照图35解释说明本实施例的图像处理设备。
此外,由于上述优选实施例的重复说明,建议上述说明只涉及本实施例中除图像反转单元以外新增的组成部分,以及重复区域排除单元,并省略已说明的部分。
图像反转单元304是用于将二值化单元303改变的二值图像数据的黑色和白色进行反转,并将反转的图像数据输出给游程创建单元305的设备。
重复区域排除单元314响应由字符线条确定单元313获得的反转及非反转图像的两种线条候选者提取结果,将线条候选者中交迭的线条候选者中的一条削除,并将结果发送给字符区域输出单元315。
接下来,将参照图34的流程图解释说明本实施例涉及的图像处理方法。
此外,以下的说明还作为对上述图像处理设备(图35)的图像反转单元304以及重复区域排除单元314的操作说明。
根据图34的流程图,首先通过多级图像输入单元301获取将被处理的文档作为原始图像(彩色图像)(步骤S331)。
这里所获取的彩色图像是采用由图像传感器用主扫描及次扫描方法检测的每个R,G,B像素数据的形式。
随后,通过二值化单元303为用作处理对象的彩色(多值)图像获取二值化图像(步骤S332)。
该二值化方法设置固定阈值,并将像素值(例如,G颜色的像素数据)与该阈值相比较,可采用如下的方法来实现,如将亮于该阈值的像素改变为白色,并将暗像素改变为黑色。
因此,实现了用作处理对象的彩色(多值)图像的二值化,并基于所获取的黑色像素数据进行字符线条的提取处理(步骤S333)。
根据上述实施例中示出的图32的流程图执行字符线条的提取。
接下来,当原始图像中包含白色字符时,为了在提取中防止疏漏,通过图像反转单元304反转由步骤S332的二值化处理所获得的二值图像数据(步骤S334)。
通过使用已知的方法可以实现单色反转处理。
基于反转了黑色和白色的二值图像数据进行字符线条的提取处理(步骤S333)。
根据上述图32的流程图执行字符线条的提取(步骤S335)。当分别在步骤S333和S335执行对非反转图像以及反转图像两种图像分别进行线条候选者提取,并且提取出在反转图像与非反转图像之间的交迭位置时,重复区域排除单元314确定一个作为正确答案以及另一个作为错误的,由此使得实现消除一个的处理,直到获得没有重复的提取结果为止。
例如,如图38所示,当把“Mr.Tanaka”制成处理对象图像(A)进行常规处理(非反转的)时,字符线条区域转换成图(A’)中的由虚线围绕的区域,并获得(A”)的数据作为提取线条候选者。
另一方面,如果反转了二值图像,构成字符的白色像素的连通分量将转换为黑色像素,作为反转图像(B),并将被提取作为线条。也就是说,如果是字符“田(ricefield)”,原始图像的四个小的白色交叉线构成了反转的图像(B)。
因此,字符线条区域可以转换成图(B’)中由虚线围绕的区域,并可以提取(B”)作为线条候选者。
如图38的例子所示,由于从反转图像(B)中提取的线条候选者(B”)是错的,并且显露出来,因此在这种情况下需要留下非反转图像的线条候选者(A”),并需要删除反转图像的线条候选者(B”)。
作为这种情况下的删除条件,如图38所示,由于被删除的反转图像的线条候选者(B”)比非反转图像的线条候选者(A”)的尺寸小,因此可以根据这种特性定义该条件。
因此,可以通过比较两者的线条尺寸并删除较小的一个来去除错误数据。此外,上述实施例给出了通过比较来实现线条相似率的计算以及可以删除完全不像线条的指示,并且即使将它们一起使用也是没问题的。
在图34的流程所示的重复线条的排除处理步骤中提取应用排除处理的对象线条(步骤S336)。也就是说,通过对反转和非反转两种图像进行线条提取来提取在步骤S333和S335中获得的线条候选者中位置交迭的线条候选者。
随后,比较所提取的重复线条候选者的线条尺寸,并将具有小尺寸的指示的线条候选者删除(步骤S337)。由于一次执行只能提取一组重复线条,因此重复执行步骤S336-S338的排除处理步骤直到去除交迭线条(步骤S338-是)。
因此,由于可以删除被认为可能是为线条候选者产生的错误提取的线条,并在对非反转图像进行反转及线条提取时可以从获取的字符线条数据中提取正确的字符线条数据,因此字符区域输出单元315将相应的线条区域的坐标值作为处理结果输出(步骤S339),并结束该处理流程。
接下来的实施例给出了使用通用处理器(计算机)作为图像处理设备来执行图像处理方法的各个步骤以及执行上述实施例所示的字符区域提取。
图39示出了本实施例的处理器的组成。如图39所示,本实施例示出了使用的通用处理器(计算机),其包括CPU341,存储器342,硬盘驱动器343,输入设备344(鼠标等),CD-ROM驱动器345,以及显示器346作为其组成部件。
此外,将使计算机执行本实施例的字符区域(字符线条)提取处理流程的程序(软件)记录在记录介质347上,如与CD-ROM驱动器345结合使用的CD-ROM。
将例如存储在硬盘驱动器343中的处理对象的彩色(多值)图像通过输入设备344进行输入,如扫描仪。
CPU341从记录介质347读取用于实现上述字符区域提取处理的流程的程序,根据该程序执行彩色(多值)图像的字符区域提取处理,并由于在字符图像处理步骤中需要使用作为提取结果而得到的字符区域数据而进行输出,如字符识别处理。
因此,通过根据用于执行字符区域提取处理的程序进行操作,该计算机被用作本发明的图像处理设备。
图31-图39的上述实施例提供了一种图像处理设备,包括:二值图像创建单元,通过对作为处理对象图像的多级图像进行二值化来创建二值图像;连通分量创建单元,获取二值图像中每一个具有黑色像素游程的连通分量;距离确定单元,分别确定连通分量之间的水平距离和垂直距离;线条候选者单元,将水平距离和垂直距离小于预定阈值的连通分量合并成线条候选者之一;特征量计算单元,分别基于每个线条候选者,计算代表多级图像中相应线条的特征的特征量;以及线条候选者删除单元,如果基于相关线条候选者的特征值的线条相似率小于给定值,删除线条候选者中的一个。
根据本发明,对处理对象的多级图像进行二值化,根据二值图像获取像素游程和连通分量,整合字符线条候选者,有可能通过短的处理时间来创建字符线条候选者,并且其后将字符线条候选者作为示出该线条的特征的值。通过检查连通分类的数目、线条候选者周围的灰色像素的数目、以及线条候选者的代表像素值和构成线条候选者的纵横比的线条候选者周围和线条候选者的比较结果,可以快速地执行字符线条的日志处理,而较少地发生错误,并删除不合适字符线条。
上述图像处理设备可以被配置为使得图像处理设备还包括:分别获取相应于多级图像中构成每个连通分量的像素的像素值的单元;基于所获取的像素值,确定表示连通分量的像素值的代表像素值的单元;以及基于所获取的像素值,确定表示线条候选者的像素值的代表像素值的单元。
上述图像处理设备可以被配置为使得线条候选者单元包含:色差计算单元,用于计算连通分量的代表像素值和线条候选者的代表像素值之间的差值;以及提供线条候选者单元,用于当所计算的差值小于预定阈值时,将连通分量合并到一条线条候选者。
上述图像处理设备可以被配置为使得特征量计算单元包括以下单元的至少一个:纵横比计算单元,用于计算相关线条候选者的纵横比;连通分量数量计算单元,用于计算构成一条线条候选者的连通分量的数量;以及黑色像素数量计算单元,用于计算一条线条候选者周围的黑色像素的数量。
上述图像处理设备可以被配置为使得特征量计算单元包括:获取多级图像中位于相应于一个线条候选者的像素周围的像素的像素值的单元;基于所获取的像素值,确定表示一条线条候选者周围的像素的像素值的代表像素值的单元;以及将表示一条线条候选者周围的像素的像素值的代表像素值与表示线条候选者的像素值的代表像素值进行比较的单元。
上述图像处理设备可以被配置为使得图像处理设备还包括二值图像反转单元,用于将来自二值图像创建单元的二值图像进行反转。
上述图像处理设备可以被配置为使得图像处理设备包括下述单元中的至少一个:提取在基于非反转二值图像创建的线条候选者和基于反转二值图像创建的线条候选者之间交迭的线条候选者的单元,删除具有较小尺寸的交迭线条候选者的单元,以及将交迭线条候选者的特征量进行比较并且删除具有较小的线条相似率的交迭线条候选者的单元。
图31-图39的上述实施例提供了一种图像处理方法,包括以下步骤:通过对作为处理对象图像的多级图像进行二值化创建二值图像;获取二值图像中每一个具有黑色像素游程的连通分量;分别确定连通分量之间的水平距离和垂直距离;将水平距离和垂直距离小于预定阈值的连通分量合并成一条线条候选者;分别基于每条线条候选者,计算代表多级图像中相应线条的特征的特征量;以及如果基于相关线条候选者的特征值的线条相似率小于给定值,删除线条候选者中的一个。
上述图像处理方法可以被配置为使得图像处理方法还包括以下步骤:分别获取相应于多级图像中构成每个连通分量的像素的像素值;基于所获取的像素值,确定表示连通分量的像素值的代表像素值;以及基于所获取的像素值,确定表示线条候选者的像素值的代表像素值。
上述图像处理方法可以被配置为使得组合步骤包括:计算连通分量的代表像素值和线条候选者的代表像素值之间的差值,以及当所计算的差值小于预定阈值时,将连通分量合并到一条线条候选者中。
上述图像处理方法可以被配置为使得特征量计算步骤包括至少以下步骤之一:,计算相关线条候选者的纵横比;计算构成一条线条候选者的连通分量的数量;以及计算一条线条候选者周围的黑色像素的数量。
上述图像处理方法可以被配置为使得特征量计算步骤包括:获取多级图像中位于相应于一条线条候选者的像素周围的像素的像素值;基于所获取的像素值,确定表示一条线条候选者周围的像素的像素值的代表像素值;以及将表示一条线条候选者周围的像素的像素值的代表像素值与表示线条候选者的像素值的代表像素值进行比较。
上述图像处理方法可以被配置为使得图像处理方法还包括:将在二值图像创建步骤中创建的二值图像进行反转的步骤,以及获取二值图像中每一个具有黑色像素游程的连通分量以及获取反转二值图像中每一个具有黑色像素游程的连通分量的连通分量获取步骤。
上述图像处理方法可以被配置为使得图像处理方法至少包括下述步骤之一:提取在基于非反转二值图像创建的线条候选者和基于反转二值图像创建的线条候选者之间交迭的线条候选者,删除具有较小尺寸的交迭线条候选者中的一个,以及将交迭线条候选者的特征量进行比较,并且删除具有较小的线条相似率的交迭线条候选者中的一个。
图31-图39的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:通过对作为处理对象图像的多级图像进行二值化处理创建二值图像;获取二值图像中每一个具有黑色像素游程的连通分量;分别确定连通分量之间的水平距离和垂直距离;将水平距离和垂直距离小于预定阈值的连通分量合并成一条线条候选者;分别基于每条线条候选者,计算代表多级图像中相应线条的特征的特征量;以及如果基于相关线条候选者中的特征值的线条相似率小于给定值,删除一条线条候选者。
图40A和图40B是本发明的优选实施例中的文档数据结构的示意图。
如图40B所示,文档数据DD由n个平面组成:从图40A的原始文档100提取的平面-PLN(1)、平面-PLN(2)、以及平面-PLN(3)(本实施例中n=3),以及参考图像REF。
如图40A所示,原始文档100包括8位彩色图像101、蓝色绘制的字符以及蓝色横纹绘制的字符102、以及红色点状背景103。
在本实施例中,如图40B所示,根据由所涉及的图像表示的对象,将在原始文档100上显示的图像分割成平面-PLN(1)、平面-PLN(2)、以及平面-PLN(3),并提取。参考图像REF包括每个像素的用于选择PLN(1)、PLN(2)以及PLN(s)(3)之一的信息,作为m个色调级别的值A1,A2,和A3(本实施例中m=3)。例如,可以是A1:“00”、A2:“01”以及A3:“10”。
在本实施中,通过8位彩色图像以及适用于照片等的压缩的方法来对平面PLN(1)进行编码。平面PLN(2)可以通过字符(由图像或文本代码表示的图像)以及适用于字符压缩的方法进行编码。平面PLN(3)可以通过示出背景的图像以及适用于背景压缩的方法进行编码。
举例来说,当参考图像REF是单色图像时,MMR压缩等在压缩率方面是令人满意的。此外,由于平面PLN(1)是彩色图像,诸如JPEG和JPEG2000之类的方法变得适用。
此外,由于平面PLN(2)是字符图像,则认为MMR压缩是合意的。
图41是示出了第一优选实施例的文档转换设备的方块图,通过该文档转换设备可以创建图40B所示结构的文档数据DD。
图41中,文档转换设备11包括平面图像提取单元411、参考图像创建单元412、图像处理单元413、编码单元414、以及组合单元415。
平面图像提取单元411可以根据编码方法从原始文档100中提取三页(1)、PLN(2)以及PLN(3)中的平面PLN。在本实施例中,平面PLN(1)是彩色图像。
此外,当PLN(2)和PLN(3)上的对象的原始文档100的颜色是单色时,PLN(2)和PLN(3)上的对象也可以制成单色,并可作为单色图像。当将PLN(2)和PLN(3)制成彩色图像时,参考图像REF是单色图像。
另外,当将PLN(2)和PLN(3)制成单色图像时,将该单色定义成色调级别值A2和A3,该值选择参考图像REF的PLN(2),以及PLN(3)。
本实施例彩色照片等中的平面是通过PLN(1)提取的,字符平面是通过PLN(2)提取的,以及背景平面是通过PLN(3)提取的,由于对象的明显区别(字符的提取,背景的提取)技术是公知技术,因此不再给出说明。
参考图像创建单元412可以创建参考图像REF。
图像操作单元413可以执行图像操作或图像补偿(分辨率转换,滤波处理,亮度补偿,色调补偿,噪声抑制)。通常,通过这种处理,在编码的时候可压缩性会变高。
例如,由于平面PLN(2)在恢复文件100’上只要知道字符的颜色就行,所以,在定义平面PLN(2)上的点间距的分辨率或对平面PLN(2)定义单色颜色的情况下,可降低色调的分辨率。由于平面PLN(2)的对象是字符,所以分辨率降低,辨认性并不明显降低。
此外,关于平面PLN(2),如果执行字符识别处理,将获得文本代码。如果这与最后创建并设置的一系列数据集合(通常数据集合中包括文本数据)有关,可以在恢复文档100’中执行文本代码中的检索。
另外,插入处理等可以执行提高分辨率的图像处理。虽然文件尺寸变大,但当照片区域等重要时,其在图像质量中有了改善。
在本实施例中,尽管参考图像REF没有改变点的间距,但可以将它改变。
通过消除平面PLN(2)的连通分量以及参考图像REF中的黑色像素的方法,可以实现噪声抑制,并且可压缩性将会提高。
另外,可根据文件被如何使用来适当地决定各平面的加工处理。例如,在认为照片重要的情况下,可不降低平面PLN(1)的分辨率,相反,在照片不那么重要的情况下,降低平面PLN(1)的分辨率,提高平面PLN(2)的分辨率就可以。由于它们是图像质量和最终信息的大小的折中,所以根据用途来决定。
编码单元414是平面PLN(1)、PLN(2)、PLN(3),以及根据在原始文档上的对象的类型,参考图像REF可以使用该方法(该方法是对所涉及的对象进行压缩的适当方法,每个平面各不相同)进行编码。
组合单元415可以将由编码单元413编码的参考图像REF和n个平面PLN(1)、PLN(2)、以及PLN(3)合并在数据集合中。此外,例如在组合的时候,每个平面都具有包含在数据集合中的信息(例如,如照片、字符、以及背景这样的位图图像的信息)的属性,在之后描述的文档恢复时,使用平面排除单元213为操作者排除不需要的平面。因此,只有某一特定平面也可以在图像表达的情况下看见。因此,由于不需要的信息是不可视的,文档变得容易辨认。
另外,在数据通信期间,从数据集合中适当地去除了被认为是不需要的平面,并减轻了传送和接收的数据量(收发器的时间也因此缩短)。
图42是示出了第一优选实施例的文档转换方法的示意图。可以通过使用图41的文档转换设备11执该文档转换方法。
在图42中,首先从原始文档100中提取对应于编码方法的三个平面PLN(1)、PLN(2)、PLN(3)(平面提取步骤:S411)。
在平面提取步骤S411中,将原始文档上的对象分割成三层平面PLN(1)、PLN(2)以及PLN(3),并提取它们。
接着,将3个色调级别的值A1、A2、A3赋予各像素,根据3个色调级别的值,创建用于确定平面PLN(1)、PLN(2)、PLN(3)其中之一的参照图像REF(参照图像作成步骤:S412)。
进一步对三层平面PLN(1)、PLN(2)以及PLN(3)进行图像操作或图像补偿(分辨率转换、滤波处理、亮度补偿、色调补偿、噪声抑制)(图像操作步骤:S413)。
接着,对三层平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及参考图像REF进行编码(编码步骤:S414)。
在编码步骤S414中,通过根据原始文档100上的对象类型的方法对三层平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及参考图像REF进行编码。在本实施例中,分别通过不同的编码方法对三层平面进行编码。
将在编码步骤S414中编码的参考图像REF和三层平面PLN(1)、PLN(2)以及PLN(3)的平面PLN合并在数据集合中。
此外,将平面PLN(1)、PLN(2)以及PLN(3)所不涉及的区域中的像素值转换成预定的像素值(如白色、黑色等)。因此,在这种情况下编码可以提高压缩率。
在图像再现时仅参照平面PLN(1)的情况下,可利用周围的像素将规定的像素值赋予平面PLN(1)上的参照图像REF的字符所对应的像素。在图像再现时仅参照平面PLN(2)的情况下,可以将字符容易辨认的颜色且压缩效率不下降的像素值赋予平面PLN(2)上的参照图像REF的字符以外的像素。
图43示出了本发明的优选实施例中的文档恢复设备。
图43中的文档恢复设备21包括文档分解/解码单元211、色调级别值获取单元212、平面排除单元213、平面指定单元214、以及文档恢复单元215。在本实施例中,文档恢复设备21可以获取文档数据DD,并可以从相关文档数据中恢复原始文档100。
文档分解/解码单元211可以对文档数据DD执行解码处理,并可以创建三层平面PLN(1)、PLN(2)、PLN(3)以及参考图像REF。
色调级别值获取单元212可以获取扫描参考图像REF的像素的三种色调级别的值A1、A2、A3中的任何一种,并将它们赋予所扫描的像素。
平面排除单元213可以从三层平面PLN(1)、PLN(2)以及PLN(3)的平面PLN中的处理对象中移除一层或两层平面。
不包含在由平面指定单元214指定的对象中,由平面排除单元213排除的平面可以仅显示在再现图像100’上的所需对象。
平面指定单元214可确定与3个色调级别的值A1、A2、A3的值对应的平面PLN(1)、PLN(2)、PLN(3)。
文档恢复单元215可以对应于参考图像REF的像素位置给出的像素,提取由平面指定单元214确定的平面上的值,并可以恢复文档,以及可以获得恢复文档100’。
当将单色定义为平面PLN(2)和PLN(3)上的对象,以及参考图像的像素的色调级别值为A2或A3时,将平面PLN(2)和PLN(3)上定义的颜色反映到恢复文档100’中。
此外,当对应于色调级别值A2和A3将单色定义为平面PLN(2)以及PLN(3),而不需要提前定义颜色时,将这些单色反映到恢复图像中。
图44示出了本发明优选实施例中的文档恢复方法。
可通过使用图43中的文档恢复设备21执行该文档恢复方法。
在图44中,首先,将文档数据DD分解成三层平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及参考图像REF,并对它们执行解码处理(文档分解/解码步骤:S421)。
扫描参考图像REF的像素,并获取对每个像素给定的三种色调级别的值A1、A2、A3(色调级别值获取步骤:S422)。
排除作为预定对象的平面(平面排除步骤:S423)。
确定相应于三种色调级别的值A1、A2及A3的平面(平面指定步骤:S424)。
提取赋予在平面指定步骤S424中确定的平面上的像素位置像素值,并创建恢复文档100’(文档恢复步骤:S425)。
接下来,图45A和45B示出了本发明的另一个优选实施例中的文档数据结构。
在本实施例中,如图45A所示,原始文档200与在前实施例中的原始文档100是相同的(参见图40A),并包含8位彩色图像201、蓝色绘制的字符以及蓝色横纹绘制的字符202、以及红色点状背景203。
此外,文档数据DD包含从图45B的原始文档中提取的平面PLN(1)、平面PLN(2)、平面PLN(3),以及参考图像REF。
参考图像REF具有每个像素的用于选择平面PLN(1)、PLN(2)以及PLN(3)之一的信息作为m个色调级别的A1,A2,A3值(本实施例中m=3)。
然而,图45B的平面PLN(2)以及参考图像REF与优选实施例(参见图40B)中的平面PLN(2)以及参考图像REF是不同的。
由参考图像REF指示蓝色绘制的字符以及蓝色横纹绘制的字符202。由黑色绘制以及黑色条纹绘制的图形B1在与平面PLN(2)的字符202相同的部分中形成(参见图46的平面PLN(2))。
可以通过图41的文档转换设备11创建图45B所示的文档数据DD的结构,并可用图45B中的文档恢复设备12将其恢复。
图46示出了第二优选实施例的文档转换方法。
该文件变换方法与第1实施方式的文件变换方法基本上相同。但是,在平面提取步骤S411中,第1实施方式,将原始文档200上的对象分成3张平面PLN(1)、PLN(2)、PLN(3)来提取,而本实施方式,将原始文档100上的对象分成2张平面PLN(1)、PLN(3)以及参照图像REF来提取。
图47示出了本发明的另一个优选实施例中的文档恢复方法。
该文档恢复方法与在前实施例中的文档恢复方法基本上是相同的,并且恢复文档200’所执行的恢复处理也与第一优选实施例的主旨相似。但是,在平面指定步骤S424中,第1实施方式,通过参照图像REF上的涂抹和平面PLN(2)上的字符对象来恢复字符202,而第2实施方式,通过参照图像REF上的字符对象和平面PLN(2)的涂抹来恢复字符202。
图48A和48B示出了本发明的另一个优选实施例中的文档数据结构。
在本实施例中,如图48A所示,原始文档300包括8位彩色图像301、上下格由绿色进行区分的蓝色表格304,以及被抹掉并用黑色表示的字符(上边区域用302表示,下边区域由303表示),以及红色点状的背景305。
此外,文档数据包括从图48B的原始文档300提取出来的平面PLN(1)、PLN(2)、PLN(3)、PLN(4),以及参考图像REF。参考图像REF具有用于每个像素选择平面PLN(1)、PLN(2)、PLN(3)以及PLN(s)(4)之一的信息,作为m个色调级别的值A1,A2,A3、和A4,以及A5(本实施例中m=5)。也就是说,本实施例中,n<m。
图48B的平面PLN(1)包括8位彩色图像301。此外,平面PLN(2)由单色绘制的字符构成。平面-PLN(3)由单色的表格构成。平面-PLN(4)由单色的点图构成。
另外,如上所述,参考图像REF包含五个色调级别的值A1、A2、A3及A4,以及区域A5。
带有色调级别值A1的区域相应于平面PLN(1)的彩色图像301形成。此外,带有色调级别值A2的区域相应于平面PLN(2)上的字符的上边区域302形成,以及带有色调级别值A3的区域相应于平面PLN(2)上的字符的下边区域303形成。
带有色调级别值A4的区域相应于平面PLN(3)的表格304形成,以及带有色调级别值A5的区域相应于平面PLN(4)的点图背景305。
图45B中所示结构的文档数据DD可以通过图41的文档转换设备11来创建,并可通过图43的文档恢复设备12进行恢复。
在本实施例中,根据PLN(1)上的像素值显示平面PLN(1)。此外,对于本实施例中的平面PLN(2)、(3)及(4),没有定义颜色,但分别相应于A2、A3、A4及A5如参考图像REF那样定义颜色。
因此,关于平面PLN(2)上的对象(本实施例中的字符),用预先定义为色调级别A2区域的颜色(蓝色)来表示,或者是预先定义为色调级别A3区域的颜色(绿色)来表示。
此外,平面-PLN(3)上的对象(本实施例中的表格),用预先定义为色调级别A3区域的颜色(这里是黑色)来表示。平面PLN(4)上的对象(本实施例中的点图)用预先定义为色调级别A4区域的颜色(这里是红色)来表示。
另外,也可以通过平面PLN(2)、PLN(3)及PLN(4)上的像素值来显示平面PLN(2)、PLN(3)及PLN(4)。在这种情况下,将颜色定义为平面PLN(2)、PLN(3)及PLN(4)上的对象。
图48B所示结构的文档数据DD可以通过图41的文档转换设备11来创建,并通过图43中的文档恢复设备12将其恢复。
图49示出了本发明的另一个优选实施例中的文档转换方法。
该文档转换方法与在前实施例中的文档转换方法基本上是相同的。然而,虽然字符对应于一个色调级别值A2,但通过本实施例中的参考图像创建步骤S412,字符对应于两个色调级别值A2和A3。
此外,在本实施例中,由于在原始文档300中增加了表格作为对象,一共有四个平面。
图50示出了本发明的另一个优选实施例的文档恢复方法。
该文档恢复方法与在前实施例中的文档恢复方法基本上是相同的,并且对恢复文档300执行的恢复处理也与第一优选实施例的主旨相似。然而,由于本实施例中的平面是参考图像REF上由色调级别值A2和A3两种颜色显示的字符对象,但是,在平面指定步骤S424中,第1实施方式,通过参照图像REF上的涂抹和平面PLN(2)上的字符对象来恢复字符102,而第3实施方式,通过参照图像REF上的色调值A2、A3表示的2色的字符对象、和平面PLN(2)的涂抹来恢复字符的上部区域302以及字符的下部区域303字符102。
图51A和图51B示出了本发明另一个优选实施例中的文档数据结构。
在本实施例中,如图51A所示,原始文档400包括由灰度级修饰的字符401,以及红色点图的背景402。
此外,文档数据DD包括从图51B的原始文档400中提取的n个平面(本实施例中n=2)PLN(1)和PLN(2),以及参考图像REF。
参考图像REF具有用于为每个像素选择平面PLN(1)和PLN(s)(2)之一的信息,作为m个色调级别的值A1,A2,......(本实施例中m=16)。也就是说,本实施例中,n<m。
如上所述,参考图像REF包括16个色调级别的值A1、A2、......、A16的区域。将在相应的平面PLN(1)上的像素值赋予具有色调级别值A1的区域的像素。
此外,将“白色”定义为具有色调级别值A2的区域,“黑色”定义为具有色调级别值A16的区域,将从“白色”逐渐靠近“黑色”的灰色定义为具有色调级别值A3-A15的区域。
图51B所示结构的文档数据DD可以通过图41的文档转换设备11来创建,并通过图43中的文档恢复设备12将其恢复。
在本实施例中,关于相应于参考图像REF上的具有色调级别值A1的像素的PLN(1)上的像素值,在与其相关的参考图像REF上显示像素值。对于平面PLN(2),没有定义颜色,但是白色、灰色以及黑色出现在对应于分别给予参考图像REF上的像素的色调级别值A2-A16的恢复图像中。
此外,也可以用平面PLN(2)、PLN(3)及PLN(4)上的像素值来显示平面PLN(2)、PLN(3)及PLN(4)。在这种情况下,颜色被定义为平面PLN(2)、PLN(3)及PLN(4)上的对象。
图51B所示结构的文档数据DD可以通过图41的文档转换设备11来创建,并通过图43中的文档恢复设备12将其恢复。
图52示出了本发明的另一个优选实施例的文档转换方法。
该文档转换方法与在前实施例中的文档转换方法基本上是相同的。此外,图53示出了本发明的另一个优选实施例的文档恢复方法。该文档恢复方法与在前实施例中的文档恢复方法基本上是相同的,并且对恢复文档400’的恢复的执行也与第一优选实施例的主旨相似。
对于参考图像REF的解码,在本实施例中,期望采用适于多级图像的方法。在本实施例中,诸如图像连续改变之类的灰度适用于在图框及背景中大量使用该灰度的图像。
图40A-图53的上述实施例提供了一种文档转换设备,其包括:平面图像提取单元,用从原始文档中提取n个平面;参考图像创建单元,用于创建其中将m个色调级别值指定给参考图像的每个像素的参考图像,参考图像还包含用于根据m个色调级别值选择n个平面之一的信息;以及编码单元,用于对n个平面以及参考图像进行编码。
根据本发明,可以将涉及彩色图像的文档的文件大小制作得很小,而不急剧地降低图像的质量。再有,在再现文档中,可以维持包括字符、格线和单色图形的图像的可视性,并且也可以被应用于具有灰度的图像。再有,将文档图像分割为两个或多个平面以及参考图像,仅仅可以显示或传送所需要的对象。
上述文档转换设备可以被配置为使得提供平面图像提取单元,通过将原始文档上的对象分割为n个平面或是n个平面和参考图像,而而提取出n个平面。
上述文档转换设备可以被配置为使得提供编码单元,通过使用根据原始文档上的对象类型的编码方法来对n个平面和/或参考图像进行编码。
上述文档转换设备可以被配置为使得提供编码单元,通过使用不同于其它平面使用的编码方法对n个平面中的至少一个平面进行编码。
上述文档转换设备可以被配置为使得文档转换设备还包括图像组合单元,用于将编码单元编码的参考图像和n个平面合并到数据集合中。
上述文档转换设备可以被配置为使得文档转换设备还包括操作单元,用于执行图像操作处理或图像补偿处理。
图40A-图53的上述实施例提供了一种文档恢复设备,通过获取具有文档数据结构的文档数据来恢复文档,该文档数据结构通过将从原始文档提取的n个平面组合成一个文件来创建,该文档数据具有n个平面以及包含用于为每一个像素选择n个平面中的一个作为m个色调级别的值的信息的参考图像,该文档恢复设备包括:文档分解/解码单元,将文档数据分解成n个平面和参考图像,并对n个平面中的每一个平面及参考图像执行解码处理;扫描单元,扫描参考图像的像素;色调级别值获取单元,获取分配给每一个扫描的像素的m个色调级别的值;平面确定单元,确定相应于m个色调级别的值的n个平面中的一个平面;像素值提取单元,提取平面确定单元确定的平面上的像素的像素值,该像素是对应于参考图像的像素位置,以及文档重建单元,通过将像素值提取单元提取的像素值分配给重建的文档图像中对应于参考图像的各个像素的像素来恢复文档。
上述文档恢复设备可以被配置为使得文档恢复设备还包括平面排除单元,用于在n个平面中指定一个或多个要排除的平面,其中所指定的平面不需要平面确定单元进行平面确定,并且在恢复的文档图像上只显示需要的对象。
图40A-图53的上述实施例提供了一种文档转换方法,包括以下步骤:从原始文档中提取n个平面;创建其中将m个色调级别值指定给参考图像的每个像素的参考图像,参考图像还包含用于根据m个色调级别值选择n个平面之一的信息;以及对n个平面以及参考图像进行编码。
上述文档转换方法可以被配置为使得提供提取步骤,通过将原始文档上的对象分割为n个平面或是n个平面和参考图像而提取出n个平面。
上述文档转换方法可以被配置为使得提供编码步骤,通过使用根据原始文档上的对象类型的编码方法来对n个平面和/或参考图像进行编码。
上述文档转换方法可以被配置为使得提供编码步骤,通过使用不同于其它平面使用的编码方法对n个平面中的至少一个平面进行编码。
上述文档转换方法可以被配置为使得文档转换方法还包括将编码步骤编码的参考图像和n个平面合并到数据集合中的步骤。
上述文档转换方法可以被配置为使得文档转换方法还包括执行图像操作处理或图像补偿处理的步骤。
图40A-图53的上述实施例提供了一种文档恢复方法,通过获取具有文档数据结构的文档数据来恢复文档,该文档数据结构通过将从原始文档提取的n个平面组合成一个文档来创建,该文档数据具有n个平面以及包含用于为每一个像素选择n个平面中的一个作为m个色调级别的值的信息的参考图像,该文档恢复方法包括以下步骤:将文档数据分解成n个平面和参考图像,并对n个平面中的每一个平面及参考图像执行解码处理;扫描参考图像的像素;获取分配给每一个扫描的像素的m个色调级别的值;确定相应于m个色调级别的值的n个平面中的一个平面;提取平面确定步骤所确定的平面上的像素的像素值,该像素对应于参考图像的像素位置;以及通过将在提取步骤中提取的像素值分配给重建的文档图像中对应于参考图像的各个像素的像素来恢复文档。
上述文档恢复方法可以被配置为使得文档恢复方法还包括:在n个平面中指定一个或多个要排除的平面的步骤,其中所指定的平面不需要进行平面确定,并且在恢复的文档图像上只显示需要的对象。
图40A-图53的上述实施例提供了一种计算机程序产品,能够使计算机执行上述图像转换方法。
图40A-图53的上述实施例提供了一种计算机程序产品,能够使计算机执行上述图像恢复方法。
图40A-图53的上述实施例提供了一种计算机可读存储介质,存储了能够使计算机执行上述图像转换方法和/或上述图像恢复方法。
接下来,图54A和图54B示出了本发明优选实施例中的文档数据结构。
如图54B所示,文档数据DD包括参考图像REF以及从图54A的原始文档100中提取的n个平面:平面PLN(1),平面PLN(2)(本实施例中,n=2)。
如图54A所示,原始文档100由8位彩色图像101、黑色绘制的字符以及灰色的绘制字符102构成。
在本实施例中,如图54B所示,根据相关图像指示的对象,将显示在原始文档100上的图像分割成平面PLN(1)和PLN(2),并提取它们。参考图像REF具有应用为每个像素选择平面PLN(1)和PLN(s)(2)之一的信息,作为m个色调级别的值A1和A2(本实施例中m=2)。例如,可以将A1作为:“0”,A2:“1”。
在本实施例中,参考图像REF包括应用原始文档100上的字符的m个色调级别中的一个色调级别的绘制(painting-out)图像。在本实施例中该绘制图像是字符。
在本实施例中,通过8位彩色图像以及适用于照片等压缩的方法来对平面-PLN(1)进行编码。
通过适用于简单形式的绘制图像的压缩的方法来对平面-PLN(2)进行编码。以及通过原始文档(字符)上的对象的像素值来确定相应于参考图像REF的绘制图像(字符)的像素值。
通过字符(由图像或文本代码表示的图像)以及适于字符压缩的方法对参考图像REF进行编码。
由于平面PLN(1)是彩色图像,其适合使用诸如JPEG以及JPEG2000之类的压缩方法。此外,平面PLN(2)可以应用如JPEG以及JPEG2000之类的压缩方法。由于参考图像REF是字符图像,其适用MMR压缩。
在本实施例中,如图54A和54B所示,参考图像REF的分辨率与原始文档100的分辨率是相同的,并且平面PLN(2)的分辨率设置成低于参考图像REF的分辨率。
在降低平面PLN(2)的分辨率时,当决定通过变薄处理或平均值处理将图像的像素值简单地经过低分辨率处理时,有时是比较困难的。例如,由于平面PLN(2)是再现字符颜色的图像,因此不希望除字符以外的像素值搀入平面PLN(2)中。也就是说,由于除字符以外的部分是适于单色的确定值的像素值,如黑色,因此不适于在低分辨率的平面PLN(2)的图像中映射该像素值。
图55是说明平面PLN(2)的低分辨率处理的示意图。图55(A)示出了平面PLN(2)的像素的值。图55(B)示出了用于对平面PLN(2)确定像素值(A的参考图像REF的像素值)的平均计算图像GA。图55C示出了平面PLN(2)的像素值。
用于取平均值的图像GA仅提取原始文档100的字符对象的像素值,并给出平面PLN(2)上的像素值作为包含在用于取平均值的图像GA中3x3个像素块中的字符对象的平均像素值。
如图55(B)所示,将平面PLN(1)的像素值选择给参考图像REF的白色像素。并将平面PLN(2)像素值(像素平均值:视图深处字符对象的灰度)选择给黑色像素。
图56示出了第一优选实施例的文档转换设备的方块图,通过该文档转换设备可以创建图54B所示结构的文档数据DD。
在图56中,文档转换设备410包括:平面图像提取单元411,参考图像创建单元412,图像操作单元413,编码单元414,以及图像组合单元415。
平面图像提取单元411可以根据编码方法从原始文档100中提取两层平面PLN(1)和PLN(2)的平面PLN。
在本实施例中,平面PLN(1)是彩色图像。此外,在PLN(2)中,当原始文档100上的对象颜色是彩色时,可作为实现PLN(2)上的对象平均值的颜色。此外,参考图像REF是单色图像。
在本实施例中,由平面PLN(1)提取彩色照片等,由平面PLN(2)提取字符。由于与这些提取相关的对象的提取技术(字符提取,背景提取)是公知的,将不再给出说明。
参考图像创建单元412可以创建参考图像REF。
图像操作单元413可以执行图像操作或图像补偿(分辨率转换,滤波处理,亮度补偿,色调补偿,噪声抑制)。通常,通过这种处理,编码时的可压缩性会变高。
例如,仅字符的颜色应当理解恢复文档100’上的平面PLN(2)。因此,将平面PLN(2)上的分辨率设置为低。
此外,由于参考图像REF上的对象是字符,即使降低平面PLN(2)的分辨率也不会使可见度下降很多。另外,对于参考图像REF,如果执行了字符识别处理,将获得文本代码。
如果这与最终创建并设置的一系列数据集合有关(数据集合中通常包括文本数据),可以在恢复文档100中执行文本代码的检索。
此外,内插处理等可以执行提高分辨率的图像处理。尽管文件尺寸变大,但当照片区域等比较重要时,可以改善图像质量。在本实施例中,虽然参考图像REF没有改变点间距,但可以对它进行改变。
对于参考图像REF,可以通过消除细小的黑色像素的连通分量的方法来进行噪声抑制,并可压缩性也将随之变高。
此外,根据如何使用该文档,可以对每个平面所适用的机器处理进行选择。例如,当认为照片是比较重要的时候,将不会降低平面PLN(1)的分辨率。
相反,当不是很重要时,照片降低平面PLN(1)的分辨率,并使平面PLN(2)的分辨率变高。由于是图像质量与最终信息尺寸的折衷,因此要根据使用方式来确定它们。
编码单元414可以通过根据原始文档100上的对象类型的方法(是用于对相关对象进行压缩的适当方法,并且对每个平面是不同的)来对平面PLN(1)、PLN(2)以及参考图像REF进行编码。
图像组合单元415可将由编码单元413编码的参考图像REF以及n个平面PLN(1)和PLN(2)合并到数据集合中。此外,在进行组合的时候,每个平面包括在数据集合中显示其所具有的属性的信息(例如,如照片、字符、以及背景之类的位图图像的信息)。在这种情况下,当进行文档恢复时,对操作者来说,不需要的平面可以通过平面排除单元423来排除。因此,就图像表示来说,只有某个特定的平面还可以显示出来。因此,由于不需要的信息是不可视的,因此文档变得容易辨认。
此外,在数据通信时,从数据集合中排除适宜认作不需要的平面,并由此降低了发送和接收的数据量(收发器的时间也因此缩短)。
图57示出了优选实施例的文档转换方法。可以通过使用图56的文档转换设备来实现该文档转换方法。
在图57中,首先根据编码方法从原始文档100中提取两层平面PLN(1)和PLN(2)的平面PLN(平面提取步骤:S411)。在平面提取步骤S411中,将原始文档100上的对象分割成平面PLN(1)和平面PLN(2),并提取它们。
接下来,当将两种色调级别的值A1、A2指定给每个像素时,创建用于根据两种色调级别的值来确定是平面PLN(1)和平面PLN(2)中任意一个的参考图像REF(参考图像创建步骤:S412)。
此外,对两层平面PLN(1)和PLN(2)的平面PLN进行图像操作或图像补偿(分辨率转换、滤波处理、亮度补偿、色调补偿、噪声抑制)(图像操作步骤:S413)。对平面PLN(2)进行上述分辨率转换。
接着,对两层平面PLN(1)、PLN(2)的平面PLN以及参考图像REF进行编码(编码步骤:S414)。在编码步骤S414中,通过根据原始文档100上的对象类型(本实施例中为字符)的方法对两层平面PLN(1)、PLN(2)的平面PLN以及参考图像REF进行编码。
在本实施例中,分别通过不同的编码方法分别对两层平面进行编码。并将在编码步骤S414中编码的参考图像REF以及两层平面PLN(1)、PLN(2)的平面PLN合并在数据集合中。
此外,可以将与原始文档100的平面PLN(1)上的字符相对应的像素替换成周围的典型颜色。
此外,也可以将平面PLN(2)所不涉及的区域中的像素值转换成预定的像素值(如白色、黑色等)。因此,在这种情况下编码可以提高压缩率。
图58示出了优选实施例中的文档恢复设备。
图58中的文档恢复设备21包括文档分解/解码单元421、色调级别值获取单元422、平面排除单元423、平面指定单元424、以及文档恢复单元425。
在本实施例中,文档恢复设备21可以获取文档数据DD,并可以从相关文档数据中恢复原始文档100。
文档分解/解码单元421可以对文档数据DD执行解码处理,并可以创建两层平面PLN(1)、PLN(2)的平面PLN以及参考图像REF。
色调级别值获取单元422可以获取扫描参考图像REF的像素的两种色调级别的值A1和A2中的任何一个,并将其指定给扫描的像素。
平面排除单元423可以从两层平面PLN(1)和PLN(2)的平面PLN的处理对象中移除一层或两层平面。通过不包含平面指定单元424指定的对象,平面排除单元423排除的平面可以仅在再现的图像100’上显示所需的对象。
平面指定单元424可以相应于两种色调级别的A1和A2值来确定平面PLN(1)和PLN(2)的平面PLN。
文档恢复单元425可以相应于指定给参考图像REF的像素位置的像素,提取由平面指定单元424确定的平面上的值,可以恢复文档,以及可以获得恢复文档100’。
当在平面PLN(2)上定义颜色、并且参考图像REF的像素的色调级别值为A2时,将平面PLN(2)上定义的颜色反应到恢复文档100’中。
图59示出了优选实施例的文档恢复方法。该文档恢复方法可以通过使用图58的文档恢复设备21来执行。
在图59中,首先,将文档数据DD分解成两层平面PLN(1)、PLN(2)的平面PLN以及参考图像REF,并对它们执行解码处理(文档分解/解码步骤:S421)。
扫描参考图像REF的像素,并获取对每个像素指定的两种色调级别的值A1和A2(色调级别值获取步骤:S422)。
排除作为预定对象的平面(平面排除步骤:S423)。
确定相应于两种色调级别的值A1和A2的平面(平面指定步骤:S424)。
提取为在平面指定步骤S424中确定的平面上的像素位置指定的像素值,并创建恢复文档100’(文档恢复步骤:S425)。
图60示出了改变平面PLN(2)的低分辨率处理的优选实施例。图60(A)示出了平面PLN(2)的像素的值。图60(B)示出了用于从(A)的参考图像REF的像素值中确定平面PLN(2)的像素值的平均计算图像GA。图60C示出了平面PLN(2)的像素值。
用于取平均值的图像GA仅提取原始文档100的字符对象的像素值,并给出平面PLN(2)上的像素值作为包含在用于取平均值的图像GA的8x8个像素块T中的字符对象的平均像素值。
如图60(B)所示,将平面PLN(1)的像素值选择给参考图像REF的白色像素。并将平面PLN(2)的像素值(作为字符对象的平均像素值的图60的深灰色)选择给黑色像素。
当用于取平均值的图像GA上相当于8x8个像素的块T中的字符的像素中的变化很小时,由相同的颜色围绕相应于平面PLN(2)上的像素值。
此外,当块T的像素值中的变化很大时,判断较小尺寸的块(如2×2个像素块)中的变化,并当该变化很小时,可以由相同颜色围绕相应于平面PLN(2)上的像素值。
图61示出了上述平面PLN(2)的低分辨率处理流程图。
首先,在用于取平均值的图像GA上选择相当于8×8个像素的块(层-tile)T(S401)。接下来,判断是否提取块T中相当于该字符位置的像素(S402),并是否存在相应的像素(S403)。
在步骤S403中,当块T中不存在相当于该字符位置的像素时,将预定的像素值指定给平面PLN(2)的像素(S404)。并且确定关于平面PLN(2)的所有像素是否完成像素值的分配(S410)。
在步骤S403中,当块T中存在相当于该字符位置的像素时,计算所涉及的每个像素值的平均值及变化(S405),并确定该变化是否大于预定值(S406)。
当变化大于预定值时,将用于取平均值的图像GA上的8×8像素块T重新分割成2x2的像素块(S407)。
将重新分解的块中相当于字符的像素的像素平均值指定给平面PLN(2)的像素(S408)。并且确定关于平面PLN(2)的所有像素是否完成了像素值的分配(S410)。
在步骤S406中,当变化大于预定值时,将8×8像素块T中字符相当像素的像素的平均值分配给PLN(2)的像素。并且确定对于平面PLN(2)的所有像素是否完成了像素值的分配(S410)
在步骤S410中,当结束对平面PLN(2)上所有像素分配像素值时,结束低分辨率处理。
在本实施例中,判断原始文档100的颜色变化,如果在好的单元上的颜色产生变化,则将不掺入该颜色。此外,由于选择性地改变着色单元,因此无需降低本实施例中的图像质量,就可以期望获得提高压缩率的效果。
此外,作为在颜色中建立变化的方法,虽然是基于变化的,但可以使用非彩色的像素与其它彩色像素的比例。在这种情况下,同时对无色和彩色进行判断,除非颜色中的变化很大。
当某个像素颜色为(R,G,B)等时,在预先定义的阈值th之间实现|R-G|<th,|G-B|<th,|B-R|<th之间的关系的时候,可以考虑如何判断无色判断是无色的。
在搀入彩色时,通过使用如非彩色或彩色的比例的方法来搀入颜色。但是,由于并不需要执行偏差计算所需要的乘法,因此,具有计算成本小的优点。
图54A-图61的上述实施例提供了一种文档转换设备,其包括:平面图像提取单元,用从原始文档中提取n个平面;参考图像创建单元,用于创建参考图像,其中将m个色调级别的值分配给参考图像,参考图像还包含用于为每个像素选择n个平面之一的信息作为m个色调级别的值,以及参考图像包括作为由m个色调级别之一给定的绘制图像的原始文档上的预定对象;以及编码单元,用于对n个平面以及参考图像进行编码;其中平面图像提取单元用于基于原始文档上绘制图像的像素值来确定相应于平面上绘制图像的每个像素的像素值,所述平面是根据参考图像中包含的每个像素的信息,从n个平面中选择的。
相据本发明,可以将涉及彩色图像的文档的文件大小制作得很小,而不急剧地降低图像的质量。再有,在再现文档中,可以维持包括字符、格线和单色图形的图像的可视性,并且也可以被应用于具有灰度的图像。再有,由于将文档图像分割为两个或多个平面以及参考图像,仅仅可以显示或传送所需要的对象。
上述文档转换设备可以被配置为使得平面图像提取单元提取根据参考平面上绘制图像的每一个像素的信息选择的平面图像,该平面图像具有低于原始图像的分辨率,并且平面图像提取单元根据相应于所提取的平面图像的像素的原始文档中的块中的绘制图像的像素值改变来确定该选择的平面图像的像素值。
上述文档转换设备可以被配置为使得平面图像提取单元提取根据参考图像上绘制图像的每个像素的信息选择的平面图像,该平面图像具有低于原始图像的分辨率,并且其中平面图像提取单元确定相应于所提取的平面图像的像素的原始文档第一层(first tile)中的绘制图像的像素值的改变,以及当所述改变小于给定值时,根据第一层中的绘制图像的像素平均值确定所选择的平面图像的像素值,以及当所述改变大于给定值时,确定原始文档的第二较小层中的绘制图像的像素值的改变,以及当所述改变小于给定值时,根据第二较小层中的绘制图像的平均像素值来确定所选择的平面图像的像素值。
上述文档转换设备可以被配置为使得平面图像提取单元通过将原始文档上的对象分割成n个平面或是n个平面和参考图像来提取n个平面。
上述文档转换设备可以被配置为使得编码单元通过使用根据原始文档上的对象类型的编码方法来对n个平面和/或参考图像进行编码。
上述文档转换设备可以被配置为使得编码单元通过使用不同于编码其它平面的编码方法来对n个平面中的至少一个平面进行编码。
上述文档转换设备可以被配置为使得文档转换设备还包括图像组合单元,用于将编码单元编码的参考图像和n个平面合并到数据集合中。
上述文档转换设备可以被配置为使得文档转换设备还包括图像操作单元,用于执行图像操作处理或图像补偿处理。
图54A-图61的上述实施例提供了一种文档恢复设备,通过获取具有通过将从原始文档提取的n个平面组合成一个文件而创建的文档数据结构的文档数据来恢复文档,该文档数据具有n个平面和包含用于为每一个像素选择n个平面中的一个作为m中色调级别的值的信息的参考图像,参考图像包括作为由m种色调级别中的一种指定的绘制图像的原始文档上的预定对象,基于原始文档上的预定对象的像素值,来确定相应于根据参考图像所包含的每个像素的信息、在n个平面中选择的平面上的绘制图像的每个像素的像素值,所述文档恢复设备包括:文档分解/解码单元,将文档数据分解成n个平面和参考图像,并对n个平面中的每一个平面及参考图像执行解码处理;扫描单元,扫描参考图像的像素;色调级别值获取单元,获取分配给每一个由扫描单元扫描的像素的m个色调级别的值;平面确定单元,确定相应于m个色调级别的值的n个平面中的一个平面;像素值提取单元,提取平面确定单元确定的平面上的像素的像素值,该像素是对应于参考图像的像素的位置,以及文档重建单元,通过将像素值提取单元提取的像素值分配给重建的文档图像中对应于参考图像的各个像素的像素来恢复文档。
上述文档恢复设备可以被配置为使得文档恢复设备包括平面排除单元,用于在n个平面中指定一个或多个平面,其中所指定的平面不经受平面确定单元的特定处理,并且在恢复的文档图像上只显示需要的对象。
图54A-图61的上述实施例提供了一种文档转换方法,包括以下步骤:从原始文档中提取n个平面;创建参考图像,其中将m个色调级别的值指定给参考图像的每个像素,参考图像还包含用于为每个像素选择n个平面之一的信息,作为m个色调级别的值,以及参考图像包括作为由m个色调级别之一给定的绘制图像的原始文档上的预定对象;以及对n个平面以及参考图像进行编码;其中提供提取步骤,使得基于原始文档上绘制图像的像素值来确定平面上相应于绘制图像的每个像素的像素值,该平面是根据参考图像中包含的每个像素的信息从n个平面中选择的。
上述文档转换方法可以被配置为使得在提取步骤中,提取根据参考图像上绘制图像的每个像素的信息选择的平面图像,该平面图像具有低于原始图像的分辨率,并且提供提取步骤,使得根据相应于所提取的平面图像的像素的原始文档中的一层绘制图像的像素值的改变来确定该选择的平面图像的像素值。
上述文档转换方法可以被配置为使得在提取步骤中,提取根据参考图像上绘制图像的每个像素的信息选择的平面图像,该平面图像具有低于原始图像的分辨率,并且其中提取步骤确定相应于所提取的平面图像的像素的原始文档中第一层绘制图像的像素值的改变,以及当所述改变小于给定值时,根据第一层中的绘制图像的像素平均值确定所选择的平面图像的像素值,以及当所述改变大于给定值时,确定原始文档的第二较小层中的绘制图像的像素值的改变,以及当所述改变小于给定值时,根据第二较小层中的绘制图像的平均像素值来确定所选择的平面图像的像素值。
上述文档转换方法可以被配置为使得提取步骤通过将原始文档上的对象分割成n个平面或是n个平面和参考图像来提取n个平面。
上述文档转换方法可以被配置为使得编码步骤通过使用根据原始文档上的对象类型的编码方法来对n个平面和/或参考图像进行编码。
上述文档转换方法可以被配置为使得编码步骤通过使用不同于编码其它平面的编码方法来对n个平面中的至少一个平面进行编码。
上述文档转换方法可以被配置为使得文档转换方法还包括组合步骤,将编码步骤中编码的参考图像和n个平面合并到数据集合中。
上述文档转换方法可以被配置为使得文档转换方法还包括执行图像操作处理或图像补偿处理的步骤。
图54A-图61的上述实施例提供了一种文档恢复方法,通过获取具有通过将从原始文档提取的n个平面组合成一个文档而创建的文档数据结构的文档数据来恢复文档,该文档数据具有n个平面和包含用于为每一个像素选择n个平面中之一的信息作为m个色调级别的值的参考图像,参考图像包括作为由m种色调级别中的一种指定的绘制图像的原始文档上的预定对象,基于原始文档上的预定对象的像素值,来确定相应于根据参考图像所包含的每个像素的信息、在n个平面中选择的平面上的绘制图像的每个像素的像素值,该文档恢复方法包括以下步骤:将文档数据分解成n个平面和参考图像,并对n个平面中的每一个平面及参考图像执行解码处理;扫描参考图像的像素;获取分配给每一个扫描的像素的m个色调级别的值;确定相应于m个色调级别的值的n个平面中的平面;提取确定步骤中确定的平面上的像素的像素值,该像素对应于参考图像的像素的位置,以及通过将像素值提取单元提取的像素值分配给重建的文档图像中对应于参考图像的各个像素的像素来恢复文档。
上述文档恢复方法可以被配置为使得文档恢复方法还包括在n个平面中指定一个或多个要被排除的平面的步骤,其中所指定的平面不需要进行平面确定,并且在恢复的文档图像上只显示需要的对象。
图54A-图61的上述实施例提供了一种计算机程序产品,能够使计算机执行上述文档转换方法。
图54A-图61的上述实施例提供了一种计算机程序产品,能够使计算机执行上述文档恢复方法。
图54A-图61的上述实施例提供了一种计算机可读存储介质,其中存储了能够使计算机执行上述文档转换方法和/或上述文档恢复方法。
接下来,图62是示出了本发明的优选实施例中的图像处理设备的功能方块图。
如图62所示,图像处理设备11包括:特定属性区域提取单元111,格线提取单元112,特定属性区域消除图像创建单元113,特定属性区域颜色确定单元114,特定属性区域着色图像创建单元115,格线绘制单元116,以及着色单元117。
特定属性区域提取单元11可以从原始图像OG(EP示出了特定属性信息)中提取带有特定属性的部分(特定属性区域:本实施例中的字符部分)。特定属性指的是本实施例中的字符属性。
此外,在本实施例中,特定属性区域提取单元111包含:二值化原始图像创建单元1111,特定属性区域提取单元1112,格线消除二值化图像创建单元1113,连通分量提取单元1114,以及连通分量尺寸分类单元1115。
二值化原始图像创建单元1111创建实现原始图像OG的二值化的二值化原始图像OGB。特定属性区域识别单元1112在由二值化原始图像创建单元1111创建的二值化原始图像OGB中执行特定属性区域的识别处理。
格线消除二值化图像创建单元1113从二值化原始图像OGB中消除由格线提取单元112提取的格线,并创建格线消除二值化图像OGB’。
连通分量提取单元1114从由格线消除二值化图像生成单元1113生成的格线消除二值化图像OGB’中提取连通分量LE,连通分量大小分类单元1115对由连通分量提取单元1114提取的连接分量的大小进行分类。该分类结果是特定属性信息EP。
格线提取单元112提取包含在原始图像OG中的格线。在本实施例中,格线提取单元112将从由二值化原始图像创建单元1111创建的二值化原始图像OGB中提取格线FB。
特定属性区域消除图像创建单元113创建特定属性区域消除图像OGE,该图像中消除了由特定属性区域提取单元111从原始图像中提取的特定属性区域(字符部分)。
特定属性区域颜色确定单元114确定由特定属性区域提取单元111提取的特定属性区域(字符部分)的颜色。将该颜色信息设为LC。
特定属性区域着色图像创建单元115创建至少一幅特定属性区域着色图像CGG,该图像由特定属性区域颜色确定单元114所确定的特性属性区域(字符部分)的图像的颜色所绘制。
在连通分量尺寸分类单元的处理之后,格线绘制单元116将由格线消除二值化图像创建单元消除的格线FB重新画到图像中去。
编码单元117从消除了特定属性区域的图像以及仅由特定属性区域构成的图像中创建压缩图像。在本实施例中,无需损失原始图像的字符可见度,图像处理设备11便可以实现尺寸的明显减少。
图63是用于解释说明图62中的图像处理设备11的处理流程的方块图。
由于对图像处理设备11使用了图像扫描仪等,以及输入带有る的上述多值原始图像(S501),二值化原始图像创建单元1111创建实现原始图像OG的二值化的二值化原始图像OGB(S502)。
随后,特定属性区域识别单元1112从原始图像OG中确认特定属性区域(本实施例中的字符部分)的位置(S503)。可以按照每个像素来获知字符的位置。
字符部分的位置确定技术是公知的技术,该技术也可以从多级图像中直接确定字符部分的位置,从多级图像中创建二值化原始图像OGB(参见日本公开专利申请No.2002-288589),并且也可以从该二值化原始图像OGB中确定字符部分的位置(参见日本公开专利申请No.06-020092)。
通过消除在步骤S503中识别的特定属性区域之外的黑色像素(将黑色像素改变为背景颜色(通常是白色))来执行特定属性区域的提取(S504)。
此外,格线提取单元112执行格线提取(S505)。在本实施例中,基于由如上所述的二值化图像创建单元1111创建的二值化原始图像OGB来执行格线的提取。
此外,由格线消除二值化原始图像创建单元1113消除格线(S506)。也就是说,通过改变为白色像素来实现格线消除。
另外,步骤S504至S506可以调换顺序。如上所述,创建了格线消除二值化原始图像OGB’。
接下来,通过连通分量提取单元1114,从格线消除二值化原始图像OGB’中提取黑色像素的连通分量(S507),并消除尺寸太大和太小的连通分量(S508)。
由于噪声等,如果存在不是字符位于二值图像的最顶端的可能性,则尺寸太小的连通分量将导致压缩率的降低。
此外,字符区域的定位在技术上是困难的,并且不必提取正确的字符区域。因此,当视图区域以及照片区域位于原始图像OG中时,该区域可能会被错认为是字符。因此,尺寸太大的连通分量具有不是字符的高可能性。
另外,虽然当大尺寸的连通分量确实是字符时,其会根据该处理被意外地分类到背景中,但由于尺寸很大,其足可以被人的眼睛读出。
当格线没有被消除时,它变成与格线相同的连通分量,尺寸变得很大,并且这里不可能提取与格线接触的字符。因此,执行格线消除具有易于提取与格线接触的字符的效果。
例如,虽然如图64A所示字符的一部分会被识别为独立的字符或者字符的一部分和格线会被识别为图像,当依尺寸提取字符时,不需要区分字符和格线。尽管当字符和格线分开时按尺寸提取字符,如图64B所示,字符的识别是正确的。
由于在许多情况下格线是单色的,即使由二值图像来再现,也不会降低可见度。因而,再次画出该格线并使得消除了字符以外内容的格线消除二值化原始图像OGB’作为二值图像再次显示(S509)。
此外,如果不是格线的部分,如照片部分,被作为格线进行提取并由二值图像进行再现,颜色数量将大量减少并将导致图像质量的下降。在这种情况下,也可能省略该处理。因此,格线将作为背景颜色被再现。
接下来,通过特定属性区域消除图像创建单元113产生消除了特定属性区域(特定属性区域)的特定属性区域消除图像OGE(S510)。
需要的只是创建由周围的颜色具体取代格线消除二值化原始图像OGB’中字符部分的像素的图像。
具体地,该特定属性区域消除图像OGE是从二值化原始图像OGB中移除了特定属性区域(字符部分)以及格线的图像。
然后,特定属性区域颜色确定单元确定特定属性区域的颜色(S511)。确定彩色图像中所有位于构成字符的黑色像素位置上的像素的颜色,并从该数据中选择一些常用的主要颜色作为代表颜色。
以及确定每个像素以及构成每个连通分量的字符的像素是否最接近某一个代表颜色。
通过特定属性区域着色图像创建单元115,创建具有特定属性区域的特定属性区域着色图像CGG(具有绘制每个像素以及每个连通分量的颜色)(S512)。对于这种图像来说,仅具有有限颜色的多级图像是足够的,并且它可以具有针对每种颜色的每一幅二值图像。假设它具有针对每种颜色的每一幅二值图像。
从编码单元117创建的消除了特定属性区域的图像以及仅包括特定属性区域的图像中创建压缩图像(S513)。例如,如果前一个图像执行JPEG压缩而后一个图像执行MMR压缩,文件的尺寸将会明显变小。
接下来,通过组合文件产生单元118组合成可以将仅包括特定属性像素的图像堆叠并显示在消除了特定属性区域的图像上的格式(S514)。
如果组合了它们,将变成字符粘贴在背景上的形式,并可简单地作为原始图像OG。
图65示出了在原始图像OG中包含诸如照片之类的图像IM的情况下,本发明优选实施例中的图像处理设备的功能方块图,以及图66是示出了所涉及的图像处理设备的处理流程图。
虽然图65的组成与图62的简略组成是相同的,但其与图62中多值图像提取单元119从原始图像OG中分离字符以及提取诸如照片之类的图像IM是不同的。在本实施例中,通过原始图像OG将带有格线FB的字符LT表示为图像IM。
从该原始图像OG提取图像IM部分的多值原图像OG1和全体进行二值化,生成图像(二值化原始图像OGB)(A1、A2)。特定属性区域提取单元111从二值化原始图像OGB中提取特定属性区域(字符部分)(A3),格线提取单元112从二值化原始图像OGB中提取格线,通过格线描画单元116进行描画(A4),同时由特定区域颜色确定单元114对二值化原始图像OGB施加彩色,创建格线消除二值化原始图像OGB’。
接着,编码单元117进行编码,并通过组合文件产生单元118将图像IM、格线部分FB(它们作为特定属性区域消除图像OGE)、以及格线消除二值化原始图像OGB’(特定属性区域(字符部分))合并起来(A6)。
参照图67A至68,将解释说明通过格线提取单元112执行格线提取的情况。
图67A和图67B是示出了格线提取单元112的详细结构图,如图67A所示,格线提取单元112包括用于提取被认为是相同颜色的长游程的相同颜色长游程提取单元1121,以及用于创建构成由相同颜色长游程提取单元1121提取的分量长游程的连通分量的长游程连通分量创建单元1122。
此外,如图67B所示,格线提取单元112包括用于提取被认为是相同颜色的短游程的相同颜色短游程提取单元1123,以及用于创建构成由相同颜色短游程提取单元1123提取的分量短游程的连通分量的短游程连通分量创建单元1124。
图67A的格线提取单元112仅从黑色像素的游程(垂直连续的级别或黑色像素组)中提取长的游程,概括这些长游程所到达的位置,并将其分组作为连通分量。
仅将在游程的方向长、在与游程垂直的方向短、细长的连通分量看作格线。
此外,图67B中的格线提取单元112仅从黑色像素的游程中提取短的游程,并从中提取连通分量。如果在游程方向上是短的,则认为在垂直方向上的游程中仅有长的以及细长的连通分量是字符。可以使用图67A或67B中示出的部件。
如图68(A1)、(A2)及(A3)所示的小写字母的情况,图67A的格线提取单元112是非常倾斜和杂乱的,以及也可以提取小的像素。相反,如图68(B1)、(B2)及(B3)所示,图67B中的线格提取单元112是不太倾斜和杂乱的,并且不能提取小的像素(在每个视图中,大写字母示出了原始图像OG以及小写字母的绘制示出了由格线提取单元112提取的图像)。
此外,尽管图67A的格线提取单元112可以识别图69(A)所示的格线,而图67B的格线提取单元112不能识别图69(B)所示的格线(在每个视图中,大写字母示出了原始图像OG,小写字母的绘制示出了由格线提取单元112提取的图像)。
由于在上述图67A和67B的格线提取单元112分别存在的优缺点,如果使用了同时具有两种功能的格线提取单元,格线提取中的遗漏将会减少。
通过上述处理,无需减少可见度,便可获得文件尺寸的明显压缩。也就是说,虽然JPEG压缩对于像素值急剧改变的图像不具有很好的压缩率,但如果通过在此描述的方法消除字符部分,由于将不会存在字符部分的像素值改变,效果会变好。
此外,由于字符部分急剧减少颜色数量,也由于这个原因压缩率变好。如果字符作为二值图像被再现,由于轮廓在图像质量方面变得清晰,可见度也趋于改善。
图62-图69的上述实施例提供了一种图像处理设备,包括:特定属性区域提取单元,用于从原始图像中提取具有特定属性的特定属性区域;格线提取单元,用于提取包含在原始图像中的格线;特定属性区域消除图像创建单元,用于创建从原始图像中消除了由特定属性区域提取单元提取的特定属性区域的特定属性区域消除图像;特定属性区域颜色确定单元,用于确定由特定属性区域提取单元提取的特定属性区域的颜色;和特定属性区域着色图像创建单元,用于创建至少一幅特定属性区域着色图像,其中该特定属性区域的图像是由特定属性区域颜色确定单元确定的颜色绘制的。
根据本发明,在不降低可见性的情况下获得了文件尺寸的显著压缩。即,尽管JPEG压缩对于像素值急剧变化的图像不具有很好的压缩效率,但是由于通过JPEG方法以外的压缩方法(适于字符等的MMR方法的压缩)编码字符区域,压缩效率变高。此外,由于字符区域急剧减少了颜色数量,压缩效率变好(由于执行了二值化)。如果将字符再现为二值图像,由于轮廓的图像质量变得清晰,可见性趋于改善。
上述图像处理设备可以被配置为使得特定属性区域提取单元包括用于通过原始图像的二值化创建二值原始图像的二值原始图像创建单元,以及用于识别由二值原始图像创建单元创建的二值原始图像中的特定属性区域的特定属性区域识别单元,以及其中格线提取单元从由二值原始图像创建单元创建的二值原始图像中提取格线。
上述图像处理设备可以被配置为使得特定属性区域提取单元还包括:格线消除二值图像创建单元,用于创建从二值原始图像中消除了由格线提取单元提取的格线的格线消除二值图像;连通分量提取单元,从由格线消除二值图像创建单元创建的格线消除二值图像中提取连通分量;以及连通分量尺寸分类单元,用于对连通分量提取单元提取的连通分量的尺寸进行分类。
上述图像处理设备可以被配置为使得图像处理设备还包括在连通分量尺寸分类单元的处理后再次将格线绘制到图像中的格线绘制单元,所述格线是由格线消除二值图像创建单元消除的格线。
上述图像处理设备可以被配置为使得格线提取单元包括:相同颜色长游程提取单元,用于提取被认为具有相同颜色的长游程;以及长游程连通分量创建单元,用于创建由相同颜色长游程提取单元提取的长游程构成的连通分量。
上述图像处理设备可以被配置为使得格线提取单元包括:相同颜色短游程提取单元,用于提取被认为具有相同颜色的短游程;以及短游程连通分量创建单元,用于创建由相同颜色短游程提取单元提取的短游程构成的连通分量。
上述图像处理设备可以被配置为使得格线提取单元包括:相同颜色长游程提取单元,用于提取被认为具有相同颜色的长游程;长游程连通分量创建单元,用于创建由相同颜色长游程提取单元提取的长游程构成的连通分量;相同颜色短游程提取单元,用于提取被认为具有相同颜色的短游程;以及短游程连通分量创建单元,用于创建由相同颜色短游程提取单元提取的短游程构成的连通分量。
图62-图69的上述实施例提供了一种图像处理方法,包括以下步骤:从原始图像中提取具有特定属性的特定属性区域;提取包含在原始图像中的格线;创建从原始图像中消除了提取的特定属性区域的特定属性区域消除图像;确定提取的特定属性区域的颜色;创建至少一幅特定属性区域着色图像,其中该特定属性区域的图像是由确定步骤中确定的颜色绘制的。
上述图像处理方法可以被配置为使得特定属性区域提取步骤包括通过原始图像的二值化创建二值原始图像,以及其中格线提取步骤用于从创建的二值原始图像中提取格线。
上述图像处理方法可以被配置为使得特定属性区域提取步骤还包括:创建从二值原始图像中消除由格线提取步骤提取的格线的格线消除二值图像;从所创建的格线消除二值图像中提取连通分量;以及对所提取的连通分量的尺寸进行分类。
上述图像处理方法可以被配置为使得图像处理方法还包括在连通分量尺寸分类步骤的处理后再次将格线绘制到图像中的步骤,所述格线是由格线消除二值图像创建步骤消除的格线。
上述图像处理方法可以被配置为使得格线提取步骤包括:提取被认为具有相同颜色的长游程;以及创建由提取的长游程构成的连通分量。
上述图像处理方法可以被配置为使得格线提取步骤包括:提取被认为具有相同颜色的短游程;以及创建由提取的短游程构成的连通分量。
上述图像处理方法可以被配置为使得格线提取步骤包括:提取被认为具有相同颜色的长游程;创建由提取的长游程构成的连通分量;提取被认为具有相同颜色的短游程;以及创建由提取的短游程构成的连通分量。
图62-图69的上述实施例提供了一种计算机程序产品,能够使计算机执行上述图像处理方法。
图62-图69的上述实施例提供了一种计算机可读存储介质,其中存储了能够使计算机执行上述图像处理方法。
接下来,图70是由基于图像处理程序13的图像处理设备1执行的处理的功能方块图。
图像处理设备1通过图像处理程序13执行预处理单元621、字符图像创建单元622、无字符图像创建单元624、字符颜色指定单元625、图像编码单元626以及组合文件创建单元627各自的功能。
接下来,解释说明各个单元的基本功能。
首先,预处理单元621在作为处理对象的原始图像的多级文档图像(在本例中是24位彩色图像)中执行边界突出(emphasis)处理、平滑处理等处理。
接着,字符图像创建单元622基于该原始图像(在本例中,是字符部分的位置)确定具有特定属性的部分(特定属性部分)的位置。
字符图像创建单元623创建二值图像,其中将相应于作为多级图像的原始图像中不具有特定属性的区域的该部分的像素值,以及将相应于具有特定属性的字符区域的部分的像素值改变为相互不同的像素值。在本例中,在二值图像中消除了除字符以外的黑色像素并将其改变为白色像素。通过这种处理,可以按照每个像素获知字符的位置。
字符颜色指定单元625确定作为特定属性部分的字符的颜色。字符颜色指定单元625确定构成字符的黑色字符的位置上的彩色图像中所有像素的颜色,并基于该颜色数据选择图像中常用的一些主要颜色作为代表颜色。
对每个像素或者每个连通分量,判断构成字符的像素最接近哪种代表色。然后,创建其中带有特定属性的像素具有对每个像素或者每个连通分量判断了的颜色的图像。
仅具有有限颜色的多级图像也是令人满意的,并且可以实现为每种颜色的每个二值图像创建这种图像。
无字符图像创建单元624创建消除了作为特定属性部分的字符的图像。应该恰好创建用彩色图像中的周围颜色取代了用作特定属性部分的字符部分像素的图像。
图像编码单元626从消除了创建的特定属性像素而创建的图像(无字符图像)以及仅由特定属性像素构成的图像(字符图像)中创建压缩图像。其压缩例如,可以由JPEG方法对无字符图像进行压缩,字符图像通过MMR方法或PNG方法等进行压缩等,由此文件尺寸显著变小。
通过组合文件创建单元627以可以将字符图像堆叠并显示在无字符图像上的格式组合文件。因此,如果解码合并及创建的图像,将组合这些图像,变成在背景上粘贴字符的形式,并可简单地认作原始图像。
接下来,将举例说明图70示出的图像处理设备1执行的其他功能的功能方块图。
在本例中,说明不同于上述功能范例的区别点,并省略了共有的细节说明。在本例中,例如字符颜色指定单元625和图像编码单元626的功能是不同的。
字符颜色指定单元625从仅有由其创建的字符的二值图像中创建字符屏蔽图像。通过屏蔽处理保留Bit ON(比特开)(这里的黑色像素),并对屏蔽处理没有保留下的像素Bit OFF(比特关)(这里的白色像素)的像素进行处理。
此外,从原始图像中获取相应于特定属性区域的黑色像素的字符颜色,并去除作为特定属性部分的字符的黑色像素。
将该图像创建为前景图像(颜色信息)。此时,将除字符以外的像素部分绘制成背景颜色。
图像编码单元626通过JPEG(DCT)方法执行背景图像的压缩编码,通过MMR方法对仅含有特定属性像素的字符屏蔽图像执行压缩编码,通过JPEG(DCT)方法对仅绘制了特定属性部分的前景图像进行压缩编码。
接下来,将解释说明图像处理设备1所执行的特性处理的内容。
图71是用于解释说明由字符颜色指定单元625执行的特性处理的功能方块图。
在字符颜色指定单元625中,通过由字符图像创建单元622创建作为输入的字符图像(包括格线)、由预处理单元621完成的24位彩色图像、以及创建着色的字符图像来执行“字符区域的代表颜色计算处理”、“字符颜色指定处理”以及“伽玛校正处理”。
首先,代表颜色计算单元631执行将字符区域的颜色减少到用户指定的颜色数量的处理。“字符区域颜色直方图的创建”以及“对于代表颜色选择的直方图”是很大的,该处理由两项处理组成。
接下来,将说明这些处理。
字符区域颜色直方图创建
从预处理单元621创建的24位彩色图像中获取相当于由字符图像创建单元622创建的仅包含字符的二值图像的字符的部分的像素值,并创建RGB颜色直方图。其在RGB中量化8个颜色组成部分的每个,创建的直方图将彩色空间分割成8x8x8个颜色,计算属于该空间的像素数量。
从直方图中选择代表颜色
从上述创建的RGB直方图中按照频率大的顺序选择出128种颜色,作为最初的代表颜色。然而,在某种程度上,由于如果按惯例进行选择会选择出大量无色彩颜色,对于无色彩颜色来说,对上述应用进行限制以使得不对它们进行选择。
如果选择的无色彩颜色超过了用户给出的最大字符颜色数量的一半,将不再进行选择。然而,仅排除了构成字符的合理的黑色,并且即使它超出了半数,也是通过添加(addition)来选择颜色。
接下来,选择最接近所选择颜色的颜色对,并从代表颜色中删除具有少量像素的情况。重复该操作并直到减少到用户所给出的颜色数。此外,即使最接近的颜色降低到用户指定的颜色,该颜色小于事先定义的阈值时,确定该减少的颜色是不足够的并继续进行颜色减少处理。由于这种原因,用户给出的颜色数量变成给出称为最大颜色数量的情况。
黑色连通分量构成的矩形的尺寸小于预定尺寸时,字符颜色指定处理单元632确定每个字符(矩形单元)的颜色。
首先,创建黑色连通分量中除字符边缘之外的字符笔划中的颜色平均值(RGB值)以及构成字符的所有像素的RGB颜色平均值。
接下来,确定这些颜色是否是无色的。确定小的连通分量中字符笔划中的颜色平均值,并将构成字符的所有像素的颜色平均值与上述的代表颜色进行比较,将最接近的代表颜色作为可使用矩形的字符颜色。
虽然当仅有背景像素以及接触像素时,为了阻止背景颜色的混合,也可考虑将最暗的颜色与代表颜色相比较,但当连通分量的笔划较细,并且最暗颜色中的颜色倾向于在字符中改变并最终再次显示为字符时,可以在字符中改变该颜色。
然后,将组成字符的所有像素的颜色平均值与代表颜色相比。此外,在字符笔划中,当存在背景像素和不接触的像素时,将颜色平均值与代表颜色进行比较。
然而,需要的颜色平均值是无色彩颜色(当每个RGB值的差值的绝对值小于预定阈值时)。例如,当|R-G|<th时,通过将该值与从RGB值减去预定值所得到的代表颜色相比较来改善黑色像素的再现性。
由于根据输入图像和字符颜色的分类结果,字符颜色可能变亮或者伽玛校正单元633可能变暗,为了调整字符图像的亮度值,执行图72所示的伽玛校正。伽玛校正在RGB中共同进行。
接下来,参照图73解释说明无字符图像创建单元624中的处理流程。
通过用“字符的周围颜色的规范”取代字符区域的颜色,从预处理单元621中输出用于创建无字符图像的24位彩色图像,并通过考虑从字符图像创建单元622中输出的仅包含字符的二值图像确定作为输入的字符周围颜色。执行“字符区域移除(暂时的)处理”、“分辨率转换(低分辨率处理)”、“平滑”以及“伽玛校正”中的每一个处理。
首先,在周围颜色指定单元641中执行字符的周围颜色指定处理。在开始时,建立相应于仅由字符构成的二值图像的字符矩形的外围矩形坐标的彩色图像的像素值。
求出计算出的像素值的平均值并将它作为围绕连通分量的颜色。此外,由于其对应于字符的输入,因此仅针对作为二值图像的白色像素的像素。
接下来,在字符区域移除单元642中执行图像的字符区域移除(暂时的)处理。也就是,将从周围颜色指定单元641所需要的周围颜色中构成彩色图像的字符的部分的像素值换成周围颜色。
由于可以近似认为周围颜色就是背景颜色,将创建消除了字符的彩色图像。
并且在分辨率转换单元643中执行图像的分辨率转换(低分辨率处理)。也就是,旨在通过背景图像的低分辨率处理获得文件尺寸的减小。尽管用户可以指定低分辨率处理的级别,将2x2个像素合计成一个像素的标准的级别是有益的。
具体地,确定移除字符的彩色图像的2×2像素的平均颜色,并将具有低分辨率的背景图像中的每个像素的像素值转换成这个平均颜色的像素值。
接下来,通过平滑处理单元644执行平滑处理。也就是,当照片包含在背景图像中时,如果将它改变为低分辨率,在该部分的再现图像中将可能产生缺陷。然后,对背景图像进行平滑处理。通过给出与原始图像的平滑处理相似的3×3像素尺寸的空间滤波来执行平滑处理。
由伽玛校正单元645执行伽玛校正处理。取决于处理后的图像打印机的合并,将由上述处理中通过获取图像处理设备1处理的原始图像的扫描仪获得的图像可以再现成全部的暗色或亮色。然后,为了调整背景图像的亮度值,执行如图72所示的伽玛校正。
在RGB中共同进行伽玛校正处理。这具有在由JPEG方法对背景图像进行压缩时提高压缩率的效果。
通过上述的组成部件,通过图像处理设备1,在将图像分割成字符图像和无字符图像之后,图像分割成字符图像和无字符图像,伽玛校正单元33和45分别独立地执行伽玛校正。
由于它全是暗的,并且背景图像可以执行分别在字符图像与无字符图像之间不同的灰度校正,例如希望将它变亮,尽管因为字符图像是带黑色的而希望将它变亮,其可以响应想要分别在字符图像和无字符图像中执行不同的灰度校正的用户的请求。
此外,在通过平滑处理单元644对无字符图像进行平滑处理之前,通过周围颜色指定单元641执行周围颜色的指定处理。在周围颜色指定单元641中,虽然执行了字符的周围颜色的指定处理,在图像平滑之后完成该处理时,将字符颜色混入到字符的周围颜色中,并将字符颜色保留在无字符图像中。
接着,在平滑处理单元644的平滑处理之前,通过由周围颜色指定单元641对周围颜色的指定处理,字符颜色不能保留在无字符图像中,并可以将无字符图像正确分离。
此外,在平滑单元644对无字符图像进行的平滑处理之前,还通过分辨率转换单元643将分辨率转换成低分辨率。这是由于,如果通过分辨率转换减小图像的尺寸,可以高速执行平滑处理。
另外,在分辨率转换单元643将分辨率转换成低分辨率之前,通过周围颜色指定单元641执行周围颜色的指定。这是由于,如果将分辨率转换成低分辨率,字符图像的位置将会变得模糊不清并且将难于正确地执行字符周围颜色的指定处理。
图70-图73的上述实施例提供了一种图像处理设备,包括:基于从多级图像创建的二值图像或作为原始图像的多级图像来确定原始图像中具有特定属性的特定属性区域的位置的单元;创建二值字符图像的单元,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像的单元,其中用原始图像的背景颜色来改变原始图像中的特定属性区域的像素值;对所创建的多级无字符图像执行伽玛校正的单元;确定构成特定属性区域的像素颜色的单元;基于二值字符图像,创建具有所确定的颜色的特定属性区域的二值或多级图像的单元;对所创建的特定属性区域的二值或多级图像执行伽玛校正的单元;图像编码单元,用于分别对伽玛转换之后的每个多级无字符图像、伽玛转换之后的特定属性区域的二值或多级的每个执行压缩编码;以及组合文件创建单元,用于创建合并了压缩编码后的编码图像的组合文件。
根据本发明,可以从处理对象图像创建诸如字符的特定属性部分的图像和其它部分的图像,可以独立地对这些图像中的每一个进行伽玛校正,使得能够根据图像的属性进行伽玛校正,并可以满足用户的请求。
图70-图73的上述实施例提供了一种图像处理设备,包括:基于作为多级图像的原始图像或从多级图像创建的二值图像,来确定原始图像中具有特定属性的特定属性区域的位置的单元;创建二值字符图像的单元,在该二值字符图像中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;对所创建的二值字符图像执行伽玛校正的单元;创建非特定属性区域的多级无字符图像的单元,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色的单元;创建表示所确定的颜色的颜色信息的单元;对所创建的颜色信息执行伽玛校正的单元;图像编码单元,用于分别对伽玛转换之后的多级无字符图像、特定属性区域的二值字符图像、以及伽玛转换之后的颜色信息中的每个进行压缩编码;以及组合文件创建单元,用于创建合并了压缩编码后的编码图像的组合文件。
图70-图73的上述实施例提供了一种图像处理设备,包括:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个,来确定原始图像中具有特定属性的特定属性区域的位置的单元;创建二值字符图像的单元,在该二值字符图像中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像的单元,其中,用于将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色的单元;基于二值字符图像创建具有所确定的颜色的特定属性区域的二值或多级图像的单元;图像编码单元,用于分别对多级无字符图像以及特定属性区域的二值或多级图像中的每个进行压缩编码;以及组合文件创建单元,用于创建合并了压缩编码后的编码图像的组合文件,其中多级无字符图像创建单元包括:确定原始图像中特定属性区域周围颜色的单元;用原始图像中的周围颜色取代特定属性区域的像素值的单元;以及平滑处理单元,在确定周围颜色之后对作为原始图像的多级图像进行平滑处理。
图70-图73的上述实施例提供了一种图像处理设备,包括:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个,来确定原始图像中具有特定属性的特定属性区域的位置的单元;创建二值字符图像的单元,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像的单元,其中,用于将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色的单元;创建表示所确定的颜色的颜色信息的单元;图像编码单元,用于分别对多级无字符图像、特定属性区域的二值字符图像、以及颜色信息中的每个实现压缩编码;以及组合文件创建单元,用于创建合并了压缩编码后的编码图像的组合文件,其中多级无字符图像创建单元包括:确定原始图像中特定属性区域周围颜色的单元;用原始图像中的周围颜色取代特定属性区域的像素值的单元;以及平滑处理单元,在确定周围颜色之后对作为原始图像的多级图像进行平滑处理。
上述图像处理设备可以被配置为使得多级无字符图像创建单元还包括分辨率转换单元,用于在执行平滑处理之前将作为原始图像的多级图像的分辨率转换成低分辨率。
上述图像处理设备可以被配置为使得多级无字符图像创建单元还包括分辨率转换单元,用于在执行平滑处理之前将作为原始图像的多级图像的分辨率转换成低分辨率。
上述图像处理设备可以被配置为使得分辨率转换单元用于在确定周围颜色之后将作为原始图像的多级图像的分辨率转换成低分辨率。
上述图像处理设备可以被配置为使得分辨率转换单元用于在确定周围颜色之后将作为原始图像的多级图像的分辨率转换成低分辨率。
上述图像处理设备可以被配置为使得图像处理设备还包括通信控制设备,用于通过预定网络传送组合文件。
上述图像处理设备可以被配置为使得图像处理设备还包括用于分别对包含在组合文件中的每一个编码图像进行解码的单元。
图70-图73的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,在该二值字符图像中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中将原始图像中的特定属性区域的像素改变为原始图像的背景颜色;对所创建的多级无字符图像执行伽玛校正;确定构成特定属性区域的像素颜色;基于二值字符图像,创建具有所确定的颜色的特定属性区域的二值或多级图像;执行所创建的特定属性区域的二值或多级图像的伽玛转换;分别对伽玛转换之后的多级无字符图像和伽玛转换后的特定属性区域的二值或多级图像实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件。
图70-图73的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;对所创建的二值字符图像执行伽玛校正;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;创建表示所确定的颜色的颜色信息;对所创建的颜色信息执行伽玛转换;分别对伽玛转换之后的多级无字符图像、特定属性区域的二值字符图像、以及伽玛转换之后的颜色信息中的每个实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件。
图70-图73的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;基于二值字符图像,创建具有确定颜色的特定属性区域的二值或多级图像;分别对多级无字符图像以及特定属性区域的二值或多级图像中的每个实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件,其中多级无字符图像创建步骤包括:确定原始图像中特定属性区域周围颜色;用原始图像中的周围颜色取代特定属性区域的像素值;以及在确定周围颜色之后对作为原始图像的多级图像进行平滑处理。
图70-图73的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;创建表示所确定的颜色的颜色信息;分别对多级无字符图像、特定属性区域的二值字符图像、以及颜色信息中的每个实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件,其中多级无字符图像创建步骤包括:确定原始图像中特定属性区域周围颜色;用原始图像中的周围颜色取代特定属性区域的像素值;以及在确定周围颜色之后对作为原始图像的多级图像进行平滑处理。
上述计算机程序产品可以被配置为使得图像处理方法还包括分辨率转换步骤,执行平滑处理之前将作为原始图像的多级图像的分辨率转换成低分辨率。
上述计算机程序产品可以被配置为使得图像处理方法还包括分辨率转换步骤,在执行平滑处理之前将作为原始图像的多级图像的分辨率转换成低分辨率。
上述计算机程序产品可以被配置为使得分辨率转换步骤用于在确定周围颜色之后将作为原始图像的多级图像的分辨率转换成低分辨率。
上述计算机程序产品可以被配置为使得分辨率转换步骤用于在确定周围颜色之后将作为原始图像的多级图像的分辨率转换成低分辨率。
图70-图73的上述实施例提供了计算机可读存储介质,其中存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;对所创建的多级无字符图像执行伽玛转换;确定构成特定属性区域的像素颜色;根据二值字符图像,创建具有所确定的颜色的特定属性区域的二值或多级图像;执行所创建的特定属性区域的二值或多级图像的伽玛转换;分别对伽玛转换之后的多级无字符图像和伽玛转换后的特定属性区域的二值字符图像实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件。
接下来,图74是图像处理设备701基于图像处理程序13所执行的处理的功能方块图。此外,图75是该处理的流程图。
首先,多级图像输入单元701通过未示出的图像扫描仪获取作为处理对象的原始图像的多值的文档图像(步骤S701)。
特定属性区域提取单元704从该文档图像中定位具有特定属性的部分(特定属性部分)的位置,例如字符部分(步骤S705)。
在本例中,应当从多级图像中创建二值图像(步骤S704),并从二值图像中获取该特定属性部分。
白色像素置换单元705消除二值图像中除字符以外的黑色像素并将其转换成白色像素,并建立它们的二值图像(步骤S706)。通过该处理,将按照每个像素获知字符的位置。
通过特定属性区域消除图像创建单元703创建消除了特定属性区域的图像(步骤S708)。这应当创建恰好通过用彩色图像中的周围颜色替换作为特定属性部分的字符部分的像素的图像。
接下来,特定属性区域颜色确定单元706确定特定属性部分的颜色(步骤S709)。该步骤确定了位于构成字符的黑色像素位置上所有像素的颜色,并从该数据中确定在图像常用的一些主要颜色作为代表颜色。并确定每个像素以及构成每个连通分量的字符的像素是否最接近某个代表颜色。
通过特定属性像素图像创建单元707创建其中具有特定属性的像素具有每个像素和为每个连通分量确定的颜色的图像(步骤S710)。在这种情况下,仅具有有限颜色的多级图像也是足够的,并可能实现为每种颜色创建每一幅二值图像。
图像编码单元708从消除了特定属性像素的图像中创建压缩图像,并创建仅含有特定属性像素的图像(步骤S713)。并考虑对字符图像使用MMR方法或PNG方法进行压缩,对图案图像通过JPEG方法进行压缩等,由此,文件尺寸将有效减小。
通过使用组合文件创建单元709将仅包含特定属性像素的图像堆叠并显示在消除了特定属性区域的图像上(步骤S714)。如果组合这些图像,将变成字符粘贴在背景上的形式,并可以简单地认作为原始图像。
通过执行上述处理,无需将可见度减少太多,就可以得到文件尺寸的明显压缩。理由如下。
尽管JPEG方法对具有像素值急剧改变的图像没有很好的压缩效果,但如果通过处理从图像中消除了字符部分,由于将不会存在字符部分的像素值的改变,因此将改善JPEG方法的压缩率(步骤S713)。
由于字符部分急剧减少了颜色数量,也正因如此,压缩率得到改善。
接下来,将解释说明基于图像处理程序13的图像处理设备701执行的特有处理。该处理是为了进一步提高图像质量和可压缩性而执行的。
(A)检查连通分量的尺寸
在执行了步骤S706的处理之后,步骤S708的处理之前,从消除了字符以外的像素的二值图像中提取黑色像素的连通分量,并通过连通分量尺寸检查单元713检查连通分量的尺寸(步骤S707)。
也就是,进一步消除了小于预定基准点的部分以及连通分量中大于预定基准点的另一较大部分。由于噪声等原因,如果存在不是字符位于二值图像的最顶端的可能性,尺寸太小的连通分量将导致压缩率的降低。
此外,字符区域的定位在技术上是困难的,并且不必提取正确的字符区域。因此,当视图区域以及照片区域位于在前的图像中时,也排除了在其中出错以及被认为没有完成字符的可能性。因此,尺寸太大的连通分量比这些字符具有更高的可能性。
另外,虽然当大尺寸的连通分量确实是字符时,根据该处理其会被意外地分类到背景中,但由于尺寸很大,其足可以由人的眼睛读出。
图76A示出了输入图像的邻接字符中“接触字符”的部分。图76B示出了当传统方法提取接触字符时的提取结果。
通过该传统方法,确定了从分辨率以及标准字符的尺寸(10.5pt)中显示为字符的连通分量的外接矩形尺寸n,并除非该矩形在限定的n×n尺寸中,未完成特定属性部分的提取,如字符部分。
通过这种方法,从消除了字符以外的像素的二值图像(或多级图像)中提取黑色像素的连通分量。并需要请求在输入图像的分辨率及标准字符尺寸(10.5pt)中首先显示为字符的外接矩形的高度尺寸n(也就是,根据输入图像的分辨率而改变n值),以及判定用于相应于诸如字符部分的特定属性部分的像素的取值的范围(阈值)。该阈值使用矩形部分的尺寸n×m,其中n代入上述值,m的值可以从使用建立接触字符长度的阈值Thr的以下公式(1)中获得。
由于宽度尺寸大于字符的高度,接触字符不能提取接触字符,除非将m值设置成大于n。因此,通过将条件m>n作为宽度和高度大致比例的标准,建立Thr的值以将比例设置成1∶3。在此后的说明中,暂时假设“Thr=3”。
m=n×Thr......(1)
连同图77的流程图,将解释说明步骤S707的处理,也就是图76A的对接触字符的提取处理。
首先,从字符、照片以及背景共存的输入图像或二值图像中执行字符提取处理(步骤S721)。字符提取处理可以通过使用传统的使用连通分量的公知字符提取处理。
图76B中由虚线示出步骤S721提取的矩形部分。并分别确定该矩形部分的宽度和高度是否在n×m的界限中(步骤S722)。
作为判断的结果,当是在界限内时(步骤S722为是),它的矩形部分被判断为字符图像(步骤S723)。当超出该范围时(步骤S722为否),判定其为背景图像(步骤S724)。
(B)图像的基础化(radicalization)
通过基础化单元711,在步骤S701进行输入,并在步骤S704创建二值图像之前,在彩色图像中进行基础化(步骤S702)。当可以通过彩色图像中具有淡的边缘的图像来表示,并用其进行二值化处理时,字符将变模糊,对可读性的感觉以及字符的压缩率下降。也就是说,字符的可读性通过基础化而改善。
(C)图像的平滑处理
在进行步骤S702的基础化和在步骤S704创建二值图像之前,通过平滑处理单元712平滑处理彩色图像(步骤S703)。这是为了用互不相同的精细颜色的像素集合表现中色(neutral color)并且用该其在彩色图像中执行二值化时,将字符笔划的内部变成完全由孔构成的二值图像,以及降低字符图像的压缩率。
然后,由于在平滑处理后可以得到字符笔划内部通过实现二值化而改变的二值图像,因此改善了字符图像的压缩率。
此外,可以实现对消除了字符的彩色图像(背景图像)的图像平滑处理。由于背景图像执行JPEG压缩,这有益于通过平滑处理增加对压缩率的抑制,以及由于低分辨率的转化而可能产生的波纹。
(D)对比度调整
在步骤S710的处理之后,步骤S713的处理之前,执行消除了特定属性像素的图像(背景图像)以及仅由特定属性像素构成的二值图像(字符图像)的对比度转换(步骤S711),削弱该对比度,并通过对比度调整单元714形成平滑图像。
由于压缩率很高,使得当通过JPEG方法在背景图像中压缩时,像素值几乎不变化。虽然即使执行对比度转换也不会在尺寸上产生影响,由于字符图像使用的是MMR方法等,当组合并显示它们时,执行与背景图像相同的对比度转换,以使得不会变成不自然的色调。
(E)分辨率转换
在步骤S711的处理之后,步骤S713的处理之前,实现分辨率转换,并通过分辨率转换单元715将消除了特定属性像素的图像设置成低分辨率(步骤S712)。
由于即使背景图像的分辨率有些低,对比于字符图像的可见度的影响也是很小的,因此考虑压缩率并改变为低分辨率。
将解释说明本发明的另一优选实施例。由于本实施例的图像处理设备701的硬件组成与图1是相同的,将省略对它的详细说明。
图78是图像处理设备701基于图像处理程序13所执行的处理的功能方框图。此外,图79是该处理的流程图。
在图78和图79中,使用相同的附图标记来表示与图74和图75的相应元素相同的元素,并将省略对它们的详细说明。
特定属性区域消除图像创建单元703创建消除了特定属性部分的图像(步骤S708)。该步骤应当通过彩色图像中的周围颜色来创建替换了字符部分的像素的图像。
字符屏蔽图像创建单元721从在步骤S706创建的仅包含字符的二值图像中创建字符屏蔽图像(步骤S731)。通过屏蔽处理保留像素Bit ON(这里的黑色像素),并对屏蔽处理没有保留下的像素Bit OFF(这里的白色像素)的像素进行处理。
用于绘制相应于特定属性区域的黑色图像部分的颜色的单元722从在步骤S701输入的彩色图像中获取相应于特定属性部分的黑色像素的字符颜色,并去除特定属性部分的黑色像素(步骤S732)。
前景图像创建单元723创建在步骤S732绘制的图像作为前景图像(颜色信息)(步骤S733)。此时,将字符以外的像素部分绘制成背景颜色。
图像编码单元708通过JPEG(DCT)方法压缩由特定属性区域消除图像创建单元703创建的消除了特定属性像素的背景图像,通过MMR方法压缩仅由特定属性像素构成的字符屏蔽图像,以及通过JPEG(DCT)方法压缩仅绘制了特定属性部分的前景图像(步骤S713)。
组合文件创建单元709将文件组合成可以堆叠并显示下述内容的形式:保留了相应于黑色像素部分的像素的前景图像、应用到消除了特定属性区域的背景图像的字符屏蔽、以及仅由特定属性像素构成的前景图像(步骤S714)。
如果将它们合并,将变成字符粘贴在背景之上的形式,并可简单地认为是原始图像。
在上述实施例中,图像处理设备701可以通过上述图80的处理创建的文件的解码,其可以由图像来表示。也就是,输入上述创建的组合文件(步骤S741),并分别解码和显示包含在组合文件中的每一个编码图像(步骤S742)。组合并显示每一个解码图像(步骤S744)。
在这种情况下,当通过分辨率转换单元715执行如上所述的图像分辨率转换时,执行可变功率(power)的处理来返回到原始分辨率(步骤S743)。
图74-图80的上述实施例提供了一种图像处理设备,包括:位置确定单元,用于基于作为原始图像的多级图像或从该多级图像中创建的二值图像,确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像的单元,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像的单元,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色的单元;基于二值字符图像,创建具有确定颜色的特定属性区域的二值或多级图像的单元;图像编码单元,用于分别对多级无字符图像以及特定属性区域的二值或多级图像中的每个实现压缩编码;以及组合文件创建单元,用于创建合并了压缩编码后的编码图像的组合文件,其中位置确定单元包括:从作为原始图像的多级图像或特定属性区域的二值字符图像中提取连通分量的单元;以及当相关的矩形部分的高和宽分别小于高度阈值n和宽度阈值m时,其中阈值m和n符合m>n的条件,确定连通分量的矩形部分作为字符区域的单元。
根据本发明,矩形部分的宽度阈值m的值大于高度阈值n的值,以及高度和宽度阈值n×n不用于矩形部分,因此,可以适当地提取相当于接触字符的连通分量的矩形作为特定属性区域。
图74-图80的上述实施例提供了一种图像处理设备,包括:位置确定单元,用于基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像的单元,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像的单元,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色的单元;创建表示所确定颜色的颜色信息的单元;图像编码单元,用于分别对多级无字符图像、特定属性区域的二值字符图像以及颜色信息中的每个实现压缩编码;以及组合文件创建单元,用于创建组合了压缩编码后的编码图像的组合文件,其中位置确定单元包括:从作为原始图像的多级图像或特定属性区域的二值字符图像中提取连通分量的单元;以及当相关的矩形部分的高和宽分别小于高度阈值n和宽度阈值m时,其中阈值m和n符合m>n的条件,确定连通分量的矩形部分为字符区域的单元。
上述图像处理设备可以被配置为使得位置确定单元用于根据作为原始图像的多级图像的分辨率改变高度阈值n的值。
上述图像处理设备可以被配置为使得图像处理设备还包括至少下述单元之一:用于执行作为原始图像的多级图像的明显对比度处理的单元,用于执行作为原始图像的多级图像的平滑处理的单元,在压缩编码之前执行图像的对比度调整处理的单元,以及在压缩编码之前将多级图像的分辨率改变为低分辨率的单元。
上述图像处理设备可以被配置为使得图像处理设备还包括用于分别对包含在组合文件中的每一个编码图像进行解码的单元。
图74-图80的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;基于二值字符图像,创建具有所确定颜色的特定属性区域的二值或多级图像;分别对多级无字符图像以及特定属性区域的二值或多级图像中的每个实现压缩编码;以及创建合并了压缩编码后的编码图像的组合文件,其中位置确定步骤包括:从作为原始图像的多级图像或特定属性区域的二值字符图像中提取连通分量;以及如果相关的矩形部分的高和宽分别小于高度阈值n和宽度阈值m,其中阈值m和n符合m>n的条件,确定连通分量的矩形部分作为字符区域。
图74-图80的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;创建表示所确定颜色的颜色信息;分别对多级无字符图像、特定属性区域的二值字符图像以及颜色信息中的每个执行压缩编码;以及创建合并了压缩编码后的编码图像的组合文件,其中位置确定步骤包括:从作为原始图像的多级图像或特定属性区域的二值字符图像中提取连通分量;以及如果相关的矩形部分的高和宽分别小于高度阈值n和宽度阈值m,其中阈值m和n符合m>n的条件,确定连通分量的矩形部分作为字符区域。
上述计算机程序产品可以被配置为使得位置确定步骤用于根据作为原始图像的多级图像的分辨率改变高度阈值n的值。
上述计算机程序产品可以被配置为使得图像处理方法还包括至少下述步骤之一:执行作为原始图像的多级图像的明显对比度处理,执行作为原始图像的多级图像的平滑处理,在压缩编码之前执行图像的对比度调整处理,以及在压缩编码之间将多级图像的分辨率改变为低分辨率。
上述计算机程序产品可以被配置为使得图像处理方法还包括分别对包含在组合文件中的每一个编码图像进行解码的步骤。
图74-图80的上述实施例提供了一种计算机可读存储介质,其中存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括以下步骤:基于作为原始图像的多级图像或从多级图像创建的二值图像中的任何一个来确定原始图像中具有特定属性的特定属性区域的位置;创建二值字符图像,其中,将原始图像中相应于不具有特定属性的非特定属性区域的像素值替换成不同于特定属性区域所对应的像素值的给定像素值;创建非特定属性区域的多级无字符图像,其中,将原始图像中的特定属性区域的像素值改变为原始图像的背景颜色;确定构成特定属性区域的像素颜色;根据二值字符图像,创建具有确定颜色的特定属性区域的二值或多级图像;分别对多级无字符图像以及特定属性区域的二值或多级图像中的每个执行压缩编码;以及创建合并了压缩编码后的编码图像的组合文件,其中位置确定步骤包括:从作为原始图像的多级图像或特定属性区域的二值字符图像中提取连通分量;以及如果相关的矩形部分的高和宽分别小于高度阈值n和宽度阈值m,其中阈值m和n符合m>n的条件,确定连通分量的矩形部分作为字符区域。
接下来,在下面的实施例中,通过使用图像处理程序13实现明显尺寸减少,无需损失作为处理对象图像(原始图像)的多级图像的字符的可见度。
根据图81和图82的概要流程图中所示出的处理概念图解释说明本实施例的处理概要。
首先,通过图像读取设备10,如图像扫描仪,获取如图82(a)所示的用作处理对象图像的多级图像(步骤S801)。通过对该多级图像的二值化获取如图82(b)所示的二值图像(S802)。
接着,确定具有特定属性的区域,如字符区域(步骤S803)。如图82(c)所示,执行将二值图像中不具有特定属性的像素改变为白色像素的白色像素处理,以使得二值图像中仅保留字符(S804),以及如图82(d)所示,创建字符部分的减少颜色的图像(S805)。
另一方面,多值图像设为用背景颜色填埋特定的属性部分的图像,设为如图82(e)所示的消除字符的图像(S806)。
由背景颜色填充的图像被认为不具有重要的信息,并将它改变为低分辨率,以使得它可以在编码中被高度地显示(JPEG形式等的不可逆压缩),即图82(f)(S807)。
此外,减少构成字符的像素的颜色数,并进行编码(PNG形式等的可逆压缩),或者通过该颜色数创建二值(两种颜色)图像,并进行编码(S807)。(MMR形式等的可逆压缩)
接着,组合成可堆叠并显示背景图像和字符图像的格式(例如,PDF),并具有与原始图像所保持的相同的位置关系。将所获得的文件与原始图像相比较,文件的尺寸急剧减小。
参照图83示出的功能方框图,将详细说明相关的图像处理设备1基于图像处理程序13所实现的功能。
1、获取作为处理对象图像的多级图像和基于多级图像的二值图像
通过多级图像获取单元821和二值图像获取单元822获取多级图像和二值图像(S801和S802)。基于该多级图像,应该创建二值图像。二值化方法所需要的是固定阈值以及使用该方法,就象将亮度高于该阈值的像素变为白色像素,以及将校暗的像素变为黑色像素。
此外,作为二值图像和多级图像,不同的分辨率使足够的。例如,通过上述方法创建二值图像之后,可以执行变薄处理,降低多级图像的分辨率,并且可获取其作为处理对象的多级图像。
此外,可使用另一种设备来执行该二值图像的创建并获得所创建的图像文件。
2、获取字符区域
通过使用特定属性像素指定单元824,确定字符在原始图像中的位置(步骤S803)。可以将特定属性像素指定单元824配置成从二值图像或多级图像中获取字符区域。当从多级图像获取时,可以使用日本公开专利申请No.2002-288589提出的字符区域提取方法,当从二值图像中获取时,可以使用日本公开专利申请No.06-020092提出的字符区域提取方法。在本实施例中,基于二值图像提取构成字符的像素作为具有特定属性的像素。
3、将字符区域之外的像素变为白色像素。
通过使用白色像素置换单元825,将二值图像中的除字符区域以外的像素(不具有特定属性的像素)变为白色图像(步骤S804)。
4、创建仅包含字符像素的减少颜色图像
该处理是由上述第3项处理保留下来的黑色像素部分组成并创建带有颜色信息的图像(由特定属性像素图像创建单元826执行的处理)(S805)。
将参照图84对该处理进行解释。首先,获取具有特定属性的像素的像素值(S811),并计算这些像素的代表颜色(S812)。
也就是说,虽然从多级图像中创建了颜色信息,但其计算一些主要颜色作为代表颜色—这些像素值中的大约十种颜色,而不是按原样使用相应位置上的像素值。
并将某个颜色指定给每个黑色像素(S813),以及创建几种颜色到几十种颜色的图像(S814)。创建了几种到几十种颜色的图像,则也创建了几个到几十个具有字符颜色和透明背景颜色的二值(两种颜色)图像。
总之,由于字符部分使用的颜色变得比用作处理对象图像的多级图像少,因此将该图像称为“减少颜色的图像”。
接下来,将详细解释用于计算代表颜色的单元(S812)。
图85举例说明了代表颜色计算方法的概要流程图。
(1)计算多级图像中位于相当于二值图像中的黑色像素位置的像素值,并创建该像素值的直方图(S821)。例如,需要实现等份分割率,将RGB空间分解成4×4×4的块,以及执行目标像素如何将1加到确定的空间的频率值。
(2)确定具有高频率的块,并确定频率的量作为优先权的高度,并根据频率值指定优先权(S822)。将这些块称为“代表颜色候选块”。
(3)从具有高优先权的块顺序检查,并确定所涉及的块是否是无色的(S823)。如果块的RGB中心值(块的RGB中间值等)是几乎相同的值,则表示它是无色的。
(4)如果不是无色的(S823为否),将移向下一个优先权的块检查(S827)。
(5)如果是无色的(S826为是),将通过旧的较高级的候选者检查哪一个是无色的(S824)。如果无色达到了预定的值(第一预定数),则将相应的块从代表颜色候选者中排除(S826),如果未达到,则将无色数加1并进行下面的处理(S825)。
(6)重复执行步骤S822-S826的处理,直到检查了所有代表颜色候选块(S827)。
(7)从保留下来的没有被排除的优先级较高的代表颜色候选块之一输出作为代表颜色的第二预定数(S828)。
此外,作为代表颜色计算方法,也可以考虑图86所示的方法。
(1)计算多级图像中位于相当于二值图像的黑色像素位置的像素值,并创建这些像素值的直方图(S831)。该处理可以使用与图85说明的相同的处理。
(2)确定具有高频率的块,并将频率的量作为优先权的高度,根据频率值指定优先权(S832)。
(3)从优先权的高块顺序地留下甚至第一预定数,并从候选者中排除其它块(S833)。
(4)从高优先权的块顺序检查,并确定所涉及的块是否是无色的(S834)。
(5)如果不是无色的(S834为否),将移向下一个优先权的块检查(S838)。
(6)如果是无色(S834的“是”),则用旧的高顺序的候选者来检查无色为多大程度(S835)。如果无色达到了预定的值(第一预定数)(S835的“是”),则将相应的块从代表颜色候选者中排除(S837),如果未达到(S835的“否”),则将无彩色数加1并进行下面的处理(S836)。
(7)重复执行步骤S833-S837的处理直到检查了所有代表颜色候选块(S838)。
(8)从代表颜色候选者中选择最接近的颜色(S839),通过使用RGB每个分量的差值的平方和等来计算颜色的接近值。
(9)将两个要选择的代表颜色块中频率值较低的一个从候选者中排除(S840)。
(10)重复执行(8)和(9)的处理直到低于第三预定数(S841)。
(11)将保留下来的没有被排除的代表颜色候选块作为代表颜色输出(S842)。
接下来,参照图87详细说明为计算出的代表颜色的任意一个分配具有诸如字符之类的特定属性的像素值的单元(S813)。
(1)从二值图像中提取黑色像素的连通分量(S851)。
(2)计算多级图像上相应于该连通分量的位置的位置(S852)。
(3)建立可应用位置的像素平均值。可以计算模式来取代平均值。可以使用与建立像素值直方图相同的计算方法。这里,将使用该计算方法(S853)。
(4)找到模式与代表颜色的距离,并选择最接近的(S854)。
(5)整个连通分量具有代表颜色的像素值,并写出以作为减少颜色的图像(S855)。如果减少颜色的图像是为每种颜色定义的二值图像,将连通分量写出到二值图像来表示相应的颜色。此外,如果减少颜色的图像是多级图像,颜色信息和连通分量写入到减少颜色的图像。
(6)对所有连通分量执行(2)-(5)的处理(S856)。这里,虽然以连通分量为单位来进行向代表颜色的分配,但以像素为单位进行也可以。在以像素为单位进行的情况下,生成的文件大小有变大的倾向,处理时间也稍稍增加,但与以连通分量为单位相比,由于可应对像素值的细微变动,所以生成的图像的外观变好。
此外,虽然作为指定来说字符单元已经足够,在这种情况下新需要判断字符位置的处理。此外,取决于判断字符位置处理的精确度,字符的分隔与颜色的改变可能不一致,并可能变成不自然的字符再现。
同时,如果找到模式与代表颜色的距离,并如同图87中步骤S854选择最接近的代表颜色,虽然会减少与原始图像的不同,象显示的那样,但有时并不是很好。
因此,当最相似的颜色是无色时,适于改变为更黑一点的颜色,来执行与取代的颜色和取代的代表颜色的比较,并选择最接近的。
将解释说明具体流程。
(1)根据相应于步骤S853建立模式的处理,首先建立最大相似颜色。将所寻求的最相似的颜色设为R、G、B。
(2)当所建立的最大相似颜色R、G、B小于预先定义的阈值Diff时,判断它为无色。也就是,当|R-G|<Diff,|G-B|<Diff,且|B-R|<Diff时,判断它为无色。
(3)当断定最大相似颜色是无色时,为了使黑色字符表现得更黑并改善显示效果,校正该颜色。
当补偿后的颜色变为R’、G’、B’,并且预先定义的校正值设为Rt、Gt、Bt时,进行减法处理,即R’=max(R-Rt,0),G’=max(G-Gt,0),B’=max(B-Bt,0)。这里,max(a,b)是指从a,b值中选择较大的一个。也就是说,通过减去预定校正值,将字符颜色变暗(黑色)。由于负值是不允许作为像素值的,当相减时,将最小值设为0,使得结果不会为负。
(4)寻找校正模式(R’,G’,B’)及最接近的代表颜色,并如步骤S854的情形进行选择。
此外,在本例的处理中限制处理无色的原因是当在彩色中执行(3)的减法处理时,色调会改变。在本例中,不执行对彩色颜色的颜色补偿处理,但用接近原始图像的颜色再现该处理。
同时指出,可以不对模式(R,G,B)进行减法处理而换成乘法处理,也可以使颜色包含更深的彩色颜色。也就是,需要使用预先定义的校正值Ru、Gu及Bu(分别小于0或大于1)来满足R’=R×Ru,G’=G×Gu,B’=B×Bu。
虽然关于对每个连通分量指定代表颜色的处理进行了参考,但也可以对每个像素执行与图87说明的情况相同的处理。
在补偿处理之后,需要调整颜色(将颜色变暗)以及选择接近代表颜色的颜色。
5、无字符多级图像的创建
通过使用特定属性像素消除多级图像创建单元823创建多级图像,其中用背景颜色改变多级图像中相应于在第3项的处理中剩余的黑色像素部分的字符部分的像素值,且该图像不包含字符(步骤S806)。根据图88详细示出的概要流程图进行详细说明。
(1)将二值图像变浓(S861)。在这种情况下,像素值可以逐渐倾斜地改变,并且字符颜色可以混入背景中的多级图像的字符和背景的边界区域中。
通过执行变浓处理,由于字符和背景的边界区域为了消除也变宽了,因此会减少在边界区域中字符颜色保持未融合的可能性。
(2)从变浓的图像中提取黑色像素的连通分量(S862)。
(3)从一个连通分量计算围绕相应多级图像的像素值(在连通分量的外接矩形的外围中的像素值),取其平均值,并作为背景颜色。
然而,构成不是背景而是字符的部分的可能性要高,因此在平均值计算(S863)中不包括二值图像的黑色像素部分。
(4)将相应于黑色像素连通分量的多级图像的像素部分置换成所请求的背景颜色(S865)。因此,多级图像的可适用部分作为消除了字符的图像。
(5)对所有连通分量执行(3)和(4)的处理(S866)。
6、图像编码
通过使用图像编码单元827,对不包含字符的多级图像以及构成字符的减少颜色的图像进行编码,并压缩尺寸(步骤S807)。在这其中,不具有字符的多级图像的信息被认为是不重要的,并通过JPEG等实现不可逆的高度压缩。如果在降低了分辨率之后进行压缩编码,尺寸将会更小。
此外,执行减少颜色的图像的可逆压缩。如果是二值图像,适于进行PNG压缩或MMR压缩等。如果是4级或16级值的图像,适于进行PNG压缩等。
7、创建组合文件
通过使用组合文件创建单元828,将压缩图像合并在一个文件中(图82(g),步骤S808)。如果组合成的文件的格式可以相互重复,并能够显示,则可认为是文件尺寸的小彩色图像的字符部分的可见度没有下降,并且背景也在某种程度上进行了再现。
此外,由于需要仅获取减少颜色的图像并使用它,如果仅需要背景则仅需要使用无字符图像,因此当编码图像文件仅需要文字部分时,文件尺寸在这种情况下将减小很多。
此外,在这种情况下不需要组合文件创建单元。
根据本实施例,虽然针对作为特定属性的字符,也可以使用另一种属性,如格线和线条画,或者可以将这些联合使用。
参照图89至图92解释说明本发明的另一优选实施例。使用相同的附图标记来表示与在前实施例中相应元素相同的像素,并将省略对它们的描述。
虽然提取字符区域并用这种操作形式创建字符图像作为减少颜色的图像,由一种颜色构成的标记不使用“字符”而是使用“可认为是单色的区域”作为本实施例的特定属性,使得即使不是字符,图像和可压缩性变得更好二值化。
图89是示出了本实施例的处理的概要流程图,以及图91是该功能框图。虽然这与图81和图83示出的操作形式基本相同,但区别是由请求单色区域的部分替代了字符(S803’)。
此外,特定属性像素指定单元824所涉及的部分与多级图像获取单元821的多级图像也是不同的。
参照图90中的概要流程图,说明确定单色区域(特定属性像素)的方法。此外,图92是详细示出了特定属性像素指定单元824的更多组成示例的功能框图。
首先,连通分量提取单元831从二值图像中提取黑色像素的连通分量(S871)。通过颜色信息获取单元832获取位于相应于连通分量的黑色像素位置上的多级图像的颜色信息,并创建颜色信息的变化(S872)。
根据变化,使用分布计算单元833计算每个彩色分量的分布。如果平均值用EO表示并将彩色分量设为r、g、b,分布值为V。可以通过下述公式计算:V=E(r2)-{E(r)}2+{E(g2)}-{E(g)}2+E(b2)-{E(b)}2。该值的大小表示变化。
接着,检查该变化的大小(S87 3)。当该变化大于预定值时,需要断定该分布的大小的变化较大。
通过白色像素置换单元825,从二值图像中消除较大的变化(S874)。由于是二值图像,将可应用的像素改变为白色像素。并对所有的连通分量进行步骤S872-S874的处理(S875)。这意味着通过上述处理完成了步骤S804’和S805’的处理。
根据本实施例的方法,其不关心是否是字符,但由于将单色区域分配给减少颜色的图像,改善了图像的质量和压缩率。
图81-92的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,用于获取作为处理对象图像的多级图像;二值图像获取单元,用于获取基于处理对象图像创建的二值图像;特定属性像素指定单元,用于从处理对象图像中确定具有特定属性的像素;白色像素置换单元,用于将二值图像中不具有特定属性的像素改变为白色像素;特定属性像素图像创建单元,用于创建一幅或多幅仅包含特定属性的像素部分的图像;特定属性区域消除图像创建单元,用于创建用背景颜色改变特定属性像素的像素值的多级图像;以及图像编码单元,用于对由图像创建单元创建的两幅或多幅图像的每一幅进行压缩编码,其中特定属性像素指定单元基于二值图像确定具有特定属性的像素。
根据本发明的上述图像处理设备,获取作为原始图像的多级图像和基于该原始图像的二值图像。基于二值图像确定具有诸如字符的特定属性的像素,并根据这种特定属性的存在而创建仅具有特定属性像素部分的一个或多个二值图像。创建其中由背景颜色改变具有特定属性的像素的像素值的多级图像。无需将用作处理对象图像的多级图像的图像质量减少太多,就可能实现文件尺寸的明显减少,同时保证具有特定属性的像素的可见度。
上述图像处理设备可以被配置为使得由特定属性像素指定单元确定的具有特定属性的像素包括构成字符、格线、或线条画的像素。
上述图像处理设备可以被配置为使得由特定属性像素指定单元确定的具有特定属性的像素包括被认为构成单色区域的像素。
上述图像处理设备可以被配置为使得特定属性像素指定单元包括:从二值图像中提取黑色像素的连通分量的单元;获取相应于构成连通分量的黑色像素的作为处理对象图像的多级图像的颜色信息的单元;以及当所获取的颜色信息的改变小于预定值时,确定相应于黑色像素的连通分量的区域为单色区域。
图81-92的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,用于获取作为处理对象图像的多级图像;二值图像获取单元,用于获取在处理对象图像的基础上创建的二值图像;特定属性像素指定单元,用于从处理对象图像中确定具有特定属性的像素;白色像素置换单元,用于将二值图像中不具有特定属性的像素改变为白色像素;特定属性像素图像创建单元,用于创建一幅或多幅仅包含特定属性像素部分的图像;特定属性区域消除图像创建单元,用于创建用背景颜色改变特定属性像素的像素值的多级图像;以及图像编码单元,用于对由图像创建单元创建的两幅或多幅图像的每一幅进行压缩编码,其中特定属性像素消除图像创建单元包括:从二值图像中提取黑色像素的连通分量的单元,其中将不具有特定属性的像素改变为白色像素;获取黑色像素连通分量周围的像素的像素值的单元;和基于周围像素的像素值,计算相当于连通分量的位置的背景颜色的单元。
上述图像处理设备可以被配置为使得图像处理设备还包括:基于将不具有特定属性的像素改变为白色像素的二值图像,通过预定值创建将黑色像素部分变浓的浓化二值图像的单元,其中连通分量提取单元用于从浓化二值图像中计算黑色像素的连通分量。
上述图像处理设备可以被配置为使得周围像素值获取单元不使用二值图像中设置为连通分量计算对象的黑色像素部分作为周围像素的值。
上述图像处理设备可以被配置为使得周围像素值获取单元包括计算连通分量的外接矩形的周边上的像素的像素平均值的单元。
上述图像处理设备可以被配置为使得特定属性像素消除图像创建单元包括将多级图像中等同于连通分量的位置上的像素值改变为计算的背景颜色的单元。
图81-92的上述实施例提供了一种图像处理设备,其包括:多级图像获取单元,用于获取作为处理对象图像的多级图像;二值图像获取单元,用于获取在处理对象图像的基础上创建的二值图像;特定属性像素指定单元,用于从处理对象图像中确定具有特定属性的像素;白色像素置换单元,用于将二值图像中不具有特定属性的像素改变为白色像素;特定属性像素图像创建单元,用于创建一幅或多幅仅包含特定属性像素部分的图像;特定属性区域消除图像创建单元,用于创建用背景颜色改变特定属性像素的像素值的多级图像;以及图像编码单元,用于对由图像创建单元创建的两幅或多幅图像的每一幅进行压缩编码,其中特定属性像素图像创建单元包括:获取相应于二值图像中具有特定属性的像素的多级图像中的像素的像素值的单元;从获取的像素值中计算代表颜色的单元;对具有特定属性的像素分配任一个所计算的代表颜色的单元;以及创建一幅或多幅图像的单元,其中根据像素值分配结果仅有所计算的代表颜色作为组合像素的颜色。
上述图像处理设备可以被配置为使得该代表颜色计算单元包括:创建像素值直方图的单元;从直方图的较大频率开始连续地设置具有高优先权的代表颜色候选者的单元;确定代表颜色候选者是否为非彩色的单元;当具有高优先权的非彩色代表颜色候选者的数量大于第一预定数量时,从代表颜色候选者中排除非彩色代表颜色候选者的单元;以及从具有高优先权的代表颜色候选者中选择位于第二预定数量的代表颜色候选者之一作为代表颜色的单元。
上述图像处理设备可以被配置为使得代表颜色计算单元包括:创建像素值直方图的单元;从直方图的较大频率开始连续地设置具有高优先权的代表颜色候选者的单元;设置具有高优先权的代表颜色候选者的第一预定数量的单元;确定代表颜色候选者是否为非彩色的单元;当具有高优先权的非彩色代表颜色候选者的数量大于第二预定数量时,从代表颜色候选者中排除非彩色代表颜色候选者的单元;以及计算代表颜色候选者的颜色不一致性的单元。
上述图像处理设备可以被配置为使得代表颜色分配单元包括:提取具有特定属性的像素的连通分量的单元;对每个连通分量执行代表颜色分配的单元。
上述图像处理设备可以被配置为使得代表颜色分配单元包括:对每个像素执行代表颜色分配的单元。
上述图像处理设备可以被配置为使得图像处理设备还包括分辨率转换单元,用于将多级图像的分辨率转换成低分辨率。
图81-92的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在处理对象图像的基础上创建的二值图像;从处理对象图像中确定具有特定属性的像素;将二值图像中不具有特定属性的像素改变为白色像素;创建一幅或多幅仅包含特定属性像素部分的图像;创建由背景颜色替换了具有特定属性的像素的像素值的多级图像;以及对由图像创建单元创建的两幅或多幅图像的每一幅实现压缩编码,其中确定步骤基于二值图像确定具有特定属性的像素。
图81-92的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在处理对象图像的基础上创建的二值图像;从处理对象图像中确定具有特定属性的像素;将二值图像中不具有特定属性的像素改变为白色像素;创建一幅或多幅仅包含特定属性像素部分的图像;创建由背景颜色替换了具有特定属性的像素的像素值的多级图像;以及对由图像创建单元创建的两幅或多幅图像的每一幅实现压缩编码,其中特定属性像素消除图像创建步骤包括:从二值图像中提取黑色像素的连通分量,其中该二值图像中将不具有特定属性的像素改变为白色像素;获取黑色像素的连通分量周围的像素的像素值;基于周围像素的像素值,计算相当于连通分量的位置的背景颜色。
图81-92的上述实施例提供了一种计算机程序产品,能够使计算机执行图像处理方法,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在处理对象图像的基础上创建的二值图像;从处理对象图像中确定具有特定属性的像素;将二值图像中不具有特定属性的像素改变为白色像素;创建一幅或多幅仅包含特定属性像素部分的图像;创建由背景颜色替换了具有特定属性的像素的像素值的多级图像;以及对由图像创建单元创建的两幅或多幅图像的每一幅实现压缩编码,其中特定属性像素图像创建步骤包括:获取相应于二值图像中具有特定属性的像素的多级图像中的像素的像素值;从获取的像素值中计算代表颜色;对具有特定属性的像素分配任一个所计算的代表颜色;以及创建一幅或多幅图像,其中根据像素值分配结果仅使所计算的代表颜色作为组合像素的颜色。
图81-92的上述实施例提供了一种计算机可读存储介质,其中存储了能够使计算机执行图像处理方法的程序,该图像处理方法包括以下步骤:获取作为处理对象图像的多级图像;获取在处理对象图像的基础上创建的二值图像;从处理对象图像中确定具有特定属性的像素;将二值图像中不具有特定属性的像素改变为白色像素;创建一幅或多幅仅包含特定属性像素部分的图像;创建由背景颜色替换了特定属性像素的像素值的多级图像;以及对由图像创建单元创建的两幅或多幅图像的每一幅实现压缩编码,其中确定步骤根据二值图像确定具有特定属性的像素。
上述计算机程序产品可以被配置为使得代表颜色计算步骤包括:创建像素值直方图;从直方图的较大频率开始连续地设置具有高优先权的代表颜色候选者;确定代表颜色候选者是否为非彩色;当具有高优先权的非彩色代表颜色候选者的数量大于第一预定数量时,从代表颜色候选者中排除非彩色代表颜色候选者;以及从具有高优先权的代表颜色候选者中选择位于第二预定数量的代表颜色候选者之一作为代表颜色。
上述计算机程序产品可以被配置为使得代表颜色计算步骤包括:创建像素值直方图;从直方图的较大频率开始连续地设置具有高优先权的代表颜色候选者;设置具有高优先权的代表颜色候选者的第一预定数量;确定代表颜色候选者是否为非彩色;当具有高优先权的非彩色代表颜色候选者的数量大于第二预定数量时,从代表颜色候选者中排除非彩色代表颜色候选者;以及计算代表颜色候选者的颜色不一致性。
上述计算机程序产品可以被配置为使得代表颜色分配步骤包括:提取具有特定属性的像素的连通分量;和对每个连通分量执行代表颜色分配。
上述计算机程序产品可以被配置为使得代表颜色分配步骤包括:对每个像素执行代表颜色分配。
本实施例不限于上述实施例,并可以进行不脱离本发明范围的变化和修改。

Claims (10)

1、一种图像处理设备,包括:
多级图像获取单元(21),获取作为处理对象图像的多级图像;
二值图像获取单元(22),获取基于多级图像而创建的二值图像;
特定属性区域提取单元(24),从多级图像中提取作为具有特定属性的区域的特定属性区域;
白色像素置换单元(25),将二值图像中特定属性区域以外的像素变为白色像素;
特定属性区域消除图像创建单元(23),创建其中用背景颜色改变特定属性区域的像素的多级图像;
特定属性区域颜色确定单元(26),确定特定属性区域的颜色;
特定属性像素图像创建单元(27),创建具有由特定属性区域颜色确定单元确定的特定属性区域颜色的特定属性区域的图像;
图像编码单元(28),分别对由特定属性区域消除图像创建单元和特定属性像素图像创建单元创建的两个或更多图像进行压缩编码;和
组合文件创建单元(29),创建其中合并了来自图像编码单元的编码图像的组合文件,
其中,所述特定属性区域颜色确定单元在确定所述特定属性区域颜色时,首先获取具有特定属性的像素的像素值,并计算这些像素的代表颜色;然后,建立最大相似颜色,当所建立的最大相似颜色小于预定阈值时,判定其为无色,并通过从所述最大相似颜色中减去校正值来校正所述最大相似颜色;在经校正的最大相似颜色和所述代表颜色中进行比较,并选择最接近于所述代表颜色的经校正的最大相似颜色作为所述特定属性区域颜色。
2、根据权利要求1的图像处理设备,还包括平滑处理单元(31),对多级图像获取单元所获取的多级图像进行平滑处理。
3、根据权利要求1的图像处理设备,还包括连通分量尺寸检查单元(32),用于从二值图像中提取黑色像素的连通分量,对连通分量的尺寸进行分类,并将太大或太小的分量改变为白色像素,其中通过白色像素置换单元将所述二值图像中的特定属性区域以外的像素改变为白色像素。
4、根据权利要求1的图像处理设备,还包括对比度调整单元(33),削弱由特定属性区域消除图像创建单元创建的图像与特定属性像素图像创建单元创建的图像之间的对比度。
5、根据权利要求1的图像处理设备,还包括分辨率转换单元(34),将由特定属性区域消除图像创建单元创建的、用背景颜色改变特定属性区域的像素的多级图像的分辨率转换为低分辨率。
6、一种图像处理方法,包括以下步骤:
获取作为处理对象图像的多级图像;
获取基于多级图像而创建的二值图像;
从多级图像中提取作为具有特定属性的区域的特定属性区域;
将二值图像中的特定属性区域以外的像素变为白色像素;
创建其中用背景颜色改变特定属性区域的像素的多级图像;
确定特定属性区域的颜色;
创建具有由特定属性区域颜色确定步骤所确定的特定属性区域颜色的特定属性区域的图像;
分别对由特定属性区域消除图像创建步骤和特定属性像素图像创建步骤创建的两个或更多图像进行压缩编码;以及
创建其中合并了在图像编码步骤创建的编码图像的组合文件,
其中,所述确定特定属性区域颜色的步骤包括:
获取具有特定属性的像素的像素值,并计算这些像素的代表颜色;
建立最大相似颜色,当所建立的最大相似颜色小于预定阈值时,判定其为无色,并通过从所述最大相似颜色中减去校正值来校正所述最大相似颜色;以及
在经校正的最大相似颜色和所述代表颜色中进行比较,并选择最接近于所述代表颜色的经校正的最大相似颜色作为所述特定属性区域颜色。
7、根据权利要求6的图像处理方法,还包括对多级图像获取步骤中所获取的多级图像进行平滑处理的步骤。
8、根据权利要求6的图像处理方法,还包括以下步骤:
从二值图像中提取黑色像素的连通分量,其中通过白色像素置换单元将特定属性区域以外的像素改变为白色像素;
对连通分量的尺寸进行分类;以及
将太大或太小的分量改变为白色像素。
9、根据权利要求6的图像处理方法,还包括削弱由特定属性区域消除图像创建步骤创建的图像与特定属性像素图像创建步骤创建的图像之间的对比度的步骤。
10、根据权利要求6的图像处理方法,还包括将特定属性区域消除图像创建步骤创建的、用背景颜色改变特定属性区域的像素的多级图像的分辨率转换为低分辨率的步骤。
CNB2005100543009A 2004-01-19 2005-01-19 图像处理设备和图像处理方法 Expired - Fee Related CN100356768C (zh)

Applications Claiming Priority (33)

Application Number Priority Date Filing Date Title
JP2004010225A JP4237642B2 (ja) 2004-01-19 2004-01-19 画像処理装置、画像処理用プログラム及び記憶媒体
JP010225/2004 2004-01-19
JP010223/2004 2004-01-19
JP010223/04 2004-01-19
JP010225/04 2004-01-19
JP2004010223A JP2005204206A (ja) 2004-01-19 2004-01-19 画像処理装置、画像処理用プログラム及び記憶媒体
JP072668/2004 2004-03-15
JP072668/04 2004-03-15
JP2004072668A JP2005259017A (ja) 2004-03-15 2004-03-15 画像処理装置、画像処理用プログラム及び記憶媒体
JP2004114076A JP2005303506A (ja) 2004-04-08 2004-04-08 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体
JP114076/04 2004-04-08
JP114076/2004 2004-04-08
JP116827/2004 2004-04-12
JP2004116827A JP4471202B2 (ja) 2004-04-12 2004-04-12 画像処理装置、画像処理方法及び同方法に用いるプログラム
JP116827/04 2004-04-12
JP140831/04 2004-05-11
JP140831/2004 2004-05-11
JP2004140831A JP4235583B2 (ja) 2003-05-26 2004-05-11 画像処理装置、画像処理用プログラム及び記憶媒体
JP144887/04 2004-05-14
JP2004144887A JP2005328348A (ja) 2004-05-14 2004-05-14 画像処理装置、プログラム、及び記憶媒体
JP144887/2004 2004-05-14
JP2004152864A JP4446797B2 (ja) 2004-05-24 2004-05-24 文書復元装置、文書復元方法、文書復元プログラムおよび記録媒体
JP152864/04 2004-05-24
JP152864/2004 2004-05-24
JP155767/2004 2004-05-26
JP2004155767A JP4504096B2 (ja) 2004-05-26 2004-05-26 画像処理装置、プログラム、及び記憶媒体
JP155767/04 2004-05-26
JP2004161082A JP4311663B2 (ja) 2004-05-31 2004-05-31 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体
JP161082/2004 2004-05-31
JP161082/04 2004-05-31
JP168016/04 2004-06-07
JP2004168016A JP2005348279A (ja) 2004-06-07 2004-06-07 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP168016/2004 2004-06-07

Publications (2)

Publication Number Publication Date
CN1649384A CN1649384A (zh) 2005-08-03
CN100356768C true CN100356768C (zh) 2007-12-19

Family

ID=34624185

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100543009A Expired - Fee Related CN100356768C (zh) 2004-01-19 2005-01-19 图像处理设备和图像处理方法

Country Status (3)

Country Link
US (1) US20050180645A1 (zh)
EP (1) EP1555804A3 (zh)
CN (1) CN100356768C (zh)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4165706B2 (ja) * 2004-01-26 2008-10-15 株式会社リコー 原稿読み取り装置および画像形成装置
EP1670257B1 (en) 2004-12-10 2018-09-26 Ricoh Company, Ltd. Compressing a mutlivalue image with control of memory space requirement
US7684648B2 (en) * 2005-01-14 2010-03-23 Ricoh Company, Limited Reducing the size of a document image
US7848589B2 (en) * 2005-02-01 2010-12-07 Richoh Company, Ltd. Method and apparatus for applying edge enhancement based on image characteristics
JP4646797B2 (ja) * 2005-02-01 2011-03-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4419876B2 (ja) * 2005-03-14 2010-02-24 富士ゼロックス株式会社 画像処理装置
US7570403B2 (en) * 2005-03-16 2009-08-04 Kabushiki Kaisha Toshiba Color image processing apparatus
JP4704288B2 (ja) * 2005-09-15 2011-06-15 株式会社リコー 画像処理装置およびプログラム
JP2007133383A (ja) * 2005-10-12 2007-05-31 Matsushita Electric Ind Co Ltd オンスクリーン信号処理装置、および放送受信装置
KR100662436B1 (ko) * 2005-11-29 2007-01-02 엘지전자 주식회사 메시지 용량을 표시하는 방법 및 장치
JP4750047B2 (ja) * 2006-03-31 2011-08-17 株式会社リコー 位置ずれ検出装置、位置ずれ検出方法、位置ずれ検出プログラムおよび記録媒体
US20070237408A1 (en) * 2006-04-05 2007-10-11 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP4732250B2 (ja) * 2006-06-14 2011-07-27 キヤノン株式会社 情報処理装置、制御方法、およびコンピュータプログラム
JP4333708B2 (ja) * 2006-08-02 2009-09-16 コニカミノルタビジネステクノロジーズ株式会社 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US7953277B2 (en) * 2006-09-05 2011-05-31 Williams Robert C Background separated images for print and on-line use
US8041135B2 (en) * 2006-10-20 2011-10-18 Canon Kabushiki Kaisha Image encoding apparatus and control method thereof
JP2008165381A (ja) * 2006-12-27 2008-07-17 Ricoh Co Ltd 画像処理装置及び画像処理方法
JP4979428B2 (ja) * 2007-03-23 2012-07-18 キヤノン株式会社 画像処理装置およびその制御方法
US8068684B2 (en) * 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4402138B2 (ja) * 2007-06-29 2010-01-20 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8635537B1 (en) 2007-06-29 2014-01-21 Amazon Technologies, Inc. Multi-level architecture for image display
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
JP4871822B2 (ja) * 2007-09-20 2012-02-08 キヤノン株式会社 画像符号化装置及びその制御方法
CN101918979B (zh) * 2008-01-15 2012-05-23 佩特媒体株式会社 镶嵌图像生成装置、方法
JP4960897B2 (ja) * 2008-01-30 2012-06-27 株式会社リコー 画像処理装置、画像処理方法、プログラム、記憶媒体
JP4902569B2 (ja) * 2008-02-19 2012-03-21 キヤノン株式会社 画像符号化装置及びその制御方法
US20090220120A1 (en) * 2008-02-28 2009-09-03 Jonathan Yen System and method for artistic scene image detection
CN101551859B (zh) * 2008-03-31 2012-01-04 夏普株式会社 图像辨别装置及图像检索装置
JP5047051B2 (ja) * 2008-05-02 2012-10-10 キヤノン株式会社 画像処理装置及び画像符号化方法
US8170291B2 (en) * 2008-05-09 2012-05-01 The United States Postal Service Methods and systems for analyzing the quality of digital signature confirmation images
JP5173867B2 (ja) * 2008-05-13 2013-04-03 キヤノン株式会社 画像符号化装置及び画像復号装置、並びにそれらの制御方法
JP4586891B2 (ja) * 2008-06-10 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
US8731319B2 (en) * 2008-06-25 2014-05-20 Adobe Systems Incorporated Image layer stack interface
JP5302768B2 (ja) * 2008-06-26 2013-10-02 キヤノン株式会社 画像処理装置及び画像処理方法
JP4725645B2 (ja) * 2008-12-26 2011-07-13 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、データ量削減方法およびデータ量削減プログラム
JP4698743B2 (ja) * 2009-01-22 2011-06-08 シャープ株式会社 画像圧縮方法、画像圧縮装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4752935B2 (ja) * 2009-03-06 2011-08-17 カシオ計算機株式会社 画像処理装置及び画像処理プログラム
JP5328510B2 (ja) * 2009-06-24 2013-10-30 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5300639B2 (ja) * 2009-07-23 2013-09-25 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP2011040966A (ja) * 2009-08-10 2011-02-24 Renesas Electronics Corp 画像処理装置、画像処理方法及びプログラム
JP5304529B2 (ja) * 2009-08-17 2013-10-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
TWI421784B (zh) * 2009-11-09 2014-01-01 Univ Nat Sun Yat Sen 用於篩選一作為一皮膚美白劑之候選物的魚體影像分析系統及其應用
JP4975115B2 (ja) * 2010-01-25 2012-07-11 キヤノン株式会社 画像処理装置
US8384917B2 (en) * 2010-02-15 2013-02-26 International Business Machines Corporation Font reproduction in electronic documents
JP2011216080A (ja) * 2010-03-18 2011-10-27 Canon Inc 画像処理装置、画像処理方法、および記憶媒体
CN102651107B (zh) * 2011-02-25 2016-03-23 深圳市心艺来文化有限公司 一种手机拍码缴费方法
US9064301B2 (en) * 2011-04-14 2015-06-23 Abbott Point Of Care, Inc. Method and apparatus for compressing imaging data of whole blood sample analyses
CN102394053B (zh) * 2011-06-20 2013-08-14 深圳市茁壮网络股份有限公司 一种纯单色图片显示方法及装置
US9082197B2 (en) * 2011-07-18 2015-07-14 Zte Corporation Local image translating method and terminal with touch screen
JP5842441B2 (ja) * 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5776419B2 (ja) * 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
US9147178B2 (en) * 2012-01-16 2015-09-29 International Business Machines Corporation De-identification in visual media data
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
JP5874497B2 (ja) 2012-03-30 2016-03-02 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 2012-03-30 2016-06-15 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5971068B2 (ja) * 2012-10-02 2016-08-17 富士ゼロックス株式会社 画像処理装置、画像形成システム、及び画像処理プログラム
KR102076085B1 (ko) * 2012-11-20 2020-02-11 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 인쇄 제어 단말장치, 화상형성장치 및 이를 이용한 인쇄 제어 방법
JP5847063B2 (ja) * 2012-11-27 2016-01-20 京セラドキュメントソリューションズ株式会社 画像処理装置
JP5697649B2 (ja) 2012-11-27 2015-04-08 京セラドキュメントソリューションズ株式会社 画像処理装置
WO2014102876A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 画像処理装置、および、画像処理方法
JP5939154B2 (ja) 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
US9995922B2 (en) * 2013-03-08 2018-06-12 Shimadzu Corporation Analysis target region setting apparatus
CN103260067B (zh) * 2013-05-15 2016-11-16 深圳国微技术有限公司 一种图像数据的处理方法及条件接收模块
CN104462159A (zh) * 2013-09-25 2015-03-25 北大方正集团有限公司 基于文档页面内容的图像转换方法及系统
US9564099B2 (en) * 2014-03-10 2017-02-07 Lumotune Inc. Bistable display systems and methods
JP6370080B2 (ja) * 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
JP6001010B2 (ja) * 2014-06-11 2016-10-05 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP6128092B2 (ja) 2014-10-10 2017-05-17 コニカミノルタ株式会社 履歴生成装置及び履歴生成方法
CN105760390B (zh) * 2014-12-17 2021-09-28 富泰华工业(深圳)有限公司 图片检索系统及方法
US9830508B1 (en) * 2015-01-30 2017-11-28 Quest Consultants LLC Systems and methods of extracting text from a digital image
WO2016130853A1 (en) * 2015-02-11 2016-08-18 AVG Netherlands B.V. Systems and methods for identifying unwanted photos stored on a device
WO2017009910A1 (ja) 2015-07-10 2017-01-19 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
JP2017073764A (ja) * 2015-10-08 2017-04-13 株式会社リコー 画像処理装置、画像処理方法、及び、プログラム
US9824289B2 (en) * 2015-12-07 2017-11-21 Conduent Business Services, Llc Exploiting color for license plate recognition
JP6658078B2 (ja) 2016-02-25 2020-03-04 ブラザー工業株式会社 画像処理装置、コンピュータプログラム、および、システム
JP6769045B2 (ja) * 2016-02-29 2020-10-14 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP6516103B2 (ja) * 2016-06-16 2019-05-22 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP6892625B2 (ja) 2016-07-29 2021-06-23 ブラザー工業株式会社 データ処理装置、および、コンピュータプログラム
JP6780442B2 (ja) * 2016-10-27 2020-11-04 富士ゼロックス株式会社 色処理装置、色処理方法、色処理システムおよびプログラム
JP6852364B2 (ja) * 2016-11-25 2021-03-31 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US10445615B2 (en) 2017-05-24 2019-10-15 Wipro Limited Method and device for extracting images from portable document format (PDF) documents
JP6865109B2 (ja) * 2017-05-31 2021-04-28 株式会社東芝 画像処理装置
EP3683764A4 (en) * 2017-09-12 2020-11-18 Panasonic Intellectual Property Management Co., Ltd. IMAGE GENERATION DEVICE AND METHOD
JP6939449B2 (ja) 2017-11-14 2021-09-22 株式会社リコー 画像処理装置、画像処理方法および画像処理プログラム
US10755130B2 (en) * 2018-06-14 2020-08-25 International Business Machines Corporation Image compression based on textual image content
GB2577989B (en) * 2018-09-30 2021-03-24 Lenovo Beijing Co Ltd Information processing method and electronic device
JP2022021875A (ja) 2020-07-22 2022-02-03 株式会社リコー 情報処理装置およびプログラム
CN112201117B (zh) * 2020-09-29 2022-08-02 深圳市优必选科技股份有限公司 一种逻辑板识别方法、装置及终端设备
US20230094651A1 (en) * 2021-09-30 2023-03-30 Konica Minolta Business Solutions U.S.A., Inc. Extracting text from an image
CN114786037B (zh) * 2022-03-17 2024-04-12 青岛虚拟现实研究院有限公司 一种面向vr投影的自适应编码压缩方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002312719A (ja) * 2001-04-11 2002-10-25 Nec Corp 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム
JP2003018412A (ja) * 2001-07-03 2003-01-17 Canon Inc 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2003219187A (ja) * 2002-01-23 2003-07-31 Canon Inc 画像処理方法及び画像処理装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5510634A (en) * 1978-07-10 1980-01-25 Fujitsu Ltd Separate character removal system of character recognition unit
ATE137377T1 (de) * 1990-02-06 1996-05-15 Canon Kk Bildverarbeitungsgerät
JPH04287179A (ja) * 1991-03-15 1992-10-12 Fuji Xerox Co Ltd 画像処理装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH05324905A (ja) * 1992-05-20 1993-12-10 Hitachi Ltd 印字文字検出装置
US5872864A (en) * 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
EP0811946A3 (en) * 1994-04-15 1998-01-14 Canon Kabushiki Kaisha Image pre-processor for character recognition system
JPH08179752A (ja) * 1994-12-21 1996-07-12 Canon Inc 画像処理装置及び方法
JP3749282B2 (ja) * 1995-05-16 2006-02-22 株式会社東芝 画像処理装置
US7164493B1 (en) * 1998-11-06 2007-01-16 Canon Kabushiki Kaisha Image processing method, system and apparatus, and storage medium
JP2001016447A (ja) * 1999-06-30 2001-01-19 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
EP1104916B1 (de) * 1999-12-04 2011-05-11 LuraTech Imaging GmbH Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP3972751B2 (ja) * 2001-08-27 2007-09-05 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US7340092B2 (en) * 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP2003338935A (ja) * 2002-05-20 2003-11-28 Canon Inc 画像処理装置および方法
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002312719A (ja) * 2001-04-11 2002-10-25 Nec Corp 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム
JP2003018412A (ja) * 2001-07-03 2003-01-17 Canon Inc 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2003219187A (ja) * 2002-01-23 2003-07-31 Canon Inc 画像処理方法及び画像処理装置

Also Published As

Publication number Publication date
CN1649384A (zh) 2005-08-03
EP1555804A3 (en) 2006-08-16
US20050180645A1 (en) 2005-08-18
EP1555804A2 (en) 2005-07-20

Similar Documents

Publication Publication Date Title
CN100356768C (zh) 图像处理设备和图像处理方法
CN102577345B (zh) 图像处理设备及其处理方法
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP5302768B2 (ja) 画像処理装置及び画像処理方法
US10477063B2 (en) Character detection and binarization
CN101820489A (zh) 图像处理设备及图像处理方法
US20020061140A1 (en) Image processing apparatus and method, program and storage medium
JPH03119486A (ja) 記入済書式に含まれている情報を記憶または伝送のために圧縮する方法
JP2001268372A (ja) 圧縮されたドキュメント画像内にエイリアス除去テキスト及びライングラフィックスを生成する方法
CN1112759A (zh) 删简格式文件图像压缩
JP5645612B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US6272251B1 (en) Fully automatic pasting of images into compressed pre-collated documents
JP2021167084A (ja) 画像処理装置、画像処理方法ならびにプログラム
US20100202025A1 (en) Image processing apparatus, image processing method, program, and storage medium
JP4695914B2 (ja) 画像処理装置及び画像処理方法
JP4217969B2 (ja) 画像処理装置及びプログラム
JPH04356873A (ja) カラー文書画像の適応符号化方式
JP5538996B2 (ja) 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP4648073B2 (ja) 画像処理装置及びこれを備えた画像読取装置並びに画像処理方法
JP5424785B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JPH09167222A (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム
JP2005323066A (ja) 画像処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071219

Termination date: 20200119