WO2006021247A1 - Method for detecting errors in address databases - Google Patents

Method for detecting errors in address databases Download PDF

Info

Publication number
WO2006021247A1
WO2006021247A1 PCT/EP2005/006132 EP2005006132W WO2006021247A1 WO 2006021247 A1 WO2006021247 A1 WO 2006021247A1 EP 2005006132 W EP2005006132 W EP 2005006132W WO 2006021247 A1 WO2006021247 A1 WO 2006021247A1
Authority
WO
WIPO (PCT)
Prior art keywords
address
video coding
images
distribution
errors
Prior art date
Application number
PCT/EP2005/006132
Other languages
German (de)
French (fr)
Inventor
Werner Hautsch
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2006021247A1 publication Critical patent/WO2006021247A1/en

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/20Arrangements for facilitating the visual reading of addresses, e.g. display arrangements coding stations
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Definitions

  • Another reason for the above situation is the unavoidable typing error when entering the video coding sequences, even with well-trained employees.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

The invention relates to a method for detecting errors in address databases for address read systems of letter sorting machines comprising OCR units and video coding systems. According to said method, during reading, the video coding sequences of the images of letters rejected after video coding or the distribution codes of the erroneously sorted letters determined during sorting and distribution of the letters read in the address read system are stored and the rejections are counted in relation to the respective video coding sequence or the wrong distributions are counted in relation to the determined distribution codes. When a defined number is exceeded and lies significantly above a suitably selected lower threshold value, images of rejections including the respective coding sequences or the images recorded after wrong distribution and during reprocessing of the letters in a letter sorting machine are stored as address database errors and output for error correction.

Description

Beschreibungdescription
Verfahren zum Ermitteln von Fehlern in AdressdatenbankenMethod for determining errors in address databases
Die Erfindung betrifft ein Verfahren zum Ermitteln von Feh¬ lern in Adressdatenbanken für Adresslesesysteme von Sendungs¬ sortieranlagen mit OCR-Einheiten und Videokodiersystemen.The invention relates to a method for determining errors in address databases for address reading systems of mail sorting systems with OCR units and video coding systems.
Die heute eingesetzten Anlagen zur automatischen Sortierung von Sendungen enthalten Lesesysteme, „mit deren Hilfe die' Ad¬ resse der jeweiligen Sendung automatisch gelesen und daraus die zur Sortierung notwendige Verteilinformation abgeleitet wird.The systems used today for the automatic sorting of shipments contain reading systems "with the aid of which the ' address of the respective program is automatically read and from this the distribution information necessary for the sorting is derived.
Adressen, die von der OCR-Einheit nicht mit der erforderli¬ chen Sicherheit erkannt werden können, werden anschließend in einem Videokodiersystem weiterbearbeitet . Hierbei werden die elektronischen Abbilder der Sendungen an Bildschirmen der Vi¬ deokodierplätze angezeigt. Die Operateure dieser Videokodier- platze haben die Aufgabe, die für die Verteilung der Sendun¬ gen notwendige Information manuell zu ermitteln. Dabei han¬ delt es sich nicht um ein Abschreiben der Adresse. Ein sol¬ ches Vorgehen ist viel zu aufwändig und würde zu einer völlig unbefriedigenden Kostensituation führen. Es werden vielmehr unter genauer Beachtung der jeweiligen Adress-Strukturen be¬ stimmte Kodierregeln aufgestellt, nach denen nur bestimmte Teile der Adresse eingegeben werden müssen. Dieser Informati¬ onsextrakt wird so zu definiert, dass daraus die notwendige Verteilinformation in den meisten Fällen in eindeutiger Weise gewonnen werden kann und nur in wenigen Fällen weitere Ent¬ scheidungen des Operateurs notwendig sind. Dieses Verfahren ist als Extraktionskodierverfahren bekannt.Addresses that can not be recognized by the OCR unit with the required security are then further processed in a video coding system. In this case, the electronic images of the programs are displayed on screens of the video decoding stations. The operators of these video coding platforms have the task of manually determining the information necessary for the distribution of the transmissions. This is not a copying of the address. Such a procedure is far too costly and would lead to a completely unsatisfactory cost situation. On the contrary, precise coding of the respective address structures establishes specific coding rules according to which only certain parts of the address must be entered. This informational extract is defined in such a way that the necessary distribution information can be obtained in most cases in a clear manner and only in a few cases further decisions by the surgeon are necessary. This method is known as extraction coding method.
Sendungen, bei denen auch durch Anwendung der Videokodierung keine Verteilinformation ermittelt werden kann, müssen in ein getrenntes Fach der Sortiermaschine aussortiert und anschlie- Send im Rahmen einer Handsortierung weiterbearbeitet werden. Diese manuelle Arbeit verursacht hohe Kosten und sollte daher soweit wie möglich vermieden werden.Consignments in which no distribution information can also be determined by using video coding must be sorted out into a separate compartment of the sorting machine and then Send be further processed by hand sorting. This manual work causes high costs and should therefore be avoided as much as possible.
Die Gründe für das Versagen der Lesesysteme mit OCR-Lese- und Videokodierprozessen sind vielfältig:The reasons for the failure of reading systems with OCR reading and video encoding processes are manifold:
1. Die Sendung wurde falsch eingelegt :1. The shipment was inserted incorrectly:
Die Sendung wurde beim Einlegen in die Stoffeingabe der Sortiermaschine versehentlich mit der Rückseite zumThe consignment was accidentally inserted into the material input of the sorting machine with the back to
Scanner eingelegt, sodass die Empfängeradresse nicht er- fasst werden konnte.Scanner was inserted so that the recipient address could not be detected.
Fehler dieser Art sind leicht erkennbar und durch an¬ schließendes richtiges Einlegen ohne große Mehrkosten behebbar.Errors of this kind are easily recognizable and can be remedied by an¬ closing proper insertion without large additional costs.
2. Die Adresse ist unleserlich:2. The address is illegible:
Im elektronischen Bild ist die Adresse auch für einen Menschen nicht zu erkennen. Dies kann durch eine objek- tiv schlechte Schreib- oder Druckqualität begründet sein. In vielen Fällen liegt der Grund jedoch im Bild¬ aufnahme-System. Bei sehr ungünstigen Kontrastverhält- nissen, z.B. silberfarbene Schrift auf dunklem Hinter¬ grund, sind auch die heute in Sortiermaschinen verwende- ten Hochgeschwindigkeits-Scanner nicht in der Lage, ein lesbares Bild der Adresse aufzuzeichnen.In the electronic picture the address is not recognizable even for a human being. This may be due to an objec- tively poor writing or printing quality. In many cases, however, the reason lies in the image recording system. For very unfavorable contrast ratios, e.g. silver-colored writing on a dark background, even the high-speed scanners used today in sorting machines are not able to record a readable image of the address.
Die Adressen von Sendungen dieser Art können nur auf dem Original gelesen werden und müssen deshalb in der Hand¬ verteilung bearbeitet werden.The addresses of broadcasts of this type can only be read on the original and must therefore be processed in the hand distribution.
3. Die Adresse ist unrichtig:3. The address is incorrect:
Die Adressangabe auf der Sendung entspricht keiner rea¬ len postalischen Adresse. In vielen Fällen handelt es sich dabei um Schreibfehler, die von einer Person mit guter Kenntnis der lokalen Verteilgeographie identifi- ziert werden können. In manchen Fällen müssen jedoch weitere Untersuchungen angestellt werden, die häufig auch eine postalische Öffnung der Sendung erfordern.The address information on the shipment does not correspond to a real postal address. In many cases these are typographical errors identifiable by a person with a good knowledge of local distribution geography. can be decorated. In some cases, however, further investigations must be made, which often also require postal opening of the consignment.
4. Die Adresse ist zwar korrekt, sie kann jedoch in der verwendeten Adressdatenbank nicht identifiziert werden: Zur Durchführung des OCR-Lese- und Videokodierprozesses muss eine Datenbank zur Verfügung stehen, die alle Ad¬ ressen auf landesweiter Basis enthält und dabei jeder Adresse die Verteilinformation zuordnet, die zum Sortie¬ ren der jeweiligen Sendung benötigt wird. Diese Daten¬ bank wird Adress-Datenbank oder Adress-Wörterbuch ge¬ nannt. Fehlen nun bestimmte Adressen in dieser Datenbank oder weisen Fehler auf, so können sie auch bei optimaler Druck- oder Schreibqualität weder von der OCR- Leseeinheit gelesen noch mittels Videokodiersystem ko¬ diert werden. Sie müssen dann von Personen mit guter Kenntnis der lokalen Verteilgeographie manuell sortiert werden.4. Although the address is correct, it can not be identified in the address database used. To carry out the OCR reading and video coding process, a database must be available which contains all addresses on a nationwide basis and, in so doing, the distribution information for each address assigns, which is needed for sorting the respective program. This database is called address database or address dictionary. If certain addresses in this database are now missing or have errors, they can neither be read by the OCR reading unit nor encoded by means of a video coding system, even with optimum printing or writing quality. They must then be manually sorted by persons with good knowledge of the local distribution geography.
Einen weiteren Grund für die obige Situation stellen die auch bei gut trainierten Mitarbeitern unvermeidlichen Tippfehler bei der Eingabe der Videokodier-Sequenzen dar.Another reason for the above situation is the unavoidable typing error when entering the video coding sequences, even with well-trained employees.
Im operationellen Betrieb eines Sortierzentrums stellen Män¬ gel der Adressdatenbank den häufigsten Grund für eine Bear¬ beitung in der Handsortierung dar. Bei den bislang eingesetzten Verfahren sind jedoch diese Män- gel schwer zu erkennen: Alle in der Handsortierung bearbeite¬ ten Sendungen müssen einzeln mit dem Inhalt der Adressdaten¬ bank verglichen werden, um die Mängel der Adressdatenbank von den übrigen oben erwähnten Gründen unterscheiden zu können. Diese Entscheidung kann nur von Personen mit guter Kenntnis der lokalen Verteilgeographie vorgenommen werden und ist ent¬ sprechend aufwändig.In the operational operation of a sorting center, defects in the address database are the most common reason for processing in manual sorting. However, these methods are difficult to recognize in the methods used hitherto the content of the Adressdaten¬ bank to be able to distinguish the shortcomings of the address database from the other reasons mentioned above. This decision can only be made by persons with good knowledge be made the local distribution geography and is ent¬ consuming expensive.
Der Erfindung liegt die Aufgabe zugrunde, ein aufwandsarmes Verfahren zum Ermitteln von Fehlern in Adressdatenbanken zu schaffen,The invention has for its object to provide a low-cost method for detecting errors in address databases,
Erfindungsgemäß wird die Aufgabe durch die Merkmale des An¬ spruches 1 gelöst. Im Laufe des Lesebetriebes werden die Videokodiersequenzen der nach dem Videokodieren zurückgewiesenen Abbilder der die Adressangaben aufweisenden Sendungsoberflächen oder die im Laufe des Sortier- und Verteilbetriebes der im Adresslesesys- tem gelesenen Sendungen ermittelten Verteilkodes der fehlver- teilten Sendungen gespeichert. Weiterhin werden die Zurück¬ weisungen, bezogen auf die jeweilige Videokodiersequenz, oder die Fehlverteilungen bezogen auf die ermittelten Verteilkodes gezählt. Bei Überschreiten einer festgelegten Anzahl, die signifikant über einem geeignet gewählten unteren Grenzwert liegt, werden Abbilder von Zurückweisungen mit den jeweiligen Kodiersequenzen oder die nach der Fehlverteilung beim nochma¬ ligen Verarbeiten der Sendungen in einer Sendungssortieranla¬ ge aufgenommenen Abbilder als Adressdatenbankfehler gespei¬ chert und anschließend zur Fehlerkorrektur dargestellt. Durch die automatische Ermittlung der Datenbankfehler, was sowohl fehlende als auch falsche Eintragungen 'betrifft, und die Darstellung der zurückgewiesenen Videokodiersequenzen o- der der Verteilkodes der Fehlleitungen mit den Bildern zur anschließenden Korrektur kann die Adressdatenbank ohne Mühe auf dem aktuellen Stand gehalten und der Umfang der Handsor¬ tierung stark reduziert werden.According to the invention, the object is achieved by the features of claim 1. An¬. During the read operation, the video coding sequences of the images of the mailing surfaces having the address details or the distribution codes of misdistributed mailings determined during the sorting and distribution operation of the mail read in the address reading system are stored after the video coding. Furthermore, the Rück¬ instructions, based on the respective video coding sequence, or the incorrect distributions are counted based on the determined distribution codes. If a defined number is exceeded which is significantly above a suitably selected lower limit value, images of rejections with the respective coding sequences or the images recorded in a mail sorting system after the mis-distribution during further processing of the mailpieces are stored as address database errors and subsequently displayed for error correction. By automatically identifying the database error, which both missing and inaccurate entries concerns', and the presentation of the rejected Videokodiersequenzen o of the Verteilkodes the misdirection with the images for subsequent correction can maintain the address database effortlessly up to date and the scope of Handor¬ tion be greatly reduced.
Vorteilhafte Ausgestaltungen der Erfindung sind in den Unter¬ ansprüchen dargelegt . Um die Korrektur der Adressdatenbank rationell durchzuführen, ist es vorteilhaft, wenn die Darstellung der die Adressdaten¬ bankfehler kennzeichnenden Videokodiersequenzen oder Verteil- kodes mit den zugehörenden Abbildern in einer den Adressda- tenbankeinträgen entsprechenden Reihenfolge erfolgt.Advantageous embodiments of the invention are set forth in the dependent claims. In order to carry out the correction of the address database efficiently, it is advantageous if the representation of the video coding sequences or distribution codes characterizing the address database errors takes place with the associated images in an order corresponding to the address data bank entries.
Vorteilhaft ist es auch, nur eine festgelegte Anzahl von Ab¬ bildern für jede Videokodiersequenz oder für jeden Verteilko¬ de eines Adressdatenbankfehlers aufzuzeichnen und darzustel- len. Dadurch kann der Speicher- und Auswerteaufwand gering gehalten werden.It is also advantageous to record and display only a defined number of images for each video coding sequence or for each distribution code of an address database error. As a result, the storage and evaluation effort can be kept low.
Weiterhin ist es vorteilhaft, die die Aufzeichnung von Abbil¬ dern steuernden Grenzwerte dynamisch im Verlauf einer Messung anzupassen, wodurch die Messdauer entsprechend der vorhande¬ nen Gegebenheiten nahezu beliebig gewählt werden kann.Furthermore, it is advantageous to adjust the limit values controlling the recording of images dynamically in the course of a measurement, as a result of which the measurement duration can be selected almost arbitrarily in accordance with the existing conditions.
Anschließend wird die Erfindung in einem Ausführungsbeispiel anhand der Zeichnung erläutert.Subsequently, the invention will be explained in an embodiment with reference to the drawing.
Dabei zeigenShow
FIG 1 eine Häufigkeitsverteilung verschiedener zu¬ rückgewiesener Videokodiersequenzen mit den Aufzeichnungsgrenzwerten,1 shows a frequency distribution of different rejected video coding sequences with the recording limit values,
FIG 2 eine Häufigkeitsverteilung der zurückgewiesenen Videokodiersequenzen nach Liste 1 mit den Auf¬ zeichnungsgrenzwerten.2 shows a frequency distribution of the rejected video coding sequences according to list 1 with the recording limit values.
Fehlende oder inkorrekte, d.h. nicht zu den verwendeten Ad¬ ressen passende Einträge in der Adressdatenbank machen sich in gleicher Weise beim Lesen wie beim Videokodieren bemerk¬ bar. Wenn z. B. ein Straßenname in der Adressdatenbank fehlt oder falsch geschrieben ist, so führt das sowohl beim Lesen als auch beim Videokodieren zu einer Rückweisung (oder im Ex- tremfall zu einem Fehler) .Missing or incorrect entries in the address database that are not appropriate for the addresses used make themselves noticeable in the same way during reading as during video coding. If z. If, for example, a street name in the address database is missing or misspelled, this leads to a rejection (both in reading and in video coding). tremfall to an error).
Durch Analyse der Rückweisungen des Videokodiersystems können also die Mängel der Adressdatenbank ermittelt werden.By analyzing the rejections of the video coding system, the shortcomings of the address database can thus be determined.
Hierfür wird das folgende automatische Verfahren verwendet :The following automatic procedure is used for this:
Im operationeilen Betrieb wird bei jeder Rückweisung des Vi¬ deokodiersystems die zur Rückweisung führende Kodiersequenz gespeichert und gezählt.In operational operation, the coding sequence leading to the rejection is stored and counted for each rejection of the video decoding system.
Trägt man die Häufigkeit der Rückweisungen der verschiedenen Videokodiersequenzen auf, so ergibt sich eine in FIG 1 ange¬ gebene Verteilung:If one plots the frequency of the rejections of the various video coding sequences, then a distribution is given in FIG. 1:
Über einem über alle Sequenzen annähernd gleichförmig ver¬ teilten Kontinuum erheben sich Häufungspunkte für bestimmte Kodiersequenzen.Over a continuum approximately uniformly distributed over all sequences, accumulation points for certain coding sequences are raised.
Der Grund für diese Verteilung ist folgender:The reason for this distribution is as follows:
Tipp- und Schreibfehler sind i.a. statistisch gleichmäßig über alle möglichen Videokodiersequenzen verteilt. Es gibt keine besondere Bevorzugung bestimmter Sequenzen, während bei Fehlen eines Eintrags in der Adressdatenbank jede an diese . Adresse gerichtete Sendung immer eine Rückweisung der jewei¬ ligen Kodiersequenz verursacht. Die Häufungspunkte sind also dur.ch Mängel der Adressdatenbank verursacht. Die absolute Hö¬ he des Häufungspunktes deutet auf die Häufigkeit solcher Adressen im Operationellen Betrieb der Sortieranlage hin.Typing and typing errors are i.a. statistically evenly distributed over all possible video coding sequences. There is no particular preference for particular sequences, while in the absence of an entry in the address database, each of them. Address directed transmission always causes a rejection of jewei¬ time coding sequence. The accumulation points are therefore caused by deficiencies of the address database. The absolute height of the accumulation point indicates the frequency of such addresses in the operational operation of the sorting system.
Da aus den Kodiersequenzen allein kein Rückschluss auf die verursachenden Adressen möglich ist, müssen zusätzlich Bilder der betreffenden Sendungen gespeichert werden. Dabei ist es notwendig, die betreffenden Sendungen gezielt aufzuzeichnen, um eine ungeordnete Datenflut zu vermeiden.Since it is not possible to draw any conclusions about the causative addresses from the coding sequences alone, images of the relevant programs must additionally be stored. It is necessary to record the programs concerned in order to avoid a disorderly flood of data.
Zu diesem Zweck wird die Bildaufzeichnung durch zwei Grenz¬ werte gesteuert. Der untere Grenzwert wird so gelegt, dass er deutlich über dem von Tipp- und Schreibfehlern verursachten Kontinuum liegt. Er steuert den Beginn der Aufzeichnung. Zunächst fin¬ det nämlich keine Aufzeichnung statt. Erst wenn der Zähler einer bestimmten Kodiersequenz den unte¬ ren Grenzwert überschreitet, wird das elektronische Bild der die Rückweisung verursachenden Sendung gespeichert. Dadurch wird die Aufzeichnung von Rückweisungen von Tipp- und' Schreibfehlern unterdrückt und es werden nur Beispiele von echten Adressdatenbankmängeln aufgezeichnet.For this purpose, the image recording is controlled by two Grenz¬ values. The lower limit is set to be well above the continuum caused by typing and typing mistakes. He controls the beginning of the recording. First of all, no recording takes place. Only when the counter of a certain coding sequence exceeds the lower limit value is the electronic image of the consignment causing the rejection stored. This suppresses the recording of typing and typing rejections, and records only examples of real address database failures.
Umgekehrt ist es unnötig, für alle durch einen Mangel in der Adressdatenbank verursachten Rückweisungen Bilder aufzuzeich¬ nen. Einige Beispiele genügen vollauf. Zu diesem Zweck wird ein zweiter, oberer Grenzwert eingeführt, nach dessen Über- schreitung die Aufzeichnung wieder unterdrückt wird. Die Dif¬ ferenz zwischen dem unteren und oberen Grenzwert gibt die Zahl der zu speichernden Beispielsendungen an. Es dürfte i.a. ausreichen, 5-10 Beispiele jeweils aufzuzeichnen. Die geplante Dauer der Messung ist bei der Wahl des unteren und oberen Grenzwertes zu berücksichtigen. Die Messung ist spätestens dann zu beenden, wenn im Verlauf der Messung die Häufigkeit des zufällig verteilten Kontinuums den unteren Grenzwert erreicht. Andernfalls würden die Tipp- und Schreib¬ fehler den unteren Grenzwert überschreiten und zu einer uner- wünschten Speicherbelastung führen.Conversely, it is unnecessary to record images for all rejections caused by a deficiency in the address database. Some examples are enough. For this purpose, a second, upper limit is introduced, after which the recording is suppressed again. The difference between the lower and upper limit value indicates the number of sample transmissions to be stored. It should i.a. suffice to record 5-10 examples each. The planned duration of the measurement must be considered when choosing the lower and upper limit values. The measurement must be stopped at the latest when the frequency of the randomly distributed continuum reaches the lower limit in the course of the measurement. Otherwise, the typing and writing errors would exceed the lower limit and lead to an undesirable storage load.
Die Größe der Grenzwerte bestimmt weiterhin die Empfindlich¬ keit der Messung:The size of the limits further determines the sensitivity of the measurement:
Gemäß den Regeln der Statistik heben sich bei Wahl eines kleinen unteren Grenzwertes nur die sehr häufig auftretenden Mängel der Adresse vom .Kontinuum deutlich ab, während die we¬ niger häufig auftretenden Mängel sich noch nicht deutlich ge¬ nug vom Kontinuum abzeichnen.According to the rules of statistics, if a small lower limit is selected, only the very frequent shortcomings of the address from the continuum clearly stand out, while the fewer faults which frequently occur are not yet clearly enough inferred from the continuum.
Um auch sie sichtbar zu machen, muss die Dauer der Messung und damit auch der untere Grenzwert erhöht werden. Es ist auch möglich, die Grenzwerte automatisch nach oben zu verschieben, wenn das zufällig verteilte Kontinuum in die Nä¬ he des anfangs gewählten unteren Grenzwertes kommt. Auf diese Weise ist es möglich, die Messdauer nahezu beliebig zu ges¬ talten und in einer einzigen Messung häufig u8nd weniger häu¬ fig auftretende Mängel gleichzeitig festzustellen.In order to make them visible, the duration of the measurement and thus also the lower limit must be increased. It is also possible to automatically shift the limit values upward when the randomly distributed continuum comes close to the initially selected lower limit value. To this In this way, it is possible to set the duration of the measurement virtually as desired, and to detect defects which frequently occur in a single measurement and less frequently occurring defects at the same time.
Die aufgezeichneten Beispiele können an Hand der sie auslö¬ senden Videokodiersequenzen geordnet werden. Damit ergibt sich automatisch eine natürliche Ordnung des aufgezeichneten Daten-Materials. Jeder von der Messung erfasste Mangel in der Adressdatenbank wird durch seine Häufigkeit und durch eine vorgegebene Menge von Beispielen belegt' und kann nach derThe recorded examples can be arranged on the basis of the video coding sequences triggering them. This automatically results in a natural order of the recorded data material. Each shortcoming in the address database detected by the measurement is evidenced by its frequency and by a given set of examples, and may be determined by the
Postleitzahl und der alphabetischen Ordnung der kodierten Na¬ men geordnet werden. Die für die Wartung der Adressdaten zu¬ ständigen Personen erhalten somit ein wohlgeordnet aufberei¬ tetes Daten-Material, das sie in die Lage versetzt, die feh- lenden oder falschen Einträge schnell zu erkennen und zu er¬ gänzen.Postal code and the alphabetical order of the coded Na¬ men are ordered. The persons responsible for the maintenance of the address data thus receive a well-organized data material, which enables them to quickly recognize and supplement the missing or incorrect entries.
Diese Sachverhalte werden nun an zwei konkreten Fällen erläu¬ tert.These facts are now explained in two concrete cases.
Fall 1:Case 1:
Angenommen, die Aufgabe der Videokodierung besteht darin, zu¬ nächst die 5-stellige Postleitzahl und dann die ersten 3 Buchstaben des Straßennamens anzugeben.Assume that the task of video coding is to first specify the 5-digit postal code and then the first 3 letters of the street name.
Bei der Postleitzahl 78315 mögen in der Adressdatenbank der Eintrag „Rosenstraße" und der Eintrag „Lilienstraße" fehlen. Adressen der ArtFor postal code 78315, the address database may be missing the entry "Rosenstraße" and the entry "Lilienstraße". Addresses of the kind
Herrn X.Y Frau Y.XMr. X.Y Mrs. Y.X
Rosenstr.15 oder Lilienstr.12Rosenstr.15 or Lilienstr.12
78315 Radolfzell 78315 Radolfzell78315 Radolfzell 78315 Radolfzell
die durch die Sequenzenthe through the sequences
78315 ROS bzw. 78315 LIL videokodiert werden, führen dann zu einer Rückweisung des Vi¬ deokodiersystems und damit zu einer Erhöhung der betreffenden Zähler. Bei Überschreitung des unteren Grenzwerts 50 wird zu¬ sätzlich das Bild der Sendung gespeichert. Überschreitet der Zähler den oberen Grenzwert von 53, so wird die Speicherung von Bildern wieder unterdrückt.78315 ROS or 78315 LIL be video-coded, then lead to a rejection of the Vi¬ deokodiersystems and thus to an increase in the relevant counter. If the lower limit 50 is exceeded, the image of the program is additionally stored. If the counter exceeds the upper limit of 53, the storage of images is again suppressed.
Vertippte Kodiersequenzen z.B. 78315 RLS oder RPS werden auch gezählt, treten jedoch in dieser Form nicht gehäuft auf, so- dass der Grenzwert nicht überschritten wird und eine Speiche- rung des Bildes unterbleibt. Ähnliches gilt für die Sequenz 78315 RAS, die sich aus dem Schreibfehler „Rasenstr" ergibtTyped coding sequences e.g. 78315 RLS or RPS are also counted, but they do not accumulate in this form, so that the limit is not exceeded and memory is not stored. The same applies to the sequence 78315 RAS, which results from the spelling error "Rasenstr"
Nach einer bestimmten Zeit ergibt sich dann beispielhaft die folgende Belegung der Liste der Rückweisungen für die Post- leitzahl 78315:After a certain period of time, the following is an example of the list of rejections for the postal code 78315:
Liste 1:List 1:
Videocodier-Sequeπz Zähler Dateinamen der aufgezeichneten BilderVideocoder-Sequeπz Counter Filenames of recorded images
LBL 21LBL 21
LCL 14LCL 14
LIL 140 LIL_51.jpg, Lll__52.jpg, LIL_53.jpgLIL 140 LIL_51.jpg , Lll__52.jpg , LIL_53.jpg
LKL 11 - LPL 15LKL 11 - LPL 15
RAS 15RAS 15
RLS 23RLS 23
ROS 280 ROS_51.jpg, ROS_52.jpg, ROS_53.JPG RPS 14ROS 280 ROS_51.jpg, ROS_52.jpg, ROS_53.JPG RPS 14
RQS 13-RQS 13-
Für die den unteren Grenzwert klar überschreitenden Kodierse- quenzen LIL und ROS wurden die Bilder von jeweils 3 Bei¬ spielSendungen aufgezeichnet, aus denen dann die in der Ad- ressdatenbank fehlenden Adressen ermittelt und in diese ein¬ getragen wurden.For the coding sequences LIL and ROS, which clearly exceeded the lower limit, the images of each 3 exemplary broadcasts were recorded, from which then the images in the ad- database were found missing addresses and in this ein¬ worn.
Die graphische Darstellung der Belegung von Liste 1 zeigt den in FIG 2 gezeigten Verlauf.The graphical representation of the assignment of List 1 shows the course shown in FIG.
Das Verfahren eignet sich zur Ermittlung aller in Adressen enthaltener, jedoch in der Adressdatenbank fehlender oder falscher Informationen, sofern diese Informationen auch Ge- genstand der Videokodierung sind, z. B. -The method is suitable for determining all information contained in addresses but missing or incorrect information in the address database, provided that this information is also the subject of video coding, eg. B. -
• Postleitzahlen• Postal Codes
• Ortsnamen• Place names
• Straßennamen • Hausnummern• street names • house numbers
• Postfachnummern• PO box numbers
• Empfängernamen• recipient name
Fall 2:Case 2:
Angenommen, die Aufgabe bei der Videocodierung besteht aus der Eingabe der Postleitzahl, der ersten 3 Buchstaben des Straßennamens und der Hausnummer. Im Adresswörterbuch sei zwar die „Rosenstraße" enthalten, jedoch nur mit den Num- mern 1-13, die Nummern 15-19 fehlen.Suppose the video coding task consists of entering the postcode, the first 3 letters of the street name and the house number. The address dictionary contains the "Rosenstraße", but only with the numbers 1-13, the numbers 15-19 are missing.
Dann ergibt sich die folgende Listenbelegung:Then the following list assignment results:
Liste 2: Videocodier-Sequenz Zähler Dateinamen der aufgezeichneten BilderList 2: Video Coding Sequence Counter Filenames of recorded images
RBS11 15RBS11 15
RLS13 13RLS13 13
ROS 15 105 ROS15_51.jpg, ROS15_52.jpg, ROS15_53 ROS 17 132 ROS17_51.jpg, ROS17_52.jpg, ROS17_53ROS 15 105 ROS15_51.jpg, ROS15_52.jpg, ROS15_53 ROS 17 132 ROS17_51.jpg, ROS17_52.jpg, ROS17_53
ROS19 240 ROS19_51.jpg, ROS19_52.jpg, ROS19_53ROS19 240 ROS19_51.jpg, ROS19_52.jpg, ROS19_53
RQS 19 13RQS 19 13
Die fehlenden Hausnummern werden deutlich, während die exis¬ tierenden Hausnummern zu keinem Eintrag in die Rückweisungs- liste führen.The missing house numbers become clear, while the existing house numbers do not lead to an entry in the rejection list.
Das Verfahren ist auch geeignet, in derw Adressdatenbank feh¬ lende, von der Öffentlichkeit jedoch häufig benutzte Alterna- tivschreibweisen von Namen zu ermitteln.The method is also suitable for determining names feh¬ loin in w address database, but frequently used by the public alternatives tivschreibweisen.
Es ist nicht an die Existenz von Postleitzahlen gebunden. Falls es keine Postleitzahlen gibt, dient der Ortsname als Ordnungskriterium.It is not tied to the existence of postcodes. If there are no postal codes, the place name serves as the order criterion.
Das Verfahren kann auch bei der Auswertung von Fehlverteilun¬ gen vorteilhaft eingesetzt werden. Fehlverteilungen werden bei der Feinverteilung und Zustellung der Sendungen erkannt .The method can also be advantageously used in the evaluation of Fehlverteilun¬ gen. Misallocations are recognized during the fine distribution and delivery of the items.
Sie werden dann an das nächste Verteilzentrum zur Neuvertei¬ lung zurückgegeben.They are then returned to the next distribution center for redistribution.
Bei dieser Gelegenheit können die Sendungen beim Lauf in ei- ner Sortieranlage verarbeitet und dabei Bilder und die bishe¬ rigen (falschen) Verteilergebnisse aufgezeichnet werden. Trägt man die Häufigkeit der Fehlverteilungen in Abhängigkeit vom Verteilkode auf, so ergibt sich wieder die charakteristi¬ sche Verteilung nach FIG 1.On this occasion, the items can be processed while running in a sorting system and images and the previous (wrong) distribution results can be recorded. If the frequency of the incorrect distributions is plotted as a function of the distribution code, the characteristic distribution according to FIG. 1 results again.
Systematische Fehler, die auf einen Fehler in der Adressda¬ tenbank hindeuten, bilden Häufungspunkte, während die auf Er¬ kennungsfehler und Tippfehler zurückzuführenden Fehlvertei¬ lungen eher gleichmäßig verteilt sind. Durch geeignete Wahl des unteren und oberen Grenzwertes können wiederum Belegex- emplare aufgezeichnet werden, die zu einer gezielten Verbes¬ serung der Adressdatenbank verwendet werden können. Systematic errors which indicate an error in the address database form accumulation points, while the incorrect distributions attributable to identification errors and typing errors are rather uniformly distributed. By appropriate choice of the lower and upper limit value, in turn, Belegex Emplare be recorded, which can be used for a targeted Improvement of the address database.

Claims

Patentansprüche claims
1. Verfahren zum Ermitteln von Fehlern in Adressdatenbanken für Adresslesesysteme von Sendungssortieranlagen mit OCR- Einheiten und VideokodierSystemen, d a d u r c h g e ¬ k e n n z e i c h n e t, dass im Laufe des Lesebetriebes die Videokodiersequenzen der nach dem Videokodieren zu¬ rückgewiesenen Abbilder der die Adressangaben aufweisen¬ den Sendungsoberflächen oder die im Laufe des Sortier- und Verteilbetriebes der im Adresslesesystem gelesenen Sendungen ermittelten Verteilkodes der fehlverteilten Sendungen gespeichert werden und die Zurückweisungen be¬ zogen auf die jeweilige Videokodiersequenz oder die Fehl¬ verteilungen bezogen auf die ermittelten Verteilkodes ge- zählt werden, dass bei Überschreiten einer festgelegten1. A method for determining errors in address databases for address reading systems of mail sorting systems with OCR units and video coding systems, dadurchge ¬ indicates that in the course of the reading operation, the video coding sequences zu¬ after video encoding rejected images of the address information have the transmission surfaces or in the course the sorting and distribution operation of the read in the address reading system readings distribution codes of misdistributed broadcasts are stored and the rejections be¬ attracted to the respective video coding sequence or Fehl¬ distributions based on the determined distribution codes are counted that when a predetermined
Anzahl, die signifikant über einem geeignet gewählten un¬ teren Grenzwert liegt, Abbilder von Zurückweisungen mit den jeweiligen Kodiersequenzen oder die nach der Fehlver¬ teilung beim nochmaligen Verarbeiten der Sendungen in ei- ner Sendungssortieranlage aufgenommenen Abbilder als Ad¬ ressdatenbankfehler gespeichert und anschließend zur Feh¬ lerkorrektur dargestellt werden.Number, which is significantly above a suitably selected lower limit value, images of rejections with the respective coding sequences or the images recorded after misdistribution during reprocessing of the mailings in a mail sorting system are stored as address database errors and subsequently misled correction.
2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n - z e i c h n e t, dass die Darstellung der die Adressda¬ tenbankfehler kennzeichnenden Videokodiersequenzen oder Verteilkodes mit den zugehörenden Abbildern in einer den Adressdatenbankeinträgen entsprechenden Reihenfolge er¬ folgt .2. Method according to claim 1, characterized in that the representation of the video coding sequences or distribution codes characterizing the address database errors follows with the associated images in an order corresponding to the address database entries.
3. Verfahren nach Anspruch 1, d a d u r c h g e k e n n ¬ z e i c h n e t, dass durch Wahl eines oberen Grenzwertes nur eine festgelegte Anzahl von Abbildern für jede Video¬ kodiersequenz oder für jeden Verteilkode eines Adressda- tenbankfehlers aufgezeichnet und dargestellt wird. 3. The method according to claim 1, dadurchgekenn ¬ records that by selecting an upper limit only a set number of images for each video coding sequence or for each distribution code of a Adressda- tenbankfehlers recorded and displayed.
4. Verfahren nach Anspruch 1 oder 3, d a d u r c h g e ¬ k e n n z e i c h n e t, dass die die Aufzeichnung von Abbildern steuernden Grenzwerte dynamisch im Verlauf ei¬ ner Messung angepasst werden. 4. The method according to claim 1 or 3, characterized in that the limit values controlling the recording of images are dynamically adjusted during the course of a measurement.
PCT/EP2005/006132 2004-08-21 2005-06-08 Method for detecting errors in address databases WO2006021247A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004040600A DE102004040600B3 (en) 2004-08-21 2004-08-21 Method for determining errors in address databases
DE102004040600.6 2004-08-21

Publications (1)

Publication Number Publication Date
WO2006021247A1 true WO2006021247A1 (en) 2006-03-02

Family

ID=34969904

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2005/006132 WO2006021247A1 (en) 2004-08-21 2005-06-08 Method for detecting errors in address databases

Country Status (2)

Country Link
DE (1) DE102004040600B3 (en)
WO (1) WO2006021247A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115707A (en) * 1997-02-21 2000-09-05 Nec Corporation Address reading apparatus and recording medium on which a program for an address reading apparatus is recorded
US20010054031A1 (en) * 2000-01-27 2001-12-20 Raymond Lee Address learning system and method for using same
DE10216336A1 (en) * 2002-04-13 2003-11-06 Siemens Ag Process for distributing bulk mail

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60004370T2 (en) * 1999-07-05 2004-07-01 Ptt Post Holdings B.V. METHOD AND DEVICE FOR UPDATING AN ADDRESS DATABASE WITH REGISTERED ADDRESS DATA
US6796433B2 (en) * 2001-11-07 2004-09-28 Pitney Bowes Inc. Method of post processing OCR information obtained from mailpieces using a customer specific keyword database and a mailpiece sorting apparatus
DE10212085A1 (en) * 2002-03-19 2003-10-09 Siemens Ag Method and device for reading the addresses of consignments

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115707A (en) * 1997-02-21 2000-09-05 Nec Corporation Address reading apparatus and recording medium on which a program for an address reading apparatus is recorded
US20010054031A1 (en) * 2000-01-27 2001-12-20 Raymond Lee Address learning system and method for using same
DE10216336A1 (en) * 2002-04-13 2003-11-06 Siemens Ag Process for distributing bulk mail

Also Published As

Publication number Publication date
DE102004040600B3 (en) 2005-12-08

Similar Documents

Publication Publication Date Title
DE19947259C1 (en) Sorting packages involves changing/emptying containers when full, storing packages in same sequence, entering package data in database and re-ordering during subsequent sorting runs
DE4000603C5 (en) Method and device for temporary storage of objects, such as letters or the like in a reading system
EP0980293A1 (en) Mail distribution information recognition method and device
EP1015138B1 (en) Method and device for recognition of delivery data on mail matter
DE19646522A1 (en) Method and device for recognizing distribution information on shipments
DE19836767C1 (en) Processing of items to be returned to sender
DE10010241C1 (en) Shipment addresses reading method
DE60004370T2 (en) METHOD AND DEVICE FOR UPDATING AN ADDRESS DATABASE WITH REGISTERED ADDRESS DATA
EP1758688B1 (en) Method for automatic detection of operational performance data of reading systems
DE60132593T2 (en) METHOD FOR TREATING LARGE POSTS IN A SORTING PLANT
WO2000054898A1 (en) Method and device for sorting letters and packages into delivery route order
EP1534440B1 (en) Method and device for reading the addresses of mailings
DE19933984A1 (en) Method for forming and / or updating dictionaries for automatic address reading
EP2259210A2 (en) Method and device for analysing a database
WO2006021247A1 (en) Method for detecting errors in address databases
DE10212085A1 (en) Method and device for reading the addresses of consignments
DE102007034948A1 (en) Method and device for monitoring the transport of multiple objects
EP1776197B1 (en) Method for sorting non-addressed postal mailings
DE102007031315A1 (en) Method and device for sorting articles according to the delivery order in several passes
EP1916039B1 (en) Method for identifying objects and signature comparison device
DE102008061012A1 (en) Method and apparatus for transporting an item to an incompletely specified destination address
DE10064529C1 (en) Mail address post code reading method has address scanned in parts when full address cannot be clearly read
WO2007048452A1 (en) Method and device for reading addresses of items of mail
EP1229484B1 (en) Method and apparatus for reading parcel addresses with postcodes
DE102006016602B4 (en) Method for identifying a mailing information

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase