DE1774782A1 - Verfahren und Anordnung zur statistischen Fehlerreduzierung in Zeichenerkennungsvorrichtungen - Google Patents

Verfahren und Anordnung zur statistischen Fehlerreduzierung in Zeichenerkennungsvorrichtungen

Info

Publication number
DE1774782A1
DE1774782A1 DE19681774782 DE1774782A DE1774782A1 DE 1774782 A1 DE1774782 A1 DE 1774782A1 DE 19681774782 DE19681774782 DE 19681774782 DE 1774782 A DE1774782 A DE 1774782A DE 1774782 A1 DE1774782 A1 DE 1774782A1
Authority
DE
Germany
Prior art keywords
name
circuit
register
file
names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19681774782
Other languages
English (en)
Other versions
DE1774782B2 (de
DE1774782C3 (de
Inventor
Hennis Robert Baily
Theron Fosdick
Arthur Hamburgen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1774782A1 publication Critical patent/DE1774782A1/de
Publication of DE1774782B2 publication Critical patent/DE1774782B2/de
Application granted granted Critical
Publication of DE1774782C3 publication Critical patent/DE1774782C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

Verfahren und Anordnung zur statistischen Fehlerreduzierung in Z eichenerkennungs vorrichtungen
Die Erfindung betrifft ein Verfahren zur statistischen Fehlerreduzierung in Vorrichtungen zur maschinellen Zeichenerkennung, insbesondere bei der Erkennung von Eigennamen, sowie eine Anordnung zur Durchführung des Verfahrens.
Bei der maschinellen Zeichenerkennung und der nachfolgenden Datenverarbeitung sind einerseits Fehlermöglichkeiten durch verschmutzte oder nur teilweise vorhandene Zeichen gegeben, die von der Erkennungsanordnung falsch gele.sen werden, andererseits können Fehler durch falsche Angaben auf den zu lesenden Aufzeichnungsträgern hervorgerufen werden. Während die zweite Art von Fehlern durch Maßnahmen zur technischen Verbesserung
1 09.88 A/UA 1
die
der Erkennungsanordnung nicht erfaßt werden kann, ist es bekannt, /in Zeichenerkennungsvorrichtungen auftretende erste Art von Fehlern durch zusätzliche diagnostische Messungen zu reduzieren um die Genauigkeit der gesamten Anordnung zu verbessern. Diese Verfahren sind kostspielig und erfordern eine große Anzahl von zusätzlichen Bauteilen, die die Wartungsbedürftigkeit und Reparaturanfälligkeit der Anlage vergrößern.
Bei Verwendung eines festen Wortbestandes, der z. B. in einer Versicherungsgesellschaft durch die Datei, die Namen, Versicherungsnummer, Adresse usw. eines jeden Versicherungsnehmers enthält, dargestellt wird, kann die Fehlerhäufigkeit unabhängig von der Art des Fehlers durch statistische Entscheidungen verringert werden.
Aufgabe der vorliegenden Erfindung ist es, die bei der maschinellen Zeichen- erkennung auftretenden Fehler durch statistische Entscheidungen zu reduzie
ren.
Diese Aufgabe wird dadurch gelöst, daß nach der Zusammenstellung einer Datei klassifizierter, gebräuchlicher Wörter, in der außer den Wörtern ihre Varianten zusammen mit einer, ihre Annehmbarkeit für das Datenverarbeitung s sy stern anzeigenden Markierung gespeichert sind, ein Vergleich des vom Zeichenleser erkannten Wortes seriell mit dem Inhalt der Datei
Docket RO 967 030
109884/U41
und bei Übereinstimmung die Ausgabe des erkannten, nach Maßgabe der in der Datei gespeicherten Markierung geänderten und mit einer Annahmeoder Rückweisungsmarkierung versehenen Wortes in ein Aus gangs spei eher erfolgt.
Durch das erfindungsgemäße Verfahren werden die Fehler nicht durch zusätzliche Erkennung s schaltung en im Zeichenleser korrigiert, sondern es wird ein besonderes Datenverarbeitungssystem kleinerer Art, das zwischen die Zeichenerkennungsvorrichtung und die eigentliche Datenverarbeitung einheit geschaltet ist, benutzt um die Fehlerrate durch statistische Entscheidungen zu reduzieren, die auf der Benutzungshäufigkeit basieren. Jedes der in einem vorgegebenen Wortbestand enthaltenen Wörter wird auf mögliche Variationen untersucht, und diese Variationen werden nach ihrer Annehmbarkeit für die Datenverarbeitungsanlage klassifiziert. Dabei werden nur die gebräuchlicheren Wörter klassifiziert. Durch diese Maßnahme wird die ■
Größe der notwendigen Speicher in vernünftigen Grenzen gehalten. Der Speicherinhalt umfaßt dann ca. 75 bis 80 % aller Wörter, mit denen der Zeichenleser arbeitet. Vom Zeichenleeer erkannte Wörter werden dann mit Wörtern aus diesem Speicher verglichen, um den Grad ihrer Annehmbarkeit zu bestimmen. Die Wörter werden dann zusammen mit der Markierung, die den Grad ihrer Annehmbarkeit anzeigt, in einen Auegangsspeicher eingegeben, aus dem sie zur weiteren Verarbeitung entnommen werden können.
Docket RO 967 030
109884/1U1
Weitere Merkmale der Erfindung sind den Patentansprüchen, Einzelheiten sind der detaillierten Beschreibung sowie den Zeichnungen zu entnehmen. Es zeigt:
Fig. 1 das Blockdiagramm eines Ausführungsbeispieles der Erfin
dung und
Fig. 2a und 2b eine detaillierte Darstellung des in Fig. 1 gezeigten Blockdiagramms. Die Fig. 2a und 2b gehören nach dem Schema in Fig. 2 zusammen.
Nach der Darstellung in Fig. 1 werden gebräuchliche Namen und ihre Varianten in der in der oberen Hälfte der Figur gezeigten Anordnung klassifiziert. Eine Datei 10 gebräuchlicher Namen enthält z. B. 17 000 der häufig- ^ sten Namen, die etwa 80 % der Bevölkerung umfassen. Mit diesen gebräuchlichen Namen ist gleichzeitig die Anzahl der Personen in der Datei gespeichert, die diese Namen führen. Die Datei 12 für Verwechslungspaare enthält solche Verwechslungen, die wahrscheinlich vom Zeichenleser vorgenommen werden und die Wahrscheinlichkeit, mit der die Verwechslung auftritt. So kann z. B. ein kleines "a" für ein kleines "s11 gelesen werden, weil der Zeichenleser aufgrund eines minderwertigen Druckes falsch erkennt. Die Wahrscheinlichkeit für dieses Auftreten betrage 0, 002. Dementsprechend enthält eine Speicherposition in der Datei für Verwechslungspaare ein "a"
10988A/U41
Docket RO 967 030
für ein "s" und dazu die Wahrscheinlichkeit O, 002.
Der Generator 14 für falsche Namen (Fehlernamen) ist an die Datei gebräuchlicher Namen 10 und die Verwechslungspaar-Datei 12 angeschlossen und erzeugt Varianten der gebräuchlichen Namen. Dieser Generator untersucht einen gebräuchlichen Namen aus der Datei 10 auf Zeichen, für die Verwechslungspaare in der Datei 12 stehen. Dann nimmt der Generator 14 denselben Austausch vor, den der Zeichenleser vielleicht gemacht hat und gibt einen falschen Namen (Fehlernamen) aus, der eine Variante des gebräuchlichen Namens ist. Gleichzeitig wird eine statistische Berechnung im Generator angestellt über die Anzahl der vom Zeichenleser aufgrund einer Verwechslung falsch lesbarer Namen. Diese Berechnung basiert auf der Anzahl von Personen, die gebräuchliche Namen haben und der Wahrscheinlichkeit, daß die erfolgte Verwechslung tatsächlich im Zeichenleser erfolgte. Wenn z. B. der gebräuchliche Name "Jonas" mit einer Häufigkeit von 100 000 in der Datei gebräuchlicher Namen 10 und in der Verwechslungspaar-Datei 12 für die Verwechslung "e" für "a" eine Wahrscheinlichkeit von 0, 001 gespeichert ist, dann multipliziert der Rechner 100 000 mit 0, 001 und kommt zu dem Ergebnis 100. Man wird also vom Zeichenleser erwarten, daß er 100 Mal fälschlicherweise den Namen "Jones" liest, wenn er eigentlich Jonas'hätte lesen müssen.
Docket RO ,67 0,0 108884/U41
Der aus dem gebräuchlichen Namen gebildete Fehlername wird dann auf einen Vergleicher 16 geleitet, wo er mit allen für die anfallende Datenverarbeitung tatsächlich vorgesehenen, sogenannten richtigen Namen aus der Datei 18 richtiger Namen verglichen wird. Durch diesen Vergleich soll ermittelt werden, ob der erzeugte Fehlername als richtiger Name existiert. Die Datei 18 richtiger Namen enthält zu jedem Namen die Anzahl der Personen, die diesen Namen trägt. Wenn der Fehlername tatsächlich existiert, schaltet der Vergleicher 16 den Verhältnisrechner 20 ein.
Der Verhältnisrechner 20 soll das Verhältnis bestimmen zwischen der Anzahl der Personen, die tatsächlich den Namen tragen und der Anzahl der Vorgänge, in denen dieser Name als Variation eines gebräuchlichen Namens erzeugt wurde. Die Anzahl von Personen mit richtigem Namen (N ) erhält der Rechner aus der Datei 18, während er die Anzahl von Namen, die wahrscheinlich aus einem gebräuchlichen Namen falsch erzeugt werden (N„) aus dem Rechnerteil des Generators 14 stammt. Der Verhältnisrechner dividiert dann die Zahl der Fehlernamen (N_) durch die Anzahl der Leute, die tatsächlich den Namen (N ) tragen.
In dem oben erwähnten Beispiel, in welchem der Name "Jones" aus dem Namen "Jonas" erzeugt wurde, stellt der Vergleicher 16 fest, daß der Fehlername "Jones" tatsächlich als richtiger Name existiert und in der Datei
Docket RO 967 030 1Q9884/U41
richtiger Namen gespeichert ist. Diesen richtigen Namen "Jones" tragen z. B. zwei Personen. Der Vergleicher 16 gibt dann ein Signal an der Verhältnisrechner 20, damit dieser das Verhältnis zwischen N und N berechnet. In diesem Fall ist N = 2 und N - 100 (100 000 "Jonas" multipliziert mit der Wahrscheinlichkeit von 0, 001 für den fehlerhaften Austausch "e" für "a"). Somit ist das Verhältnis NT /Ν- = 0, 02.
Lf Xj
Dieses Verhältnis wird dann auf eine Auswahlschaltung 22 gegeben, die die gebräuchlichen Namen und ihre Varianten entsprechend Annahme, Änderung oder Rückweisung einteilt. Die Auswahlgruppe "Änderung", bei der der Fehlername auf einen gebräuchlichen Namen geändert wird, ist außerdem unterteilt in die Untergruppen "Änderung und Rückweisung" und "Änderung und Annahme". Um die Einteilung vornehmen zu können, empfängt die Auswahlschaltung 22 das Verhältnis N /N und eine Anzeige vom Generator 14, ob
Li
ein Fehlername empfangen wurde oder nicht, sowie eine Anzeige vom Ver- λ
gleicher 16, ob für den Fehlernamen ein richtiger Name vorliegt oder nicht. Die Unterteilungen können folgendermaßen gruppiert sein:
1. Gebräuchlicher Name wird mit Annahmemarkierung versehen - wenn kein Fehlername vorliegt oder das Verhältnis N /N größer oder gleich 20 ist.
Li XLt
2. Fehlername wird in gebräuchlichen geändert und mit Annahmemarkierung
Docket RO 967 /)30
109884/1U1
versehen - wenn für Fehlernamen ein entsprechender richtiger Name vorliegt und das Verhältnis N /N kleiner oder gleich 0, 05 ist.
Ij SLt
3. Fehlername wird in gebräuchlichen geändert und mit Rückweisungsmarkierung versehen - wenn der Fehlername einem richtigen Namen entspricht und wenn das Verhältnis N /N zwischen 0, 05 und 1 liegt oder
Xj SLi
gleich 1 ist.
4. Gebräuchlicher Name wird mit Rückweisungsmarkierung versehen, wenn das Verhältnis N /N zwischen 1 und 20 liegt.
Xj E
Die Schwellenwerte für die Gruppierung der Namen sind Erfahrungswerte, es ist vorteilhaft, sie nach wirtschaftlichen Überlegungen festzusetzen.
Die Signale von der in Fig. 1 dargestellten Auswahlschaltung 22 werden auf die Datei 24 klassifizierter Namen geleitet. Die Datei 24 empfängt außerdem den wöc gebräuchlichen Namen von der Datei 10 und den Fehlernamen vom Generator 14. Diese Namen und die von der Auswahlschaltung vorgenommene Markierung gestatten der Datei 24 für klassifizierte Namen den als gebräuchlichen Namen markierten Namen als Annahme oder Rückweisung zu speichern oder den Fehlernamen als auf einen gewöhnlichen Namen geändert und als Annahme oder Rückweisung z^u speichern. Diese
Decket RO 967 030 1O9884/1U1
Information wird dann in die Datei 26 für klassifizierte gebräuchliche Namen eingegeben. Die beschriebene Anordnung arbeitet weiter, bis alle gebräuchlichen Namen der Datei 10 geordnet sind. Am Ende der Verarbeitung enthält somit die Datei 26 für klassifizierte gebräuchliche Namen alle gebräuchlichen Namen und alle Varianten der gebräuchlichen Namen. Diese gebräuchlichen Namen und die Fehlernamen sind in die vier oben angegebenen Gruppen unterteilt. Namen vom Zeichenleser können dann mit den Namen in der Datei 26 verglichen werden, um festzustellen, ob der vom Zeichenleser empfangene Name als Annahme oder Rückweisung markiert oder ob er geändert und dann als Annahme oder Rückweisung markiert werden muß.
Der Name vom Zeichenleser wird vorübergehend im Zwischenspeicher 28 gespeichert. Ein Vergleicher 30 vergleicht den Namen im Zwischenspeicher 28 mit allen Namen in der Datei 26. Wenn in der Datei 26 ein entsprechender Name steht, gibt der Vergleicher 30 ein Signal auf den ersten Namenwähler 32 und den zweiten Namenwähler 34. Diese beiden Wähler sind außerdem mit der Datei 26 verbunden, so daß sie eine Anzeige empfangen, ob dieser Name auf einen statistisch gebräuchlicheren Namen zu ändern ist oder nicht.
Der er:ite Namen wähler 32 stellt fest, daß der Name nicht geändert werden braucht und leitet ihn in den Speicher 36 korrigierter Namen. Außerdem gibt der erste Namenwähler 32 die mit dem Namen in der Datei 26 verbundene
Doc ld· t RC) 967 030
109884/1441
Annahme- oder Rückweisungsmarkierung an den Speicher 36 weiter.
Der zweite Namenwähler 34 stellt fest, ob der dem Eingangsnamen entsprechende klassifizierte Name mit einer Änderungsmarkierung versehen ist. Ist das der Fall, leitet der zweite Namenwähler 34 den zweiten oder nächsten in der Datei 26 für klassifizierte gebräuchliche Namen gespeicherten Namen weiter. Dieser Änderungsname enthält eine Annahme- oder Rückweisungsmarkierung, die ebenfalls in den Speicher 36 für korrigierte Namen weitergeleitet wird.
Wenn der Vergleicher 30 keine Übereinstimmung zwischen dem Eingangsnamen und einem Namen in der Datei 26 für klassifizierte gebräuchliche Namen feststellt, wird eine zweite Vergleichsreihe mit ungewöhnlichen Namen durchgeführt. Dieser Vergleich beginnt, wenn die Datei 38 für ungebräuchliche Namen ein die Nichtübereinstimmung anzeigendes Signal aus dem Vergleicher 30 empfängt und ein Datei-Ende-Signal von der Datei 26 für klassifizierte, gebräuchliche Namen eintrifft. Die Datei 38 ungebräuchlicher Namen leitet dann Namen auf den Vergleicher 30, damit dieser feststelLen kann, ob eine Übereinstimmung mit dem Eingangsnamen vorliegt. Außerdem schalten das Signal für Nichtübereinstimmung und das Datei-Ende-Signal von der Datei 26 die Auswahlschaltung 40 ein, die dann den Eingabenamen direkt auf den Speicher für korrigierte Namen 36 leitet. Die Su-he
Docket RO 967 0 30
109884/1441 BAD ORIGINAL
läuft dann weiter in der Datei 38 für ungebräuchliche Namen bis zum Ende dieser Datei und die Auswahlschaltung 40 kennzeichnet den Eingabenamen mit einer Rückweisungsmarkierung, wenn keine Übereinstimmung durch den Vergleicher 30 festgestellt wurde. Wurde eine Übereinstimmung festgestellt, versieht die Auswahlschaltung 40 den Eingabenamen mit einer Annahmemarkierung und leitet ihn in die Datei für korrigierte Namen 36.
Im folgenden Abschnitt wird die obige Darstellung zusammengefaßt.
Nach Einordnung der Namen in die Datei 26 für klassifizierte gebräuchliche Namen können Eingabenamen mit diesen gespeicherten Namen verglichen werden. Der Vergleich gestattet einer Schaltung zu bestimmen, ob die Eingabenamen mit Annahme oder Rückweisung markiert werden sollen und ob sie auf einen anderen Namen geändert und dann mit Annahme oder Rückweisung markiert werden sollen. Wenn der Eingabename in der Datei 26 & nicht vorhanden ist, erfolgt ein Vergleich auf einer zweiten Ebene. Bei diesem Vergleich mit ungewöhnlichen Namen wird der Eingabename nur mit dem Vermerk "Annahme" oder "Rückweisung" versehen und es wird nicht versucht ihn auf einen vom statistischen Standpunkt gebräuchlicheren Namen zu ändern.
Der Zweck der Gruppe "Namen auf gebräuchlicheren Namen ändern und An-
BAD
Docket RO 967 030 0^
109884/1U1
nähme" wurde bereits besprochen. Der Zweck der Gruppe "Namen auf gebräuchlicheren Namen ändern und Rückweisung" ist folgender: Hierdurch soll die beste Vorechlagemöglichkeit des Zeichenlesesystems verbessert werden, ohne daß man so viel Vertrauen in diesen besten Vor schlag hat, daß dem Datenverarbeitung β system dieser Vorschlag zur Annahme empfohlen wird. Dadurch kann das Bedienungspersonal die besten Namens vor schlage schneller verarbeiten, als wenn sie nur zurückgewiesen würden. Angenommen werden solche Namen, die keine fehlerhaften Varianten aufweisen, oder bei denen die Anzahl der fehlerhaften Varianten im Vergleich zur tatsächlichen Anzahl von richtigen gebräuchlichen Namen so idein ist, daß die fehlerhaften Varianten ignoriert werden können. Die Rückweieung kommt in Frage, wenn der Eingabename vom Zeichenleser weder in der Datei 26 für klassifizierte gebräuchliche Namen noch in der Datei 38 für ungebräuchliche Namen gefunden werden konnte, d. h. der Eingabename ist falsch gelesen worden und existiert in Wirklichkeit nicht in dieser Form.
Die zur Ausführung des in Fig. 1 gezeigten Beispieles benötigten Bauteile sind in den Fig. 2a und 2b gezeigt. Die Fig. 2a stellt das .Qerät zur Erzeugung der Datei 26 für klassifizierte gebräuchliche Namen, während die Fig. 2b das Gerät zur Einordnung der Eingabenamen vom Zeichenleeer entsprechend der Klassifizierung in der Datei 26 enthält.
Docket RO 967 030
109884/1441 bad original
Die Datei 10 gebräuchlicher Namen in Fig. 1 besteht aus dem Speicher 50 und der Adress-Steuerung 52 in Fig. 2a. Der Speicher 50 kann z. B. ein Kern-, Platten- oder ein Magnettrommelspeicher sein. Die Adress-Steuerung 52 besteht aus den normalen Adress-Steuerschaltungen für Speicher und einem Zähler zum Weiterschalten der Adresse.
Die Datei 12 für Verwechslungspaare in Fig. 1 besteht aus dem Speicher 54 ™
und der Adress-Steuerung 56 rechts oben in Fig. 2a. Die Adress-Steuerung 56 und der Speicher 54 sind ähnlich aufgebaut wie der Speicher 50 und die Adress-Steuerung 52. Um die Klassifizierung der gebräuchlichen Namen einzuleiten, wird ein Startsignal auf die beiden Adress-Steuerungen 52 und 56 gegeben. Die beiden Adress-Steuerungen bewirken, daß der erste gebräuchliche Name ins Register 58 und das erste Verwechslungspaar ins Register 60 gesetzt werden. Die Anzahl von Personen N mit einem gebräuchlichen Namen wird zusammen mit jedem Namen im Speicher 50 gespeichert. Die M
Größe von N_ wird mit dem zugehörigen Namen auf das Register 58 gegeben. Das die Adress-Steuerungen 52 und 56 einschaltende Startsignal wird außerdem über eine Oder-Schaltung 64 und eine Verzögerungsschaltung 66 auf eine bistabile Kippschaltung 62 geleitet. Die Verzögerungsschaltung 66 soll das Laden der Register 58 und 60 ermöglichen, bevor die bistabile Kippschaltung 62 durch den Startimpuls eingeschaltet wird. Wenn die Kippschaltung 62 eingeschaltet wird, werden auch die Und-Schaltung en 68, 70 und 72 in den
Docket RO 967 030
109884/1441
leitenden Zustand gesetzt. Die Und-Schaltung 70 empfängt ein weiteres Eingangssignal vom Gleich-Ausgang der Vergleicherschaltung 74, während die Und-Schaltung 72 ein zweites Eingangssignal vom Ungleich-Ausgang des Vergleichers 74 empfängt.
Der Vergleicher 74 vergleicht die Zeichen von dem in das Register 58 geladenen Namen mit einem Zeichen im Register 60, d. h. er untersucht, ob irgendwelche Zeichen des im Register 58 gespeicherten Namens ein Teil des Verwechslungspaares sind. Die Verwechslungspaare durchlaufen das Register 60, nachdem das erste Zeichen eines jeden Verwechslungspaares mit jedem Zeichen des im Register 58 gespeicherten Namens verglichen wurde.
Der serielle Vergleich der Zeichen aus dem Verwechelungspaar im Register 60 mit den Zeichen im Namen erfolgt über den Schalter 76. Der elektronisch gesteuerte Schalter 76 beginnt beim ersten Zeichen izn Namen uhd wird auf die anderen Zeichen dieses Namens durch einen Impuls weitergeschaltet, der das Schieberegister 78 weite rs ehaltet. Am Anfang enthält das Schieberegister 78 eine Einschaltbedingung in seiner ersten Stufe. Dadurch leitet die' erste Position des Schalters 76 das erste Zeichen des Namens aus dem· Re-> gister 58 auf den Vergleicher 74, der es mit dem Zeichen des Verwechslungspaares in Register 60 vergleicht. Wenn keine Übereinstimmung festgestellt wird, läuft ein Impuls vom Vergleicher 74 über die Und-Schaltung 72
Docket RO 967 030
109884/1441
und die O der-Schaltung 80 zurück zum Schieberegister 78, wodurch die Einschaltbedingung in diesem Schieberegister um eine Position verschoben wird. Die zweite Position im Schieberegister läßt dann die zweite Position des Schalters 76 das zweite Zeichen aus dem Register 58 auf den Vergleicher 74 leiten, damit es mit dem Zeichen aus dem Register 60 verglichen wird. Solange keine Übereinstimmung zwischen Zeichen aus dem Namen und dem Zeichen im Register 60 festgestellt werden, wird der Schalter 76 über den ™
ganzen im Register 58 gespeicherten Namen durchgeschaltet. Wenn der Schalter schließlich hinter dem Ende des Namens auf eine Leerstelle stößt, wird diese Bedingung durch den Leerzeichendetektor 82 abgefühlt, der die Zeichensignale über eine Und-Schaltung 68 empfangt.
Der Leerzeichendetektor 82 erzeugt bei Erkennung eines Leerzeichens einen Impuls, der auf die Adress-Steuerung 56 gegeben wird, die dann die auf den Verwechslungepaar-Speicher 54 gegebene Adresse um eine Position weiter- Λ
β ehaltet. Außerdem stellt der Impuls vom Leerzeichendetektor das Register 60 und über die Oder-Schaltung 94 die bi stabile Kippschaltung 62 zurück. Durch die Rückstellung dieser Kippschaltung sind die Und-Schaltungen 68, 70 und 72 nicht mehr eingeschaltet, wahrend ein neues Verwechslungspaar mit der zugehörigen Wahrscheinlichkeit in das Register 60 geladen wird. Der Impuls vom Leerzeichendetektor 82 wird außerdem über eine Oder-Schaltung 64 und die Verzögerungsschaltung 66 geleitet und schaltet die bistabile Kippschaltung
Docket RO 967 030
109884/U41
62 wieder ein. Die Verzögerung 66 ermöglicht das Laden des Registers 60 mit einem neuen Verwechslungspaar, bevor die Kippschaltung 62 wieder eingeschaltet wird.
Wenn ein neues Verwechslungspaar im Register 60 steht, kann der Vergleicher 74 wieder nach einem Zeichen in dem im Register 58-gespeicherten Namen suchen, das einem Zeichen im Verwechslungspaar entspricht. Das Schieberegister 78 wurde zu Beginn des neuen Vergleiches durch denselben Impuls vom Leerzeichendetektor 82 zurückgeschaltet, der die Adressierung des Verwechslungspaar-Speichers 54 weiterschaltete. Dieser Impuls vom Leerzeichendetektor läuft über die Oder-Schaltung 86 und schaltet das Schieberegister auf eine Einschaltbedingung nur in der ersten Position zurück.
Wenn der Vergleicher 74 eine Übereinstimmung zwischen einem Namenszeichen vom Register 58 und einem Zeichen aus dem Register 60 entdeckt, muß ein Fehlername erzeugt werden. Zu diesem Zweck wird der im Register 58 gespeicherte Name ebenfalls vom Speicher 50 auf das Register 88 geleitet. Das Register 88 empfängt nur den Namen vom gebräuchlichen Namensspeicher und nicht die Größe N_.
Das Register 88 ist mit einem Schalter 90 verbunden, der durch das Schieberegister 78 ebenso gesteuert wird wie der Schalter 76. Der Schalter 90 stellt
Docket RO 967 030
109884/1U1
die Verbindungen von der Und-Schaltung 92 zu den Zeichen in dem im Register 88 gespeicherten Namen her. Die Und-Schaltung 92 wird durch ein Signal vom Gleich-Ausgang des Vergleichers 74 eingeschaltet, das auch über die Und-Schaltung 70, die bereits während des Vergleichs eingeschaltet wurde, auf die Und-Schaltung 92 geleitet wurde. Wenn Gleichheit vorliegt, leitet die eingeschaltete Und-Schaltung 92 das für das Namenszeichen einzusetzende Zeichen aus dem Register 60 über den Schalter 90 in die enteprechende Stelle im Namen im Register 88. Der Schalter 90 wird zur selben Zeit weitergeschaltet wie der Schalter 76, so daß eine Zeichenübereinstimmung im Namen im Register 58, wie sie vom Vergleicher 74 erkannt wurde, dazu führt, daß ein Ersatzzeichen in den Namen im Register 88 an die entsprechende Stelle gesetzt wird. Der Name im Register 88 wird ein Fehlername, wenn der Vergleicher 74 die Übereinstimmung zwischen einem Zeichen eines Verwechslungspaares und einem Zeichen in dem im Register 58 gespeicherten Namen feststellt.
Der statistische Rechner im Fehlernamen-Generator 14 (Fig. 1) besteht aus den Und-Schaltungen 94 und 96 sowie dem Multiplikator 98 in Fig. 2a. Wenn Übereinstimmung durch den Vergleicher 74 festgestellt wird, schaltet die Und-Schaltung 70 die Und-Schaltungen 94 und 96 ein. Die Und-Schaltung 94 leitet dann den Betrag, der die Wahrscheinlichkeit des Auftretens des Verwechslungspaares angibt auf den Multiplikator 98, während die Und-Schal-
Docket RO 967 030
109884/U41
tune 96 die Zahl N - die Anzahl der Leute mit diesem Namen - auf den Multiplikator 98 leitet. Der Multiplikator liefert das Produkt dieser beiden Zahlen und leitet es auf das Register 88. Dieses, Produkt ist die Größe N und gibt an, wie oft der Fehlername aus dem gebräuchlichen Namen erzeugt werden wird.
Der in Fig. 1 dargestellte Vergleicher 16 ist an der linken Seite der Fig. 2a genauer dargestellt. Die Datei richtiger Namen 18 in Fig. 1 besteht aus einem Speicher 100 und der Adress-Steuerung 102, die ebenfalls auf der linken Seite der Fig. 2a dargestellt sind. Der Speicher 100 und die Adress-Steuerung 102 arbeiten prinzipiell genauso wie die Speicher 50 bzw. 54 und die Adress-Steuerungen 52 bzw. 56.
Der in Fig. 2a gezeigte Vergleicher 104 empfängt den Fehlernamen vom Register 88 und einen richtigen Namen vom Register 106. Das Register 106 wird mit dem richtigen Namen aus dem Speicher 100 geladen, wenn die Adress-Steuerung 102 durch ein Signal der bistabilen Kippschaltung 108 eingeschaltet wird. Die bistabile Kippschaltung 108 ist nur eingeschaltet, wenn der Vergleicher 74 im Generator 14 eine Übereinstimmung festgestellt und die Erzeugung eines Fehler namens verursacht hat. Dieser auf die Adress-Steuerung 102 gegebene Impuls schaltet über die Oder-Schaltung 120 und die Verzögerungsleitung 112 außerdem die bistabile Kippschaltung 110 ein.
Docket RO 967 030
109884/U41
Die Verzögerungsleitung 112 ermöglicht das Laden des ersten richtigen Namens aus dem Speicher 100 in das Register 106. Wenn die bistabile Kipp schaltung 110 eingeschaltet ist, können die Ausgangssignale vom Vergleicher 104 über die Und-Schaltungen 114 und 116 überwacht werden.
Wenn keine Übereinstimmung zwischen dem richtigen Namen im Register 106 und dem Fehlernamen im Register 88 besteht, wird vom Vergleicher ein Impuls über die Und-Schaltung 114 zur Oder-Schaltung 118 und zur Adress-Steuerung 102 gegeben. Dieser Impuls schaltet das Register 106 zurück und die Adress-Steuerung 102 weiter, so daß ein neuer richtiger Name auf das Register 106 gegeben wird. Das Ungleich-Signal vom Vergleicher 104 wird ebenfalls über die Oder-Schaltung 118 auf die bistabile Kippschaltung 110 gegeben und schaltet diese zurück. Bei dieser Stellung der Kippschaltung sind die Und-Schaltungen 114 und 116 nicht länger eingeschaltet, während der neue richtige Name auf das Register 106 geleitet wird. Der Impuls von der Und-Schaltung 114 wird ebenfalls über die Oder-Schaltung 120 und eine Verzöge rungs schaltung 112 zur erneuten Rückschaltung der Kippschaltung 110 geleitet. Durch die Verzögerung kann der nächste richtige Name in das Register 106 geladen werden, bevor die Und-Schaltungen 114 und 116 wieder eingeschaltet werden.
Dieser Vorgang läuft weiter, bis der Vergleicher 104 eine Übereinstimmung Docket RO 967 030
zwischen einem Fehlernamen im Register 88 und einem richtigen Namen im Register 106 feststellt oder bis das Ende der Datei richtiger Namen im Speicher 100 erreicht ist. In letzterem Fall läuft das Speicher-Ende-Signal von der Adre es-Steuerung 102 über eine Und-Schaltung 122 und eine Oder-Schaltung 124 und schaltet die Und-Schaltung 126 ein. Wenn die Und-Schaltung 126 eingeschaltet ist, leitet sie einen Fehlernatnen vom Register 88 über die Oder-Schaltung 128 auf die erste Namensposition im Register 130. Außerdem wird das Ausgangs signal von der Und-Schaltung 122 über eine Oder-Schaltung 132 geleitet und schaltet die Und-Schaltung 134 ein, die dann den gebräuchlichen Namen, von welchem der Fehlername abgeleitet ist, auf die zweite Position im Register 130 leitet. Außerdem marjdert das Ausgangesignal der Oder-Schaltung 132 den ersten Namen im Register 130 als geändert (Position S). Das Ausgangs signal von der Und-Schaltung 122 wird außerdem über eine Oder-Schaltung 136 geleitet und schaltet Position T der zweiten Namensposition im Register 130 auf Annahme. Wenn also ein Fehlername erzeugt wurde, der kein richtiger Name ist, wird dieser FeUername markiert "Andern auf gebräuchlichen Namen" und der gebräuchliche Name wird mit "Annahme" markiert. .
Um diese Information vom Register 130 auf einen Speicher zu geben, wird das Ausgangs signal von der Und-Schaltung 122 auch über eine Oder-Schaltung 138 und eine Verzögerungsleitung 140 geleitet um die Und-Schaltung 142 ein-
Docket RO 967 030
109884/1U1
zuschalten. Die Und-Schaltung 142 leitet dann den Inhalt des Registers 130 auf den in Fig. 2b gezeigten Speicher 144 für klassifizierte gebräuchliche Namen. Durch die Verzögerungsschaltung 140 kann das Register 130 mit Namen und ihren zugehörigen Markierungen geladen werden, bevor die Information auf den Speicher 144 geleitet wird. Das Ausgangs signal von der Oder-Schaltung 138 schaltet ebenfalls das Register 130 zurück, unmittelbar bevor das Register mit den Namen und den Markierungen geladen wird. %
Die Und-Schaltung 122, die das Au8gang8signal erzeugte, das Nichtübereinstimmung und das Ende des Speichers 100 anzeigt, d. h. daß kein richtiger Name für den Fehlernamen vorliegt, wird durch die bistabile Kippschaltung 123 eingeschaltet, die in Ruhestellung steht, bis sie durch ein Ausgangssignal von der Und-Schaltung 116 eingeschaltet wird. Diese hat nur dann ein Ausgangs signal, wenn ein richtiger Name für den Fehlernamen durch den Vergleicher 104 festgestellt wurde. Wenn kein richtiger Name für den Fehler- m namen vorliegt, bleibt die Kippschaltung 123 in Ruhestellung und die Und-Schaltung 122 wird eingeschaltet, wenn das Ende des Speichers 100 erreicht und das entsprechende Signal durch die Adress-Steuerung 102 erzeugt ist.
Wenn der Vergleicher 104 einen richtigen Namen für den Fehlernamen entdeckt, erzeugt die Und-Schaltung 116 ein Ausgangs signal, das die bistabile Kippschaltung 123 einschaltet. Das Ausgangssignal wird axißerdem durch die
Docket RO 967 030
10988A/U41 BA0
Verzögerungsschaltung 146 verzögert und der verzögerte Impuls ear Rückstellung der Adress-Steuerung auf die Anfangsadresse des Speichers 100, sowie zur Rückstellung des Registers 106 benutzt. Die Verzogerungsschaltung 146 ermöglicht ein Arbeiten der Schaltung bevor das Register 106 und die Adress-Steuerung 103 zurückgestellt werden.
Das durch die Schaltstellung der bistabilen Kippschaltung 123 gespeicherte Signal für Übereinstimmung wird dazu verwendet, um die Oder-Schaltung 124 die Und-Schaltung 126 einzuschalten. Die Und-Schaltung 126 leitet dann den Fehlernamen vom Register 88 auf die erste Position des Registers 130. Außerdem wird das in der Schalt stellung der bistabilen Kippschaltung 123 gespeicherte Signal für Übereinstimmung zum Einschalten der Und-Schaltungen 148 und 150 verwendet. Die Und-Schaltung 148 leitet die Größe N zum Teiler 152, während die Und-Schaltung 150 die Anzahl N_ (Anzahl der Personen, die den Fehlernamen als richtigen Namen führen) auf die Rechenschaltung 152 überträgt. Die Rechenschaltung 152 errechnet dann das Verhältnis NT /N_.
Der Ausgangswert der Schaltung 152 wird durch drei Schwellenwertdetektoren überwacht. Der Schwellenwertdetektor 154 hat dann ein Ausgangs signal, wenn das Verhältnis N /Ν— kleiner oder gleich 0, 05 ist, der Sch wellenwert de tek-
Lj E
tor 156 hat ein Ausgangssignal, wenn dieses Verhältnis größer als 0, 5 und Docket RO 967 030 109884/1441 BAD ORIGINAL
kleiner oder gleich 1 ist und der Schwellenwertdetektor 158 hat ein Ausgangssignal, wenn das Verhältnis größer oder gleich 20 ist. Die Ausgangs signale von diesen drei Schwellenwertdetektoren bestimmen, ob die Namen im Register mit einer Änderungsmarkierung und außerdem mit einer Annahme oder Rückweisungsmarkierung zu versehen sind.
Wenn das Verhältnis N /N kleiner oder gleich 0, 5 ist, hat der Detektor ein Ausgangssignal, das über eine Oder-Schaltung 132 läuft und den ersten Namen im Register 130 mit einer Änderungsmarkierung versieht. Das Ausgangssignal von der Oder-Schaltung 132 schaltet außerdem die Und-Schaltung 134 ein, die dann den gebräuchlichen Namen vom Register 58 auf die zweite Position im Register 130 leitet. Außerdem wird das Ausgangs signal vom Detektor 1-4 über eine Oder-Schaltung 136 geleitet und zur Markierung des zweiten Νε etis mit "Annahme" verwendet. Durch das Ausgangs signal des Detektor« ' wird also der Fehlername in Position 1 im Register 130 mit einer ™ Änderung markiert und der gebräuchliche Name in die Position 2 geladen und als annehmbar markiert. Wenn später Namen mit dem Fehlernamen vergliclien werden, wird der Fehlername auf einengebräuchlichen Namen geändert und der gebräuchliche Name angenommen.
Wenn das Verhältnis N_ /N_ größer oder gleich 20 ist, gibt der Detektor 158 ein Ausgangs signal ab, das über eine Oder-Schaltung 160 geleitet wird und
Docket RO %7 030 , Q8884/U41
den in die erste Position des Registers 130 geladenen Namen als annehmbar markiert. In diesem Fall führen mindestens 20 mal mehr Leute den Fehlernamen als richtigen Namen als dieser als Fehler eines gebräuchlichen Namens erscheint. Infolgedessen werden die Fehlernamen als annehmbar und als richtiger Name markiert und als annehmbarer Name in die Datei für klassifizierte gebräuchliche Namen geleitet. Diese Überleitung in den Speicher 144 in Fig. 2b erfolgt, wenn die bistabile Kippschaltung 123 eingeschaltet ist, die über die Oder-Schaltung 138 und die Verzögerungsleitung 140 am Eingang der Und-Schaltung 142 wirksam wird.
Wenn das Verhältnis von N. /N kleiner oder gleich 1 und größer als 0, 05 ist, gibt der Detektor 156 ein Ausgangs signal ab, das über eine Oder-Schaltung 132 geleitet wird und den Fehlernamen in Position 1 des Registers 130 mit einer Änderungsmarkierung versieht. Der gebrludbliche Name wird wieder über die Und-Schaltung 134 auf die Position 2 des Registers 130 geleitet. In diesem Fall jedoch wird der in Position 2 befindliche Name ale nicht annehmbar markiert und somit als Zurückweisung eingeftuft. Dadurch wird der Fehlername in der Kategorie "auf gebräuchlichen Namen lindern" eingestuft und der gebräuchliche Name mit "Rückweisung" markiert. Dies ist also eine Gruppe, in der von der Anordnung ein Vorschlag angegeben, dessen Zuverlässigkeit jedoch sehr gering ist. Damit sind alle Fälle beschrieben, in denen von der Anordnung ein Fehlername aus gebräuchlichen Namen und Verwechslungspaaren erzeugt wird.
Docket RO 967 030 10 98 8 4/1441
Wenn für einen gebräuchlichen Namen kein Fehlername existiert, wird diese Bedingung durch eine Und-Schaltung 162 erkannt, die rechts oben in Fig. 2a dargestellt ist. Die Und-Schaltung 162 ist mit einem Ausgang der bistabilen Kippschaltung 108 verbunden und empfängt ein Spei eher-Ende-Signal von der Adress-Steuerung 56. An diesem Ausgang der bistabilen Kippschaltung 108 tritt solange ein Signal auf, wie der Vergleicher 74 im Fehlernamen-Generator 14 keine Übereinstimmung zwischen dem Zeichen eines Verwechslungspaares und dem Zeichen in einem Namen entdeckt. Die Und-Schaltung 162 leitet das Speicher-Ende-Signal weiter, wenn die Adreas -Steuerung 156 alle Verwechslungspaare im Speicher 54 adressiert hat. Dieses Signal von der Und-Schaltung 162 wird auf die unten in Fig. 2a dargestellte Und-Schaltung 164 geleitet, die dann eingeschaltet wird und den gebräuchlichen Namen vom Register 58 über die Oder-Schaltung 128 in die erste Position des Registers 130 leitet. Außerdem wird das Aus gange signal von der Und-Schaltung 162 über eine Oder-Schaltung 160 geleitet, um den Namen in der ersten Position "
des Registers 130 mit einer Annahmemarkierung zu versehen.
Am Ende des Speichers 54 für die Verwechslungspaare wird der gebräuchliche Name auf das Register 130 übertragen und mit einem Annahmevermerk versehen und dann zum Speicher 144 für klassifizierte gebräuchliche Namen weitergeleitet. Diese Übertragung findet auch dann statt, wenn aus dem gebräuchlichen Namen ein Fehlername abgeleitet worden ist, da die bistabile
Docket RO 967 030 109884/1U1
Kippschaltung 108 zurückgestellt wird, nachdem der Fehlername klassifiziert und in den Speicher 144 (Fig. 2b) tibertragen worden ist. Die Rückstellung der Kippschaltung 108 erfolgt durch das Ausgangs signal der Verzögerung s schaltung 140, die außerdem den Inhalt des Registers 130 in den Speicher 144 leitet. Dieses Ausgangssignal der Verzöge rungs schaltung 140 stellt außerdem die bistabile Kippschaltung 110 zurück, über eine Oder-Schaltung 118 das Register 106, das Register 88, schaltet das Schieberegister 78 über eine Oder-Schaltung 80 und schließlich die Adress-Steuerung 146 (Fig. 2b) weiter.
Durch das Speicher-Ende-Signal der Adress-Steuerung 56 wird außerdem die Adress-Steuerung 52 weitergeschaltet, so daß ein neuer gebräuchlicher Name in das Register 58 geladen wird. Dieses Signal von der Adress-Steuerung 56 wird über eine Verzöge rungs schaltung 166 geleitet, schaltet die Adress-Steue-™ rung 52 weiter und über eine Oder-Schaltung 84 die bistabile Kippschaltung
und das Register 58 zurück. Wie bereits gesagt, bleibt die bistabile Kippschaltung 62 während einer Zeit zurückgestellt, die ausreicht, um den neuen gebräuchlichen Namen in das Register 58 zu laden. Dann schaltet der Impuls, der vorher die Adress-Steuerung 52 schaltete, die bistabile Kippschaltung 62 nach einer Verzögerung wieder ein, die durch die Verzögerungsschaltung 66 bestimmt wird.
RO ,67 030 109eB4/utl
Schließlich sind alle Namen im Speicher 50 für gebräuchliche Namen verarbeitet und zusammen mit ihren wahrscheinlichsten Varianten klassifiziert, das Ende der Verarbeitung wird durch ein Speicher-Ende-Signal aus der Adress-Steuerung 52 gemeldet. Dieses Signal schaltet die bistabile Kippschaltung 62 zurück, die in diesem Zustand bleibt, bis sie ein neues Startsignal empfängt. Das Signal aus der Adrese-Steuerung 52 wird außerdem auf die rechts unten in Fig. 2b gezeigte Oder-Schaltung 168 geleitet, die das Signal zur Rückstellung der Adress-Steuerung 146 auf die Anfangeadresse des Speichers 144 für klassifizierte gebräuchliche Namen weiterleitet. Dieser Speicher 144 wird dann mit allen klassifizierten gebräuchlichen Namen und den Varianten geladen und ist jetzt bereit zur Klassifizierung von Namen, die durch den Zeichenleser gelesen werden.
Die Klassifizierung von durch den Zeichenleser gelesenen Namen wird im Zusammenhang über eine Und-Schaltung 172 auf das in der Mitte der Fig. 2b dargestellte Register 170 geleitet. Die Und-Schaltung wird durch ein Prüfsignal beaufschlagt, das auftritt» wenn ein neuer Name in das Register 170 gebracht werden soll. Dieses Prüfsignal stellt außerdem die gesamte Anordnung durch Rückstellung der bistabilen Kippschaltungen 174 und 176 und des Ausgangsregister 178 zurück. Außerdem wird das Prüfsignal auch über eine Oder-Schaltung 180 und eine Verzögerunge schaltung 182 zum Einschalten auf die bistabile Kippschaltung 184 geleitet. Ein Ausgangs signal dieser Kipp-
Docket RO 967 030
109884/U41
schaltung schaltet dann die Und-Schaltungen 186 und 188 ein, die die Ausgangs signale des Vergleichers 190 überwachen. Die Verzögerungsschaltung 182 gestattet das Laden von Namen aus dem Zeichenleser in due Register 170, bevor die Und-Schaltungen 186 und 188 eingeschaltet werden.
Der Vergleicher 190 vergleicht den im Register 170 gespeicherten Namen ™ vom Zeichenleser mit Namen im Register 192 aus dem Speicher 144. Die
Namen aus dem Speicher 144 werden über eine Und-Schaltung 194 und eine Oder-Schaltung 196 in das Register 192 geladen. Die Und-schaltung 194 ist eingeschaltet, wenn der Name vom Zeichenleser mit Namen im Speicher für gebräuchliche Namen verglichen wird und ist nicht eingeschaltet, wenn der Name vom Zeichenleser mit Namen aus dem Speicher 198 für ungebräuchliche Namen verglichen wird.
h Wenn der Vergleicher 190 keine Übereinstimmung χ wischen dem Namen aus
dem Register 170 und dem Namen aus dem Register 192 feststellt, gibt er ein Auegangesignal über die Und-Schaltung 188 ab. Dieses schaltet die Adress-Steuerung 146 über eine Und-Schaltung 200 und eine Qder-Schaltung 202 ein. Der auf die Adre β β-Steuerung 146 gegebene Impuls wird auch auf die Oder-Schaltung 180 gegeben, die über die Oder-Schaltung 204 ein Auegangssignal hat, das die bistabile Kippschaltung 184 zunächst zurückschaltet und nach einer durch die Verzögerungeeinrichtung 182 hervorgerufenen Verzö-
Docket RO ,67 O3O j
gerung später wieder einschaltet. Diese Ein- und Ausschaltoperation der bistabilen Kippschaltung 184 soll die Und-Schaltungen 186 und 188 ausschalten, während ein neuer gebräuchlicher Name in das Register 192 geladen wird. So wird die Adress-Steuerung 146 jedesmal auf einen neuen Namen weitergeschaltet, wenn der Vergleicher 190 ein Signal für Nichtübereinstimmung über die Und-Schaltung 188 abgibt.
Das Signal für Nichtübereinstimmung vom Vergleicher 190 kann außerdem unter bestimmten Umständen die Adress-Steuerung 146 veranlassen, zwei Adresspositionen weiter zuschalten und somit einen Name,n zu überspringen. Dieses Überspringen soll bewirken, daß beim Auftreten eines einen geänderten ersten Namen darstellenden zweiten Namens die Übereinstimmung des vom Zeichenleser eingegebenen Namens mit dem zweiten Namen dann nicht überprüft wird, wenn schon keine Übereinstimmung mit dem ersten Namen festgestellt wurde. Dies erfolgt durch Weiterleiten der Änderungsmarkierung "
des Namens im Register 192 auf die Und-Schaltung 206, die dann das Signal für Nichtübereinstimmung von der Und-Schaltung 188 über die Oder-Schaltung 208 auf die Adress-Steuerung 146 weitergibt. Durch das Signal von der Oder-Schaltung 208 wird die AdresSf-Steuerung außerdem um eine Adress-Position weitergeschaltet. Wenn somit der Name im Register 192 mit "Änderung" markiert ist und nicht mit dem Namen vom Zeichenleser übereinstimmt, wird ein Fortschaltimpuls über die Oder-Schaltung 204 auf die Adress-Steue-
Docket RO 967 030 109884/1441
rung 146 geleitet und ein zweiter Fortschaltimpuls über die Oder-Schaltung 208, so daß die Adress-Steuerung zwei Positionen weiter springt.
Wenn der Vergleicher 190 eine Übereinstimmung zwischen dem Namen im Register 170 und dem gebräuchlichen Namen im Register 192 feststellt, erreicht ein Signal über die Und-Schaltung 186 die bistabile Kippschaltung 176, die dann die Und-Schaltungen 210 und 212 beaufschlagt. Wenn der Name im Register 192 eine Änderungsmarkierung enthält, führt diese zu einem Ausgangssignal der Und-Schaltung 212. Dieses Signal wird jedoch durch die Inversionsschaltung 214 umgekehrt, so daß die Und-Schaltung 210 dann kein Ausgangs signal abgibt.
Wenn für den übereinstimmenden Namen eine Änderungsmarkierung und somit für die Und-Schaltung 212 ein Ausgangs signal angenommen wird, so wird dieses Signal über die Oder-Schaltung 202 weiter geleitet und schaltet die Adress-Steuerung 146 auf den nächsten Namen, d. h. auf den Namen, auf welchen der Name im Register 192 geändert werden soll. Dieser Name wird dann in das Register 192 geladen. In der Zwischenzeit wird das Ausgangssignal von der Und-Schaltung 212 durch die Verzögerungseinrichtung 216 verzögert und schaltet dann die monostabile Kippschaltung 218 ein, die daraufhin die Und-Schaltung 220 einschaltet. Das andere Eingangssignal für die Und-Schaltung 220 liegt auch vor, da der Name vom Zeichenleser mit
Docket RO 967 030 10988A/U41
Namen aus dem Speicher 144 verglichen wird. Sobald die monostabile Kippschaltung 218 einen Impuls abgibt wird die Und-Schaltung 220 eingeschaltet und leitet den Namen aus dem Register 192 mit seiner Annahme- oder Rückweisungemarkierung über die Oder-Schaltung 222 in das Ausgangsregister 178. Die Verzögerungseinrichtung 216 ist so ausgelegt, daß der Name auf den auf den der Name von Zeichenleser geändert werden soll, im Register 192 steht, wenn die Und-Schaltung 220 eingeschaltet ist.
Wenn der übereinstimmende Name im Register 192 keine Änderungsmarkierung trägt, hat die Und-Schaltung 210 ein Ausgangs signal. Die Und-Schaltung 210 wird durch das Ausgangs signal "Keine Änderung" vom Inverter 214 und die eine Übereinstimmung anzeigende, eingeschaltete, bistabile Kippschaltung 176 angesteuert. Das Ausgangssignal von der Schaltung 210 schaltet die monostabile Kippschaltung 223 ein, die die Und-Schaltung 224 einschaltet und den übereinstimmenden Namen vom Register 192 über die Oder-Schaltung 222 in das Ausgangsregister 178 leitet. Die Annahme- oder Rückweieungsmarkierung des Namens im Register 192 wird ebenfalls in das Aus gangs register 178 übertragen. Die monostabile Kippschaltung 223 hat einen Ausgangsimpuls, dessen Dauer ausreicht, um den Namen vom Register 192 in das Ausgangsregister 178 zu übertragen.
Das Au s gang β signal von den monostabilen Kippschaltungen 218 und 223 wird Docket RO 967 030 m ΛΛ.
ebenfalls auf die Oder-Schaltung 226 gegeben, deren Ausgangs signal durch das Differenzierglied 228 differenziert wird und durch die Gleichrichterschaltung 230 so behandelt wird, daß nur ein Impuls von der Hinterflanke des Ausgangsimpulses der Kippschaltung 218 bzw. der Kippschaltung 223 entsteht. Dieser Impuls wird über eine Oder-Schaltung 168 geleitet und schaltet die Adress-Steuerung 146 auf die Anfangsadresse des Speichers 144 für klassifizierte gebräuchliche Namen zurück. Auf diese Weise ist der Speicher 144 für eine neue Suchoperation bereit, sobald ein neuer Name in das Register 170 gebracht wird.
Zum gleichen Zweck stellt das Signal für Übereinstimmung auch die bistabile Kippschaltung 184 zurück. Dazu wird es von der Und-Schaltung 186 über eine Verzögerungseinrichtung 232 und eine Oder-Schaltung 204 zur Rückstellung auf die bistabile Kippschaltung 184 geleitet. Die Verzögerungsschaltung 232 bewirkt, daß die bistabile Kippschaltung 176 eingeschaltet werden kann, bevor die bistabile Kippschaltung 184 ausgeschaltet wird.
Wenn keine Übereinstimmung des rom Zeichenleser erkannten Namens mit irgendeinem Namen im Speicher 144 für klassifizierte gebräuchliche Namen vorliegt, erzeugt die an der rechten Seite der Fig. 2b dargestellte Und-Schaltung 234 ein Ausgangs signal. Sie wird durch die Rückstellung der bistabilen Kippschaltung 176 eingeschaltet. Die bistabile Kippschaltung 176 wird jeweils
Docket RO 967 030
dann zurückgeschaltet, wenn ein neuer Name in das Register 170 geleitet wird und verbleibt in diesem Zustand, wenn keine Übereinstimmung zwischen dem Eingangsnahmen (vom Zeichenleser) und dem Namen aus dem Speicher 144 vorliegt. Wenn keine Übereinstimmung vorliegt, bis durch die Adress-Steuerung 146 "Speicher-Ende" angezeigt wird, leitet die Und-Schaltung 234 das Speicher-Ende-Signal weiter, wodurch die oben in Fig. 2b gezeigte bistabile Kippschaltung 236 eingeschaltet wird. Wenn diese Schaltung eingeschaltet ist, schaltet die Anordnung vom Vergleich zwischen Eingangsname und klassifizierten, gebräuchlichen Namen (Speicher 144) um auf Vergleich zwischen Eingangsname und ungebräuchlichen Namen (Speicher 198). Diese Umschaltung erfolgt dadurch, daß der Ein-Ausgang der bistabilen Kippschaltung 236 die Und-Schaltung 238 und 240 einschaltet und über den Inverter auch die Und-Schaltungen 194, 220 und 224.
Dieselben Bedingungen (Nicht-Übereinstimmung und "Speicher-Ende" für ■
Speicher 144), durch die die Und-Schaltung 234 ein Signal erzeugte, schalten auch die Und-Schaltung 244 ein, die dann den Eingangsnamen vom Register 170 über die Oder-Schaltung 222 auf das Ausgangsregister 178 überträgt. Jetzt braucht nur noch bestimmt zu werden, ob dieser Eingangsname mit einer Annahme- oder Rückweismarkierung versehen werden muß. Wenn keine Übereinstimmung mit den Namen im Speicher 144 für klassifizierte gebräuchliche Namen erzielt wurde, wird am Ende des Vergleichs mit dem Inhalt
!fecht RO 967 030 109e84/mi
BM> obig«**1-
dieses Speichers der Eingangsname in das Ausgangsregister 178 übertragen. Jetzt braucht nur noch der Eingangsname mit den ungebräuchlichen Namen verglichen zu werden, um festzustellen, ob er mit einer Annahme- oder Rückweisungsmarkierung versehen werden muß.
Zu diesem Zweck vergleicht der Vergleicher 190 den Eingangshamen mit den ungebräuchlichen Namen im Register 192. Die ungebräuchlichen Namen laufen über die Und-Schaltung 238 und die Oder-Schaltung 196 jedesmal in das Register 192, wenn die Adress-Steuerung 246 weiterge β ehaltet wird.
Die Adress-Steuerung 246, eingeschaltet durch ein Signal von der Und-Schaltung 234, leitet den ersten Namen aus dem Speicher 198 für ungebräuchliche Namen in das Register 192. Das Speicher-Ende-Signal (Speicher 144) von der Adress-Steuerung 146 schaltet während dieser Zeit über die Oder-Schaltung 180 und 204 die bistabile Kippschaltung 184 zurück. Das gleiche Signal schaltet nach einer Verzögerung die bistabile Kippschaltung 184 wieder ein, die dann die Und-Schaltungen 186 und 188 wieder einschaltet, welche den Vergleicher 190 überwachen.
Wenn keine Übereinstimmung zwischen dem Eingangsnamen und dem ungebräuchlichen Namen im Register 192 besteht, gibt die Und-Schaltung 188 ein Ausgangs signal ab, das über eine Und-Schaltung 248 läuft und die Adresse
Docket RO 967 030 109e84/mi BADOR1G1NAL
in der Adr ess-Steuerung 246 um eine Position weiterschaltet. Dieses Signal stellt gleichzeitig das Register 192 über die Oder-Schaltung 203 zurück und kurzzeitig auch die bistabile Kippschaltung 184 über die Oder-Schaltungen 180 und 204. Wie oben erklärt, werden dann die Und-Schaltungen 186 und abgeschaltet, während der neue ungebräuchliche Name in das Register 192 geladen wird.
Falls der Vergleicher 190 eine Übereinstimmung zwischen dem Eingangsnamen im Register 170 und dem ungebräuchlichen Namen im Register 192 entdeckt, gibt die Und-Schaltung 186 ein Ausgangs signal ab, das über die Und-Schaltung 240 die bistabile Kippschaltung 174 einschaltet. Die Und-Schaltung 240 wurde durch den Ein-Ausgang der bistabilen Kippschaltung 2 36 eingeschaltet. Somit wird die bistabile Kippschaltung 174 bei Übereinstimmung in den Registern 170 und 192 eingeschaltet. Diese Kippschaltung befindet sich normalerweise in Ruhestellung (Aus-Zustand), die sie zu dem Zeitpunkt einnimmt, " wenn der Eingangsname in das Register 170 geladen wird. Vom Ausgangssignal wird die Und-Schaltung 250 beaufschlagt. Wenn keine Übereinstimmung vorliegt und damit die bistabile Kippschaltung 174 nicht eingeschaltet wird, bleibt die Und-Schaltung 250 eingeschaltet, wenn die Adr ess-Steuerung 246 "Speicher-Ende" für den Speicher 198 für ungebräuchliche Namen anzeigt. Dieses Signal von der Adress-Steuerung 246 läuft über die Und-Schaltung 250 und löst im Ausgangsregister 178 die Anbringung einer Rückweisungemarkierung
ROW-030
aus. Wenn Übereinstimmung vorliegt, ist die Und-Schaltung 250 nicht beaufschlagt, so daß das Speicher-Ende-Signal im Ausgangeregister 178 den vom Register 170 empfangenen Namen mit einer Annahmemarkierung versieht.
Das Speicher-Ende-Signal von der Adress-Steuerung 246 wird außerdem über eine Oder-Schaltung 252 geleitet und schaltet die bistabile Kippschaltung zurück, wodurch die in Fig. 2b gezeigte Anordnung auf Vergleich des Eingangsnamens mit Namen im Speicher 144 für klassifizierte gebräuchliche Namen zurückschaltet. Jetzt ist die Anordnung bereit für die Weiterleitung des nächsten Eingangsnamens auf das Register 170.
Die bistabile Kippschaltung 236 wird auch dann zurückgestellt, wenn der Vergleicher 190 eine Übereinstimmung zwischen dem Eingangenamen und dem ungebräuchlichen Namen im Register 192 entdeckt. Diese Rücketeilung erfolgt über den Ein-Ausgang der bistabilen Kippschaltung 174. Der Ein-Ausgang der Kippschaltung 174 schaltet ebenfalls die Adress-Steuerung 246 auf die Anfangsadresse. Das Ausgangesignal für Übereinstimmung üer Und-Schaltung 186 wird über eine Verzögerungseinrichtung 232 und eine Oder-Schaltung geleitet und schaltet die bistabile Kippschaltung 184 zurück. Die Verzögerungsleitung 2 32 verhindert eine Abschaltung der Und-Schaltung 186 bevor die bistabile Kippschaltung 174 eingeschaltet ist. Die Rückschaltung der bistabilen Kippschaltung 184 bewirkt, daß die Anordnung für den Empfang des
Docket RO 967 030
109884/1U1
nächsten Namens vom Zeichenleeer bereit ist.
Die Arbeitsweise des in Fig. 2b gezeigten Gerätes kann wie folgt zusammengefaßt werden: Ein Eingangsname vom Zeichenleeer wird in As Register 170 geleitet. Der Vergleicher 190 vergleicht den Eingangsnamen zuerst mit den klassifizierten gebräuchlichen Namen. Liegt eine Übereinstimmung vor, wählt der erste Namenwähler 32 den Namen im Register 192 aus, wenn die- ^
ser nicht mit einem Änderungsvermerk versehen ist. Trägt der Name eine Änderungsmarkierung, schaltet der zweite Namenwähler 34 den Speicher 144 für klassifizierte gebräuchliche Namen weiter, so daß dieser den zweiten Namen in das Register 192 leitet und ihn dann ins Ausgangsregister 178 gibt. Die Annahme- oder Rückweisungsmarkierung wird mit dem Namen aus dem Register 192 in das Ausgangsregister 178 übertragen. Wird keine Übereinstimmung zwischen dem Eingangsnamen und einem klassifizierten gebräuchlichen Namen festgestellt, wird der Eingangsname über eine Und-Schaltung g 244 in das Ausgangsregister 178 geleitet. Der Eingangsname wird dann mit Namen aus einem Speicher 198 für ungebräuchliche Namen verglichen, um festzustellen, ob es sich um einen richtigen Namen handelt. Ist der Eingangsname ein richtiger Name, verläßt er das Ausgangsregister 178 mit einer Annahmemarkierung. Handelt es sich nicht um einen richtigen Namen, wird die Und-Schaltung 250 eingeschaltet und der Eingangsname im Ausgangsregister 178 mit einer Rückweisungsmarkierung versehen.
Docket RO 967 030
10988A/UA1

Claims (5)

Patentansprüche
1. Verfahren zur statistischen Fehlerreduzierung in Vorrichtungen zur maschinellen Zeichenerkennung, insbesondere bei der Erkennung von Eigennamen, dadurch gekennzeichnet, daß nach der Zusammenstellung einer Datei (26) klassifizierter, gebräuchlicher Wörter, in der außer den Wörtern ihre Varianten zusammen mit einer ihre Annehmbarkeit für das Datenverarbeitung s system anzeigende Markierung gespeichert sind, ein Vergleich des vom Zeichenleser erkannten Wortes seriell mit dem Inhalt der Datei (26) und bei Übereinstimmung die Ausgabe des erkannten, nach Maßgabe der in der Datei (26) gespeicherten Markierung geänderten und mit einer Annahme- oder Rückweisungsmarkierung versehenen Wortes in ein Ausgangs speicher (36) erfolgt.
2. Verfahren zur statistischen Fehlerreduzierung nach Anspruch 1, dadurch gekennzeichnet, daß zusätzlich eine Datei (38) ungebräuchlicher Wörter zusammengestellt wird, mit deren Inhalt das vom Zeichenleser erkannte Wort dann verglichen wird, wenn Nicht-Übereinstimmung mit dem Inhalt der Datei (26) klassifizierter, gebräuchlicher Wörter festgestellt wurde, und daß die Ausgabe des erkannten Wortes bei Übereinstimmung mit dieser Datei (38) mit einer Annahme-Markierung und bei Nicht-Übereinstimmung mit einer Rückweisungsmarkierung erfolgt.
Docket RO 967 030
109884/1U1
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Bildung der Datei (26) klassifizierter, gebräuchlicher Wörter Varianten gebräuchlicher Wörter durch Vertauschen einzelner Zeichen mit solchen ähnlichen Aussehens (Verwechslungspaare) erzeugt werden, daß jede dieser Varianten mit dem im vorgegebenen Wortbestand enthaltenen richtigen Wörtern verglichen und ihr Auftreten sowie dessen Häufigkeit (N ) bestimmt wird,
daß aus dieser Häufigkeit (N ) und dem Produkt (N ) aus der Wahrscheinlichkeit (P) des Auftretens des Verwechslungspaares und der Häufigkeit (N ) des Auftretens des invariierten gebräuchlichen Wortes ein für diese Variation geltender Quotient (N /N ) gebildet wird, und daß die gebräuchliehen Namen und ihre Varianten eine von dem Wert des Quotienten (N /
N) abhängende Markierung erhalten, die Annahme, Rückweisung und/ oder Änderung des vom Zeichenleser erkannten Namens bestimmen und ebenfalls in der Datei (26) gespeichert wird.
4. Anordnung zur Durchführung des Verfahrens nach den Ansprüchen 1 und 2, dadurch gekennzeichnet, daß zur Aufnahme der Datei (26) klassifizierter, gebräuchlicher Wörter ein erster Speicher (144) und zur Aufnahme der Datei (38) ungebräuchlicher Wörter ein zweiter Speicher (198) angeordnet ist und diese Speicher (144 und 198) über eine Oder-Schaltung (196) mit ,einem ersten Register (192) verbunden sind, daß ein zweites Register (170) zur Aufnahme des von der Zeichenerkennungevorrichtung erkannten
Docket RO 967 030
109884/1U1
Zeichens vorgesehen ist und daß diese Register (192 und 170) mit einer Vergleichsschaltung (190) und einem Ausgangsspeicher (178) in Verbindung stehen.
5. Anordnung zur Durchführung des Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß der Rechner (20 bzw. 152) zur Bestimmung des Quotienten (N /N) mit einer Auswahlschaltung (22) verbunden ist, die aus "drei Schwellenwert schaltung en (154, 156, 158) besteht, deren Eingänge parallel geschaltet sind und deren Ausgänge über ein Register (131) mit dem Speicher (144) der Datei (26) klassifizierter gebräuchlicher Namen zur Übertragung der die Annehmbarkeit der Wörter anzeigenden Markierung verbunden sind.
Docket RO 967 030
109884/1U1
DE19681774782 1967-09-08 1968-09-05 Anordnung zur statistischen Fehlerreduzierung bei Geräten zur maschinellen Zeichenerkennung Expired DE1774782C3 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66640267A 1967-09-08 1967-09-08
US66640267 1967-09-08

Publications (3)

Publication Number Publication Date
DE1774782A1 true DE1774782A1 (de) 1972-01-20
DE1774782B2 DE1774782B2 (de) 1976-10-21
DE1774782C3 DE1774782C3 (de) 1977-06-08

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4324495A1 (de) * 1993-07-21 1995-01-26 Kaufmann Klaus Dieter Verfahren und Anordnung zum Verringern von Schadstoffemissionen

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4324495A1 (de) * 1993-07-21 1995-01-26 Kaufmann Klaus Dieter Verfahren und Anordnung zum Verringern von Schadstoffemissionen
US5529757A (en) * 1993-07-21 1996-06-25 Kaufmann; Klaus-Dieter Apparatus for reducing emissions of pollutants

Also Published As

Publication number Publication date
US3492653A (en) 1970-01-27
GB1236455A (en) 1971-06-23
DE1774782B2 (de) 1976-10-21

Similar Documents

Publication Publication Date Title
DE2946857C2 (de) Wortspeichergerät
DE2541204C3 (de) Einrichtung zur Fehlerkorrektur
DE19547812C2 (de) Lesegerät für Schriftzeichenketten
DE2322538A1 (de) Geraet zum auswerten von pruefungsbogen
DE2740105A1 (de) Optische zeichenerkennungseinrichtung
DE2747196C2 (de) Vergleichseinrichtung zum Vergleichen von Informationen variabler Länge
DE1810810A1 (de) Codeablese- und Steuerungsschaltanordnung
DE1168127B (de) Schaltungsanordnung zum Vergleich von Zahlen
DE1808895A1 (de) Einrichtung zur Zeichenerkennung
DE1524375A1 (de) Verfahren und Einrichtung zur Zeichenerkennung
DE2435889A1 (de) Verfahren und einrichtung zum unterscheiden von zeichengruppen
DE2110604B2 (de) Verfahren und Vorrichtung zur Abgabe von Abfragenachrichten an mehrere adressierbare Stationen
DE2133638C3 (de) Verfahren zum Betrieb eines lernfähigen Systems aus in Kaskade geschalteten, zur nicht linearen Datenverarbeitung geeigneten lernfähigen Datenverarbeitungseinheiten
DE2321701A1 (de) Kartenleser mit mehreren lesekanaelen
DE1198597B (de) Anordnung zur Analyse gedruckter Schriftzeichen
DE3026055C2 (de) Schaltungsanordnung zur maschinellen Zeichererkennung
DE2460757C2 (de) Einrichtung zur Auswahl der richtigen Form eines bei der maschinellen Zeichenerkennung verstümmtelten Wortes
DE1774782A1 (de) Verfahren und Anordnung zur statistischen Fehlerreduzierung in Zeichenerkennungsvorrichtungen
DE2732143A1 (de) Zeichenerkennungsgeraet zum abtasten gedruckter zeichen
DE2333202A1 (de) Zeichenerkennungsanordnung
DE1549719A1 (de) Einrichtung zur Zeichenerkennung
DE1774782C3 (de) Anordnung zur statistischen Fehlerreduzierung bei Geräten zur maschinellen Zeichenerkennung
DE2718569A1 (de) Verfahren und anordnung zum erkennen gedruckter zeichen
DE4030629C2 (de) Anordnung zur Sicherung von mit den Speichereinträgen eines Arbeitsspeichers gekoppelten Steuerinformationen in einem Multiprozessorsystem
DE2428811A1 (de) Verfahren und anordnung zur klassifizierung bei der maschinellen zeichenerkennung

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
E77 Valid patent as to the heymanns-index 1977
8339 Ceased/non-payment of the annual fee