DE1774782A1 - Verfahren und Anordnung zur statistischen Fehlerreduzierung in Zeichenerkennungsvorrichtungen - Google Patents
Verfahren und Anordnung zur statistischen Fehlerreduzierung in ZeichenerkennungsvorrichtungenInfo
- Publication number
- DE1774782A1 DE1774782A1 DE19681774782 DE1774782A DE1774782A1 DE 1774782 A1 DE1774782 A1 DE 1774782A1 DE 19681774782 DE19681774782 DE 19681774782 DE 1774782 A DE1774782 A DE 1774782A DE 1774782 A1 DE1774782 A1 DE 1774782A1
- Authority
- DE
- Germany
- Prior art keywords
- name
- circuit
- register
- file
- names
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
Verfahren und Anordnung zur statistischen Fehlerreduzierung in
Z eichenerkennungs vorrichtungen
Die Erfindung betrifft ein Verfahren zur statistischen Fehlerreduzierung in
Vorrichtungen zur maschinellen Zeichenerkennung, insbesondere bei der Erkennung von Eigennamen, sowie eine Anordnung zur Durchführung des
Verfahrens.
Bei der maschinellen Zeichenerkennung und der nachfolgenden Datenverarbeitung
sind einerseits Fehlermöglichkeiten durch verschmutzte oder nur teilweise vorhandene Zeichen gegeben, die von der Erkennungsanordnung
falsch gele.sen werden, andererseits können Fehler durch falsche Angaben auf den zu lesenden Aufzeichnungsträgern hervorgerufen werden. Während
die zweite Art von Fehlern durch Maßnahmen zur technischen Verbesserung
1 09.88 A/UA 1
die
der Erkennungsanordnung nicht erfaßt werden kann, ist es bekannt, /in Zeichenerkennungsvorrichtungen
auftretende erste Art von Fehlern durch zusätzliche diagnostische Messungen zu reduzieren um die Genauigkeit der gesamten
Anordnung zu verbessern. Diese Verfahren sind kostspielig und erfordern eine große Anzahl von zusätzlichen Bauteilen, die die Wartungsbedürftigkeit
und Reparaturanfälligkeit der Anlage vergrößern.
Bei Verwendung eines festen Wortbestandes, der z. B. in einer Versicherungsgesellschaft
durch die Datei, die Namen, Versicherungsnummer, Adresse usw. eines jeden Versicherungsnehmers enthält, dargestellt wird,
kann die Fehlerhäufigkeit unabhängig von der Art des Fehlers durch statistische Entscheidungen verringert werden.
Aufgabe der vorliegenden Erfindung ist es, die bei der maschinellen Zeichen-
L· erkennung auftretenden Fehler durch statistische Entscheidungen zu reduzie
ren.
Diese Aufgabe wird dadurch gelöst, daß nach der Zusammenstellung einer
Datei klassifizierter, gebräuchlicher Wörter, in der außer den Wörtern ihre Varianten zusammen mit einer, ihre Annehmbarkeit für das Datenverarbeitung
s sy stern anzeigenden Markierung gespeichert sind, ein Vergleich des vom Zeichenleser erkannten Wortes seriell mit dem Inhalt der Datei
Docket RO 967 030
109884/U41
und bei Übereinstimmung die Ausgabe des erkannten, nach Maßgabe der in
der Datei gespeicherten Markierung geänderten und mit einer Annahmeoder Rückweisungsmarkierung versehenen Wortes in ein Aus gangs spei eher
erfolgt.
Durch das erfindungsgemäße Verfahren werden die Fehler nicht durch zusätzliche
Erkennung s schaltung en im Zeichenleser korrigiert, sondern es
wird ein besonderes Datenverarbeitungssystem kleinerer Art, das zwischen die Zeichenerkennungsvorrichtung und die eigentliche Datenverarbeitung einheit
geschaltet ist, benutzt um die Fehlerrate durch statistische Entscheidungen zu reduzieren, die auf der Benutzungshäufigkeit basieren. Jedes der
in einem vorgegebenen Wortbestand enthaltenen Wörter wird auf mögliche Variationen untersucht, und diese Variationen werden nach ihrer Annehmbarkeit
für die Datenverarbeitungsanlage klassifiziert. Dabei werden nur die gebräuchlicheren Wörter klassifiziert. Durch diese Maßnahme wird die ■
Größe der notwendigen Speicher in vernünftigen Grenzen gehalten. Der Speicherinhalt
umfaßt dann ca. 75 bis 80 % aller Wörter, mit denen der Zeichenleser
arbeitet. Vom Zeichenleeer erkannte Wörter werden dann mit Wörtern
aus diesem Speicher verglichen, um den Grad ihrer Annehmbarkeit zu bestimmen. Die Wörter werden dann zusammen mit der Markierung, die den
Grad ihrer Annehmbarkeit anzeigt, in einen Auegangsspeicher eingegeben, aus dem sie zur weiteren Verarbeitung entnommen werden können.
Docket RO 967 030
109884/1U1
Weitere Merkmale der Erfindung sind den Patentansprüchen, Einzelheiten
sind der detaillierten Beschreibung sowie den Zeichnungen zu entnehmen. Es zeigt:
Fig. 1 das Blockdiagramm eines Ausführungsbeispieles der Erfin
dung und
Fig. 2a und 2b eine detaillierte Darstellung des in Fig. 1 gezeigten Blockdiagramms.
Die Fig. 2a und 2b gehören nach dem Schema in Fig. 2 zusammen.
Nach der Darstellung in Fig. 1 werden gebräuchliche Namen und ihre Varianten
in der in der oberen Hälfte der Figur gezeigten Anordnung klassifiziert. Eine Datei 10 gebräuchlicher Namen enthält z. B. 17 000 der häufig-
^ sten Namen, die etwa 80 % der Bevölkerung umfassen. Mit diesen gebräuchlichen
Namen ist gleichzeitig die Anzahl der Personen in der Datei gespeichert, die diese Namen führen. Die Datei 12 für Verwechslungspaare enthält
solche Verwechslungen, die wahrscheinlich vom Zeichenleser vorgenommen
werden und die Wahrscheinlichkeit, mit der die Verwechslung auftritt. So kann z. B. ein kleines "a" für ein kleines "s11 gelesen werden, weil
der Zeichenleser aufgrund eines minderwertigen Druckes falsch erkennt. Die Wahrscheinlichkeit für dieses Auftreten betrage 0, 002. Dementsprechend
enthält eine Speicherposition in der Datei für Verwechslungspaare ein "a"
10988A/U41
Docket RO 967 030
für ein "s" und dazu die Wahrscheinlichkeit O, 002.
Der Generator 14 für falsche Namen (Fehlernamen) ist an die Datei gebräuchlicher
Namen 10 und die Verwechslungspaar-Datei 12 angeschlossen und erzeugt Varianten der gebräuchlichen Namen. Dieser Generator untersucht
einen gebräuchlichen Namen aus der Datei 10 auf Zeichen, für die Verwechslungspaare
in der Datei 12 stehen. Dann nimmt der Generator 14 denselben Austausch vor, den der Zeichenleser vielleicht gemacht hat und gibt einen
falschen Namen (Fehlernamen) aus, der eine Variante des gebräuchlichen Namens ist. Gleichzeitig wird eine statistische Berechnung im Generator
angestellt über die Anzahl der vom Zeichenleser aufgrund einer Verwechslung falsch lesbarer Namen. Diese Berechnung basiert auf der Anzahl von Personen,
die gebräuchliche Namen haben und der Wahrscheinlichkeit, daß die
erfolgte Verwechslung tatsächlich im Zeichenleser erfolgte. Wenn z. B. der gebräuchliche Name "Jonas" mit einer Häufigkeit von 100 000 in der
Datei gebräuchlicher Namen 10 und in der Verwechslungspaar-Datei 12 für die Verwechslung "e" für "a" eine Wahrscheinlichkeit von 0, 001 gespeichert
ist, dann multipliziert der Rechner 100 000 mit 0, 001 und kommt zu dem Ergebnis
100. Man wird also vom Zeichenleser erwarten, daß er 100 Mal fälschlicherweise den Namen "Jones" liest, wenn er eigentlich Jonas'hätte
lesen müssen.
Docket RO ,67 0,0 108884/U41
Der aus dem gebräuchlichen Namen gebildete Fehlername wird dann auf
einen Vergleicher 16 geleitet, wo er mit allen für die anfallende Datenverarbeitung
tatsächlich vorgesehenen, sogenannten richtigen Namen aus der Datei 18 richtiger Namen verglichen wird. Durch diesen Vergleich soll ermittelt
werden, ob der erzeugte Fehlername als richtiger Name existiert. Die Datei 18 richtiger Namen enthält zu jedem Namen die Anzahl der Personen,
die diesen Namen trägt. Wenn der Fehlername tatsächlich existiert, schaltet der Vergleicher 16 den Verhältnisrechner 20 ein.
Der Verhältnisrechner 20 soll das Verhältnis bestimmen zwischen der Anzahl
der Personen, die tatsächlich den Namen tragen und der Anzahl der Vorgänge, in denen dieser Name als Variation eines gebräuchlichen Namens
erzeugt wurde. Die Anzahl von Personen mit richtigem Namen (N ) erhält
der Rechner aus der Datei 18, während er die Anzahl von Namen, die wahrscheinlich
aus einem gebräuchlichen Namen falsch erzeugt werden (N„) aus
dem Rechnerteil des Generators 14 stammt. Der Verhältnisrechner dividiert dann die Zahl der Fehlernamen (N_) durch die Anzahl der Leute, die tatsächlich
den Namen (N ) tragen.
In dem oben erwähnten Beispiel, in welchem der Name "Jones" aus dem
Namen "Jonas" erzeugt wurde, stellt der Vergleicher 16 fest, daß der Fehlername "Jones" tatsächlich als richtiger Name existiert und in der Datei
richtiger Namen gespeichert ist. Diesen richtigen Namen "Jones" tragen z.
B. zwei Personen. Der Vergleicher 16 gibt dann ein Signal an der Verhältnisrechner
20, damit dieser das Verhältnis zwischen N und N berechnet.
In diesem Fall ist N = 2 und N - 100 (100 000 "Jonas" multipliziert mit
der Wahrscheinlichkeit von 0, 001 für den fehlerhaften Austausch "e" für "a").
Somit ist das Verhältnis NT /Ν- = 0, 02.
Lf Xj
Dieses Verhältnis wird dann auf eine Auswahlschaltung 22 gegeben, die die
gebräuchlichen Namen und ihre Varianten entsprechend Annahme, Änderung oder Rückweisung einteilt. Die Auswahlgruppe "Änderung", bei der der Fehlername
auf einen gebräuchlichen Namen geändert wird, ist außerdem unterteilt in die Untergruppen "Änderung und Rückweisung" und "Änderung und
Annahme". Um die Einteilung vornehmen zu können, empfängt die Auswahlschaltung
22 das Verhältnis N /N und eine Anzeige vom Generator 14, ob
Li L·
ein Fehlername empfangen wurde oder nicht, sowie eine Anzeige vom Ver- λ
gleicher 16, ob für den Fehlernamen ein richtiger Name vorliegt oder nicht.
Die Unterteilungen können folgendermaßen gruppiert sein:
1. Gebräuchlicher Name wird mit Annahmemarkierung versehen - wenn kein
Fehlername vorliegt oder das Verhältnis N /N größer oder gleich 20 ist.
Li XLt
2. Fehlername wird in gebräuchlichen geändert und mit Annahmemarkierung
Docket RO 967 /)30
109884/1U1
versehen - wenn für Fehlernamen ein entsprechender richtiger Name vorliegt
und das Verhältnis N /N kleiner oder gleich 0, 05 ist.
Ij SLt
3. Fehlername wird in gebräuchlichen geändert und mit Rückweisungsmarkierung
versehen - wenn der Fehlername einem richtigen Namen entspricht und wenn das Verhältnis N /N zwischen 0, 05 und 1 liegt oder
Xj SLi
gleich 1 ist.
4. Gebräuchlicher Name wird mit Rückweisungsmarkierung versehen, wenn
das Verhältnis N /N zwischen 1 und 20 liegt.
Xj E
Die Schwellenwerte für die Gruppierung der Namen sind Erfahrungswerte,
es ist vorteilhaft, sie nach wirtschaftlichen Überlegungen festzusetzen.
Die Signale von der in Fig. 1 dargestellten Auswahlschaltung 22 werden auf
die Datei 24 klassifizierter Namen geleitet. Die Datei 24 empfängt außerdem
den wöc gebräuchlichen Namen von der Datei 10 und den Fehlernamen vom Generator 14. Diese Namen und die von der Auswahlschaltung
vorgenommene Markierung gestatten der Datei 24 für klassifizierte Namen den als gebräuchlichen Namen markierten Namen als Annahme oder Rückweisung
zu speichern oder den Fehlernamen als auf einen gewöhnlichen Namen geändert und als Annahme oder Rückweisung z^u speichern. Diese
Decket RO 967 030 1O9884/1U1
Information wird dann in die Datei 26 für klassifizierte gebräuchliche Namen
eingegeben. Die beschriebene Anordnung arbeitet weiter, bis alle gebräuchlichen Namen der Datei 10 geordnet sind. Am Ende der Verarbeitung enthält
somit die Datei 26 für klassifizierte gebräuchliche Namen alle gebräuchlichen Namen und alle Varianten der gebräuchlichen Namen. Diese gebräuchlichen
Namen und die Fehlernamen sind in die vier oben angegebenen Gruppen unterteilt. Namen vom Zeichenleser können dann mit den Namen in der
Datei 26 verglichen werden, um festzustellen, ob der vom Zeichenleser empfangene Name als Annahme oder Rückweisung markiert oder ob er geändert
und dann als Annahme oder Rückweisung markiert werden muß.
Der Name vom Zeichenleser wird vorübergehend im Zwischenspeicher 28
gespeichert. Ein Vergleicher 30 vergleicht den Namen im Zwischenspeicher 28 mit allen Namen in der Datei 26. Wenn in der Datei 26 ein entsprechender
Name steht, gibt der Vergleicher 30 ein Signal auf den ersten Namenwähler
32 und den zweiten Namenwähler 34. Diese beiden Wähler sind außerdem mit der Datei 26 verbunden, so daß sie eine Anzeige empfangen, ob dieser
Name auf einen statistisch gebräuchlicheren Namen zu ändern ist oder nicht.
Der er:ite Namen wähler 32 stellt fest, daß der Name nicht geändert werden
braucht und leitet ihn in den Speicher 36 korrigierter Namen. Außerdem gibt
der erste Namenwähler 32 die mit dem Namen in der Datei 26 verbundene
Doc ld· t RC) 967 030
109884/1441
Annahme- oder Rückweisungsmarkierung an den Speicher 36 weiter.
Der zweite Namenwähler 34 stellt fest, ob der dem Eingangsnamen entsprechende
klassifizierte Name mit einer Änderungsmarkierung versehen ist. Ist das der Fall, leitet der zweite Namenwähler 34 den zweiten oder nächsten
in der Datei 26 für klassifizierte gebräuchliche Namen gespeicherten Namen weiter. Dieser Änderungsname enthält eine Annahme- oder Rückweisungsmarkierung,
die ebenfalls in den Speicher 36 für korrigierte Namen weitergeleitet wird.
Wenn der Vergleicher 30 keine Übereinstimmung zwischen dem Eingangsnamen
und einem Namen in der Datei 26 für klassifizierte gebräuchliche Namen feststellt, wird eine zweite Vergleichsreihe mit ungewöhnlichen
Namen durchgeführt. Dieser Vergleich beginnt, wenn die Datei 38 für ungebräuchliche
Namen ein die Nichtübereinstimmung anzeigendes Signal aus dem Vergleicher 30 empfängt und ein Datei-Ende-Signal von der Datei 26
für klassifizierte, gebräuchliche Namen eintrifft. Die Datei 38 ungebräuchlicher
Namen leitet dann Namen auf den Vergleicher 30, damit dieser feststelLen
kann, ob eine Übereinstimmung mit dem Eingangsnamen vorliegt. Außerdem schalten das Signal für Nichtübereinstimmung und das Datei-Ende-Signal
von der Datei 26 die Auswahlschaltung 40 ein, die dann den Eingabenamen direkt auf den Speicher für korrigierte Namen 36 leitet. Die Su-he
Docket RO 967 0 30
109884/1441 BAD ORIGINAL
läuft dann weiter in der Datei 38 für ungebräuchliche Namen bis zum Ende
dieser Datei und die Auswahlschaltung 40 kennzeichnet den Eingabenamen mit einer Rückweisungsmarkierung, wenn keine Übereinstimmung durch
den Vergleicher 30 festgestellt wurde. Wurde eine Übereinstimmung festgestellt, versieht die Auswahlschaltung 40 den Eingabenamen mit einer Annahmemarkierung
und leitet ihn in die Datei für korrigierte Namen 36.
Im folgenden Abschnitt wird die obige Darstellung zusammengefaßt.
Nach Einordnung der Namen in die Datei 26 für klassifizierte gebräuchliche
Namen können Eingabenamen mit diesen gespeicherten Namen verglichen werden. Der Vergleich gestattet einer Schaltung zu bestimmen, ob die Eingabenamen
mit Annahme oder Rückweisung markiert werden sollen und ob sie auf einen anderen Namen geändert und dann mit Annahme oder Rückweisung
markiert werden sollen. Wenn der Eingabename in der Datei 26 &
nicht vorhanden ist, erfolgt ein Vergleich auf einer zweiten Ebene. Bei diesem Vergleich mit ungewöhnlichen Namen wird der Eingabename nur mit
dem Vermerk "Annahme" oder "Rückweisung" versehen und es wird nicht
versucht ihn auf einen vom statistischen Standpunkt gebräuchlicheren Namen zu ändern.
Der Zweck der Gruppe "Namen auf gebräuchlicheren Namen ändern und An-
BAD
Docket RO 967 030 0^
109884/1U1
nähme" wurde bereits besprochen. Der Zweck der Gruppe "Namen auf gebräuchlicheren Namen ändern und Rückweisung" ist folgender: Hierdurch
soll die beste Vorechlagemöglichkeit des Zeichenlesesystems verbessert
werden, ohne daß man so viel Vertrauen in diesen besten Vor schlag hat,
daß dem Datenverarbeitung β system dieser Vorschlag zur Annahme empfohlen wird. Dadurch kann das Bedienungspersonal die besten Namens vor schlage schneller verarbeiten, als wenn sie nur zurückgewiesen würden. Angenommen werden solche Namen, die keine fehlerhaften Varianten aufweisen,
oder bei denen die Anzahl der fehlerhaften Varianten im Vergleich zur tatsächlichen Anzahl von richtigen gebräuchlichen Namen so idein ist, daß die
fehlerhaften Varianten ignoriert werden können. Die Rückweieung kommt in
Frage, wenn der Eingabename vom Zeichenleser weder in der Datei 26 für
klassifizierte gebräuchliche Namen noch in der Datei 38 für ungebräuchliche
Namen gefunden werden konnte, d. h. der Eingabename ist falsch gelesen worden und existiert in Wirklichkeit nicht in dieser Form.
Die zur Ausführung des in Fig. 1 gezeigten Beispieles benötigten Bauteile
sind in den Fig. 2a und 2b gezeigt. Die Fig. 2a stellt das .Qerät zur Erzeugung der Datei 26 für klassifizierte gebräuchliche Namen, während die Fig.
2b das Gerät zur Einordnung der Eingabenamen vom Zeichenleeer entsprechend der Klassifizierung in der Datei 26 enthält.
Docket RO 967 030
109884/1441 bad original
Die Datei 10 gebräuchlicher Namen in Fig. 1 besteht aus dem Speicher 50
und der Adress-Steuerung 52 in Fig. 2a. Der Speicher 50 kann z. B. ein Kern-, Platten- oder ein Magnettrommelspeicher sein. Die Adress-Steuerung
52 besteht aus den normalen Adress-Steuerschaltungen für Speicher und einem Zähler zum Weiterschalten der Adresse.
Die Datei 12 für Verwechslungspaare in Fig. 1 besteht aus dem Speicher 54 ™
und der Adress-Steuerung 56 rechts oben in Fig. 2a. Die Adress-Steuerung
56 und der Speicher 54 sind ähnlich aufgebaut wie der Speicher 50 und die Adress-Steuerung 52. Um die Klassifizierung der gebräuchlichen Namen einzuleiten,
wird ein Startsignal auf die beiden Adress-Steuerungen 52 und 56
gegeben. Die beiden Adress-Steuerungen bewirken, daß der erste gebräuchliche
Name ins Register 58 und das erste Verwechslungspaar ins Register 60 gesetzt werden. Die Anzahl von Personen N mit einem gebräuchlichen
Namen wird zusammen mit jedem Namen im Speicher 50 gespeichert. Die M
Größe von N_ wird mit dem zugehörigen Namen auf das Register 58 gegeben.
Das die Adress-Steuerungen 52 und 56 einschaltende Startsignal wird außerdem über eine Oder-Schaltung 64 und eine Verzögerungsschaltung 66 auf eine
bistabile Kippschaltung 62 geleitet. Die Verzögerungsschaltung 66 soll das
Laden der Register 58 und 60 ermöglichen, bevor die bistabile Kippschaltung 62 durch den Startimpuls eingeschaltet wird. Wenn die Kippschaltung 62
eingeschaltet wird, werden auch die Und-Schaltung en 68, 70 und 72 in den
Docket RO 967 030
109884/1441
leitenden Zustand gesetzt. Die Und-Schaltung 70 empfängt ein weiteres Eingangssignal
vom Gleich-Ausgang der Vergleicherschaltung 74, während die
Und-Schaltung 72 ein zweites Eingangssignal vom Ungleich-Ausgang des Vergleichers
74 empfängt.
Der Vergleicher 74 vergleicht die Zeichen von dem in das Register 58 geladenen
Namen mit einem Zeichen im Register 60, d. h. er untersucht, ob irgendwelche Zeichen des im Register 58 gespeicherten Namens ein Teil des
Verwechslungspaares sind. Die Verwechslungspaare durchlaufen das Register
60, nachdem das erste Zeichen eines jeden Verwechslungspaares mit jedem Zeichen des im Register 58 gespeicherten Namens verglichen wurde.
Der serielle Vergleich der Zeichen aus dem Verwechelungspaar im Register
60 mit den Zeichen im Namen erfolgt über den Schalter 76. Der elektronisch gesteuerte Schalter 76 beginnt beim ersten Zeichen izn Namen uhd wird auf
die anderen Zeichen dieses Namens durch einen Impuls weitergeschaltet,
der das Schieberegister 78 weite rs ehaltet. Am Anfang enthält das Schieberegister
78 eine Einschaltbedingung in seiner ersten Stufe. Dadurch leitet die'
erste Position des Schalters 76 das erste Zeichen des Namens aus dem· Re->
gister 58 auf den Vergleicher 74, der es mit dem Zeichen des Verwechslungspaares
in Register 60 vergleicht. Wenn keine Übereinstimmung festgestellt
wird, läuft ein Impuls vom Vergleicher 74 über die Und-Schaltung 72
Docket RO 967 030
109884/1441
und die O der-Schaltung 80 zurück zum Schieberegister 78, wodurch die Einschaltbedingung in diesem Schieberegister um eine Position verschoben wird.
Die zweite Position im Schieberegister läßt dann die zweite Position des Schalters 76 das zweite Zeichen aus dem Register 58 auf den Vergleicher 74
leiten, damit es mit dem Zeichen aus dem Register 60 verglichen wird. Solange keine Übereinstimmung zwischen Zeichen aus dem Namen und dem
Zeichen im Register 60 festgestellt werden, wird der Schalter 76 über den ™
ganzen im Register 58 gespeicherten Namen durchgeschaltet. Wenn der Schalter schließlich hinter dem Ende des Namens auf eine Leerstelle stößt, wird
diese Bedingung durch den Leerzeichendetektor 82 abgefühlt, der die Zeichensignale über eine Und-Schaltung 68 empfangt.
Der Leerzeichendetektor 82 erzeugt bei Erkennung eines Leerzeichens einen
Impuls, der auf die Adress-Steuerung 56 gegeben wird, die dann die auf den Verwechslungepaar-Speicher 54 gegebene Adresse um eine Position weiter- Λ
β ehaltet. Außerdem stellt der Impuls vom Leerzeichendetektor das Register
60 und über die Oder-Schaltung 94 die bi stabile Kippschaltung 62 zurück. Durch
die Rückstellung dieser Kippschaltung sind die Und-Schaltungen 68, 70 und 72
nicht mehr eingeschaltet, wahrend ein neues Verwechslungspaar mit der zugehörigen Wahrscheinlichkeit in das Register 60 geladen wird. Der Impuls
vom Leerzeichendetektor 82 wird außerdem über eine Oder-Schaltung 64 und
die Verzögerungsschaltung 66 geleitet und schaltet die bistabile Kippschaltung
Docket RO 967 030
109884/U41
62 wieder ein. Die Verzögerung 66 ermöglicht das Laden des Registers 60
mit einem neuen Verwechslungspaar, bevor die Kippschaltung 62 wieder eingeschaltet wird.
Wenn ein neues Verwechslungspaar im Register 60 steht, kann der Vergleicher
74 wieder nach einem Zeichen in dem im Register 58-gespeicherten Namen suchen, das einem Zeichen im Verwechslungspaar entspricht. Das
Schieberegister 78 wurde zu Beginn des neuen Vergleiches durch denselben Impuls vom Leerzeichendetektor 82 zurückgeschaltet, der die Adressierung
des Verwechslungspaar-Speichers 54 weiterschaltete. Dieser Impuls vom
Leerzeichendetektor läuft über die Oder-Schaltung 86 und schaltet das Schieberegister
auf eine Einschaltbedingung nur in der ersten Position zurück.
Wenn der Vergleicher 74 eine Übereinstimmung zwischen einem Namenszeichen
vom Register 58 und einem Zeichen aus dem Register 60 entdeckt, muß ein Fehlername erzeugt werden. Zu diesem Zweck wird der im Register 58
gespeicherte Name ebenfalls vom Speicher 50 auf das Register 88 geleitet. Das Register 88 empfängt nur den Namen vom gebräuchlichen Namensspeicher
und nicht die Größe N_.
Das Register 88 ist mit einem Schalter 90 verbunden, der durch das Schieberegister
78 ebenso gesteuert wird wie der Schalter 76. Der Schalter 90 stellt
Docket RO 967 030
109884/1U1
die Verbindungen von der Und-Schaltung 92 zu den Zeichen in dem im Register
88 gespeicherten Namen her. Die Und-Schaltung 92 wird durch ein Signal vom Gleich-Ausgang des Vergleichers 74 eingeschaltet, das auch
über die Und-Schaltung 70, die bereits während des Vergleichs eingeschaltet wurde, auf die Und-Schaltung 92 geleitet wurde. Wenn Gleichheit vorliegt,
leitet die eingeschaltete Und-Schaltung 92 das für das Namenszeichen einzusetzende
Zeichen aus dem Register 60 über den Schalter 90 in die enteprechende
Stelle im Namen im Register 88. Der Schalter 90 wird zur selben Zeit
weitergeschaltet wie der Schalter 76, so daß eine Zeichenübereinstimmung
im Namen im Register 58, wie sie vom Vergleicher 74 erkannt wurde, dazu führt, daß ein Ersatzzeichen in den Namen im Register 88 an die entsprechende
Stelle gesetzt wird. Der Name im Register 88 wird ein Fehlername, wenn der Vergleicher 74 die Übereinstimmung zwischen einem Zeichen eines
Verwechslungspaares und einem Zeichen in dem im Register 58 gespeicherten Namen feststellt.
Der statistische Rechner im Fehlernamen-Generator 14 (Fig. 1) besteht aus
den Und-Schaltungen 94 und 96 sowie dem Multiplikator 98 in Fig. 2a. Wenn
Übereinstimmung durch den Vergleicher 74 festgestellt wird, schaltet die Und-Schaltung 70 die Und-Schaltungen 94 und 96 ein. Die Und-Schaltung 94
leitet dann den Betrag, der die Wahrscheinlichkeit des Auftretens des Verwechslungspaares
angibt auf den Multiplikator 98, während die Und-Schal-
Docket RO 967 030
109884/U41
tune 96 die Zahl N - die Anzahl der Leute mit diesem Namen - auf den
Multiplikator 98 leitet. Der Multiplikator liefert das Produkt dieser beiden Zahlen und leitet es auf das Register 88. Dieses, Produkt ist die Größe N
und gibt an, wie oft der Fehlername aus dem gebräuchlichen Namen erzeugt werden wird.
Der in Fig. 1 dargestellte Vergleicher 16 ist an der linken Seite der Fig. 2a
genauer dargestellt. Die Datei richtiger Namen 18 in Fig. 1 besteht aus einem Speicher 100 und der Adress-Steuerung 102, die ebenfalls auf der
linken Seite der Fig. 2a dargestellt sind. Der Speicher 100 und die Adress-Steuerung
102 arbeiten prinzipiell genauso wie die Speicher 50 bzw. 54 und die Adress-Steuerungen 52 bzw. 56.
Der in Fig. 2a gezeigte Vergleicher 104 empfängt den Fehlernamen vom Register
88 und einen richtigen Namen vom Register 106. Das Register 106
wird mit dem richtigen Namen aus dem Speicher 100 geladen, wenn die Adress-Steuerung 102 durch ein Signal der bistabilen Kippschaltung 108 eingeschaltet
wird. Die bistabile Kippschaltung 108 ist nur eingeschaltet, wenn der Vergleicher 74 im Generator 14 eine Übereinstimmung festgestellt und
die Erzeugung eines Fehler namens verursacht hat. Dieser auf die Adress-Steuerung
102 gegebene Impuls schaltet über die Oder-Schaltung 120 und
die Verzögerungsleitung 112 außerdem die bistabile Kippschaltung 110 ein.
Docket RO 967 030
109884/U41
Die Verzögerungsleitung 112 ermöglicht das Laden des ersten richtigen
Namens aus dem Speicher 100 in das Register 106. Wenn die bistabile Kipp schaltung 110 eingeschaltet ist, können die Ausgangssignale vom Vergleicher
104 über die Und-Schaltungen 114 und 116 überwacht werden.
Wenn keine Übereinstimmung zwischen dem richtigen Namen im Register
106 und dem Fehlernamen im Register 88 besteht, wird vom Vergleicher ein Impuls über die Und-Schaltung 114 zur Oder-Schaltung 118 und zur Adress-Steuerung
102 gegeben. Dieser Impuls schaltet das Register 106 zurück und die Adress-Steuerung 102 weiter, so daß ein neuer richtiger Name auf das
Register 106 gegeben wird. Das Ungleich-Signal vom Vergleicher 104 wird
ebenfalls über die Oder-Schaltung 118 auf die bistabile Kippschaltung 110
gegeben und schaltet diese zurück. Bei dieser Stellung der Kippschaltung
sind die Und-Schaltungen 114 und 116 nicht länger eingeschaltet, während der
neue richtige Name auf das Register 106 geleitet wird. Der Impuls von der Und-Schaltung 114 wird ebenfalls über die Oder-Schaltung 120 und eine Verzöge
rungs schaltung 112 zur erneuten Rückschaltung der Kippschaltung 110
geleitet. Durch die Verzögerung kann der nächste richtige Name in das Register
106 geladen werden, bevor die Und-Schaltungen 114 und 116 wieder eingeschaltet werden.
Dieser Vorgang läuft weiter, bis der Vergleicher 104 eine Übereinstimmung
Docket RO 967 030
zwischen einem Fehlernamen im Register 88 und einem richtigen Namen im
Register 106 feststellt oder bis das Ende der Datei richtiger Namen im Speicher 100 erreicht ist. In letzterem Fall läuft das Speicher-Ende-Signal
von der Adre es-Steuerung 102 über eine Und-Schaltung 122 und eine Oder-Schaltung 124 und schaltet die Und-Schaltung 126 ein. Wenn die Und-Schaltung 126 eingeschaltet ist, leitet sie einen Fehlernatnen vom Register 88
über die Oder-Schaltung 128 auf die erste Namensposition im Register 130.
Außerdem wird das Ausgangs signal von der Und-Schaltung 122 über eine
Oder-Schaltung 132 geleitet und schaltet die Und-Schaltung 134 ein, die dann
den gebräuchlichen Namen, von welchem der Fehlername abgeleitet ist, auf die zweite Position im Register 130 leitet. Außerdem marjdert das Ausgangesignal der Oder-Schaltung 132 den ersten Namen im Register 130 als geändert (Position S). Das Ausgangs signal von der Und-Schaltung 122 wird außerdem über eine Oder-Schaltung 136 geleitet und schaltet Position T der zweiten Namensposition im Register 130 auf Annahme. Wenn also ein Fehlername
erzeugt wurde, der kein richtiger Name ist, wird dieser FeUername markiert "Andern auf gebräuchlichen Namen" und der gebräuchliche Name wird
mit "Annahme" markiert. .
Um diese Information vom Register 130 auf einen Speicher zu geben, wird
das Ausgangs signal von der Und-Schaltung 122 auch über eine Oder-Schaltung
138 und eine Verzögerungsleitung 140 geleitet um die Und-Schaltung 142 ein-
Docket RO 967 030
109884/1U1
zuschalten. Die Und-Schaltung 142 leitet dann den Inhalt des Registers 130
auf den in Fig. 2b gezeigten Speicher 144 für klassifizierte gebräuchliche
Namen. Durch die Verzögerungsschaltung 140 kann das Register 130 mit Namen und ihren zugehörigen Markierungen geladen werden, bevor die Information
auf den Speicher 144 geleitet wird. Das Ausgangs signal von der Oder-Schaltung 138 schaltet ebenfalls das Register 130 zurück, unmittelbar
bevor das Register mit den Namen und den Markierungen geladen wird. %
Die Und-Schaltung 122, die das Au8gang8signal erzeugte, das Nichtübereinstimmung
und das Ende des Speichers 100 anzeigt, d. h. daß kein richtiger Name für den Fehlernamen vorliegt, wird durch die bistabile Kippschaltung
123 eingeschaltet, die in Ruhestellung steht, bis sie durch ein Ausgangssignal von der Und-Schaltung 116 eingeschaltet wird. Diese hat nur dann ein
Ausgangs signal, wenn ein richtiger Name für den Fehlernamen durch den Vergleicher
104 festgestellt wurde. Wenn kein richtiger Name für den Fehler- m
namen vorliegt, bleibt die Kippschaltung 123 in Ruhestellung und die Und-Schaltung
122 wird eingeschaltet, wenn das Ende des Speichers 100 erreicht und das entsprechende Signal durch die Adress-Steuerung 102 erzeugt ist.
Wenn der Vergleicher 104 einen richtigen Namen für den Fehlernamen entdeckt,
erzeugt die Und-Schaltung 116 ein Ausgangs signal, das die bistabile
Kippschaltung 123 einschaltet. Das Ausgangssignal wird axißerdem durch die
Docket RO 967 030
10988A/U41 BA0
Verzögerungsschaltung 146 verzögert und der verzögerte Impuls ear Rückstellung
der Adress-Steuerung auf die Anfangsadresse des Speichers 100,
sowie zur Rückstellung des Registers 106 benutzt. Die Verzogerungsschaltung
146 ermöglicht ein Arbeiten der Schaltung bevor das Register 106 und die Adress-Steuerung 103 zurückgestellt werden.
Das durch die Schaltstellung der bistabilen Kippschaltung 123 gespeicherte
Signal für Übereinstimmung wird dazu verwendet, um die Oder-Schaltung
124 die Und-Schaltung 126 einzuschalten. Die Und-Schaltung 126 leitet dann
den Fehlernamen vom Register 88 auf die erste Position des Registers 130.
Außerdem wird das in der Schalt stellung der bistabilen Kippschaltung 123
gespeicherte Signal für Übereinstimmung zum Einschalten der Und-Schaltungen
148 und 150 verwendet. Die Und-Schaltung 148 leitet die Größe N
zum Teiler 152, während die Und-Schaltung 150 die Anzahl N_ (Anzahl der
Personen, die den Fehlernamen als richtigen Namen führen) auf die Rechenschaltung
152 überträgt. Die Rechenschaltung 152 errechnet dann das Verhältnis NT /N_.
Der Ausgangswert der Schaltung 152 wird durch drei Schwellenwertdetektoren
überwacht. Der Schwellenwertdetektor 154 hat dann ein Ausgangs signal, wenn
das Verhältnis N /Ν— kleiner oder gleich 0, 05 ist, der Sch wellenwert de tek-
Lj E
tor 156 hat ein Ausgangssignal, wenn dieses Verhältnis größer als 0, 5 und
Docket RO 967 030 109884/1441 BAD ORIGINAL
kleiner oder gleich 1 ist und der Schwellenwertdetektor 158 hat ein Ausgangssignal, wenn das Verhältnis größer oder gleich 20 ist. Die Ausgangs signale
von diesen drei Schwellenwertdetektoren bestimmen, ob die Namen im Register mit einer Änderungsmarkierung und außerdem mit einer Annahme oder
Rückweisungsmarkierung zu versehen sind.
Wenn das Verhältnis N /N kleiner oder gleich 0, 5 ist, hat der Detektor
ein Ausgangssignal, das über eine Oder-Schaltung 132 läuft und den ersten
Namen im Register 130 mit einer Änderungsmarkierung versieht. Das Ausgangssignal von der Oder-Schaltung 132 schaltet außerdem die Und-Schaltung
134 ein, die dann den gebräuchlichen Namen vom Register 58 auf die zweite
Position im Register 130 leitet. Außerdem wird das Ausgangs signal vom Detektor 1-4 über eine Oder-Schaltung 136 geleitet und zur Markierung des zweiten Νε etis mit "Annahme" verwendet. Durch das Ausgangs signal des Detektor« ' wird also der Fehlername in Position 1 im Register 130 mit einer ™
Änderung markiert und der gebräuchliche Name in die Position 2 geladen und als annehmbar markiert. Wenn später Namen mit dem Fehlernamen vergliclien werden, wird der Fehlername auf einengebräuchlichen Namen geändert
und der gebräuchliche Name angenommen.
Wenn das Verhältnis N_ /N_ größer oder gleich 20 ist, gibt der Detektor 158
ein Ausgangs signal ab, das über eine Oder-Schaltung 160 geleitet wird und
den in die erste Position des Registers 130 geladenen Namen als annehmbar
markiert. In diesem Fall führen mindestens 20 mal mehr Leute den Fehlernamen als richtigen Namen als dieser als Fehler eines gebräuchlichen Namens erscheint. Infolgedessen werden die Fehlernamen als annehmbar und als
richtiger Name markiert und als annehmbarer Name in die Datei für klassifizierte gebräuchliche Namen geleitet. Diese Überleitung in den Speicher
144 in Fig. 2b erfolgt, wenn die bistabile Kippschaltung 123 eingeschaltet ist, die über die Oder-Schaltung 138 und die Verzögerungsleitung 140 am Eingang der Und-Schaltung 142 wirksam wird.
Wenn das Verhältnis von N. /N kleiner oder gleich 1 und größer als 0, 05
ist, gibt der Detektor 156 ein Ausgangs signal ab, das über eine Oder-Schaltung 132 geleitet wird und den Fehlernamen in Position 1 des Registers 130
mit einer Änderungsmarkierung versieht. Der gebrludbliche Name wird wieder über die Und-Schaltung 134 auf die Position 2 des Registers 130 geleitet.
In diesem Fall jedoch wird der in Position 2 befindliche Name ale nicht annehmbar markiert und somit als Zurückweisung eingeftuft. Dadurch wird
der Fehlername in der Kategorie "auf gebräuchlichen Namen lindern" eingestuft und der gebräuchliche Name mit "Rückweisung" markiert. Dies ist
also eine Gruppe, in der von der Anordnung ein Vorschlag angegeben, dessen Zuverlässigkeit jedoch sehr gering ist. Damit sind alle Fälle beschrieben,
in denen von der Anordnung ein Fehlername aus gebräuchlichen Namen und Verwechslungspaaren erzeugt wird.
Docket RO 967 030 10 98 8 4/1441
Wenn für einen gebräuchlichen Namen kein Fehlername existiert, wird diese
Bedingung durch eine Und-Schaltung 162 erkannt, die rechts oben in Fig. 2a
dargestellt ist. Die Und-Schaltung 162 ist mit einem Ausgang der bistabilen Kippschaltung 108 verbunden und empfängt ein Spei eher-Ende-Signal von der
Adress-Steuerung 56. An diesem Ausgang der bistabilen Kippschaltung 108
tritt solange ein Signal auf, wie der Vergleicher 74 im Fehlernamen-Generator
14 keine Übereinstimmung zwischen dem Zeichen eines Verwechslungspaares und dem Zeichen in einem Namen entdeckt. Die Und-Schaltung 162
leitet das Speicher-Ende-Signal weiter, wenn die Adreas -Steuerung 156 alle
Verwechslungspaare im Speicher 54 adressiert hat. Dieses Signal von der Und-Schaltung 162 wird auf die unten in Fig. 2a dargestellte Und-Schaltung
164 geleitet, die dann eingeschaltet wird und den gebräuchlichen Namen vom Register 58 über die Oder-Schaltung 128 in die erste Position des Registers
130 leitet. Außerdem wird das Aus gange signal von der Und-Schaltung 162
über eine Oder-Schaltung 160 geleitet, um den Namen in der ersten Position "
des Registers 130 mit einer Annahmemarkierung zu versehen.
Am Ende des Speichers 54 für die Verwechslungspaare wird der gebräuchliche
Name auf das Register 130 übertragen und mit einem Annahmevermerk
versehen und dann zum Speicher 144 für klassifizierte gebräuchliche Namen
weitergeleitet. Diese Übertragung findet auch dann statt, wenn aus dem gebräuchlichen
Namen ein Fehlername abgeleitet worden ist, da die bistabile
Docket RO 967 030 109884/1U1
Kippschaltung 108 zurückgestellt wird, nachdem der Fehlername klassifiziert
und in den Speicher 144 (Fig. 2b) tibertragen worden ist. Die Rückstellung
der Kippschaltung 108 erfolgt durch das Ausgangs signal der Verzögerung
s schaltung 140, die außerdem den Inhalt des Registers 130 in den Speicher 144 leitet. Dieses Ausgangssignal der Verzöge rungs schaltung 140
stellt außerdem die bistabile Kippschaltung 110 zurück, über eine Oder-Schaltung
118 das Register 106, das Register 88, schaltet das Schieberegister 78 über eine Oder-Schaltung 80 und schließlich die Adress-Steuerung 146
(Fig. 2b) weiter.
Durch das Speicher-Ende-Signal der Adress-Steuerung 56 wird außerdem die
Adress-Steuerung 52 weitergeschaltet, so daß ein neuer gebräuchlicher Name
in das Register 58 geladen wird. Dieses Signal von der Adress-Steuerung 56
wird über eine Verzöge rungs schaltung 166 geleitet, schaltet die Adress-Steue-™
rung 52 weiter und über eine Oder-Schaltung 84 die bistabile Kippschaltung
und das Register 58 zurück. Wie bereits gesagt, bleibt die bistabile Kippschaltung
62 während einer Zeit zurückgestellt, die ausreicht, um den neuen gebräuchlichen
Namen in das Register 58 zu laden. Dann schaltet der Impuls, der vorher die Adress-Steuerung 52 schaltete, die bistabile Kippschaltung 62
nach einer Verzögerung wieder ein, die durch die Verzögerungsschaltung 66 bestimmt wird.
RO ,67 030 109eB4/utl
Schließlich sind alle Namen im Speicher 50 für gebräuchliche Namen verarbeitet und zusammen mit ihren wahrscheinlichsten Varianten klassifiziert,
das Ende der Verarbeitung wird durch ein Speicher-Ende-Signal aus der Adress-Steuerung 52 gemeldet. Dieses Signal schaltet die bistabile Kippschaltung 62 zurück, die in diesem Zustand bleibt, bis sie ein neues Startsignal
empfängt. Das Signal aus der Adrese-Steuerung 52 wird außerdem auf die
rechts unten in Fig. 2b gezeigte Oder-Schaltung 168 geleitet, die das Signal
zur Rückstellung der Adress-Steuerung 146 auf die Anfangeadresse des
Speichers 144 für klassifizierte gebräuchliche Namen weiterleitet. Dieser Speicher 144 wird dann mit allen klassifizierten gebräuchlichen Namen und
den Varianten geladen und ist jetzt bereit zur Klassifizierung von Namen, die durch den Zeichenleser gelesen werden.
Die Klassifizierung von durch den Zeichenleser gelesenen Namen wird im Zusammenhang über eine Und-Schaltung 172 auf das in der Mitte der Fig. 2b
dargestellte Register 170 geleitet. Die Und-Schaltung wird durch ein Prüfsignal beaufschlagt, das auftritt» wenn ein neuer Name in das Register 170
gebracht werden soll. Dieses Prüfsignal stellt außerdem die gesamte Anordnung durch Rückstellung der bistabilen Kippschaltungen 174 und 176 und des
Ausgangsregister 178 zurück. Außerdem wird das Prüfsignal auch über eine
Oder-Schaltung 180 und eine Verzögerunge schaltung 182 zum Einschalten
auf die bistabile Kippschaltung 184 geleitet. Ein Ausgangs signal dieser Kipp-
Docket RO 967 030
109884/U41
schaltung schaltet dann die Und-Schaltungen 186 und 188 ein, die die Ausgangs signale des Vergleichers 190 überwachen. Die Verzögerungsschaltung
182 gestattet das Laden von Namen aus dem Zeichenleser in due Register
170, bevor die Und-Schaltungen 186 und 188 eingeschaltet werden.
Der Vergleicher 190 vergleicht den im Register 170 gespeicherten Namen
™ vom Zeichenleser mit Namen im Register 192 aus dem Speicher 144. Die
Namen aus dem Speicher 144 werden über eine Und-Schaltung 194 und eine
Oder-Schaltung 196 in das Register 192 geladen. Die Und-schaltung 194 ist
eingeschaltet, wenn der Name vom Zeichenleser mit Namen im Speicher für
gebräuchliche Namen verglichen wird und ist nicht eingeschaltet, wenn der
Name vom Zeichenleser mit Namen aus dem Speicher 198 für ungebräuchliche Namen verglichen wird.
h
Wenn der Vergleicher 190 keine Übereinstimmung χ wischen dem Namen aus
dem Register 170 und dem Namen aus dem Register 192 feststellt, gibt er
ein Auegangesignal über die Und-Schaltung 188 ab. Dieses schaltet die
Adress-Steuerung 146 über eine Und-Schaltung 200 und eine Qder-Schaltung
202 ein. Der auf die Adre β β-Steuerung 146 gegebene Impuls wird auch auf
die Oder-Schaltung 180 gegeben, die über die Oder-Schaltung 204 ein Auegangssignal hat, das die bistabile Kippschaltung 184 zunächst zurückschaltet
und nach einer durch die Verzögerungeeinrichtung 182 hervorgerufenen Verzö-
gerung später wieder einschaltet. Diese Ein- und Ausschaltoperation der
bistabilen Kippschaltung 184 soll die Und-Schaltungen 186 und 188 ausschalten,
während ein neuer gebräuchlicher Name in das Register 192 geladen wird. So wird die Adress-Steuerung 146 jedesmal auf einen neuen Namen
weitergeschaltet, wenn der Vergleicher 190 ein Signal für Nichtübereinstimmung über die Und-Schaltung 188 abgibt.
Das Signal für Nichtübereinstimmung vom Vergleicher 190 kann außerdem
unter bestimmten Umständen die Adress-Steuerung 146 veranlassen, zwei
Adresspositionen weiter zuschalten und somit einen Name,n zu überspringen.
Dieses Überspringen soll bewirken, daß beim Auftreten eines einen geänderten ersten Namen darstellenden zweiten Namens die Übereinstimmung des
vom Zeichenleser eingegebenen Namens mit dem zweiten Namen dann nicht überprüft wird, wenn schon keine Übereinstimmung mit dem ersten Namen
festgestellt wurde. Dies erfolgt durch Weiterleiten der Änderungsmarkierung "
des Namens im Register 192 auf die Und-Schaltung 206, die dann das Signal
für Nichtübereinstimmung von der Und-Schaltung 188 über die Oder-Schaltung 208 auf die Adress-Steuerung 146 weitergibt. Durch das Signal von
der Oder-Schaltung 208 wird die AdresSf-Steuerung außerdem um eine Adress-Position
weitergeschaltet. Wenn somit der Name im Register 192 mit "Änderung"
markiert ist und nicht mit dem Namen vom Zeichenleser übereinstimmt,
wird ein Fortschaltimpuls über die Oder-Schaltung 204 auf die Adress-Steue-
Docket RO 967 030 109884/1441
rung 146 geleitet und ein zweiter Fortschaltimpuls über die Oder-Schaltung
208, so daß die Adress-Steuerung zwei Positionen weiter springt.
Wenn der Vergleicher 190 eine Übereinstimmung zwischen dem Namen im
Register 170 und dem gebräuchlichen Namen im Register 192 feststellt, erreicht ein Signal über die Und-Schaltung 186 die bistabile Kippschaltung 176,
die dann die Und-Schaltungen 210 und 212 beaufschlagt. Wenn der Name im
Register 192 eine Änderungsmarkierung enthält, führt diese zu einem Ausgangssignal
der Und-Schaltung 212. Dieses Signal wird jedoch durch die Inversionsschaltung 214 umgekehrt, so daß die Und-Schaltung 210 dann kein
Ausgangs signal abgibt.
Wenn für den übereinstimmenden Namen eine Änderungsmarkierung und somit
für die Und-Schaltung 212 ein Ausgangs signal angenommen wird, so wird dieses Signal über die Oder-Schaltung 202 weiter geleitet und schaltet die
Adress-Steuerung 146 auf den nächsten Namen, d. h. auf den Namen, auf
welchen der Name im Register 192 geändert werden soll. Dieser Name wird dann in das Register 192 geladen. In der Zwischenzeit wird das Ausgangssignal
von der Und-Schaltung 212 durch die Verzögerungseinrichtung 216 verzögert und schaltet dann die monostabile Kippschaltung 218 ein, die daraufhin
die Und-Schaltung 220 einschaltet. Das andere Eingangssignal für die Und-Schaltung 220 liegt auch vor, da der Name vom Zeichenleser mit
Docket RO 967 030 10988A/U41
Namen aus dem Speicher 144 verglichen wird. Sobald die monostabile Kippschaltung 218 einen Impuls abgibt wird die Und-Schaltung 220 eingeschaltet
und leitet den Namen aus dem Register 192 mit seiner Annahme- oder Rückweisungemarkierung über die Oder-Schaltung 222 in das Ausgangsregister
178. Die Verzögerungseinrichtung 216 ist so ausgelegt, daß der Name auf den
auf den der Name von Zeichenleser geändert werden soll, im Register 192 steht, wenn die Und-Schaltung 220 eingeschaltet ist.
Wenn der übereinstimmende Name im Register 192 keine Änderungsmarkierung trägt, hat die Und-Schaltung 210 ein Ausgangs signal. Die Und-Schaltung
210 wird durch das Ausgangs signal "Keine Änderung" vom Inverter 214 und die eine Übereinstimmung anzeigende, eingeschaltete, bistabile Kippschaltung
176 angesteuert. Das Ausgangssignal von der Schaltung 210 schaltet die monostabile Kippschaltung 223 ein, die die Und-Schaltung 224 einschaltet und den
übereinstimmenden Namen vom Register 192 über die Oder-Schaltung 222 in
das Ausgangsregister 178 leitet. Die Annahme- oder Rückweieungsmarkierung des Namens im Register 192 wird ebenfalls in das Aus gangs register 178
übertragen. Die monostabile Kippschaltung 223 hat einen Ausgangsimpuls, dessen Dauer ausreicht, um den Namen vom Register 192 in das Ausgangsregister
178 zu übertragen.
Das Au s gang β signal von den monostabilen Kippschaltungen 218 und 223 wird
Docket RO 967 030 m ΛΛ.
ebenfalls auf die Oder-Schaltung 226 gegeben, deren Ausgangs signal durch
das Differenzierglied 228 differenziert wird und durch die Gleichrichterschaltung
230 so behandelt wird, daß nur ein Impuls von der Hinterflanke des Ausgangsimpulses
der Kippschaltung 218 bzw. der Kippschaltung 223 entsteht. Dieser Impuls wird über eine Oder-Schaltung 168 geleitet und schaltet die
Adress-Steuerung 146 auf die Anfangsadresse des Speichers 144 für klassifizierte
gebräuchliche Namen zurück. Auf diese Weise ist der Speicher 144 für eine neue Suchoperation bereit, sobald ein neuer Name in das Register
170 gebracht wird.
Zum gleichen Zweck stellt das Signal für Übereinstimmung auch die bistabile
Kippschaltung 184 zurück. Dazu wird es von der Und-Schaltung 186 über
eine Verzögerungseinrichtung 232 und eine Oder-Schaltung 204 zur Rückstellung
auf die bistabile Kippschaltung 184 geleitet. Die Verzögerungsschaltung 232 bewirkt, daß die bistabile Kippschaltung 176 eingeschaltet werden kann,
bevor die bistabile Kippschaltung 184 ausgeschaltet wird.
Wenn keine Übereinstimmung des rom Zeichenleser erkannten Namens mit
irgendeinem Namen im Speicher 144 für klassifizierte gebräuchliche Namen
vorliegt, erzeugt die an der rechten Seite der Fig. 2b dargestellte Und-Schaltung
234 ein Ausgangs signal. Sie wird durch die Rückstellung der bistabilen Kippschaltung 176 eingeschaltet. Die bistabile Kippschaltung 176 wird jeweils
Docket RO 967 030
dann zurückgeschaltet, wenn ein neuer Name in das Register 170 geleitet
wird und verbleibt in diesem Zustand, wenn keine Übereinstimmung zwischen dem Eingangsnahmen (vom Zeichenleser) und dem Namen aus dem Speicher
144 vorliegt. Wenn keine Übereinstimmung vorliegt, bis durch die Adress-Steuerung
146 "Speicher-Ende" angezeigt wird, leitet die Und-Schaltung 234
das Speicher-Ende-Signal weiter, wodurch die oben in Fig. 2b gezeigte bistabile Kippschaltung 236 eingeschaltet wird. Wenn diese Schaltung eingeschaltet
ist, schaltet die Anordnung vom Vergleich zwischen Eingangsname und klassifizierten, gebräuchlichen Namen (Speicher 144) um auf Vergleich
zwischen Eingangsname und ungebräuchlichen Namen (Speicher 198). Diese Umschaltung erfolgt dadurch, daß der Ein-Ausgang der bistabilen Kippschaltung
236 die Und-Schaltung 238 und 240 einschaltet und über den Inverter auch die Und-Schaltungen 194, 220 und 224.
Dieselben Bedingungen (Nicht-Übereinstimmung und "Speicher-Ende" für ■
Speicher 144), durch die die Und-Schaltung 234 ein Signal erzeugte, schalten
auch die Und-Schaltung 244 ein, die dann den Eingangsnamen vom Register 170 über die Oder-Schaltung 222 auf das Ausgangsregister 178 überträgt.
Jetzt braucht nur noch bestimmt zu werden, ob dieser Eingangsname mit einer Annahme- oder Rückweismarkierung versehen werden muß. Wenn keine
Übereinstimmung mit den Namen im Speicher 144 für klassifizierte gebräuchliche
Namen erzielt wurde, wird am Ende des Vergleichs mit dem Inhalt
!fecht RO 967 030 109e84/mi
BM> obig«**1-
dieses Speichers der Eingangsname in das Ausgangsregister 178 übertragen.
Jetzt braucht nur noch der Eingangsname mit den ungebräuchlichen Namen
verglichen zu werden, um festzustellen, ob er mit einer Annahme- oder Rückweisungsmarkierung versehen werden muß.
Zu diesem Zweck vergleicht der Vergleicher 190 den Eingangshamen mit den
ungebräuchlichen Namen im Register 192. Die ungebräuchlichen Namen laufen über die Und-Schaltung 238 und die Oder-Schaltung 196 jedesmal in das
Register 192, wenn die Adress-Steuerung 246 weiterge β ehaltet wird.
Die Adress-Steuerung 246, eingeschaltet durch ein Signal von der Und-Schaltung
234, leitet den ersten Namen aus dem Speicher 198 für ungebräuchliche Namen in das Register 192. Das Speicher-Ende-Signal (Speicher 144) von der
Adress-Steuerung 146 schaltet während dieser Zeit über die Oder-Schaltung
180 und 204 die bistabile Kippschaltung 184 zurück. Das gleiche Signal schaltet nach einer Verzögerung die bistabile Kippschaltung 184 wieder ein, die
dann die Und-Schaltungen 186 und 188 wieder einschaltet, welche den Vergleicher
190 überwachen.
Wenn keine Übereinstimmung zwischen dem Eingangsnamen und dem ungebräuchlichen
Namen im Register 192 besteht, gibt die Und-Schaltung 188 ein Ausgangs signal ab, das über eine Und-Schaltung 248 läuft und die Adresse
in der Adr ess-Steuerung 246 um eine Position weiterschaltet. Dieses Signal
stellt gleichzeitig das Register 192 über die Oder-Schaltung 203 zurück und
kurzzeitig auch die bistabile Kippschaltung 184 über die Oder-Schaltungen
180 und 204. Wie oben erklärt, werden dann die Und-Schaltungen 186 und
abgeschaltet, während der neue ungebräuchliche Name in das Register 192 geladen wird.
Falls der Vergleicher 190 eine Übereinstimmung zwischen dem Eingangsnamen
im Register 170 und dem ungebräuchlichen Namen im Register 192 entdeckt, gibt die Und-Schaltung 186 ein Ausgangs signal ab, das über die Und-Schaltung
240 die bistabile Kippschaltung 174 einschaltet. Die Und-Schaltung 240 wurde durch den Ein-Ausgang der bistabilen Kippschaltung 2 36 eingeschaltet.
Somit wird die bistabile Kippschaltung 174 bei Übereinstimmung in den Registern 170 und 192 eingeschaltet. Diese Kippschaltung befindet sich normalerweise
in Ruhestellung (Aus-Zustand), die sie zu dem Zeitpunkt einnimmt, "
wenn der Eingangsname in das Register 170 geladen wird. Vom Ausgangssignal wird die Und-Schaltung 250 beaufschlagt. Wenn keine Übereinstimmung vorliegt
und damit die bistabile Kippschaltung 174 nicht eingeschaltet wird, bleibt die Und-Schaltung 250 eingeschaltet, wenn die Adr ess-Steuerung 246 "Speicher-Ende"
für den Speicher 198 für ungebräuchliche Namen anzeigt. Dieses Signal von der Adress-Steuerung 246 läuft über die Und-Schaltung 250 und
löst im Ausgangsregister 178 die Anbringung einer Rückweisungemarkierung
ROW-030
aus. Wenn Übereinstimmung vorliegt, ist die Und-Schaltung 250 nicht beaufschlagt, so daß das Speicher-Ende-Signal im Ausgangeregister 178 den vom
Register 170 empfangenen Namen mit einer Annahmemarkierung versieht.
Das Speicher-Ende-Signal von der Adress-Steuerung 246 wird außerdem über
eine Oder-Schaltung 252 geleitet und schaltet die bistabile Kippschaltung
zurück, wodurch die in Fig. 2b gezeigte Anordnung auf Vergleich des Eingangsnamens
mit Namen im Speicher 144 für klassifizierte gebräuchliche Namen zurückschaltet. Jetzt ist die Anordnung bereit für die Weiterleitung
des nächsten Eingangsnamens auf das Register 170.
Die bistabile Kippschaltung 236 wird auch dann zurückgestellt, wenn der Vergleicher
190 eine Übereinstimmung zwischen dem Eingangenamen und dem ungebräuchlichen Namen im Register 192 entdeckt. Diese Rücketeilung erfolgt
über den Ein-Ausgang der bistabilen Kippschaltung 174. Der Ein-Ausgang
der Kippschaltung 174 schaltet ebenfalls die Adress-Steuerung 246 auf die
Anfangsadresse. Das Ausgangesignal für Übereinstimmung üer Und-Schaltung
186 wird über eine Verzögerungseinrichtung 232 und eine Oder-Schaltung
geleitet und schaltet die bistabile Kippschaltung 184 zurück. Die Verzögerungsleitung
2 32 verhindert eine Abschaltung der Und-Schaltung 186 bevor die bistabile Kippschaltung 174 eingeschaltet ist. Die Rückschaltung der bistabilen
Kippschaltung 184 bewirkt, daß die Anordnung für den Empfang des
Docket RO 967 030
109884/1U1
nächsten Namens vom Zeichenleeer bereit ist.
Die Arbeitsweise des in Fig. 2b gezeigten Gerätes kann wie folgt zusammengefaßt
werden: Ein Eingangsname vom Zeichenleeer wird in As Register 170
geleitet. Der Vergleicher 190 vergleicht den Eingangsnamen zuerst mit den klassifizierten gebräuchlichen Namen. Liegt eine Übereinstimmung vor,
wählt der erste Namenwähler 32 den Namen im Register 192 aus, wenn die- ^
ser nicht mit einem Änderungsvermerk versehen ist. Trägt der Name eine
Änderungsmarkierung, schaltet der zweite Namenwähler 34 den Speicher 144 für klassifizierte gebräuchliche Namen weiter, so daß dieser den zweiten
Namen in das Register 192 leitet und ihn dann ins Ausgangsregister 178 gibt. Die Annahme- oder Rückweisungsmarkierung wird mit dem Namen aus
dem Register 192 in das Ausgangsregister 178 übertragen. Wird keine Übereinstimmung
zwischen dem Eingangsnamen und einem klassifizierten gebräuchlichen Namen festgestellt, wird der Eingangsname über eine Und-Schaltung g
244 in das Ausgangsregister 178 geleitet. Der Eingangsname wird dann mit Namen aus einem Speicher 198 für ungebräuchliche Namen verglichen, um
festzustellen, ob es sich um einen richtigen Namen handelt. Ist der Eingangsname ein richtiger Name, verläßt er das Ausgangsregister 178 mit einer
Annahmemarkierung. Handelt es sich nicht um einen richtigen Namen, wird die Und-Schaltung 250 eingeschaltet und der Eingangsname im Ausgangsregister
178 mit einer Rückweisungsmarkierung versehen.
Docket RO 967 030
10988A/UA1
Claims (5)
1. Verfahren zur statistischen Fehlerreduzierung in Vorrichtungen zur maschinellen
Zeichenerkennung, insbesondere bei der Erkennung von Eigennamen,
dadurch gekennzeichnet, daß nach der Zusammenstellung einer Datei (26) klassifizierter, gebräuchlicher Wörter, in der außer den Wörtern
ihre Varianten zusammen mit einer ihre Annehmbarkeit für das Datenverarbeitung
s system anzeigende Markierung gespeichert sind, ein Vergleich des vom Zeichenleser erkannten Wortes seriell mit dem Inhalt der
Datei (26) und bei Übereinstimmung die Ausgabe des erkannten, nach Maßgabe
der in der Datei (26) gespeicherten Markierung geänderten und mit einer Annahme- oder Rückweisungsmarkierung versehenen Wortes in ein
Ausgangs speicher (36) erfolgt.
2. Verfahren zur statistischen Fehlerreduzierung nach Anspruch 1, dadurch
gekennzeichnet, daß zusätzlich eine Datei (38) ungebräuchlicher Wörter zusammengestellt
wird, mit deren Inhalt das vom Zeichenleser erkannte Wort dann verglichen wird, wenn Nicht-Übereinstimmung mit dem Inhalt
der Datei (26) klassifizierter, gebräuchlicher Wörter festgestellt wurde,
und daß die Ausgabe des erkannten Wortes bei Übereinstimmung mit dieser
Datei (38) mit einer Annahme-Markierung und bei Nicht-Übereinstimmung
mit einer Rückweisungsmarkierung erfolgt.
Docket RO 967 030
109884/1U1
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Bildung der
Datei (26) klassifizierter, gebräuchlicher Wörter Varianten gebräuchlicher Wörter durch Vertauschen einzelner Zeichen mit solchen ähnlichen
Aussehens (Verwechslungspaare) erzeugt werden, daß jede dieser Varianten mit dem im vorgegebenen Wortbestand enthaltenen richtigen Wörtern
verglichen und ihr Auftreten sowie dessen Häufigkeit (N ) bestimmt wird,
daß aus dieser Häufigkeit (N ) und dem Produkt (N ) aus der Wahrscheinlichkeit
(P) des Auftretens des Verwechslungspaares und der Häufigkeit (N ) des Auftretens des invariierten gebräuchlichen Wortes ein für diese
Variation geltender Quotient (N /N ) gebildet wird, und daß die gebräuchliehen
Namen und ihre Varianten eine von dem Wert des Quotienten (N /
N) abhängende Markierung erhalten, die Annahme, Rückweisung und/ oder Änderung des vom Zeichenleser erkannten Namens bestimmen und ebenfalls
in der Datei (26) gespeichert wird.
4. Anordnung zur Durchführung des Verfahrens nach den Ansprüchen 1 und 2,
dadurch gekennzeichnet, daß zur Aufnahme der Datei (26) klassifizierter, gebräuchlicher Wörter ein erster Speicher (144) und zur Aufnahme der Datei
(38) ungebräuchlicher Wörter ein zweiter Speicher (198) angeordnet ist und diese Speicher (144 und 198) über eine Oder-Schaltung (196) mit
,einem ersten Register (192) verbunden sind, daß ein zweites Register
(170) zur Aufnahme des von der Zeichenerkennungevorrichtung erkannten
Docket RO 967 030
109884/1U1
Zeichens vorgesehen ist und daß diese Register (192 und 170) mit einer
Vergleichsschaltung (190) und einem Ausgangsspeicher (178) in Verbindung stehen.
5. Anordnung zur Durchführung des Verfahren nach Anspruch 3, dadurch
gekennzeichnet, daß der Rechner (20 bzw. 152) zur Bestimmung des Quotienten (N /N) mit einer Auswahlschaltung (22) verbunden ist, die
aus "drei Schwellenwert schaltung en (154, 156, 158) besteht, deren Eingänge
parallel geschaltet sind und deren Ausgänge über ein Register (131) mit dem Speicher (144) der Datei (26) klassifizierter gebräuchlicher
Namen zur Übertragung der die Annehmbarkeit der Wörter anzeigenden Markierung verbunden sind.
Docket RO 967 030
109884/1U1
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66640267A | 1967-09-08 | 1967-09-08 | |
US66640267 | 1967-09-08 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1774782A1 true DE1774782A1 (de) | 1972-01-20 |
DE1774782B2 DE1774782B2 (de) | 1976-10-21 |
DE1774782C3 DE1774782C3 (de) | 1977-06-08 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4324495A1 (de) * | 1993-07-21 | 1995-01-26 | Kaufmann Klaus Dieter | Verfahren und Anordnung zum Verringern von Schadstoffemissionen |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4324495A1 (de) * | 1993-07-21 | 1995-01-26 | Kaufmann Klaus Dieter | Verfahren und Anordnung zum Verringern von Schadstoffemissionen |
US5529757A (en) * | 1993-07-21 | 1996-06-25 | Kaufmann; Klaus-Dieter | Apparatus for reducing emissions of pollutants |
Also Published As
Publication number | Publication date |
---|---|
US3492653A (en) | 1970-01-27 |
GB1236455A (en) | 1971-06-23 |
DE1774782B2 (de) | 1976-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2946857C2 (de) | Wortspeichergerät | |
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE19547812C2 (de) | Lesegerät für Schriftzeichenketten | |
DE2322538A1 (de) | Geraet zum auswerten von pruefungsbogen | |
DE2740105A1 (de) | Optische zeichenerkennungseinrichtung | |
DE2747196C2 (de) | Vergleichseinrichtung zum Vergleichen von Informationen variabler Länge | |
DE1810810A1 (de) | Codeablese- und Steuerungsschaltanordnung | |
DE1168127B (de) | Schaltungsanordnung zum Vergleich von Zahlen | |
DE1808895A1 (de) | Einrichtung zur Zeichenerkennung | |
DE1524375A1 (de) | Verfahren und Einrichtung zur Zeichenerkennung | |
DE2435889A1 (de) | Verfahren und einrichtung zum unterscheiden von zeichengruppen | |
DE2110604B2 (de) | Verfahren und Vorrichtung zur Abgabe von Abfragenachrichten an mehrere adressierbare Stationen | |
DE2133638C3 (de) | Verfahren zum Betrieb eines lernfähigen Systems aus in Kaskade geschalteten, zur nicht linearen Datenverarbeitung geeigneten lernfähigen Datenverarbeitungseinheiten | |
DE2321701A1 (de) | Kartenleser mit mehreren lesekanaelen | |
DE1198597B (de) | Anordnung zur Analyse gedruckter Schriftzeichen | |
DE3026055C2 (de) | Schaltungsanordnung zur maschinellen Zeichererkennung | |
DE2460757C2 (de) | Einrichtung zur Auswahl der richtigen Form eines bei der maschinellen Zeichenerkennung verstümmtelten Wortes | |
DE1774782A1 (de) | Verfahren und Anordnung zur statistischen Fehlerreduzierung in Zeichenerkennungsvorrichtungen | |
DE2732143A1 (de) | Zeichenerkennungsgeraet zum abtasten gedruckter zeichen | |
DE2333202A1 (de) | Zeichenerkennungsanordnung | |
DE1549719A1 (de) | Einrichtung zur Zeichenerkennung | |
DE1774782C3 (de) | Anordnung zur statistischen Fehlerreduzierung bei Geräten zur maschinellen Zeichenerkennung | |
DE2718569A1 (de) | Verfahren und anordnung zum erkennen gedruckter zeichen | |
DE4030629C2 (de) | Anordnung zur Sicherung von mit den Speichereinträgen eines Arbeitsspeichers gekoppelten Steuerinformationen in einem Multiprozessorsystem | |
DE2428811A1 (de) | Verfahren und anordnung zur klassifizierung bei der maschinellen zeichenerkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
E77 | Valid patent as to the heymanns-index 1977 | ||
8339 | Ceased/non-payment of the annual fee |