DE60116949T2 - Gesichtserfassungsverfahren - Google Patents

Gesichtserfassungsverfahren Download PDF

Info

Publication number
DE60116949T2
DE60116949T2 DE60116949T DE60116949T DE60116949T2 DE 60116949 T2 DE60116949 T2 DE 60116949T2 DE 60116949 T DE60116949 T DE 60116949T DE 60116949 T DE60116949 T DE 60116949T DE 60116949 T2 DE60116949 T2 DE 60116949T2
Authority
DE
Germany
Prior art keywords
image
faces
face
algorithm
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60116949T
Other languages
English (en)
Other versions
DE60116949D1 (de
Inventor
Lawrence A. łc/o Eastman Kodak Compa Rochester Ray
Henry łc/o Eastman Kodak Company Rochester Nicponski
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24047119&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60116949(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of DE60116949D1 publication Critical patent/DE60116949D1/de
Application granted granted Critical
Publication of DE60116949T2 publication Critical patent/DE60116949T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure

Description

  • Die folgende Erfindung betrifft den Bereich der Bilderfassung und insbesondere den Bereich der Bildverarbeitung zum Zwecke der Verbesserung und Optimierung des Bilderfassungsprozesses mit einer Kamera.
  • Eine überwiegende Zahl der von Fotografen gesammelten Bilder beinhaltet Menschen, die oft das wichtigste Motiv des Bildes darstellen. Die Kenntnis des Vorhandenseins und der Lage der Menschen in einem Bild und insbesondere des Vorhandenseins und der Lage ihrer Gesichter könnte viele vorteilhafte Verbesserungen während des Bilderfassungsprozesses ermöglichen. Einige davon werden nach dem Stand der Technik beschrieben. Beispielsweise erfassen Kameras mit automatischer und halbautomatischer Scharfstellung oder Fokussierung häufig einen Teil der Szene, auf den scharfgestellt wird. Sofern die Kamera Gesichter in einer Szene erkennen könnte, ließe sich die Fokussierung auf die Gesichter optimieren, es sei denn, der Fotograf setzt diese Auswahl absichtlich außer Kraft. In US-A-5,835,616 wird ein zweistufiges Gesichtserfassungssystem in einem automatischen Fotografiervorgang verwendet, um Probleme mit der manuellen Einstellung zu beseitigen, die zu einer schlechten Qualität aufgrund fehlerhaft fokussierter Motive führen könnten.
  • Die Erfassung der Gesichter in einer Szene lässt aussagekräftige Rückschlüsse auf die richtige Lage des Hauptmotivs zu. In diesem Zusammenhang findet der in US-A-5,835,616 beschriebene Prozess automatisch ein menschliches Gesicht in einem digitalisierten Bild, das von einer Digitalkamera aufgenommen wurde, bestätigt das Vorhandensein des Gesichts durch Prüfung der Gesichtsmerkmale und stellt dann die Kamera automatisch auf das erkannte Gesicht mittig. Die Erfassung eines Gesichts liefert zudem aussagekräftige Rückschlüsse auf die richtige Farbbalance für einen Gesichts- und/oder Hautbereich. Beispielsweise führt in US-A-5,430,809 eine Videokamera ein Gesichts-Target automatisch nach, um einen Messrahmen zum Zwecke der automatischen Belichtung und Fokussierung auf das Gesichtsobjekt zu legen. Nachdem der Messrahmen eingerichtet ist, stellt ein automatisches Weißabgleichssystem die Farben ein, um eine optimale Hautfarbe auf dem Gesicht zu erzielen. Daher wird das automatische Weißabgleichssystem als System zur automatischen Durchführung des Hautfarbenabgleichs beschrieben. US-A-5,629,752 beschreibt zudem die Erfassung eines menschlichen Gesichts und die Nutzung der Daten, die die Farbe und/oder die Dichte des Gesichtsbereichs darstellen, um einen Belichtungswert zu ermitteln, damit der dem Gesicht entsprechende Bereich von einem fotografischen Printer einwandfrei gedruckt werden kann.
  • Zwar wurden in den vergangenen Jahren Untersuchungen zur Gesichtserfassung in Bezug auf die Bildanalyse durchgeführt, aber dieser Bereich erfordert immer noch sehr umfangreiche maschinelle Berechnungen, insbesondere wenn ein mächtiger Gesichtserfassungsalgorithmus benötigt wird. Es sind eine Reihe von Verfahren entwickelt worden, die eine beachtliche Leistungsfähigkeit über einen Bereich von Bebilderungsbedingungen aufweisen. Diese Verfahren lassen sich mit größerem Erfolg in großen Verarbeitungseinrichtungen implementieren, wie beispielsweise fotografischen Printern, die (im Vergleich zu einer Handkamera) über relativ komplexe Verarbeitungsressourcen verfügen. Die Herausforderung besteht darin, diese Gesichtserfassungsverfahren verwertbar in einer Kamera mit begrenzten Speicherressourcen und mit geringem Berechnungsaufwand zu implementieren. Wenn dies erfolgreich möglich ist, wird die Erfassung von Gesichtern in einer Szene als Ausgangspunkt für zahlreiche weitere Verbesserungen in dem Bilderfassungsprozess dienen. Die Gesichtserfassung wäre außerdem nützlich, um nachgeordnete Aktivitäten im Anschluss an die Bilderfassung zu implementieren, so könnte beispielsweise die Gesichtserfassung Aufschluss über die Ausrichtung für den nachfolgenden Druckvorgang (auch beispielsweise für Index-Prints) geben.
  • Der vorliegenden Erfindung liegt die Aufgabe zugrunde, Bilder zu erfassen und ein oder mehrere der in den Bildern enthaltenen menschlichen Gesichter zu erkennen, um dem Bilderfassungsprozess einen Mehrwert zu verleihen und die Qualität des erfassten Bildes zu verbessern.
  • Die vorliegende Erfindung löst eines oder mehrere der vorstehend genannten Probleme. Erfindungsgemäß und wie in Anspruch 1 dargelegt, umfasst ein Verfahren zur Bestimmung des Vorhandenseins eines Gesichts anhand von Bilddaten einen Gesichtsdatenerfassungsalgorithmus, der aus zwei getrennten Algorithmenschritten besteht: einem ersten Schritt zur Vor prüfung der Bilddaten mit einer ersten Komponente des Algorithmus, um einen oder mehrere mögliche Gesichtsbereiche des Bildes aufzufinden; und einem zweiten Schritt, bei dem die möglichen Gesichtsbereiche einer Verarbeitung mit einer zweiten Komponente des Algorithmus unterzogen werden, um das Vorhandensein eines Gesichts in dem Bereich zu bestätigen, wobei die Kombination dieser Komponenten eine höhere Leistung in Bezug auf Erkennungsquote liefert, als dies mit jeweils einer einzelnen Komponente möglich wäre. In einer Kameraimplementierung umfasst eine Digitalkamera einen Algorithmenspeicher zum Speichern eines Algorithmus, der sich aus der vorstehend genannten ersten und zweiten Komponente zusammensetzt, sowie einen elektronischen Verarbeitungsbereich zur Verarbeitung der Bilddaten zusammen mit dem Algorithmus, um das Vorhandensein eines oder mehrerer Gesichter in der Szene zu bestimmen. Gesichtsdaten, die auf das Vorhandensein von Gesichtern hinweisen, lassen sich nutzen, um beispielsweise Belichtungsparameter für die Bilderfassung zu steuern, oder um verarbeitete Bilddaten zu erzeugen, die sich beispielsweise auf die Farbbalance, auf das Vorhandensein von Gesichtern in dem Bild oder auf die Gesichtsdaten beziehen, die zusammen mit den Bilddaten auf einem Speichermedium gespeichert werden.
  • Die Erfindung wird im Folgenden anhand in der Zeichnung dargestellter Ausführungsbeispiele näher erläutert.
  • Es zeigen:
  • 1 ein Blockdiagramm einer Gesichtserfassungskamera zur Darstellung einer Anordnung von erfindungsgemäßen Kameraelementen.
  • 2 ein Blockdiagramm einer Bilderfassungssektion der in 1 gezeigten Kamera.
  • 3 ein Ablaufdiagramm der Kameraoperationen der in 1 gezeigten Kamera in einem Anvisiermodus.
  • 4 ein Ablaufdiagramm der Kameraoperationen der in 1 gezeigten Kamera in einem Finalbildmodus.
  • 5 ein Ablaufdiagramm zur Darstellung der Erzeugung von Kompositions- oder Bildaufbauempfehlungen.
  • 6 eine Darstellung eines Bildbereichs, der zur Anwendung des Drittelsatzes in ein Gitter unterteilt ist.
  • 7A, 7B, 7C und 7D Beispiele der Formenmodelle für frontale und rechte, semi-frontale Posen, die in einem der Gesichtserfassungsalgorithmen zur Anwendung kommen.
  • 8A und 8B grafische Darstellungen von Wahrscheinlichkeitsdichten für Haut, die in einem der Gesichtserfassungsalgorithmen zur Anwendung kommen.
  • 9A und 9B grafische Darstellungen für Wahrscheinlichkeitsdichten für Haar, die in einem der Gesichtserfassungsalgorithmen zur Anwendung kommen.
  • 10A, 10B und 10C ein Originalbild und dessen Rekonstruktion nach einer Hauptkomponentenanalyse gemäß einem der Gesichtserfassungsalgorithmen.
  • Da Bebilderungssysteme, die elektronische und Filmerfassung verwenden, bekannt sind, bezieht sich die vorliegende Beschreibung insbesondere auf Attribute, die Teil der erfindungsgemäßen Vorrichtung und Systeme sind oder direkt damit zusammenwirken. Hier nicht gezeigte oder beschriebene Attribute und Komponenten sind aus den nach dem Stand der Technik bekannten wählbar. In der folgenden Beschreibung würde ein bevorzugtes Ausführungsbeispiel des Gesichtserfassungsalgorithmus als ein Softwareprogramm implementiert werden, obwohl Fachleute selbstverständlich wissen, dass das Äquivalent zu dieser Software auch in Hardware implementierbar ist. Was die folgende Beschreibung des Systems und des Verfahrens betrifft, ist die gesamte Software-Implementierung von herkömmlicher Art und entspricht dem üblichen Kenntnisstand in dieser Technik. Wenn die Gesichtserfassung der vorliegenden Erfindung als Computerprogramm implementiert wird, kann das Programm auf einem herkömmlichen, computerlesbaren Speichermedium gespeichert werden, beispiels weise auf magnetischen Speichermedien, wie Magnetplatten (z.B. Diskette) oder auf Magnetband, optischen Speichermedien, wie einer optischen Platte, einem optischen Band oder einem maschinenlesbaren Strichcode, auf Halbleiterspeichervorrichtungen, wie RAM (random access memory) oder ROM (read only memory) oder auf jeder anderen physischen Vorrichtung oder jedem anderen Medium, das zur Speicherung eines Computerprogramms geeignet ist.
  • Wie in Blockdiagrammen aus 1 und 2 dargestellt, wird eine Kamera 10 als ein integriertes System gezeigt, das die Komponenten einer Standardkamera beinhaltet, einschließlich einer Bilderfassungssektion 20, einem Prozessor oder einer zentralen Verarbeitungseinheit (CPU) 30, einem digitalen Speicher 32 zur Speicherung erfasster Bilder und zugehöriger Anmerkungen, die sich auf die Bilder beziehen, sowie einer Displayeinrichtung 34 zur Anzeige erfasster Bilder und/oder anderer für den Betrieb der Kamera nützlicher Daten. Die Erfassungssektion 20 umfasst eine optische Sektion 21 mit Autofokus-Funktionalität zur Fokussierung eines Bildes 22 (das zum Zwecke dieser Beschreibung ein oder mehrere Gesichter umfasst) auf einem Bildsensor 23, beispielsweise einem konventionellen CCD (charge-coupled device). Ein Belichtungssteuerungsmechanismus 24 umfasst eine Blende und einen Verschluss zur Regulierung der Belichtung eines Bildes auf dem Bildsensor 23. Anstelle einer (oder zusätzlich zu einer) elektronischen Erfassungsvorrichtung kann die Erfassungssektion eine analoge Speichervorrichtung 25 umfassen, beispielsweise einen konventionellen fotografischen Film. Im Falle des bekannten APS-Films, der eine magnetische Aufzeichnungsschicht beinhaltet, kann eine Aufzeichnungsvorrichtung 26 ergänzende Daten aufnehmen, die die erfassten Bilder auf der Magnetschicht betreffen. Zur Beleuchtung des Bildes 22 bei unzuweichenden Lichtverhältnissen ist eine Blitzeinheit 27 vorgesehen.
  • Die CPU 30 ist über einen Systembus 40 mit einem RAM 42 (random access memory), einem ROM 44 (read only memory), einem I/O-Adapter 46 (input/output) verbunden (um die Bilderfassungssektion 20, den digitalen Speicher 32, die Aufzeichnungsvorrichtung 26 und die Blitzeinheit 27 mit dem Bus 40 zu verbinden), einem Kommunikationsadapter 48 (für den direkten Anschluss eines Informationshandlingsystems oder eines Datenverarbeitungsnetzes, beispielsweise des Internet), einer Zielnachführungsstufe 49 (zum Erzeugen eines Messrahmens 49a, der die Gesichter nachführt), einem Benutzeroberflächenadapter 50 (zum Anschließen von Vorrichtungen für die Benutzeroberfläche, wie einer Verschlusstaste 52, Blitzeinstelltasten 54, Belichtungsprogrammtasten 56, einem benutzergeführten Displaycursor 58 und/oder anderen mit dem Systembus 40 verbundenen Bedienungseinrichtungen), einem Algorithmusschnittstellenadapter 60 (zum Anschluss verschiedener gespeicherter Algorithmen an den Systembus 40, einschließlich eines Gesichtserfassungsalgorithmus 90) und einer Display-Schnittstelle 70 (zum Anschluss des Systembusses 40 an die Displayeinrichtung 34). Die CPU 30 ist ausreichend leistungsstark und hat einen ausreichend bemessenen Speicher 42 und 44, um den Gesichtserfassungsalgorithmus 90 ausführen zu können. Eine mit dem Systembus 40 verbundene Trainingsdatenbank verfügt über ausreichende Trainingsdaten, um dem Gesichtserfassungsalgorithmus 90 den Betrieb für einen großen Bereich an Bebilderungsbedingungen zu ermöglichen. In dem vorliegenden Ausführungsbeispiel, wie nachfolgend detaillierter beschrieben wird, umfasst der Gesichtserfassungsalgorithmus zwei Komponentenalgorithmen, nämlich einen ersten Komponentenalgorithmus, der einen potentiellen Gesichtsbereich des Bildes anhand eines Vergleichs zwischen Gesichtsformenmodellen und Gesichtswahrscheinlichkeiten ermittelt, die den Bildpixeln innerhalb des Bereichs zugeordnet sind, und einem zweiten Komponentenalgorithmus, der den potentiellen Gesichtsbereich einer Musteranalyse unterzieht, um jeden Bereich des Bildes zu untersuchen und damit das Vorhandensein eines Gesichtes in dem Bereich zu bestätigen. Der Vorteil bei dieser Kombination liegt darin, dass der erste Komponentenalgorithmus schnell arbeiten kann, allerdings mit einer gewissen Fehlerquote, und dass der zweite Komponentenalgorithmus seine berechnungsintensive Verarbeitung auf relativ wenige Bereiche beschränkt, die von dem ersten Algorithmus positiv erkannt wurden.
  • Die Ergebnisse der Gesichtserfassung werden benutzt, um eine Reihe von Kamerafunktionen zu steuern, die in den Algorithmen ausgeführt sind, die mit dem Datenbus 40 über den Algorithmusschnittstellenadapter 60 verbunden sind. Die Ergebnisse der Gesichtserfassung werden von einer Zielnachführungsstufe 49 nachgeführt, um den Mittelpunkt einer oder mehrerer Gesichtspositionen nachzuführen. Der Messrahmen wird wie in US-A-5,430,809 beschrieben, verwendet, um die zum Zwecke der automatischen Fokussierung, der automatischen Belichtung, des automatischen Farbabgleichs und des automatischen Weißabgleichs gesammelten Daten auf die Gesichtsbereiche zu beschränken. Der Messrahmen kann ein kleiner, punktförmiger Bereich sein, oder er kann derart konfiguriert sein, dass seine Grenzen im Allgemeinen mit den Grenzen eines oder mehrerer Gesichter zusammenfallen; in beiden Fällen ist vorgesehen, die für die Algorithmen gesammelten Daten auf Gesichtsdaten oder einige Muster davon zu beschränken. Diese Algorithmen umfassen einen Rote-Augen-Korrekturalgorithmus 80, einen Belichtungssteuerungsalgorithmus 82, einen Blitzsteuerungsalgorithmus 84, einen Fokussteuerungsalgorithmus 86, einen Farbbalancesteuerungsalgorithmus 88 und einen Kompositionsalgorithmus 92. Der Rote-Augen-Korrekturalgorithmus 80 stimmt die gespeicherten, digitalen Pixelwerte ab, um einen von der Blitzeinheit 27 erzeugten Rote-Augen-Zustand zu entfernen. Der Belichtungssteuerungsalgorithmus 82 ermittelt aus dem Messrahmen 49a Parameter für den Bildbelichtungssteuerungsmechanismus 24 in der Bilderfassungssektion 20 der Kamera, um die Gesichter einwandfrei zu belichten. In Verbindung mit der Ermittlung der Belichtungssteuerung ermittelt der Blitzsteuerungsalgorithmus 84, ob der Blitz zur optimalen Erfassung der Gesichtsbilder ausgelöst werden soll. Die Kamera verwendet den Fokussteuerungsalgorithmus 86, um Entfernungsdaten von dem Messrahmen 49a abzuleiten und um einen zielbaren Fokussiermechanismus in der Optiksektion anhand der Ergebnisse eines Anvisierbildes derart einzustellen, dass ein final erfasstes Bild einwandfrei auf die Gesichtsbereiche fokussiert ist. Der Farbbalancesteuerungsalgorithmus 88 wird auf die digitale Bilddatei angewandt, um die Darstellung der Hautbereiche innerhalb des Messrahmens 49a so zu optimieren, dass diese dem erwarteten Farbbereich der Hauttöne entsprechen.
  • Die Displayeinrichtung 34 ermöglicht es einem Fotografen, ein Bild vor der Erfassung zu betrachten und/oder das zuletzt erfasste Bild anzusehen. Zudem ist ein optischer Sucher 28 vorgesehen, um ein Bild vorab zu betrachten. Darüber hinaus kann die CPU 30 den Gesichtserfassungsalgorithmus verwenden, um Gesichter innerhalb des betrachteten Bildes bei Bedarf hervorzuheben. Zu diesem Zweck kann ein halbtransparentes LCD-Overlay 29 in dem optischen Sucher 28 bereitgestellt werden; ein LCD-Treiber 29a aktiviert bestimmte Bereiche des LCD-Overlays 29, die einer oder mehreren Gesichtspositionen entsprechen, und zwar abhängig von Gesichtspositionsdaten aus der CPU 30 (eine derartige LCD-Maske wird in US-A-5,103,254 beschrieben). Die CPU 30 kann hervorgehobene oder umrissene Gesichter erzeugen, indem sie den Mustergenerator 74 über die Display-Schnittstelle 70 ansteuert, um beispielsweise einen Rahmen über einem Gesicht in einem an der Displayeinrichtung 34 angezeigten Betrachtungsbereich darzustellen. Zudem können die Gesichter seitens eines Fotografen markiert werden, indem dieser den Cursor 58 auf den Betrachtungsbereich der Displayeinrichtung 34 bewegt, so dass dieser beispielsweise auf einem Gesicht liegt oder um ein Gesicht herum einen Rahmen zieht. Auch dieses könnte durch den LCD-Treiber 29a und das LCD-Overlay 29 in dem optischen Sucher 28 erfolgen.
  • Ein weiterer Vorteil der vorliegenden Erfindung besteht darin, dass die der Erfassung von Gesichtern in einem Bild zugeordneten Daten automatisch aufgezeichnet und als eine Anmerkung einem Bild beigefügt werden könnten. Dies ermöglicht die automatische Aufzeichnung wichtiger Motive innerhalb einer fotografischen Aufzeichnung von Ereignissen, ohne dass der Fotograf die Anmerkungen zum Zeitpunkt der Bilderfassung oder zu einem späteren Zeitpunkt vornehmen müsste. Die Erfassung von Gesichtern in der Szene ermöglicht wesentliche zusätzliche Verbesserungen des Bilderfassungsereignisses und in der nachfolgenden Verarbeitung des Bildes. Die Gesichtserfassung eignet sich beispielsweise zur Indizierung von Bildern für den späteren Rückgriff, indem beispielsweise auf Bilder zugegriffen wird, die als Motiv einen oder mehrere Menschen beinhalten. Die Ausführung des Gesichtserfassungsalgorithmus erzeugt somit Gesichtsdaten, die einem oder mehreren Parametern entsprechen, wie der Lage, der Ausrichtung, dem Maßstab und der Pose eines oder mehrerer der erfassten Gesichter. Nachdem Gesichter erfasst worden sind, lässt sich zudem ein einfacher Gesichtserkennungsalgorithmus anwenden, um Gesichter aus einer kleinen Galerie von Trainingsgesichtern zu identifizieren, die die Kamera zuvor mit Unterstützung des Benutzers erfasst und in einer Trainingsdatenbank gespeichert hat. Die Ergebnisse der Gesichtserfassung und die Lage werden in einem, dem Bild anhängenden Zusatzdatenbereich abgelegt und gemeinsam in dem Pufferspeicher im RAM 42 gespeichert. Bilder werden beispielsweise mit den Koordinaten der erfassten Gesichter, der geschätzten Gesichtsgröße, der Position der Augen, einer ungefähren Schätzung der Posenparameter des Kopfes und der Identität jedes Individuums ergänzt. Sobald ein Bild zur Speicherung ausgewählt worden ist, können das Bild und die Zusatzdaten entweder gemeinsam in dem digitalen Bildspeicher 32 gespeichert werden, oder die Zusatzdaten können in der Magnetschicht des analogen Bildspeichers 25 gespeichert werden (das Bild würde als konventionelles Latentbild auf der fotografischen Emulsion gespeichert werden). In einer Konfiguration für eine Digitalkamera werden die erfassten Bilddaten in dem Speichermedium in digitalen Ordnern aufgezeichnet, die Bildern mit einer bestimmten Anzahl von Gesichtern in der Szene zugeordnet sind.
  • Es sei darauf hingewiesen, dass ein weiteres Ausführungsbeispiel der Erfindung eine Hybridkamera ist, die ein Bild einer Szene sowohl auf einem elektronischen Medium, wie beispielsweise dem Bildsensor 23, als auch auf einem Filmmedium, wie dem APS-Film 25, erfasst. In diesem Ausführungsbeispiel verarbeitet die CPU 30 die Bilddaten aus dem Bildsensor 23, um das Vorhandensein eines oder mehrerer Gesichter in der Szene zu ermitteln, und Gesichts daten werden entsprechend der Lage, dem Maßstab oder der Pose mindestens von einem Gesicht in dem Bild erzeugt. Diese Gesichtsdaten könnten dem Benutzer der Kamera am Display 34 angezeigt werden, um das erfasste Bild zu bewerten. Wenn die Gesichtsdaten (oder das Bild) auf ein Problem mit dem erfassten Bild hinweisen, würde der Benutzer die Gelegenheit haben, das Bild auf einem anderen Bildfeld des Films 25 erneut zu erfassen. Zudem könnten die Gesichtsdaten auf die Magnetschicht des Filmmediums 25 durch Aktivierung der Aufzeichnungseinheit 26 geschrieben werden.
  • Wie in 3 und 4 gezeigt, arbeitet die Kamera zunächst in einem Anvisiermodus und dann in einem finalen Bebilderungsmodus. In jedem Modus bietet die Kamera zahlreiche Automatikfunktionen zur Unterstützung des Fotografen. Der Fotograf hat die Wahl, den Anvisiermodus durch den Benutzeroberflächenadapter 50 zu deaktivieren, wodurch er die Erfassung des Anvisierbildes unterbindet und direkt in den finalen Bebilderungsmodus wechselt.
  • Anvisiermodus.
  • In dem in 3 gezeigten Anvisiermodus erfasst die Kamera 10 in Schritt 100 durch Betätigung der Erfassungssektion 20 ein Anvisierbild. Die CPU 30 führt dann den Gesichtserfassungsalgorithmus 90 in Schritt 120 aus, womit sie versucht, Gesichter in dem Anvisierbild zu erfassen und dem Fotografen im Sucher 28 oder an der Displayeinrichtung 34 deren Lage anzuzeigen. Insbesondere verwendet der Gesichtserfassungsalgorithmus Gesichtstrainingsdaten aus der Trainingsdatenbank 72, um Gesichter aufzufinden. Sofern Gesichter in dem Entscheidungsblock 130 erfasst werden, werden die Gesichtslagedaten in Schritt 140 im RAM 42 zur nachfolgenden Verwendung von einer oder mehreren Kameraalgorithmen gespeichert. Die Gesichtslagedaten werden von der Display-Oberfläche 70 verarbeitet, d.h. dass beispielsweise die an der Displayeinrichtung 34 gezeigten Gesichter mit einem Rahmen oder einem anderen Umrissmerkmal umgeben werden. Wenn der Gesichtserfassungsalgorithmus 90 keine Gesichter finden kann, wird diese Tatsache in dem Ergebnis des Entscheidungsblocks 130 berücksichtigt. In Reaktion auf eine nicht erfolgte Gesichtserfassung, d.h. wenn keine Gesichter aufgefunden werden konnten, kann der Fotograf über den Pfad 132 an den Anfang zurückkehren, den Bildaufbau der Szene verändern und einen neuen Erfassungslauf beginnen, oder er kann in einem manuellen Entscheidungsblock 134 eine manuelle Eingabe in die Kamera mithilfe des Cursors 58 vornehmen, um ein Gesicht am Sucher 28 oder am Display 34 manuell zu lokalisieren. Andere Eingabetechniken sind ebenfalls verwendbar, beispielsweise ein (nicht gezeigter) berührungsempfindlicher Bildschirm und Stift. Mit Kenntnis des Vorhandenseins eines Gesichts und der Lage des Gesichts in dem Anvisierbild ist die Kamera 10 anschließend in der Lage, dem Fotografen wertvolle Dienste bereitzustellen, die dazu verwendet werden können, das final erfasste Bild zu verbessern. Derartige Dienste umfassen die Fokussierungsunterstützung, die Belichtungs- und Blitzeinstellung sowie Kompositionshilfen, wie nachfolgend beschrieben.
  • Fokussierungsunterstützung.
  • Viele moderne Kameras bieten eine automatische Fokussierung oder eine benutzerseitig veranlasste Fokussierung über einen Fokussierungszielpunkt im Sucher. Da Menschen, sofern sie aufgenommen werden, normalerweise die wichtigsten Motive in Bildern darstellen, ist es sinnvoll, das Bild auf die Gesichter der Menschen zu fokussieren, sofern der Fotograf keine anderen Instruktionen erteilt. In der Technik sind Systeme bekannt (siehe beispielsweise US-A-5,749,000), die mehrere Fokuserfassungsbereiche und einen steuerbaren Auswahlmechanismus umfassen, der einen dieser Bereiche abhängig von einem Eingangssignal auswählt (beispielsweise einer Sprachanweisung). Alternativ hierzu und wie in dem vorstehend genannten Patent US-A-5,430,809 beschrieben, lässt sich die Autofokussierung innerhalb eines Messrahmens durchführen, der auf ein Gesicht eingestellt ist. In Verbindung mit der vorliegenden Erfindung und nach Durchführung der Gesichtserkennung in dem Anvisierbild aktiviert die Kamera 10 den Fokussteuerungsalgorithmus 86 in einem Fokussierschritt 150, um das steuerbare Autofokussystem in der Optiksektion 21 zu verwenden und einen bestimmten Fokuserfassungsbereich auszuwählen, der das Bild optimal auf die Gesichter in der Szene fokussiert. (Alternativ hierzu könnte der Fokus optimal auf das größte Gesicht in der Szene eingestellt werden, von dem angenommen wird, dass es das primäre Motiv darstellt.)
  • Belichtungs- und Blitzeinstellung.
  • Die Kamera 10 sieht eine automatische Belichtungssteuerung und einen automatischen Blitzeingriff durch den Belichtungssteuerungsalgorithmus 82 und den Blitzsteuerungsalgorithmus 84 vor. Eine typische mikroprozessorgesteuerte Belichtungssteuerungseinrichtung wird in US-A-4,503,508 beschrieben und für Umgebungs- und Blitzbelichtung verwendet. Die von diesem Patent vorgesehene Belichtungssteuerungsfunktionalität kann auf den Gesichtsbereich innerhalb des Messfensters 49a beschränkt oder gerichtet werden, wie in Bezug zu dem zuvor genannten Patent US-A-5,430,809 beschrieben. Da Menschen normalerweise das wichtigste Motiv in Bildern sind, in denen sie erscheinen, ist es sinnvoll, die Belichtung auf das Vorhandensein von menschlichen Gesichtern zu optimieren, sofern der Fotograf keine anderen Instruktionen erteilt. Nach Durchführung der Gesichtserfassung im Anvisierbild nutzt die Kamera ihren automatischen Belichtungsalgorithmus 82, um die Bildbelichtung in einem Schritt 160 auf den Erfassungsbereich optimal einzustellen, der dem Schwerpunkt der Gesichter in der Szene entspricht. (Alternativ hierzu könnte die Belichtung optimal auf das größte Gesicht in der Szene eingestellt werden, von dem angenommen wird, dass es das primäre Motiv darstellt.) Der Belichtungssteuerungsalgorithmus 82 ermittelt anhand der Ausleuchtung der Gesichter in der Szene, ob der Blitz 27 ausgelöst werden muss. Wenn die Beleuchtung unzureichend ist, schaltet sich der Blitzsteuerungsalgorithmus 84 ein und steuert die Blitzeinheit 27 in Schritt 170.
  • Bildaufbauhilfen.
  • Die Gesichtserfassungskamera 10 stellt in Schritt 180 einen Kompositionsunterstützungsmodus bereit, womit der Fotograf beim Aufbau des Bildes unterstützt wird. Vielen Hobby-Fotografen gelingt aus ästhetischer Sicht nur eine unzureichende Bildkomposition. Zusammen mit einer fehlerhaften Fokussierung und Belichtung zählt der schlechte Bildaufbau wohl zu den Hauptursachen für nicht zufriedenstellende Bilder. Verschiedene heuristische "Daumenregeln" gelten als allgemein anerkannte Richtschnur für die Komposition gelungener Bilder.
  • Ein zu kleines Hauptmotiv macht beispielsweise ein Bild uninteressant. Nach der sogenannten "Drittelregel" sollte das Hauptmotiv ungefähr auf einer Achse liegen, die das Bild jeweils zu ein Drittel teilt, und zwar entweder vertikal, horizontal oder in beiden Richtungen. Diese Grundregeln werden detailliert beschrieben in Grill, T. and Scanlon, M., Photographic Composition, Amphoto Books, 1990.
  • Die Gesichtserfassungskamera 10 stellt den Bildaufbau-Unterstützungsmodus 180 bereit, in dem ein Bildaufbaualgorithmus 82 anhand der Ergebnisse der Gesichtserfassung in dem Anvisierbild aktiviert wird, um Bildaufbauempfehlungen zu erzeugen, die in dem Sucher oder an der Displayeinrichtung 34 angezeigt werden. Der Bildaufbaualgorithmus geht anhand der in 5 gezeigten Schritte vor, wobei jedoch darauf hingewiesen sei, dass auch andere Bildaufbauelemente geprüft werden könnten (wie in der genannten Quelle von Grill und Scanlon beschrieben). Eine Bildaufbauhilfe vergleicht den Bereich des größten erfassten Gesichts mit dem gesamten Bildbereich (Schritt 181). Wenn der Vergleich einen Schwellenwert (Schritt 182) überschreitet, was darauf hinweist, dass die Gesichter zu klein sind, empfiehlt ein Hinweis am Display 34, die Kamera näher an das Hauptmotiv heranzuführen (Schritt 183). Eine zweite Bildaufbauhilfe vergleicht (Schritt 184) die Mittelpunkte der Gesichter mit Gitterlinien, wie in 6 gezeigt, die die Drittelregel darstellen, nämlich die Position in dem Bild, in dem das Hauptmotiv am besten zur Geltung kommt (eine detaillierte Beschreibung findet sich bei Grill und Scanlon auf Seite 22). Wenn die Gesichter stark von den Gitterlinien abweichen (Schritt 185), empfiehlt ein Hinweis am Display 34, das Hauptmotiv nach der Drittelregel anzuordnen, um ein gefälligeres Bild zu erhalten (Schritt 186). Eine Drittelbildaufbauhilfe sucht nach Gesichtern, die von den Bildrändern geschnitten werden (Schritt 187). Wenn ein Schwellenwert anzeigt, dass ein wesentlicher Teil des Gesichts von der Kameraapertur abgeschnitten wird (Schritt 188), erscheint am Display 34 ein entsprechender Hinweis für den Fotografen (Schritt 189). Eine vierte Bildaufbauhilfe setzt die Gesichtsmittelpunkt in Beziehung zu einer horizontalen Linie (Schritt 190). Wenn die Gesichter auf einer gemeinsamen horizontalen Linie zu liegen scheinen (Schritt 192), wird empfohlen, die Höhe der Gesichter in einem Bild von einer Gruppe von Menschen zu variieren, um eine interessantere Bildaussage zu erhalten. Die Darstellung in 5 soll einen derartigen Algorithmus allgemein darstellen, wobei andere Bildaufbauregeln, wie die in der genannten Quelle von Grill und Scanlon beschrieben, die durch Nennung als hierin aufgenommen betrachtet wird, in ähnlicher Weise implementiert werden können.
  • Finaler Bebilderungsmodus.
  • Unmittelbar nach Erfassung und Verarbeitung des Anvisierbildes, wie in 3 gezeigt, ist die Kamera zur Erfassung des finalen Bildes bereit, wie in 4 gezeigt, wobei dem Fotografen die im vorherigen Abschnitt beschriebenen und in den Schritten 150180 erwähnten Hilfen bereitgestellt worden sind. Die in 4 gezeigten ersten Schritte 200240 sind mit den Schritten 100140 aus 3 identisch und werden daher nicht weiter beschrieben. Zusätzlich dazu werden in 4 weitere Hilfen direkt auf das finale Bild angewandt. Wie zuvor erwähnt, kann der Fotograf entscheiden, nur mit einem finalen Bild zu arbeiten (wobei das Anvisierbild wegfällt), wenn ausschließlich die zweite Gruppe von Hilfen gewünscht wird. Wenn das an der Displayeinrichtung 34 dargestellte Anvisierbild dem Benutzer als zufriedenstellend erscheint, kann dieses als permanentes Bild gespeichert werden. In beiden Fällen werden mehrere Dienste als Teil des finalen Bebilderungsmodus bereitgestellt, unter anderem eine optimale Farbbalance, eine Rote-Augen-Anzeige- und Korrektur, eine Ausrichtungsmarkierung und Gesichtsbezeichnung.
  • Optimale Farbbalance.
  • Während das menschliche Auge in der Lage ist, Farben über unterschiedliche Szenenbedingungen hinweg konstant wahrzunehmen, verfügen weder analoge noch digitale Kameras über diese Fähigkeit. Beispielsweise erscheint dem menschlichen Auge die Farbe eines Objekts gleich, unabhängig davon, ob das Objekt in Sonnenlicht, in diffusem Licht oder in Kunstlicht betrachtet wird; im Unterschied dazu führen diese drei Szenenzustände bei Erfassung auf einem identischen fotografischen Film notwendigerweise zur Reproduktion sehr unterschiedlicher Farben. Es ist daher üblich, Farbbalancealgorithmen (CBAs) auf erfasste Bilder anzuwenden, bevor diese gedruckt oder in anderer Form angezeigt werden. Die automatischen Farbbalancealgorithmen nach dem Stand der Technik versuchen, die gängigsten Szenenlichtverhältnisse zu kompensieren.
  • Eine bessere Farbbalance lässt sich für ein Bild durchführen, indem man bestimmte Aspekte über die Art der Objekte in der Szene sowie deren relative Bedeutung berücksichtigt. Wenn die gesamte Szene einwandfrei reproduziert ist, die Farbe der Gesichter jedoch deutliche Farbveränderungen aufweist, gilt das gesamte Bild als inakzeptabel. Menschen reagieren auf die falsche Wiedergabe von Hauttönen sehr empfindlich, wobei es allerdings kulturelle Unterschiede bezüglich dessen gibt, was als inakzeptabel betrachtet wird. Die Abweichungen der Hauttöne unter unterschiedlichen Personen und ethnischen Gruppen lassen sich statistisch kategorisieren und einordnen. Es kann allerdings zufällig vorkommen, dass die natürliche Schwankung von Hauttönen und störende Fehler bei der Hauttonwiedergabe auf orthogonale Verschiebungen in ansonsten einwandfrei ausgewählten Farbraumdarstellungen zurückzuführen sind. Die Hautfarben verändern sich entlang der Blau-Rot-Dimension, während inakzeptable Wiedergabefehler hauptsächlich die Grün-Purpurrot-Dimension betreffen.
  • Die Kenntnis des Vorhandenseins und der Lage von Gesichtern in einer Szene kann in zweifacher Hinsicht zu einer verbesserten Farbbalance führen. Wenn nur eine globale Bildkorrektur zur Verfügung steht (wie beim optischen Drucken analoger Bilder), kann die Bestimmung der globalen Beleuchtung derart abgestimmt werden, dass die Hauttöne der Gesichter harmonisch wiedergegeben werden. Die Gesichtserfassungskamera ermöglicht durch Aufzeichnung der Lage und Größe der Gesichter in der Magnetschicht des analogen Films 25 eine Optimierung der Farbbalance zur einwandfreien Wiedergabe der Hauttöne in den Gesichtern durch die optische Fotofinishing-Ausrüstung. Wenn ein digitaler Verarbeitungsschritt zur Verfügung steht, lassen sich die Gesichtsbereiche unabhängig von globalen Überlegungen zur Beleuchtung korrigieren. Dies ist das bestmögliche Szenario, das zu einem besseren Ausdruck führt, als dies durch ausschließlich optische Mittel möglich wäre, da sowohl die primären Motive (Menschen) als auch die Hintergrundbereiche ansprechend reproduziert werden können. In jedem Fall verwendet die Kamera 10 einen Farbbalancealgorithmus 88 in einem Gesichtspräferenz-Korrekturschritt 260, um eine optimale Farbbalance für das Bild zu erreichen, die sich zumindest teilweise auf die lokalisierten Gesichter stützt. Insbesondere kommuniziert die CPU 30 mit dem Messrahmen 49a, der von der Nachführungsstufe 49 erstellt wurde, um Farbdaten aus den erfassten Gesichtern zu sammeln und dann den Farbbalancealgorithmus 88 auf den Gesichtsbereich zu gewichten.
  • Rote-Augen-Meldung und -korrektur.
  • Ein Rote-Augen-Erfassungsalgorithmus 80, wie beispielsweise der in der Parallelanmeldung US-A-5,432,863 beschriebene, wird in der Rote-Augen-Korrekturstufe 270 gegen das final erfasste Bild durchgeführt. Das erfasste Vorhandensein eines Gesichts wird als zusätzlicher Nachweis in dem Rote-Augen-Algorithmus 80 verwendet, um eine irrtümliche positive Erkennung zu vermeiden. Das Vorhandensein von zwei erfassten roten Augen sollte durch den Nachweis eines vorhandenen Gesichts bekräftigt werden. Das Vorhandensein roter Augen kann der Display-Schnittstelle 70 auch von dem Rote-Augen-Erfassungsalgorithmus gemeldet werden, worauf die Schnittstelle eine entsprechende Warnung an die Displayeinrichtung 34 weiterleitet. Nach Eingang der Rote-Augen-Meldung kann sich der Fotograf entscheiden, ein weiteres Bild aufzunehmen. Alternativ hierzu, und sofern die Kamera 10 eine Digitalkamera ist, kann der automatische Rote-Augen-Korrekturalgorithmus aufgerufen werden, um die störenden roten Punkte in den Augen zu entfernen.
  • Ausrichtungsmarkierung.
  • Viele Aufträge von Endverbrauchern zur Vervielfältigung ihrer Fotografien werden mittlerweile mit einem Index-Print ausgeliefert, auf dem kleine Abbildungen jeder Fotografie in Folge dargestellt sind. Der Nutzen des Index-Prints wird herabgesetzt, wenn nicht alle Bilder in der natürlichen, richtigen Ausrichtung abgedruckt sind. Das Vorhandensein von Gesichtern in einem Bild ist ein leistungsstarkes Mittel zur Bestimmung der richtigen Ausrichtung. Beispielsweise lassen sich die Gesichtsabmessungen in ihre Hauptachsen trennen, wobei die längste Achse als die von oben nach unten verlaufende Achse interpretiert werden kann; anschließend kann einer der später beschriebenen Gesichtserfassungsalgorithmen den Haarbereich ermitteln und somit eine richtige Ausrichtung bestimmen. Die Mehrzahl der Gesichter ist vertikal oder nahezu vertikal im Sinne der gesamten Bildausrichtung angeordnet. Der Gesichtserfassungsalgorithmus 90 in der Gesichtserfassungskamera 10 ermittelt die Ausrichtung und markiert jedes erfasste Bild in der Bildspeichervorrichtung 32 (oder 25) mit einer Anmerkung zur richtigen Ausrichtung, wie anhand der in dem Ausrichtungsschritt 280 ermittelten Gesichtsausrichtung empfohlen.
  • Gesichtsbezeichnung.
  • Nachdem Gesichter erfasst worden sind, kann ein einfacher Gesichtserkennungsalgorithmus angewandt werden, um Gesichter aus einer kleinen Galerie von Trainingsgesichtern zu identifizieren, die die Kamera zuvor mit Hilfe des Benutzers erfasst und in der Trainingsdatenbank 72 abgelegt hat. Die Galerie sollte beispielsweise die einzelnen Personen einer Familie enthalten oder Kinder einer Schulklasse. Wenn von der Kamera ein neues Bild erfasst und die Gesichter ermittelt worden sind, kann die Identität jedes Individuums, wie von dem Gesichtserkennungsalgorithmus ermittelt, zusammen mit dem Bild in dem digitalen Speicher 32 oder auf der Magnetschicht des Films 25 aufgezeichnet werden. Diese Gesichtsidentitätsinformationen fließen zusammen mit dem Bild in das Fotofinishing oder in die nachfolgende Computerverarbeitung ein. Die Informationen können dazu dienen, automatisch Etiketten mit den Namen der in dem Bild dargestellten Personen zu drucken. Andere mögliche Anwendungen betreffen die automatische Erstellung von Alben, die Bilder einer einzelnen Person oder einer Personengruppe enthält, wie vom Kunden angegeben. Für einen typischen Gesichtserkennungsalgorithmus steht eine Reihe kommerziell erhältlicher Gesichtserkennungsprodukte zur Verfügung, die entsprechende Software-Entwicklungskits bereitstellen, welche es ermöglichen, die Algorithmen als größere Systeme einzubinden. Beispielsweise wäre das "Face-It"-System von Visionics Corp. zur Verwendung als Gesichtserkennungsalgorithmus geeignet.
  • Gesichtserfassungsalgorithmen.
  • Ein Gesichtserfassungsalgorithmus, der in einer Digitalkamera arbeitet, muss die Kriterien erfüllen, die erforderlich sind, um einen Betrieb unter begrenzten Rechen- und Speicherressourcen zu ermöglichen. Das bedeutet, dass der Algorithmus schnell (in weniger als einer Sekunde) und mit ausreichend hoher Leistung in Bezug auf die Richtigkeit der Erkennung arbeiten muss. Unter Berücksichtigung der begrenzten Ressourcen impliziert die Tatsache, dass die Ergebnisse des Algorithmus einem menschlichen Bediener gezeigt oder von diesem verwendet werden, eine gewisse Toleranz gegenüber Algorithmenfehlern. Diese Toleranz ist ein Merkmal der vorliegenden Erfindung.
  • Das vorliegende Ausführungsbeispiel sieht eine Kombination aus zwei Gesichtserfassungsalgorithmen vor, deren gemeinsame Verwendung eine höhere Leistung in Bezug auf die Erfassungsgenauigkeit erzielt, als dies mit den einzelnen Algorithmen möglich wäre. Der erste Detektor, die Komponente W, ist ein sehr schneller, vorgeschalteter Scanner zur Analyse auf mögliche Gesichter. Der zweite Detektor, Komponente S, ist ein ausgefeilter Mustervergleichsalgorithmus, der sich durch eine sehr niedrige Fehlerquote auszeichnet. Die von der Komponente W bezeichneten potenziellen Gesichter werden anschließend von der Komponente S überprüft, um eine abschließende Entscheidung zu treffen.
  • Komponente W.
  • Wu et al. haben einen Gesichtserfassungsalgorithmus veröffentlicht (nachfolgend in modifizierter Form als Komponente W bezeichnet), der sich zur Einbindung in eine Digitalkamera eignet (siehe Wu, H., Chen, Q. und Yachida, M., "Face Detection from Color Images Using a Fuzzy Pattern Matching Method", IEEE Trans. Pattern Analysis and Machine Intelligence, 21(6), 557–563, 1999). Der Algorithmus arbeitet sehr schnell und stellt nur geringe Ansprüche an Programmspeicher und Trainingszustand. Die Komponente W ist eine Art ad-hoc-Mustererkenner, der nach Bildfenstern sucht, die aufgrund ihrer Farbcharakteristik wahrscheinlich Gesichter enthalten. Dieses Verfahren sucht im Wesentlichen nach Fenstern, in denen der mittlere Bereich wahrscheinlich Haut beinhaltet, wobei sich die Suche auf Farbe und Form stützt; ebenso wird in den Umgebungsbereichen (also oberhalb und an den Seiten) anhand von Farbe und Form nach Haar gesucht. Da das Verfahren auf Farbsignalen beruht, ist es erforderlich, dass die Bilder, auf die es angewandt wird, in einer aussagekräftigen Farbmetrik codiert sind.
  • Die Komponente W umfasst eine Trainings- und eine Testphase. Die Trainingsphase beinhaltet das Sammeln von Haut- und Haarfarbverteilungen sowie die Erhebung von Formenmodellen aus geeigneten Trainingsbeispielen. In der Testphase wird ein Fenster über das Bild geführt, um ein vollständiges Spektrum von Maßstäben und Positionen zu erfassen. Die Komponente W geht implizit davon aus, dass die richtige Ausrichtung des Bildes in der Vertikalen bekannt ist, und dass die Gesichter ungefähr auf die Bildausrichtung ausgerichtet sind. Diese Vermutung könnte untermauert werden, indem die gesamte Gesichtssuche mehrmals ausgeführt wird, und zwar einmal für jede mögliche Bildausrichtung, insgesamt aber nur dreimal, da ausgeschlossen werden kann, dass die Kamera auf dem Kopf stehend verwendet würde. In der Testphase führt der Algorithmus folgende Schritte einmal für jedes zu prüfende Bildfenster durch:
    • 1) Berechnung der Haut- und Haar-Wahrscheinlichkeitszuordnungen. Hierbei handelt es sich um einen Vergleich jedes Pixels in einem digitalisierten Bild mit vorbestimmten Wahrscheinlichkeitstabellen aus Haut- und Haartönen, wodurch eine A-posteriori-Wahrscheinlichkeit abgeleitet wird, dass das Pixel menschliche Haut oder menschliches Haar darstellt. Die Wahrscheinlichkeitstabellen müssen off-line gesammelt und in der Kamera gespeichert werden. Sie werden mit dem gleichen Bildsensor wie in der Digitalkamera unter Verwendung identischer Spektralempfindlichkeiten erfasst.
    • 2) Konvertierung der Wahrscheinlichkeiten in geschätzte Bereichsfraktionen mittels Nichtlinearität. Gesichtsformenmodelle werden ebenfalls off-line aus Trainingsbeispielen gebildet. Diese Modelle codieren die Wahrscheinlichkeit des Vorhandenseins von Haut- und Haarfarben in jeder Zelle eines rechteckigen Gitters, das über räumlich normalisierten menschlichen Gesichtern in einer kleinen Menge aus Standardkopfposen gelegt wird.
    • 3) Durchführung einer Fuzzy-Musterzuordnung mit Gesichtsformenmodellen. Ein rechtwinkliges Fenster wird nacheinander über jede Pixelposition des Bildes geführt, um zu beurteilen, ob das Fenster ein Gesicht enthält. Um Gesichter von unterschiedlicher Größe zu berücksichtigen, wird der Abtastprozess mithilfe von Fenstern wiederholt, die sich innerhalb eines Größenbereichs ändern. Die Beurteilung, ob ein Gesicht in einem Fenster des Bildes vorhanden ist, wird anhand eines Fuzzy-Vergleichs zwischen den zuvor ermittelten Gesichtsformenmodellen und der tatsächlichen Verteilung von A-posteriori-Wahrscheinlichkeiten bezüglich Haut und Haar in jeder Zelle des Fensters getroffen. Der Fuzzy-Vergleich verwendet parameterisierte Nicht-Linearitäten, wie in dem Beitrag von Wu et al. beschrieben, die in einer Kalibrierungsstufe abgestimmt werden, um die besten Ergebnisse zu erzielen.
  • Jeder dieser Schritte wird nachfolgend nach Vorstellung der Gesichtsformenmodelle detailliert beschrieben. Es sei darauf hingewiesen, dass der Beitrag von Wu et al. ausführliche Erläuterungen hierzu enthält.
  • Formenmodelle.
  • Die Kopfformenmodelle sind niedrig aufgelöste Darstellungen der räumlichen Verteilung von Haut und Haar in typischen Gesichtsposen. Es gibt ein Modell für Haut und ein Modell für Haar für jede jeweilige Pose. Jedes Modell besteht aus m × n Zellen (derzeit ist m = 12 und n = 10), wobei jede Zelle die Fraktion der Zelle codiert, die von Haut (für Hautmodelle) oder Haar (für Haarmodelle) für typische Köpfe in einer gegebenen Pose besetzt ist. Ein Bildfenster kann räumlich zu den Zellen in den Formenmodellen in Beziehung gesetzt werden. Je nach Auflösung des Fensters kann ein einzelnes Pixel oder ein Pixelblock jeder Modellzelle entsprechen. Die Modelle wurden mithilfe einer Menge von Trainingsbildern erstellt, auf die Affintransformationen angewandt wurden, um die beiden Augen in Standardposition anzuordnen. Die räumlich normalisierten Bilder wurden dann manuell in Haut- und Haarbereiche segmentiert, worauf die fraktionale Zellbelegung bei den Auflösungen der Modelle berechnet wurde. Ein Beispiel der Formenmodelle für frontale und rechte halb-frontale Posen zeigt 7. Die Modelle werden in der Trainingsdatenbank 72 (in 1 gezeigt) gespeichert, wobei die Belegungsfraktion graustufencodiert ist.
  • Berechnung der Haut- und Haar-Wahrscheinlichkeitszuordnungen.
  • Die Aufgabe besteht an diesem Punkt darin, Wahrscheinlichkeitsverteilungen für die Haut- und Haarfarben aus Trainingsbildern zu erfassen. Das Ziel besteht darin, Wahrscheinlichkeitstabellen der Form P(Haut|Farbe) und P(Haar|Farbe) zu erstellen. Anstatt den für die Wahrnehmung uniformen Farbraum nach Farnsworth zu verwenden, wie in der Veröffentlichung von Wu et al. beschrieben, verwendet die vorliegende Erfindung den Farbraum (L, s, t) als bevorzugte Farbmetrik, um Haut- und Haarbereiche zu unterscheiden, weshalb eine Wahrscheinlichkeitsschulung und -anwendung der Farbmetrik (L, s, t) verwendet wird, wobei L = c(R + G + B); s = a(R – b); t = b(R – 2G + B); wobei a, b und c Konstanten sind; und wobei R, G und B für Bildwerte stehen, die proportional zu der relativen logarithmischen Szenenbelichtung sind. Diese Metrik hat sich als effektiver Farbraum erwiesen, in dem eine Bildsegmentierung durchgeführt werden kann.
  • Wenn sämtliche drei Kanäle verwendet werden, ist der Helligkeitskanal von den kombinierten Farbkanälen in den Wahrscheinlichkeitshistogrammen getrennt.
  • Um Hautfarbenstatistiken zu sammeln, wurde eine kommentierte Datenbank von ca. 1800 Bildern verwendet, wobei jedes Bild mit einer Tiefe von 12 bit in RGB-Metrik mit relativer logarithmischer Szenenbelichtung gespeichert wurde. Für diese Bilder standen eine vom Menschen beurteilte Farbbalance sowie Weißpunktsollwerte zur Verfügung, ebenso wie die Lage der Augen bei sämtlichen Gesichtern in der Datenbank, bei denen zwei Augen sichtbar waren. Unter Verwendung eines anthropometrischen gemittelten Gesichtsmodells wurden für sämtliche Gesichter in der Datenbank die Hautpixel der Gesichter extrahiert. In jedem einzelnen Fall wurden zudem die Farbbalance und die Weißpunktsollwerte subtrahiert. Anschließend wurden die Pixelwerte in die (L, s, t) Metrik mithilfe folgender Matrixberechnung umgewandelt:
    Figure 00190001
    wobei die mit einem Hut versehenen Größen anhand der Sollwerte abgestimmt wurden. Um Haarfarbstatistiken zu sammeln, wurde ein analoger Prozess durchgeführt, mit dem Unterschied, dass die Haarbereiche manuell für jeden Beispielkopf segmentiert wurden. Jedes Pixel der Haut oder des Haars erzeugt ein Beispiel einer Farbe in dem Raum (L, s, t). Für Haar und Haut wurden getrennte Wahrscheinlichkeits-Histrogramme erstellt. Die L-Histogramme wurden getrennt von den beiden s-, t-Histogrammen kompiliert. Es wird somit implizit angenommen, dass die Farb- und Helligkeitswerte für Haut und Haar unabhängig voneinander verteilt sind. Zum Testzeitpunkt wurde zunächst ein Bild mithilfe der Farbwerte an jedem Pixel verarbeitet, um A-posteriori-Wahrscheinlichkeiten aufzufinden, dass dieses Pixel entweder mit Haut oder Haar bebildert worden ist. Um zu gewährleisten, dass die Farbverteilung in den Weltobjekten berücksichtigt wird, wird der Bayessche Satz auf die Wahrscheinlichkeitsverteilungen angewandt. Das Ergebnis dieser Berechnung erzeugt zwei grafische Anzeigen der Haut- und Haar-Wahrscheinlichkeitsdichte, wie in den 8A und 8B bzw. 9A und 9A gezeigt, in denen jede grafische Anzeige zwei Ansichten der Haut- und Haar-Wahrscheinlichkeiten darstellt, die zwischen den Helligkeits- und Farbkomponenten getrennt sind.
  • Zuordnung von Haut- und Haar-Wahrscheinlichkeiten zu geschätzten Bereichsfraktionen.
  • Die Formenmodelle enthalten Informationen über die räumliche Verteilung von Farben in Gesichtsbildern, während die in dem vorherigen Schritt berechneten Wahrscheinlichkeiten von der mittleren Farbe in den infrage kommenden Gesichtsbereichen abhängen. Da diese beiden Informationskategorien unterschiedlich sind, können sie nicht direkt miteinander verglichen werden. Daher ist ein Zwischenschritt notwendig, um die Wahrscheinlichkeitswerte in einem Bildfenster auf geschätzte Haut- und Haar-Belegungsfraktionen durch Verwendung einer nicht-linearen Zuordnungsfunktion zuzuordnen. Die nicht-lineare Funktion ist eine Sigmoid-Funktion mit abstimmbaren Parametern a und b gemäß folgender Gleichung.
  • Figure 00200001
  • Die Veröffentlichung von Wu et al. beschreibt die getrennte Abstimmung der Parameter a und b für jedes der Haut- und Haar-Modelle gemäß einem empirischen Versuch, um die besten Gesichtserfassungsergebnisse zu erzeugen. In der vorliegenden Erfindung hat sich die Zuordnung der Nicht-Linearität als besonders geeignet erwiesen, um die Mängel bei der statistischen Abtastung von Haut- und Haartönen auszugleichen. Aus diesem Grund sind die Parameter a und b relativ niedrig angesetzt. Das Ziel für die Komponente W besteht darin, möglichst kein Gesicht auszulassen, wobei davon ausgegangen wird, dass die weitere Verarbeitung durch den Algorithmus S viele Fälle beseitigt, die von Komponente W als Gesicht zugelassen worden sind.
  • Durchführung einer Fuzzy-Musterzuordnung mit Gesichtsformenmodellen.
  • Anhand des Gesichtsformmodells mit Haut- und Bereichsbelegungsaktionen für jede Zelle sowie Schätzungen der gleichen Größen für entsprechende Bildbereiche aus der nicht-linearen Zuordnung wird eine Entscheidung über die Ähnlichkeit zwischen den Bildbereichen und den Modellzellen getroffen. Das Ähnlichkeitsmaß verwendet eine aus zwei Termen bestehende "Fuzzybeziehung":
    Figure 00200002
    wobei die Parameter a und b (welche sich von denen in der Nicht-Linearitätszuordnung des vorherigen Abschnitts unterscheiden) die Form des Vergleichs bestimmen, während die indizierten Variablen I und M die Haut- und Haarwahrscheinlichkeiten von einem Bildbereich bzw. einer Modellzelle darstellen. Durch Erhöhung von b ergeben sich exponentiell zunehmende Abzüge (Penalties) für Unterschiede zwischen dem Formenmodell und dem Bildfenster. In diesem Beispiel wurden die Werte a – 2 und b = 1 nach einer Reihe von Versuchen gewählt. Das Ähnlichkeitsergebnis für das gesamte Bildfenster wird als mittleres Ähnlichkeitsergebnis über alle Zellen des Formenmodells herangezogen. Um die von der Komponente W ermittelten potentiellen Gesichter zu identifizieren, kann auf das Ähnlichkeitsmaß ein Schwellenwert angewandt werden.
  • Komponente S
  • Eine detaillierte Beschreibung des Algorithmus nach Schneiderman (nachfolgend Komponente S genannt) ist zu finden in Schneiderman, H. und Kanade, T., "Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition", Proc. CVPR 1998, 45–51. Die Hauptschritte dieses Verfahrens werden nachfolgend dargestellt, um eine eigenständige Beschreibung zu liefern und die Unterschiede und Verbesserungen in Bezug zu der genannten Quelle darzustellen. Die Komponente S implementiert einen Bayesschen Klassifizierer, der anhand einer Wahrscheinlichkeitsverteilung eine maximale A-posteriori-Klassifizierung durchführt, die sich der bedingten Wahrscheinlichkeitsverteilung P (Gesicht|Bild) nähert. Das Verfahren wird als Bayessches Verfahren bezeichnet, weil es den Bayesschen Satz verwendet, um eine a priori gemessene Trainingsverteilung P(Bild|Gesicht) in die A-posteriori-Wahrscheinlichkeit bei Vorhandensein eines Hinweises aus einem Bild umzuwandeln. Der Hinweis besteht aus den Pixelwerten in einem räumlich und intensitätsnormalisierten Bildfenster. Die Verwendung des Bayesschen Satzes unterliegt der Beobachtung, dass der Bildhinweis mehrdeutig sein kann. In einigen Fällen können Objekte und Szenen, die hier nicht von Interesse sind (d.h. in diesem Zusammenhang Gesichter), Bildmuster erzeugen, die mit den klassengemäßen Objekten (= Gesicht) verwechselt werden. Der Bayessehe Satz verlangt die Sammlung repräsentativer Nicht-Klassebilder, die als "Weltbilder" bekannt sind. Das Sammeln der Weltbilder erweist sich als der schwierigste und am meisten kritische Prozess bei der Schulung des Algorithmus. Die Schwierigkeit liegt in der Tatsache, dass die Welt sehr komplex ist. Gesichter sind dagegen nicht komplex (zumindest im Vergleich mit der Welt), so dass die Sammlung von Trainingsbeispielen für Gesichter relativ unkompliziert ist. Diese Problematik wird im Folgenden in einem gesonderten Abschnitt detailliert besprochen.
  • Die Vereinfachungen an der Verteilung P(Gesicht|Bild) (1)die hier besprochen werden, wandeln eine große, nicht zählbare Verteilung in eine sehr handliche Verteilung um. Das Ziel besteht darin, eine vereinfachte Verteilung P(Gesicht|destillierte Bildmerkmale) zu erreichen, wobei die destillierten Bildmerkmale gezählt und während des Trainings gruppiert werden können, beispielsweise in einer Million Bins. Eine Heuristik der Trainingsklassifizierer würde darauf hinweisen, dass mehr Beispiele als Bins notwendig sind, und zwar im Bereich von zwei Größenordnungen. Demnach müssten 108 Beispiele erforderlich sein, um 106 Bins in statistisch aussagekräftiger Weise zu besetzen. Es ist durchaus möglich, eine derartige Anzahl von Beispielen zu sammeln, vor allem, wenn es zulässig ist, einige davon per Computer zu berechnen, und sofern die "Einheit" eines Beispiels kleiner als ein ganzes menschliches Gesicht ist.
  • Vereinfachungen werden in der nachfolgend aufgeführten Reihenfolge angewandt und in den folgenden Abschnitten beschrieben:
    • (1) Gesichtsbereichsgröße standardisieren
    • (2) Gesichtsbereich in Unterbereiche zerlegen
    • (3) Abhängigkeiten zwischen Unterbereichen ignorieren
    • (4) Unterbereiche mithilfe von PCA auf eine kleiner dimensionierte Darstellung projizieren
    • (5) Codeprojektionen mithilfe spärlicher Koeffizienten
    • (6) Quantisierung spärlicher Koeffizienten
    • (7) Zerlegen von Darstellung und Position
    • (8) Position für nicht gängige Muster ignorieren
    • (9) Positionsabhängigkeit für gängige Muster vektorisieren
    • (10) Erkennung bei mehreren Auflösungen unter der Annahme von Abhängigkeiten zwischen den Auflösungen anwenden
  • 1. Gesichtsbereichsgröße standardisieren.
  • Räumliche normalisierte Gesichter werden in einem Pixelfenster von 56 × 56 Pixeln dargestellt. Die Vereinfachung verändert Gleichung (1) in P(Gesicht|Bereich) (2)wobei Bereich ein genau gerasterter Vektor aus Pixeln aus einem 56 × 56 großen Pixelbildfenster ist.
  • 2. Gesichtsbereich in Unterbereiche zerlegen.
  • Jeder Gesichtsbereich wird in mehrere, sich überlagernde Unterbereiche aus 16 × 16 Pixeln zerlegt. Diese Unterbereiche können an jeder Pixelposition in dem Bereich oder an einer Untermenge dieser Positionen verankert werden. Im vorliegenden Fall werden Unterbereiche an jedem dritten Pixel in jeder dritten Zeile verankert. Mit dieser Wahl entstehen 196 mögliche Ankerpositionen eines Unterbereichs innerhalb eines Gesichtsbereichs; diese Position kann daher in einem einzelnen Byte codiert werden. Auf der rechten Seite von Gleichung (2) kann "Bereich" durch "{Unterbereich}" ersetzt werden, wobei es sich um eine Sammlung von Unterbereichen handelt. Die Unterbereichsgröße ist derart gewählt, dass einzelne Unterbereiche bei geeigneter Positionierung groß genug sind, um Gesichtsmerkmale (wie Auge, Nase oder Mund) zu enthalten. Diese Größe begrenzt das größte Gesichtsmerkmal, das als kohärente Einheit geprüft werden kann.
  • 3. Abhängigkeiten zwischen Unterbereichen ignorieren.
  • Es wird kein Versuch unternommen, um die statistischen Abhängigkeiten zwischen Unterbereichen zu modifizieren. Diese Vereinfachung begrenzt damit die Art der modellierbaren Objektattribute. Während beispielsweise einen einzelnen Unterbereich ausreichend viele Pixel zur Erfassung eines Auges enthalten kann, fällt das andere Auge in einen anderen Unterbereich, wodurch keine Ähnlichkeit oder Unähnlichkeit zwischen den beiden Augen ermittelt werden kann. Es kann auch keine Ableitung über die Helligkeit verschiedener Teile des Gesichtes herangezogen werden. Mithilfe dieser Vereinfachung lässt sich Gleichung (2) jetzt ersetzen durch
    Figure 00230001
    wobei die statistische Unabhängigkeit durch das Fehlen gemeinsamer Abhängigkeiten von mehreren Unterbereichen dargestellt wird.
  • 4. Unterbereiche mithilfe von PCA (Principal Component Analysis/Analyse auf Hauptkomponenten) auf eine kleiner dimensionierte Darstellung projizieren.
  • Da Unterbereiche 256 Pixel enthalten, und zwar zu jeweils 256 Graustufen, ist die Anzahl möglicher Unterbereiche sehr groß. Die nächste Vereinfachung umfasst die Anwendung der Standardtechnik der linearen Analyse auf Hauptkomponenten (PCA), um die Dimensionalität des Unterbereichs von 256 auf 12 zu reduzieren. (Die Wahl von zwölf Dimensionen ist in gewisser Weise willkürlich. Mehr als 90% der tatsächlichen Unterbereichsabweichung lassen sich mithilfe von maximal zwölf Dimensionen codieren.) Um die PCA durchzuführen, wurde eine große Menge von Gesichtsbildern verarbeitet, wobei sämtliche Unterbereiche an der Datenanalyse teilhatten. Es wurden gewisse Versuche durchgeführt, um zu sehen, ob für unterschiedliche Bildauflösungen und mehrere Gesichtsposen separate Hauptkomponenten benötigt würden. Aufgrund dieser Erkenntnisse wurde entschieden, dass unterschiedliche Mengen von Hauptkomponenten für jede Auflösung gespeichert würden, aber dass es nicht notwendig wäre, unterschiedliche Mengen von Gesichtsposen vorzuhalten. Es scheint sinnvoll zu sein, dass die wesentlichen Gesichtsstrukturen bei unterschiedlichen Auflösungen einheitliche räumliche Muster aufweisen, während die Änderungen, die durch etwas unterschiedliche Gesichtsposen hervorgerufen werden, in den ersten wenigen Hauptvariationsmodi weniger Bedeutung haben.
  • Als Ergebnis des Projektionsschritts wird jeder Bildunterbereich von zwölf Projektions-Koeffizienten entlang der Hauptkomponentenachse dargestellt. Die Darstellung führt dazu, dass jeder Unterbereich durch eine lineare Kombination aus zwölf Hauptunterbereichen dargestellt wird. Die Projektionsoperation wird durch eine Matrixoperation durchgeführt [proj] = AT[Unterbereich] (4)wobei A die Projektionsmatrix ist, deren Spalten die Eigenvektoren (Hauptkomponenten) der Trainingsunterbereiche enthalten. Es sei darauf hingeweisen, dass die PCA nur auf eine Trainingsmenge von Gesichtsbildern angewandt wird. Falsche Beispiele (keine Gesichter) werden nicht verwendet, da die resultierenden Hauptkomponenten wahrscheinlich einer weiten Abweichung unterlägen, die durch eine statistisch inadäquate Abtastung der sehr großen Menge von möglichen Nicht-Gesichtsbildern verursacht wird. Als Ergebnis dieses Schrittes führt Ausdruck (3) zu
  • Figure 00250001
  • 5. Codeprojektionen mithilfe spärlicher Koeffizienten.
  • Anstatt alle zwölf Projektionskoeffizienten zu behalten, wird die Darstellung der Unterbereiche weiter komprimiert, indem nur die sechs bedeutendsten erhalten bleiben. Dieses spärliche Codierungsschema erfährt jedoch eine stärkere Komplexität, indem die letzten sechs Koeffizienten paarweise in Gruppen zusammengefasst werden, wobei deren Summenquadratwerte bei der Auswahl der sechs beizubehaltenden Projektionsdimensionen berücksichtigt werden. Auf diese Weise werden zwölf Koeffizienten auf sechs Koeffizienten zur nachfolgenden Verarbeitung reduziert.
  • 6. Quantisierung spärlicher Koeffizienten.
  • Eine weitere Komprimierung der Unterbereichsdarstellung erfolgt durch diskrete Quantisierung der neun Koeffizienten mithilfe eines Lloys-Max-Quantisierers. Dieser Quantisierer minimiert den mittleren quadratischen Fehler (Standardabweichung) bei Annahme einer Gausschen Verteilung der unabhängigen Variablen. Für gängige Werte bezüglich der Anzahl der Quantisierungswerte sind die binären Breakpoints und die Rekonstruktionsebenen von Lloyd-Max-Quantisierern in Tabellenform dargestellt in Lim. J., Two-Dimensional Signal and Image Processing, Prentice-Hall: New Jersey, USA, 1990. Um die Gültigkeit der Gausschen Verteilungsannahme zu testen, wurde die tatsächliche Verteilung der Projektionskoeffizienten in der Trainingsmenge gesammelt, aus der hervorging, dass die Gaussche Annahme der tatsächlichen Verteilung weitgehend entspricht.
  • Die Auswahl der beizubehaltenden spärlichen Koeffizienten und die Anzahl der jedem Koeffizienten zugewiesenen Quantisierungsstufen bestimmt die Anzahl der möglichen Quantisierungswerte für die Codierung von Bildunterbereichen. Gestützt auf die Auswahl sechs hervorstehender Dimensionen, wobei für jede Dimension 8, 4 oder 2 Quantisierungsstufen gewählt werden, kann der implementierte Algorithmus jeden Unterbereich durch ungefähr eine Million Zahlen darstellen. Diese Quantisierungszahlen werden in der genannten Quelle von Schneiderman et al. etwas undurchsichtig als "q"-Werte bezeichnet.
  • Die Anzahl möglicher q1-Werte ist ein Algorithmus-Bemessungsparameter, der in der genannten Quelle als "nq1" bezeichnet wird.
  • Der Komprimierungsvorteil dieses Quantisierungsschemas wird deutlich, wenn man bedenkt, dass 256256 mögliche Unterbereichsmuster in 106 einzelnen Zahlen codiert werden können. Man kann dieses Quantisierungsschema als eine Art Bildcodierung betrachten. Die Rekonstruktion des Bildes aus seiner Codierung ergibt eine Art Näherung an das Originalbild. 10 zeigt ein Originalbild und dessen Rekonstruktion nach PCA-Projektion und spärlicher Codierung sowie Quantisierung. 10(a) zeigt das Originalbild, 10(b) zeigt eine Rekonstruktion aus Projektionen von Unterbereichen auf zwölf Unterbereiche, während 10(c) eine Rekonstruktion aus der spärlich codierten und quantisierten Version von 10(b) zeigt. (Es sei darauf hingewiesen, dass Bild (b) und (c) nicht sämtliche codierten Informationen zeigen. Statt dessen zeigen sie die Rekonstruktionen aus der Codierung, wobei die Unterbereiche auf ein Gitter von 56 × 56 Gesichtsbereichen ausgerichtet sind. Simultane Codierungen erfassen weitere Bildinformationen, wenn die Unterbereiche bezüglich des Bereichsgitters versetzt sind.)
  • Nach dem Quantisierungsschritt wird der Wahrscheinlichkeitsausdruck (5) weiter vereinfacht auf
  • Figure 00260001
  • 7. Zerlegen von Darstellung und Position.
  • An diesem Punkt in der Kette der Vereinfachungen der Wahrscheinlichkeitsverteilung wird Ausdruck (6) expandiert, um explizit sowohl das Pixelmuster eines Unterbereichs als auch dessen Position innerhalb des Gesichtsbereichs zu umfassen. Gleichung (6) wird ersetzt durch
    Figure 00260002
    wobei jeder Unterbereich jetzt durch dessen Quantisierungswert und dessen Position innerhalb des Gesichtsbereichs dargestellt wird. Die Interpretation des Ausdrucks (7) führt intuitiv zu folgendem: die augenähnlichen Muster sollten in Gesichtsbereichen nur in Unterbereichen auftreten, die wahrscheinlich Augen enthalten.
  • 8. Position für nicht gängige Muster ignorieren.
  • Unter Berücksichtigung der Tatsache, dass 1.000.000 Quantisierungsebenen und 196 Positionen für jeden Unterbereich möglich sind, muss eine weitere Vereinfachung des Ausdrucks (7) erfolgen. Dieser Ausdruck wird zwei weiteren Vereinfachungen unterzogen. Erstens wird eine Entscheidung bezüglich der Codierung der Positionsabhängigkeit ausschließlich der gängigsten q1-Muster getroffen. Zu diesem Zweck ordnet ein großer Sortierschritt die q1-Muster nach abnehmender Frequenz ihres Auftretens in der Trainingsmenge. Für alle q1-Muster, die in der Sortierung einen gewissen Schwellenwert ihres Auftretens unterschreiten, wird deren Positionsabhängigkeit durch eine gleichmäßige Positionsverteilung ersetzt. Die Anzahl der q1-Muster, deren Positionsverteilung während des Trainings explizit erlernt werden muss, ist ein Algorithmen-Bemessungsparameter, der in der Quelle von Schneiderman als "nest" bezeichnet wird. Für die ungewöhnlichen Muster wird Ausdruck (7) zu
    Figure 00270001
    wobei npos = 196 für die Zahl möglicher Unterbereichspositionen steht.
  • 9. Positionsabhängigkeit für gängige Muster vektorisieren.
  • Die zweite Vereinfachung des Ausdrucks (7) umfasst eine weitere Verringerung der Zahl von Positionsverteilungen, die während des Trainings erlernt wurden. Die in Abschnitt 8 durchgeführte Vereinfachung hat bereits die Anzahl der zu erlernenden Positionsverteilungen von nq1 auf nest verringert. Jetzt wird eine weitere Verringerung von nest auf nq2 durch Vektorquantisierung der die Reduzierung nest überdauernden Positionsverteilungen auf nq2 repräsentative Darstellungen durchgeführt. Zum Zwecke dieser Quantisierung werden die beiden dimensionalen Positionsverteilungen der q1-Muster zu Vektoren gerastert. Die Zahl nq2 ist ein Algorithmen-Bemessungsparameter.
  • Der Vektorquantisierungs-Trainingsalgorithmus ist kein LBG-Standardalgorithmus, sondern ein ad hoc angepasster Algorithmus, der auf einen einzelnen Durchgang durch die eingegebenen Vektoren angewandt wird. Die Tatsache, dass nur ein Durchgang durchgeführt wird, ist wichtig, da der Trainingsalgorithmus zehn- oder hunderttausende von Vektoren quantisieren muss und daher geschwindigkeitsoptimiert sein muss. Der Trainingsprozess stellt sich folgendermaßen dar:
    Für jeden Vektor x
    Finde das nächste, aktuelle Musterzentrum
    Berechne die Distanz d zwischen x und dem nächstgelegenen Zentrum. Die SSE-Metrik (Summenquadratfehler) wird benutzt.
    Wenn d < Schwellenwert
    Füge x zum Cluster hinzu; aktualisiere Cluster-Mittelpunkt
    sonst
    Belege neuen Cluster mit x
  • Damit dieser Algorithmus einwandfrei funktioniert, muss er natürlich leere Cluster berücksichtigen und auch die Auferlegung einer maximalen Anzahl von nq2 Clustern handhaben können. Die Custerzentren werden als das Mittel (idealerweise ein nach Häufigkeitszählung gewichteter Mittelwert) der Vektoren berechnet, die diesem Cluster zugeordnet sind. Die Wahl des Distanzschwellenwertes ist problematisch und basiert im Wesentlichen auf einer empirischen Beobachtung des Verhaltens des Quantisierungstrainings bei Verwendung unterschiedlicher Werte für den Schwellenwert. Das Ziel dieser Auswahl besteht darin, die verfügbare Anzahl von Quantisierungsebenen vollständig zu nutzen, während die Verteilungsvektoren so gleichmäßig wie möglich gestreut werden.
  • Bei Anwendung der Vektorquantisierung von Positionsverteilungen wird die Position pos in Ausdruck (7) auf eines der VQ-Musterzentren abgebildet, das als pos' bezeichnet wird. Für gängige Muster wird Gleichung (7) dann
  • Figure 00280001
  • 10. Erkennung bei mehreren Auflösungen unter der Annahme von Abhängigkeiten zwischen den Auflösungen anwenden.
  • Da die statistischen Abhängigkeiten zwischen Unterbereichen nicht in dem zuvor entwickelten, vereinfachten Wahrscheinlichkeitsmodell erfasst werden können, können keine Merkmale Berücksichtigung finden, die größer als die Unterbereiche sind. Um diese Beschränkung zu überwinden, werden nun mehrere Ebenen der Bildauflösung eingeführt. Der gesamte Mechanismus des Wahrscheinlichkeitsschätzers (2) wird auf mehrere Ebenen der Bildauflösung angewandt, was zu folgendem Ausdruck führt
  • Figure 00290001
  • Ein typisches Beispiel wäre ein einzelnes Gesicht, das mit nmags = 3 Ebenen der Pixelauflösung erfasst wurde. Bei jeder Auflösung müssen sich die Augen an Standardpositionen befinden.
  • Volle Form der vereinfachten Wahrscheinlichkeitsverteilung.
  • Das Sammeln der Ausdrücke (8) und (10) und das Anwenden des Bayesschen Satzes, um während des Trainings gesammelte A-priori-Wahrscheinlichkeiten in Beziehung zu A-posteriori-Wahrscheinlichkeiten in diesen Ausdrücken zu setzen, führt zu der vollständigen Form (11) der geschätzten Wahrscheinlichkeit des Vorhandenseins eines Gesichtes in einem Bildbereich. Einzelheiten zur vollständigen Ableitung dieser Gleichung werden in der Quelle von Schneiderman dargelegt.
  • Figure 00290002
  • In diesem Ausdruck stellen P(Gesicht) und P(Gesicht) die A-posteriori-Wahrscheinlichkeiten dar, das ein Bildbereich ein Gesicht enthält oder nicht enthält. Wenn diese Kenntnis nicht vorhanden ist, werden A-priori-Wahrscheinlichkeiten von ½ verwendet, was in dem vorausgehenden Ausdruck (11) zu einer weiteren Vereinfachung führt. Diese Annahme bezüglich der A-priori-Wahrscheinlichkeiten beeinträchtigt die Leistungsfähigkeit des Algorithmus nicht, wenn dieser für die Mustererkennung von Gesichtern verwendet wird. Statt dessen begründet er einen Skalierungsfaktor, der berücksichtigt werden muss, wenn die Ausgabe des Algorithmus als Wahrscheinlichkeitswert interpretiert wird.
  • Trainingsschritte – Phase I.
  • Während das eigentliche Training des Algorithmus S eine Anzahl einzelner Schritte umfasst, unterteilt sich das Training selbst in zwei Hauptphasen. Ziel der ersten Phase ist es, spezifische Parameter der Quantisierung von Gesichtsunterbereichen zu erhalten. Der erste Schritt besteht darin, die Covarianz-Matrix und dann Hauptkomponenten der Unterbereiche aus der Trainingsmenge zu erfassen. Als Teil dieses Schrittes und nach Extraktion der Hauptkomponenten folgt ein weiterer Durchgang durch sämtliche Trainingsunterbereiche, um die Statistiken der Projektionen auf diese zwölf Hauptdimensionen zu sammeln. Die Projektionsdaten werden dann analysiert. Die Projektionsstatistiken werden an das Trainingsprogramm zurückgeführt, um eine optimale Auslegung des Lloyd-Max-Quantisierers zu ermöglichen. Da die Variation von Gesichtsmustern unter Berücksichtigung der unterschiedlichen Auflösungsmaßstäbe relativ groß ist, muss dieser Prozess der Extraktion von Hauptkomponenten und der statistischen Verteilung der Trainingsdaten entlang dieser Komponenten für jede Bildauflösung wiederholt werden.
  • Trainingsschritte – Phase II.
  • Die zweite Phase des Trainings beginnt mit dem Durchlaufen der Trainingsmenge und der Durchführung der Quantisierung jedes Unterbereichs jedes Gesichtsbeispiels. Wie bereits erwähnt, kann die Trainingsmenge erweitert werden, indem etwas veränderte Versionen jedes Trainingsexemplars erstellt werden. Die Frequenz, mit der quantisierte Werte erscheinen, wird in einem Histogramm mit ungefähr 1.000.000 Bins gezählt. Gleichzeitig werden Unterbereichspositionen akkumuliert, an denen jeder quantisierte Wert auftritt. Eine Sortieroperation ordnet das Histogramm der Quantisierungshäufigkeit in absteigender Reihenfolge der Auftretungszählung an. Für die nest frequenzquantisierten Muster werden die Positionsverteilungen in den Vektorquantisierungsalgorithmus eingegeben. Nach Vektorquantisierung bleiben nur nq2 seminale Positionsverteilungen erhalten, wobei jeder der nest frequenzquantisierten Werte eine Positionsverteilung aufweist, die durch die beibehaltenen Verteilungen approximiert werden.
  • Anwendung des Gesichtsdetektors.
  • Um den trainierten Gesichtserfassungsalgorithmus zur Testzeit zu verwenden, muss die Berechnung von Ausdruck (11) auf einen Bildbereich angewandt werden, auf den eine Raum- und Intensitätsnormalisierung durchgeführt worden ist. Drei verschiedene Auflösungsversionen jedes infrage kommenden Gesichtsbereichs werden benötigt. Der Quantisierungswert für jeden Unterbereich wird berechnet, und die verschiede nen Wahrscheinlichkeitsterme in Ausdruck (11) werden aus den Wahrscheinlichkeitstabellen extrahiert, die während der Algorithmenschulung erstellt wurden.
  • Um den Ausdruck (11) für die Gesichtserfassung zu verwenden, muss eine Wahrscheinlichkeitsschwelle gewählt werden. Wenn die A-posteriori-Wahrscheinlichkeit den Schwellenwert überschreitet, ist eine Gesichtserfassung aufgetreten. Nachdem der Algorithmus-Trainingsprozess abgeschlossen worden ist, wird der Schwellenwert durch Untersuchung der Klassifizierungsleistung des Algorithmus ermittelt, wenn dieser auf eine Verifizierungsmenge von Bildern mit und ohne Gesichter angewandt wird. Der Schwellenwert wird auf eine optimale Leistung bei der Verifizierungsmenge eingestellt, wobei die relative Bedeutung falscher positiver und falscher negativer Fehler berücksichtigt wird.
  • Dualer Gesichtsdetektor – die kombinierten Algorithmen
  • Bei dem erfindungsgemäßen Gesichtserfassungsalgorithmus werden die potentiellen Gesichter, die von Komponente W erzeugt worden sind, in den Gesichtsdetektor der Komponente S eingegeben. Da die Fensterformen der beiden Algorithmen etwas voneinander abweichen, dient eine räumlich affine Transformation dazu, das potentielle Gesicht einzurahmen und die Augen für die Komponente S an einer Standardposition anzuordnen. Ein Schwellenwert wird auf die Ausgabe von der Komponente S angewandt, um das Vorhandensein eines Gesichts in einem Bildfenster zu erklären.
  • Da die Komponente W das Bild bei einer Reihe von Maßstäben in einem Fenster prüft, das über das gesamte Bild geführt wird, ist es wahrscheinlich, dass ein wahres Gesicht bei mehr als einem Maßstab und an mehreren dicht beabstandeten Fensterpositionen erfasst wird. Es muss ein Verfahren zur Kombination von Erfassungsüberlagerungen verwendet werden. Hierzu werden zwei verschiedene Verfahren getestet. Das erste Verfahren verwendet einfach die stärkste Erfassung aus einer räumlich sich überlagernden Gruppe von Erfassungen. Das zweite Verfahren berechnet die mittleren Augenpositionen der sich überlagernden Erfassungen. Es wurde empirisch festgestellt, dass sich mithilfe der Mittelungstechnik die Augenpositionen genauer bestimmen ließen, so wie von einem menschlichen Beobachter per Sichtprüfung festgestellt.

Claims (20)

  1. Verfahren zur Bestimmung des Vorhandenseins eines Gesichts anhand von Bilddaten mit folgenden Schritten: a) Vorprüfung der Bilddaten mit einem ersten Algorithmus, wobei der erste Algorithmus eine Vielzahl von möglichen Gesichtern anhand einer Mustervergleichstechnik ermittelt, die nach Farb- und Forminformationen Bildfenster identifiziert, die wahrscheinlich Gesichter enthalten, und b) Anwenden eines zweiten Mustervergleichsalgorithmus, wobei der zweite Algorithmus die möglichen Gesichter mithilfe eines nachträglichen Wahrscheinlichkeits-Funktionsklassifizierers verarbeitet, um das Vorhandensein des Gesichts zu ermitteln.
  2. Verfahren nach Anspruch 1, worin der erste Algorithmus eine erste Rate falscher – Resultate aufweist und wobei der zweite Algorithmus eine zweite Rate falscher Resultate aufweist, die kleiner als die erste Rate falscher Resultate ist.
  3. Verfahren nach Anspruch 1, worin das Verfahren in einer Digitalkamera zur Erfassung eines Bildes einer Szene implementiert ist und wobei die Digitalkamera Folgendes umfasst: einen Erfassungsbereich zur Erfassung eines Bildes und zur Erzeugung der Bilddaten; einen elektronischen Verarbeitungsbereich zur Verarbeitung der Bilddaten zur Ermittlung des Vorhandenseins eines oder mehrerer Gesichter in dem Bild; Gesichtsdatenmittel, die dem Verarbeitungsbereich zugeordnet sind, um Gesichtsdaten zu erzeugen, die mindestens einem Attribut von mindestens einem der Gesichter in dem Bild entsprechen; ein Speichermedium zur Speicherung der Bilddaten; und Aufzeichnungsmittel, die dem Verarbeitungsbereich zur Aufzeichnung der Gesichtsdaten mit den Bilddaten auf dem Speichermedium zugeordnet sind.
  4. Verfahren nach Anspruch 3, worin die Gesichtsdaten mindestens entweder dem Ort, der Ausrichtung, dem Maßstab oder der Pose von mindestens einem der Gesichter in dem Bild entsprechen.
  5. Verfahren nach Anspruch 3, worin der elektronische Verarbeitungsbereich zudem einen Hinweis darauf gibt, dass ein oder mehrere Gesichter erfasst worden sind.
  6. Verfahren nach Anspruch 5, worin die Digitalkamera zudem eine Visiereinrichtung zum Anvisieren des Bildes umfasst, und worin der elektronische Verarbeitungsbereich einen Hinweis in der Visiereinrichtung bereitstellt, der das eine erfasste Gesicht oder die mehreren erfassten Gesichter identifiziert.
  7. Verfahren nach Anspruch 6, worin die Visiereinrichtung entweder ein optischer Sucher ist, der die Szene abbildet, oder eine elektronische Anzeigeeinrichtung, die die Bilddaten reproduziert.
  8. Verfahren nach Anspruch 3, worin die Aufzeichnungsmittel die erfassten Bilddaten in dem Speichermedium in digitalen Ordnern aufzeichnen, die den Bildern mit einer bestimmten Anzahl von Gesichtern in den Szenen zugeordnet sind.
  9. Verfahren nach Anspruch 3, worin der elektronische Verarbeitungsbereich zudem einen Gesichtserkennungsalgorithmus und eine Datenbank bekannter Gesichter zur Erzeugung von Gesichtsidentitäten umfasst, und worin die Aufzeichnungsmittel ein oder mehrere Bilder in dem Speichermedium mit den Gesichtsidentitäten bekannter Gesichter bezeichnen.
  10. Verfahren nach Anspruch 3, worin der Erfassungsbereich zudem einen Belichtungssteuerungsbereich umfasst, der auf das Vorhandensein eines oder mehrerer Gesichter zur optimalen Belichtung des Bildes für mindestens eines der Gesichter in der Szene anspricht.
  11. Verfahren nach Anspruch 10, worin der Belichtungssteuerungsbereich der Digitalkamera das Bild entweder für die überwiegende Zahl von Gesichtern in der Szene oder für das größte Gesicht in der Szene optimal belichtet.
  12. Verfahren nach Anspruch 10, worin der Erfassungsbereich zudem eine Blitzeinheit umfasst und worin der elektronische Verarbeitungsbereich die Aktivierung der Blitzeinheit steuert, um die Belichtung für mindestens eines der Gesichter in der Szene zu optimieren.
  13. Verfahren nach Anspruch 1, worin das Verfahren in einer Digitalkamera zur Erfassung eines Bildes einer Szene implementiert ist und wobei die Digitalkamera Folgendes umfasst: einen Erfassungsbereich zur Erfassung eines Bildes und zur Erzeugung der Bilddaten; einen elektronischen Verarbeitungsbereich zur Verarbeitung der Bilddaten zur Ermittlung des Vorhandenseins eines oder mehrerer Gesichter in der Szene; Gesichtsdatenmittel, die dem Verarbeitungsbereich zugeordnet sind, um Gesichtsdaten zu erzeugen, die mindestens einem Attribut von mindestens einem der Gesichter in dem Bild entsprechen; einen Kompositionsalgorithmus, der dem Verarbeitungsbereich zur Verarbeitung der Gesichtsdaten und zur Erzeugung von Kompositionsempfehlungen für einen Benutzer der Digitalkamera in Abhängigkeit von den verarbeiteten Gesichtsdaten zugeordnet ist; und eine Anzeigevorrichtung zum Anzeigen der Kompositionsempfehlungen gegenüber dem Benutzer.
  14. Verfahren nach Anspruch 13, worin die Kompositionsempfehlungen mindestens entweder a) eine Anzeige, dass ein Hauptmotiv in dem Bild zu klein ist, b) eine Anzeige, dass die Befolgung des Goldenen Schnitts zu einer besseren Komposition führt, c) eine Anzeige, dass eines der Gesichter in dem Bild abgeschnitten ist oder d) eine Anzeige, dass eine horizontale Ausrichtung der Motive in dem Bild vermieden werden sollte, umfasst.
  15. Verfahren nach Anspruch 1, worin das Verfahren in einer Digitalkamera zur Erfassung eines Bildes einer Szene implementiert ist und wobei die Digitalkamera Folgendes umfasst: einen Erfassungsbereich zur Erfassung eines Bildes und zur Erzeugung der Bilddaten; einen elektronischen Verarbeitungsbereich zur Verarbeitung der Bilddaten zur Ermittlung des Vorhandenseins eines oder mehrerer Gesichter in der Szene und zum Erzeugen von Gesichtsdaten daraus; einen Ausrichtungsalgorithmus, der dem Verarbeitungsbereich zum Erzeugen von Ausrichtungsdaten zugeordnet ist, die die Ausrichtung des Bildes anhand der Ausrichtung mindestens eines Gesichts in dem Bild anzeigen; ein Speichermedium zur Speicherung der Bilddaten; und Aufzeichnungsmittel, die dem Verarbeitungsbereich zur Aufzeichnung der Ausrichtungsdaten mit den Bilddaten auf dem Speichermedium zugeordnet sind.
  16. Verfahren nach Anspruch 1, worin das Verfahren in einer Digitalkamera zur Erfassung eines Bildes einer Szene implementiert ist und wobei die Digitalkamera Folgendes umfasst: einen Erfassungsbereich zur Erfassung eines Bildes und zur Erzeugung der Bilddaten; einen elektronischen Verarbeitungsbereich zur Verarbeitung der Bilddaten zur Ermittlung des Vorhandenseins eines oder mehrerer Gesichter in der Szene; einen Algorithmus zur Erkennung roter Augen, der dem elektronischen Verarbeitungsbereich zur Erzeugung Roter-Augen-Signale zugeordnet ist, um das Vorhandensein roter Augen in einem oder in mehreren Gesichtern anzuzeigen; und eine Anzeigevorrichtung, die auf Rote-Augen-Signale anspricht, um einem Benutzer der Digitalkamera eine Rote-Augen-Warnung anzuzeigen.
  17. Verfahren nach Anspruch 16, worin die Digitalkamera zudem Rote-Augen-Korrekturmittel umfasst, die auf die Rote-Augen-Signale zur Korrektur des roten Auges in dem einen Gesicht oder in mehreren Gesichtern ansprechen.
  18. Verfahren nach Anspruch 1, das zudem folgende Schritte umfasst: Verarbeiten der Bilddaten mit einem Rote-Augen-Erkennungsalgorithmus zum Erzeugen von Rote-Augen-Signalen, die das Vorhandensein eines roten Auges in dem Bild anzeigen; und Bestätigen des Vorhandenseins eines roten Auges durch Verwendung der Ergebnisse der Gesichtserfassung zur Verifizierung, dass die Rote-Augen-Signale dem Vorhandensein eines oder mehrerer Gesichter in dem Bild entsprechen.
  19. Verfahren nach Anspruch 18 mit zudem dem Schritt des Korrigierens des roten Auges in dem Bild.
  20. Verfahren nach Anspruch 1, worin das Verfahren in einer Digitalkamera zur Durchführung des ersten und zweiten Algorithmus implementiert ist.
DE60116949T 2000-02-28 2001-02-16 Gesichtserfassungsverfahren Expired - Lifetime DE60116949T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/514,436 US6940545B1 (en) 2000-02-28 2000-02-28 Face detecting camera and method
US514436 2000-02-28

Publications (2)

Publication Number Publication Date
DE60116949D1 DE60116949D1 (de) 2006-04-13
DE60116949T2 true DE60116949T2 (de) 2006-10-19

Family

ID=24047119

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60116949T Expired - Lifetime DE60116949T2 (de) 2000-02-28 2001-02-16 Gesichtserfassungsverfahren

Country Status (4)

Country Link
US (2) US6940545B1 (de)
EP (1) EP1128316B1 (de)
JP (2) JP2001309225A (de)
DE (1) DE60116949T2 (de)

Families Citing this family (393)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7634662B2 (en) * 2002-11-21 2009-12-15 Monroe David A Method for incorporating facial recognition technology in a multimedia surveillance system
US7760905B2 (en) 1999-06-29 2010-07-20 Digimarc Corporation Wireless mobile phone with content processing
JP2000350123A (ja) * 1999-06-04 2000-12-15 Fuji Photo Film Co Ltd 画像選択装置、カメラ、画像選択方法及び記録媒体
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
EP1956557A1 (de) * 2000-03-08 2008-08-13 Cyberextruder.com, Inc. Erzeugung einer 3D-Darstellungsform
US6701005B1 (en) 2000-04-29 2004-03-02 Cognex Corporation Method and apparatus for three-dimensional object segmentation
US6753929B1 (en) 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US7698450B2 (en) * 2000-11-17 2010-04-13 Monroe David A Method and apparatus for distributing digitized streaming video over a network
JP4590717B2 (ja) * 2000-11-17 2010-12-01 ソニー株式会社 顔識別装置及び顔識別方法
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US7958359B2 (en) * 2001-04-30 2011-06-07 Digimarc Corporation Access control systems
AUPR541801A0 (en) * 2001-06-01 2001-06-28 Canon Kabushiki Kaisha Face detection in colour images with complex background
US6930718B2 (en) * 2001-07-17 2005-08-16 Eastman Kodak Company Revised recapture camera and method
US8218829B2 (en) * 2001-08-20 2012-07-10 Polycom, Inc. System and method for using biometrics technology in conferencing
US7298412B2 (en) 2001-09-18 2007-11-20 Ricoh Company, Limited Image pickup device, automatic focusing method, automatic exposure method, electronic flash control method and computer program
CA2359269A1 (en) * 2001-10-17 2003-04-17 Biodentity Systems Corporation Face imaging system for recordal and automated identity confirmation
US7130446B2 (en) 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
US7535496B2 (en) * 2002-01-30 2009-05-19 Intel Corporation Audio-based attention grabber for imaging devices
JP2003259296A (ja) * 2002-03-05 2003-09-12 Fuji Photo Film Co Ltd 画像処理方法および装置並びにプログラム
AU2003220595A1 (en) * 2002-03-27 2003-10-13 The Trustees Of Columbia University In The City Of New York Imaging method and system
AUPS140502A0 (en) 2002-03-27 2002-05-09 Seeing Machines Pty Ltd Method for automatic detection of facial features
EP1353516A1 (de) * 2002-04-08 2003-10-15 Mitsubishi Electric Information Technology Centre Europe B.V. Verfahren und Vorrichtung zum Erfassen bzw. Verfolgen einer oder mehrerer Farbzonen in einem Bild oder einer Bildsequenz
AUPS170902A0 (en) * 2002-04-12 2002-05-16 Canon Kabushiki Kaisha Face detection and tracking in a video sequence
US7843495B2 (en) 2002-07-10 2010-11-30 Hewlett-Packard Development Company, L.P. Face recognition in a digital imaging system accessing a database of people
KR100474848B1 (ko) * 2002-07-19 2005-03-10 삼성전자주식회사 영상시각 정보를 결합하여 실시간으로 복수의 얼굴을검출하고 추적하는 얼굴 검출 및 추적 시스템 및 방법
AU2003252254A1 (en) * 2002-07-26 2004-05-04 Olympus Corporation Image processing system
AU2003252253A1 (en) 2002-07-26 2004-02-16 Olympus Optical Co., Ltd. Image processing system
JP2004062565A (ja) 2002-07-30 2004-02-26 Canon Inc 画像処理装置及び方法並びにプログラム記憶媒体
JP4086580B2 (ja) * 2002-07-30 2008-05-14 キヤノン株式会社 画像処理装置、プログラム及び方法
US7110575B2 (en) * 2002-08-02 2006-09-19 Eastman Kodak Company Method for locating faces in digital color images
US7920718B2 (en) * 2002-09-05 2011-04-05 Cognex Corporation Multi-zone passageway monitoring system and method
JP3931903B2 (ja) * 2002-09-26 2007-06-20 セイコーエプソン株式会社 画像データの出力画像調整
JP2004147018A (ja) * 2002-10-23 2004-05-20 Fuji Photo Film Co Ltd 画像処理方法及びデジタルカメラ
JP4151387B2 (ja) * 2002-11-15 2008-09-17 セイコーエプソン株式会社 被写体の明るさに応じた画質の自動調整
GB2395264A (en) 2002-11-29 2004-05-19 Sony Uk Ltd Face detection in images
CA2509644A1 (en) * 2002-12-11 2004-06-24 Nielsen Media Research, Inc. Detecting a composition of an audience
EP1688884B1 (de) * 2002-12-11 2009-04-01 FUJIFILM Corporation Bildaufnahmevorrichtung
US7203338B2 (en) * 2002-12-11 2007-04-10 Nielsen Media Research, Inc. Methods and apparatus to count people appearing in an image
JP2004206688A (ja) * 2002-12-12 2004-07-22 Fuji Photo Film Co Ltd 顔認識方法、顔切出方法、および撮像装置
CN1306456C (zh) * 2002-12-13 2007-03-21 佳能株式会社 图像处理方法和装置
US7415137B2 (en) * 2002-12-13 2008-08-19 Canon Kabushiki Kaisha Image processing method, apparatus and storage medium
EP1431810A1 (de) * 2002-12-16 2004-06-23 Agfa-Gevaert AG Verfahren zur automatischen Bestimmung von Farbdichte-Korrekturwerten für die Wiedergabe von digitalen Bilddaten
US7634138B2 (en) * 2002-12-20 2009-12-15 Eastman Kodak Company Method for generating an image of a detected subject
US7120279B2 (en) * 2003-01-30 2006-10-10 Eastman Kodak Company Method for face orientation determination in digital color images
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US20040207743A1 (en) * 2003-04-15 2004-10-21 Nikon Corporation Digital camera system
TWI226020B (en) * 2003-05-16 2005-01-01 Benq Corp Device and method to determine exposure setting for image of scene with human-face area
CN1293515C (zh) * 2003-06-24 2007-01-03 明基电通股份有限公司 确定具有人脸区域的影像的曝光设定的装置及方法
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US8698924B2 (en) 2007-03-05 2014-04-15 DigitalOptics Corporation Europe Limited Tone mapping for low-light video frame enhancement
US20130010138A1 (en) * 2003-06-26 2013-01-10 Petronel Bigioi Digital Camera with an Image Processor
US8989516B2 (en) * 2007-09-18 2015-03-24 Fotonation Limited Image processing method and apparatus
US8896725B2 (en) 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US7471846B2 (en) * 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US7317815B2 (en) * 2003-06-26 2008-01-08 Fotonation Vision Limited Digital image processing composition using face detection information
US8363951B2 (en) 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US7616233B2 (en) * 2003-06-26 2009-11-10 Fotonation Vision Limited Perfecting of digital image capture parameters within acquisition devices using face detection
US7440593B1 (en) * 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US8593542B2 (en) 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US7587068B1 (en) * 2004-01-22 2009-09-08 Fotonation Vision Limited Classification database for consumer digital images
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8682097B2 (en) 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US7315630B2 (en) * 2003-06-26 2008-01-01 Fotonation Vision Limited Perfecting of digital image rendering parameters within rendering devices using face detection
US7620218B2 (en) 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US7362368B2 (en) * 2003-06-26 2008-04-22 Fotonation Vision Limited Perfecting the optics within a digital image acquisition device using face detection
US7565030B2 (en) * 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US8155397B2 (en) 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US8553949B2 (en) 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US8264576B2 (en) 2007-03-05 2012-09-11 DigitalOptics Corporation Europe Limited RGBW sensor array
US7792335B2 (en) * 2006-02-24 2010-09-07 Fotonation Vision Limited Method and apparatus for selective disqualification of digital images
US7269292B2 (en) 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US9129381B2 (en) 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US8330831B2 (en) 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7274822B2 (en) * 2003-06-30 2007-09-25 Microsoft Corporation Face annotation for photo management
JP2005033508A (ja) * 2003-07-14 2005-02-03 Minolta Co Ltd 撮像装置
EP1653279B1 (de) * 2003-07-15 2019-02-06 Omron Corporation Objekt-entscheidungseinrichtung und abbildungseinrichtung
JP4307301B2 (ja) 2003-07-31 2009-08-05 キヤノン株式会社 画像処理装置およびその方法
US7920725B2 (en) * 2003-09-09 2011-04-05 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
US7308156B2 (en) * 2003-09-30 2007-12-11 Fotonation Vision Limited Automated statistical self-calibrating detection and removal of blemishes in digital images based on a dust map developed from actual image data
US7310450B2 (en) 2003-09-30 2007-12-18 Fotonation Vision Limited Method of detecting and correcting dust in digital images based on aura and shadow region analysis
US7206461B2 (en) * 2003-09-30 2007-04-17 Fotonation Vision Limited Digital image acquisition and processing system
US7424170B2 (en) * 2003-09-30 2008-09-09 Fotonation Vision Limited Automated statistical self-calibrating detection and removal of blemishes in digital images based on determining probabilities based on image analysis of single images
US7315658B2 (en) * 2003-09-30 2008-01-01 Fotonation Vision Limited Digital camera
US7676110B2 (en) * 2003-09-30 2010-03-09 Fotonation Vision Limited Determination of need to service a camera based on detection of blemishes in digital images
US7590305B2 (en) 2003-09-30 2009-09-15 Fotonation Vision Limited Digital camera with built-in lens calibration table
US7340109B2 (en) * 2003-09-30 2008-03-04 Fotonation Vision Limited Automated statistical self-calibrating detection and removal of blemishes in digital images dependent upon changes in extracted parameter values
US8369650B2 (en) 2003-09-30 2013-02-05 DigitalOptics Corporation Europe Limited Image defect map creation using batches of digital images
US7369712B2 (en) * 2003-09-30 2008-05-06 Fotonation Vision Limited Automated statistical self-calibrating detection and removal of blemishes in digital images based on multiple occurrences of dust in images
US7295233B2 (en) * 2003-09-30 2007-11-13 Fotonation Vision Limited Detection and removal of blemishes in digital images utilizing original images of defocused scenes
JP4470434B2 (ja) * 2003-10-06 2010-06-02 富士ゼロックス株式会社 動作識別装置、及び対象物の姿勢識別装置
US8159561B2 (en) 2003-10-10 2012-04-17 Nikon Corporation Digital camera with feature extraction device
JP2005128956A (ja) * 2003-10-27 2005-05-19 Pentax Corp 被写体判定プログラム及びデジタルカメラ
US7623674B2 (en) * 2003-11-05 2009-11-24 Cognex Technology And Investment Corporation Method and system for enhanced portal security through stereoscopy
US8326084B1 (en) * 2003-11-05 2012-12-04 Cognex Technology And Investment Corporation System and method of auto-exposure control for image acquisition hardware using three dimensional information
JP3879732B2 (ja) * 2003-11-27 2007-02-14 コニカミノルタホールディングス株式会社 物体検出装置、物体検知方法、およびコンピュータプログラム
DE60330471D1 (de) * 2003-12-09 2010-01-21 Mitsubishi Electric Corp Verfahren und Vorrichtung zum Trennen von Inhalten in Bildern
GB2409028A (en) * 2003-12-11 2005-06-15 Sony Uk Ltd Face detection
GB2409031A (en) * 2003-12-11 2005-06-15 Sony Uk Ltd Face detection
GB2409029A (en) * 2003-12-11 2005-06-15 Sony Uk Ltd Face detection
JP4121026B2 (ja) 2004-01-21 2008-07-16 富士フイルム株式会社 撮像装置および方法並びにプログラム
US7555148B1 (en) 2004-01-22 2009-06-30 Fotonation Vision Limited Classification system for consumer digital images using workflow, face detection, normalization, and face recognition
US7551755B1 (en) 2004-01-22 2009-06-23 Fotonation Vision Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7564994B1 (en) 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
US7558408B1 (en) 2004-01-22 2009-07-07 Fotonation Vision Limited Classification system for consumer digital images using workflow and user interface modules, and face detection and recognition
CN101701849A (zh) * 2004-01-23 2010-05-05 奥林巴斯株式会社 图像处理系统以及照相机
JP2005215750A (ja) 2004-01-27 2005-08-11 Canon Inc 顔検知装置および顔検知方法
CN100448267C (zh) 2004-02-06 2008-12-31 株式会社尼康 数码相机
US7460737B2 (en) 2004-02-12 2008-12-02 Hoshiko Llc Method and apparatus for photograph finding
JP2005309409A (ja) * 2004-03-25 2005-11-04 Fuji Photo Film Co Ltd 赤目防止装置、プログラムおよびプログラムを記録した記録媒体
WO2005093654A2 (en) 2004-03-25 2005-10-06 Fatih Ozluturk Method and apparatus to correct digital image blur due to motion of subject or imaging device
JP4130641B2 (ja) * 2004-03-31 2008-08-06 富士フイルム株式会社 ディジタル・スチル・カメラおよびその制御方法
JP4154400B2 (ja) * 2004-04-01 2008-09-24 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
JP4352980B2 (ja) * 2004-04-23 2009-10-28 オムロン株式会社 拡大表示装置及び拡大画像制御装置
US20050237473A1 (en) * 2004-04-27 2005-10-27 Stephenson Stanley W Coatable conductive layer
WO2005106772A1 (en) * 2004-04-29 2005-11-10 Koninklijke Philips Electronics N.V. Apparatus that supports electronic viewfinding
US20050248681A1 (en) 2004-05-07 2005-11-10 Nikon Corporation Digital camera
JP4572583B2 (ja) * 2004-05-31 2010-11-04 パナソニック電工株式会社 撮像装置
AU2005202479B2 (en) * 2004-06-08 2008-01-03 Canon Kabushiki Kaisha Picture composition guide
US7460782B2 (en) 2004-06-08 2008-12-02 Canon Kabushiki Kaisha Picture composition guide
JP2006025238A (ja) * 2004-07-08 2006-01-26 Fuji Photo Film Co Ltd 撮像装置
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
US7430369B2 (en) 2004-08-16 2008-09-30 Canon Kabushiki Kaisha Image capture apparatus and control method therefor
WO2006025185A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 監視記録装置およびその方法
US20060061599A1 (en) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for automatic image orientation normalization
EP1794703A4 (de) * 2004-09-17 2012-02-29 Cyberextruder Com Inc System, verfahren und vorrichtung zur erzeugug einer dreidimensionalen darstelllung aus einem oder mehreren zweidimensionalen bildern
CA2568633C (en) * 2004-10-15 2008-04-01 Oren Halpern A system and a method for improving the captured images of digital still cameras
US7542600B2 (en) * 2004-10-21 2009-06-02 Microsoft Corporation Video image quality
US8320641B2 (en) 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
JP4328286B2 (ja) * 2004-12-14 2009-09-09 本田技研工業株式会社 顔領域推定装置、顔領域推定方法及び顔領域推定プログラム
US8488023B2 (en) * 2009-05-20 2013-07-16 DigitalOptics Corporation Europe Limited Identifying facial expressions in acquired digital images
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US8503800B2 (en) 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
US7936919B2 (en) * 2005-01-18 2011-05-03 Fujifilm Corporation Correction of color balance of face images depending upon whether image is color or monochrome
US7095892B2 (en) 2005-01-26 2006-08-22 Motorola, Inc. Object-of-interest image capture
JP4284448B2 (ja) * 2005-01-28 2009-06-24 富士フイルム株式会社 画像処理装置及び方法
US20060170956A1 (en) 2005-01-31 2006-08-03 Jung Edward K Shared image devices
US9910341B2 (en) 2005-01-31 2018-03-06 The Invention Science Fund I, Llc Shared image device designation
US9489717B2 (en) * 2005-01-31 2016-11-08 Invention Science Fund I, Llc Shared image device
US9325781B2 (en) 2005-01-31 2016-04-26 Invention Science Fund I, Llc Audio sharing
US9082456B2 (en) 2005-01-31 2015-07-14 The Invention Science Fund I Llc Shared image device designation
US9124729B2 (en) 2005-01-31 2015-09-01 The Invention Science Fund I, Llc Shared image device synchronization or designation
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video
US20060222243A1 (en) * 2005-04-02 2006-10-05 Newell Martin E Extraction and scaled display of objects in an image
US7403642B2 (en) * 2005-04-21 2008-07-22 Microsoft Corporation Efficient propagation for face annotation
WO2006115156A1 (ja) * 2005-04-25 2006-11-02 Matsushita Electric Industrial Co., Ltd. 監視カメラシステム、撮影装置および映像表示装置
US9819490B2 (en) 2005-05-04 2017-11-14 Invention Science Fund I, Llc Regional proximity for shared image device(s)
US10003762B2 (en) 2005-04-26 2018-06-19 Invention Science Fund I, Llc Shared image devices
US9451200B2 (en) 2005-06-02 2016-09-20 Invention Science Fund I, Llc Storage access technique for captured data
US9967424B2 (en) 2005-06-02 2018-05-08 Invention Science Fund I, Llc Data storage usage protocol
US9621749B2 (en) 2005-06-02 2017-04-11 Invention Science Fund I, Llc Capturing selected image objects
US20070222865A1 (en) 2006-03-15 2007-09-27 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Enhanced video/still image correlation
JP4772544B2 (ja) * 2005-04-27 2011-09-14 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
JP4519708B2 (ja) * 2005-05-11 2010-08-04 富士フイルム株式会社 撮影装置および方法並びにプログラム
JP4906034B2 (ja) * 2005-05-16 2012-03-28 富士フイルム株式会社 撮影装置および方法並びにプログラム
US7590267B2 (en) * 2005-05-31 2009-09-15 Microsoft Corporation Accelerated face detection based on prior probability of a view
JP4217698B2 (ja) * 2005-06-20 2009-02-04 キヤノン株式会社 撮像装置及び画像処理方法
JP4457980B2 (ja) * 2005-06-21 2010-04-28 ソニー株式会社 撮像装置、この装置の処理方法およびその方法をコンピュータに実行させるプログラム
JP4429241B2 (ja) 2005-09-05 2010-03-10 キヤノン株式会社 画像処理装置及び方法
JP4718952B2 (ja) * 2005-09-27 2011-07-06 富士フイルム株式会社 画像補正方法および画像補正システム
US20090060289A1 (en) * 2005-09-28 2009-03-05 Alex Shah Digital Image Search System And Method
US8369570B2 (en) * 2005-09-28 2013-02-05 Facedouble, Inc. Method and system for tagging an image of an individual in a plurality of photos
US8311294B2 (en) * 2009-09-08 2012-11-13 Facedouble, Inc. Image classification and information retrieval over wireless digital networks and the internet
US7450740B2 (en) 2005-09-28 2008-11-11 Facedouble, Inc. Image classification and information retrieval over wireless digital networks and the internet
US8111904B2 (en) 2005-10-07 2012-02-07 Cognex Technology And Investment Corp. Methods and apparatus for practical 3D vision system
US20070080967A1 (en) * 2005-10-11 2007-04-12 Animetrics Inc. Generation of normalized 2D imagery and ID systems via 2D to 3D lifting of multifeatured objects
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
CN101297548A (zh) * 2005-10-26 2008-10-29 松下电器产业株式会社 影像再生装置和影像记录装置、影像再生方法和影像记录方法以及半导体集成电路
US7885458B1 (en) * 2005-10-27 2011-02-08 Nvidia Corporation Illuminant estimation using gamut mapping and scene classification
US8488847B2 (en) * 2005-11-25 2013-07-16 Nikon Corporation Electronic camera and image processing device
GB2432659A (en) * 2005-11-28 2007-05-30 Pixology Software Ltd Face detection in digital images
US20070121094A1 (en) * 2005-11-30 2007-05-31 Eastman Kodak Company Detecting objects of interest in digital images
US20070126876A1 (en) * 2005-11-30 2007-06-07 Eastman Kodak Company Locating digital image planar surfaces
US20070140532A1 (en) * 2005-12-20 2007-06-21 Goffin Glen P Method and apparatus for providing user profiling based on facial recognition
JP2007174378A (ja) * 2005-12-22 2007-07-05 Fujifilm Corp 画像ファイリング方法及びデジタルカメラ及び画像ファイリング処理プログラム及び動画記録再生装置
JP2007184683A (ja) * 2006-01-04 2007-07-19 Eastman Kodak Co 画像データ処理装置及び方法
US7694885B1 (en) 2006-01-26 2010-04-13 Adobe Systems Incorporated Indicating a tag with visual data
US7978936B1 (en) 2006-01-26 2011-07-12 Adobe Systems Incorporated Indicating a correspondence between an image and an object
US7716157B1 (en) 2006-01-26 2010-05-11 Adobe Systems Incorporated Searching images with extracted objects
US7813557B1 (en) 2006-01-26 2010-10-12 Adobe Systems Incorporated Tagging detected objects
US7720258B1 (en) * 2006-01-26 2010-05-18 Adobe Systems Incorporated Structured comparison of objects from similar images
US7813526B1 (en) * 2006-01-26 2010-10-12 Adobe Systems Incorporated Normalizing detected objects
US8259995B1 (en) 2006-01-26 2012-09-04 Adobe Systems Incorporated Designating a tag icon
US7636450B1 (en) * 2006-01-26 2009-12-22 Adobe Systems Incorporated Displaying detected objects to indicate grouping
US7706577B1 (en) 2006-01-26 2010-04-27 Adobe Systems Incorporated Exporting extracted faces
WO2007095556A2 (en) 2006-02-14 2007-08-23 Fotonation Vision Limited Digital image acquisition device with built in dust and sensor mapping capability
US8068160B2 (en) 2006-02-20 2011-11-29 Panasonic Corporation Imaging apparatus, printing apparatus, printing system, printing method, display system, display apparatus, and display method
US7804983B2 (en) 2006-02-24 2010-09-28 Fotonation Vision Limited Digital image acquisition control and correction method and apparatus
EP2405646A1 (de) * 2006-03-23 2012-01-11 Nikon Corporation Kamera und Bildverarbeitungsprogramm
US7792355B2 (en) 2006-03-30 2010-09-07 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and image capturing apparatus
JP2007274017A (ja) * 2006-03-30 2007-10-18 Fujifilm Corp 自動トリミング方法および装置ならびにプログラム
JP5239126B2 (ja) * 2006-04-11 2013-07-17 株式会社ニコン 電子カメラ
US8766995B2 (en) * 2006-04-26 2014-07-01 Qualcomm Incorporated Graphics system with configurable caches
US20070268289A1 (en) * 2006-05-16 2007-11-22 Chun Yu Graphics system with dynamic reposition of depth engine
US8884972B2 (en) 2006-05-25 2014-11-11 Qualcomm Incorporated Graphics processor with arithmetic and elementary function units
US8869147B2 (en) * 2006-05-31 2014-10-21 Qualcomm Incorporated Multi-threaded processor with deferred thread output control
DE602007012246D1 (de) 2006-06-12 2011-03-10 Tessera Tech Ireland Ltd Fortschritte bei der erweiterung der aam-techniken aus grauskalen- zu farbbildern
US8644643B2 (en) * 2006-06-14 2014-02-04 Qualcomm Incorporated Convolution filtering in a graphics processor
US8766996B2 (en) * 2006-06-21 2014-07-01 Qualcomm Incorporated Unified virtual addressed register file
US20080004892A1 (en) * 2006-06-30 2008-01-03 Jerry Zucker Biometric aid for customer relations
JP4110178B2 (ja) * 2006-07-03 2008-07-02 キヤノン株式会社 撮像装置及びその制御方法及びプログラム及び記憶媒体
US7515740B2 (en) 2006-08-02 2009-04-07 Fotonation Vision Limited Face recognition with combined PCA-based datasets
US7403643B2 (en) 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US7916897B2 (en) 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
JP4460560B2 (ja) * 2006-09-29 2010-05-12 富士フイルム株式会社 撮像装置及び撮影方法
JP5055939B2 (ja) 2006-10-12 2012-10-24 株式会社ニコン デジタルカメラ
US10021291B2 (en) 2006-11-16 2018-07-10 Samsung Electronics Co., Ltd Portable device enabling a user to manually adjust locations of focusing and photometry and method for taking images
KR100805293B1 (ko) * 2006-11-16 2008-02-20 삼성전자주식회사 휴대기기 및 그 촬영방법
US7847830B2 (en) * 2006-11-21 2010-12-07 Sony Ericsson Mobile Communications Ab System and method for camera metering based on flesh tone detection
KR100856273B1 (ko) * 2006-12-12 2008-09-03 삼성전자주식회사 영상 자동 기록 방법 및 장치
FR2910143B1 (fr) * 2006-12-19 2009-04-03 Eastman Kodak Co Procede pour predire automatiquement des mots dans un texte associe a un message multimedia
US20080155422A1 (en) * 2006-12-20 2008-06-26 Joseph Anthony Manico Automated production of multiple output products
US20080215984A1 (en) * 2006-12-20 2008-09-04 Joseph Anthony Manico Storyshare automation
US7706579B2 (en) * 2006-12-21 2010-04-27 Sony Ericsson Communications Ab Image orientation for display
JP2008160620A (ja) * 2006-12-26 2008-07-10 Matsushita Electric Ind Co Ltd 画像処理装置および撮像装置
KR101310230B1 (ko) * 2007-01-17 2013-09-24 삼성전자주식회사 디지털 촬영장치, 그 제어방법 및 제어방법을 실행시키기위한 프로그램을 저장한 기록매체
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
JP2008199486A (ja) 2007-02-15 2008-08-28 Olympus Imaging Corp 一眼レフレックス型の電子撮像装置
ATE472140T1 (de) 2007-02-28 2010-07-15 Fotonation Vision Ltd Trennung der direktionalen beleuchtungsvariabilität in der statistischen gesichtsmodellierung auf basis von texturraumzerlegungen
JP4781299B2 (ja) * 2007-02-28 2011-09-28 キヤノン株式会社 画像処理装置及び画像処理方法並びに撮像装置
EP2123008A4 (de) 2007-03-05 2011-03-16 Tessera Tech Ireland Ltd Gesichtskategorisierungs- und anmerkungssystem für eine mobiltelefon-kontaktliste
US8649604B2 (en) 2007-03-05 2014-02-11 DigitalOptics Corporation Europe Limited Face searching and detection in a digital image acquisition device
GB2447247B (en) * 2007-03-07 2011-11-23 Aurora Comp Services Ltd Adaptive colour correction,exposure and gain control for area specific imaging in biometric applications
US7916969B2 (en) * 2007-03-23 2011-03-29 Seiko Epson Corporation Varying the exposure of a digital image by region
US8564687B2 (en) * 2007-05-07 2013-10-22 Nvidia Corporation Efficient determination of an illuminant of a scene
JP4315215B2 (ja) * 2007-05-18 2009-08-19 カシオ計算機株式会社 撮像装置、及び顔検出方法、顔検出制御プログラム
US7916971B2 (en) 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
US8126260B2 (en) * 2007-05-29 2012-02-28 Cognex Corporation System and method for locating a three-dimensional object using machine vision
US8698917B2 (en) * 2007-06-04 2014-04-15 Nvidia Corporation Reducing computational complexity in determining an illuminant of a scene
US8934717B2 (en) * 2007-06-05 2015-01-13 Intellectual Ventures Fund 83 Llc Automatic story creation using semantic classifiers for digital assets and associated metadata
KR101431535B1 (ko) * 2007-08-30 2014-08-19 삼성전자주식회사 얼굴인식 기능을 이용한 영상 촬영 장치 및 방법
JP4927669B2 (ja) * 2007-09-05 2012-05-09 浜松ホトニクス株式会社 固体撮像装置
US8094971B2 (en) * 2007-09-05 2012-01-10 Seiko Epson Corporation Method and system for automatically determining the orientation of a digital image
JP2009089174A (ja) * 2007-10-01 2009-04-23 Fujifilm Corp デジタルカメラおよびその撮影方法
JP4995024B2 (ja) * 2007-10-02 2012-08-08 キヤノン株式会社 パターン認識方法、パターン認識装置及びプログラム
US7949621B2 (en) * 2007-10-12 2011-05-24 Microsoft Corporation Object detection and recognition with bayesian boosting
US20090128644A1 (en) * 2007-11-15 2009-05-21 Camp Jr William O System and method for generating a photograph
KR101411910B1 (ko) * 2008-01-04 2014-06-26 삼성전자주식회사 디지털 촬영 장치 및 이의 제어 방법
US20090174805A1 (en) * 2008-01-07 2009-07-09 Motorola, Inc. Digital camera focusing using stored object recognition
US8194156B2 (en) * 2008-01-07 2012-06-05 Sony Ericsson Mobile Communications Ab EXIF object coordinates
JP5089405B2 (ja) * 2008-01-17 2012-12-05 キヤノン株式会社 画像処理装置及び画像処理方法並びに撮像装置
JP4972569B2 (ja) * 2008-01-24 2012-07-11 浜松ホトニクス株式会社 固体撮像装置
US8750578B2 (en) 2008-01-29 2014-06-10 DigitalOptics Corporation Europe Limited Detecting facial expressions in digital images
US8385681B2 (en) 2008-02-11 2013-02-26 Apple Inc. Blemish removal
US8233676B2 (en) * 2008-03-07 2012-07-31 The Chinese University Of Hong Kong Real-time body segmentation system
EP2104338A3 (de) * 2008-03-19 2011-08-31 FUJIFILM Corporation Autofokussystem
US7855737B2 (en) 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
JP2009246545A (ja) * 2008-03-28 2009-10-22 Brother Ind Ltd 画像出力装置
US8868929B2 (en) * 2008-04-08 2014-10-21 Microelectronica Espanola S.A.U. Method of mass storage memory management for large capacity universal integrated circuit cards
JP5121681B2 (ja) * 2008-04-30 2013-01-16 株式会社日立製作所 生体認証システム、認証クライアント端末、及び生体認証方法
JP5251547B2 (ja) * 2008-06-06 2013-07-31 ソニー株式会社 画像撮影装置及び画像撮影方法、並びにコンピュータ・プログラム
US8036417B2 (en) * 2008-06-11 2011-10-11 Eastman Kodak Company Finding orientation and date of hardcopy medium
US20090310189A1 (en) 2008-06-11 2009-12-17 Gallagher Andrew C Determining the orientation of scanned hardcopy medium
US20090310863A1 (en) * 2008-06-11 2009-12-17 Gallagher Andrew C Finding image capture date of hardcopy medium
JP4966260B2 (ja) * 2008-06-25 2012-07-04 キヤノン株式会社 画像処理方法および画像処理装置、プログラム並びに、コンピュータ読み取り可能な記憶媒体
CN101617974A (zh) * 2008-06-30 2010-01-06 鸿富锦精密工业(深圳)有限公司 近视防护系统
TWI413003B (zh) * 2008-07-23 2013-10-21 Altek Corp Face recognition of the automatic camera method
JP5547730B2 (ja) 2008-07-30 2014-07-16 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド 顔検知を用いた顔及び肌の自動美化
US8520089B2 (en) * 2008-07-30 2013-08-27 DigitalOptics Corporation Europe Limited Eye beautification
US8411963B2 (en) * 2008-08-08 2013-04-02 The Nielsen Company (U.S.), Llc Methods and apparatus to count persons in a monitored environment
US8805110B2 (en) 2008-08-19 2014-08-12 Digimarc Corporation Methods and systems for content processing
US8237847B2 (en) * 2008-10-16 2012-08-07 Fujinon Corporation Auto focus system having AF frame auto-tracking function
KR101539043B1 (ko) 2008-10-31 2015-07-24 삼성전자주식회사 인물 구도 제안 영상 촬영 장치 및 방법
US8270682B2 (en) * 2008-11-25 2012-09-18 Eastman Kodak Company Hair segmentation
US8493178B2 (en) * 2008-12-02 2013-07-23 Electronics And Telecommunications Research Institute Forged face detecting method and apparatus thereof
WO2010063463A2 (en) 2008-12-05 2010-06-10 Fotonation Ireland Limited Face recognition using face tracker classifier data
US8355567B2 (en) * 2008-12-12 2013-01-15 Tektronix, Inc. Method and apparatus for implementing moving image color appearance model for video quality ratings prediction
US8396263B2 (en) * 2008-12-30 2013-03-12 Nokia Corporation Method, apparatus and computer program product for providing face pose estimation
US20100186234A1 (en) 2009-01-28 2010-07-29 Yehuda Binder Electric shaver with imaging capability
US9495583B2 (en) * 2009-01-05 2016-11-15 Apple Inc. Organizing images by correlating faces
US9514355B2 (en) 2009-01-05 2016-12-06 Apple Inc. Organizing images by correlating faces
US8385638B2 (en) * 2009-01-05 2013-02-26 Apple Inc. Detecting skin tone in images
US8548257B2 (en) 2009-01-05 2013-10-01 Apple Inc. Distinguishing between faces and non-faces
JP2010165052A (ja) * 2009-01-13 2010-07-29 Canon Inc 画像処理装置及び画像処理方法
JP4911191B2 (ja) * 2009-04-08 2012-04-04 株式会社ニコン 画像処理装置および画像処理プログラム
US8754960B2 (en) * 2009-05-01 2014-06-17 Koninklijke Philips N.V. Systems and apparatus for image-based lighting control and security control
JP5525757B2 (ja) * 2009-05-18 2014-06-18 オリンパス株式会社 画像処理装置、電子機器、及びプログラム
US20100295782A1 (en) 2009-05-21 2010-11-25 Yehuda Binder System and method for control based on face ore hand gesture detection
WO2010136593A2 (en) 2009-05-29 2010-12-02 Tessera Technologies Ireland Limited Methods and apparatuses for foreground, top-of-the-head separation from background
US8675099B2 (en) * 2009-06-16 2014-03-18 Aptina Imaging Corporation Efficient system and method for face tracking
TWI383673B (zh) * 2009-09-01 2013-01-21 Quanta Comp Inc 測光權重調整方法及其裝置
JP5388774B2 (ja) * 2009-09-24 2014-01-15 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
JP5385752B2 (ja) * 2009-10-20 2014-01-08 キヤノン株式会社 画像認識装置、その処理方法及びプログラム
US8416277B2 (en) * 2009-12-10 2013-04-09 Apple Inc. Face detection as a metric to stabilize video during video chat session
US20110194762A1 (en) * 2010-02-04 2011-08-11 Samsung Electronics Co., Ltd. Method for detecting hair region
US8957981B2 (en) 2010-03-03 2015-02-17 Intellectual Ventures Fund 83 Llc Imaging device for capturing self-portrait images
US9047531B2 (en) 2010-05-21 2015-06-02 Hand Held Products, Inc. Interactive user interface for capturing a document in an image signal
US8600167B2 (en) 2010-05-21 2013-12-03 Hand Held Products, Inc. System for capturing a document in an image signal
WO2011149558A2 (en) 2010-05-28 2011-12-01 Abelow Daniel H Reality alternate
EP2577242B1 (de) 2010-06-04 2018-10-24 TECNIMED S.r.l. Verfahren und vorrichtung zur messung der körperinnentemperatur eines patienten
JP5451883B2 (ja) * 2010-06-30 2014-03-26 Necソフト株式会社 頭部検出方法、頭部検出装置、属性判定方法、属性判定装置、プログラム、記録媒体および属性判定システム
US8971628B2 (en) 2010-07-26 2015-03-03 Fotonation Limited Face detection using division-generated haar-like features for illumination invariance
US8774528B2 (en) 2010-09-24 2014-07-08 Kodak Alaris Inc. Method of selecting important digital images
JP2012068948A (ja) * 2010-09-24 2012-04-05 Renesas Electronics Corp 顔属性推定装置およびその方法
US9185469B2 (en) 2010-09-30 2015-11-10 Kodak Alaris Inc. Summarizing image collection using a social network
JP5649425B2 (ja) * 2010-12-06 2015-01-07 株式会社東芝 映像検索装置
KR20120075845A (ko) * 2010-12-29 2012-07-09 삼성전자주식회사 터치스크린 단말기에서 메모 방법 및 장치
US8612441B2 (en) 2011-02-04 2013-12-17 Kodak Alaris Inc. Identifying particular images from a collection
TWI455043B (zh) * 2011-03-01 2014-10-01 Hon Hai Prec Ind Co Ltd 防紅眼人像拍攝系統及方法
TWI454131B (zh) * 2011-03-31 2014-09-21 Realtek Semiconductor Corp 立體影像格式的量測裝置及相關方法
US9552376B2 (en) 2011-06-09 2017-01-24 MemoryWeb, LLC Method and apparatus for managing digital files
US9055276B2 (en) 2011-07-29 2015-06-09 Apple Inc. Camera having processing customized for identified persons
US8620088B2 (en) 2011-08-31 2013-12-31 The Nielsen Company (Us), Llc Methods and apparatus to count people in images
US10122970B2 (en) 2011-09-13 2018-11-06 Polycom, Inc. System and methods for automatic call initiation based on biometric data
WO2013063270A1 (en) * 2011-10-25 2013-05-02 Montaj, Inc. Methods and systems for creating video content on mobile devices
US9025835B2 (en) * 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US20130108168A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US8811747B2 (en) * 2011-10-28 2014-08-19 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US8938100B2 (en) * 2011-10-28 2015-01-20 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US9025836B2 (en) 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US9008436B2 (en) 2011-10-28 2015-04-14 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
JP5000781B1 (ja) * 2011-11-09 2012-08-15 楽天株式会社 画像処理装置、画像処理装置の制御方法、プログラム、及び情報記憶媒体
US9253340B2 (en) 2011-11-11 2016-02-02 Intellectual Ventures Fund 83 Llc Wireless camera with image sharing prioritization
US20130272609A1 (en) * 2011-12-12 2013-10-17 Intel Corporation Scene segmentation using pre-capture image motion
US8897553B2 (en) 2011-12-13 2014-11-25 The Nielsen Company (Us), Llc Image comparison using color histograms
US8897554B2 (en) 2011-12-13 2014-11-25 The Nielsen Company (Us), Llc Video comparison using color histograms
US8750613B2 (en) 2011-12-13 2014-06-10 The Nielsen Company (Us), Llc Detecting objects in images using color histograms
US20130201316A1 (en) 2012-01-09 2013-08-08 May Patents Ltd. System and method for server based control
CN103208005A (zh) * 2012-01-13 2013-07-17 富士通株式会社 对象识别方法和对象识别设备
JP5949030B2 (ja) 2012-03-26 2016-07-06 カシオ計算機株式会社 画像生成装置、画像生成方法及びプログラム
JP5959923B2 (ja) * 2012-04-26 2016-08-02 キヤノン株式会社 検出装置、その制御方法、および制御プログラム、並びに撮像装置および表示装置
TWI576771B (zh) * 2012-05-28 2017-04-01 宏碁股份有限公司 透明顯示裝置及其透明度調整方法
US8965119B2 (en) 2012-06-10 2015-02-24 Apple Inc. Color balance tools for editing images
US20130329996A1 (en) 2012-06-10 2013-12-12 Apple Inc. Method and system for auto-enhancing photographs with tonal response curves
US9536290B2 (en) 2012-06-10 2017-01-03 Apple Inc. Tempered auto-adjusting, image-editing operation
JP2014021782A (ja) * 2012-07-19 2014-02-03 Canon Inc 画像処理装置、その制御方法及びプログラム
JP5949331B2 (ja) * 2012-08-30 2016-07-06 カシオ計算機株式会社 画像生成装置、画像生成方法及びプログラム
JP2014071832A (ja) * 2012-10-01 2014-04-21 Toshiba Corp 物体検出装置及びその検出方法
US9330301B1 (en) * 2012-11-21 2016-05-03 Ozog Media, LLC System, method, and computer program product for performing processing based on object recognition
US9336435B1 (en) * 2012-11-21 2016-05-10 Ozog Media, LLC System, method, and computer program product for performing processing based on object recognition
US9025868B2 (en) 2013-02-27 2015-05-05 Sony Corporation Method and system for image processing to determine a region of interest
US9210319B2 (en) * 2013-07-11 2015-12-08 Magisto Ltd. Method and system for capturing important objects using a camera based on predefined metrics
US9363431B2 (en) * 2013-07-11 2016-06-07 Magisto Ltd. Method and system for capturing important objects using a camera based on predefined metrics
US9489564B2 (en) 2013-07-11 2016-11-08 Google Technology Holdings LLC Method and apparatus for prioritizing image quality of a particular subject within an image
JP6406251B2 (ja) * 2013-07-17 2018-10-17 日本電気株式会社 物体追跡装置、物体追跡方法および物体追跡プログラム
EP2843589B1 (de) 2013-08-29 2019-03-13 Alcatel Lucent Verfahren und Plattform zum Senden einer Nachricht an eine mit einem sich bewegenden Objekt assoziierte Kommunikationsvorrichtung
US9502003B2 (en) 2014-01-05 2016-11-22 Spatial Cam Llc Apparatus and methods to display a modified image
US20150201124A1 (en) * 2014-01-15 2015-07-16 Samsung Electronics Co., Ltd. Camera system and method for remotely controlling compositions of self-portrait pictures using hand gestures
CN106416217A (zh) * 2014-04-17 2017-02-15 索尼公司 照相机的深度辅助场景识别
EP3134850B1 (de) 2014-04-22 2023-06-14 Snap-Aid Patents Ltd. Verfahren zur steuerung einer kamera auf der basis der verarbeitung eines von einer anderen kamera aufgenommenen bildes
WO2015165092A1 (zh) * 2014-04-30 2015-11-05 中国科学院自动化研究所 大范围优先的跨摄像机视觉目标再识别方法
US10026010B2 (en) * 2014-05-14 2018-07-17 At&T Intellectual Property I, L.P. Image quality estimation using a reference image portion
US11170037B2 (en) 2014-06-11 2021-11-09 Kodak Alaris Inc. Method for creating view-based representations from multimedia collections
US20150362989A1 (en) * 2014-06-17 2015-12-17 Amazon Technologies, Inc. Dynamic template selection for object detection and tracking
WO2015192246A1 (en) * 2014-06-19 2015-12-23 Bitlit Media Inc Method and system for identifying books on a bookshelf
US9251427B1 (en) * 2014-08-12 2016-02-02 Microsoft Technology Licensing, Llc False face representation identification
US9747648B2 (en) * 2015-01-20 2017-08-29 Kuo-Chun Fang Systems and methods for publishing data on social media websites
US9986289B2 (en) 2015-03-02 2018-05-29 The Nielsen Company (Us), Llc Methods and apparatus to count people
WO2016157499A1 (ja) * 2015-04-02 2016-10-06 株式会社日立製作所 画像処理装置、物体検知装置、画像処理方法
EP3289430B1 (de) 2015-04-27 2019-10-23 Snap-Aid Patents Ltd. Schätzung und verwendung einer relativen kopfhaltung und kamerasichtfeld
WO2016207875A1 (en) 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image
US9769367B2 (en) 2015-08-07 2017-09-19 Google Inc. Speech and computer vision-based control
TW201707471A (zh) * 2015-08-14 2017-02-16 Unity Opto Technology Co Ltd 自動控制指向性喇叭及其燈具
US9836484B1 (en) 2015-12-30 2017-12-05 Google Llc Systems and methods that leverage deep learning to selectively store images at a mobile image capture device
US10225511B1 (en) 2015-12-30 2019-03-05 Google Llc Low power framework for controlling image sensor mode in a mobile image capture device
US10732809B2 (en) 2015-12-30 2020-08-04 Google Llc Systems and methods for selective retention and editing of images captured by mobile image capture device
US9836819B1 (en) 2015-12-30 2017-12-05 Google Llc Systems and methods for selective retention and editing of images captured by mobile image capture device
US9838641B1 (en) 2015-12-30 2017-12-05 Google Llc Low power framework for processing, compressing, and transmitting images at a mobile image capture device
WO2017149526A2 (en) 2016-03-04 2017-09-08 May Patents Ltd. A method and apparatus for cooperative usage of multiple distance meters
JP2017209486A (ja) * 2016-05-19 2017-11-30 パナソニックIpマネジメント株式会社 血圧計測装置
US9904844B1 (en) * 2016-08-04 2018-02-27 International Business Machines Corporation Clustering large database of images using multilevel clustering approach for optimized face recognition process
EP3512672B1 (de) 2016-09-14 2022-06-15 Koninklijke Philips N.V. Pflegesystem mit adaptiver beleuchtung und betriebsverfahren
CN109906052B (zh) * 2016-11-07 2022-09-23 皇家飞利浦有限公司 包括血压传感器的设备以及用于控制该设备的方法
US10304209B2 (en) 2017-04-19 2019-05-28 The Nielsen Company (Us), Llc Methods and systems to increase accuracy of eye tracking
WO2019010134A1 (en) * 2017-07-03 2019-01-10 Hunsmann Margrit Sieglinde COLOR MOTOR
RU2667790C1 (ru) 2017-09-01 2018-09-24 Самсунг Электроникс Ко., Лтд. Способ автоматической регулировки экспозиции для инфракрасной камеры и использующее этот способ вычислительное устройство пользователя
US20190090011A1 (en) * 2017-09-06 2019-03-21 Venkat Kankipati Realtime in-video image rendering
US11176373B1 (en) * 2018-01-12 2021-11-16 Amazon Technologies, Inc. System and method for visitor detection algorithm
US11615623B2 (en) 2018-02-19 2023-03-28 Nortek Security & Control Llc Object detection in edge devices for barrier operation and parcel delivery
US11295139B2 (en) 2018-02-19 2022-04-05 Intellivision Technologies Corp. Human presence detection in edge devices
JP6977624B2 (ja) * 2018-03-07 2021-12-08 オムロン株式会社 物体検出装置、物体検出方法、およびプログラム
CN108510525B (zh) * 2018-03-30 2019-03-12 百度在线网络技术(北京)有限公司 模板追踪方法、装置、增强现实系统及存储介质
US11113507B2 (en) 2018-05-22 2021-09-07 Samsung Electronics Co., Ltd. System and method for fast object detection
JP7129229B2 (ja) * 2018-06-07 2022-09-01 キヤノン株式会社 画像処理方法、画像処理装置、撮像装置、プログラム、および、記憶媒体
US10936178B2 (en) 2019-01-07 2021-03-02 MemoryWeb, LLC Systems and methods for analyzing and organizing digital photos and videos
CN109714543A (zh) * 2019-01-10 2019-05-03 成都品果科技有限公司 一种获取相机数据流中皮肤亮度及调节曝光度的方法
US20220083786A1 (en) * 2019-01-17 2022-03-17 Jungo Connectivity Ltd. Method and system for monitoring a person using infrared and visible light
CN109948433A (zh) * 2019-01-31 2019-06-28 浙江师范大学 一种嵌入式人脸跟踪方法及装置
EP3888346A4 (de) 2019-02-19 2022-08-24 Edgy Bees Ltd. Schätzung der echtzeitverzögerung eines videodatenstroms
US11711638B2 (en) 2020-06-29 2023-07-25 The Nielsen Company (Us), Llc Audience monitoring systems and related methods
US11475596B2 (en) 2020-07-23 2022-10-18 Motorola Solutions, Inc. Device, method and system for adjusting a configuration of a camera device
CN111881866B (zh) * 2020-08-03 2024-01-19 杭州云栖智慧视通科技有限公司 一种实时人脸抓取推荐方法、装置及计算机设备
US11860704B2 (en) 2021-08-16 2024-01-02 The Nielsen Company (Us), Llc Methods and apparatus to determine user presence
US11758223B2 (en) 2021-12-23 2023-09-12 The Nielsen Company (Us), Llc Apparatus, systems, and methods for user presence detection for audience monitoring
CN114670848B (zh) * 2022-03-02 2022-12-13 江苏泽景汽车电子股份有限公司 危险驾驶的预测方法、装置、终端设备及存储介质

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4503508A (en) 1982-10-12 1985-03-05 Eastman Kodak Company Exposure control apparatus
GB8710737D0 (en) 1987-05-06 1987-06-10 British Telecomm Video image encoding
US5012522A (en) 1988-12-08 1991-04-30 The United States Of America As Represented By The Secretary Of The Air Force Autonomous face recognition machine
JPH03144427A (ja) * 1989-10-30 1991-06-19 Olympus Optical Co Ltd 閃光発光装置
US5103254A (en) 1990-05-29 1992-04-07 Eastman Kodak Company Camera with subject highlighting and motion detection
CA2087523C (en) 1990-07-17 1997-04-15 Mark Andrew Shackleton Method of processing an image
US5164992A (en) 1990-11-01 1992-11-17 Massachusetts Institute Of Technology Face recognition system
JPH0816958B2 (ja) 1991-12-11 1996-02-21 茨城警備保障株式会社 防犯監視システム
JP3298072B2 (ja) 1992-07-10 2002-07-02 ソニー株式会社 ビデオカメラシステム
US5432864A (en) 1992-10-05 1995-07-11 Daozheng Lu Identification card verification system
JPH06313838A (ja) 1993-04-28 1994-11-08 Nikon Corp 音声入力カメラ
US5432863A (en) * 1993-07-19 1995-07-11 Eastman Kodak Company Automated detection and correction of eye color defects due to flash illumination
US5835616A (en) 1994-02-18 1998-11-10 University Of Central Florida Face detection using templates
US5629752A (en) 1994-10-28 1997-05-13 Fuji Photo Film Co., Ltd. Method of determining an exposure amount using optical recognition of facial features
US5870138A (en) 1995-03-31 1999-02-09 Hitachi, Ltd. Facial image processing
US5710833A (en) 1995-04-20 1998-01-20 Massachusetts Institute Of Technology Detection, recognition and coding of complex objects using probabilistic eigenspace analysis
US5642431A (en) 1995-06-07 1997-06-24 Massachusetts Institute Of Technology Network-based system and method for detection of faces and the like
US5781665A (en) * 1995-08-28 1998-07-14 Pitney Bowes Inc. Apparatus and method for cropping an image
US5850470A (en) * 1995-08-30 1998-12-15 Siemens Corporate Research, Inc. Neural network for locating and recognizing a deformable object
US5715325A (en) * 1995-08-30 1998-02-03 Siemens Corporate Research, Inc. Apparatus and method for detecting a face in a video image
US5687412A (en) * 1996-10-25 1997-11-11 Eastman Kodak Company Camera for selectively recording images recorded on a photographic film on a magnetic tape
US6271876B1 (en) * 1997-05-06 2001-08-07 Eastman Kodak Company Using two different capture media to make stereo images of a scene
JP3806489B2 (ja) * 1997-05-12 2006-08-09 オリンパス株式会社 測距装置
JP3222091B2 (ja) * 1997-05-27 2001-10-22 シャープ株式会社 画像処理装置及び画像処理装置制御プログラムを記憶した媒体
US5973734A (en) * 1997-07-09 1999-10-26 Flashpoint Technology, Inc. Method and apparatus for correcting aspect ratio in a camera graphical user interface
US6597817B1 (en) * 1997-07-15 2003-07-22 Silverbrook Research Pty Ltd Orientation detection for digital cameras
US5873007A (en) * 1997-10-28 1999-02-16 Sony Corporation Picture composition guidance system
GB9724933D0 (en) * 1997-11-25 1998-01-28 British Telecomm Image processing
JP3621245B2 (ja) * 1997-12-12 2005-02-16 株式会社東芝 人物認識装置、人物認識方法、および、人物認識プログラムの記録媒体
US6148092A (en) * 1998-01-08 2000-11-14 Sharp Laboratories Of America, Inc System for detecting skin-tone regions within an image
US6278491B1 (en) * 1998-01-29 2001-08-21 Hewlett-Packard Company Apparatus and a method for automatically detecting and reducing red-eye in a digital image
US6038333A (en) * 1998-03-16 2000-03-14 Hewlett-Packard Company Person identifier and management system
JP2000048184A (ja) * 1998-05-29 2000-02-18 Canon Inc 画像処理方法及び顔領域抽出方法とその装置
US6404900B1 (en) * 1998-06-22 2002-06-11 Sharp Laboratories Of America, Inc. Method for robust human face tracking in presence of multiple persons
US6263113B1 (en) * 1998-12-11 2001-07-17 Philips Electronics North America Corp. Method for detecting a face in a digital image
US6301440B1 (en) * 2000-04-13 2001-10-09 International Business Machines Corp. System and method for automatically setting image acquisition controls

Also Published As

Publication number Publication date
JP2001309225A (ja) 2001-11-02
US6940545B1 (en) 2005-09-06
US20050264658A1 (en) 2005-12-01
EP1128316B1 (de) 2006-02-01
DE60116949D1 (de) 2006-04-13
US7583294B2 (en) 2009-09-01
EP1128316A1 (de) 2001-08-29
JP2010045819A (ja) 2010-02-25

Similar Documents

Publication Publication Date Title
DE60116949T2 (de) Gesichtserfassungsverfahren
DE60304278T2 (de) Kameras und verfahren zum ungleichmässigen neuzuordnen von bildern unter verwendung eines kleinen datensatzes
DE60320178T2 (de) Verfahren und System zur Verbesserung von Portraitbildern
JP4335476B2 (ja) 画像の顕著性及びアピール性に基づいて写真印画の数、寸法、及び、倍率を変更する方法
DE60306737T2 (de) Verfahren und system zum bestimmen eines bereichs von bedeutung in einem zu archivierenden bild
DE602006000400T2 (de) Bildsegmentierungsverfahren und -system
DE602004007172T2 (de) Vorrichtung, Verfahren und Programm zur Bearbeitung von Bilddaten
DE69906403T2 (de) Verfahren und Gerät zum Detektieren eines gesichtsähnlichen Gebiets
DE69934068T2 (de) Bestimmung der position von augen durch blitzreflexerkennung und korrektur von defekten in einem aufgenommenen bild
DE69635101T2 (de) Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät
DE10317917B4 (de) System und Verfahren zum Umgrenzen und Klassifizieren von Regionen innerhalb einer graphischen Abbildung
DE60207417T2 (de) Verfahren und vorrichtung zur erzeugung formatierter information, die mit den fehlern zumindest eines geräts einer kette verbunden ist, insbesondere der bildschärfeverzerrung
DE69937707T2 (de) Digitales Fotofinishingsystem mit digitaler Bildverarbeitung
DE602005003917T2 (de) Verfahren und Vorrichtung zur Erzeugung von Bildern mit hoher Dynamik aus mehreren Belichtungen
DE112007002904T5 (de) Vorrichtung und Verfahren zum Erzeugen photorealistischer Bild-Thumbnails
JP7286392B2 (ja) 画像処理装置、画像処理方法、及びプログラム
DE69922752T2 (de) Verfahren zum Detektieren eines menschlichen Gesichtes
DE60307583T2 (de) Auswertung der Schärfe eines Bildes der Iris eines Auges
EP1206118B1 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Aufzeichnungsmedium
DE112006001017B4 (de) Verfahren und Vorrichtung zum Eingliedern von Irisfarbe in eine Rotes-Auge-Korrektur
EP1223551A2 (de) Doppeldruckfotobehandlungsdienst mit inhaltsbasierten Veränderungen des zweiten Drukbildes
EP1223550A2 (de) Verfahren zur Erkennung von Hautfarbe in digitalen Bildern
US20050200722A1 (en) Image capturing apparatus, image capturing method, and machine readable medium storing thereon image capturing program
EP1413972A1 (de) Prüfung von Bildaufnahmen von Personen
JP2002279416A (ja) 色補正方法および色補正装置

Legal Events

Date Code Title Description
8364 No opposition during term of opposition