Die Software erkennt Gesichter besser als die Ermittler
Manuel Günther, zvg.

Die Software erkennt Gesichter besser als die Ermittler

Was Gesichtserkennung bereits kann und womit sich die Forschung noch schwertut.

 

Im Alltag verwenden viele die Gesichtserkennung, um ihre elektronischen Geräte automatisch zu entsperren. Es ist einfacher und sicherer, einmal das Gesicht in die Kamera zu halten, als sich eine PIN zu merken oder ein Muster auf dem Display zu zeichnen. Der automatischen Gesichtserkennung sind manche auch schon an Flughäfen begegnet, als sie durch ein sogenanntes E-Gate gegangen sind. Beide Anwendungen fallen in den Bereich der Verifikation, auch Authentifikation genannt, bei der es darum geht, ein aktuell aufgenommenes Foto mit einem vorher abgelegten Template zu vergleichen – sei es das Foto auf dem Reisepass oder ein Template, das während der Einrichtung des Smartphones aufgenommen wurde.

Der zweite Anwendungsbereich der Gesichtserkennung, nämlich die Identifikation einer Person, funktioniert zwar ähnlich, aber nicht ganz gleich: Es werden nicht nur zwei Bilder miteinander verglichen, sondern es wird versucht, der Person auf dem aktuellen Bild einen Namen zu geben. Dazu muss vorher eine Datenbank mit Gesichtern und zugehörigen Namen angelegt werden, die im Forschungsbereich der Biometrie häufig als Galerie bezeichnet wird. Eine solche Galerie kann zum Beispiel bei der Suche von vermissten Personen dienlich sein – sie kann aber auch sicherstellen, dass beispielsweise Hausverbote eingehalten werden. Im einfachsten Fall können aber auch nur die Personen auf einem persönlichen Gruppenfoto automatisch erkannt werden – als Galerie verwendet die Software dann Fotos, die bereits zu einem früheren Zeitpunkt aufgenommen wurden und bei denen der User selbständig die Namen der fotografierten Personen vermerkt hat.

In drei Schritten zur Erkennung

Die automatische Gesichtserkennung besteht typischerweise aus drei Schritten. Erstens benötigen alle bekannten Gesichtserkennungsalgorithmen ein Gesichtsbild in einem gewissen Format: Das Eingabebild muss also in einer bestimmten Auflösung vorliegen, und das Gesicht muss eine bestimmte Grösse und Position innerhalb des Bildes einnehmen. Um dies zu gewährleisten, wird das zu analysierende Gesicht im Originalbild detektiert und in das sogenannte Eingabebild extrahiert. In vielen Fällen werden dazu auch «Landmarken» im Gesicht detektiert, also auffällige Gesichtspartien wie der Mund, die Nase und die Augen. Anhand dieser wird das Eingabebild normiert.

Sobald das Eingabebild im gewünschten Format vorliegt, werden im zweiten Schritt Merkmale aus dem Bild extrahiert, die die wesentlichen Eigenschaften des Gesichts beinhalten, die zur Identifikation benötigt werden. Dazu gehören etwa die Grösse, Form und relative Position von Augen, Mund und Nase. Bestenfalls werden andere Einflussgrössen wie die Beleuchtung, der Gesichtsausdruck oder die Blickrichtung ausgeklammert.

Drittens werden die extrahierten Merkmale aus zwei Bildern miteinander verglichen, indem ein Ähnlichkeitswert berechnet wird. Ist dieser Wert grösser als ein vorher festgelegter Schwellenwert, legt der Algorithmus nahe, dass die beiden Bilder die gleiche Person zeigen. Wie genau der Schwellenwert festgelegt wird, ist von den Anwendungsfällen abhängig: Zum Beispiel wird zur Entsperrung des Smartphones meist ein niedrigerer Schwellenwert eingestellt als an sicherheitsrelevanten Punkten wie dem E-Gate am Flughafen.

Laufende Forschungsarbeiten

Seit mehreren Jahren ist das National Institute for Standards and Technology (NIST) in den Vereinigten Staaten eine treibende Kraft in der Entwicklung und im Vergleich von Lösungen zur automatischen Gesichtserkennung. Regelmässig werden in Face Recognition Vendor Tests (FRVT) viele kommerzielle und akademische Algorithmen in verschiedenen Einsatzgebieten auf Herz und Nieren getestet. In der letzten Reihe der FRVT wurden fast 400 Algorithmen aus aller Welt untersucht, darunter auch Lösungen von vier Schweizer und sechs deutschen Firmen. Dabei ist die staatliche Intelligence Advanced Research Projects Activity (IARPA) eine grosse Geldgeberin. Sie finanziert viele Projekte, die die Gesichtserkennung immer weiter vorantreiben.

Die Forschung an der Gesichtserkennung ist weder neu noch ist sie abgeschlossen. Erste kommerzielle Produkte zur Gesichtserkennung gibt es ungefähr seit Mitte der 90er-Jahre, die ersten Versuche der automatischen Gesichtserkennung in der Wissenschaft gehen jedoch bis in die 1980er-Jahre zurück. Die Forschenden versuchten damals, die Abstände von unterschiedlichen…

«Das intelligenteste
Magazin der Schweiz.»
Rolf Dobelli, Bestseller-Autor und Unternehmer,
über den «Schweizer Monat»