Hur fungerar ansiktsigenkänning?

By rik

De flesta känner sig bekväma med ansiktsigenkänning tack vare dess närvaro i Instagramfilter och Face ID. Trots detta kan denna relativt nya teknik väcka en viss oro. Ditt ansikte är unikt, likt ett fingeravtryck, och tekniken bakom ansiktsigenkänning är komplex.

Som med all ny teknik finns det utmaningar med ansiktsigenkänning. Dessa blir tydligare när militären, polisen, reklamföretag och skapare av deepfakes hittar nya sätt att utnyttja ansiktsigenkänningsprogram.

Idag är det viktigare än någonsin att förstå hur ansiktsigenkänning fungerar. Det är också viktigt att känna till begränsningarna och hur tekniken kan utvecklas i framtiden.

Hur ansiktsigenkänning fungerar: en översikt

Innan vi går in på de många tillämpningarna av ansiktsigenkänning är det bra att förstå hur processen fungerar. Här är tre exempel på användning av ansiktsigenkänningsprogram och en förenklad förklaring av hur de känner igen eller identifierar ansikten:

Grundläggande ansiktsigenkänning: För animojis och Instagramfilter ”letar” din telefonkamera efter de typiska egenskaperna i ett ansikte, särskilt ett par ögon, en näsa och en mun. Därefter används algoritmer för att fixera ansiktet och bestämma åt vilket håll det tittar och om munnen är öppen etc. Det är viktigt att poängtera att detta inte är ansiktsidentifiering, utan bara programvara som letar efter ansikten.
Face ID och liknande: När du ställer in Face ID (eller liknande) på din telefon, tas ett foto av ditt ansikte och avståndet mellan dina ansiktsdrag mäts. Varje gång du sedan låser upp telefonen, ”tittar” kameran för att mäta och bekräfta din identitet.
Identifiering av en okänd person: När en organisation vill identifiera ett ansikte för säkerhet, reklam eller polisarbete används algoritmer för att jämföra ansiktet med en stor databas av ansikten. Denna process liknar Apples Face ID fast i större skala. I teorin kan vilken databas som helst användas (ID-kort, Facebook-profiler), men en databas med tydliga, föridentifierade bilder är idealisk.

Låt oss nu gå in på detaljerna. Eftersom den ”grundläggande ansiktsigenkänningen” som används i Instagramfilter är en enkel process fokuserar vi på ansiktsidentifiering och de olika teknikerna som används för att identifiera ett ansikte.

2D-bilder är grunden för mycket ansiktsigenkänning

De flesta programvaror för ansiktsigenkänning använder sig främst av 2D-bilder. Det är inte för att 2D-ansiktsavbildning är superexakt, utan för att det är praktiskt. Majoriteten av kamerorna tar foton utan djup, och offentliga foton som kan användas i ansiktsigenkänningsdatabaser (till exempel Facebook-profilbilder) är alla i 2D.

Varför är 2D-ansiktsbilder inte särskilt exakta? Jo, en platt bild av ansiktet saknar identifierande egenskaper som djup. En dator kan mäta pupillavståndet och munnens bredd på en platt bild, men kan inte se näsans längd eller hur framträdande pannan är.

Dessutom är 2D-ansiktsavbildning beroende av det synliga ljusspektrumet. Det betyder att 2D-ansiktsavbildning inte fungerar i mörker, och kan vara opålitlig i skuggiga eller svaga ljusförhållanden.

Ett sätt att hantera dessa begränsningar är att använda 3D-ansiktsbilder. Men hur går det till? Behöver man specialutrustning för att se ett ansikte i 3D?

IR-kameror ger djup i identifieringen

Även om vissa ansiktsigenkänningsprogram bara använder 2D-bilder är det vanligt att 3D-bilder också används. Faktum är att din upplevelse av ansiktsigenkänning förmodligen innehåller inslag av 3D.

Detta åstadkoms genom en teknik som kallas lidar, som liknar ekolod. Ansiktsskanningsenheter, som din iPhone, skickar ut en ofarlig IR-matris mot ditt ansikte. Denna matris (en vägg av lasrar) reflekteras sedan och registreras av en IR-kamera (eller ToF-kamera) på din telefon.

Hur fungerar 3D-magin? Din telefons IR-kamera mäter tiden det tar för varje bit IR-ljus att studsa från ansiktet och återvända till telefonen. Ljuset som reflekteras från näsan har en kortare sträcka än ljuset som reflekteras från öronen. IR-kameran använder denna information för att skapa en unik djupkarta över ditt ansikte. Tillsammans med 2D-bilder ökar 3D-avbildningen noggrannheten hos ansiktsigenkänningsprogram avsevärt.

Lidar-avbildning kan vara ett abstrakt koncept. Om det hjälper kan du föreställa dig att IR-nätet från din telefon (eller annan ansiktsigenkänningsenhet) är som en anslagstavla med spikar. Liksom på en sådan leksak lämnar ditt ansikte en fördjupning i IR-nätet där näsan är djupare än, till exempel, ögonen.

Värmebilder gör ansiktsigenkänning möjlig i mörker

En av nackdelarna med 2D-ansiktsigenkänning är att den är beroende av det synliga ljusspektrumet. Enkelt uttryckt fungerar inte grundläggande ansiktsigenkänning i mörker. Detta kan lösas genom att använda en värmekamera.

Du kanske undrar om inte värmebilder också använder IR-ljus? Jo, det gör de. Men värmekameror skickar inte ut IR-ljus, de upptäcker det IR-ljus som föremål avger. Varma objekt avger mycket IR-ljus medan kalla objekt avger väldigt lite. Avancerade värmekameror kan till och med upptäcka små temperaturskillnader på en yta, vilket gör tekniken idealisk för ansiktsigenkänning.

En bild i synligt ljus, en värmebild och en sammansatt värmebild.

Det finns flera metoder för att identifiera ett ansikte med värmebilder. Dessa tekniker är komplexa, men har vissa likheter, så vi ska förenkla det med en lista:

Flera bilder behövs: En värmekamera tar flera bilder av ansiktet. Varje bild fokuserar på ett annat spektrum av IR-ljus (långa, korta och medellånga vågor). Vanligtvis ger det långa vågspektrumet mest information om ansiktet.
Blodkärlskartor är användbara: Dessa IR-bilder kan användas för att kartlägga blodkärlen i ansiktet. Det kan verka skrämmande, men blodkärlskartor kan fungera som unika fingeravtryck för ansikten. De kan också användas för att bestämma avstånden mellan ansiktsdragen (om vanlig värmebildning ger dåliga bilder) eller för att identifiera blåmärken och ärr.
Personen kan identifieras: En sammansatt bild (eller datauppsättning) skapas med flera IR-bilder. Denna bild kan sedan jämföras med en ansiktsdatabas för att identifiera personen.

Värmebaserad ansiktsigenkänning används mest av militären och är inte vanligt i kommersiella sammanhang, till exempel i vanliga butiker eller i din mobiltelefon. Dessutom fungerar värmebilder dåligt i dagsljus, vilket begränsar användningen till militära applikationer.

Begränsningar för ansiktsigenkänning

Vi har diskuterat begränsningar med ansiktsigenkänning. Med IR- och värmebilder kan vissa begränsningar övervinnas, men det finns fortfarande problem som inte är lösta:

Hinder: Som väntat kan solglasögon och andra tillbehör försvåra ansiktsigenkänning.
Poser: Ansiktsigenkänning fungerar bäst med neutrala, raka bilder. Att luta eller vrida huvudet kan försvåra identifiering, även med IR-baserad programvara. Ett leende eller andra ansiktsuttryck kan också förändra hur datorn mäter ansiktet.
Ljus: Alla former av ansiktsigenkänning är beroende av ljus, vare sig det är synligt eller IR-ljus. Konstiga ljusförhållanden kan minska precisionen i ansiktsidentifieringen. Detta kan ändras, då forskare utvecklar ekolodsbaserad ansiktsigenkänningsteknik.
Databasen: Utan en bra databas fungerar inte ansiktsigenkänning. Det är omöjligt att identifiera ett ansikte som inte tidigare har registrerats.
Databehandling: Beroende på storleken på databasen kan det ta tid för datorer att identifiera ansikten korrekt. I vissa fall, till exempel polisarbete, begränsar databehandlingskapaciteten användningen av ansiktsigenkänning för vanliga tillämpningar, vilket förmodligen är bra.

För närvarande är det bästa sättet att hantera begränsningarna att använda andra identifieringsmetoder tillsammans med ansiktsigenkänning. Din telefon kan be om ett lösenord eller fingeravtryck om den inte kan känna igen ditt ansikte, och den kinesiska regeringen använder ID-kort och spårningsteknik för att minimera felmarginalen i sina ansiktsigenkänningssystem.

I framtiden kommer forskare säkert att hitta lösningar på dessa problem. De kan använda ekolodsteknik tillsammans med lidar för att skapa 3D-ansiktskartor i alla miljöer, och utveckla snabbare metoder för att bearbeta data och identifiera okända personer. Hur som helst är tekniken kraftfull och kan missbrukas, så det är viktigt att följa utvecklingen.

Källor: Universitetet i Rijeka, Electronic Frontier Foundation