Allt om ansiktsigenkänning för företag

Spread the love

Ansiktsigenkänning är inte begränsad till datavetenskapens sfärer. Den har solida affärsapplikationer.

Ett av de hetaste modeorden under det här decenniet är ansiktsigenkänning.

Det är den del av tillämpad maskininlärning som kan upptäcka och identifiera mänskliga ansikten, ett problem som har varit notoriskt svårt för datorer hittills. Och detta har öppnat upp en helt ny värld av spännande möjligheter och utmaningar för både företag, myndigheter och privatpersoner.

Om du är en företagsledare och har undrat vad tjafset handlar om och om det finns någon nytta i den här nya utvecklingen, så har vi dig täckt. I den här artikeln kommer vi att titta på historien om ansiktsigenkänning, dess utveckling, nuvarande användningsområden, kontroverser, distribution och många fler aspekter.

I slutet av det har du ett gediget grepp om vad ansiktsigenkänningsteknik handlar om och vad dess implikationer är för företag.

Låt oss börja!

Utveckling av ansiktsigenkänning

Tekniken har funnits ett tag för all hype och mediabevakning kring ansiktsigenkänning. Det första seriösa algoritmiska arbetet med att upptäcka ansikten var Viola-Jones Object Detection Framework publicerades 2001. Även om det var ett allmänt ramverk för att identifiera objekt i bilder, användes det snabbt för ansiktsdetektering med mycket god framgång. Den främsta anledningen till denna algoritms popularitet var dess hastighet; Även om träningsprocessen var oerhört långsam, var upptäcktsprocessen extremt snabb.

Redan 2001/2004 kunde den genomsnittliga stationära datorn som körde denna algoritm bearbeta en 300px X 300px ram på 0,07 sekunder (mer här). De noggrannhetsgraderäven om det inte är jämförbart med vad människor kan uppnå, var imponerande på 90%.

Men verkliga framsteg gjordes inte förrän årtiondet 2010-2020, då Konvolutionella neurala nätverk framstod som den bästa metoden för att utföra ansiktsdetektion. Anledningen var tillgången på rå processorkraft och gigantiska systemminnen som gjordes tillgängliga genom molnberäkning av IaaS-leverantörer (Infrastructure-as-a-Service). För första gången i historien slog datorer konsekvent människor när de kände igen ansikten, särskilt när ett stort antal slumpmässiga ansikten var inblandade.

Källa: medium.com

Hur fungerar ansiktsigenkänning?

Ansiktsigenkänning är en process i flera steg med flera specialiserade delsystem involverade.

Så här betyder de olika stegen:

Detektering/spårning: Denna del av förbehandlingssteget är ansvarig för att identifiera och spåra ansikten i den givna bilden eller videofilen. När den här processen är klar vet vi med säkerhet att det finns ett ansikte i den givna inmatningen, och den kan bearbetas vidare. Spårningsfasen är också ansvarig för att spåra vissa delar, särskilda egenskaper eller uttryck i ett ansikte, om det skulle behövas.

Justering: Problemet med ansiktsigenkänning förvärras eftersom ansikten i en given bild eller video inte följer några riktlinjer. Personen kan zoomas in eller ut, kikar bakom ett träd eller finns i en sidoprofil, vilket gör problemet med ansiktsdetektering ännu svårare. Det är här ansiktsjustering kommer in: den talar om för oss var i den givna bilden/videon ansiktslinjerna är och vad är konturerna för ansiktsdrag.

Källa: csc.kth.se

Funktionsextraktion: Som namnet antyder, under denna fas av processen (vi är nu i igenkänningsstadiet), extraheras de individuella egenskaperna i ansiktet, såsom ögon, näsa, haka, läppar, etc. i formen som algoritmer kan använda i nästa steg. I det här skedet har datorn samlat in tillräckligt med komplex data för att skilja ett ansikte unikt.

Funktionsmatchning/klassificering: I detta skede matchas indata som tas emot från funktionsextraktion mot den givna databasen för att härleda personens identitet. Denna fas är också känd som en klassificering eftersom algoritmen kan behövas för att kategorisera ansikten istället för att identifiera dem individuellt.

När den här processen är över vet vi med säkerhet om det givna ansiktet är en del av databasen vi jämförde mot eller inte. Slutresultatet kan också innehålla taggning, som vi är vana vid att se på Facebook.

Källa: towardsdatascience.com

Distributionsöverväganden: Serversidan kontra klientsidan

Ansiktsigenkänning kan fungera både på servern och enheten som användaren interagerar med. När du till exempel laddar upp ett foto till Facebook körs algoritmerna på serversidan; å andra sidan måste ett ID-system som använder ditt ansikte för att låsa upp enheten köras på klientsidan. Så vilken är bättre?

Ärligt talat, det handlar inte om vilken som är bäst. Både serversidan och klientsidan har sina styrkor; i praktiken använder företagen ett hybridsystem. Rekommenderad praxis är att träna dina modeller på serversidan, där träningsdata och bearbetningsresurser är obegränsade. När modellerna har tränats kan dessa paketeras och distribueras på klientsidan, vilket förbättrar systemets hastighet samt upprätthåller användarens integritet.

  Så här aktiverar du livetextning på din Chromebook

Att skicka allt till servern introducerar en fördröjning, vilket kan vara dåligt eller oacceptabelt i vissa fall. Att hålla allt på klientsidan kommer samtidigt att resultera i svagare modeller.

Hur exakt är ansiktsigenkänning?

Noggrannhet är inte en särskilt väldefinierad term inom ansiktsigenkänning. Den främsta anledningen är att det är ett flummigt problem med alla möjliga trassliga ingångar (lågt ljus, ansikte delvis täckt av hår, kamerakvalitet, etc.) och till och med vilseledande ingångar (mer om detta senare!). Som ett resultat måste de neurala nätverk som är involverade i ansiktsigenkänning justeras för det aktuella problemet, vilket begränsar deras omfattning. Så även om ett industriellt ansiktsigenkänningssystem kan skryta med 100 % noggrannhet (vilket ofta är fallet), kanske samma system inte ens är 20 % korrekt när det ombeds att identifiera ansikten i ett fullsatt foto.

I ett forskning, kunde en viss typ av ansiktsigenkänningsalgoritm uppnå 98,52 % noggrannhet, högre än den mänskliga noggrannheten på 97,53 % som uppnåddes i samma test. I en annan studie som utfördes inom kriminalteknik, gav kombinationen av mänskligt omdöme och algoritmer de bästa resultaten i vissa fall.

Sammanfattningsvis — för fokuserade, väldefinierade applikationer är ansiktsigenkänning det bästa verktyget vi har.

Var används ansiktsigenkänning?

Även under den korta period som livskraftiga algoritmer har utvecklats har Ansiktsigenkänning hittat otroligt användbara och spännande applikationer. Vissa av dessa är iögonfallande, men vissa är så subtilt och fundamentalt invävda i vardagen att vi knappt stannar upp för att tänka på vad som finns under.

Facebook är kanske det vanligaste exemplet på moderna ansiktsigenkänningssystem på jobbet. Så snart du laddar upp ett foto kan det sociala nätverket upptäcka ansikten. Medan du för en tid sedan blev ombedd att tagga vänner, kan Facebook nu göra det på egen hand.

Källa: labnol.org

En cool ny applikation från Facebook är funktionen hos informera användare när bilder som innehåller deras ansikten laddas upp av någon, även om de inte har taggats i dessa foton.

Snapchat använder sig hårt av ansiktsdetektering och igenkänning för många av dess funktioner, framför allt de roliga filtren som är så rasande.

Källa: gistreel.com

För att dessa filter ska fungera måste konturerna och egenskaperna i motivets ansikte detekteras perfekt, annars kommer överläggen inte att se realistiska ut. Detsamma gäller Face Swap, en annan populär funktion på Snapchat. Om du är intresserad av att dyka djupare in i Snapchats möjligheter inom ansiktsigenkänning, se här.

Uber har kämpat mot integritets- och säkerhetsproblem ett tag nu, och det nyaste vapnet i företagets arsenal är ansiktsigenkänning. Företaget har lanserat en ny funktion där dess förarpartners identitet verifieras av använder sina ansikten. Företaget säger på sin blogg att efter att ha testat flera teknikleverantörer för ansiktsigenkänning, bestämde de sig för Microsoft Face API för dess höga kvalitet. Intressant nog fungerar denna ID-kontroll i realtid bra i svagt ljus och kan upptäcka glasögon.

Eftersom ansiktsigenkänning visar sig vara framgångsrik i naturen är det lätt att förutsäga att det snart kan ersätta andra identifieringsmetoder på utbildningsinstitutioner, sjukhus, bibliotek, etc.

Förebyggande av brott mot detaljhandeln är en naturlig förlängning av tillämpningen av ansiktsigenkänning. Detaljhandeln tappar en uppskattning 45 miljarder dollar varje år till snattare och andra detaljhandelsbrott, med väldigt lite att bekämpa det med. Nu gillar företag FaceFirst hjälper återförsäljare att använda ansiktsigenkänning för att upptäcka tidigare lagöverträdare och varna säkerhetstjänstemän.

Polisövervakning börjar dra nytta av ansiktsigenkänning som alla andra institutioner där ute. Till exempel i Storbritannien använder polisen i södra Wales kameror monterade på skåpbilar för att tillverka övervakning av folkmassor lättare.

Källa: theconversation.com

Medan denna nyfunna supermakt i polisens händer har väckt heta offentliga debatter om individuell integritet, tror polisen att det kommer att hjälpa dem att begränsa brottslingar bättre. Som Richard Lewis, biträdande chefskonstapel vid polisen i South Wales, berättade Ekonomiska tider:

Om du identifierar någon som har begått ett brott [previously]du säger i princip: vi vet att du är här, snälla uppför dig.

Sjukvården hade nyligen en oväntad applikation, där ansiktsigenkänning hjälpte till att upptäcka en sällsynt genetisk sjukdom som heter DiGeorge Syndrome.

DiGeorges syndrom uppträder hos cirka 1 av 6 000 barn och resulterar i missbildningar i flera kroppsdelar. Sjukvårdsproblemet, i det här fallet, är allvarligare för fattigare länder, som inte har resurser att gå till dyra diagnosmetoder. Som sådan, ansiktsigenkänning, med en häpnadsväckande noggrannhet av 96,6 %, erbjuder nytt hopp för offer för DiGeorges syndrom.

Inom flygbolagsbranschen ökar användningen av ansiktsigenkänning, och det kommer snart att ersätta de konventionella boardingkorten. För närvarande finns det begränsade men lovande resultat när det gäller att hjälpa identifiera passagerare när de lämnar landet. Faktum är att USA:s transportsäkerhetsadministration (TSA) har lagt ut ett planen för den utbredda användningen av ansiktsigenkänningsbaserad biometri.

  Så här styr du hela ditt smarta hem genom en app

Kontroversiell användning av ansiktsigenkänning

Tekniken ger oss kraft, även om dess goda eller dåliga användning är upp till oss. Ingen tvekan om att något så kraftfullt och radikalt som ansiktsigenkänning används på ett sätt som väcker oro för grundläggande mänskliga rättigheter och etik.

Det mest framträdande exemplet på kontroversiell användning av ansiktsigenkänning är Kinas enorma övervakningssystem som använder uppskattningsvis 200 miljoner kameror för att hålla ett öga på sina 1,4 miljarder medborgare.

Källa: sbs.com

Systemet spårar människor och utvärderar deras handlingar och uppdaterar ständigt ett mått som kallas medborgarpoäng. Även om det finns ett visst värde i att ha ett kraftfullt statligt kontrollerat övervakningssystem (t.ex. spåra skulder som förfaller), ser de flesta det som ankomsten av den dystopiska framtiden George Orwell föreställde sig. Det är en framtid där regeringar har obegränsad makt över individen och integritet är obefintlig.

Det andra exemplet på diskutabel användning av ansiktsigenkänning kommer också (föga förvånande?) från Kina. Den här gången använder skolsystemet ansiktsigenkänning för att säkerställa att eleverna är ”uppmärksamma” under lektionerna. Det nya ansiktsigenkänningssystemet, även om det inte är utbrett ännu, ersätter ID-kort, bibliotekskort, närvarosystem etc., med hjälp av studentens ansikte för identifiering.

Källa: businessinsider.com

Men det läskiga är att det här systemet övervakar elevernas uppmärksamhetsnivåer, användning av mobiltelefoner etc. och larmar läraren när en viss tröskel passeras.

Även om videoövervakning som drivs av ansiktsigenkänning inte är exklusiv för Kina, har USA varit det göra ansträngningar att använda den för att stävja vapenvåld i skolor – det är Kina som verkar ta detta längre än något annat land.

Vilka alternativ har du när det gäller att använda ansiktsigenkänning? I det här avsnittet kommer vi att titta på vad som är vanligt förekommande och hur de olika lösningarna står sig mot varandra.

Innan vi börjar, dock: en påminnelse om att dessa API:er utvecklas snabbt, och du kommer sannolikt att stöta på blogginlägg som säger att detta API saknar den här funktionen eller den funktionen. Ta inte dina beslut utifrån det. Analysera dina affärsbehov först, kontrollera noggrant de funktioner som erbjuds, gå ut på ett spår och bestäm dig först sedan.

OpenCV

AI-forskning är ett slukhål utan botten. Att träna och fullända ett ansiktsigenkänningssystem är svårt och det är bäst att lämna till konglomerat med djupa fickor och en armé av forskare. Men om dina behov är enkla och du gillar att ha full kontroll – och naturligtvis är redo för underhållet av ett litet/litet ingenjörsteam –OpenCV kanske bara fungerar för dig.

Det är ett Open source Computer Vision-bibliotek som är anmärkningsvärt exakt och tillgängligt för alla programmeringsplattformar. Här är en hårresande exempel om hur du kan spinna upp ett ansiktsdetektionssystem med Python och OpenCV i 25 rader kod!

Nu kanske du stöter på några bloggar som säger att OpenCV inte har ansiktsigenkänning. Tja, det är en fullständig lögn, och här är det bevis. Sammantaget kan OpenCV vara ett utmärkt val för ditt företag om behoven är enkla och specifika.

Amazon erkännande

Erkännande är ett tungt erbjudande från en av de största molnleverantörerna där ute – AWS. Det är en fullt hanterad, kraftfull tjänst för AWS-plattformen, och om du redan använder AWS för distribution är Rekognition förmodligen det bästa valet.

Några av de häpnadsväckande funktionerna som erbjuds av Rekognition är:

  • Realtidsanalys (när du laddar upp en bild eller video till S3)
  • Omfattande ansiktsanalys (kön, hårfärg, ansiktsuttryck, öppna ögon eller inte, etc.)
  • Sökväg (fånga sökvägar för identifierade objekt i videor)
  • Scen- och aktivitetsdetektering (inomhus/utomhus, ”spela fotboll” etc.)
  • Moderera osäkert innehåll (till exempel nakenhet)

Det största pluset med Rekognition är också det största minuset – du kommer verkligen att kämpa för att använda det med icke-AWS-tjänster till den grad att du bara måste ge upp.

Kairos

I skarp kontrast till Erkännande, Kairos ger dig AI över ett API (rimningen är oavsiktlig, vi svär!), så att du kan ta fullständig kontroll över dina data och servrar. Kairos presenterar sig själv som en integritet-först tjänst, och är ytterst kritisk av Amazon och andra företag som samarbetar med regeringen (så är ACLUförresten).

Kairos fungerar både på bilder och videor och har alla fina funktioner du kan förvänta dig av ett modernt API för ansiktsigenkänning. Det gör några av de häpnadsväckande funktionerna som finns i Rekognition, men om du inte behöver dem och redan hanterar din data, varför bry dig?!

Kairos har en lokal distribution för de som är paranoida om integritet och inte ens vill skicka data över tråden för bearbetning, Kairos har en lokal distribution, priset beror på ditt användningsfall och kan vara ganska brant.

  Hur man delar och hanterar Microsoft Teams-filer i en kanal

Google Cloud Vision

Google har valt att skilja på sina ansiktsigenkänningstjänster för bilder och videor. Bild-API är känt som Cloud Visionmedan den videofokuserade tjänsten kallas Videointelligens.

Medan den bildfokuserade tjänsten är ganska lik vad AWS har att erbjuda, har videotjänsten en trevlig funktion för katalogisering och sökning. Detta kommer att vara användbart för företag som har stora videoarkiv som de kanske vill analysera eller söka igenom.

Som sagt, Video Intelligence saknar ansiktsigenkänningsfunktioner när de skrivs, och dessa verkar endast erbjudas i Cloud Vision. Objektspårning och textdetektering är också i beta, vilket lägger det mycket bakom Amazons erbjudanden.

Azure Face API

Med Microsoft tar sina molnerbjudanden mer seriöst än de stationära (äntligen), de Azure Face API är ett härligt erbjudande. Den har alla intressanta funktioner du kan förvänta dig (identifiering, identifiering, ansiktsgruppering, liknande ansiktssökning, känslor, etc.), och fungerar lika bra med videor.

Nu är detta inte strikt relaterat till ansiktsigenkänning, men det är värt att nämna att Azure också erbjuder en kunddatorvision servicevilket gör att du kan använda dina ingångar och träna modeller enligt dina behov.

Precis som Googles tjänst finns det en lekplats direkt på startsidan, vilket gör det mycket roligt att testa API!

Finns det betydande skillnader mellan de topphanterade ansiktsigenkänningstjänsterna? Inte riktigt. Det råder hård konkurrens på området just nu och nya funktioner rullas ut snabbare än pizzor. Om du redan är bunden till ett visst ekosystem är det vettigt att använda deras egen ansiktsigenkänningstjänst. Annars kanske du vill välja en annan leverantör om dina behov är specifika (kontrollera dina egna data, behöver endast vanlig upptäckt, etc.).

Anti-ansiktsigenkänningssystem

Precis som vissa forskare har ägnat sina liv åt att fullända teknik för ansiktsigenkänning, är andra upptagna med att utveckla tekniker för att lura dem. En sådan intressant utveckling är Motstridiga glasögonsom annars ser normala ut för människor men som har lurat expertsystem för ansiktsigenkänning.

Källa: digitaltrends.com

Som sagt, dessa glasögon är inte tillgängliga på marknaden ännu, även om forskarna säger att dessa lätt kan 3D-printas.

En annan intressant utveckling var lanseringen av ekō glasögon på Kickstarter. Även om produkten nu är inställd, fungerade den på en anmärkningsvärt enkel idé: vanliga, vardagliga solglasögon för $45 som helt enkelt reflekterade ljuset, vilket fick kameror och videoövervakningsenheter att bli galna.

Precis som cybersäkerhetsdomänen låser ”hackers” och forskare horn i ansiktsigenkänning för kapplöpningen mot perfektion. Runt 2014 såg vi populariteten av kamouflagesmink som skänkte osynlighet mot ansiktsigenkänning, men som inte är livskraftiga längre. Kommer det att finnas en AES-kryptering av ansiktsigenkänning? Svaret kommer med tiden!

Är ansiktsigenkänning något för dig?

Den typ av verksamhet som kan dra nytta av ansiktsigenkänning är den som involverar människor – ja, vilket betyder alla företag där ute! Medan den nuvarande användningen av ansiktsigenkänning verkar förespråkas av regeringar, stora företag eller tekniska startups, finns det ingen anledning till varför ditt företag inte kan dra nytta av det.

Möjligheterna är verkligen oändliga när vi kombinerar lite kreativt tänkande – hälsa och identifiera kunder på ett hotell, hitta din vän i ett hav av människor, hitta personer med liknande ansikten (kanske för att användas som skådespelare), upptäcka personligheter för jobbet intervjuer (återigen, vi låter bara fantasin flöda här; det kanske inte finns något väsentligt i en sådan studie), anpassar bankupplevelsen när en kund med högt värde kommer in. . . Det finns oändliga sätt att använda ansiktsigenkänning på små och stora nivåer för att få ditt företag att prestera bättre.

Slutsats

Ganska snart kommer ansiktsigenkänning att bli så utbrett och så vanligt att vi inte ens kommer att märka det (som mobiltelefoner?). Den underliggande tekniken har nästan fulländats, men i den verkliga världen handlar det inte bara om att upptäcka ansikten – det handlar om vad vi kan göra med den förmågan.

Låter det fascinerande och intresserad av att lära dig mer? Kolla in det här lysande kurs om datorseende.