Teknikutvecklingen accelererar och når nya nivåer som få kunnat drömma om för en generation sedan. Vad gäller röstigenkänning så har tekniken gått framåt i rekordfart och antalet enheter exploderat de senaste åtta åren. Idag kan maskiner känna igen din röst och förstå vad du säger på en mängd olika språk och även olika dialekter. Du kan styra saker med hjälp av rösten, ta reda på fakta och interagera med maskiner i din omgivning. Röstigenkänning byggs nu snabbt in i kylskåp, bilar, hörlurar, klockor, telefoner, datorer, surfplattor och annan utrustning. Detta för att t ex kunna slå på och av belysningen hemma, sköta larmet, dra ner ljudet på TV:n, få den senaste väderprognosen eller få hjälp att hitta sin favoritmusik.
Nu börjar även en del tillverkare kombinera röstigenkänning med bildigenkänning, för att göra ditt liv ännu mer bekvämt. Nya telefoner har idag ansiktsigenkänning så att du enkelt skall kunna identifiera dig för betalningar, bankärenden och andra ärenden då du behöver bevisa din identitet. Nya funktioner är på väg, t ex att du skall kunna få smakråd inför en fest med val av matchande kläder, inköp av nya saker så att de passar med de gamla eller att dina ansiktsuttryck läses av för att tolka vad du tycker.
Det du säger skickas som filer till centrala servrar för analys och åtgärd. Vissa aktörer sparar filerna för evigt, andra raderar dem efter ett tag. Alla analysföretagen använder en ny teknik sedan 2011, köpt av amerikanska försvaret, som gör att det går många gånger fortare idag att lära en dator att förstå naturligt språk. Den gamla tekniken innebar att en ljudfil synkades med en inskriven text, vilket var ett arbetskrävande arbete. Idag så spelas filerna in ”live” av användarna, och när inte datorn förstår vad du säger, så kan ljudfilen skickas till en människa som lyssnar och talar om för datorn vad som sades. Dessa människor sitter ofta i U-länder och lyssnar på 1000-tals ljudklipp varje dag, ett enahanda jobb, lågbetalt och ibland skrämmande. De får höra bitar av folks privatliv, delar av konversationer på kontor, sexuella akter eller att folk biktar sig och bekänner brott, allt intill sin smarta högtalare. Alla dessa ljudfiler sparas, ofta med vem som spelat in, var det hände och med en tidsangivelse. De som lyssnar får dock aldrig reda på vem och var, utan enbart själva ljudet. Även barn spelas in och bakgrundsljud kommer med.
Flera av de stora aktörerna, som t ex Facebook och Google, tjänar stora pengar på vad du skriver, gillar, söker och numera även talar in. Dessa kan nu med smart teknik t ex höra om det är barnskrik i bakgrunden och dra slutsatsen att du är en förälder. Man kan höra på din röst vilket kön du har, ungefärlig ålder och vad du är intresserad av.
Prognosen till 2023 gjord av Juniper Research Ltd säger att det kommer finnas 7,3 miljarder prylar i världen som styrs av röstigenkänning och att det kommer att omsättas över 100 miljarder kronor på dessa varje år. Det blir i snitt en pryl per invånare på jorden. Det är en gigantisk marknad.
Många frågor reses och behöver besvaras: Hur kan det komma sig att det går så fort? Vilka är de kommersiella drivkrafterna? Vad spelas in på dessa enheter? Vem lyssnar? Var hamnar inspelningarna? Blir vår integritet kränkt? Vem får lyssna på vad vi har sagt? Kan data hamna i orätta händer? Hur kan någon tjäna pengar på vad som spelas in? Kan främmande makts underrättelsetjänst komma åt data? Finns det någon lagstiftning som reglerar denna verksamhet?
De största tillverkarna idag av smarta högtalare och andra enheter som kan förstå vad du säger är ungefär i fallande ordning: Amazon (säljer flest, USA), Google (USA), Microsoft (USA), Xiaomi (Kina), Baidu (Kina), Apple (USA), Alibaba (Kina) och Facebook (USA). Flera av dessa licensierar ut sin teknik till andra tillverkare, till t ex HP, BMW och kylskåpstillverkare.
De enheter som spelar in din röst aktiveras på olika sätt, t ex kan du ställa in din smarta klocka så att den lyssnar om du snabbt vrider armen, vilket medför att om du viftar mycket på armen så kommer många ljudfiler att skickas upp i molnet för analys. Det är inte säkert att du har en aning om att dessa filer har skickats, och du vet inte vem som lyssnar på dessa eller vad de använder det till. Om du köper utrustning från icke-demokratiska länder, finns dessutom risken att filerna analyseras av deras underrättelsetjänst. Om det är kommersiella företag, så säljs informationen direkt eller vidare till andra aktörer, de är ju inte ideella.
Hur skall vi bete oss i denna nya omgivning med massor med smarta mikrofoner som lyssnar och spelar in dina ljud och tolkar vad du vill och vad du gör? Å ena sidan kan vi få hjälp: slippa släppa ratten med händerna när vi kör bil när vi vill ringa någon eller kanske någon att prata med när vi är ensamma, å andra sidan är det ett stort problem med integriteten. Du vet aldrig vem som får tag i dina data, och vem vet vad du sagt för 10 år sedan, det kan användas mot dig. Jag har läst att Facebooks grundare och VD, Mark Zuckerberg, har tejpat för linsen på sin laptop och tagit bort mikrofonen, företaget har ju som bekant släppt en produkt du skall ha hemma som analyserar dig genom en lins när du går omkring hemma, samtidigt som den har en smart mikrofon. Kanske skall vi göra som Mark? Sätt en svart tejp på linsen på din dator och döda alla mikrofoner! Han har gjort detta för att även om du tror att du stängt av mikrofonen, så lyssnar apparaterna. Ofta kan de ligga och lyssna när de är i viloläge.
Du som jobbar med militära eller kommersiella hemligheter eller är i en förtroendeposition, stäng av alla mikrofoner! För att vara riktigt säker, ha inte några sådana enheter i samma rum som där du pratar hemligheter. Det gäller telefoner, klockor, surfplattor, datorer, hörlurar etc. Låt dem vara i ett annat rum. Det är mitt allra viktigaste råd, så att du inte kommer i trångmål eller att hemligheter läcker ut.
Mycket lagstiftning behöver tas fram för att skydda oss och våra data, det känns ju inte kul att någon med en enorm dator sitter och lyssnar på oss och gör avancerade analyser, ofta med en helt annan värdegrund och syfte än den vi står för. Representanthuset i USA och även Kongressen, som förhört Mark, jobbar på att ta fram nya lagar. Man är speciellt bekymrad för lagring av data från barn. Även EU har nu satt igång ett jobb med en av sina kommissioner (Data Protection Commission) för att se till så att företagen inte kränker medborgarnas integritet. Kommissionen kräver nu att få besked om hur företagen byggt upp sina databaser med ljudfiler.
Jag avslutar med att svara på frågan i rubriken, ”Var kan du prata hemligheter och vara helt säker på att ingen lyssnar?”. Förutom de klassiska metoderna för att vara säker på att ingen lyssnar, måste vi idag även ta bort alla ”smarta enheter med AI” ur den lokal där vi skall prata. Det kan vara bra att hjälpas åt att ta av oss smarta klockor, små hörlurar, telefoner etc innan man går in i rummet. Kolla även de fasta installationerna i rummet, t ex TV:n, Sonys nyaste TV har röstigenkänning. Säkrast är att gå en promenad i skogen utan några enheter med mikrofon och där det saknas mobil täckning och långt från hus med aktiva mikrofoner. Lycka till med din integritet och med dina hemliga samtal!