Big Data og Internettet

tilbage

Der har udviklet sig et begreb i informationshåndteringen som eksperterne kalder ’Big Data’. Det er blevet et mere påtrængende fænomen efterhånden som oplysninger af enhver art er blevet lagt ud på nettet og i så stort omfang at ingen kan overskue hvor meget der er, og hvad det kan bruges til.
I virkeligheden skulle disse oplysninger ikke anvendes til andet formål end det de er beregnet til. Det vil sige undersøgelser, kontrol eller opdatering på de områder og af de kilder som det fra begyndelsen har været meningen med digitaliseringen. Adgangen til benyttelsen skulle også være indskrænket til de folk, som var grunden til at tingene blev lagt ud i første omgang.
Men sådan spiller klaveret ikke længere. Det digitale rum opfører sig som det får lov til, og ingen får anbragt de adgangsbetingelser, der burde begrænse tilgængeligheden, ja, selv om man prøver på det, er der altid noget man ikke får med. Vi er simpelthen ikke blevet opmærksomme på de konsekvenser det har med samkøring af dataoplysninger. Der er for ringe gennemsigtighed, hvad angår alle de data, vi lader flyde rundt i cyberspace, frivilligt eller fordi vi bliver tvunget til det.

Det seneste eksempel til at minde os om denne nye form for risiko er misbruget af viden om vores kreditkortoplysninger. Tanken om at den store grådige amerikansk investeringsbank Goldman Sachs har gnavet sig ind i PBS eller NETS gør ikke bekymringen mindre. Det mest pinlige er næsten, at NETS var klar over risikoen for lækage omkring kreditkort men bare ikke gjorde noget ved det i tide. Vi må da håbe de ikke behandler NemID oplysningerne med samme skødesløshed. Staten overvejer allerede nu at fratage NETS koncessionen på datahåndtering.
Misbrug vil finde sted, så meget er også sikkert. ’Se og Hør’s uetiske adfærd hører desværre nok på længere sigt henne i den mere kuriøse ende af spektret.

Mens man ivrigt diskuterer den danske skandale på mediefronten lader det til, at den internationale sag om dataovervågning er lagt død. Den amerikanske efterretningstjeneste NSA tapper informationer overalt hvor de kan, men den slags er sværere at håndtere i en debat, for efterretningstjenester er hemmelige, og så er det umuligt eller utilbørligt at få noget konkret at vide.
Vi kan åbenbart ikke kræve noget her, fordi en række små nationers sikkerhed er bundet op på det mere gennemgribende og dyre efterretningsarbejde USA foretager sig. Hvem ved, måske får vi brug for amerikanernes hjælp senere, hvis det gælder vores egen nationale sikkerhed? Ingen ønsker rigtig at lægge sig ud med Big Brother.
Jeg husker den sørgmuntre vits med et billede af en dreng, der snakker med præsident Obama. Man har sat tekstbobler ind, hvor drengen spørger ’Min far siger du udspionerer os på nettet’ og Obama svarer ’Han er ikke din far’.
Edward Snowden fik ørerne i maskinen som whistleblower og må nu opholde sig i Rusland. Jeg hører til dem, der synes Snowden gjorde det eneste rigtige, selv om han må betale prisen. Det ligger i kortene. Ansatte i Guantanamo-lejren som også fik samvittighedsnag og lækkede oplysninger fører nu et liv som de facto udstødte af det amerikanske arbejdsmarked på grund af deres åbenmundethed. Samvittighed skal man holde for sig selv, specielt i magtfulde nationer.

Konventionelle nationale krige føles mere og mere fjerne i vores del af verden, alle synes at være enige om det, uanset raslen med sablerne i Ukraine. Hvad vi derimod kan risikere er angreb på vores datakommunikationssystemer. Hvis hackere får held til at sabotere datakommunikationen er alle pludselig ilde stedt, og der foregår løbende forskning i, hvordan man kan imødegå dette samtidig med at man må formode, at der foregår en lige så intens forskning i, hvordan man selv kan benytte lammelse af andres datakommunikation offensivt.
Twitter og Facebook, Instagram og LinkedIn er glimrende til at sprede et budskab og kan også bruges effektivt til at samle en masse mennesker til en spot aktion eller demonstration. Men virkningen er kortvarig. Disse manifestationer fra græsrødderne mangler den koordinerede handling, der bør følge efter, fordi de netop ikke har nogen ledelsesstruktur, der kan sørge for at organisere det efterfølgende påkrævede hårde benarbejde.
Men nettet kan bruges som samlingspunkt for minoriteters eller enkeltpersoners kamp for anerkendelse. I Cambodia bruger menneskerettighedsforkæmpere nettet til at holde kontakten, og da de i forvejen er organiserede har de digitale platforme en gavnlig funktion til at samle og fastholde engagementet.

I Kina er der enkelte systemkritikere, der er fængslet for deres kritiske udtryk eller udtalelser. Selv om man må skifte servere, er opmærksomheden på nettet med til at fastholde folks interesse og gøre det sværere for myndighederne at fortsætte en indespærring, fordi den dårlige omtale i sig selv bliver en belastning for systemet.
Jeg så en udsendelse om den kinesiske kunstner Wei Wei der længe har været holdt i husarrest. Hans installationskunst er dybt respekteret i kunstkredse i Vesten og man bliver mindet om, at i de rette hænder og med det rette formål kan kunst stadig have en vigtig funktion i samfundet. Det bliver man ofte i tvivl om når det gælder vestlig kunst, som boltrer sig i formeksperimenter men helt uden indhold eller engagement.

Jeg kommer til at tænke på min deltagelse i det seneste møde hos rettighedsforvaltningsselskabet Copydan, hvor der også var et par foredrag på programmet. I et af dem præsenteredes urovækkende perspektiver omkring sammenkørsel af datainformationer, der både kan misbruges og anvendes til fordel for mennesker, for eksempel i sygdomsbehandlingen. Big Data kaldes det. Ingen ved endnu, hvordan det vil påvirke den enkelte eller større grupper vi er en del af, men ændringer vil indtræffe.                  

Et brugt eksempel i demonstrationen af Big Data i forbindelse med sygdom har man i Googles varsling af influenzaepidemier. Google lagrer folks søgninger på internettet og ved at gå tilbage og undersøge forekomsten af søgeord eller kombinationer af disse kan man se, hvordan de følger udbredelsen af influenza fordelt på tid og geografiske lokaliteter. Der kan tilmed blive tale om en slags varslingstjeneste, idet de mere konventionelle statistikregistreringer ligger senere i tid, og netop når det gælder epidemier er tid en vigtig parameter, når det gælder om at tilrettelægge indsatsen.
Et vigtigt emne inden for sygdomsbehandling er dosering af medicin. Med større datamængder kan man lettere komme frem til den optimale dosis i forhold til den enkelte patient, bygget på diagnose og behandlingsresultat ud fra en stor mængde fortilfælde. Et eksempel her er den optimale behandling af for tidligt fødte børn.
Da Steve Jobs fik kræft, kunne han trække på et hav af statistiske oplysninger til at finpudse sit behandlingsforløb, og nogle vil mene at det var med til at forlænge hans liv med flere år.
En anden vigtig konsekvens af at behandle kolossale mængder af oplysninger er, at man kan finde sammenhænge mellem hændelser, forløb eller fagområder, som man ikke ville have fået mistanke om eksisterede ved at følge de gammeldags veje omkring årsag og virkning. Her kommer statistikken ind som en hjælp til at foretage yderligere undersøgelser.
Samtidig ændres magtfordelingen omkring brug af oplysninger. Hvor den slags tidligere mest lå i institutioners regi, så er brugen af disse nye digitale statistikplatforme kommet ind som et væsentligt supplement, og de ligger i hænderne på helt andre aktører end dem som tidligere nærmest havde monopol på den  slags. Der er altså også tale om en magtforskydning i informationshåndteringen.

Et andet aspekt af tilgængeligheden af masser af data langt tilbage i tid er den reducerede mulighed for at glemme aktivt. Vi mennesker har det med at ændre på vores selvforståelse i retning af et mere acceptabelt billede af os selv, men også af vores nærmeste og vores omgivelser mere generelt. Det hjælper os til at komme videre i tilværelsen, også når vi tilgiver andre og på sigt fortrænger eller mindsker en negativ oplevelse eller opfattelse. Historikere er skeptiske omkring disse mekanismer og Big Date vil i fremtiden komme dem til hjælp men blive en byrde for folk med ting i deres fortid de helst vil glemme. Gamle mails vil kunne trækkes frem og fortælle, hvad man var så letsindig at sige for længe siden. Måske har vi her nogle af det virkeligt ubehagelige perspektiver for den enkelte person.
I filmen ’Minority Report’ bliver en person straffet for en forbrydelse han ikke har begået, men som han med stor sandsynlighed ville komme til at begå, udregnet efter statistiske parametre, som man åbenbart har stor tillid til – en gang i fremtiden.
En foreløbig optakt til dette scenario er luftselskabernes ’No Fly’ lister. Man kan i lufthavnen risikere at få at vide, at man ikke får lov at flyve med, fordi den statistiske profil på dig tilsiger, at du er for risikabel at have om bord som passager.
Til gengæld kan du som indsat måske få lov at blive løsladt, fordi profilen på dig viser, at der er minimal risiko for, at du igen vil udøve fremtidig kriminalitet. Til gengæld vil lignende mekanismer kunne hjælpe politiet til at effektivisere indsatsen mod ny kriminalitet.

Forleden så jeg en udsendelse om svindelagtige påvirkninger gennem de sociale medier. Mange mener at ’synes godt om’ meldinger på Facebook er et plus eller at omtale af et produkt på Twitter er en anbefaling, men ’likes’ kan købes i bundter på titusinder visse steder i Asien, og god omtale på Twitter kan forklares med, at et firma har givet gaver til den pågældende kendte person, som så med sin status skal give et produkt en forøget anseelse.
Det der med statusafsmitning er et gammelt fænomen. Forleden spurgte Thomas Buch-Andersen Ulf Pilgaard om han spillede golf, for det afslørede han i en reklame, der skulle få os til at købe en vibrator man kunne sætte fødderne på, så man ikke behøvede motionere. Ulf Pilgaard måtte indrømme, at han hverken spillede golf eller brugte vibratoren, men for usselt mammon havde han solgt sit gode navn så det kunne smitte af på et produkt, som Buch-Andersen samtidig kunne få eksperters udsagn om var aldeles nytteløs. Han har haft en hel række udsendelser om reklamer under titlen ’For godt til at være sandt’. Bondefangeri er en gammel disciplin, der også var kendt inden den digitale tidsalder.

Men noget af den tvivlsomme informationsophobning på nettet kan vi trods alt selv påvirke. Vi burde alle gøre hvad vi kan for at begrænse de tilgængelige oplysninger om os i cyberspace.
Ikke desto mindre udfylder vi gladelig en masse rubrikker i Facebook og Twitter om hvem vi er og hvad vi laver. Vi er på en måde selv ude om det, når vi nu ved at den amerikanske efterretningstjeneste NSA og en masse andre orienterer sig i disse oplysninger og tager hensyn til dem eller bruger dem efter forgodtbefindende. Hvem tør lægge deres computer dokumenter op i en Dropbox i skyen, når oplysningerne automatisk bliver gennemgået af efterretningstjenesterne og andre for brug af farlige nøgleord?

Jeg overvejede på et tidspunkt at opsige min gratis g-mail konto hos Google men besindede mig. Netop den feature at jeg selv ved brug af et søgeord kan finde frem til en gammel mail var trods alt vigtig for mig.
Jeg undgår dog at lægge rettighedsbehæftet materiale ud på Facebook, for jeg ved, at jeg så overlader brugsretten til dem. Forleden, da Facebook havde et eller andet jubilæum, fik en række gamle kunder en hilsen med et maskinelt sammensat show med personlige oplysninger, som de i tidens løb havde lagt ud på nettet. Mange var charmeret over dette, men nogle blev måske også en smule bekymrede.
Vi ved efterhånden hvorfor vores mailprogrammer, søgefunktioner og sociale netværk ser ud til at være gratis. Udbyderne scorer kassen på de oplysninger de kan sælge til annoncører, der boltrer sig i spalten ude i siden til højre med lige nøjagtig de tilbud, som de mener vil være interessante for netop mig. På nogle svage sjæle virker det måske. Når jeg tilfældigvis ser at datingfirmaer byder sig til i den spalte – ja måske tilmed som reklame i strengen af posteringer - kan jeg ikke undgå at tænke, at jeg måske har afsløret, at jeg for tiden er single. Det er der selvfølgelig flere, der hellere end gerne vil hjælpe mig med at råde bod på.

For ikke længe siden så jeg den ypperlige film ’Disconnect’.
Jeg er en filmnørd, som ser masser af film, sommetider på dobbelt hastighed med undertekster for at lære lidt af en halvdårlig film, for intrigekonstruktioner er en vigtig del af mit faglige beredskab som forfatter. Det gælder også danske film, som man sjældent vil ofre fuld spilletid på fordi de som regel er for ringe.
Men man skal kysse en masse frøer for at finde en prins. Mine prinser er ikke high school film, romantiske komedier eller voldsballetter med action eller superhelte. Det er nutidsrelevante dramaer udført med professionalisme, og som regel er prinsen amerikansk. Derovre fra kommer også 95% af alle frøerne.      
Disconnect er sådan en perle, der over tre parallelhandlinger beskriver de problemer man kan få på nettet ved at besøge obskure chatrooms, både for unge og voksne. Man kan skabe sig en fiktiv identitet og lede klassekammerater kan narre en ensom dreng til at tro på, at han chatter med en følsom pige og dermed udleverer sig selv.
Man kan på nettet ikke blot skabe sig fiktive identiteter, man kan overtage andre personers identitet. Motivet med identitetstyveri bliver dog ikke udviklet i Disconnect, men nogle taber her alle deres penge og cybersex og cybermobning er stærke temaer i filmen. Desuden omhandler den problemet med journalistisk kildebeskyttelse samt risikoen ved selvtægt, som ellers sjældent betvivles i amerikanske film, snarere det modsatte.
Alt i alt en usædvanlig anbefalelsesværdig film, som jeg var ekstra glad for at se sammen med min teenagedatter, som kunne være mere i risikogruppe end jeg selv. Heldigvis er hun kvik og omhyggelig med alt hvad hun foretager sig og håndterer ansvarligt sit sociale netværk. Som far bliver man lidt stolt, når ens børn er socialt robuste og opfører sig fornuftigt.

Kontrol med internettet er noget, som mange instanser ønsker sig, men det er svært. Selv det formynderiske Kina har svært ved at forhindre, at ubehagelige oplysninger cirkulerer blandt brugerne.
En hyppigt anvendt parameter til kontrol er søgning efter nøgleord. Man skal være tilbageholdende med at bruge ord som sex eller pædofili, for der er givetvis en søgemaskine et sted som opsnapper din tilkendegivelse, hvis du bruger bestemte ord.

Man kan også søge på bestemte typer billeder. Der går rygter om, at man mener at kunne lave en statistik over mængden af sex sider på nettet ved at lave en kortlægning af forekomsten af lyserøde pixels. Det er måske en joke, men man forsøger sig frem med statistiske prøver på de forskellige søgemodeller. Statistikerne ved, hvor stort et baggrundsmateriale de har brug for, hvis de skal kunne udlede konklusioner med tilstrækkelig stor sandsynlighed.
Så sagen med lækagen hos NETS og Se og Hør’s misbrug er måske kun toppen af isbjerget. Udviklingen vil givetvis føre til flere eksempler på, at vi føler os misbrugt på nettet.

 

tilbage