søndag 8. september 2013

Jeg har prøvd @tweetcast

Det fungerte ikke, eller det ble i alle fall feil - jeg ble sendt til @Arbeiderpartiet. Poenget er at det er skrevet en algoritme som skal bruke Twitterkontoen min til å analysere hva jeg antakelig stemmer til valget. Det er dette som skal være kjennetegnet til web 3.0, den semantiske webben, nettopp at automatisering forteller en historie basert på informasjonsbrokker som er plukket opp herfra og derfra. Hvorfor tar den feil?

Aftenposten omtaler noen deler av den algoritmen som er i bruk. Det fremkommer at det søkes etter forekomst og hyppighet av markørord, hashtags, linker, tilknyttete brukenavn osv. Dersom man brukes et utvalg av disse hyppig, er det sannsynlighetsovervekt for at man sokner til et bestemt, politisk parti.

Nåvel. Jeg ga tweetcast tillatelse til innsyn i min twitter-konto og -aktivitet, og min resultatside hos Tweetcast viste blant frem et utvalg venner ("Your friends"). Den kom til at jeg skulle stemme Arbeiderpartiet

Arbeiderpartiet?
Så vidt jeg skjønner, er avgjørelsen bl.a. basert på de to kontaktene Tweetcast selv hadde trukket frem: Kristin Halvorsen (SVKristin) og Gudmund Hernes (gudmundh). Det var et rart utvalg, og jeg forstår ikke hvordan de dro i retning Arbeiderpartiet.

Hernes har jo sluttet i aktiv politikk for lenge siden, han følger jeg mest fordi han bruker sene kveldtimer til å tweete analyser osv. fra New York Times. Kristin Halvorsen følger jeg fordi hun er undervisningsminister og jeg jobber i skolen - samme årsak som gjør at jeg følger Utdanningsdirektoratet .

Jeg følger også en annen, tidligere undervisningsminister: Kristin Clemet (kristinclemet). Hennes konservative bakgrunn skulle vel trukket analysen mot høyre. Nå er det for så vidt greit at det ikke skjedde, for det er jo slik at jeg også følger folk jeg ikke sympatiserer med. Det gir meg mer kunnskap enn bare å følge folk som allerede er i menigheten. At jeg også følger Jens Stoltenberg, har tweetcast heller ikke trukket frem, og det er også greit. Hadde Per Sandberg vært statsminister, ville jeg jaggu fulgt ham også.

Å bli satt i bås etter sannsynlighetsovervekt
Ja, tweetcast tar sjansen. De klinker til. Det er godt jeg ikke automatisk havnet på en søkbar liste med dette resultatet.

Alvoret er at fremtidens webfunksjoner også baserer seg på sannsynlighetsovervekt, basert på større og større erfaringstall. Mer presist blir det nok, men det blir aldri perfekt. Det er alltid en eller annen susekopp der ute som ikke oppfører seg som tweetcast og liknende programmer forutsetter, og som velger etter en helt annen prioritering, eller etter helt andre prinsipper, enn alle andre.

Nå er nok ikke dette noen krise ifm stortingsvalget 2013, men det finnes andre sammenhenger der en kan se for seg en liten krise. Tenk deg at en nettbasert algoritme beregner seg frem til hvorden folk eller biler kommer til å handle i den nære fremtiden, og så begynner vi å plasserer oss og navigere etter det. Vips! kommer vår venn Suse Mikkel og gjør noe annet enn alle andre, og noen kolliderer med ham.

Foreløpig ler vi av nettalgoritmer som tolker og fremskriver feil, men en dag har de en så stor sannsynlighetsovervekt at det vil bli stilt spørsmål ved folk som ikke forholder seg til dem, eller som dem. Den dagen det har noe å si for ansvarsforholdene, blir det ordentlig moro!

søndag 1. september 2013

Innholdsfiltre, pedagogikk og digital dannelse

Innholdsfilteret nekter kommunalt ansatte å gjennomføre
Språkrådets klarspråk-quiz.
Jeg prøvde å ta språkrådets klarspråk-quiz mens jeg var logget på skolens nettverk: "Content blocked by your organization" (!). Det er mange farlige "spill" der ute, kommunens innholdsfiltrering reagerte tvert.

For noen år siden hadde vi det samme problemet da en lærer skulle melde klassen sin på KappAbel-konkurransen: "This websense-category is filtered: Games" (!). Han måtte gjøre det hjemmefra samme kveld.

Rutinen i slike saker er å henvende seg til kommunenes sikkerhetsavdeling, og be om å få åpnet områder/sider etter individuell vurdering. Det er mange gode opplegg og aktiviteter som ryker på den måten:

Vi skulle antakelig akseptere litt utryggghet på dette området, slik at lærerne får brukt hjemmeforberedelsene sine også når de kommer på skolen.

Det høres kanskje tilforlatelig ut å sperre sider som er tagget med weapons, guns, incest osv. Problemet er selvfølgelig at det blir umulig å undervise ved å ta med seg elevene inn på nettsidene til National Rifle Assosiation (NRA), Vigrid, White Aryan Resistance, Støttesenter mot Incest osv.

Nå har jeg ikke en gang begynt å snakke om den pedagogiske verdien av spill, og det lar jeg også ligge. Mange andre har sagt mye klokt om det, nok til  at det forblir uforståelig hvorfor det er noen som ikke ønsker spill velkommen i pedagogisk sammenheng.

Vi vet at barn og unge bl.a. ser mye seksuelt innhold og dubiøse, politiserte fremlegg på nettet - både frivillig og ufrivillig. Det å kunne ta tak i noe av dette i undervisningen vil aldri kunne ses på som en legitimisering av selve innholdet. På en eller annen måte må man kunne undervise og trene elevene i digital navigasjonskompetanse, dannelse og kildekritikk.

Det er neppe heller fruktbart for demokratiundervisningen å betrakte en hver eksponering for uønsket innhold som mulig markedsføring eller potensiell rekruttering. Samfunnsfaglærere har i uminnelige tider vist propagandaklipp fra Filmavisen 1940-45, eller rikspartidagene i Nürnberg på 1930-tallet, uten at det er problematisert på den samme måten.

Den kortsiktige løsningen er kanskje å la elevene gå inn på slike nettsider hjemmefra, som lekse, slik at man i det minste har en felles referanse å forholde seg til på skolen.

På den andre siden hadde vel dette på sikt bare økt utbredelsen av familefiltre, så vi er like langt (og elevene kan nok fortsatt finne den typen innhold - de verste/dummeste/minst seriøse nettsidene går under radarhøyde uansett - de kan bare ikke finne akkurat de kildene vi skal bruke i undervisningen).

Nei, det er bedre å holde hodet kaldt enn å stikke det ned i varm sand...

Personvern for blogger-barn og andre i web 3.0

Ungdom over 15 har selvstendig råde- og samtykkerett over håndtering av egne personopplysninger, og en rett til å forvalte eget rykte. Vi får håpe at det fortsatt blir rom for slikt i fremtiden.

Man kan i store trekk forutsette at ungdommens samtykke etter fylte 15 er selvstendig og avgjørende, med mindre noe annet er eksplisitt uttrykt. I praksis må det være hjemlet i lov før det er aktuelt at foreldre overstyrer det. Personopplysningsloven og barneloven sikrer barn og unges rett til gradvis å ta kontroll over andres behandling av personopplysninger om en selv, både innsamling, registrering, sammenstilling, lagring og utlevering.

Vi har snakket mye om publisering av bilder de siste årene, men må ikke glemme tekster, nettverk osv. Min bekymring er bl.a. knyttet til at jeg har lest for mange foreldreblogger til å tro på at barn og unge egentlig har mulighet til å påvirke hva som er kjent om dem og ikke.

Hva vi alltid har visst at vi må verne

Personvernbestemmelsene er hovedsakelig utformet med tanke på informasjonsinnsamling til registre - for organisasjonsbruk, forskning eller statistikk - med påfølgende anvendelse og evntuelle publisering. La oss for enkelhets skyld anta at denne siden av saken går greit. Likevel gjenstår problemstillinger knyttet til sensitive personopplysninger og informasjon som en ikke nødvendigvis ønsker at skal være kjent for alle.

Sensitive personopplysninger er kraftig vernet. Det er informasjon det skal særlig konsesjon til for å innhente, og opplysninger en aldri skal føle seg forpliktet til å dele med andre hvis en ikke selv ønsker det. Likevel publiseres de ofte i vanvare av enkeltpersoner og slektninger, og lagres åpent i offentligheten.

Hva vi ennå ikke vet at vi trenger å verne

I en mammablogg (ja, en uhøytidelig, empirisk og lokal undersøkelse tilsier at mødre dominerer foreldreblogg-sjangeren) lar mor det stadig komme små drypp om utfordringer og morsomme situasjoner knyttet til å ha et barn med en eller annen tilstand. Det trenger ikke være knyttet til noen definert diagnose, selv om det også er vanlig.

Bloggen er uansett skrevet med tanke på mottakere som er i omtrent samme situasjon eller som kjenner noen i samme situasjon, og den illustrerer på en god  måte mor og fars etiske dilemmaer, hverdagskomplikasjoner osv. Ærlig og åpent, med både selvironi og gode etiske/moralske betraktninger.

Så begynner poden på ungdomsskolen, med de mulige intriger og posisjonskamper som hører med til det, og feil klassekamerat finner et gammelt blogginnlegg. Ikke bare kommer det frem noe som kan likne på helse- eller personopplysninger, det kommer frem at foreldrene slet med oppdragelsen - at de synes det var vanskelig og slitsomt, at de var i tvil om hva de skulle gjøre, og at det var mange sider ved deres egne barn som de ønsket å endre på eller synes det var vanskelig å takle.

Dette er effektiv ammunisjon i gale hender. Likevel er publiseringen antakelig juridisk passabel og ikke i strid med personopplysningsloven, siden den bare forekommer spredt og tilfeldig, og ikke stammer fra et register eller publiseres for å legges inn i et register eller en annen, større sammenheng. Enn så lenge.

Robotjournalisten og den digitale fortelleren

Den nærmeste fremtidens web 3.0 er bl.a. omtalt som "semantisk web" hvor informasjoner i skyen identifiseres og settes sammen til meningsfulle fortellinger. Den automatiske journalisten er kommet temmelig langt allerede. Med semantisk web holder det at informasjon er publisert. Et sett av algoritmer tar seg av å sammenstille informasjonen i de meningsfulle sammenhengene du trenger å finne dem i. Sammenstillingene trenger ikke å lagres. De oppstår i utregningsøyeblikket, og forsvinner når du lukker dem.

Hva samfunnsvitenskapelig forskning kommer til å være i en slik sammenheng, har jeg ingen mulighet til å overskue. Men, man trenger i alle fall ikke å gjøre mer enn å slippe fra seg en bit informasjon et eller annet sted, før den kan sammenstilles og publiseres av digitale agenter som på ingen måte kan underlegges konsesjonsplikt for slike handlinger.

Vi er kommet et skritt på veien allerede når en dagligvarekjedes lojalitetskort kan brukes til å analysere enkeltkundens handlemønster, og endringene i det, på en slik måte at butikken vet at kunden er gravid før hun selv vet det. I sammenstillinger som også omfatter sosiale medier er det heller ikke særlig komplisert å skrive algoritmer som avslører noen av dine innerste hemmeligheter eller lyster - uten å bryte seg inn noe sted, men bare ved å sette sammen offentlig tilgjengelig informasjon.

I web 3.0 kan vi alle være forskere. Det er bare er en bieffekt av det som egentlig kommer til å kjennetegne utviklingen, men like fullt et interessant aspekt. Vi kan opprette våre egne glimt inn i andre folks personopplysninger, enten i dybden eller som sammenlikninger mellom flere. Enkeltpersonenes deltakelse i vår (ut)forskning er ukjent for dem selv, høyst tilfeldig og ukonsesjonert.


Oppsummering: digital varsomhet (igjen...)

Når all personlig informasjon allerede er publisert, vil enkeltpersonenes rolle reduseres til å forsvare sitt rykte og bidra til balanserte fremstillinger av seg selv. Om dette i det hele tatt kan unngås, er tvilsomt, men det er nok greit å ha passert 15 før man får de tyngste utfordringene på dette feltet.

Foreldre må ta problemstillingene på alvor, være aktsomme og tenke langsiktig rundt hva slags informasjon som blir offentlig, akkurat som barn og unge må læres opp til det samme. Intet egentlig nytt under solen der, altså, det blir bare viktigere etter hvert som spekteret av mulige konsekvenser utvides.

Nå som det er skolestart og foreldremøter er dette enda en av de oppfordringene jeg mener noe alvorlig med, men som jeg aldri fant plass eller rom til å komme med - noe annet sted enn her.