Av Jean-Philippe Caquet, Senior Advisor at Documaster

Et av resultatene var at flere nordmenn fikk en oppfatning om at det offentlige satt på én mappe, som inneholdt alt om dem. Denne idéen festet seg i folks tankesett, og har siden gitt forventninger om tilgang til egne data, men også større frykt for å bli overvåket. Begge deler er ubegrunnet, siden «mappa mi» er spredt på hundrevis av offentlige databaser og arkiver.

Vil det noen gang bli mulig for en innbygger å bare ha én mappe? Det kan det, dersom man er bevisst på sine data.

Data gir gode tjenester

«Data er den nye oljen» hører vi ofte, og it-guruer snakker om viktigheten av åpne data. Data blir til som en del av tjenestene det offentlige tilbyr, og blir de håndtert riktig, kan de bidra til utvikling av flere og bedre tjenester.

Men åpning og deling av data er utfordrende. Problemet er at de fleste datasamlinger har oppstått som resultat av behov der og da, og man har sjelden tenkt på hva dataene kan brukes til i fremtiden. Hvordan skal man så jobbe praktisk med dette? Det er du som må svare for din egen organisasjon, men for å hjelpe deg på vei, har vi noen stikkord: Kvalitet, unike identifikatorer, metadata og trygghet.

Kvalitet

Dårlig datakvalitet gir feil informasjon, kan ikke brukes juridisk, er en sikkerhetstrussel, og kan være umulig å finne igjen. Derfor er kvalitetssikring viktig. Det kan gjøres ved å gjennomføre gode informasjonsvurderinger i forkant av at data oppstår, ha støtte for dette i dine systemer, samt bruk av oppslag i sentrale registre (som folkeregisteret) eller virksomhetens egne registre (som et kunderegister). Har man ikke oppslagsmuligheter er kryss-sjekking med tidligere hendelser en mulighet, og man kan også bruke selvlærende algoritmer som jobber kontinuerlig for å bedre datakvaliteten. Bruker man flere av disse metodene samtidig øker kvaliteten betraktelig.

Unike identifikatorer

Kvalitetssikring av data er spesielt viktig for unike identifikatorer. Dette er entydige nøkkelverdier som gjør det mulig å identifisere unike objekters (for eksempel personer eller organisasjoner) tilknytning til data. Ved hjelp av disse kan vi også dele og koble forskjellige typer data sammen, på tvers av forskjellige systemer. Men de må brukes.

Fødselsnummer er kanskje den viktigste identifikatoren vi har. Et navn er ikke unikt og kan forandre seg, men et fødselsnummer er (med noen få unntak) unikt, uforanderlig og følger deg livet ut. Ved konsekvent bruk av fødselsnummer som identifikator er ikke «mappa mi» en utopi lenger.

Metadata

Unike identifikatorer er en form for «metadata», eller «data om data», men det finnes også andre metadata som har verdi. For selv om de ikke gir en entydig identifikasjon, kan de fortelle oss masse om kontekst, og gjøre dataene enda nyttigere.

Når skrev du deg inn på sykehuset den dagen barna dine ble født? De fleste it-systemer logger både tid og sted, men disse dataene blir sjelden tatt vare på. I en god datastruktur kan tid og sted på flere måter som kan si noe om tidspunktet en begivenhet skjedde, hvor det skjedde og hvem som var med deg. Tidfestinger kan la oss sette opp grafer og tidslinjer og la oss se utviklinger over tid.

Trygghet

Er det trygt å la det offentlige vite alt om deg? De vet allerede mye om deg, men slik det er i dag er det vanskelig å finne frem den dokumentasjonen på grunn av mangel på unike indentifikatorer og metadata.

Husk at du eier dine egne data, og disse dataene må det offentlige ha tillatelse av deg til å behandle, med mindre de er pålagt tilgang på grunn av lov.

Når dataene om deg er tilgjengelig vil det gjøre deg tryggere enn hvis dataene er spredt og du ikke aner hvor de er.

Informasjonsvurderinger

Data oppstår ikke på magisk vis. De skapes som en konsekvens av det vi gjør. Vi vet ikke sikkert hvilke data vi kan ha behov for før behovet oppstår. Likevel kan man gjøre grep i dag som gjør at man står sterkere i møte med en usikker fremtid. Hver gang du skriver noe, eller registrerer noe i et it-system, så skaper du data. Disse har nytte for deg her og nå, men hvem andre kan ha nytte av dem også? Hvor lenge? Hvordan skal du strukturere dem slik at de kan gjenbrukes? Hvis du stiller deg disse spørsmålene, har du allerede begynt å bedre vårt felles datagrunnlag, og all bedring av datagrunnlaget tar oss et skritt videre på veien mot det digitale samfunnet.