Programmabeschrijving HISKLIM
Inleiding
Data-infrastructuur
en data-archivering
Digitaliseren
Bewerken en homogeniseren
Schematisch overzicht HISKLIM
(PDF-bestand, 24 kB)
Inleiding
Lange en kwalitatief goede historische klimaatreeksen en databases zijn
vooral nodig om duidelijkheid te krijgen over antropogene klimaatverandering
in relatie tot natuurlijke klimaatvariabiliteit. Wereldwijd wordt de vraag
naar dergelijke reeksen en databases, met hoge tijdsresolutie, dan ook
steeds groter. Daarnaast groeit het besef dat het belangrijk is deze gegevens
via een goed toegankelijk medium, zoals internet, publiek ter beschikking
te stellen. De twee belangrijkste doelstellingen van HISKLIM zijn hiermee
nauw verweven: (1) het verbeteren van de kwaliteit van bestaande lange
historische klimaatreeksen en databases; en (2) het op een gebruikersvriendelijke
manier publiek ter beschikking stellen van historische klimaat data (data-infrastructuur).
Daarnaast spelen data-rescue en data-archivering een belangrijke rol.
Data-infrastructuur
en data-archivering
De data-infrastructuur voor historische data, zowel maritiem als land,
voldoet niet aan de eisen van deze tijd. Ook op andere typen data (satelliet,
radar, model, etc.) is dit van toepassing. Op het KNMI zijn daarom verschillende
ontwikkelingen in gang gezet met als doel het verbeteren van de data-infrastructuur.
Een belangrijk probleem bij historische waarnemingen is dat de metadata
nogal versnippert aanwezig is. Ook is er geen geschreven KNMI-archiveringsbeleid
t.a.v. van de digitale en niet-digitale waarnemingen en is er geen duidelijke
policy met betrekking tot de verstrekking van de historische klimaatdata
en de beveiliging van data (o.a. backups).
Wat willen we bereiken?
Het streven van HISKLIM is te komen tot een goed toegankelijke (via
internet) en beheersbaar metadata-informatiesysteem opzetten van alle historische
data (ongeacht of het digitaal beschikbaar is of niet). Dit systeem werkt
voor de gebruiker als zoek-catalogus. Het vormt de basis om diverse (nader
te bepalen) historische waarnemingen on-line te downloaden. Het geheel
wordt zodanig opgezet dat het kan uitgroeien tot een Nationale Klimaat
Database (NKD) met daarin ook niet-HISKLIM data. Hoewel het einddoel is
dat de waarnemingen in databases benaderd kunnen worden, kan in eerste
instantie volstaan worden met het downloaden van geselecteerde gegevens.
Daarbij wordt een databeleid opgesteld waarin o.a. wordt aangegeven welke
waarnemingen, en met welke restricties, men kan 'downloaden'. Rekening
houdend met de KNMI Catalogus, wordt het systeem gespecificeerd volgens
'free flow of data', inclusief een gebruikersvriendelijke wijze van benaderen.
Voor de pre-1850 maritiem data willen we onderzoeken of het mogelijk is
een internationale Maritieme Klimaat Database op te zetten.
Er is een duidelijke behoefte aan een (geschreven) archiveringsbeleid
voor digitale waarnemingen (opslag waarnemingen met hoge tijdsresolutie,
backup strategie, etc.) en niet-digitale waarnemingen. HISKLIM wil hiertoe
een archiveringsbeleid opstellen zodanig dat: (1) het voor iedereen duidelijk
is welke gegevens bewaard worden en welke niet; (2) gegevens gemakkelijk
te traceren zijn; (3) gegevens veilig en doeltreffend bewaard worden; en
(4) het voor iedereen duidelijk is bij welke personen de verantwoordelijkheden
liggen.
Digitaliseren
Uit een inventarisatie van maritieme data en landdata bleek dat er nog
een grote hoeveelheid waarnemingen in de boeken sluimert. Om deze gegevens
geschikt te maken voor klimaatonderzoek e.d., is de eerste stap het digitaliseren
van de waarnemingen. Hierbij moeten we bedenken dat wij onder digitaliseren
iets anders verstaan dan bibliotheken en archieven. Bibliotheken en archieven
verstaan onder digitaliseren in de regel het verfilmen of digitaal fotograferen
van bronnen, waarbij de gegevens dus niet in ASCII vorm beschikbaar komen.
In ons geval is dit laatste juist de bedoeling van digitalisatie, omdat
er dan met de gegevens gerekend kan worden. Deze wijze van digitaliseren
is echter een arbeidsintensieve bezigheid, die een grote mate van discipline
en uithoudingsvermogen vereist. Gelukkig is het voor het grootste deel
een eenmalige bezigheid, mits bij het digitaliseren de oorspronkelijke
gegevens worden opgeslagen zonder correcties bij voorbaat.
Wat willen we bereiken?
Ons streven is zoveel mogelijk van de in de archieven sluimerende maritieme
data en landdata te digitaliseren. Daarbij willen een voldoende groot aantal
mensen inzetten, zowel intern als extern, zodanig dat de voortgang van
dit werk gegarandeerd is. Niet iedere bron met waarnemingen heeft een even
hoge prioriteit binnen het HISKLIM programma om gedigitaliseerd te worden.
Anderzijds bevatten deze bronnen klimaatdata die thans nauwelijks beschikbaar
zijn (bijvoorbeeld 10-minuten neerslagreeksen uit stroken) waaraan in de
toekomst behoefte zal zijn. Om dit alles binnen een redelijke termijn te
digitaliseren, zal veel afhangen van de mogelijkheden om subsidies te krijgen.
Bewerken en homogeniseren
Bewerken en homogeniseren zijn beide activiteiten die tot doel hebben de
kwaliteit van klimaatreeksen te verhogen. Bewerken is een dagelijks terugkerende
standaard activiteit op het KNMI. Daarbij worden de waarnemingen op kwaliteit
gecontroleerd en indien nodig gecorrigeerd. Elke waarneming krijgt vervolgens
een kwaliteitscode mee. Voor de oudere waarnemingen, bijvoorbeeld de jaarboeken
van de 19e eeuw, ontbreken deze codes. Ook zijn daar de tijden niet gestandaardiseerd
(ook een punt van aandacht voor de termijnstations van de 20e eeuw). Iets
verder terug in de tijd zijn ook de eenheden waarin gemeten is niet gestandaardiseerd.
Voor de oude reeksen moeten een aantal bewerkingen dus nog met terugwerkende
kracht uitgevoerd worden.
Voor veranderingen in meetopstelling, meetinstrument, e.d. wordt tot
op heden niet gecorrigeerd. Dat betekent dat reeksen inhomogeniteiten kunnen
vertonen. Voor onderzoek naar klimaatverandering en –variabiliteit is het
echter noodzakelijk dat klimaatreeksen homogeen zijn. Binnen HISKLIM is
het homogeniseren van reeksen en het garanderen van de continuïteit
van reeksen dan ook een belangrijk doel. Daarnaast speelt er nog het probleem
van de maritieme data. Centraal staat hierbij het COADS probleem en de
beschikbaarstelling van gehomogeniseerde lichtschipreeksen.
Wat willen we bereiken?
In de eerste plaats willen we bestaande waarnemingen zodanig bewerken
dat ze geschikt zijn voor verdere verspreiding. Deze bewerkte reeksen zijn
een belangrijke basis voor het tweede doel, n.l. het verkrijgen van een
homogene Zwanenburg/De Bilt reeks op een zo hoog mogelijke tijdsresolutie.
Daarna willen we ook andere reeksen gaan homogeniseren, zoals de 4 andere
hoofdstations. Verder willen we ervoor zorgen dat de continuïteit
van bestaande lange reeksen gewaarborgd wordt.
intro-ne
HISKLIM: programmabeschrijving
| projecten
| maritieme
data | landdata
| publikaties
| datalinks
| vacature
Theo Brandsma