Programmabeschrijving HISKLIM

  • Inleiding
  • Data-infrastructuur en data-archivering
  • Digitaliseren
  • Bewerken en homogeniseren
  • Schematisch overzicht HISKLIM (PDF-bestand, 24 kB)

  •  
     

    Inleiding

    Lange en kwalitatief goede historische klimaatreeksen en databases zijn vooral nodig om duidelijkheid te krijgen over antropogene klimaatverandering in relatie tot natuurlijke klimaatvariabiliteit. Wereldwijd wordt de vraag naar dergelijke reeksen en databases, met hoge tijdsresolutie, dan ook steeds groter. Daarnaast groeit het besef dat het belangrijk is deze gegevens via een goed toegankelijk medium, zoals internet, publiek ter beschikking te stellen. De twee belangrijkste doelstellingen van HISKLIM zijn hiermee nauw verweven: (1) het verbeteren van de kwaliteit van bestaande lange historische klimaatreeksen en databases; en (2) het op een gebruikersvriendelijke manier publiek ter beschikking stellen van historische klimaat data (data-infrastructuur). Daarnaast spelen data-rescue en data-archivering een belangrijke rol.
     

    Data-infrastructuur en data-archivering

    De data-infrastructuur voor historische data, zowel maritiem als land, voldoet niet aan de eisen van deze tijd. Ook op andere typen data (satelliet, radar, model, etc.) is dit van toepassing. Op het KNMI zijn daarom verschillende ontwikkelingen in gang gezet met als doel het verbeteren van de data-infrastructuur. Een belangrijk probleem bij historische waarnemingen is dat de metadata nogal versnippert aanwezig is. Ook is er geen geschreven KNMI-archiveringsbeleid t.a.v. van de digitale en niet-digitale waarnemingen en is er geen duidelijke policy met betrekking tot de verstrekking van de historische klimaatdata en de beveiliging van data (o.a. backups).

    Wat willen we bereiken?
    Het streven van HISKLIM is te komen tot een goed toegankelijke (via internet) en beheersbaar metadata-informatiesysteem opzetten van alle historische data (ongeacht of het digitaal beschikbaar is of niet). Dit systeem werkt voor de gebruiker als zoek-catalogus. Het vormt de basis om diverse (nader te bepalen) historische waarnemingen on-line te downloaden. Het geheel wordt zodanig opgezet dat het kan uitgroeien tot een Nationale Klimaat Database (NKD) met daarin ook niet-HISKLIM data. Hoewel het einddoel is dat de waarnemingen in databases benaderd kunnen worden, kan in eerste instantie volstaan worden met het downloaden van geselecteerde gegevens. Daarbij wordt een databeleid opgesteld waarin o.a. wordt aangegeven welke waarnemingen, en met welke restricties, men kan 'downloaden'. Rekening houdend met de KNMI Catalogus, wordt het systeem gespecificeerd volgens 'free flow of data', inclusief een gebruikersvriendelijke wijze van benaderen. Voor de pre-1850 maritiem data willen we onderzoeken of het mogelijk is een internationale Maritieme Klimaat Database op te zetten.

    Er is een duidelijke behoefte aan een (geschreven) archiveringsbeleid voor digitale waarnemingen (opslag waarnemingen met hoge tijdsresolutie, backup strategie, etc.) en niet-digitale waarnemingen. HISKLIM wil hiertoe een archiveringsbeleid opstellen zodanig dat: (1) het voor iedereen duidelijk is welke gegevens bewaard worden en welke niet;  (2) gegevens gemakkelijk te traceren zijn; (3) gegevens veilig en doeltreffend bewaard worden; en (4) het voor iedereen duidelijk is bij welke personen de verantwoordelijkheden liggen.
     

    Digitaliseren

    Uit een inventarisatie van maritieme data en landdata bleek dat er nog een grote hoeveelheid waarnemingen in de boeken sluimert. Om deze gegevens geschikt te maken voor klimaatonderzoek e.d., is de eerste stap het digitaliseren van de waarnemingen. Hierbij moeten we bedenken dat wij onder digitaliseren iets anders verstaan dan bibliotheken en archieven. Bibliotheken en archieven verstaan onder digitaliseren in de regel het verfilmen of digitaal fotograferen van bronnen, waarbij de gegevens dus niet in ASCII vorm beschikbaar komen. In ons geval is dit laatste juist de bedoeling van digitalisatie, omdat er dan met de gegevens gerekend kan worden. Deze wijze van digitaliseren is echter een arbeidsintensieve bezigheid, die een grote mate van discipline en uithoudingsvermogen vereist. Gelukkig is het voor het grootste deel een eenmalige bezigheid, mits bij het digitaliseren de oorspronkelijke gegevens worden opgeslagen zonder correcties bij voorbaat.

    Wat willen we bereiken?
    Ons streven is zoveel mogelijk van de in de archieven sluimerende maritieme data en landdata te digitaliseren. Daarbij willen een voldoende groot aantal mensen inzetten, zowel intern als extern, zodanig dat de voortgang van dit werk gegarandeerd is. Niet iedere bron met waarnemingen heeft een even hoge prioriteit binnen het HISKLIM programma om gedigitaliseerd te worden. Anderzijds bevatten deze bronnen klimaatdata die thans nauwelijks beschikbaar zijn (bijvoorbeeld 10-minuten neerslagreeksen uit stroken) waaraan in de toekomst behoefte zal zijn. Om dit alles binnen een redelijke termijn te digitaliseren, zal veel afhangen van de mogelijkheden om subsidies te krijgen.
     

    Bewerken en homogeniseren

    Bewerken en homogeniseren zijn beide activiteiten die tot doel hebben de kwaliteit van klimaatreeksen te verhogen. Bewerken is een dagelijks terugkerende standaard activiteit op het KNMI. Daarbij worden de waarnemingen op kwaliteit gecontroleerd en indien nodig gecorrigeerd. Elke waarneming krijgt vervolgens een kwaliteitscode mee. Voor de oudere waarnemingen, bijvoorbeeld de jaarboeken van de 19e eeuw, ontbreken deze codes. Ook zijn daar de tijden niet gestandaardiseerd (ook een punt van aandacht voor de termijnstations van de 20e eeuw). Iets verder terug in de tijd zijn ook de eenheden waarin gemeten is niet gestandaardiseerd. Voor de oude reeksen moeten een aantal bewerkingen dus nog met terugwerkende kracht uitgevoerd worden.

    Voor veranderingen in meetopstelling, meetinstrument, e.d. wordt tot op heden niet gecorrigeerd. Dat betekent dat reeksen inhomogeniteiten kunnen vertonen. Voor onderzoek naar klimaatverandering en –variabiliteit is het echter noodzakelijk dat klimaatreeksen homogeen zijn. Binnen HISKLIM is het homogeniseren van reeksen en het garanderen van de continuïteit van reeksen dan ook een belangrijk doel. Daarnaast speelt er nog het probleem van de maritieme data. Centraal staat hierbij het COADS probleem en de beschikbaarstelling van gehomogeniseerde lichtschipreeksen.

    Wat willen we bereiken?
    In de eerste plaats willen we bestaande waarnemingen zodanig bewerken dat ze geschikt zijn voor verdere verspreiding. Deze bewerkte reeksen zijn een belangrijke basis voor het tweede doel, n.l. het verkrijgen van een homogene Zwanenburg/De Bilt reeks op een zo hoog mogelijke tijdsresolutie. Daarna willen we ook andere reeksen gaan homogeniseren, zoals de 4 andere hoofdstations. Verder willen we ervoor zorgen dat de continuïteit van bestaande lange reeksen gewaarborgd wordt.
     
     
     

    intro-ne HISKLIM: programmabeschrijving | projecten | maritieme data | landdata | publikaties | datalinks | vacature
     
     

    Theo Brandsma