NL FR EN
www.belgium.be

Catalogi en databank van wetenschappelijke collecties

Onderzoeksproject DI/05 (Onderzoeksactie DI)

Personen :

  • M.  DANON Eric - Koninklijk Belgisch Instituut voor Natuurwetenschappen (KBIN)
    Coördinator van het project
    Betoelaagde Belgische partner
    Duur: 1/11/2005-1/1/2012
  • Prof. dr.  BACKELJAU Thierry - Koninklijk Belgisch Instituut voor Natuurwetenschappen (KBIN)
    Betoelaagde Belgische partner
    Duur: 1/11/2005-1/1/2012
  • M.  VANGELUWE Didier - Koninklijk Belgisch Instituut voor Natuurwetenschappen (KBIN)
    Betoelaagde buitenlandse partner
    Duur: 1/11/2005-1/1/2012

Beschrijving :

De complexiteit van het digitaliseren binnen het KBIN is moeilijk te bevatten indien men het doel van de collecties niet begrijpt en men de hoeveelheid en de variatie van de betrokken objecten niet kent. De objectieven vastgesteld in het kader van dit project vertegenwoordigen slechts een minuscuul deel van de collecties van het KBIN die gedigitaliseerd zouden kunnen worden, zoals de resultaten van de studie van het bureau Van Dijk getuigen. Deze studie, uitgevoerd in 2002-2003, lijst tot dan voor het KBIN niet minder dan 46 collecties op, ingedeeld volgens de natuur van de objecten van deze collecties (boeken, periodieken, archieven, wetenschappelijke gegevens in "analoge" vorm of 3D objecten, foto’s, plannen, …).

De keuze van de doelstellingen van het project DI/00/05 was, is en zal de komende jaren blijven, wat steeds de voornaamste prioriteit van de digitaliseringswerken van het wetenschappelijke patrimonium van het KBIN was: de digitalisering van de catalogi van de wetenschappelijke collecties waarvan de hoeveelheid van bewaarde objecten historisch geschat werd op 35 tot 37 miljoen specimens.

De collecties van het KBIN, en in het bijzonder deze betreffende de zoölogie, zijn zowel op Europees als op wereldvlak zeer belangrijk. Het aantal "type-specimens" in de collecties wordt geschat op 110.000 exemplaren. De prioriteit wordt dus gelegd op het digitaliseren van deze unieke exemplaren (holypes en paratypes, maar ook allotype, cotype, genotype, lectotype, neotype, paralectotype, plastotype, plesiotype, syntype en topotype). De basisgegevens alsook de verwijzing naar de originele beschrijving worden ingebracht in DaRWIN, een gemeenschappelijk programma voor het beheer van de collecties (databank ontwikkeld door de informaticadienst van het KBIN), en dit door personeel aangeworven dankzij het project maar ook door personeel op eigen middelen, omkaderd door wetenschappers en collectiebeheerders.

De resultaten zijn uitstekend: eind februari 2012 waren er 27.221 records ingevoerd in DaRWIN, die informatie omtrent 71.687 "type"-objecten in de collecties vertegenwoordigen (ofwel 65,17% van het historisch geschatte totaal).

Het project richt zich eveneens op de digitalisering van 500.000 stalen “Belgisch materiaal”. In het begin van het project bevond slechts een uiterst klein deel van de “Belgische” collecties (recente vertebraten, invertebraten, entomologie, paleontologie, mineralen en geologische gegevens) zich in digitale vorm. Het doel van deze eerste fase was dus het invoeren in DaRWIN (op dezelfde manier als het typemateriaal) van een selectie van “Belgische” specimens in de collectie voor dewelke de basisgegevens gekend zijn.

De prioriteit werd doorgaans steeds gelegd op de “Belgische” collecties. Naarmate het project vorderde werd echter, om het werkritme van de encodeurs niet te vertragen, de digitalisering ook uitgebreid naar andere catalogi specimens van onze collecties waarvan de gegevens eveneens klaar waren voor invoer. Eind februari 2012 waren 411.408 "non-type" records aanwezig in DaRWIN (ofwel 82,28% van het oorspronkelijke objectief), die 2.449.171 "non-type"-objecten in de collecties vertegenwoordigen.

Eenmaal ingevoerd, zijn deze gegevens (net zoals het typemateriaal) onmiddellijk online beschikbaar via de DaRWIN-webinterface: http://darwin.naturalsciences.be.

Een parallelle inspanning werd eveneens geleverd met betrekking tot de invoer van de collectiegegevens van het departement Antropologie en Prehistorie van het Instituut. Deze collecties vereisten een andere aanpak (specifieke noden) voor hun beheer. Hiervoor werd de informatie ingevoerd op een specifiek platform “Mars”, ontwikkeld op basis van “open source”-oplossingen in het kader van een ander project gefinancierd door de POD Wetenschapsbeleid (BELSPO).

De derde en niet te vergeten laatste doelstelling van het project betrof de invoer van 500.000 ringgegevens: op 31 augustus 2009 waren reeds 548.268 ringfiches ingebracht in het programma Papageno (conform het EURING-formaat) waardoor de oorspronkelijke doelstelling met bijna 10% werd overschreden! De gegevens betreffende het ringwerk in België zijn sinds 1926 gecentraliseerd in het KBIN. Momenteel is enkel de databank van de terugvangsten, die 450.000 gegevens omvat, volledig geïnformatiseerd. De andere gegevens (meer dan 15.000.000 records) zijn voor het grootste deel enkel beschikbaar op handgeschreven fiches. In het kader van het DI/00/05 project werd slechts een voorgeselecteerd deel van deze 15.000.000 gegevens ingevoerd (weerhouden selectie: grote vogelsoorten - grote ringen, 500.000 ringgegevens) in het programma Papageno dat sinds meerdere jaren gebruikt wordt op het KBIN.

Om dit soort project tot een goed einde te kunnen brengen, heeft men tijd en personeel nodig; tot op heden is er nog geen beter alternatief gevonden om de menselijke invoer van inventarisgegevens over te nemen. De inventarissen worden immers ook gebruikt voor onderzoeksdoeleinden. De regels zijn veranderd, de nomenclatuur eveneens, het volstaat niet om de inventarisfiches in te scannen met een tekstherkenningsprogramma: men moet de bestaande gegevens herschrijven naar formaten die internationaal erkend worden door de wetenschappelijke gemeenschap. De digitalisering gaat dus vergezeld van een verificatie. Er zijn opgeleide operatoren nodig (“encodeurs”) en een voldoende wetenschappelijke omkadering, waarbij ook het nodige informaticapersoneel niet mag worden vergeten voor wat de technologische aspecten betreft (voor de ontwikkeling, het beheer en de support van deze tool).

We kunnen dus besluiten dat deze fase van het project DI/00/05 eindigt met een zeer positieve balans: niet alleen kunnen er opmerkelijke cijfers worden voorgelegd, dit project is een echte motor gebleken voor de uitvoering van een institutioneel plan tot digitalisering van de collecties. Dit project heeft aldus niet alleen geleid tot het opstellen van gemeenschappelijke werkprocessen (personeel, doelstellingen, software, …) maar ook tot het online plaatsen van de resultaten van deze digitalisering, waardoor het grote publiek, onderzoekers en specialisten wereldwijd in real-time toegang krijgen tot ons patrimonium.

Het KBIN beschikt nu ook over een operationeel platform om zijn wetenschappelijke collecties (entomologie, vertebraten, invertebraten, paleontologie en geologie) te beheren, dat gemeenschappelijk is en gebaseerd is op technologie onafhankelijk van enige commerciële of propriëtaire verplichtingen. Een platform dat goed aangepast is voor het beheer van natuurhistorische collecties en dat, met respect voor de internationale standaarden, de uitwisseling van gegevens naar andere internationale platformen (zoals bijvoorbeeld BioCase & GeoCase) toelaat. Beter nog, nieuwe samenwerkingen tussen het KBIN en andere wetenschappelijke instellingen lijken vorm te nemen rondom DaRWIN voor wat betreft het delen van kennis, ervaring en capaciteiten inzake ontwikkeling.

Maar het digitaliseringswerk van het KBIN is echter nog verre van voltooid! Dit was slechts een eerste etappe, een springplank naar nieuwe doelstellingen. Ondertussen duiken er andere perspectieven op inzake digitalisering van 2D/3D-objecten die in rechtstreeks verband staan met de specimens, zelfs als onze absolute prioriteit voor de komende jaren nog exclusief het verderztten van de nauwgezette digitalisering van de catalogi van onze wetenschappelijke collecties blijft. Een nieuwe stap in de digitalisering van ons erfgoed zou hiermee worden gezet. Deze gekruiste informatie zou zonder twijfel de interesse vergroten bij het grote publiek (aangezien de informatie meer toegankelijk wordt gemaakt), maar zou eveneens aanvullende wetenschappelijke informatie kunnen bezorgen voor specialisten in het domein.

Documentatie :

Catalogi en databank van wetenschappelijke collecties (Phase 1) : eindrapport  Emery, Cathy - Semal, Patrick - Lenglet, Georges ... et al  Brussel : Federaal Wetenschapsbeleid, 2012 (SP2520)
[Om te downloaden