NL FR EN
www.belgium.be

Text mining voor de verspreiding van statistische informatie via Belgostat on-line

Onderzoeksproject AG/GG/094 (Onderzoeksactie AG)

Personen :

Beschrijving :

Het voorgestelde project is een logisch vervolg op het Belgostat-thesaurusproject voor de Nationale Bank van België (Project AG/DD/36). Hoewel deze thesaurus de toegankelijkheid van de Belgostat reeksen voor externe klanten, maar ook voor interne gebruikers aanzienlijk zal verhogen, blijft er evenwel een lacune bestaan inzake toegankelijkheid van de niet-gecodeerde en niet-gestructureerde informatie, te weten de metagegevens, de artikelen, enz. ... Het project "text mining voor de verspreiding van statistische informatie via Belgostat on-line" stelt zich bijgevolg ten doel aan de gebruikers van de Internetsite van de Bank een snelle en gestructureerde toegang te verschaffen tot de methodologische nota's die aan de verzameling en aanmaak van de statistische reeksen ten grondslag liggen.
De invoering van een "text mining", die het opzoeken van dit soort informatie vergemakkelijkt, is van essentieel belang om aan de gebruikers een volledige Internetsite te bieden, met alle nodige search engines.

Op basis van de door de Nationale Bank geleverde inventaris, zal de onderzoeksploeg een organisatie voorstellen die in staat is om de verspreiding van de methodologische nota's via Belgostat on-line te vereenvoudigen (links met de reeksen en tabellen, gebruik van sleutelwoorden, "text mining"), evenals een geschikte opzoek- en organisatiemethode, rekening houdend met de specifieke kenmerken van de gegevens.

Het team van universitaire specialisten vat zijn werkzaamheden aan nadat door de Bank een inventaris werd opgemaakt van de niet-gecodeerde informatie waarin de gebruikers opzoekingen zullen kunnen verrichten (lijst van methodologische artikelen betreffende de statistische reeksen, metagegevens). Deze inventaris zal bovendien de van kracht zijnde ontwerp- en bijwerkregels verduidelijken.

Het team van specialisten zal een functioneel en technisch voorstel doen met betrekking tot de organisatie (indeling, toegang, bijwerking) van de methodologische nota's, dat op de Internetsite van de Bank kan worden gebruikt, en dat de volgende kenmerken omvat:
- eenvoudige opsporing van de niet-gecodeerde informatie
- links met de huidige thesaurus, en bijgevolg mogelijke overeenstemming met de statistische reeksen.
- verfijning van de gebruiks- en beheermethodes.

De Bank zal deze nieuwe toepassing integreren op haar Internetsite, en zal aldus de waaier van instrumenten voor het zoeken naar informatie die ter beschikking wordt gesteld van de eindgebruikers, vervolledigen. Via de statistische website, o.a. Belgostat on-line, dient dit project een eenvoudige toegang te verzekeren tot de methodologische informatie over de gepubliceerde reeksen.