Onderzoeksproject P5/24 (Onderzoeksactie P5)
Een belangrijke opdracht voor statistiekers bestaat in het voorzien van methoden die onderzoekers kunnen aanwenden voor het inkaderen van hun substantiële vragen in formele modellen, zodat deze handelbaar worden voor empirisch onderzoek. Wat dit laatste betreft, een belangrijke nauw verbonden opdracht in statistische analyse bestaat in het rekening houden met de natuur van de data. Tegenwoordig is er in vele domeinen een stijgende vraag naar het adequaat verwerken van de complexiteit van de data, die verzameld worden om substantiële vragen i.v.m. onderzoek te bestuderen. Bovendien vertonen de substantiële vragen i.v.m. onderzoek zelf een toenemende complexiteit, in het bijzonder vanaf het laatste decennium. Beide types van complexiteit betekenen een belangrijke uitdaging voor de hedendaagse statistiek. Nieuwe modellen en technieken zijn duidelijk noodzakelijk voor het verwerken van vragen en data met een complexe onderliggende structuur, gebruik makend van up-to-date methoden in statistische methodologie en besluitvorming en steunend op aanpassingen van bestaande technieken voor eenvoudigere structuren.
Het vertrekpunt van de voorgestelde netwerk activiteiten bestaat uit een breed gamma van complexe substantiële data sets en vragen die in verschillende disciplines voorkomen (waaronder psychologie, biomedische wetenschappen, economie en climatologie). Het hoofddoel van ons project is het ontwikkelen van geschikte statistische modellen en technieken om deze data en vragen te kunnen verwerken.
Als zodanig zullen de netwerk activiteiten georganiseerd worden in 6 werkmodulen die verder gegroepeerd worden in twee secties. Sectie I bestaat uit 4 werkmodulen (WP1-WP4) die zich toeleggen op 4 wel omschreven klassen van modellen. Sectie II omvat 2 werkmodulen (WP5-WP6) die statistische aspecten van meta-modellering behandelen; deze laatste kan op zich zelf bestudeerd worden, maar kan daarenboven ook deel uit maken van verschillende klassen van modellen, zoals onderscheiden in Sectie I. De belangrijkste doelstellingen van de zes werkmodulen (WPs) kan als volgt samengevat worden :
- WP1 (Schatten van functies) : het uitbreiden van klassieke methoden voor het schatten van één- of meer-dimensionele functies naar meer realistische (maar tegelijkertijd ook meer complexe) substantiële theoriëen (in het bijzonder : economische theoriëen die gebruik maken van het schatten van `frontiers’) en het op een geschikte manier formaliseren en modelleren van heterogeniteit;
- WP2 (Tijdreeksen) : het behandelen van twee belangrijke bronnen van complexiteit in de analyse van multivariate tijdreeksen : niet-stationariteit en hoog-dimensionale data;
- WP3 (Overlevingsanalyse) : het bestuderen van niet-parametrische regressiemodellen met een complex censureringsmechanisme of die discontinuiteiten bevatten, en van frailty modellen voor het opvangen van heterogeniteit;
- WP4 (`Mixed models’) : het zoeken naar geschikte `random effects’ verdelingen;
- WP5 (Classificatie en `mixture’ modellen) : het opvangen van heterogeniteit in een populatie en het bestuderen van zijn oorsprong;
- WP6 (Onvolledigheid en latente variabelen) : het ontwikkelen van (semi)parametrische `missingness’ modellen voor onvolledige en latente data, en het bestuderen van de sensitiviteit voor verschillende onderstellingen die gemaakt worden bij deze modellering.
Integratie van de netwerk activiteiten zal op vier verschillende niveau’s bereikt worden :
1) substantieel : data sets zullen gedeeld worden door verschillende werkmodulen en zullen als zodanig geanalyseerd worden m.b.v. verschillende, complementaire modellen;
2) `cross-links’ zullen tot stand gebracht worden tussen paren van werkmodulen, bv. overlevingsmodellen zullen bestudeerd worden in WPs 3 en 4; latente variabelen zullen behandeld worden in WPs 5 en 6;
3) interacties tussen Sectie I en Sectie II: bv, classificatie technieken en `mixture’ modellen zoals bestudeerd in WP5 voor het opvangen van heterogeniteit, zullen toegepast worden in verschillende WPs van Sectie I;
4) gemeenschappelijke methodologische basis : (a) het grootste deel van de werkmodulen zal gebruik maken van smoothing en bootstrap/Bayesiaanse data analyse technieken als gemeenschappelijke methodologische hulpmiddelen; (b) een aantal methodologische onderzoeksprojecten zullen bestudeerd worden door gebruik te maken van methodologische resultaten van andere werkmodulen, hetgeen uiteindelijk moet leiden naar het trekken van algemene conclusies.
Het voorgestelde onderzoek moet resulteren in nieuwe types van statistische methoden, modellen en model uitbreidingen die beter geschikt zijn voor zowel complexe substantiële theoriëen als complexe data. Als zodanig zullen zij onderzoekers voorzien van efficientere en nuttige hulpmiddelen voor het beantwoorden van belangrijke hedendaagse vragen.