Konferansebidrag og faglig presentasjon  »  Vitenskapelig foredrag

En sammenlikning av metoder for testing av modellers prediksjonsevne

Trenger du hjelp? Kontakt Nofimas bibliotek med dine spørsmål om publikasjoner:
Kjetil Aune

Bibliotekleder
kjetil.aune@nofima.no

17. Norske kjemometrisymposium; Geilo, Bardøla hotell, 2005-03-14–2005-03-16

Cederkvist, Henrik René; Aastveit, Are Halvor; Næs, Tormod

Designing av regresjonsmodeller beregnet for tolkning og prediksjon er et viktig tema innen anvendt statistikk og kjemometri. Mange metoder eksisterer og det er vanskelig å velge den beste. Det er i tillegg mange faktorer å ta hensyn til. Når et antall modeller er valgt, må en validere og sammenlikne for å identifisere og velge den ”beste”. Hvis kriteriet er prediksjonsevne bruker en vanligvis kryssvalidert RMSEP (Root Mean Square Error of Prediction) og deretter rangerer modellene etter lavest RMSEP verdi. Problemet er at en slik form for rangering ikke er tilstrekkelig siden en liten endring i datasettet ofte vil føre til at denne rangering endres. Dette er også viktig i PLS siden bruken av minst RMSEP kan gi større modeller enn nødvendig. Det er da nødvendig med metoder som kan forenkle valget mellom en enkel modell på den ene siden og en kompleks modell på den andre, uten at en får reduksjon i prediksjonsevne. Vi skal i denne presentasjonen vise hvordan man kan bruke parametriske og ikke-parametrisk variansanalyse metoder til testing av modellers prediktive evne. Sammenlikningen av metodene vil være basert på simulert/estimerte styrkefunksjoner. Vi studerer forksjellige problemstillinger (betingelser for klassisk variansanalyse) som kan oppstå slik som korrelerte observasjoner, mange modeller, ulik varians m.m. Eksempler vil bli basert på PLS og PCR modeller.