Een inleiding tot het informatiecriterium van Akaike (AIC)

De Akaike Informatiecriterium (meestal gewoon aangeduid als AIC) is een criterium voor het selecteren uit geneste statistische of econometrische modellen. De AIC is in wezen een geschatte maat voor de kwaliteit van elk van de beschikbare econometrische modellen, aangezien deze voor een bepaalde set gegevens op elkaar betrekking hebben, waardoor het een ideale methode voor modelselectie is.

AIC gebruiken voor statistische en econometrische modelselectie

Het Akaike Informatiecriterium (AIC) is ontwikkeld met een basis in de informatietheorie. Informatietheorie is een tak van toegepaste wiskunde betreffende de kwantificering (het proces van tellen en meten) van informatie. Door AIC te gebruiken om de relatieve kwaliteit van econometrische modellen voor een bepaalde gegevensset te meten, geeft AIC de onderzoeker een schatting van de informatie die verloren zou gaan als een bepaald model zou worden gebruikt om het proces weer te geven dat de gegevens heeft geproduceerd. Als zodanig werkt de AIC om een ​​balans te vinden tussen de complexiteit van een bepaald model en zijn model goedheid van fit, dat is de statistische term om te beschrijven hoe goed het model "past" bij de gegevens of de reeks waarnemingen.

Wat AIC niet zal doen

Vanwege wat het Akaike Informatiecriterium (AIC) kan doen met een set statistische en econometrische modellen en een gegeven set gegevens, is het een handig hulpmiddel bij het selecteren van modellen. Maar zelfs als een modelselectietool, heeft AIC zijn beperkingen. AIC kan bijvoorbeeld alleen een relatieve test van modelkwaliteit bieden. Dat wil zeggen dat AIC geen test van een model kan en kan leveren die in absolute zin informatie over de kwaliteit van het model oplevert. Dus als elk van de geteste statistische modellen even onbevredigend of ongeschikt is voor de gegevens, zou AIC vanaf het begin geen enkele indicatie geven.

AIC in Econometrics-voorwaarden

De AIC is een nummer dat bij elk model hoort:

AIC = ln (sm2) + 2m / T

Waar m is het aantal parameters in het model, en sm2 (in een AR (m) -voorbeeld) is de geschatte resterende variantie: sm2 = (som van vierkante residuen voor model m) / T. Dat is het gemiddelde kwadraat voor het model m.

Het criterium kan worden beperkt tot keuzes van m om een ​​afweging te maken tussen de pasvorm van het model (die de som van de gekwadrateerde residuen verlaagt) en de complexiteit van het model, die wordt gemeten door m. Een AR (m) -model versus een AR (m + 1) kan dus met dit criterium worden vergeleken voor een gegeven batch gegevens.

Een equivalente formulering is deze: AIC = T ln (RSS) + 2K waarbij K het aantal regressoren is, T het aantal waarnemingen en RSS de resterende som van vierkanten; minimaliseren boven K om K te kiezen.

Als zodanig, mits een set econometrische modellen, zal het voorkeursmodel in termen van relatieve kwaliteit het model zijn met de minimale AIC-waarde.