Het verschil tussen extrapolatie en interpolatie

Extrapolatie en interpolatie worden beide gebruikt om hypothetische waarden voor een variabele te schatten op basis van andere waarnemingen. Er zijn verschillende interpolatie- en extrapolatiemethoden gebaseerd op de algemene trend die in de gegevens wordt waargenomen. Deze twee methoden hebben namen die erg op elkaar lijken. We zullen de verschillen tussen hen onderzoeken.

prefixes

Om het verschil tussen extrapolatie en interpolatie te zien, moeten we kijken naar de voorvoegsels 'extra' en 'inter'. Het voorvoegsel 'extra' betekent 'buiten' of 'naast'. Het voorvoegsel 'inter' betekent 'ertussen' of "onder". Alleen al het kennen van deze betekenissen (van hun originelen in het Latijn) maakt een lange weg om onderscheid te maken tussen de twee methoden.

De instelling

Voor beide methoden gaan we uit van een paar dingen. We hebben een onafhankelijke variabele en een afhankelijke variabele geïdentificeerd. Door middel van steekproeven of een verzameling gegevens hebben we een aantal paren van deze variabelen. We gaan er ook van uit dat we een model voor onze gegevens hebben geformuleerd. Dit kan een kleinste vierkantenlijn zijn die het beste past, of het kan een ander type curve zijn dat onze gegevens benadert. We hebben in elk geval een functie die de onafhankelijke variabele relateert aan de afhankelijke variabele.

Het doel is niet alleen het model voor zichzelf, we willen ons model meestal gebruiken voor voorspelling. Meer in het bijzonder, gegeven een onafhankelijke variabele, wat zal de voorspelde waarde van de overeenkomstige afhankelijke variabele zijn? De waarde die we invoeren voor onze onafhankelijke variabele bepaalt of we werken met extrapolatie of interpolatie.

interpolatie

We kunnen onze functie gebruiken om de waarde van de afhankelijke variabele te voorspellen voor een onafhankelijke variabele die zich in het midden van onze gegevens bevindt. In dit geval voeren we interpolatie uit.

Stel dat gegevens met X tussen 0 en 10 wordt gebruikt om een ​​regressielijn te produceren Y = 2X + 5. We kunnen deze best passende lijn gebruiken om de Y waarde die overeenkomt met X = 6. Sluit deze waarde eenvoudig aan op onze vergelijking en we zien dat Y = 2 (6) + 5 = 17. Omdat onze X waarde behoort tot het bereik van waarden dat wordt gebruikt om de best passende lijn te maken, dit is een voorbeeld van interpolatie.

Extrapolatie

We kunnen onze functie gebruiken om de waarde van de afhankelijke variabele te voorspellen voor een onafhankelijke variabele die buiten het bereik van onze gegevens valt. In dit geval voeren we extrapolatie uit.

Stel als voorheen die gegevens met X tussen 0 en 10 wordt gebruikt om een ​​regressielijn te produceren Y = 2X + 5. We kunnen deze best passende lijn gebruiken om de Y waarde die overeenkomt met X = 20. Sluit deze waarde eenvoudig aan op onze vergelijking en we zien dat Y = 2 (20) + 5 = 45. Omdat onze X waarde behoort niet tot het bereik van waarden dat wordt gebruikt om de best passende lijn te maken, dit is een voorbeeld van extrapolatie.

Voorzichtigheid

Van de twee methoden heeft interpolatie de voorkeur. Dit komt omdat we een grotere kans hebben om een ​​geldige schatting te krijgen. Wanneer we extrapolatie gebruiken, gaan we ervan uit dat onze waargenomen trend zich voortzet voor waarden van X buiten het bereik dat we gebruikten om ons model te vormen. Dit is misschien niet het geval, en daarom moeten we heel voorzichtig zijn bij het gebruik van extrapolatietechnieken.