La differenza tra estrapolazione e interpolazione

L'estrapolazione e l'interpolazione sono entrambe utilizzate per stimare valori ipotetici per una variabile sulla base di altre osservazioni. Esistono vari metodi di interpolazione ed estrapolazione basati sulla tendenza generale osservata nei dati. Questi due metodi hanno nomi molto simili. Esamineremo le differenze tra loro.

prefissi

Per dire la differenza tra estrapolazione e interpolazione, dobbiamo guardare i prefissi "extra" e "inter". Il prefisso "extra" significa "esterno" o "in aggiunta a". Il prefisso "inter" significa "in mezzo" o "tra". La sola conoscenza di questi significati (dai loro originali in latino) fa molta strada per distinguere tra i due metodi.

Le impostazioni

Per entrambi i metodi, assumiamo alcune cose. Abbiamo identificato una variabile indipendente e una variabile dipendente. Attraverso il campionamento o una raccolta di dati, abbiamo un numero di accoppiamenti di queste variabili. Supponiamo anche di aver formulato un modello per i nostri dati. Questa potrebbe essere una linea dei minimi quadrati della migliore misura, oppure potrebbe essere un altro tipo di curva che approssima i nostri dati. In ogni caso, abbiamo una funzione che mette in relazione la variabile indipendente con la variabile dipendente.

L'obiettivo non è solo il modello per se stesso, in genere vogliamo utilizzare il nostro modello per la previsione. Più specificamente, data una variabile indipendente, quale sarà il valore previsto della corrispondente variabile dipendente? Il valore che immettiamo per la nostra variabile indipendente determinerà se stiamo lavorando con estrapolazione o interpolazione.

interpolazione

Potremmo usare la nostra funzione per prevedere il valore della variabile dipendente per una variabile indipendente che si trova nel mezzo dei nostri dati. In questo caso, stiamo eseguendo l'interpolazione.

Supponiamo che i dati con X tra 0 e 10 viene utilizzato per produrre una linea di regressione y = 2X + 5. Possiamo usare questa linea della migliore misura per stimare il y valore corrispondente a X = 6. Basta inserire questo valore nella nostra equazione e lo vediamo y = 2 (6) + 5 = 17. Perché nostro X Il valore è compreso nell'intervallo di valori utilizzati per rendere la linea più adatta, questo è un esempio di interpolazione.

Estrapolazione

Potremmo utilizzare la nostra funzione per prevedere il valore della variabile dipendente per una variabile indipendente che non rientra nell'intervallo dei nostri dati. In questo caso, stiamo eseguendo l'estrapolazione.

Supponi come prima quei dati con X tra 0 e 10 viene utilizzato per produrre una linea di regressione y = 2X + 5. Possiamo usare questa linea della migliore misura per stimare il y valore corrispondente a X = 20. Basta inserire questo valore nella nostra equazione e lo vediamo y = 2 (20) + 5 = 45. Perché nostro X Il valore non è compreso nell'intervallo di valori utilizzati per rendere la linea più adatta, questo è un esempio di estrapolazione.

Attenzione

Dei due metodi, è preferita l'interpolazione. Questo perché abbiamo una maggiore probabilità di ottenere un preventivo valido. Quando usiamo l'estrapolazione, assumiamo che la nostra tendenza osservata continui per valori di X al di fuori della gamma che abbiamo usato per formare il nostro modello. Questo potrebbe non essere il caso, e quindi dobbiamo stare molto attenti quando si usano le tecniche di estrapolazione.