【銀蛇出品】數(shù)學(xué)漫談14——關(guān)于最小二乘擬合的一些思考

前置知識:線性代數(shù)、插值、數(shù)值逼近
前言:最小二乘擬合是進(jìn)行數(shù)值逼近的常用手段。本文主要考慮兩個問題,其一是最小二乘擬合與插值之間的關(guān)系,其二是如何利用已知點各階導(dǎo)數(shù)值的信息做最小二乘擬合。在最后還將附上針對第二個問題的Matlab代碼。
關(guān)鍵內(nèi)容:最小二乘擬合、插值、導(dǎo)數(shù)值

一、最小二乘擬合的范數(shù)與內(nèi)積觀點
??? 假設(shè)我們已知點
選擇基函數(shù)
進(jìn)行擬合。按照范數(shù)的觀點,我們應(yīng)該尋找一個
使得達(dá)到最小,這只需令
。由于考慮的是離散點,我們按如下方式取范數(shù):
計算可得
如果取,上式就比較簡單
這也是我們通常選擇2-范數(shù)構(gòu)建最小二乘擬合方程的原因。
??? 同時我們注意到,按這種取法的2-范數(shù)滿足平行四邊形公式,因此可以由它誘導(dǎo)出一種內(nèi)積。事實上我們知道這種內(nèi)積就應(yīng)該是:
那么,可不可以直接用內(nèi)積的觀點看最小二乘擬合呢?這個問題實際上就是在上尋找
的投影,即
容易驗證,這與基于2-范數(shù)給出的擬合方程是一致的。

二、最小二乘擬合與插值的聯(lián)系
??? 插值所做的事情可以描述為:仍假設(shè)已知個點,但給定
個簡單函數(shù)
,找到其線性組合使得其剛好通過所有給定點。記
則尋找線性組合系數(shù)事實上就是求解線性方程組
當(dāng)基函數(shù)選為時,系數(shù)矩陣事實上就是Vandermonde矩陣,只要所給兩點橫坐標(biāo)不相同,那么該方程就有且只有唯一解。(若選擇多項式形式的基函數(shù),總可在此基礎(chǔ)上通過適當(dāng)?shù)目赡孀儞Q實現(xiàn),從而說明這種情況也是有且只有唯一解的。對于更一般的非多項式形式,應(yīng)該需要額外驗證。)
??? 通過觀察能夠發(fā)現(xiàn),做擬合相較于做插值,就是所給基函數(shù)的個數(shù)少于已知點的個數(shù),這導(dǎo)致前邊的方程組變?yōu)?/p>
系數(shù)矩陣的行數(shù)大于列數(shù),說明這是個超定方程,一般情況下是無解的。這時可以尋求其最佳最小二乘解,在左右兩邊同時左乘系數(shù)矩陣的轉(zhuǎn)置得
由于,上式進(jìn)一步整理就成為了
這與最小二乘擬合方程完全一致。于是說明,某種意義下,最小二乘擬合是插值的最佳最小二乘解。
??? 反過來,如果給定的基函數(shù)與已知點個數(shù)一樣多,那么此時插值問題的解與其最佳最小二乘解一致,這時擬合問題可以退化為插值問題。

三、利用已知點各階導(dǎo)數(shù)值的信息做最小二乘擬合
??? 如果已知一些點導(dǎo)數(shù)值信息,能否在做最小二乘擬合時將它們用上呢?只要能夠構(gòu)造一種適當(dāng)?shù)膬?nèi)積,其中包含導(dǎo)數(shù)值信息就可以了。我們先來構(gòu)造這樣一個運算:
容易驗證,該運算是雙線性、對稱、正定的(但可能是退化的,例如對于就有
),將它與我們熟知的函數(shù)內(nèi)積做一線性組合:
可以驗證,該運算滿足內(nèi)積的定義。由于其中包含了導(dǎo)數(shù)值信息,所以它是有可能實現(xiàn)我們的想法的。不過該內(nèi)積是對連續(xù)函數(shù)來說的,下邊直接給出其針對離散點的版本:
??? 此時,已知點的信息也要作出相應(yīng)調(diào)整:
如何驗證這樣構(gòu)造的內(nèi)積實現(xiàn)的擬合效果的準(zhǔn)確性呢?前邊提到過在適當(dāng)情況下,擬合問題可以退化為插值問題,而對于已知某點導(dǎo)數(shù)信息做插值的問題,我們可以使用Hermite插值。所以我們只要用這個內(nèi)積驗證一道Hermite插值的例題就能證明其準(zhǔn)確的必要性了。
例1. 已知
求其三次Hermite插值多項式。
??? 插值問題不是我們研究的重點,略去步驟,直接給出插值的結(jié)果為:
按照前邊定義的內(nèi)積,構(gòu)建出的擬合方程為
解得
與Hermite插值給出的結(jié)果一致。
??? 至于該方法能否推出Hermite插值的結(jié)果,筆者沒有嘗試,但猜測應(yīng)該是成立的,感興趣的讀者可以嘗試證明。
??? 如果已知的是更高階導(dǎo)數(shù)的信息呢?通過測試,筆者給出如下形式的內(nèi)積:
對于的情形,筆者進(jìn)行了類似前例的測試,結(jié)果是準(zhǔn)確的。筆者比較感興趣的是
這個系數(shù)是從何而來的,由于時間所限,筆者無法進(jìn)行進(jìn)一步的論證,也將這個問題留給讀者思考。

附代碼(Matlab):