numpy.polyfit#

numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)[原始碼]#

最小平方法多項式擬合。

注意

這是舊多項式 API 的一部分。自 1.4 版本以來,建議使用在 numpy.polynomial 中定義的新多項式 API。差異摘要可以在轉換指南中找到。

將次數為 deg 的多項式 p(x) = p[0] * x**deg + ... + p[deg] 擬合到點 (x, y)。傳回係數向量 p,其以 degdeg-1、… 0 的順序最小化平方誤差。

建議新程式碼使用 Polynomial.fit 類別方法,因為它在數值上更穩定。有關更多資訊,請參閱該方法的文檔。

參數:
xarray_like,形狀 (M,)

M 個樣本點 (x[i], y[i]) 的 x 座標。

yarray_like,形狀 (M,) 或 (M, K)

樣本點的 y 座標。可以透過傳入一個 2D 陣列一次擬合多個共享相同 x 座標的樣本點資料集,該陣列的每一列包含一個資料集。

degint

擬合多項式的次數

rcondfloat,可選

擬合的相對條件數。小於此值(相對於最大奇異值)的奇異值將被忽略。預設值為 len(x)*eps,其中 eps 是浮點類型的相對精度,在大多數情況下約為 2e-16。

fullbool,可選

決定傳回值性質的開關。當為 False(預設值)時,僅傳回係數;當為 True 時,也會傳回來自奇異值分解的診斷資訊。

warray_like,形狀 (M,),可選

權重。如果不是 None,則權重 w[i] 適用於 x[i] 處的未平方殘差 y[i] - y_hat[i]。理想情況下,權重的選擇應使乘積 w[i]*y[i] 的誤差都具有相同的變異數。當使用逆變異數加權時,請使用 w[i] = 1/sigma(y[i])。預設值為 None。

covbool 或 str,可選

如果給定且不為 False,則不僅傳回估計值,還傳回其共變異數矩陣。預設情況下,共變異數會按 chi2/dof 縮放,其中 dof = M - (deg + 1),即權重被認為是不可靠的,除非在相對意義上,並且所有內容都會縮放,以使縮減的 chi2 為 1。如果 cov='unscaled',則會省略此縮放,這與權重為 w = 1/sigma 的情況相關,其中 sigma 已知是不可靠性之可靠估計。

傳回值:
pndarray,形狀 (deg + 1,) 或 (deg + 1, K)

多項式係數,最高冪次優先。如果 y 是 2D 陣列,則第 k 個資料集的係數在 p[:,k] 中。

residuals、rank、singular_values、rcond

只有當 full == True 時才會傳回這些值

  • residuals – 最小平方法擬合的平方殘差和

  • rank – 縮放的范德蒙矩陣的有效秩

    係數矩陣

  • singular_values – 縮放的范德蒙矩陣的奇異值

    係數矩陣

  • rcond – rcond 的值。

有關更多詳細資訊,請參閱 numpy.linalg.lstsq

Vndarray,形狀 (deg + 1, deg + 1) 或 (deg + 1, deg + 1, K)

僅當 full == Falsecov == True 時存在。多項式係數估計值的共變異數矩陣。此矩陣的對角線是每個係數的變異數估計值。如果 y 是 2D 陣列,則第 k 個資料集的共變異數矩陣在 V[:,:,k]

警告:
RankWarning

最小平方法擬合中係數矩陣的秩不足。僅當 full == False 時才會引發警告。

警告可以透過以下方式關閉

>>> import warnings
>>> warnings.simplefilter('ignore', np.exceptions.RankWarning)

另請參閱

polyval

計算多項式值。

linalg.lstsq

計算最小平方法擬合。

scipy.interpolate.UnivariateSpline

計算樣條擬合。

註解

解最小化平方誤差

\[E = \sum_{j=0}^k |p(x_j) - y_j|^2\]

在方程式中

x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0]
x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1]
...
x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]

係數 p 的係數矩陣是范德蒙矩陣。

polyfit 在最小平方法擬合條件不良時發出 RankWarning。這表示由於數值誤差,最佳擬合未明確定義。可以透過降低多項式次數或將 x 替換為 x - x.mean() 來改善結果。rcond 參數也可以設定為小於其預設值的值,但產生的擬合可能是虛假的:包含來自小奇異值的貢獻可能會向結果添加數值雜訊。

請注意,當多項式的次數很大或樣本點的間隔未良好居中時,擬合多項式係數本質上是條件不良的。在這些情況下,應始終檢查擬合的品質。當多項式擬合不令人滿意時,樣條曲線可能是很好的替代方案。

參考文獻

[1]

維基百科,「曲線擬合」,https://en.wikipedia.org/wiki/Curve_fitting

[2]

維基百科,「多項式插值」,https://en.wikipedia.org/wiki/Polynomial_interpolation

範例

>>> import numpy as np
>>> import warnings
>>> x = np.array([0.0, 1.0, 2.0, 3.0,  4.0,  5.0])
>>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0])
>>> z = np.polyfit(x, y, 3)
>>> z
array([ 0.08703704, -0.81349206,  1.69312169, -0.03968254]) # may vary

使用 poly1d 物件處理多項式很方便

>>> p = np.poly1d(z)
>>> p(0.5)
0.6143849206349179 # may vary
>>> p(3.5)
-0.34732142857143039 # may vary
>>> p(10)
22.579365079365115 # may vary

高階多項式可能會劇烈震盪

>>> with warnings.catch_warnings():
...     warnings.simplefilter('ignore', np.exceptions.RankWarning)
...     p30 = np.poly1d(np.polyfit(x, y, 30))
...
>>> p30(4)
-0.80000000000000204 # may vary
>>> p30(5)
-0.99999999999999445 # may vary
>>> p30(4.5)
-0.10547061179440398 # may vary

圖示

>>> import matplotlib.pyplot as plt
>>> xp = np.linspace(-2, 6, 100)
>>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--')
>>> plt.ylim(-2,2)
(-2, 2)
>>> plt.show()
../../_images/numpy-polyfit-1.png