numpy.corrcoef#
- numpy.corrcoef(x, y=None, rowvar=True, bias=<no value>, ddof=<no value>, *, dtype=None)[原始碼]#
返回皮爾森積差相關係數。
請參考
cov
的文件以取得更多詳細資訊。相關係數矩陣 R 和共變異數矩陣 C 之間的關係為\[R_{ij} = \frac{ C_{ij} } { \sqrt{ C_{ii} C_{jj} } }\]R 的值介於 -1 和 1 之間,包含端點。
- 參數:
- xarray_like
包含多個變數和觀測值的 1-D 或 2-D 陣列。x 的每一列代表一個變數,每一欄代表所有這些變數的單次觀測。另請參閱下方的 rowvar。
- yarray_like,選用
額外的一組變數和觀測值。y 的形狀與 x 相同。
- rowvarbool,選用
如果 rowvar 為 True(預設值),則每一列代表一個變數,觀測值位於欄中。否則,關係會轉置:每一欄代表一個變數,而列包含觀測值。
- bias_NoValue,選用
沒有作用,請勿使用。
自版本 1.10.0 起已棄用。
- ddof_NoValue,選用
沒有作用,請勿使用。
自版本 1.10.0 起已棄用。
- dtypedata-type,選用
結果的資料類型。依預設,返回資料類型將至少具有
numpy.float64
精度。在版本 1.20 中新增。
- 返回:
- Rndarray
變數的相關係數矩陣。
另請參閱
cov
共變異數矩陣
註解
由於浮點數捨入,產生的陣列可能不是 Hermitian 矩陣,對角線元素可能不是 1,且元素可能不滿足不等式 abs(a) <= 1。實部和虛部會被裁剪到區間 [-1, 1],以嘗試改善這種情況,但在複數情況下幫助不大。
此函數接受但會捨棄引數 bias 和 ddof。這是為了向後相容此函數的先前版本。這些引數對函數的傳回值沒有影響,在此版本和先前的 NumPy 版本中可以安全地忽略它們。
範例
>>> import numpy as np
在此範例中,我們生成兩個隨機陣列
xarr
和yarr
,並計算行向和列向的皮爾森相關係數R
。由於rowvar
預設為 true,我們首先找到xarr
變數之間的行向皮爾森相關係數。>>> import numpy as np >>> rng = np.random.default_rng(seed=42) >>> xarr = rng.random((3, 3)) >>> xarr array([[0.77395605, 0.43887844, 0.85859792], [0.69736803, 0.09417735, 0.97562235], [0.7611397 , 0.78606431, 0.12811363]]) >>> R1 = np.corrcoef(xarr) >>> R1 array([[ 1. , 0.99256089, -0.68080986], [ 0.99256089, 1. , -0.76492172], [-0.68080986, -0.76492172, 1. ]])
如果我們加入另一組變數和觀測值
yarr
,我們可以計算xarr
和yarr
中變數之間的行向皮爾森相關係數。>>> yarr = rng.random((3, 3)) >>> yarr array([[0.45038594, 0.37079802, 0.92676499], [0.64386512, 0.82276161, 0.4434142 ], [0.22723872, 0.55458479, 0.06381726]]) >>> R2 = np.corrcoef(xarr, yarr) >>> R2 array([[ 1. , 0.99256089, -0.68080986, 0.75008178, -0.934284 , -0.99004057], [ 0.99256089, 1. , -0.76492172, 0.82502011, -0.97074098, -0.99981569], [-0.68080986, -0.76492172, 1. , -0.99507202, 0.89721355, 0.77714685], [ 0.75008178, 0.82502011, -0.99507202, 1. , -0.93657855, -0.83571711], [-0.934284 , -0.97074098, 0.89721355, -0.93657855, 1. , 0.97517215], [-0.99004057, -0.99981569, 0.77714685, -0.83571711, 0.97517215, 1. ]])
最後,如果我們使用選項
rowvar=False
,則欄現在被視為變數,我們將找到xarr
和yarr
中變數之間的列向皮爾森相關係數。>>> R3 = np.corrcoef(xarr, yarr, rowvar=False) >>> R3 array([[ 1. , 0.77598074, -0.47458546, -0.75078643, -0.9665554 , 0.22423734], [ 0.77598074, 1. , -0.92346708, -0.99923895, -0.58826587, -0.44069024], [-0.47458546, -0.92346708, 1. , 0.93773029, 0.23297648, 0.75137473], [-0.75078643, -0.99923895, 0.93773029, 1. , 0.55627469, 0.47536961], [-0.9665554 , -0.58826587, 0.23297648, 0.55627469, 1. , -0.46666491], [ 0.22423734, -0.44069024, 0.75137473, 0.47536961, -0.46666491, 1. ]])