numpy.random.Generator.binomial#
方法
- random.Generator.binomial(n, p, size=None)#
從二項式分佈中抽取樣本。
樣本是從具有指定參數的二項式分佈中抽取的,參數包括 n 次試驗和 p 成功機率,其中 n 為大於等於 0 的整數,p 在區間 [0,1] 內。(n 可以作為浮點數輸入,但在使用時會被截斷為整數)
- 參數:
- n整數或整數的類陣列 (array_like)
分佈的參數,>= 0。也接受浮點數,但會被截斷為整數。
- p浮點數或浮點數的類陣列 (array_like)
分佈的參數,>= 0 且 <=1。
- size整數或整數元組,選用
輸出形狀。如果給定的形狀是例如
(m, n, k)
,則會抽取m * n * k
個樣本。如果 size 為None
(預設),則如果n
和p
都是純量,則會傳回單一值。否則,會抽取np.broadcast(n, p).size
個樣本。
- 傳回值:
- outndarray 或純量
從參數化的二項式分佈中抽取的樣本,其中每個樣本等於 n 次試驗中的成功次數。
參見
scipy.stats.binom
機率密度函數、分佈或累積密度函數等。
註解
二項式分佈的機率質量函數 (PMF) 為
\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]其中 \(n\) 是試驗次數,\(p\) 是成功的機率,而 \(N\) 是成功的次數。
當使用隨機樣本估計母體中比例的標準誤差時,除非乘積 p*n <=5,否則常態分佈效果良好,其中 p = 母體比例估計值,n = 樣本數,在這種情況下應改用二項式分佈。例如,一個由 15 人組成的樣本顯示有 4 人是左撇子,11 人是右撇子。那麼 p = 4/15 = 27%。0.27*15 = 4,因此在這種情況下應使用二項式分佈。
參考文獻
[1]Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.
[2]Glantz, Stanton A. “Primer of Biostatistics.”, McGraw-Hill, Fifth Edition, 2002.
[3]Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.
[4]Weisstein, Eric W. “Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/BinomialDistribution.html
[5]Wikipedia, “Binomial distribution”, https://en.wikipedia.org/wiki/Binomial_distribution
範例
從分佈中抽取樣本
>>> rng = np.random.default_rng() >>> n, p, size = 10, .5, 10000 >>> s = rng.binomial(n, p, 10000)
假設一家公司鑽探 9 口野貓式石油探勘井,每口井的估計成功機率為
p=0.1
。所有九口井都失敗了。這發生的機率是多少?在
size = 20,000
次試驗中,這發生的機率平均為>>> n, p, size = 9, 0.1, 20000 >>> np.sum(rng.binomial(n=n, p=p, size=size) == 0)/size 0.39015 # may vary
以下可用於視覺化
n=100
、p=0.4
的樣本以及對應的機率密度函數>>> import matplotlib.pyplot as plt >>> from scipy.stats import binom >>> n, p, size = 100, 0.4, 10000 >>> sample = rng.binomial(n, p, size=size) >>> count, bins, _ = plt.hist(sample, 30, density=True) >>> x = np.arange(n) >>> y = binom.pmf(x, n, p) >>> plt.plot(x, y, linewidth=2, color='r')