numpy.random.Generator.binomial#

方法

random.Generator.binomial(n, p, size=None)#

從二項式分佈中抽取樣本。

樣本是從具有指定參數的二項式分佈中抽取的，參數包括 n 次試驗和 p 成功機率，其中 n 為大於等於 0 的整數，p 在區間 [0,1] 內。（n 可以作為浮點數輸入，但在使用時會被截斷為整數）

參數:

n整數或整數的類陣列 (array_like): 分佈的參數，>= 0。也接受浮點數，但會被截斷為整數。
p浮點數或浮點數的類陣列 (array_like): 分佈的參數，>= 0 且 <=1。
size整數或整數元組，選用: 輸出形狀。如果給定的形狀是例如 (m, n, k)，則會抽取 m * n * k 個樣本。如果 size 為 None（預設），則如果 n 和 p 都是純量，則會傳回單一值。否則，會抽取 np.broadcast(n, p).size 個樣本。

傳回值:

outndarray 或純量: 從參數化的二項式分佈中抽取的樣本，其中每個樣本等於 n 次試驗中的成功次數。

參見

scipy.stats.binom: 機率密度函數、分佈或累積密度函數等。

註解

二項式分佈的機率質量函數 (PMF) 為

\[P(N) = \binom{n}{N}p^N(1-p)^{n-N},\]

其中 \(n\) 是試驗次數，\(p\) 是成功的機率，而 \(N\) 是成功的次數。

當使用隨機樣本估計母體中比例的標準誤差時，除非乘積 p*n <=5，否則常態分佈效果良好，其中 p = 母體比例估計值，n = 樣本數，在這種情況下應改用二項式分佈。例如，一個由 15 人組成的樣本顯示有 4 人是左撇子，11 人是右撇子。那麼 p = 4/15 = 27%。0.27*15 = 4，因此在這種情況下應使用二項式分佈。

參考文獻

[1]

Dalgaard, Peter, “Introductory Statistics with R”, Springer-Verlag, 2002.

[2]

Glantz, Stanton A. “Primer of Biostatistics.”, McGraw-Hill, Fifth Edition, 2002.

[3]

Lentner, Marvin, “Elementary Applied Statistics”, Bogden and Quigley, 1972.

[4]

Weisstein, Eric W. “Binomial Distribution.” From MathWorld–A Wolfram Web Resource. https://mathworld.wolfram.com/BinomialDistribution.html

[5]

Wikipedia, “Binomial distribution”, https://en.wikipedia.org/wiki/Binomial_distribution

範例

從分佈中抽取樣本

>>> rng = np.random.default_rng()
>>> n, p, size = 10, .5, 10000  
>>> s = rng.binomial(n, p, 10000)

假設一家公司鑽探 9 口野貓式石油探勘井，每口井的估計成功機率為 p=0.1。所有九口井都失敗了。這發生的機率是多少？

在 size = 20,000 次試驗中，這發生的機率平均為

>>> n, p, size = 9, 0.1, 20000
>>> np.sum(rng.binomial(n=n, p=p, size=size) == 0)/size
0.39015  # may vary

以下可用於視覺化 n=100、p=0.4 的樣本以及對應的機率密度函數

>>> import matplotlib.pyplot as plt
>>> from scipy.stats import binom
>>> n, p, size = 100, 0.4, 10000
>>> sample = rng.binomial(n, p, size=size)
>>> count, bins, _ = plt.hist(sample, 30, density=True)
>>> x = np.arange(n)
>>> y = binom.pmf(x, n, p)
>>> plt.plot(x, y, linewidth=2, color='r')

../../../_images/numpy-random-Generator-binomial-1.png