numpy.random.Generator.exponential#

方法

random.Generator.exponential(scale=1.0, size=None)#

從指數分佈中抽取樣本。

其機率密度函數為

\[f(x; \frac{1}{\beta}) = \frac{1}{\beta} \exp(-\frac{x}{\beta}),\]

對於 x > 0,其他地方為 0。\(\beta\) 是尺度參數,為速率參數 \(\lambda = 1/\beta\) 的倒數。速率參數是指數分佈的另一種廣泛使用的參數化方法 [3]

指數分佈是幾何分佈的連續類比。它描述了許多常見情況,例如多次暴雨中測量的雨滴大小 [1],或對維基百科的頁面請求之間的時間 [2]

參數:
scalefloat 或 float 的類陣列 (array_like)

尺度參數,\(\beta = 1/\lambda\)。必須為非負數。

sizeint 或 int 元組,選用

輸出形狀。如果給定的形狀為,例如 (m, n, k),則會抽取 m * n * k 個樣本。如果 size 為 None (預設值),如果 scale 是純量,則會傳回單一值。否則,會抽取 np.array(scale).size 個樣本。

傳回值:
outndarray 或 純量

從參數化的指數分佈中抽取的樣本。

參考文獻

[1]

Peyton Z. Peebles Jr., “Probability, Random Variables and Random Signal Principles”, 4th ed, 2001, p. 57.

[2]

Wikipedia, “Poisson process”, https://en.wikipedia.org/wiki/Poisson_process

[3]

Wikipedia, “Exponential distribution”, https://en.wikipedia.org/wiki/Exponential_distribution

範例

假設一家公司有 10000 名客戶支援專員,且客戶來電之間的時間呈指數分佈,且客戶來電之間的平均時間為 4 分鐘。

>>> scale, size = 4, 10000
>>> rng = np.random.default_rng()
>>> time_between_calls = rng.exponential(scale=scale, size=size)

客戶在接下來 4 到 5 分鐘內來電的機率是多少?

>>> x = ((time_between_calls < 5).sum())/size
>>> y = ((time_between_calls < 4).sum())/size
>>> x - y
0.08  # may vary

對應的分佈可以視覺化如下

>>> import matplotlib.pyplot as plt
>>> scale, size = 4, 10000
>>> rng = np.random.default_rng()
>>> sample = rng.exponential(scale=scale, size=size)
>>> count, bins, _ = plt.hist(sample, 30, density=True)
>>> plt.plot(bins, scale**(-1)*np.exp(-scale**-1*bins), linewidth=2, color='r')
>>> plt.show()
../../../_images/numpy-random-Generator-exponential-1.png