numpy.random.Generator.exponential#
方法
- random.Generator.exponential(scale=1.0, size=None)#
從指數分佈中抽取樣本。
其機率密度函數為
\[f(x; \frac{1}{\beta}) = \frac{1}{\beta} \exp(-\frac{x}{\beta}),\]對於
x > 0
,其他地方為 0。\(\beta\) 是尺度參數,為速率參數 \(\lambda = 1/\beta\) 的倒數。速率參數是指數分佈的另一種廣泛使用的參數化方法 [3]。指數分佈是幾何分佈的連續類比。它描述了許多常見情況,例如多次暴雨中測量的雨滴大小 [1],或對維基百科的頁面請求之間的時間 [2]。
- 參數:
- scalefloat 或 float 的類陣列 (array_like)
尺度參數,\(\beta = 1/\lambda\)。必須為非負數。
- sizeint 或 int 元組,選用
輸出形狀。如果給定的形狀為,例如
(m, n, k)
,則會抽取m * n * k
個樣本。如果 size 為None
(預設值),如果scale
是純量,則會傳回單一值。否則,會抽取np.array(scale).size
個樣本。
- 傳回值:
- outndarray 或 純量
從參數化的指數分佈中抽取的樣本。
參考文獻
[1]Peyton Z. Peebles Jr., “Probability, Random Variables and Random Signal Principles”, 4th ed, 2001, p. 57.
[2]Wikipedia, “Poisson process”, https://en.wikipedia.org/wiki/Poisson_process
[3]Wikipedia, “Exponential distribution”, https://en.wikipedia.org/wiki/Exponential_distribution
範例
假設一家公司有 10000 名客戶支援專員,且客戶來電之間的時間呈指數分佈,且客戶來電之間的平均時間為 4 分鐘。
>>> scale, size = 4, 10000 >>> rng = np.random.default_rng() >>> time_between_calls = rng.exponential(scale=scale, size=size)
客戶在接下來 4 到 5 分鐘內來電的機率是多少?
>>> x = ((time_between_calls < 5).sum())/size >>> y = ((time_between_calls < 4).sum())/size >>> x - y 0.08 # may vary
對應的分佈可以視覺化如下
>>> import matplotlib.pyplot as plt >>> scale, size = 4, 10000 >>> rng = np.random.default_rng() >>> sample = rng.exponential(scale=scale, size=size) >>> count, bins, _ = plt.hist(sample, 30, density=True) >>> plt.plot(bins, scale**(-1)*np.exp(-scale**-1*bins), linewidth=2, color='r') >>> plt.show()